TH95514B - การกระจายแหล่งกำเนิดเสียงหลายอุปกรณ์รับรู้ - Google Patents
การกระจายแหล่งกำเนิดเสียงหลายอุปกรณ์รับรู้Info
- Publication number
- TH95514B TH95514B TH801000333A TH0801000333A TH95514B TH 95514 B TH95514 B TH 95514B TH 801000333 A TH801000333 A TH 801000333A TH 0801000333 A TH0801000333 A TH 0801000333A TH 95514 B TH95514 B TH 95514B
- Authority
- TH
- Thailand
- Prior art keywords
- sound source
- recognition device
- sound
- source distribution
- voice recognition
- Prior art date
Links
Abstract
เทคนิคการกระจายแหล่งกำเนิดเสียงหลายอุปกรณ์รับรู้ (เอสเอสแอล) ถูกนำเสนอซึ่งให้ ปฏิบัติการความน่าจะเป็นมากที่สุด (เอ็มแอล) สำหรับแถวลำดับไมโครโฟนที่มีอุปกรณ์รับรู้เสียง มากกว่าหนึ่งคู่ ทั่วๆ ไป นี้เป็นการประสบความสำเร็จโดยทำการคัดเลือกตำแหน่งแหล่งกำเนิดเสียง ซึ่งให้ผลต่างๆ ในเวลาหนึ่งของการแผ่เสียงจากแหล่งกำเนิดเสียงถึงอุปกรณ์รับรู้เสียงของแถวลำดับ ซึ่งความน่าจะเป็นสูงสุดของสัญญาณนำออกอุปกรณ์รับรู้เสียงสร้างขึ้นพร้อมๆ กันรับเข้าจาก อุปกรณ์รับรู้ในแถวลำดับสูงสุดทั้งหมด ความน่าจะเป็นนั้นครอบคลุมคำหนึ่งเดียวในโลกซึ่ง ประมาณการอุปกรณ์รับรู้เสียงที่ไม่รู้จักตอบสนองต่อสัญญาณแหล่งกำเนิดเสียงสำหรับแต่ละ อุปกรณ์รับรู้แต่ละอุปกรณ์ในแถวลำดับดังกล่าว
Claims (1)
1. กระบวนการทำให้คอมพิวเตอร์เป็นผลสมบูรณ์ (Computer-implemented process) สำหรับประมาณการตำแหน่งของแหล่งกำเนิดเสียงโดยการใช้สัญญาณนำออกโดยแถวลำดับ ไมโครโฟนที่มีอุปกรณ์รับรู้เสียงจำนวนมากจัดวางเพื่อว่าให้ได้รับเสียงเปล่งจากแหล่งกำเนิดใน สภาพแวดล้อมแสงการสะท้อนกลับและเสียงในสภาพแวดล้อม ประกอบด้วยการใช้คอมพิวเตอร์ เพื่อจะดำเนินการการกระทำกระบวนการต่อไปนี้ การรับเข้านำออกสัญญาณโดยอุปกรณ์รับรู้เสียง (audio sensors) แต่ละอุปกรณ์เสียงนั้น การคัดเลือกตามตำแหน่งของแหล่:
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TH95514B true TH95514B (th) | 2009-04-30 |
| TH95514A TH95514A (th) | 2009-04-30 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Xiao et al. | On time-frequency mask estimation for MVDR beamforming with application in robust speech recognition | |
| Kanda et al. | Acoustic modeling for distant multi-talker speech recognition with single-and multi-channel branches | |
| Sainath et al. | Speaker location and microphone spacing invariant acoustic modeling from raw multichannel waveforms | |
| Hoshen et al. | Speech acoustic modeling from raw multichannel waveforms | |
| Swietojanski et al. | Hybrid acoustic models for distant and multichannel large vocabulary speech recognition | |
| US10304440B1 (en) | Keyword spotting using multi-task configuration | |
| Minhua et al. | Frequency domain multi-channel acoustic modeling for distant speech recognition | |
| CN106023996B (zh) | 基于十字形声阵列宽带波束形成的声识别方法 | |
| CN110400571B (zh) | 音频处理方法、装置、存储介质及电子设备 | |
| CN108122563A (zh) | 提高语音唤醒率及修正doa的方法 | |
| CN110534126B (zh) | 一种基于固定波束形成的声源定位和语音增强方法及系统 | |
| US11495215B1 (en) | Deep multi-channel acoustic modeling using frequency aligned network | |
| WO2019187589A1 (ja) | 音源方向推定装置、音源方向推定方法、プログラム | |
| RU2009102507A (ru) | Способ и устройство для естественно-речевого распознавания речевого высказывания | |
| ES2421927T3 (es) | Determinación de la calidad de un dispositivo de audio | |
| Tu et al. | An information fusion framework with multi-channel feature concatenation and multi-perspective system combination for the deep-learning-based robust recognition of microphone array speech | |
| JP2018031909A (ja) | 音声処理装置、音声処理方法及び音声処理プログラム | |
| Akimoto et al. | POCO: A Voice Spoofing and Liveness Detection Corpus Based on Pop Noise. | |
| JP2015070321A (ja) | 音声処理装置、音声処理方法、及び音声処理プログラム | |
| Tu et al. | On Design of Robust Deep Models for CHiME-4 Multi-Channel Speech Recognition with Multiple Configurations of Array Microphones. | |
| IL289471B2 (en) | Speech-Tracking Listening Device | |
| CN107396244A (zh) | 一种基于麦克风阵列的声源定位系统及方法 | |
| Kim et al. | Efficient implementation of the room simulator for training deep neural network acoustic models | |
| Zwyssig et al. | Recognition of overlapping speech using digital MEMS microphone arrays | |
| JP4812302B2 (ja) | 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム |