TH95514B - การกระจายแหล่งกำเนิดเสียงหลายอุปกรณ์รับรู้ - Google Patents

การกระจายแหล่งกำเนิดเสียงหลายอุปกรณ์รับรู้

Info

Publication number
TH95514B
TH95514B TH801000333A TH0801000333A TH95514B TH 95514 B TH95514 B TH 95514B TH 801000333 A TH801000333 A TH 801000333A TH 0801000333 A TH0801000333 A TH 0801000333A TH 95514 B TH95514 B TH 95514B
Authority
TH
Thailand
Prior art keywords
sound source
recognition device
sound
source distribution
voice recognition
Prior art date
Application number
TH801000333A
Other languages
English (en)
Other versions
TH95514A (th
Inventor
เซงยูซาง คินีโฟเรนซิโอ ชาซาง ดินี โฟเรนซิโอ
Original Assignee
ไมโครซอฟต์ คอร์ปอเรชั่น ไมโครซอฟต์ คอร์ปอเรชั่น
Filing date
Publication date
Application filed by ไมโครซอฟต์ คอร์ปอเรชั่น ไมโครซอฟต์ คอร์ปอเรชั่น filed Critical ไมโครซอฟต์ คอร์ปอเรชั่น ไมโครซอฟต์ คอร์ปอเรชั่น
Publication of TH95514B publication Critical patent/TH95514B/th
Publication of TH95514A publication Critical patent/TH95514A/th

Links

Abstract

เทคนิคการกระจายแหล่งกำเนิดเสียงหลายอุปกรณ์รับรู้ (เอสเอสแอล) ถูกนำเสนอซึ่งให้ ปฏิบัติการความน่าจะเป็นมากที่สุด (เอ็มแอล) สำหรับแถวลำดับไมโครโฟนที่มีอุปกรณ์รับรู้เสียง มากกว่าหนึ่งคู่ ทั่วๆ ไป นี้เป็นการประสบความสำเร็จโดยทำการคัดเลือกตำแหน่งแหล่งกำเนิดเสียง ซึ่งให้ผลต่างๆ ในเวลาหนึ่งของการแผ่เสียงจากแหล่งกำเนิดเสียงถึงอุปกรณ์รับรู้เสียงของแถวลำดับ ซึ่งความน่าจะเป็นสูงสุดของสัญญาณนำออกอุปกรณ์รับรู้เสียงสร้างขึ้นพร้อมๆ กันรับเข้าจาก อุปกรณ์รับรู้ในแถวลำดับสูงสุดทั้งหมด ความน่าจะเป็นนั้นครอบคลุมคำหนึ่งเดียวในโลกซึ่ง ประมาณการอุปกรณ์รับรู้เสียงที่ไม่รู้จักตอบสนองต่อสัญญาณแหล่งกำเนิดเสียงสำหรับแต่ละ อุปกรณ์รับรู้แต่ละอุปกรณ์ในแถวลำดับดังกล่าว

Claims (1)

1. กระบวนการทำให้คอมพิวเตอร์เป็นผลสมบูรณ์ (Computer-implemented process) สำหรับประมาณการตำแหน่งของแหล่งกำเนิดเสียงโดยการใช้สัญญาณนำออกโดยแถวลำดับ ไมโครโฟนที่มีอุปกรณ์รับรู้เสียงจำนวนมากจัดวางเพื่อว่าให้ได้รับเสียงเปล่งจากแหล่งกำเนิดใน สภาพแวดล้อมแสงการสะท้อนกลับและเสียงในสภาพแวดล้อม ประกอบด้วยการใช้คอมพิวเตอร์ เพื่อจะดำเนินการการกระทำกระบวนการต่อไปนี้ การรับเข้านำออกสัญญาณโดยอุปกรณ์รับรู้เสียง (audio sensors) แต่ละอุปกรณ์เสียงนั้น การคัดเลือกตามตำแหน่งของแหล่:
TH801000333A 2008-01-22 การกระจายแหล่งกำเนิดเสียงหลายอุปกรณ์รับรู้ TH95514A (th)

Publications (2)

Publication Number Publication Date
TH95514B true TH95514B (th) 2009-04-30
TH95514A TH95514A (th) 2009-04-30

Family

ID=

Similar Documents

Publication Publication Date Title
Xiao et al. On time-frequency mask estimation for MVDR beamforming with application in robust speech recognition
Kanda et al. Acoustic modeling for distant multi-talker speech recognition with single-and multi-channel branches
Sainath et al. Speaker location and microphone spacing invariant acoustic modeling from raw multichannel waveforms
Hoshen et al. Speech acoustic modeling from raw multichannel waveforms
Swietojanski et al. Hybrid acoustic models for distant and multichannel large vocabulary speech recognition
US10304440B1 (en) Keyword spotting using multi-task configuration
Minhua et al. Frequency domain multi-channel acoustic modeling for distant speech recognition
CN106023996B (zh) 基于十字形声阵列宽带波束形成的声识别方法
CN110400571B (zh) 音频处理方法、装置、存储介质及电子设备
CN108122563A (zh) 提高语音唤醒率及修正doa的方法
CN110534126B (zh) 一种基于固定波束形成的声源定位和语音增强方法及系统
US11495215B1 (en) Deep multi-channel acoustic modeling using frequency aligned network
WO2019187589A1 (ja) 音源方向推定装置、音源方向推定方法、プログラム
RU2009102507A (ru) Способ и устройство для естественно-речевого распознавания речевого высказывания
ES2421927T3 (es) Determinación de la calidad de un dispositivo de audio
Tu et al. An information fusion framework with multi-channel feature concatenation and multi-perspective system combination for the deep-learning-based robust recognition of microphone array speech
JP2018031909A (ja) 音声処理装置、音声処理方法及び音声処理プログラム
Akimoto et al. POCO: A Voice Spoofing and Liveness Detection Corpus Based on Pop Noise.
JP2015070321A (ja) 音声処理装置、音声処理方法、及び音声処理プログラム
Tu et al. On Design of Robust Deep Models for CHiME-4 Multi-Channel Speech Recognition with Multiple Configurations of Array Microphones.
IL289471B2 (en) Speech-Tracking Listening Device
CN107396244A (zh) 一种基于麦克风阵列的声源定位系统及方法
Kim et al. Efficient implementation of the room simulator for training deep neural network acoustic models
Zwyssig et al. Recognition of overlapping speech using digital MEMS microphone arrays
JP4812302B2 (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム