JP2016050872A - 音源位置推定装置、音源位置推定方法および音源位置推定プログラム - Google Patents
音源位置推定装置、音源位置推定方法および音源位置推定プログラム Download PDFInfo
- Publication number
- JP2016050872A JP2016050872A JP2014176949A JP2014176949A JP2016050872A JP 2016050872 A JP2016050872 A JP 2016050872A JP 2014176949 A JP2014176949 A JP 2014176949A JP 2014176949 A JP2014176949 A JP 2014176949A JP 2016050872 A JP2016050872 A JP 2016050872A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- sound
- person
- sensor arrays
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】音源位置推定装置2000において、音源方向推定部は、複数のマイクロホンアレイ1052.1〜4からの複数チャンネルの信号の各々とマイクロホンアレイに含まれる各マイクの間の位置関係とに基づいて、複数のマイクロホンアレイに音の到来する方向を特定する。音声区間推定部は、複数のマイクロホンアレイ1052.1〜4のうち、異なるマイクロホンアレイでそれぞれ特定された音の到来する方向の組と人の位置情報とに基づいて、発話中の人を推定する。
【選択図】図1
Description
[システムの構成]
図1は、本実施の形態の音源位置推定装置を含む対話行動認識システム1000の構成を説明するための概念図である。
[システムの設置環境]
図2は、後に説明するような実験を実施した際の環境を示す図である。
[音源位置推定のための構成]
図3は、図1に示した音源位置推定装置2000の構成の概要を示すブロック図である。
音声区間推定部1080では、音源方向と人位置情報を基に、後に説明するように、その人が発話しているか否かを判断する(S106)。不揮発性記憶装置2080中に記憶された部屋の空間情報とアレイの位置情報を基に、それぞれのマイクロホンアレイから得られた音源方向と、人位置推定部から得られる人の位置情報を重ね合わせる。「部屋の空間情報」とは、たとえば、会議室のような所定の空間内でのマイクロホンアレイの設置位置の情報を含む。なお、特許文献2に記載のように、反射音も利用する場合は、「部屋の空間情報」は、所定の空間の壁、天井の位置に関する情報を含んでいてもよい。
[MUSIC法による音源方向の推定処理]
図5は、音源方向推定部1040の構成を示すブロック図である。音源方向推定部1040.1〜1040.4の構成は基本的に同様である。
なお、本実施の形態では、各音源の2次元的な方位角だけでなく、仰角も推定する。そのために、MUSICアルゴリズムとしては、3次元での計算が可能なものを実装する。方位角と仰角とのセットを、これ以降、音源方位(DOA)と呼ぶ。MUSIC処理部62で実行されるアルゴリズムでは、音源までの距離は推定しない。音源方位のみを推定するようにすることで、処理時間を大幅に減少させることができる。
(MUSIC法)
以下、上述した3次元での方位を算出するMUSIC法について、簡単にまとめる。
公知文献4:A. Badali, J.-M. Valin, F. Michaud, and P. Aarabi, ”Evaluating realtime audio localization algorithms for artificial audition on mobile robots,” in Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2009, 2009, pp. 2033-2038.
[音声区間推定部1080の処理]
次に、音声区間推定部1080において、マイクロホンアレイから得られた音源方向により、音源候補の位置を推定する処理について、以下、説明する。
[コンピュータによる実現]
音源位置推定装置2000の音源方向推定部1040、音声区間推定部1080および音源分離部1090の処理は、実際にはコンピュータハードウェアと、当該コンピュータハードウェアにより実行されるコンピュータプログラムとにより、 ハードウェアとソフトウェアとの協働により実現される。以下、これらの機能を実現するためのコンピュータプログラムの動作について簡単に説明する。
[実験結果]
(1)データ収集
上述のとおり、実験は、図2に示したような、複数のマイクロホンアレイを設置した研究室内のミーティングスペースで実施した。
(評価結果:単独で発話した場合)
まず、図10は、2名の話者(女性F1 および 男性M1)が単独で発話した場合の発話区間検出率(precision およびrecall)の結果を示す図である。
(評価結果:複数人が同時に発話した場合)
次に、2名が同時に発声した場合の結果について説明する。
Claims (8)
- 複数の音センサアレイと、
所定空間内の人の位置を推定するための人位置推定手段と、
前記音センサアレイ中の各音センサの配置の情報および人の位置情報を格納するための記憶装置と、
前記複数の音センサアレイからの複数チャンネルの信号の各々と前記音センサアレイに含まれる各音センサの間の位置関係とに基づいて、前記複数の音センサアレイに音の到来する方向を特定するための処理を実行する音源定位手段と、
前記複数の音センサアレイのうち、異なる音センサアレイでそれぞれ特定された前記音の到来する方向の組と前記人の位置情報とに基づいて、発話中の人を推定するための音声区間推定手段とを備える、音源位置推定装置。 - 前記音声区間推定手段は、前記音の到来する方向の組ごとに、到来方向の延長線間の最短距離が第1のしきい値以下であることに応じて、前記最短距離に対応する直線上に前記音源の候補位置が存在すると推定する、請求項1記載の音源位置推定装置。
- 前記音声区間推定手段は、前記音源の候補位置のうち、前記音の到来方向を特定するのに使用した前記音センサアレイまでの距離の総和が最小の音源の候補位置を音源位置と推定する、請求項2記載の音源位置推定装置。
- 前記音声区間推定手段は、推定された前記音源位置と前記人の位置とが第2のしきい値以下であることに応じて、発話中の人を推定する、請求項3記載の音源位置推定装置。
- 前記音声区間推定手段は、発話中の人であると推定された前記人の位置と対応する前記音源位置とに応じて、発話中の人の顔の向きを推定する、請求項4記載の音源位置推定装置。
- 前記音声区間推定手段により推定された発話中の人についての音声を分離して、発話内容と発話者とを関連づけて記録するための音源分離手段をさらに備える、請求項1〜5のいずれか1項に記載の音源位置推定装置。
- 複数の音センサアレイからの信号と推定された人位置とに基づいて、所定の空間内での発話者を推定する音源位置推定方法であって、
位置センサからの測定データにより前記所定空間内の人の位置を推定するステップと、
前記複数の音センサアレイからの複数チャンネルの音源信号の各々と前記音センサアレイに含まれる各音センサの間の位置関係とに基づいて、前記複数の音センサアレイに音の到来する方向を特定するステップと、
前記複数の音センサアレイのうち、異なる音センサアレイでそれぞれ特定された前記音の到来する方向の組と前記人の位置情報とに基づいて、発話中の人を推定するステップとを備える、音源位置推定方法。 - 演算装置と記憶装置とを有するコンピュータに、複数の音センサアレイからの信号と推定された人位置とに基づいて、所定の空間内での発話者を推定する音源位置推定プログラムであって、前記音源位置推定プログラムは、
前記演算装置が、位置センサからの測定データにより前記所定空間内の人の位置を推定するステップと、
前記演算装置が、前記複数の音センサアレイからの複数チャンネルの音源信号の各々と前記音センサアレイに含まれる各音センサの間の位置関係とに基づいて、前記複数の音センサアレイに音の到来する方向を特定するステップと、
前記演算装置が、前記複数の音センサアレイのうち、異なる音センサアレイでそれぞれ特定された前記音の到来する方向の組と前記人の位置情報とに基づいて、発話中の人を推定するステップとを、コンピュータに実行させる、音源位置推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014176949A JP6467736B2 (ja) | 2014-09-01 | 2014-09-01 | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014176949A JP6467736B2 (ja) | 2014-09-01 | 2014-09-01 | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016050872A true JP2016050872A (ja) | 2016-04-11 |
JP6467736B2 JP6467736B2 (ja) | 2019-02-13 |
Family
ID=55658471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014176949A Active JP6467736B2 (ja) | 2014-09-01 | 2014-09-01 | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6467736B2 (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399719A (zh) * | 2018-02-02 | 2018-08-14 | 北京大学深圳医院 | 噪音报警提醒装置及系统 |
JP2019049414A (ja) * | 2017-09-07 | 2019-03-28 | 本田技研工業株式会社 | 音響処理装置、音響処理方法及びプログラム |
JP2020030376A (ja) * | 2018-08-24 | 2020-02-27 | 本田技研工業株式会社 | 音響シーン再構成装置、音響シーン再構成方法、およびプログラム |
JP2020038123A (ja) * | 2018-09-04 | 2020-03-12 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、およびプログラム |
US11062727B2 (en) | 2018-06-13 | 2021-07-13 | Ceva D.S.P Ltd. | System and method for voice activity detection |
CN113376576A (zh) * | 2020-07-23 | 2021-09-10 | 郑州大学 | 基于小孔径麦克风阵列的声源定位传感器的定位方法 |
CN113539288A (zh) * | 2021-07-22 | 2021-10-22 | 南京华捷艾米软件科技有限公司 | 一种语音信号去噪方法及装置 |
KR102335765B1 (ko) * | 2021-10-06 | 2021-12-06 | 주식회사 휴라 | 전파 측정에 기반하여 무인 항공기를 탐지하기 위한 방법 및 장치 |
CN114203181A (zh) * | 2021-12-10 | 2022-03-18 | 北京百度网讯科技有限公司 | 用于识别对话语音的方法、装置以及可拆卸的拾音设备 |
CN114502926A (zh) * | 2020-06-09 | 2022-05-13 | 东芝三菱电机产业系统株式会社 | 金属材料加工设备的异响观测系统 |
CN114616483A (zh) * | 2020-10-05 | 2022-06-10 | 铁三角有限公司 | 声源定位设备、声源定位方法和程序 |
CN115424633A (zh) * | 2022-08-02 | 2022-12-02 | 钉钉(中国)信息技术有限公司 | 说话人定位方法、装置及设备 |
JP7184798B2 (ja) | 2017-04-14 | 2022-12-06 | シグニファイ ホールディング ビー ヴィ | 対象物の位置を決定するための位置決めシステム |
US11665391B2 (en) | 2021-01-13 | 2023-05-30 | Panasonic Intellectual Property Management Co., Ltd. | Signal processing device and signal processing system |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005274707A (ja) * | 2004-03-23 | 2005-10-06 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
JP2005323381A (ja) * | 2004-05-07 | 2005-11-17 | Fuji Xerox Co Ltd | マイクロホンの位置確認のためのシステム、方法、及びプログラム |
JP2012211768A (ja) * | 2011-03-30 | 2012-11-01 | Advanced Telecommunication Research Institute International | 音源定位装置 |
-
2014
- 2014-09-01 JP JP2014176949A patent/JP6467736B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005274707A (ja) * | 2004-03-23 | 2005-10-06 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
JP2005323381A (ja) * | 2004-05-07 | 2005-11-17 | Fuji Xerox Co Ltd | マイクロホンの位置確認のためのシステム、方法、及びプログラム |
JP2012211768A (ja) * | 2011-03-30 | 2012-11-01 | Advanced Telecommunication Research Institute International | 音源定位装置 |
Non-Patent Citations (1)
Title |
---|
石井カルロス寿憲, JANI EVEN, 塩見昌裕, 小泉智史, 萩田紀博: "「複数のマイクロホンアレイによる音源アクティビティ:小学校理科室におけるデータ分析」", 第31回日本ロボット学会学術講演会予稿集DVD-ROM, JPN6018024866, 4 September 2013 (2013-09-04), pages 2 - 01, ISSN: 0003827714 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7184798B2 (ja) | 2017-04-14 | 2022-12-06 | シグニファイ ホールディング ビー ヴィ | 対象物の位置を決定するための位置決めシステム |
JP2019049414A (ja) * | 2017-09-07 | 2019-03-28 | 本田技研工業株式会社 | 音響処理装置、音響処理方法及びプログラム |
CN108399719A (zh) * | 2018-02-02 | 2018-08-14 | 北京大学深圳医院 | 噪音报警提醒装置及系统 |
CN108399719B (zh) * | 2018-02-02 | 2024-01-05 | 北京大学深圳医院 | 噪音报警提醒装置及系统 |
US11062727B2 (en) | 2018-06-13 | 2021-07-13 | Ceva D.S.P Ltd. | System and method for voice activity detection |
US11373355B2 (en) | 2018-08-24 | 2022-06-28 | Honda Motor Co., Ltd. | Acoustic scene reconstruction device, acoustic scene reconstruction method, and program |
JP7177631B2 (ja) | 2018-08-24 | 2022-11-24 | 本田技研工業株式会社 | 音響シーン再構成装置、音響シーン再構成方法、およびプログラム |
JP2020030376A (ja) * | 2018-08-24 | 2020-02-27 | 本田技研工業株式会社 | 音響シーン再構成装置、音響シーン再構成方法、およびプログラム |
JP7001566B2 (ja) | 2018-09-04 | 2022-02-04 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、およびプログラム |
JP2020038123A (ja) * | 2018-09-04 | 2020-03-12 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、およびプログラム |
CN114502926A (zh) * | 2020-06-09 | 2022-05-13 | 东芝三菱电机产业系统株式会社 | 金属材料加工设备的异响观测系统 |
CN113376576A (zh) * | 2020-07-23 | 2021-09-10 | 郑州大学 | 基于小孔径麦克风阵列的声源定位传感器的定位方法 |
CN114616483A (zh) * | 2020-10-05 | 2022-06-10 | 铁三角有限公司 | 声源定位设备、声源定位方法和程序 |
US11665391B2 (en) | 2021-01-13 | 2023-05-30 | Panasonic Intellectual Property Management Co., Ltd. | Signal processing device and signal processing system |
CN113539288A (zh) * | 2021-07-22 | 2021-10-22 | 南京华捷艾米软件科技有限公司 | 一种语音信号去噪方法及装置 |
KR102335765B1 (ko) * | 2021-10-06 | 2021-12-06 | 주식회사 휴라 | 전파 측정에 기반하여 무인 항공기를 탐지하기 위한 방법 및 장치 |
CN114203181A (zh) * | 2021-12-10 | 2022-03-18 | 北京百度网讯科技有限公司 | 用于识别对话语音的方法、装置以及可拆卸的拾音设备 |
CN115424633A (zh) * | 2022-08-02 | 2022-12-02 | 钉钉(中国)信息技术有限公司 | 说话人定位方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6467736B2 (ja) | 2019-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6467736B2 (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
Brandstein et al. | A practical methodology for speech source localization with microphone arrays | |
Ishi et al. | Evaluation of a MUSIC-based real-time sound localization of multiple sound sources in real noisy environments | |
CN110875060A (zh) | 语音信号处理方法、装置、系统、设备和存储介质 | |
Aarabi et al. | Robust sound localization using multi-source audiovisual information fusion | |
CN112088315A (zh) | 多模式语音定位 | |
JP6240995B2 (ja) | 移動体、音響源マップ作成システムおよび音響源マップ作成方法 | |
KR102230667B1 (ko) | 오디오-비주얼 데이터에 기반한 화자 분리 방법 및 장치 | |
US12148441B2 (en) | Source separation for automatic speech recognition (ASR) | |
Vesperini et al. | Localizing speakers in multiple rooms by using deep neural networks | |
CN106872945B (zh) | 声源定位方法、装置和电子设备 | |
KR20130116299A (ko) | 음향 삼각 측량에 의한 공간 선택적 사운드 취득 장치 및 방법 | |
JP2014098568A (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
Ishi et al. | Using multiple microphone arrays and reflections for 3D localization of sound sources | |
Ishi et al. | Speech activity detection and face orientation estimation using multiple microphone arrays and human position information | |
JP2023550434A (ja) | 改良型音響源測位法 | |
Nakadai et al. | Sound source tracking with directivity pattern estimation using a 64 ch microphone array | |
Marti et al. | Real time speaker localization and detection system for camera steering in multiparticipant videoconferencing environments | |
Pertilä et al. | Multichannel source activity detection, localization, and tracking | |
Cho et al. | Sound source localization for robot auditory systems | |
Macho et al. | Automatic speech activity detection, source localization, and speech recognition on the CHIL seminar corpus | |
Shivappa et al. | Role of head pose estimation in speech acquisition from distant microphones | |
Blauth et al. | Voice activity detection and speaker localization using audiovisual cues | |
CN118748008A (zh) | 多模态语音识别方法、装置、设备及计算机可读介质 | |
Nguyen et al. | Selection of the closest sound source for robot auditory attention in multi-source scenarios |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180710 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6467736 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |