JP2012211768A - 音源定位装置 - Google Patents
音源定位装置 Download PDFInfo
- Publication number
- JP2012211768A JP2012211768A JP2011076230A JP2011076230A JP2012211768A JP 2012211768 A JP2012211768 A JP 2012211768A JP 2011076230 A JP2011076230 A JP 2011076230A JP 2011076230 A JP2011076230 A JP 2011076230A JP 2012211768 A JP2012211768 A JP 2012211768A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- output
- sound
- candidate
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 30
- 238000000926 separation method Methods 0.000 claims abstract description 29
- 230000004807 localization Effects 0.000 claims description 75
- 238000000034 method Methods 0.000 claims description 44
- 238000001514 detection method Methods 0.000 claims description 29
- 230000004044 response Effects 0.000 claims description 15
- 238000013179 statistical model Methods 0.000 claims description 4
- 238000003491 array Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 69
- 239000013598 vector Substances 0.000 description 33
- 238000004364 calculation method Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 19
- 239000011159 matrix material Substances 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 101100011863 Arabidopsis thaliana ERD15 gene Proteins 0.000 description 8
- 101001046894 Homo sapiens Protein HID1 Proteins 0.000 description 8
- 102100022877 Protein HID1 Human genes 0.000 description 8
- 101100191082 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GLC7 gene Proteins 0.000 description 8
- 101100274406 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cid1 gene Proteins 0.000 description 8
- 238000000354 decomposition reaction Methods 0.000 description 7
- 238000009432 framing Methods 0.000 description 7
- 101150021084 CID2 gene Proteins 0.000 description 6
- 241000282412 Homo Species 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000020509 sex determination Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
【解決手段】音源定位装置は、人の位置を検出するLRF(レーザレンジファインダ)群56と、マイクロホンアレイ群52の出力から得られる複数チャンネルの音源信号の各々と、マイクロホンアレイに含まれる各マイクロホンの間の位置関係と、LRF群56の出力とに基づいて、複数の方向の各々について、所定時間ごとにMUSICパワーを算出し、そのピークを音源位置として所定時間ごとに検出する音源定位処理部60と、マイクロホンアレイの出力信号から、音源定位処理部60により検出された音源位置からの音声信号を分離する音源分離処理部70と、分離された音声信号の属性を人位置計測装置58の出力を用いて高精度で判定する音源種類同定処理部72とを含む。
【選択図】図2
Description
坂場 俊介、冨澤 哲雄、大場 光太郎、和田 和義、「分散配置された物体形状の知識とLRFを併用したパスプラニングに関する研究」(第8回計測自動制御学会システムインテグレーション部門講演会(S12007)資料、2007年12月7日、計測自動制御学会。
宮下敬宏、Glas Dylan、石黒浩、萩田紀博、「レーザ距離計による適応型人形状モデルを利用した人追跡手法」、
第25回日本ロボット学会学術講演会、1I13、2007。
図1に、本発明の1実施の形態の構成の原理を概念的に示す。本発明に係る音源定位装置の1例である音源分離及び音種類判定装置は、図1には図示していないLRFと、LRFの出力から周囲の人間の位置とその種類(人間の識別子)とを判定する人位置計測装置と、音源定位のための、特許文献1で開示されている技術とを組合わせることにより、音源種類の判定と音源定位とを行なう。なお、図1がフローチャート形式で示されていることからも分かるように、本実施の形態は、CPU(中央演算処理装置)を含むコンピュータハードウェアと、コンピュータハードウェアにより実行されることにより、音源種類の判定と音源定位とを行なうコンピュータプログラムとにより実現される。もちろん、そのような組合せでの実現に本発明が限定されるわけではない。例えばプログラムと同様のアルゴリズムをハードウェアにより実現する装置、プログラムをハードワイア化した装置によっても同様の効果を得られることはいうまでもない。
図4を参照して、音源定位部84は、対応するマイクロホンアレイからアレイに含まれるマイクロホンの数(例えば14個)のアナログ音源信号を受け、アナログ/デジタル(A/D)変換を行なって同数のデジタル音源信号を出力するA/D変換器100と、A/D変換器100から出力される複数のデジタル音声信号を受け、音声信号を所定時間毎にフレーム化し、各フレームについてMUSIC応答の算出のために必要なマイクロホン出力に関する相関行列と、その最大固有値と、最大固有値以外の固有値に対応する固有ベクトルである雑音空間とを算出し出力する固有ベクトル算出部102と、固有ベクトル算出部102から所定時間ごとに出力される情報を使用し、位置ベクトルDB80から得られる位置ベクトルにより定まる各方向についてMUSIC法により算出されるMUSIC応答を出力するMUSIC処理部104と、MUSIC処理部104の出力するMUSIC応答をしきい値と比較することにより、MUSIC音源が存在する可能性の高い方位を、すなわちピークの方位を推定し音源の方向を示す情報を出力するピーク検出部106とを含む。
上に説明した音源分離及び音種類判定装置は以下のように動作する。この動作に先立ち、図2に示す人位置計測装置58には、測定対象となる人物をLRF群56の出力に基づいて識別するために必要な情報と、各人物の識別子とが記憶されているものとする。また図3に示す位置ベクトルDB80には音源分離及び音種類判定装置がMUSIC応答を算出するための空間グリッドの各点(方位)を特定する位置ベクトルが予め記憶されている。アレイ位置DB82には、マイクロホンアレイ群52を構成する各マイクロホンアレイの位置が記憶される。複数の個人別GMM180としては、測定対象となる人物についてそれぞれ予め作成された音響モデルが準備される。雑音GMM182としては、予め収集された、属性が予め分かっている雑音に関する音響モデルが準備される。
最初にステップ280で候補リスト240の要素数(候補のエントリ数)が1か否かが判定される。判定結果が肯定であれば制御はステップ306に進み、候補リスト240が履歴リスト242にコピーされ、呼出元ルーチンに復帰する。ここでは、検出ID・尤度リスト230の要素数が3である場合を想定しているのでステップ280の判定は否定となり、ステップ282に制御が進む。
図10を参照して、ステップ280の判定結果はNOとなる。続くステップ282の判定結果もNOとなる。制御はステップ284に進み、CID1とCID2との尤度を前述の式にしたがって再計算し、その結果、NProb1とNProb2とが得られる。
この場合、ステップ288の処理により、新たな候補リスト240の1番目の候補の識別子CID1が履歴リスト242の1番目の候補の識別子HID1に代入され、候補リスト240の1番目の候補の尤度NProb1が履歴リスト242の1番目の候補の尤度HProb1に代入される。さらに、ステップ292の処理により、新たな候補リスト240の2番目の候補の識別子CID2が履歴リスト242の2番目の候補の識別子HID2に代入され、候補リスト240の2番目の候補の尤度NProb2が履歴リスト242の2番目の候補の尤度HProb2に代入される。すなわち、履歴リスト242の1、2番目の候補に代えて、候補リスト240の1番目及び2番目の候補が履歴リスト242の1番目及び2番目にそれぞれ代入される。この後、図9のステップ256に制御が戻る。
この場合には、ステップ294で、新たな候補リスト240の2番目の候補の識別子CID2が履歴リスト242の1番目の候補の識別子HID1に代入され、候補リスト240の2番目の候補の尤度NProb2が履歴リスト242の1番目の候補の尤度HProb1に代入される。さらに、ステップ296で、新たな候補リスト240の1番目の候補の識別子CID1が履歴リスト242の2番目の候補の識別子HID2に代入され、候補リスト240の1番目の候補の尤度NProb1が履歴リスト242の2番目の候補の尤度HProb2に代入される。要するに、直前の1番目及び2番目の候補が入れ替わることになる。
この場合には上記(1)と同じ処理が実行される。
図10のステップ298で、再帰的な呼出がおこなわれた場合のこのプログラムによる処理について説明する。説明を分かりやすくするため、図9のルーチンを「主ルーチン」、主ルーチンから呼出された図10のルーチンを「子ルーチン」、子ルーチンから呼出された図10のルーチンを「孫ルーチン」、孫ルーチンから呼出された図10のルーチンを「ひ孫ルーチン」と呼ぶことにする。上記説明にしたがえば、孫ルーチンでは、新たな候補リスト240及び履歴リスト242の要素数は、いずれも2となっている。説明を分かりやすくするため、引数として渡される候補リスト240及び履歴リスト242の各エントリの識別子及び尤度については、親ルーチンのときと同じ呼び方で示すものとする。
この実施の形態に係る音源分離及び音種類判定装置は、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現される。図11はこのコンピュータシステム530の外観を示し、図12はコンピュータシステム530の内部構成を示す。
52 マイクロホンアレイ群
54 同期用タイムサーバ
56 LRF群
58 人位置計測装置
60 音源定位処理部
70 音源分離処理部
72 音源種類同定処理部
80 位置ベクトルDB
82 アレイ位置DB
84,86,88 音源定位部
102 固有ベクトル算出部
104 MUSIC処理部
106 ピーク検出部
108 相対位置ベクトル生成部
110 詳細探索部
160,162,164 適応ビームフォーマ
180 個人別GMM
182 雑音GMM
190,192,194 音源属性判定部
210 比較部
212 選択部
214 特徴抽出部
216 音源属性推定部
230 検出ID・尤度リスト
240 候補リスト
242 履歴リスト
Claims (3)
- レーザレンジファインダにより人の位置を検出する人位置検出手段と、
マイクロホンアレイの出力から得られる複数チャンネルの音源信号の各々と、前記マイクロホンアレイに含まれる各マイクロホンの間の位置関係と、前記人位置検出手段の出力とに基づいて、前記マイクロホンアレイの位置に関連して定められる点を中心とする空間内で定義された複数の方向の各々について、所定時間ごとにMUSICパワーを算出し、当該MUSICパワーのピークを音源位置として前記所定時間ごとに検出するための音源定位手段と、
前記マイクロホンアレイの出力信号から、前記音源定位手段により検出された音源位置からの音声信号を分離する音源分離手段と、
前記音源分離手段により分離された音声信号の属性を判定する音源属性判定手段とを含む、音源定位装置。 - 前記音源属性判定手段は、
複数の個人の音声の音響的特徴量の統計的モデルである複数の個人別音響モデルと、
人間以外の音源であって、属性が既知の雑音源からの音響的特徴量の統計的モデルである複数の雑音音響モデルと、
前記人位置検出手段の出力と、前記音源定位手段の出力とを受け、音源方向に人が存在するときには前記複数の個人別音響モデル及び前記複数の雑音音響モデルとを選択し、音源方向に人が存在しないときには前記複数の雑音音響モデルを選択する、音響モデル選択手段と、
前記音響モデル選択手段により選択された音響モデルを用い、前記音源分離手段により分離された音声信号の属性を確率的手法により推定する統計的推定手段とを含む、請求項
1に記載の音源定位装置。 - 前記音源定位手段は、
マイクロホンアレイの出力から得られる複数チャンネルの音源信号の各々と、前記マイクロホンアレイに含まれる各マイクロホンの間の位置関係とに基づき、前記複数の方向の各々について、所定時間ごとにMUSICパワーを算出し、当該MUSICパワーがしきい値を超えるピークが存在する位置及び方向を音源の概略の位置として推定する概略位置推定手段と、
前記概略位置推定手段により推定された位置及び方向のうち、前記人位置検出手段により人が検出された位置及び方向を中心としてより詳細に前記MUSICパワーのピークを検出することにより、音源位置を検出するための詳細検出手段とを含む、請求項1または請求項2に記載の音源定位装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011076230A JP5724125B2 (ja) | 2011-03-30 | 2011-03-30 | 音源定位装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011076230A JP5724125B2 (ja) | 2011-03-30 | 2011-03-30 | 音源定位装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012211768A true JP2012211768A (ja) | 2012-11-01 |
JP5724125B2 JP5724125B2 (ja) | 2015-05-27 |
Family
ID=47265860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011076230A Active JP5724125B2 (ja) | 2011-03-30 | 2011-03-30 | 音源定位装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5724125B2 (ja) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5318258B1 (ja) * | 2012-07-03 | 2013-10-16 | 株式会社東芝 | 集音装置 |
CN103811020A (zh) * | 2014-03-05 | 2014-05-21 | 东北大学 | 一种智能语音处理方法 |
JP2014098568A (ja) * | 2012-11-13 | 2014-05-29 | Advanced Telecommunication Research Institute International | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
JP2016050872A (ja) * | 2014-09-01 | 2016-04-11 | 株式会社国際電気通信基礎技術研究所 | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
JP2016100677A (ja) * | 2014-11-19 | 2016-05-30 | 株式会社国際電気通信基礎技術研究所 | 臨場感伝達システムおよび臨場感再現装置 |
JP2016133304A (ja) * | 2015-01-15 | 2016-07-25 | 本田技研工業株式会社 | 音源定位装置、音響処理システム、及び音源定位装置の制御方法 |
JP2017092732A (ja) * | 2015-11-11 | 2017-05-25 | 株式会社国際電気通信基礎技術研究所 | 聴覚支援システムおよび聴覚支援装置 |
CN106898360A (zh) * | 2017-04-06 | 2017-06-27 | 北京地平线信息技术有限公司 | 音频信号处理方法、装置和电子设备 |
CN107123421A (zh) * | 2017-04-11 | 2017-09-01 | 广东美的制冷设备有限公司 | 语音控制方法、装置及家电设备 |
JP2018040848A (ja) * | 2016-09-05 | 2018-03-15 | 本田技研工業株式会社 | 音響処理装置および音響処理方法 |
JP2018156047A (ja) * | 2017-03-21 | 2018-10-04 | 株式会社東芝 | 信号処理装置、信号処理方法および属性付与装置 |
WO2018188287A1 (zh) * | 2017-04-11 | 2018-10-18 | 广东美的制冷设备有限公司 | 一种语音控制方法、装置及家电设备 |
CN109254266A (zh) * | 2018-11-07 | 2019-01-22 | 苏州科达科技股份有限公司 | 基于麦克风阵列的声源定位方法、装置及存储介质 |
CN109309607A (zh) * | 2018-10-15 | 2019-02-05 | 珠海格力电器股份有限公司 | 家电设备操作执行方法、装置、家电设备及可读存储介质 |
JP2019537071A (ja) * | 2017-09-25 | 2019-12-19 | ボーズ・コーポレーションBosecorporation | 分散したマイクロホンからの音声の処理 |
CN110827849A (zh) * | 2019-11-11 | 2020-02-21 | 广州国音智能科技有限公司 | 数据建库的人声分离方法、装置、终端及可读存储介质 |
JP2020030376A (ja) * | 2018-08-24 | 2020-02-27 | 本田技研工業株式会社 | 音響シーン再構成装置、音響シーン再構成方法、およびプログラム |
CN111383629A (zh) * | 2020-03-20 | 2020-07-07 | 深圳市未艾智能有限公司 | 语音处理方法和装置、电子设备以及存储介质 |
WO2020218075A1 (ja) * | 2019-04-26 | 2020-10-29 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JPWO2019138619A1 (ja) * | 2018-01-09 | 2021-01-28 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
CN113376576A (zh) * | 2020-07-23 | 2021-09-10 | 郑州大学 | 基于小孔径麦克风阵列的声源定位传感器的定位方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102605755B1 (ko) | 2016-12-19 | 2023-11-27 | 삼성전자주식회사 | 스피커를 제어하는 전자 장치와 이의 동작 방법 |
CN107170440A (zh) * | 2017-05-31 | 2017-09-15 | 宇龙计算机通信科技(深圳)有限公司 | 定向传声方法、装置、移动终端及计算机可读存储介质 |
US20230290355A1 (en) * | 2020-07-10 | 2023-09-14 | Amosense Co., Ltd. | Device for processing voice and operation method thereof |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091469A (ja) * | 2000-09-19 | 2002-03-27 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声認識装置 |
JP2002135642A (ja) * | 2000-10-24 | 2002-05-10 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声翻訳システム |
JP2005181088A (ja) * | 2003-12-19 | 2005-07-07 | Advanced Telecommunication Research Institute International | モーションキャプチャシステム及びモーションキャプチャ方法 |
US20060075422A1 (en) * | 2004-09-30 | 2006-04-06 | Samsung Electronics Co., Ltd. | Apparatus and method performing audio-video sensor fusion for object localization, tracking, and separation |
JP2008158868A (ja) * | 2006-12-25 | 2008-07-10 | Toyota Motor Corp | 移動体、及びその制御方法 |
JP2008175733A (ja) * | 2007-01-19 | 2008-07-31 | Fujitsu Ltd | 音声到来方向推定・ビームフォーミングシステム、移動装置及び音声到来方向推定・ビームフォーミング方法 |
JP2009162689A (ja) * | 2008-01-09 | 2009-07-23 | Honda Elesys Co Ltd | 電子走査型レーダ装置、受信波方向推定方法及び受信波方向推定プログラム |
JP2010121975A (ja) * | 2008-11-17 | 2010-06-03 | Advanced Telecommunication Research Institute International | 音源定位装置 |
JP2010231359A (ja) * | 2009-03-26 | 2010-10-14 | Advanced Telecommunication Research Institute International | 遠隔操作装置 |
JP2011220701A (ja) * | 2010-04-05 | 2011-11-04 | Advanced Telecommunication Research Institute International | 音源定位装置及びコンピュータプログラム |
JP2012042465A (ja) * | 2010-08-17 | 2012-03-01 | Honda Motor Co Ltd | 音源方向推定装置及び音源方向推定方法 |
-
2011
- 2011-03-30 JP JP2011076230A patent/JP5724125B2/ja active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091469A (ja) * | 2000-09-19 | 2002-03-27 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声認識装置 |
JP2002135642A (ja) * | 2000-10-24 | 2002-05-10 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声翻訳システム |
JP2005181088A (ja) * | 2003-12-19 | 2005-07-07 | Advanced Telecommunication Research Institute International | モーションキャプチャシステム及びモーションキャプチャ方法 |
US20060075422A1 (en) * | 2004-09-30 | 2006-04-06 | Samsung Electronics Co., Ltd. | Apparatus and method performing audio-video sensor fusion for object localization, tracking, and separation |
JP2006123161A (ja) * | 2004-09-30 | 2006-05-18 | Samsung Electronics Co Ltd | 位置把握、追跡および分離のためのオーディオビデオセンサー融合装置および融合方法 |
JP2008158868A (ja) * | 2006-12-25 | 2008-07-10 | Toyota Motor Corp | 移動体、及びその制御方法 |
JP2008175733A (ja) * | 2007-01-19 | 2008-07-31 | Fujitsu Ltd | 音声到来方向推定・ビームフォーミングシステム、移動装置及び音声到来方向推定・ビームフォーミング方法 |
JP2009162689A (ja) * | 2008-01-09 | 2009-07-23 | Honda Elesys Co Ltd | 電子走査型レーダ装置、受信波方向推定方法及び受信波方向推定プログラム |
JP2010121975A (ja) * | 2008-11-17 | 2010-06-03 | Advanced Telecommunication Research Institute International | 音源定位装置 |
JP2010231359A (ja) * | 2009-03-26 | 2010-10-14 | Advanced Telecommunication Research Institute International | 遠隔操作装置 |
JP2011220701A (ja) * | 2010-04-05 | 2011-11-04 | Advanced Telecommunication Research Institute International | 音源定位装置及びコンピュータプログラム |
JP2012042465A (ja) * | 2010-08-17 | 2012-03-01 | Honda Motor Co Ltd | 音源方向推定装置及び音源方向推定方法 |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5318258B1 (ja) * | 2012-07-03 | 2013-10-16 | 株式会社東芝 | 集音装置 |
JP2014098568A (ja) * | 2012-11-13 | 2014-05-29 | Advanced Telecommunication Research Institute International | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
CN103811020A (zh) * | 2014-03-05 | 2014-05-21 | 东北大学 | 一种智能语音处理方法 |
CN103811020B (zh) * | 2014-03-05 | 2016-06-22 | 东北大学 | 一种智能语音处理方法 |
JP2016050872A (ja) * | 2014-09-01 | 2016-04-11 | 株式会社国際電気通信基礎技術研究所 | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
JP2016100677A (ja) * | 2014-11-19 | 2016-05-30 | 株式会社国際電気通信基礎技術研究所 | 臨場感伝達システムおよび臨場感再現装置 |
JP2016133304A (ja) * | 2015-01-15 | 2016-07-25 | 本田技研工業株式会社 | 音源定位装置、音響処理システム、及び音源定位装置の制御方法 |
JP2017092732A (ja) * | 2015-11-11 | 2017-05-25 | 株式会社国際電気通信基礎技術研究所 | 聴覚支援システムおよび聴覚支援装置 |
JP2018040848A (ja) * | 2016-09-05 | 2018-03-15 | 本田技研工業株式会社 | 音響処理装置および音響処理方法 |
JP2018156047A (ja) * | 2017-03-21 | 2018-10-04 | 株式会社東芝 | 信号処理装置、信号処理方法および属性付与装置 |
CN106898360A (zh) * | 2017-04-06 | 2017-06-27 | 北京地平线信息技术有限公司 | 音频信号处理方法、装置和电子设备 |
CN106898360B (zh) * | 2017-04-06 | 2023-08-08 | 北京地平线信息技术有限公司 | 音频信号处理方法、装置和电子设备 |
CN107123421A (zh) * | 2017-04-11 | 2017-09-01 | 广东美的制冷设备有限公司 | 语音控制方法、装置及家电设备 |
WO2018188287A1 (zh) * | 2017-04-11 | 2018-10-18 | 广东美的制冷设备有限公司 | 一种语音控制方法、装置及家电设备 |
JP2019537071A (ja) * | 2017-09-25 | 2019-12-19 | ボーズ・コーポレーションBosecorporation | 分散したマイクロホンからの音声の処理 |
EP3739415A4 (en) * | 2018-01-09 | 2021-03-03 | Sony Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND PROGRAM |
JPWO2019138619A1 (ja) * | 2018-01-09 | 2021-01-28 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP7120254B2 (ja) | 2018-01-09 | 2022-08-17 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US11373355B2 (en) | 2018-08-24 | 2022-06-28 | Honda Motor Co., Ltd. | Acoustic scene reconstruction device, acoustic scene reconstruction method, and program |
JP2020030376A (ja) * | 2018-08-24 | 2020-02-27 | 本田技研工業株式会社 | 音響シーン再構成装置、音響シーン再構成方法、およびプログラム |
JP7177631B2 (ja) | 2018-08-24 | 2022-11-24 | 本田技研工業株式会社 | 音響シーン再構成装置、音響シーン再構成方法、およびプログラム |
CN109309607A (zh) * | 2018-10-15 | 2019-02-05 | 珠海格力电器股份有限公司 | 家电设备操作执行方法、装置、家电设备及可读存储介质 |
CN109254266A (zh) * | 2018-11-07 | 2019-01-22 | 苏州科达科技股份有限公司 | 基于麦克风阵列的声源定位方法、装置及存储介质 |
WO2020218075A1 (ja) * | 2019-04-26 | 2020-10-29 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP7428182B2 (ja) | 2019-04-26 | 2024-02-06 | ソニーグループ株式会社 | 情報処理装置および方法、並びにプログラム |
CN110827849B (zh) * | 2019-11-11 | 2022-07-26 | 广州国音智能科技有限公司 | 数据建库的人声分离方法、装置、终端及可读存储介质 |
CN110827849A (zh) * | 2019-11-11 | 2020-02-21 | 广州国音智能科技有限公司 | 数据建库的人声分离方法、装置、终端及可读存储介质 |
CN111383629A (zh) * | 2020-03-20 | 2020-07-07 | 深圳市未艾智能有限公司 | 语音处理方法和装置、电子设备以及存储介质 |
CN113376576A (zh) * | 2020-07-23 | 2021-09-10 | 郑州大学 | 基于小孔径麦克风阵列的声源定位传感器的定位方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5724125B2 (ja) | 2015-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5724125B2 (ja) | 音源定位装置 | |
US11875820B1 (en) | Context driven device arbitration | |
US10847171B2 (en) | Method for microphone selection and multi-talker segmentation with ambient automated speech recognition (ASR) | |
US10847162B2 (en) | Multi-modal speech localization | |
US11064294B1 (en) | Multiple-source tracking and voice activity detections for planar microphone arrays | |
US9626970B2 (en) | Speaker identification using spatial information | |
JP4937622B2 (ja) | 位置標定モデルを構築するコンピュータ実施方法 | |
CN110875060A (zh) | 语音信号处理方法、装置、系统、设备和存储介质 | |
US10535361B2 (en) | Speech enhancement using clustering of cues | |
KR20180042376A (ko) | 응답을 제공하기 위한 디바이스 선택 | |
Dorfan et al. | Tree-based recursive expectation-maximization algorithm for localization of acoustic sources | |
JP6467736B2 (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
JP2008079256A (ja) | 音響信号処理装置、音響信号処理方法及びプログラム | |
US10878812B1 (en) | Determining devices to respond to user requests | |
CN109196583A (zh) | 动态语音识别数据评估 | |
KR20210137146A (ko) | 큐의 클러스터링을 사용한 음성 증강 | |
Cho et al. | Sound source localization for robot auditory systems | |
Kim et al. | Acoustic Event Detection in Multichannel Audio Using Gated Recurrent Neural Networks with High‐Resolution Spectral Features | |
Dao et al. | Indoor navigation assistance system for visually impaired people using multimodal technologies | |
JP2017067948A (ja) | 音声処理装置および音声処理方法 | |
Kojima et al. | Bird song scene analysis using a spatial-cue-based probabilistic model | |
JP2005196020A (ja) | 音声処理装置と方法並びにプログラム | |
JP2021184282A (ja) | 音声操作装置及びその制御方法 | |
US20200333423A1 (en) | Sound source direction estimation device and method, and program | |
US12002444B1 (en) | Coordinated multi-device noise cancellation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140314 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5724125 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |