JP7493158B2 - 音声処理装置および音声処理方法 - Google Patents
音声処理装置および音声処理方法 Download PDFInfo
- Publication number
- JP7493158B2 JP7493158B2 JP2020028730A JP2020028730A JP7493158B2 JP 7493158 B2 JP7493158 B2 JP 7493158B2 JP 2020028730 A JP2020028730 A JP 2020028730A JP 2020028730 A JP2020028730 A JP 2020028730A JP 7493158 B2 JP7493158 B2 JP 7493158B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- signal
- speaker
- main speaker
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 77
- 238000003672 processing method Methods 0.000 title claims description 8
- 230000001629 suppression Effects 0.000 claims description 144
- 230000015654 memory Effects 0.000 claims description 30
- 239000000203 mixture Substances 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 description 35
- 238000000034 method Methods 0.000 description 30
- 238000004364 calculation method Methods 0.000 description 17
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 15
- 230000002452 interceptive effect Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 3
- 238000012880 independent component analysis Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
音響クロストーク抑圧装置が使用される場面として、例えば、二人の人物が会話する状況が想定される。音響クロストーク抑圧装置は、例えば、特許第6635394号等に開示されるように、一方の人物が発話した音声に他方の人物が発話した音声がクロストーク成分として含まれる場合に、クロストーク成分を抑圧(言い換えると、減算)するための抑圧信号を生成し、その一方の人物の発話による音声信号から抑圧信号を抑圧することで、クロストーク成分が抑圧された音声信号を出力できる。二人の人物が会話する状況として、例えば、刑務所などで刑務官と犯罪者などの入所者とが向かい合って会話する状況、店舗などで店員と顧客とがテーブルを挟んで対話する状況、オフィスなどで社員と上司とが会議で話し合う状況などが挙げられるが、上述した状況に限定されなくてよい。発話の内容は、ログとして記録され、テキストに変換されて保存されてもよいし、発話の音声信号が音声認識の処理として入力されてもよい。
図1は、実施の形態1に係る音響クロストーク抑圧装置5の機能的構成例を示すブロック図である。音声処理装置の一例としての音響クロストーク抑圧装置5は、目的音に混ざる妨害音を抑圧するものであり、DSP(Digital Signal Processor)10とメモリ50,51とを含む構成である。音響クロストーク抑圧装置5には、マイクmc1が入力機器として接続され、音声認識エンジン(図示略)が出力機器として接続される。
実施の形態2に係る音響クロストーク抑圧装置5Aでは、任意の方向に指向性を形成可能なマイクアレイを用いる場合を示す。図3は、実施の形態2に係る音響クロストーク抑圧装置5Aの機能的構成例を示すブロック図である。実施の形態2に係る音響クロストーク抑圧装置5Aにおいて、実施の形態1と同一の構成要素については同一の符号を用いることで、その説明を省略し、ここでは相違する部分だけを説明する。音響クロストーク抑圧装置5Aは、実施の形態1と比べ、マイクmc1の代わりに、マイクアレイmAを含む構成である。
22 加算器
23 畳み込み信号生成部
25 フィルタ更新部
26 更新量計算部
27 非線形変換部
28 ノルム算出部
29 ディレイ
41,41A 妨害音混合率推定部
42 信号処理選択部
43 切替部
43a 第1端子
43b 第2端子
mA マイクアレイ
mc1 マイク
Claims (8)
- 閉空間内に配置された収音装置と接続され、
前記収音装置と前記閉空間内に存在するメイン話者を含む複数人のそれぞれとの位置関係を示す話者位置情報を保持するメモリと、
前記話者位置情報に基づいて、前記メイン話者以外の他人物の音声信号に対して前記メイン話者の音声信号が含まれる割合を示す混合率を推定する混合率推定部と、
前記混合率の推定結果に基づいて、前記メイン話者の音声信号に含まれる前記他人物の発話によるクロストーク成分の抑圧の要否を判別する決定部と、を備える、
音声処理装置。 - 前記決定部は、前記混合率の推定結果が所定の閾値以下であると判定した場合に、前記メイン話者の音声信号に含まれる前記他人物の発話によるクロストーク成分の抑圧を行うと決定する、
請求項1に記載の音声処理装置。 - 前記決定部は、前記混合率の推定結果が所定の閾値より大きいと判定した場合に、前記メイン話者の音声信号に含まれる前記他人物の発話によるクロストーク成分の抑圧を行わないと決定する、
請求項1に記載の音声処理装置。 - 前記メイン話者の音声信号に含まれる前記他人物の発話によるクロストーク成分の抑圧信号を生成するフィルタを有し、前記クロストーク成分を抑圧するための前記フィルタのパラメータを更新し、その更新結果をメモリに保持するフィルタ更新部と、
前記フィルタにより生成された前記抑圧信号を用いて、前記メイン話者の音声信号に含まれる前記クロストーク成分を抑圧するクロストーク抑圧部と、をさらに備える、
請求項1に記載の音声処理装置。 - 前記混合率推定部は、前記話者位置情報に含まれる前記メイン話者の位置から前記収音装置の位置までの第1距離と、前記話者位置情報に含まれる前記他人物の位置から前記収音装置の位置までの第2距離との比率に基づいて、前記混合率を推定する、
請求項1に記載の音声処理装置。 - 前記フィルタは、前記メモリに保持されている最新の前記フィルタのパラメータの更新結果を用いて、前記抑圧信号を生成する、
請求項4に記載の音声処理装置。 - 入力された前記メイン話者の音声信号を、前記クロストーク抑圧部を介さずに前記音声処理装置の出力段に伝達する第1端子と、入力された前記メイン話者の音声信号を、前記クロストーク抑圧部を介して前記音声処理装置の出力段に伝達する第2端子とを有し、前記クロストーク成分の抑圧の要否の判別結果に基づいて、前記メイン話者の音声信号の入力を前記第1端子または前記第2端子に切り替える切替部、をさらに備える、
請求項4に記載の音声処理装置。 - 閉空間内に配置された収音装置と接続された音声処理装置により実行される音声処理方法であって、
前記収音装置と前記閉空間内に存在するメイン話者を含む複数人のそれぞれとの位置関係を示す話者位置情報をメモリに保持し、
前記話者位置情報に基づいて、前記メイン話者以外の他人物の音声信号に対して前記メイン話者の音声信号が含まれる割合を示す混合率を推定し、
前記混合率の推定結果に基づいて、前記メイン話者の音声信号に含まれる前記他人物の発話によるクロストーク成分の抑圧の要否を判別する、
音声処理方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020028730A JP7493158B2 (ja) | 2020-02-21 | 2020-02-21 | 音声処理装置および音声処理方法 |
US17/179,985 US11410671B2 (en) | 2020-02-21 | 2021-02-19 | Speech processing device and speech processing meihod |
US17/851,945 US11735201B2 (en) | 2020-02-21 | 2022-06-28 | Speech processing device and speech processing method |
US18/210,702 US20230335149A1 (en) | 2020-02-21 | 2023-06-16 | Speech processing device and speech processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020028730A JP7493158B2 (ja) | 2020-02-21 | 2020-02-21 | 音声処理装置および音声処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021135310A JP2021135310A (ja) | 2021-09-13 |
JP7493158B2 true JP7493158B2 (ja) | 2024-05-31 |
Family
ID=77661056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020028730A Active JP7493158B2 (ja) | 2020-02-21 | 2020-02-21 | 音声処理装置および音声処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7493158B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004187283A (ja) | 2002-11-18 | 2004-07-02 | Matsushita Electric Ind Co Ltd | マイクロホン装置および再生装置 |
WO2007080886A1 (ja) | 2006-01-11 | 2007-07-19 | Nec Corporation | 音声認識装置、音声認識方法、および音声認識プログラム、ならびに妨害軽減装置、妨害軽減方法、および妨害軽減プログラム |
JP2013168857A (ja) | 2012-02-16 | 2013-08-29 | Jvc Kenwood Corp | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
JP6635394B1 (ja) | 2019-01-29 | 2020-01-22 | パナソニックIpマネジメント株式会社 | 音声処理装置および音声処理方法 |
-
2020
- 2020-02-21 JP JP2020028730A patent/JP7493158B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004187283A (ja) | 2002-11-18 | 2004-07-02 | Matsushita Electric Ind Co Ltd | マイクロホン装置および再生装置 |
WO2007080886A1 (ja) | 2006-01-11 | 2007-07-19 | Nec Corporation | 音声認識装置、音声認識方法、および音声認識プログラム、ならびに妨害軽減装置、妨害軽減方法、および妨害軽減プログラム |
JP2013168857A (ja) | 2012-02-16 | 2013-08-29 | Jvc Kenwood Corp | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
JP6635394B1 (ja) | 2019-01-29 | 2020-01-22 | パナソニックIpマネジメント株式会社 | 音声処理装置および音声処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2021135310A (ja) | 2021-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11297178B2 (en) | Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters | |
EP2936830B1 (en) | Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrivial estimates | |
JP4588966B2 (ja) | 雑音低減のための方法 | |
CA2560034C (en) | System for selectively extracting components of an audio input signal | |
US9002027B2 (en) | Space-time noise reduction system for use in a vehicle and method of forming same | |
CN110856072B (zh) | 一种耳机通话降噪方法及耳机 | |
CN111131947B (zh) | 耳机信号处理方法、系统和耳机 | |
US20080292108A1 (en) | Dereverberation system for use in a signal processing apparatus | |
JP6545419B2 (ja) | 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置 | |
WO2007018293A1 (ja) | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム | |
KR20040019362A (ko) | 후처리기로서 멀티 마이크로폰 에코 억제기를 가지는 음향보강 시스템 | |
CN110782912A (zh) | 音源的控制方法以及扬声设备 | |
US20230335149A1 (en) | Speech processing device and speech processing method | |
CN111078185A (zh) | 录制声音的方法及设备 | |
Zhang et al. | Neural cascade architecture for multi-channel acoustic echo suppression | |
JP3756828B2 (ja) | 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体 | |
JP7493158B2 (ja) | 音声処理装置および音声処理方法 | |
JP2008245250A (ja) | 音声会議装置 | |
US20220189450A1 (en) | Audio processing system and audio processing device | |
JP7486153B2 (ja) | 音声処理装置および音声処理方法 | |
Adcock et al. | Practical issues in the use of a frequency‐domain delay estimator for microphone‐array applications | |
JP2021135311A (ja) | 音声処理装置および音声処理方法 | |
Saremi | Spatial audio signal processing for speech telecommunication inside vehicles | |
WO2023149254A1 (ja) | 音声信号処理装置、音声信号処理方法及び音声信号処理プログラム | |
WO2023065317A1 (zh) | 会议终端及回声消除方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7493158 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |