JP5251473B2 - 音声処理装置、及び、音声処理方法 - Google Patents
音声処理装置、及び、音声処理方法 Download PDFInfo
- Publication number
- JP5251473B2 JP5251473B2 JP2008313255A JP2008313255A JP5251473B2 JP 5251473 B2 JP5251473 B2 JP 5251473B2 JP 2008313255 A JP2008313255 A JP 2008313255A JP 2008313255 A JP2008313255 A JP 2008313255A JP 5251473 B2 JP5251473 B2 JP 5251473B2
- Authority
- JP
- Japan
- Prior art keywords
- short
- spectrum
- time spectrum
- unit
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
1.全体構成
2.方向推定処理
<1.全体構成>
テレビジョン会議システム100は、近端装置1と遠端装置2との間で、それぞれの装置側の会議出席者の画像及び発音音声に係る情報を双方向に送受信するものである。近端装置1と遠端装置2とは、画像信号及び音声信号を送受信するため、インターネットなどの電気通信回線3を介して接続されている。
以上のような構成からなるテレビジョン会議システム100において、近端装置1に接続されたマイクロフォン12a、12bは、上述したように近端装置1側の会議出席者の発音音声を収音するとともに、スピーカ11から放音される音声も空間を介して収音してしまう。このようにして、マイクロフォン12a、12bにより収音される音声信号には、スピーカ11から放音された音声信号が重畳されてしまうので、次のような問題が生じてしまう。マイクロフォン12a、12bによる収音結果に基づいて、近端装置1側で発話している会議出席者にカメラ13の画角を向けるように制御する場合には、遠端装置2側の会議出席者の発話でスピーカ11にカメラ13の画角が向いてしまうという問題がある。
また、Spectral Subtraction法を用いると、マイクロフォン12a、12bにより検出される音声信号に対する目的話者の発音信号s(t)の割合を示す伝達関数G(ω)は、下記の(2)式で表される。なお、この例では、Spectral Subtractionにより定式式化したものを用いるが、Wiener FilteringやMaximum Likelihood法などを用いてもかまわない。
近端装置1では、上述した処理によりダブルトーク時においても演算量の増大を抑えつつ精度良く目的話者の画像をカメラ13により撮像して遠端装置2側に送信することができるが、次のような機能を音声信号処理部17が有することで、精度良く目的話者の音声認識をすることができる。
Claims (7)
- スピーカに出力する出力信号x(t)を短時間スペクトルに変換する第1の短時間スペクトル変換部と、
上記スピーカにより放音された音を検出しうる環境に設置された多チャンネルのマイクロフォンから検出された音声信号m(t)を短時間スペクトルに変換する第2の短時間スペクトル変換部と、
上記第1の短時間スペクトル変換部により変換された出力信号x(t)の短時間スペクトルと、上記第2の短時間スペクトル変換部により変換された音声信号m(t)の短時間スペクトルとを用いて、上記出力信号x(t)が上記スピーカにより放音されてエコー信号b(t)として上記音声信号m(t)に重畳されて上記マイクロフォンにより検出される伝搬経路の伝達関数h(t)の振幅周波数関数を算出する第1の伝達関数算出部と、
上記第1の伝達関数算出部により算出された伝達関数h(t)の振幅周波数関数と、上記第1の短時間スペクトル変換部により変換された出力信号x(t)の短時間スペクトルと、上記第2の短時間スペクトル変換部により変換された音声信号m(t)の短時間スペクトルとを用いて、上記音声信号m(t)に対する上記エコー信号b(t)を除いた音声信号s(t)の割合を示す伝達関数の振幅周波数関数を算出する第2の伝達関数算出部と、
上記マイクロフォンにより検出された音声信号m(t)から、当該マイクロフォンが設置された環境において上記音声信号s(t)が放音された放音位置の方向を示す方向スペクトルを算出する方向スペクトル算出部と、
上記方向スペクトル算出部により算出された方向スペクトルを、上記第2の伝達関数算出部により算出された振幅周波数関数で重み付けして、当該重み付けした方向スペクトルに応じて、上記放音位置の方向を推定する方向推定部とを備える音声処理装置。 - 上記第1の短時間スペクトル変換部は、上記出力信号x(t)を帯域分割して、帯域毎の短時間スペクトルに変換し、
上記第2の短時間スペクトル変換部は、上記音声信号m(t)を帯域分割して、帯域毎の短時間スペクトルに変換し、
上記第1の伝達関数算出部は、上記伝達関数h(t)の振幅周波数関数を帯域毎に算出し、
上記第2の伝達関数算出部は、上記音声信号m(t)に対する上記エコー信号b(t)を除いた音声信号s(t)の割合を示す伝達関数の振幅周波数関数を帯域毎に算出し、
上記第2の伝達関数算出部により算出された各帯域の振幅周波数関数を合成する合成処理部を更に備え、
上記方向推定部は、上記方向スペクトル算出部により算出された方向スペクトルを、上記第2の伝達関数算出部により算出され上記合成処理部により合成された振幅周波数関数で重み付けして、当該重み付けした方向スペクトルに応じて、上記放音位置の方向を推定する請求項1記載の音声処理装置。 - 上記方向推定部は、上記第2の伝達関数算出部により算出された振幅周波数関数が所定の値より大きいときのみ、上記方向スペクトル算出部により算出された方向スペクトルを、上記第2の伝達関数算出部により算出された振幅周波数関数で重み付けして、当該重み付けした方向スペクトルに応じて、上記放音位置を推定する請求項2記載の音声処理装置。
- 上記第2の短時間スペクトル変換部により変換された音声信号m(t)の短時間スペクトルを、上記第2の伝達関数算出部により算出された振幅周波数関数で重み付けして、当該重み付けした短時間スペクトルに応じて、上記方向推定部により推定された放音位置により放音される音声に対して音声認識を行う音声認識部を更に備える請求項1記載の音声処理装置。
- 上記音声認識部は、上記第2の短時間スペクトル変換部により変換された音声信号m(t)の短時間スペクトルを、上記第2の伝達関数算出部により算出された振幅周波数関数で重み付けして、当該重み付けした短時間スペクトルに応じて、上記方向推定部により推定された放音位置により放音される音声の基本周波数を得て、得られた基本周波数に基づいて音声認識を行う請求項4記載の音声処理装置。
- 上記音声認識部は、上記第2の短時間スペクトル変換部により変換された音声信号m(t)の短時間スペクトルを、上記第2の伝達関数算出部により算出された振幅周波数関数で重み付けして、当該重み付けした短時間スペクトルに応じて、上記方向推定部により推定された放音位置により放音される音声の音声検出を行い、当該検出結果に基づいて音声認識を行う請求項4記載の音声処理装置。
- スピーカに出力する出力信号x(t)を短時間スペクトルに変換する第1の短時間スペクトル変換ステップと、
上記スピーカにより放音された音を検出しうる環境に設置された多チャンネルのマイクロフォンから検出された音声信号m(t)を短時間スペクトルに変換する第2の短時間スペクトルステップと、
上記第1の短時間スペクトル変換ステップにより変換された上記出力信号x(t)の短時間スペクトルと、上記第2の短時間スペクトル変換ステップにより変換された音声信号m(t)の短時間スペクトルとを用いて、上記出力信号x(t)が上記スピーカにより放音されてエコー信号b(t)として上記音声信号m(t)に重畳されて上記マイクロフォンにより検出される伝搬経路の伝達関数h(t)の振幅周波数関数を算出する第1の伝達関数算出ステップと、
上記第1の伝達関数算出ステップにより算出された伝達関数h(t)の振幅周波数関数と、上記第1の短時間スペクトル変換ステップにより変換された上記出力信号x(t)の短時間スペクトルと、上記第2の短時間スペクトル変換ステップにより変換された音声信号m(t)の短時間スペクトルとを用いて、上記音声信号m(t)に対する上記エコー信号b(t)を除いた音声信号s(t)の割合を示す振幅周波数関数を算出する第2の振幅周波数関数算出ステップと、
上記マイクロフォンにより検出された音声信号m(t)から、当該マイクロフォンが設置された環境において上記音声信号s(t)が放音された放音位置の方向を示す方向スペクトルを算出する方向スペクトル算出ステップと、
上記方向スペクトル算出ステップにより推定された方向スペクトルを、上記第2の振幅周波数関数算出ステップにより算出された振幅周波数関数で重み付けして、当該重み付けした方向スペクトルに応じて、上記放音位置を推定する方向推定ステップとを有する音声処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008313255A JP5251473B2 (ja) | 2008-12-09 | 2008-12-09 | 音声処理装置、及び、音声処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008313255A JP5251473B2 (ja) | 2008-12-09 | 2008-12-09 | 音声処理装置、及び、音声処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010141402A JP2010141402A (ja) | 2010-06-24 |
JP5251473B2 true JP5251473B2 (ja) | 2013-07-31 |
Family
ID=42351169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008313255A Expired - Fee Related JP5251473B2 (ja) | 2008-12-09 | 2008-12-09 | 音声処理装置、及び、音声処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5251473B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107251134A (zh) * | 2014-12-28 | 2017-10-13 | 静公司 | 在噪声受控体积内控制噪声的装置、系统和方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012149906A (ja) * | 2011-01-17 | 2012-08-09 | Mitsubishi Electric Corp | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3211398B2 (ja) * | 1992-09-04 | 2001-09-25 | 松下電器産業株式会社 | テレビ会議用発言音声検出装置 |
JP3341815B2 (ja) * | 1997-06-23 | 2002-11-05 | 日本電信電話株式会社 | 受話状態検出方法およびその装置 |
JPH11341334A (ja) * | 1998-05-27 | 1999-12-10 | Canon Inc | カメラ制御方法及び装置並びに記憶媒体 |
JP5028833B2 (ja) * | 2006-03-17 | 2012-09-19 | ヤマハ株式会社 | 放収音装置 |
JP4929685B2 (ja) * | 2005-11-15 | 2012-05-09 | ヤマハ株式会社 | 遠隔会議装置 |
-
2008
- 2008-12-09 JP JP2008313255A patent/JP5251473B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107251134A (zh) * | 2014-12-28 | 2017-10-13 | 静公司 | 在噪声受控体积内控制噪声的装置、系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2010141402A (ja) | 2010-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI398855B (zh) | 多重麥克風聲音活動偵測器 | |
EP3189521B1 (en) | Method and apparatus for enhancing sound sources | |
JP5862349B2 (ja) | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 | |
US8644496B2 (en) | Echo suppressor, echo suppressing method, and computer readable storage medium | |
JP6279181B2 (ja) | 音響信号強調装置 | |
US8392184B2 (en) | Filtering of beamformed speech signals | |
US9418678B2 (en) | Sound processing device, sound processing method, and program | |
CN103718241B (zh) | 噪音抑制装置 | |
JP4660578B2 (ja) | 信号補正装置 | |
US20120057722A1 (en) | Noise removing apparatus and noise removing method | |
EP2751806B1 (en) | A method and a system for noise suppressing an audio signal | |
JP4957810B2 (ja) | 音処理装置、音処理方法及び音処理プログラム | |
JP2008236077A (ja) | 目的音抽出装置,目的音抽出プログラム | |
US9082411B2 (en) | Method to reduce artifacts in algorithms with fast-varying gain | |
TW201142829A (en) | Adaptive noise reduction using level cues | |
US9343073B1 (en) | Robust noise suppression system in adverse echo conditions | |
US20080019537A1 (en) | Multi-channel periodic signal enhancement system | |
JPWO2018163328A1 (ja) | 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置 | |
KR101581885B1 (ko) | 복소 스펙트럼 잡음 제거 장치 및 방법 | |
JP5887535B2 (ja) | エコー消去装置、エコー消去方法、及び、通話装置 | |
WO2020110228A1 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
CN112130801B (zh) | 音响装置及音响处理方法 | |
JP5251473B2 (ja) | 音声処理装置、及び、音声処理方法 | |
JP5228903B2 (ja) | 信号処理装置および方法 | |
JP4478045B2 (ja) | エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130401 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |