JP5838861B2 - 音声信号処理装置、方法及びプログラム - Google Patents
音声信号処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5838861B2 JP5838861B2 JP2012044138A JP2012044138A JP5838861B2 JP 5838861 B2 JP5838861 B2 JP 5838861B2 JP 2012044138 A JP2012044138 A JP 2012044138A JP 2012044138 A JP2012044138 A JP 2012044138A JP 5838861 B2 JP5838861 B2 JP 5838861B2
- Authority
- JP
- Japan
- Prior art keywords
- coherence
- target speech
- unit
- target
- determination threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
第1の指向性形成部11では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向に指向性が強い信号B1(f,K)を形成し、第2の指向性形成部12では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向(上述の特定方向とは異なる)に指向性が強い信号B2(f,K)を形成する。特定方向に指向性が強い信号B1(f,K)、B2(f,K)の形成方法としては既存の方法を適用でき、例えば、(3)式を適用して右方向に指向性が強いB1(f,K)や(4)式を適用して左方向に指向性が強いB2(f,K)が形成できる。(3)式及び(4)式では、フレームインデックスKは演算に関与しないので省略している。
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm_1及びm_2は図14(B)のような指向特性を持つようになる。
以下、本発明による音声信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態は、コヒーレンスCOHに基づき、到来方位に応じて適切な目的音声区間の判定閾値Θを設定できるようにしたものである。
図1は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図であり、上述した図13との同一、対応部分には同一符号を付して示している。ここで、一対のマイクm_1及びm_2を除いた部分は、CPUが実行するソフトウェア(音声信号処理プログラム)として実現することも可能であるが、機能的には、図1で表すことができる。
…(8)
(8)式は、平均値として、現フレーム区間(動作開始時点から数えてK番目の分析フレーム)の入力音声に対するコヒーレンスCOH(K)と1つ前のフレーム区間で得られた平均値AVE_COH(K−1)との重み付け加算を計算しており、δの値の大小で、コヒーレンスCOH(K)の瞬時値の平均値への寄与度を調整することができる。仮に、δを0に近い小さい値に設定した場合には、瞬時値の平均値への寄与度が小さくなるので、瞬時値による変動を抑制できる。また、δが1に近い値であれば、瞬時値の寄与度が高まるので、平均値の効果を弱めることができる。このような観点に従い、δを適宜選定すれば良い。
次に、第1の実施形態の音声信号処理装置1の動作を、図面を参照しながら、全体動作、目的音声区間判定閾値制御部20における詳細動作の順に説明する。
第1の実施形態によれば、非目的音声(主として妨害音声)の到来方位に応じて、目的音声区間判定閾値Θを制御するようにしたので、目的音声区間及び非目的音声区間の判定精度を向上させ、所望外の区間でボイススイッチ処理を誤って稼動して音質を低下させるようなことを防止することができる。
次に、本発明による音声信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
第2の実施形態に係る音声信号処理装置1Aも、その全体構成は、第1の実施形態の説明で用いた図1で表すことができる。但し、第2の実施形態の場合、目的音声区間判定閾値制御部20Aの内部構成が、第1の実施形態の目的音声区間判定閾値制御部20と異なっている。
Θ(K)=AVE_COH(K)+{Y×AVE_COH(K)+Z}
…(9−2)
(9−1)式若しくは(9−2)式の演算を行うことにより、到来方位ごとのコヒーレンス平均値の挙動に基づいた関数演算が実行され、適切な閾値Θ(K)を設定することができるようになる。
次に、第2の実施形態の音声信号処理装置1Aの動作を説明する。第2の実施形態の音声信号処理装置1Aの全体動作は第1の実施形態と同様であるので、以下では、目的音声区間判定閾値制御部20Aにおける詳細動作のみ説明する。図7は、目的音声区間判定閾値制御部20Aの動作を示すフローチャートであり、第1の実施形態に係る図4との同一、対応ステップには同一符号を付して示している。
第2の実施形態によっても、非目的音声(主として妨害音声)の方位に応じて、目的音声区間判定閾値Θを制御するようにしたので、目的音声区間及び非目的音声区間の判定精度を向上させ、所望外の区間でボイススイッチ処理を誤って稼動して音質を低下させるようなことを防止することができる。
上記各実施形態では、非目的音声区間のコヒーレンス平均値に基づいて、目的音声区間検出部が利用する閾値を定めるものを示したが、閾値の決定に用いるパラメータは、コヒーレンス平均値に限定されるものではない。パラメータは、ある程度の直前期間のコヒーレンスの傾向を反映できているものであれば良く、例えば、公知のピークホールド手法を適用して得たコヒーレンスのピークに基づいて閾値を設定するようにしても良い。また、コヒーレンスの分散、標準偏差などの統計量に基づいて閾値を設定するようにしても良い。
D(f,K)=X1(f,K)−B3(f,K) …(11)
図10は、コヒーレンスフィルターと第1の実施形態とを併用した変形実施形態の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図11は、ウィーナーフィルターと第1の実施形態とを併用した変形実施形態の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
以上では、周波数減算処理、コヒーレンスフィルター処理若しくはウィーナーフィルター処理を施した後に、ボイススイッチ処理を施すものを示したが、この処理順序は逆であっても良い。
Claims (9)
- 入力音声信号から雑音成分を抑制する音声信号処理装置において、
入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
前記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定する目的音声区間検出部と、
前記コヒーレンスに基づいて前記第1の判定閾値を制御する目的音声区間判定閾値制御部と、
前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定するゲイン制御部と、
前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算するボイススイッチゲイン乗算部と
を有することを特徴とする音声信号処理装置。 - 前記目的音声区間判定閾値制御部は、
前記コヒーレンスと固定値でなる第2の判定閾値とを比較して非目的音声区間を検出し、非目的音声区間でのみコヒーレンス平均値を更新し、目的音声区間でコヒーレンス平均値を維持する非目的音声コヒーレンス平均計算部と、
非目的音声コヒーレンス平均値と前記第1の判定閾値との対応表が格納されている記憶部と、
前記記憶部から、前記非目的音声コヒーレンス平均計算部が得た現在の非目的音声コヒーレンス平均値に対応した前記第1の判定閾値を取り出す目的音声区間判定閾値照合部と
を有することを特徴とする請求項1に記載の音声信号処理装置。 - 前記目的音声区間判定閾値制御部は、
前記コヒーレンスと固定値でなる第2の判定閾値とを比較して非目的音声区間を検出し、非目的音声区間でのみコヒーレンス平均値を更新し、目的音声区間でコヒーレンス平均値を維持する非目的音声コヒーレンス平均計算部と、
前記非目的音声コヒーレンス平均計算部が得た現在の非目的音声コヒーレンス平均値に対し、所定の演算を施すことにより前記第1の判定閾値を得る目的音声区間判定閾値計算部と
を有することを特徴とする請求項1に記載の音声信号処理装置。 - 現在の非目的音声コヒーレンス平均値をAVE_COH(K)、第1の判定閾値をΘ(K)、正の3つの定数をW、X、Y、任意の定数をZとし、
前記目的音声区間判定閾値計算部は、AVE_COH(K)がW以下の場合に(A)式に従い、AVE_COH(K)がWより大きい場合に(B)式に従い、Θ(K)を求めることを特徴とする請求項3に記載の音声信号処理装置。
Θ(K)=AVE_COH(K)+X …(A)
Θ(K)=AVE_COH(K)+{Y×AVE_COH(K)+Z} …(B) - 自己への入力信号から非目的音声信号成分を減算することで雑音抑制を行う周波数減算部を、前記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜4のいずれかに記載の音声信号処理装置。
- 複数の係数の平均処理によりコヒーレンスを求める際の要素である周波数ごとの前記各係数を、周波数ごとに、自己への入力信号に乗算することで到来方向に偏りを有する信号成分を抑制するコヒーレンスフィルター演算部を、前記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜5のいずれかに記載の音声信号処理装置。
- 雑音区間の信号から周波数ごとに雑音特性を推定して得た係数を、自己への入力信号に乗算することで雑音を除去するウィーナーフィルター演算部を、前記ボイススイッチゲイン乗算部の入力段若しくは出力段側に有することを特徴とする請求項1〜6のいずれかに記載の音声信号処理装置。
- 入力音声信号から雑音成分を抑制する音声信号処理方法において、
第1の指向性形成部は、入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、
第2の指向性形成部は、入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、
コヒーレンス計算部は、前記第1及び第2の指向性信号を用いてコヒーレンスを計算し、
目的音声区間検出部は、前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定し、
目的音声区間判定閾値制御部は、前記コヒーレンスに基づいて前記第1の判定閾値を制御し、
ゲイン制御部は、前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定し、
ボイススイッチゲイン乗算部は、前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算する
ことを特徴とする音声信号処理方法。 - コンピュータを、
入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
前記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
前記コヒーレンスと第1の判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定する目的音声区間検出部と、
前記コヒーレンスに基づいて前記第1の判定閾値を制御する目的音声区間判定閾値制御部と、
前記目的音声区間検出部の判定結果に応じて、ボイススイッチゲインを設定するゲイン制御部と、
前記ゲイン制御部で得られたボイススイッチゲインを入力音声信号に乗算するボイススイッチゲイン乗算部と
して機能させることを特徴とする音声信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012044138A JP5838861B2 (ja) | 2012-02-29 | 2012-02-29 | 音声信号処理装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012044138A JP5838861B2 (ja) | 2012-02-29 | 2012-02-29 | 音声信号処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013182044A JP2013182044A (ja) | 2013-09-12 |
JP5838861B2 true JP5838861B2 (ja) | 2016-01-06 |
Family
ID=49272743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012044138A Expired - Fee Related JP5838861B2 (ja) | 2012-02-29 | 2012-02-29 | 音声信号処理装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5838861B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5970985B2 (ja) * | 2012-07-05 | 2016-08-17 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
JP6314475B2 (ja) * | 2013-12-25 | 2018-04-25 | 沖電気工業株式会社 | 音声信号処理装置及びプログラム |
JP6295650B2 (ja) * | 2013-12-25 | 2018-03-20 | 沖電気工業株式会社 | 音声信号処理装置及びプログラム |
US10043532B2 (en) | 2014-03-17 | 2018-08-07 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
JP6252274B2 (ja) * | 2014-03-19 | 2017-12-27 | 沖電気工業株式会社 | 背景雑音区間推定装置及びプログラム |
JP6213324B2 (ja) * | 2014-03-19 | 2017-10-18 | 沖電気工業株式会社 | 音声信号処理装置及びプログラム |
JP2016163135A (ja) * | 2015-02-27 | 2016-09-05 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
JP6531776B2 (ja) | 2017-04-25 | 2019-06-19 | トヨタ自動車株式会社 | 音声対話システムおよび音声対話方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5197458B2 (ja) * | 2009-03-25 | 2013-05-15 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
-
2012
- 2012-02-29 JP JP2012044138A patent/JP5838861B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013182044A (ja) | 2013-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6028502B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP5838861B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP5817366B2 (ja) | 音声信号処理装置、方法及びプログラム | |
KR101116013B1 (ko) | 잡음 억압 장치, 잡음 억압 방법 및 휴대 전화기 | |
JP5672770B2 (ja) | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム | |
US9219456B1 (en) | Correcting clock drift via embedded sin waves | |
JP5927887B2 (ja) | 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム | |
JP6190373B2 (ja) | オーディオ信号ノイズ減衰 | |
JP6314475B2 (ja) | 音声信号処理装置及びプログラム | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP6711205B2 (ja) | 音響信号処理装置、プログラム及び方法 | |
JP6221258B2 (ja) | 信号処理装置、方法及びプログラム | |
JP5772562B2 (ja) | 目的音抽出装置及び目的音抽出プログラム | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP5970985B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
JP5971047B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP6295650B2 (ja) | 音声信号処理装置及びプログラム | |
JP6102144B2 (ja) | 音響信号処理装置、方法及びプログラム | |
JP2019036917A (ja) | パラメータ制御装置、方法及びプログラム | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
JP6263890B2 (ja) | 音声信号処理装置及びプログラム | |
JP6903947B2 (ja) | 非目的音抑圧装置、方法及びプログラム | |
JP6221463B2 (ja) | 音声信号処理装置及びプログラム | |
JP2015025914A (ja) | 音声信号処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151026 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5838861 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |