JP2014056112A - 音声信号処理装置、方法及びプログラム - Google Patents
音声信号処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2014056112A JP2014056112A JP2012200898A JP2012200898A JP2014056112A JP 2014056112 A JP2014056112 A JP 2014056112A JP 2012200898 A JP2012200898 A JP 2012200898A JP 2012200898 A JP2012200898 A JP 2012200898A JP 2014056112 A JP2014056112 A JP 2014056112A
- Authority
- JP
- Japan
- Prior art keywords
- hangover
- coherence
- target
- target speech
- directivity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】入力音声信号に遅延減算処理を施して、第1、第2の所定方位に死角を有する第1、第2の指向性信号を形成し、これらの指向性信号を用いてコヒーレンスを得る。そして、コヒーレンスと第1の閾値とを比較して、入力音声信号が目的音声区間か否かを判定する。コヒーレンスと、第1の閾値より大きい第2の閾値とを比較して、上述の判定結果が目的音声区間からそれ以外へ変化してもハングオーバー長だけ、変化前の判定結果を継続させる。非目的音声区間におけるコヒーレンスの変化傾向の切替り頻度を表す特徴量を得て、この特徴量に応じて上述したハングオーバー長を制御する。
【選択図】 図1
Description
…(2)
第1の指向性形成部11では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向に指向性が強い信号B1(f,K)を形成し、第2の指向性形成部12では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向(上述の特定方向とは異なる)に指向性が強い信号B2(f,K)を形成する。特定方向に指向性が強い信号B1(f,K)、B2(f,K)の形成方法としては既存の方法を適用でき、例えば、(3)式を適用して右方向に指向性が強いB1(f,K)や(4)式を適用して左方向に指向性が強いB2(f,K)が形成できる。(3)式及び(4)式では、フレームインデックスKは演算に関与しないので省略している。
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm_1及びm_2は図10(B)のような指向特性を持つようになる。
以下、本発明による音声信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。
図1は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図であり、上述した図13との同一、対応部分には同一符号を付して示している。ここで、一対のマイクm_1及びm_2を除いた部分は、CPUが実行するソフトウェア(音声信号処理プログラム)として実現することも可能であるが、機能的には、図1で表すことができる。
次に、第1の実施形態の音声信号処理装置1の動作を、図面を参照しながら、全体動作、ハングオーバー長制御部16における詳細動作の順に説明する。
以上のように、第1の実施形態によれば、妨害音声の到来方位に応じて、ハングオーバー長を適切な値に設定するので、過不足のないハングオーバー効果を奏することができる。
次に、本発明による音声信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
図5は、第2の実施形態に係る音声信号処理装置の構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。
次に、第2の実施形態の音声信号処理装置1Aにおけるハングオーバーカウンタ初期化閾値照合部34の詳細動作を説明する。図8は、ハングオーバーカウンタ初期化閾値制御部17の動作を示すフローチャートである。
第2の実施形態によれば、第1の実施形態と同様な効果に加え、以下のような効果を奏することができる。
上記第1の実施形態では、非目的音声区間におけるコヒーレンスの瞬時値の微分係数のゼロクロスに基づいて、ハングオーバー長を設定したものを示したが、2次微分係数など、コヒーレンスの変化の頻度を表す他の特徴量に基づいてハングオーバー長を設定するようにしても良い。
Claims (4)
- 入力音声信号から目的音声の区間と非目的音声の区間とを切り分ける音声信号処理装置において、
入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
入力音声信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
上記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
上記コヒーレンスと目的音声区間判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定すると共に、上記コヒーレンスと、上記目的音声区間判定閾値より大きいハングオーバー付与閾値とを比較して、上記目的音声区間判定閾値を用いた比較による判定結果が目的音声区間から非目的音声区間へ変化しても、ハングオーバー長だけ、目的音声区間という判定結果を継続させる目的音声区間検出・ハングオーバー付与部と、
非目的音声区間におけるコヒーレンスの変化傾向の切替り頻度を表す特徴量を得て、得られた特徴量に応じて、上記目的音声区間検出・ハングオーバー付与部が適用する上記ハングオーバー長を制御するハングオーバー長制御部と
を備えることを特徴とする音声信号処理装置。 - 上記ハングオーバー長制御部は、入力音声信号の所定期間毎のフレーム単位に処理するものであり、非目的音声区間で、現フレームと直前フレームのコヒーレンス値の差を取ることでコヒーレンスの微分係数を算出し、この微分係数と直前フレームにおける微分係数との積の正負判定し、負の場合には、微分係数の正負の変動回数を計測するカウンター変数を増加させ、積が正の場合には、上記カウンター変数を維持させる、という方法で得たカウンター変数を、上記特徴量として適用することを特徴とする請求項1に記載の音声信号処理装置。
- 入力音声信号から目的音声の区間と非目的音声の区間とを切り分ける音声信号処理方法において、
第1の指向性形成部は、入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、
第2の指向性形成部は、入力音声信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、
コヒーレンス計算部は、上記第1及び第2の指向性信号を用いてコヒーレンスを得、
目的音声区間検出・ハングオーバー付与部は、上記コヒーレンスと目的音声区間判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定すると共に、上記コヒーレンスと、上記目的音声区間判定閾値より大きいハングオーバー付与閾値とを比較して、上記目的音声区間判定閾値を用いた比較による判定結果が目的音声区間から非目的音声区間へ変化しても、ハングオーバー長だけ、目的音声区間という判定結果を継続させ、
ハングオーバー長制御部は、非目的音声区間におけるコヒーレンスの変化傾向の切替り頻度を表す特徴量を得て、得られた特徴量に応じて、上記目的音声区間検出・ハングオーバー付与部が適用する上記ハングオーバー長を制御する
ことを特徴とする音声信号処理方法。 - コンピュータを、
入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
入力音声信号に遅延減算処理を施すことで、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
上記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
上記コヒーレンスと目的音声区間判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定すると共に、上記コヒーレンスと、上記目的音声区間判定閾値より大きいハングオーバー付与閾値とを比較して、上記目的音声区間判定閾値を用いた比較による判定結果が目的音声区間から非目的音声区間へ変化しても、ハングオーバー長だけ、目的音声区間という判定結果を継続させる目的音声区間検出・ハングオーバー付与部と、
非目的音声区間におけるコヒーレンスの変化傾向の切替り頻度を表す特徴量を得て、得られた特徴量に応じて、上記目的音声区間検出・ハングオーバー付与部が適用する上記ハングオーバー長を制御するハングオーバー長制御部と
して機能させることを特徴とする音声信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012200898A JP5971047B2 (ja) | 2012-09-12 | 2012-09-12 | 音声信号処理装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012200898A JP5971047B2 (ja) | 2012-09-12 | 2012-09-12 | 音声信号処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014056112A true JP2014056112A (ja) | 2014-03-27 |
JP5971047B2 JP5971047B2 (ja) | 2016-08-17 |
Family
ID=50613462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012200898A Active JP5971047B2 (ja) | 2012-09-12 | 2012-09-12 | 音声信号処理装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5971047B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328165A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种机器人自身音源消除系统 |
CN109806498A (zh) * | 2019-02-14 | 2019-05-28 | 深圳信息职业技术学院 | 一种电子耳蜗信号处理的方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013525848A (ja) * | 2010-04-22 | 2013-06-20 | クゥアルコム・インコーポレイテッド | ボイスアクティビティ検出 |
JP2013531419A (ja) * | 2010-05-20 | 2013-08-01 | クゥアルコム・インコーポレイテッド | ヘッドマウントマイクロフォンペアを使用する音声信号の処理のためのシステム、方法、装置、及びコンピュータ可読媒体 |
JP2014016377A (ja) * | 2012-07-05 | 2014-01-30 | Oki Electric Ind Co Ltd | 音声信号処理装置、方法及びプログラム |
-
2012
- 2012-09-12 JP JP2012200898A patent/JP5971047B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013525848A (ja) * | 2010-04-22 | 2013-06-20 | クゥアルコム・インコーポレイテッド | ボイスアクティビティ検出 |
JP2013531419A (ja) * | 2010-05-20 | 2013-08-01 | クゥアルコム・インコーポレイテッド | ヘッドマウントマイクロフォンペアを使用する音声信号の処理のためのシステム、方法、装置、及びコンピュータ可読媒体 |
JP2014016377A (ja) * | 2012-07-05 | 2014-01-30 | Oki Electric Ind Co Ltd | 音声信号処理装置、方法及びプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328165A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种机器人自身音源消除系统 |
CN109806498A (zh) * | 2019-02-14 | 2019-05-28 | 深圳信息职业技术学院 | 一种电子耳蜗信号处理的方法及装置 |
CN109806498B (zh) * | 2019-02-14 | 2022-11-04 | 深圳信息职业技术学院 | 一种电子耳蜗信号处理的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5971047B2 (ja) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5817366B2 (ja) | 音声信号処理装置、方法及びプログラム | |
US8370140B2 (en) | Method of filtering non-steady lateral noise for a multi-microphone audio device, in particular a “hands-free” telephone device for a motor vehicle | |
JP6028502B2 (ja) | 音声信号処理装置、方法及びプログラム | |
US9269367B2 (en) | Processing audio signals during a communication event | |
JP5838861B2 (ja) | 音声信号処理装置、方法及びプログラム | |
US8195246B2 (en) | Optimized method of filtering non-steady noise picked up by a multi-microphone audio device, in particular a “hands-free” telephone device for a motor vehicle | |
JP2012150237A (ja) | 音信号処理装置、および音信号処理方法、並びにプログラム | |
US9773510B1 (en) | Correcting clock drift via embedded sine waves | |
US11785406B2 (en) | Inter-channel level difference based acoustic tap detection | |
JP5971047B2 (ja) | 音声信号処理装置、方法及びプログラム | |
US11528571B1 (en) | Microphone occlusion detection | |
JP5970985B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
JP6221258B2 (ja) | 信号処理装置、方法及びプログラム | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
US10887709B1 (en) | Aligned beam merger | |
JP5772562B2 (ja) | 目的音抽出装置及び目的音抽出プログラム | |
JP6102144B2 (ja) | 音響信号処理装置、方法及びプログラム | |
JP6221463B2 (ja) | 音声信号処理装置及びプログラム | |
JP6213324B2 (ja) | 音声信号処理装置及びプログラム | |
JP2016039398A (ja) | 残響判定装置及びプログラム | |
JP2016121957A (ja) | 目的音区間判定装置、目的音区間判定方法及び目的音区間判定プログラム | |
JP6252274B2 (ja) | 背景雑音区間推定装置及びプログラム | |
JP2015025913A (ja) | 音声信号処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160627 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5971047 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |