JP2014016377A - 音声信号処理装置、方法及びプログラム - Google Patents
音声信号処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2014016377A JP2014016377A JP2012151563A JP2012151563A JP2014016377A JP 2014016377 A JP2014016377 A JP 2014016377A JP 2012151563 A JP2012151563 A JP 2012151563A JP 2012151563 A JP2012151563 A JP 2012151563A JP 2014016377 A JP2014016377 A JP 2014016377A
- Authority
- JP
- Japan
- Prior art keywords
- hangover
- target speech
- coherence
- target
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】 入力音声信号に遅延減算処理を施して、第1、第2の所定方位に死角を有する第1、第2の指向性信号を形成し、これら2つの指向性信号を用いてコヒーレンスを得る。そして、コヒーレンスと目的音声区間判定閾値とを比較して、入力音声信号が、目的音声区間か非目的音声区間かを判定すると共に、コヒーレンスと、目的音声区間判定閾値より大きいハングオーバー付与閾値とを比較して、上述の判定結果が目的音声区間から非目的音声区間へ変化しても、所定のハングオーバー長だけ、目的音声区間という判定結果を継続させる。
【選択図】 図1
Description
第1の指向性形成部11では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向に指向性が強い信号B1(f,K)を形成し、第2の指向性形成部12では、周波数領域信号X1(f,K)及びX2(f,K)から特定方向(上述の特定方向とは異なる)に指向性が強い信号B2(f,K)を形成する。特定方向に指向性が強い信号B1(f,K)、B2(f,K)の形成方法としては既存の方法を適用でき、例えば、(3)式を適用して右方向に指向性が強いB1(f,K)や(4)式を適用して左方向に指向性が強いB2(f,K)が形成できる。(3)式及び(4)式では、フレームインデックスKは演算に関与しないので省略している。
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(t)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm_1及びm_2は図11(B)のような指向特性を持つようになる。
以下、本発明による音声信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態は、コヒーレンスCOHに基づいて目的音声区間を検出するにつき、目的音声の振幅が小さくても目的音声区間を正しく検出できるようにハングオーバー機能を導入したものである。
図1は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図であり、上述した図10との同一、対応部分には同一符号を付して示している。ここで、一対のマイクm_1及びm_2を除いた部分は、CPUが実行するソフトウェア(音声信号処理プログラム)として実現することも可能であるが、機能的には、図1で表すことができる。
次に、第1の実施形態の音声信号処理装置1の動作を、図面を参照しながら、全体動作、目的音声区間検出・ハングオーバー付与部15における詳細動作の順に説明する。
第1の実施形態によれば、コヒーレンスCOHに基づいて目的音声区間を検出するにつき、コヒーレンスCOHが大きい状態から小さい状態に移行したときには、コヒーレンスCOHが目的音声区間判定閾値Φより小さくても、所定期間だけ目的音声と判定させるようにしたので、目的音声の振幅が小さくてコヒーレンスCOHが小さくなっても目的音声区間を正しく検出することができる。
次に、本発明による音声信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
図3は、第2の実施形態に係る音声信号処理装置の構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。
次に、第2の実施形態の音声信号処理装置1Aの動作を、図面を参照しながら、全体動作、ハングオーバーカウンタ初期化閾値照合部24における詳細動作の順に説明する。
第2の実施形態によれば、第1の実施形態と同様な効果に加え、以下のような効果を奏することができる。
次に、本発明による音声信号処理装置、方法及びプログラムの第3の実施形態を、図面を参照しながら説明する。
図7は、第3の実施形態に係る音声信号処理装置の構成を示すブロック図であり、上述した第2の実施形態に係る図3との同一、対応部分には同一符号を付して示している。
次に、第3の実施形態の音声信号処理装置1Bの動作を、図面を参照しながら、全体動作、ハングオーバーカウンタ初期値制御部17における詳細動作の順に説明する。
第3の実施形態によれば、第2の実施形態と同様な効果に加え、以下のような効果を奏することができる。
上記各実施形態では、目的音声区間判定閾値Φが1つのものを示したが、目的音声区間判定閾値として複数の閾値を設け、ハングオーバー操作を変えるようにしても良い。例えば、目的音声区間判定閾値としてΦ1及びΦ2(Φ1>Φ2)を設け、コヒーレンスCOH(K)が目的音声区間判定閾値Φ1以上のときは判定結果変数VAD_RES(K)に1.0を設定し、コヒーレンスCOH(K)が目的音声区間判定閾値Φ2以上Φ1未満のときは判定結果変数VAD_RES(K)に1.0を設定すると共に、ハングオーバーカウンタcounterを1デクリメントし(counter=counter−1)、コヒーレンスCOH(K)が目的音声区間判定閾値Φ2未満であってハングオーバーカウンタcounterが正のときは判定結果変数VAD_RES(K)に1.0を設定すると共に、ハングオーバーカウンタcounterを2デクリメントし(counter=counter−2)、コヒーレンスCOH(K)が目的音声区間判定閾値Φ2未満であってハングオーバーカウンタcounterが0若しくは負のときは判定結果変数VAD_RES(K)に0.0を設定するようにしても良い。なお、ハングオーバーカウンタcounterをソフトウェアで実現している場合には、デクリメントの単位量として、整数ではない小数を適用するようにしても良い。
Claims (7)
- 入力音声信号から目的音声の区間と非目的音声の区間とを切り分ける音声信号処理装置において、
入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
前記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
前記コヒーレンスと目的音声区間判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定すると共に、前記コヒーレンスと、前記目的音声区間判定閾値より大きいハングオーバー付与閾値とを比較して、前記目的音声区間判定閾値を用いた比較による判定結果が目的音声区間から非目的音声区間へ変化しても、所定のハングオーバー長だけ、目的音声区間という判定結果を継続させる目的音声区間検出・ハングオーバー付与部と
を有することを特徴とする音声信号処理装置。 - 目的音声区間におけるコヒーレンスのばらつきを表す統計量を得て、得られた統計量に応じて、前記目的音声区間検出・ハングオーバー付与部が適用する前記ハングオーバー付与閾値を制御するハングオーバー付与閾値制御部をさらに備えることを特徴とする請求項1に記載の音声信号処理装置。
- 前記ハングオーバー付与閾値制御部は、
目的音声区間と判定された複数のコヒーレンスからコヒーレンスの分散を計算するコヒーレンス分散計算部と、
コヒーレンス分散とハングオーバー付与閾値との対応関係を記憶している第1の記憶部と、
算出されたコヒーレンス分散に応じたハングオーバー付与閾値を前記第1の記憶部から取得するハングオーバー付与閾値照合部と
を有することを特徴とする請求項2に記載の音声信号処理装置。 - 前記目的音声区間検出・ハングオーバー付与部が適用する前記ハングオーバー付与閾値に応じて、前記目的音声区間検出・ハングオーバー付与部が付与する前記ハングオーバー長を制御するハングオーバー長制御部をさらに備えることを特徴とする請求項2又は3に記載の音声信号処理装置。
- 前記ハングオーバー長制御部は、
ハングオーバー付与閾値とハングオーバー長の対応関係を記憶している第2の記憶部と、
前記目的音声区間検出・ハングオーバー付与部が適用する前記ハングオーバー付与閾値に応じたハングオーバー長を前記第2の記憶部から取得するハングオーバー長照合部と
を有することを特徴とする請求項4に記載の音声信号処理装置。 - 入力音声信号から目的音声の区間と非目的音声の区間とを切り分ける音声信号処理方法において、
第1の指向性形成部は、入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、
第2の指向性形成部は、入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、
コヒーレンス計算部は、前記第1及び第2の指向性信号を用いてコヒーレンスを計算し、
目的音声区間検出・ハングオーバー付与部は、計算された前記コヒーレンスと目的音声区間判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定すると共に、前記コヒーレンスと、前記目的音声区間判定閾値より大きいハングオーバー付与閾値とを比較して、前記目的音声区間判定閾値を用いた比較による判定結果が目的音声区間から非目的音声区間へ変化しても、所定のハングオーバー長だけ、目的音声区間という判定結果を継続させる
ことを特徴とする音声信号処理方法。 - コンピュータを、
入力音声信号に遅延減算処理を施すことで、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
入力音声信号に遅延減算処理を施すことで、前記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
前記第1及び第2の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部と、
前記コヒーレンスと目的音声区間判定閾値とを比較して、入力音声信号が、目的方位から到来している目的音声の区間か、それ以外の非目的音声区間かを判定すると共に、前記コヒーレンスと、前記目的音声区間判定閾値より大きいハングオーバー付与閾値とを比較して、前記目的音声区間判定閾値を用いた比較による判定結果が目的音声区間から非目的音声区間へ変化しても、所定のハングオーバー長だけ、目的音声区間という判定結果を継続させる目的音声区間検出・ハングオーバー付与部と
して機能させることを特徴とする音声信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012151563A JP5970985B2 (ja) | 2012-07-05 | 2012-07-05 | 音声信号処理装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012151563A JP5970985B2 (ja) | 2012-07-05 | 2012-07-05 | 音声信号処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014016377A true JP2014016377A (ja) | 2014-01-30 |
JP5970985B2 JP5970985B2 (ja) | 2016-08-17 |
Family
ID=50111150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012151563A Active JP5970985B2 (ja) | 2012-07-05 | 2012-07-05 | 音声信号処理装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5970985B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014056112A (ja) * | 2012-09-12 | 2014-03-27 | Oki Electric Ind Co Ltd | 音声信号処理装置、方法及びプログラム |
JP2019511864A (ja) * | 2016-03-09 | 2019-04-25 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | チャネル間時間差パラメータの安定性を増加させるための方法および装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013525848A (ja) * | 2010-04-22 | 2013-06-20 | クゥアルコム・インコーポレイテッド | ボイスアクティビティ検出 |
JP2013531419A (ja) * | 2010-05-20 | 2013-08-01 | クゥアルコム・インコーポレイテッド | ヘッドマウントマイクロフォンペアを使用する音声信号の処理のためのシステム、方法、装置、及びコンピュータ可読媒体 |
JP2013182044A (ja) * | 2012-02-29 | 2013-09-12 | Oki Electric Ind Co Ltd | 音声信号処理装置、方法及びプログラム |
-
2012
- 2012-07-05 JP JP2012151563A patent/JP5970985B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013525848A (ja) * | 2010-04-22 | 2013-06-20 | クゥアルコム・インコーポレイテッド | ボイスアクティビティ検出 |
JP2013531419A (ja) * | 2010-05-20 | 2013-08-01 | クゥアルコム・インコーポレイテッド | ヘッドマウントマイクロフォンペアを使用する音声信号の処理のためのシステム、方法、装置、及びコンピュータ可読媒体 |
JP2013182044A (ja) * | 2012-02-29 | 2013-09-12 | Oki Electric Ind Co Ltd | 音声信号処理装置、方法及びプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014056112A (ja) * | 2012-09-12 | 2014-03-27 | Oki Electric Ind Co Ltd | 音声信号処理装置、方法及びプログラム |
JP2019511864A (ja) * | 2016-03-09 | 2019-04-25 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | チャネル間時間差パラメータの安定性を増加させるための方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5970985B2 (ja) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5817366B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP6028502B2 (ja) | 音声信号処理装置、方法及びプログラム | |
US9947338B1 (en) | Echo latency estimation | |
JP5838861B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP2019503107A (ja) | 音響信号を向上させるための音響信号処理装置および方法 | |
JP2012150237A (ja) | 音信号処理装置、および音信号処理方法、並びにプログラム | |
US9773510B1 (en) | Correcting clock drift via embedded sine waves | |
JP2011244232A (ja) | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム | |
US10911881B1 (en) | Inter-channel level difference based acoustic tap detection | |
US9558758B1 (en) | User feedback on microphone placement | |
CN112530450A (zh) | 频域中的样本精度延迟识别 | |
JP5970985B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP2013126026A (ja) | 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム | |
JP5971047B2 (ja) | 音声信号処理装置、方法及びプログラム | |
WO2010061505A1 (ja) | 発話音声検出装置 | |
GB2566756A (en) | Temporal and spatial detection of acoustic sources | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP5772562B2 (ja) | 目的音抽出装置及び目的音抽出プログラム | |
JP6221258B2 (ja) | 信号処理装置、方法及びプログラム | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
JP6102144B2 (ja) | 音響信号処理装置、方法及びプログラム | |
JP6213324B2 (ja) | 音声信号処理装置及びプログラム | |
JP6221463B2 (ja) | 音声信号処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160627 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5970985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |