JP6314475B2 - 音声信号処理装置及びプログラム - Google Patents
音声信号処理装置及びプログラム Download PDFInfo
- Publication number
- JP6314475B2 JP6314475B2 JP2013267754A JP2013267754A JP6314475B2 JP 6314475 B2 JP6314475 B2 JP 6314475B2 JP 2013267754 A JP2013267754 A JP 2013267754A JP 2013267754 A JP2013267754 A JP 2013267754A JP 6314475 B2 JP6314475 B2 JP 6314475B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- frequency coherence
- low
- section
- disturbing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
以下、本発明による音声信号処理装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。第1の実施形態の音声処理装置は、ボイススイッチ法を適用して、音声信号中に含まれる目的音声成分を抽出する(言い換えると、非目的音声成分を抑圧する)ものである。
マイクロホン間隔がある所定値以上に広がると、上述した空間エイリアスが生じるだけでなく、第1及び第2の指向性信号の低域成分の指向性の鋭さが増す。図1は、このことの説明図である。図1は、第1の指向性信号におけるある低域成分(例えば500Hz程度)についての指向性を表している。破線曲線はマイクロホン間隔が狭い場合を表し、実線曲線はマイクロホン間隔が広い場合を示しており、正面から90°右側にずれた方位の指向性はマイクロホン間隔が広い方が数倍(図1では4倍程度)指向性が鋭くなっている。なお、図1における円は、指向性の強度の目安を与える目盛として描いている。
図3は、第1の実施形態に係る音声信号処理装置の構成を示すブロック図である。ここで、一対のマイクロホンm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(音声信号処理プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図3で表すことができる。
後述するボイススイッチ処理部12においては、周波数領域信号X1(f,K)及びX2(f,K)のうち、周波数領域信号X1(f,K)をメインとし、周波数領域信号X2(f,K)をサブとしてボイススイッチ処理を行うが、周波数領域信号X2(f,K)をメインとし、周波数領域信号X1(f,K)をサブとしてボイススイッチ処理を行っても良い。
次に、第1の実施形態の音声信号処理装置10の動作を、図面を参照しながら、全体動作、ボイススイッチ処理部12における詳細動作の順に説明する。
以上のように、第1の実施形態によれば、マイクロホン間隔が広く、空間エイリアス成分がコヒーレンスに混入した場合でも、低減の極端に強い指向性に基づいて、正確に妨害音声区間を検出することができ、ボイススイッチ処理を適切に実行させることができる。
上記第1の実施形態では、長期平均値AVE_COHL(K)が長期平均値用の閾値Θより小さく、かつ、分散VAR_COHL(K)が分散用の閾値Ψより小さい場合を妨害音声区間と判定するものを示したが、他の判定基準を適用するようにしても良い。
Claims (7)
- 一対のマイクロホンが捕捉して得た入力音声信号から、当該入力音声信号に含まれている妨害音声信号の区間を特定する音声信号処理装置において、
一対の上記入力音声信号から低域コヒーレンスを得る低域コヒーレンス取得手段と、
得られた低域コヒーレンスの統計量を算出する低域コヒーレンス統計量算出手段と、
算出された低域コヒーレンス統計量を閾値と比較し、上記入力音声信号の区間が妨害音声信号の区間か否かを決定する妨害音声判定手段と
を有することを特徴する音声信号処理装置。 - 妨害音声信号の区間と他の区間とで異なる抑圧ゲインを設定し、上記入力音声信号に乗算するゲイン設定・乗算手段をさらに有することを特徴する請求項1に記載の音声信号処理装置。
- 上記低域コヒーレンスの統計量は、低域コヒーレンスの長期平均値であり、
上記妨害音声判定手段は、算出された低域コヒーレンスの長期平均値が長期平均値用の閾値より小さい場合、上記入力音声信号の現時刻は妨害音声信号の区間内にあると判定する
ことを特徴する請求項1又は2に記載の音声信号処理装置。 - 上記低域コヒーレンスの統計量は、低域コヒーレンスの分散であり、
上記妨害音声判定手段は、算出された低域コヒーレンスの分散が分散用の閾値より小さい場合、上記入力音声信号の現時刻は妨害音声信号の区間内にあると判定する
ことを特徴する請求項1又は2に記載の音声信号処理装置。 - 上記低域コヒーレンスの統計量は、低域コヒーレンスの長期平均値と分散であり、
上記妨害音声判定手段は、算出された低域コヒーレンスの長期平均値が長期平均値用の閾値より小さく、かつ、算出された低域コヒーレンスの分散が分散用の閾値より小さい場合、上記入力音声信号の現時刻は妨害音声信号の区間内にあると判定する
ことを特徴する請求項1又は2に記載の音声信号処理装置。 - 一対のマイクロホンが捕捉して得た入力音声信号から、当該入力音声信号に含まれている妨害音声信号の区間を特定する音声信号処理プログラムであって、
コンピュータを、
一対の上記入力音声信号から低域コヒーレンスを得る低域コヒーレンス取得手段と、
得られた低域コヒーレンスの統計量を算出する低域コヒーレンス統計量算出手段と、
算出された低域コヒーレンス統計量を閾値と比較し、上記入力音声信号の区間が妨害音声信号の区間か否かを決定する妨害音声判定手段と
して機能させることを特徴とする音声信号処理プログラム。 - 上記コンピュータをさらに、妨害音声信号の区間と他の区間とで異なる抑圧ゲインを設定し、上記入力音声信号に乗算するゲイン設定・乗算手段として機能させることを特徴する請求項6に記載の音声信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013267754A JP6314475B2 (ja) | 2013-12-25 | 2013-12-25 | 音声信号処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013267754A JP6314475B2 (ja) | 2013-12-25 | 2013-12-25 | 音声信号処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015125184A JP2015125184A (ja) | 2015-07-06 |
JP6314475B2 true JP6314475B2 (ja) | 2018-04-25 |
Family
ID=53535947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013267754A Active JP6314475B2 (ja) | 2013-12-25 | 2013-12-25 | 音声信号処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6314475B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9906859B1 (en) * | 2016-09-30 | 2018-02-27 | Bose Corporation | Noise estimation for dynamic sound adjustment |
CN110495184B (zh) * | 2017-03-24 | 2021-12-03 | 雅马哈株式会社 | 拾音装置及拾音方法 |
JP6755843B2 (ja) * | 2017-09-14 | 2020-09-16 | 株式会社東芝 | 音響処理装置、音声認識装置、音響処理方法、音声認識方法、音響処理プログラム及び音声認識プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120020489A1 (en) * | 2009-01-06 | 2012-01-26 | Tomohiro Narita | Noise canceller and noise cancellation program |
US8620672B2 (en) * | 2009-06-09 | 2013-12-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal |
JP5927887B2 (ja) * | 2011-12-13 | 2016-06-01 | 沖電気工業株式会社 | 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム |
JP5838861B2 (ja) * | 2012-02-29 | 2016-01-06 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
-
2013
- 2013-12-25 JP JP2013267754A patent/JP6314475B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015125184A (ja) | 2015-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10650796B2 (en) | Single-channel, binaural and multi-channel dereverberation | |
US8238569B2 (en) | Method, medium, and apparatus for extracting target sound from mixed sound | |
KR20180073664A (ko) | 소리 신호를 강화하는 소리 신호 처리 장치 및 방법 | |
JP5838861B2 (ja) | 音声信号処理装置、方法及びプログラム | |
KR20090037692A (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
JP2011244232A (ja) | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム | |
JP2010112995A (ja) | 通話音声処理装置、通話音声処理方法およびプログラム | |
KR20090037845A (ko) | 혼합 신호로부터 목표 음원 신호를 추출하는 방법 및 장치 | |
JP6314475B2 (ja) | 音声信号処理装置及びプログラム | |
JP6221257B2 (ja) | 信号処理装置、方法及びプログラム | |
JPWO2016076237A1 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP6295650B2 (ja) | 音声信号処理装置及びプログラム | |
JP6221258B2 (ja) | 信号処理装置、方法及びプログラム | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
JP6221463B2 (ja) | 音声信号処理装置及びプログラム | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP6263890B2 (ja) | 音声信号処理装置及びプログラム | |
US11495241B2 (en) | Echo delay time estimation method and system thereof | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
JP2019054340A (ja) | 信号処理装置およびその制御方法 | |
JP6903947B2 (ja) | 非目的音抑圧装置、方法及びプログラム | |
WO2022047606A1 (en) | Method and system for authentication and compensation | |
JP6544182B2 (ja) | 音声処理装置、プログラム及び方法 | |
JP6252274B2 (ja) | 背景雑音区間推定装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180312 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6314475 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |