JP2017067844A - 音声判定装置、方法及びプログラム、並びに、音声処理装置 - Google Patents
音声判定装置、方法及びプログラム、並びに、音声処理装置 Download PDFInfo
- Publication number
- JP2017067844A JP2017067844A JP2015189919A JP2015189919A JP2017067844A JP 2017067844 A JP2017067844 A JP 2017067844A JP 2015189919 A JP2015189919 A JP 2015189919A JP 2015189919 A JP2015189919 A JP 2015189919A JP 2017067844 A JP2017067844 A JP 2017067844A
- Authority
- JP
- Japan
- Prior art keywords
- coherence
- smoothing
- suppression signal
- voice
- determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】 本発明は、複数のマイクから得られた入力信号の音声処理に音声判定装置の判定結果を利用する音声処理装置に関する。そして、本発明の音声判定装置は、入力信号を時間領域から周波数領域に変換された周波数領域入力信号を取得し、取得したマイクごとの周波数領域入力信号の差に基づいて、正面に死角を有する正面抑圧信号を生成する正面抑圧信号生成部と、複数のマイクから得られた入力信号からコヒーレンスを計算するコヒーレンス計算部と、得られた正面抑圧信号とコヒーレンスの平滑化処理を行う平滑化処理部と、平滑化処理されたコヒーレンスと正面抑圧信号との関係性を表す特徴量を算出し、当該特徴量の値に基づいて妨害音声の有無を判定する判定部とを有することを特徴とする。
【選択図】 図1
Description
以下、本発明による音声判定装置、方法及びプログラム、並びに、音声処理装置の一実施形態を、図面を参照しながら詳述する。
図1は、この実施形態の音声判定装置1の全体構成を示すブロック図である。
FRAME1(1)={s1(1)、s1(2)・・、s1(i)、・・s1(n)}
FRAME1(K)={s1(N×K+1)、s1(N×K+2)・・、s1(N×K+i)、・・s1(N×K+N)} …(1)
X1(f,K)={X1(f1,K)、X1(f2,K)、・・X1(fi,K)・・、X1(fm,K)} …(2)
N(f,K)=X1(f,K)−X2(f,K) …(3)
S_AVE_N(K)
=λ×AVE_N(K)+(1−λ)×S_AVE_N(K−1) …(5)
S_COH(K)
=ξ×COH(K)+(1−ξ)×S_COH(K−1) …(6)
次に、以上のような構成を有するこの実施形態の音声判定装置1の動作(実施形態の判定方法)を説明する。
この実施形態によれば、以下のような効果を奏することができる。
本発明は、上記の実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
Claims (12)
- 複数のマイクから得られた入力信号を時間領域から周波数領域に変換された周波数領域入力信号を取得し、取得した前記マイクごとの周波数領域入力信号の差に基づいて、正面に死角を有する正面抑圧信号を生成する正面抑圧信号生成部と、
前記複数のマイクから得られた入力信号からコヒーレンスを計算するコヒーレンス計算部と、
前記正面抑圧信号生成部が生成した正面抑圧信号、及び前記コヒーレンス計算部が計算したコヒーレンスを平滑化処理し、平滑化処理済の正面抑圧信号、及び平滑化処理済のコヒーレンスを生成する平滑化処理部と、
前記平滑化処理済の正面抑圧信号、及び前記平滑化処理済のコヒーレンスとの関係性を表す特徴量を算出し、前記特徴量の値に基づいて妨害音声の有無を判定する判定部と
を有することを特徴とする音声判定装置。 - 前記特徴量は、前記平滑化処理済の正面抑圧信号と、前記平滑化処理済のコヒーレンスとの相関係数であることを特徴とする請求項1に記載の音声判定装置。
- 前記判定部は、前記特徴量としての相関係数の正負に基づいて妨害音声の有無を判定することを特徴とする請求項2に記載の音声判定装置。
- 前記特徴量は、前記正面抑圧信号と前記コヒーレンスとの共分散であることを特徴とする請求項1に記載の音声判定装置。
- 前記判定部は、前記特徴量としての共分散の正負に基づいて妨害音声の有無を判定することを特徴とする請求項4に記載の音声判定装置。
- 前記平滑化処理部は、
第1の平滑化係数を用いて、前記正面抑圧信号生成部が生成した正面抑圧信号を平滑化処理し、
第2の平滑化係数を用いて、前記コヒーレンス計算部が計算したコヒーレンスを平滑化処理する
ことを特徴とする請求項1〜5のいずれかに記載の音声判定装置。 - 妨害音声の到来方向に応じて、前記第1の平滑化係数及び前記第2の平滑化係数を設定し、前記平滑化処理部に供給する平滑化係数制御部をさらに有し、
前記平滑化処理部は、前記平滑化係数制御部から供給された前記第1の平滑化係数及び前記第2の平滑化係数を用いて平滑化処理を行う
ことを特徴とする請求項6に記載の音声判定装置。 - 前記平滑化係数制御部は、前記コヒーレンス計算部が計算したコヒーレンスに応じて、前記第1の平滑化係数及び前記第2の平滑化係数を設定することを特徴とする請求項7に記載の音声判定装置。
- 前記平滑化係数制御部は、前記コヒーレンス計算部が計算したコヒーレンスの値と大小関係が反転するような値を、前記第1の平滑化係数に設定し、前記コヒーレンス計算部が計算したコヒーレンスの値と大小関係が一致するような値を、前記第2の平滑化係数に設定することを特徴とする請求項8に記載の音声判定装置。
- コンピュータを、
複数のマイクから得られた入力信号を時間領域から周波数領域に変換された周波数領域入力信号を取得し、取得した前記マイクごとの周波数領域入力信号の差に基づいて、正面に死角を有する正面抑圧信号を生成する正面抑圧信号生成部と、
前記複数のマイクから得られた入力信号からコヒーレンスを計算するコヒーレンス計算部と、
前記正面抑圧信号生成部が生成した正面抑圧信号、及び前記コヒーレンス計算部が計算したコヒーレンスを平滑化処理し、平滑化処理済の正面抑圧信号、及び平滑化処理済のコヒーレンスを生成する平滑化処理部と、
前記平滑化処理済の正面抑圧信号、及び前記平滑化処理済のコヒーレンスとの関係性を表す特徴量を算出し、前記特徴量の値に基づいて妨害音声の有無を判定する判定部と
して機能させることを特徴とする音声判定プログラム。 - 複数のマイクから得られた入力信号に関する判定方法において、
正面抑圧信号生成部、コヒーレンス計算部、平滑化処理部、及び判定部を備え、
前記正面抑圧信号生成部は、複数のマイクから得られた入力信号を時間領域から周波数領域に変換された周波数領域入力信号を取得し、取得した前記マイクごとの周波数領域入力信号の差に基づいて、正面に死角を有する正面抑圧信号を生成し、
前記コヒーレンス計算部は、前記複数のマイクから得られた入力信号からコヒーレンスを計算し、
前記平滑化処理部は、前記正面抑圧信号生成部が生成した正面抑圧信号、及び前記コヒーレンス計算部が計算したコヒーレンスを平滑化処理し、平滑化処理済の正面抑圧信号、及び平滑化処理済のコヒーレンスを生成し、
前記判定部は、前記平滑化処理済の正面抑圧信号、及び前記平滑化処理済のコヒーレンスとの関係性を表す特徴量を算出し、前記特徴量の値に基づいて妨害音声の有無を判定する
ことを特徴とする音声判定方法。 - 複数のマイクから得られた入力信号の音声処理を行う音声処理装置において、請求項1〜9のいずれかに記載の音声判定装置の判定結果を利用した音声処理を行うことを特徴とする音声処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015189919A JP6631127B2 (ja) | 2015-09-28 | 2015-09-28 | 音声判定装置、方法及びプログラム、並びに、音声処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015189919A JP6631127B2 (ja) | 2015-09-28 | 2015-09-28 | 音声判定装置、方法及びプログラム、並びに、音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017067844A true JP2017067844A (ja) | 2017-04-06 |
JP6631127B2 JP6631127B2 (ja) | 2020-01-15 |
Family
ID=58494740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015189919A Active JP6631127B2 (ja) | 2015-09-28 | 2015-09-28 | 音声判定装置、方法及びプログラム、並びに、音声処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6631127B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018181259A1 (ja) | 2017-03-30 | 2018-10-04 | 住友化学株式会社 | 芳香族ポリスルホン、芳香族ポリスルホン組成物、及び芳香族ポリスルホンの製造方法 |
-
2015
- 2015-09-28 JP JP2015189919A patent/JP6631127B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018181259A1 (ja) | 2017-03-30 | 2018-10-04 | 住友化学株式会社 | 芳香族ポリスルホン、芳香族ポリスルホン組成物、及び芳香族ポリスルホンの製造方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6631127B2 (ja) | 2020-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111418010B (zh) | 一种多麦克风降噪方法、装置及终端设备 | |
JP5070873B2 (ja) | 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム | |
US9426566B2 (en) | Apparatus and method for suppressing noise from voice signal by adaptively updating Wiener filter coefficient by means of coherence | |
WO2014054314A1 (ja) | 音声信号処理装置、方法及びプログラム | |
WO2013065088A1 (ja) | 雑音抑圧装置 | |
JP5838861B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP2016042613A (ja) | 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
US11984132B2 (en) | Noise suppression device, noise suppression method, and storage medium storing noise suppression program | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
JP5970985B2 (ja) | 音声信号処理装置、方法及びプログラム | |
JP5772562B2 (ja) | 目的音抽出装置及び目的音抽出プログラム | |
JP6544182B2 (ja) | 音声処理装置、プログラム及び方法 | |
JP6263890B2 (ja) | 音声信号処理装置及びプログラム | |
Cheong et al. | Postfilter for Dual Channel Speech Enhancement Using Coherence and Statistical Model-Based Noise Estimation | |
JP2018142822A (ja) | 音響信号処理装置、方法及びプログラム | |
JP6903947B2 (ja) | 非目的音抑圧装置、方法及びプログラム | |
JP2017067990A (ja) | 音声処理装置、プログラム及び方法 | |
JP6221463B2 (ja) | 音声信号処理装置及びプログラム | |
JP6213324B2 (ja) | 音声信号処理装置及びプログラム | |
JP2016039398A (ja) | 残響判定装置及びプログラム | |
JP6252274B2 (ja) | 背景雑音区間推定装置及びプログラム | |
CN114495961A (zh) | 语音降噪方法、装置、电子设备以及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190521 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6631127 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |