JP2010181467A - 複数信号強調装置とその方法と、プログラム - Google Patents
複数信号強調装置とその方法と、プログラム Download PDFInfo
- Publication number
- JP2010181467A JP2010181467A JP2009022698A JP2009022698A JP2010181467A JP 2010181467 A JP2010181467 A JP 2010181467A JP 2009022698 A JP2009022698 A JP 2009022698A JP 2009022698 A JP2009022698 A JP 2009022698A JP 2010181467 A JP2010181467 A JP 2010181467A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- correlation matrix
- signal
- unit
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】この発明の複数信号強調装置の他話者相関行列計算部は、観測信号xb(f,t)とクラスタデータCb(t)と話者組み合わせ情報p(b)とを入力として、強調対象話者k以外の観測信号xb(f,t)の相関行列である他話者相関行列の計算値と、他話者相関行列保持部を参照して同じ話者組み合わせの過去の他話者相関行列とから、他話者相関行列を求める。強調対象話者相関行列計算部は、強調対象話者kの観測信号xb(f,t)の相関行列である強調対象話者相関行列を計算する。係数計算部は、他話者相関行列と、強調対象話者相関行列と、を入力として強調対象話者kに関するSN比最大化ビームフォーマの係数を計算する。
【選択図】図1
Description
式(8)をwk(f)で微分し0と置くと、式(11)の関係が得られる。
実施例1の強調対象話者相関行列計算部57は、計算対象のブロックbに強調対象話者kの発話がある場合、そのブロックで計算した話者kの強調対象話者相関行列Rb Tk(f)を用いていた。また、計算対象のブロックに強調対象話者kの発話が無い場合は、過去のブロックで計算された最も新しい強調対象話者相関行列Rprev Tk(f)を用いていた。この強調対象話者相関行列Rb Tk(f)を、実施例1の他話者相関行列と同じように過去に話者kが話したブロックの相関行列の全てを用いて計算するようにしても良い。つまり、図3の動作フローのステップS551で強調対象話者kが話している場合に、強調対象話者相関行列計算部57は、式(18)で強調対象話者相関行列Rb Tk(f)を計算して出力する。そして、強調対象話者相関行列保持部58に記録されている最も新しい強調対象話者相関行列Rprev Tk(f)を式(24)に示すように更新する。このようにすることで、強調対象話者相関行列Rb Tk(f)についても、過去のブロックの相関行列が生かされ、音声強調性能の更なる向上が期待できる。
〔実験結果〕
この発明の効果を確認する目的で、従来の複数信号強調装置600と、この発明の複数信号強調装置100の音声強調性能の比較を行った。実験は、図5に示す凡そ3m×4mの会議スペース内のテーブルの上に置かれた3個のマイクロホンアレーで観測した4人の会議状況を模擬した観測信号x(f,t)を用いて行った。その観測信号x(f,t)を、複数信号強調装置600でブロック処理が有無の場合と、複数信号強調装置100で音声強調処理を行った場合を比較した。ブロック長は5秒間とした。音声強調性能をSINR(Signal-to-Interference plus Noise-ratio)で評価した結果を表1に示す。
Claims (7)
- 複数のマイクロホンで観測された観測信号を周波数領域の信号x(f,t)に変換する周波数領域変換部と、
複数話者のそれぞれの話者の発話区間を推定してクラスタ情報C(t)を出力する複数信号区間推定部と、
上記話者の発話区間の発話音声信号を強調する信号強調部と、を備える複数信号強調装置において、
上記信号強調部は、
上記周波数領域の信号x(f,t)と、上記クラスタ情報C(t)とを入力として、所定時間長毎のブロックに区切った観測信号xb(f,t)とクラスタデータCb(t)とを出力するブロック分割部と、
上記ブロックに区切ったクラスタデータCb(t)内に存在する話者番号を調べ、それを話者組み合わせ情報p(b)として出力する話者組み合わせ推定部と、
上記話者組み合わせ情報p(b)を記録する話者組み合わせ保持部と、
上記観測信号xb(f,t)と、上記クラスタデータCb(t)と、上記話者組み合わせ情報p(b)とを入力として、強調対象話者k以外の上記観測信号xb(f,t)の相関行列である他話者相関行列の計算値と、他話者相関行列保持部を参照して上記話者組み合わせと同じ組み合わせの過去の上記他話者相関行列とから、他話者相関行列を求める他話者相関行列計算部と、
上記他話者相関行列を記録する上記他話者相関行列保持部と、
上記ブロックに区切ったクラスタデータCb(t)内に強調対象話者kの発話があるか否かを判断する強調対象話者検出部と、
上記強調対象話者kの上記観測信号xb(f,t)の相関行列である強調対象話者相関行列を計算する強調対象話者相関行列計算部と、
上記強調対象話者相関行列を記録する強調対象話者相関行列保持部と、
上記他話者相関行列と、上記強調対象話者相関行列とを入力として強調対象話者kに関するSN比最大化ビームフォーマの係数を計算する係数計算部と、
を具備することを特徴とする複数信号強調装置。 - 請求項1に記載した複数信号強調装置において、
上記他話者相関行列計算部は、計算対象とする上記ブロックの他話者相関行列に、そのブロックと同じ話者組み合わせの過去の他話者相関行列に1以下の忘却係数を乗算して加算した値を、上記ブロックの他話者相関行列として出力するものであることを特徴とする複数信号強調装置。 - 請求項1又は2に記載した複数信号強調装置において、
強調対象話者相関行列計算部は、計算対象とする上記ブロックに強調対象話者kの発話が含まれていない場合、そのブロックの強調対象話者kについての相関行列を、過去のブロックで既に得られている強調対象話者相関行列に置換して出力するものであることを特徴とする複数信号強調装置。 - 周波数領域変換部が、複数のマイクロホンで観測された観測信号を周波数領域の信号x(f,t)に変換する周波数領域変換過程と、
複数信号区間推定部が、複数話者のそれぞれの話者の発話区間を推定してクラスタ情報C(t)を出力する複数信号区間推定過程と、
信号強調部が、上記話者の発話区間の発話音声信号を強調する信号強調過程とから成る複数信号強調方法において、
上記信号強調過程は、
ブロック分割部が、上記周波数領域の信号x(f,t)と、上記クラスタ情報C(t)とを入力として、所定時間長毎のブロックに区切った観測信号xb(f,t)とクラスタデータCb(t)とを出力するブロック分割ステップと、
話者組み合わせ推定部が、上記ブロックに区切ったクラスタデータCb(t)内に存在する話者番号を調べ、それを話者組み合わせ情報p(b)として出力する話者組み合わせ推定ステップと、
話者組み合わせ保持部が、上記話者組み合わせ情報p(b)を記録する話者組み合わせ保持ステップと、
他話者相関行列計算部が、上記観測信号xb(f,t)と、上記クラスタデータCb(t)と、上記話者組み合わせ情報p(b)とを入力として、強調対象話者k以外の上記観測信号xb(f,t)の相関行列である他話者相関行列の計算値と、他話者相関行列保持部を参照して上記話者組み合わせと同じ組み合わせの過去の上記他話者相関行列とから、他話者相関行列を求める他話者相関行列計算ステップと、
他話者相関行列保持部が、上記他話者相関行列を記録する他話者相関行列保持ステップと、
強調対象話者検出部が、上記ブロックに区切ったクラスタデータCb(t)内に強調対象話者kの発話があるか否かを判断する強調対象話者検出過程と、
強調対象話者相関行列計算部が、上記強調対象話者kの上記観測信号xb(f,t)の相関行列である強調対象話者相関行列を計算する強調対象話者相関行列計算ステップと、
強調対象話者相関行列保持部が、上記強調対象話者相関行列を記録する強調対象話者相関行列保持ステップと、
係数計算部が、上記他話者相関行列と、上記強調対象話者相関行列とを入力として強調対象話者kに関するSN比最大化ビームフォーマの係数を計算する係数計算ステップと、
を含むことを特徴とする複数信号強調方法。 - 請求項4に記載した複数信号強調方法において、
上記他話者相関行列計算ステップは、計算対象とする上記ブロックの他話者相関行列に、そのブロックと同じ話者組み合わせの過去の他話者相関行列に1以下の忘却係数を乗算して加算した値を、上記ブロックの他話者相関行列として出力するステップであることを特徴とする複数信号強調方法。 - 請求項4又は5に記載した複数信号強調方法において、
上記強調対象話者相関行列保持ステップは、計算対象とする上記ブロックに強調対象話者kの発話が含まれていない場合、そのブロックの強調対象話者kについての相関行列を、過去のブロックで既に得られている強調対象話者相関行列に置換して出力するステップであることを特徴とする複数信号強調方法。 - 請求項1乃至3の何れかに記載した複数信号強調装置としてコンピュータを機能させる装置プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009022698A JP5044581B2 (ja) | 2009-02-03 | 2009-02-03 | 複数信号強調装置とその方法と、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009022698A JP5044581B2 (ja) | 2009-02-03 | 2009-02-03 | 複数信号強調装置とその方法と、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010181467A true JP2010181467A (ja) | 2010-08-19 |
JP5044581B2 JP5044581B2 (ja) | 2012-10-10 |
Family
ID=42763078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009022698A Active JP5044581B2 (ja) | 2009-02-03 | 2009-02-03 | 複数信号強調装置とその方法と、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5044581B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019202966A1 (ja) * | 2018-04-16 | 2019-10-24 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP2020003751A (ja) * | 2018-07-02 | 2020-01-09 | 株式会社東芝 | 音信号処理装置、音信号処理方法、およびプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008060635A (ja) * | 2006-08-29 | 2008-03-13 | Nippon Telegr & Teleph Corp <Ntt> | ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体 |
JP2008158035A (ja) * | 2006-12-21 | 2008-07-10 | Nippon Telegr & Teleph Corp <Ntt> | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 |
JP2008203474A (ja) * | 2007-02-20 | 2008-09-04 | Nippon Telegr & Teleph Corp <Ntt> | 多信号強調装置、方法、プログラム及びその記録媒体 |
-
2009
- 2009-02-03 JP JP2009022698A patent/JP5044581B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008060635A (ja) * | 2006-08-29 | 2008-03-13 | Nippon Telegr & Teleph Corp <Ntt> | ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体 |
JP2008158035A (ja) * | 2006-12-21 | 2008-07-10 | Nippon Telegr & Teleph Corp <Ntt> | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 |
JP2008203474A (ja) * | 2007-02-20 | 2008-09-04 | Nippon Telegr & Teleph Corp <Ntt> | 多信号強調装置、方法、プログラム及びその記録媒体 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019202966A1 (ja) * | 2018-04-16 | 2019-10-24 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JPWO2019202966A1 (ja) * | 2018-04-16 | 2021-04-22 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP7279710B2 (ja) | 2018-04-16 | 2023-05-23 | ソニーグループ株式会社 | 信号処理装置および方法、並びにプログラム |
JP2020003751A (ja) * | 2018-07-02 | 2020-01-09 | 株式会社東芝 | 音信号処理装置、音信号処理方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5044581B2 (ja) | 2012-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7191793B2 (ja) | 信号処理装置、信号処理方法、及びプログラム | |
Schwartz et al. | Multi-microphone speech dereverberation and noise reduction using relative early transfer functions | |
US11869481B2 (en) | Speech signal recognition method and device | |
JP4746533B2 (ja) | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 | |
JP4891801B2 (ja) | 多信号強調装置、方法、プログラム及びその記録媒体 | |
JP4964204B2 (ja) | 複数信号区間推定装置、複数信号区間推定方法、そのプログラムおよび記録媒体 | |
JP4875656B2 (ja) | 信号区間推定装置とその方法と、プログラムとその記録媒体 | |
JP2004274763A (ja) | マイクロホンアレイ構造、ビーム形成装置およびビーム形成方法、ならびに音源方向推定装置および方法 | |
JP6622159B2 (ja) | 信号処理システム、信号処理方法およびプログラム | |
Xiao et al. | The NTU-ADSC systems for reverberation challenge 2014 | |
JP5566846B2 (ja) | ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法 | |
CN104485108A (zh) | 一种基于多说话人模型的噪声与说话人联合补偿方法 | |
KR20210137146A (ko) | 큐의 클러스터링을 사용한 음성 증강 | |
Jin et al. | Multi-channel noise reduction for hands-free voice communication on mobile phones | |
JP2007047427A (ja) | 音声処理装置 | |
Chazan et al. | DNN-based concurrent speakers detector and its application to speaker extraction with LCMV beamforming | |
US20130253923A1 (en) | Multichannel enhancement system for preserving spatial cues | |
JP5044581B2 (ja) | 複数信号強調装置とその方法と、プログラム | |
KR20190073852A (ko) | 우도 최대화를 이용한 빔포밍 방법 | |
KR101658001B1 (ko) | 강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법 | |
JP6567479B2 (ja) | 信号処理装置、信号処理方法およびプログラム | |
Kim et al. | Speech feature mapping based on switching linear dynamic system | |
Malek et al. | Speaker extraction using LCMV beamformer with DNN-based SPP and RTF identification scheme | |
CN110675890A (zh) | 声音信号处理装置以及声音信号处理方法 | |
Saruwatari et al. | Semi-blind speech extraction for robot using visual information and noise statistics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101214 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110715 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120327 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120703 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120713 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5044581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150720 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |