JP2013201722A - 多チャネル信号処理装置、方法、及びプログラム - Google Patents
多チャネル信号処理装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2013201722A JP2013201722A JP2012070301A JP2012070301A JP2013201722A JP 2013201722 A JP2013201722 A JP 2013201722A JP 2012070301 A JP2012070301 A JP 2012070301A JP 2012070301 A JP2012070301 A JP 2012070301A JP 2013201722 A JP2013201722 A JP 2013201722A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- estimated
- spectrum
- time domain
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Stereophonic System (AREA)
Abstract
【解決手段】周波数領域変換部14L,14Rで観測信号を周波数領域の信号である観測スペクトルに変換し、スペクトル比演算部16で、観測スペクトルの比を演算し、ボーカル信号抽出部18で、スペクトル比が閾値以上の信号を楽曲信号とみなして抑圧した推定ボーカルスペクトルを抽出し、時間領域変換部20で、時間領域の信号である推定ボーカル信号に変換する。楽曲信号推定部22で、推定ボーカル信号の分散値、観測信号の分散値から推定ボーカル信号の分散値を差し引いた楽曲信号の分散値、並びに観測信号を有色駆動源付カルマンフィルタに適用し、状態量の最適推定値ベクトルとして推定された推定楽曲信号を抽出する。
【選択図】図1
Description
<第1の実施の形態>
第1の実施の形態では、本発明の第1信号の一例を、例えばLチャネルマイクとRチャネルマイクとの中央付近を音源位置とするボーカル信号とし、本発明の第2信号の一例を、例えば楽器等を音源とする楽曲信号とする場合について説明する。
xR(n)= d(n)+iR(n) (2)
周波数領域変換部14L,14Rは、A/D変換部12L,12Rから入力された時間領域の信号である観測信号xL(n),xR(n)を各々周波数領域の観測信号XL(l,k),XR(l,k)に変換し、スペクトル比演算部16及びボーカル信号抽出部18へ出力する。具体的には、周波数領域変換部14L,14Rは、図3に示すように、所定フレーム長のフレーム内の観測信号xL(l,n),xR(l,n)各々を、下記(3)式及び(4)式によりフーリエ変換して、各周波数ビンのスペクトルに変換する。ここで、2Mは1フレーム当たりのサンプル数、lはフレーム番号、kは周波数ビン番号である。また、以下では、周波数領域の信号に変換された観測信号を「観測スペクトル」ともいう。
|XR(l,k)|= |D(l,k)|+|IR(l,k)| (6)
このことから、Lチャネル観測スペクトルとRチャネル観測スペクトルとのスペクトル比が小さい場合には、その信号をボーカル信号と判定し、スペクトル比が大きい場合には、その信号を楽曲信号と判定することができる。そこで、スペクトル比演算部16は、Lチャネル観測スペクトルとRチャネル観測スペクトルとのスペクトル比を演算する。特許文献1及び2では、同じ周波数帯域毎に周波数領域の信号に変換された左チャネル信号と右チャネル信号との類似度を計算するが、本実施の形態では、下記(7)式により、Lチャネル観測スペクトルとRチャネル観測スペクトルとのスペクトル比Ae(l,k)を演算する。
<第2の実施の形態>
第2の実施の形態では、本発明の第1信号の一例を、例えばLチャネルマイクとRチャネルマイクとの中央付近を音源位置とするボーカル信号とし、本発明の第2信号の一例を、例えば楽器等を音源とする楽曲信号とする場合について説明する。
<第3の実施の形態>
第3の実施の形態では、本発明の第1信号の一例を、例えばLチャネルマイクとRチャネルマイクとの中央付近を音源位置とするボーカル信号(音声信号)とし、本発明の第2信号の一例を、例えば白色雑音に近い雑音信号とする場合について説明する。
xR(l,i)= d(l,i)+iR(l,i) (13)
自己相関処理部26L,26Rは、遅れ時間をτとして、下記(14)式及び(15)式により、Lチャネル及びRチャネル観測信号各々の自己相関関数RxL(l,τ), RxR(l,τ)(τ=0,・・・,L−1)を計算する。
<第4の実施の形態>
第4の実施の形態では、本発明の第1信号の一例を、例えばLチャネルマイクとRチャネルマイクとの中央付近を音源位置とするボーカル信号(音声信号)とし、本発明の第2信号の一例を、例えば雑音信号とする場合について説明する。
12L,12R A/D変換部
14L,14R 周波数領域変換部
16 スペクトル比演算部
18 ボーカル信号抽出部
20、 20L,20R 時間領域変換部
22 楽曲信号推定部
24L,24R D/A変換部
26L,26R 自己相関処理部
28L,28R ピーク値検出部
30L,30R、430L,430R 雑音判定部
32L,32R スペクトル密度演算部
34L,34R スペクトルエントロピー演算部
222 特定信号推定部
322 雑音抑圧部
Claims (11)
- 各チャネル間で共通に含まれる第1信号と、チャネル毎に異なる第2信号とを含む複数チャネルの時間領域の観測信号各々を周波数領域のスペクトル信号に変換し、各スペクトル信号の比に基づいて前記第1信号のスペクトル信号と推定される推定第1スペクトル信号を抽出し、周波数領域の信号である前記推定第1スペクトル信号を時間領域の信号に変換して前記第1信号と推定される時間領域の推定第1信号を抽出する抽出手段と、
前記抽出手段で抽出された前記時間領域の推定第1信号の分散値、前記観測信号の分散値から前記推定第1信号の分散値を差し引いて得られる前記第2信号の分散値、並びに前記複数チャネルの観測信号を用いて、有色駆動源付カルマンフィルタにより、前記第1信号または前記第2信号を推定する推定手段と、
を含む多チャネル信号処理装置。 - 前記推定手段により推定された前記第1信号または前記第2信号を含む複数チャネルの時間領域の観測信号各々の自己相関のピーク値に基づいて、前記第2信号と推定される時間領域の推定第2信号を抽出する後段抽出手段と、
前記後段抽出手段で抽出された前記時間領域の推定第2信号の分散値、前記観測信号の分散値から前記推定第2信号の分散値を差し引いて得られる前記第1信号の分散値、並びに前記複数チャネルの観測信号を用いて、有色駆動源付カルマンフィルタにより、前記第1信号または前記第2信号を推定する後段推定手段と、
を含む請求項1記載の多チャネル信号処理装置。 - 前記推定手段により推定された前記第1信号または前記第2信号を含む複数チャネルの時間領域の観測信号各々を周波数領域のスペクトル信号に変換し、スペクトル信号から各々得られるスペクトルエントロピーに基づいて前記第2信号のスペクトル信号と推定される推定第2スペクトル信号を抽出し、周波数領域の信号である前記推定第2スペクトル信号を時間領域の信号に変換して前記第2信号と推定される時間領域の推定第2信号を抽出する後段抽出手段と、
前記後段抽出手段で抽出された前記時間領域の推定第2信号の分散値、前記観測信号の分散値から前記推定第2信号の分散値を差し引いて得られる前記第1信号の分散値、並びに前記複数チャネルの観測信号を用いて、有色駆動源付カルマンフィルタにより、前記第1信号または前記第2信号を推定する後段推定手段と、
を含む請求項1記載多チャネル信号処理装置。 - 各チャネル間で共通に含まれる第1信号と、チャネル毎に異なる第2信号とを含む複数チャネルの時間領域の観測信号各々の自己相関のピーク値に基づいて、前記第2信号と推定される時間領域の推定第2信号を抽出する抽出手段と、
前記抽出手段で抽出された前記時間領域の推定第2信号の分散値、前記観測信号の分散値から前記推定第2信号の分散値を差し引いて得られる前記第1信号の分散値、並びに前記複数チャネルの観測信号を用いて、有色駆動源付カルマンフィルタにより、前記第1信号または前記第2信号を推定する推定手段と、
を含む多チャネル信号処理装置。 - 各チャネル間で共通に含まれる第1信号と、チャネル毎に異なる第2信号とを含む複数チャネルの時間領域の観測信号各々を周波数領域のスペクトル信号に変換して各々のパワースペクトル密度を演算し、該パワースペクトル密度から各々得られるスペクトルエントロピーに基づいて前記第2信号のスペクトル信号と推定される推定第2スペクトル信号を抽出し、周波数領域の信号である前記推定第2スペクトル信号を時間領域の信号に変換して前記第2信号と推定される時間領域の推定第2信号を抽出する抽出手段と、
前記抽出手段で抽出された前記時間領域の推定第2信号の分散値、前記観測信号の分散値から前記推定第2信号の分散値を差し引いて得られる前記第1信号の分散値、並びに前記複数チャネルの観測信号を用いて、有色駆動源付カルマンフィルタにより、前記第1信号または前記第2信号を推定する推定手段と、
を含む多チャネル信号処理装置。 - 前記抽出手段は、前記観測信号を所定フレーム長のフレーム毎に前記周波数領域のスペクトル信号に変換し、フレーム毎に前記スペクトルエントロピーを求め、第1所定フレーム数分のスペクトルエントロピーの平均σ’が、現フレームのスペクトルエントロピーより小さい場合にはσ’、大きい場合にはσ’に所定の係数αを乗算したασ’となる値σ”を得、前記第1信号が過去第2所定フレーム数連続している場合はσ”、前記第1信号が過去第2所定フレーム数連続しておらず、かつ前記第2信号が過去第2所定フレーム数連続している場合はσ’、前記第1信号が過去第2所定フレーム数連続しておらず、かつ前記第2信号が過去第2所定フレーム数連続していない場合はσ”を閾値σとし、原フレームのスペクトルエントロピーが閾値σより小さい場合には、現フレームを第1信号と判定し、原フレームのスペクトルエントロピーが閾値σ以上の場合には、現フレームを第2信号と判定する請求項5記載の多チャネル信号処理装置。
- 前記有色駆動原付カルマンフィルタを、前記第1信号または前記第2信号の推定に必要な処理のみを取り出した演算量軽減型有色駆動原付カルマンフィルタとした請求項1〜請求項6のいずれか1項記載の多チャネル信号処理装置。
- 各チャネル間で共通に含まれる第1信号と、チャネル毎に異なる第2信号とを含む複数チャネルの時間領域の観測信号各々を周波数領域のスペクトル信号に変換し、各スペクトル信号の比に基づいて前記第1信号のスペクトル信号と推定される推定第1スペクトル信号を抽出し、周波数領域の信号である前記推定第1スペクトル信号を時間領域の信号に変換して前記第1信号と推定される時間領域の推定第1信号を抽出し、
抽出された前記時間領域の推定第1信号の分散値、前記観測信号の分散値から前記推定第1信号の分散値を差し引いて得られる前記第2信号の分散値、並びに前記複数チャネルの観測信号を用いて、有色駆動源付カルマンフィルタにより、前記第1信号または前記第2信号を推定する
多チャネル信号処理方法。 - 各チャネル間で共通に含まれる第1信号と、チャネル毎に異なる第2信号とを含む複数チャネルの時間領域の観測信号各々の自己相関のピーク値に基づいて、前記第2信号と推定される時間領域の推定第2信号を抽出し、
抽出された前記時間領域の推定第2信号の分散値、前記観測信号の分散値から前記推定第2信号の分散値を差し引いて得られる前記第1信号の分散値、並びに前記複数チャネルの観測信号を用いて、有色駆動源付カルマンフィルタにより、前記第1信号または前記第2信号を推定する
を含む多チャネル信号処理方法。 - 各チャネル間で共通に含まれる第1信号と、チャネル毎に異なる第2信号とを含む複数チャネルの時間領域の観測信号各々を周波数領域のスペクトル信号に変換して各々のパワースペクトル密度を演算し、該パワースペクトル密度から各々得られるスペクトルエントロピーに基づいて前記第2信号のスペクトル信号と推定される推定第2スペクトル信号を抽出し、周波数領域の信号である前記推定第2スペクトル信号を時間領域の信号に変換して前記第2信号と推定される時間領域の推定第2信号を抽出し、
抽出された前記時間領域の推定第2信号の分散値、前記観測信号の分散値から前記推定第2信号の分散値を差し引いて得られる前記第1信号の分散値、並びに前記複数チャネルの観測信号を用いて、有色駆動源付カルマンフィルタにより、前記第1信号または前記第2信号を推定する
多チャネル信号処理方法。 - コンピュータを、請求項1〜請求項7のいずれか1項記載のステレオ信号処理装置を構成する各手段として機能させるための多チャネル信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012070301A JP5971646B2 (ja) | 2012-03-26 | 2012-03-26 | 多チャネル信号処理装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012070301A JP5971646B2 (ja) | 2012-03-26 | 2012-03-26 | 多チャネル信号処理装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013201722A true JP2013201722A (ja) | 2013-10-03 |
JP5971646B2 JP5971646B2 (ja) | 2016-08-17 |
Family
ID=49521581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012070301A Active JP5971646B2 (ja) | 2012-03-26 | 2012-03-26 | 多チャネル信号処理装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5971646B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015143805A (ja) * | 2014-01-31 | 2015-08-06 | ブラザー工業株式会社 | 雑音抑圧装置、雑音抑圧方法、及びプログラム |
JP2019047460A (ja) * | 2017-09-07 | 2019-03-22 | 日本放送協会 | 音響信号用の制御器設計装置及びプログラム |
WO2022049741A1 (ja) * | 2020-09-04 | 2022-03-10 | 公立大学法人公立諏訪東京理科大学 | 打音診断支援装置、打音診断支援方法、打音診断支援システム、及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7186386B2 (ja) * | 2017-10-26 | 2022-12-09 | 学校法人東京理科大学 | 信号処理装置、方法、及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07319488A (ja) * | 1994-05-19 | 1995-12-08 | Sanyo Electric Co Ltd | ステレオ信号処理回路 |
JP2006330389A (ja) * | 2005-05-26 | 2006-12-07 | Matsushita Electric Works Ltd | 音声認識装置 |
JP2009069425A (ja) * | 2007-09-12 | 2009-04-02 | Sharp Corp | 音楽検出装置、音声検出装置、および音場制御装置 |
JP2009251134A (ja) * | 2008-04-03 | 2009-10-29 | Toshiba Corp | 音声/非音声を判定する装置、方法およびプログラム |
-
2012
- 2012-03-26 JP JP2012070301A patent/JP5971646B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07319488A (ja) * | 1994-05-19 | 1995-12-08 | Sanyo Electric Co Ltd | ステレオ信号処理回路 |
JP2006330389A (ja) * | 2005-05-26 | 2006-12-07 | Matsushita Electric Works Ltd | 音声認識装置 |
JP2009069425A (ja) * | 2007-09-12 | 2009-04-02 | Sharp Corp | 音楽検出装置、音声検出装置、および音場制御装置 |
JP2009251134A (ja) * | 2008-04-03 | 2009-10-29 | Toshiba Corp | 音声/非音声を判定する装置、方法およびプログラム |
Non-Patent Citations (1)
Title |
---|
JPN6015040635; 寺島 大雅 Hiromasa TERASHIMA: 'DSPを用いた雑音抑圧法のための有色性駆動源カルマンフィルタアルゴリズム Kalman Filter Algorithm wi' FIT2011 第10回情報科学技術フォーラム 講演論文集 第2分冊 査読付き論文・一般論文 データ , 20110822, p.241-245 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015143805A (ja) * | 2014-01-31 | 2015-08-06 | ブラザー工業株式会社 | 雑音抑圧装置、雑音抑圧方法、及びプログラム |
JP2019047460A (ja) * | 2017-09-07 | 2019-03-22 | 日本放送協会 | 音響信号用の制御器設計装置及びプログラム |
WO2022049741A1 (ja) * | 2020-09-04 | 2022-03-10 | 公立大学法人公立諏訪東京理科大学 | 打音診断支援装置、打音診断支援方法、打音診断支援システム、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5971646B2 (ja) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5375400B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
JP4496186B2 (ja) | 音源分離装置、音源分離プログラム及び音源分離方法 | |
JP5284360B2 (ja) | 周囲信号を抽出するための重み付け係数を取得する装置および方法における周囲信号を抽出する装置および方法、並びに、コンピュータプログラム | |
JP5435204B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP5791092B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP5724044B2 (ja) | 多重チャネル・オーディオ信号の符号化のためのパラメトリック型符号化装置 | |
WO2009046225A2 (en) | Correlation-based method for ambience extraction from two-channel audio signals | |
WO2009110574A1 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
KR101803293B1 (ko) | 입체 음향 효과를 제공하는 신호 처리 장치 및 신호 처리 방법 | |
JP6019969B2 (ja) | 音響処理装置 | |
WO2009110578A1 (ja) | 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体 | |
US9031248B2 (en) | Vehicle engine sound extraction and reproduction | |
KR101710544B1 (ko) | 스펙트럼 무게 발생기를 사용하는 주파수-영역 처리를 이용하는 스테레오 레코딩 분해를 위한 방법 및 장치 | |
JP5971646B2 (ja) | 多チャネル信号処理装置、方法、及びプログラム | |
EP3113508B1 (en) | Signal-processing device, method, and program | |
KR20190085988A (ko) | 상관해제 필터들의 적응적 제어를 위한 방법 및 장치 | |
KR101485462B1 (ko) | 후방향 오디오 채널의 적응적 리마스터링 장치 및 방법 | |
JP2016536856A (ja) | 二つ以上の基本信号からのマルチチャンネル信号の導出 | |
JP2008216721A (ja) | 雑音抑圧の方法、装置、及びプログラム | |
US8675881B2 (en) | Estimation of synthetic audio prototypes | |
JP5413575B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP6011536B2 (ja) | 信号処理装置、信号処理方法、およびコンピュータ・プログラム | |
JP3831220B2 (ja) | 雑音抑圧方法及びその装置、雑音抑圧プログラム並びにそのプログラム記録媒体 | |
KR101096091B1 (ko) | 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법 | |
Lee et al. | Single-channel speech separation using zero-phase models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160705 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5971646 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |