JP2012163676A - 音響処理装置 - Google Patents
音響処理装置 Download PDFInfo
- Publication number
- JP2012163676A JP2012163676A JP2011022633A JP2011022633A JP2012163676A JP 2012163676 A JP2012163676 A JP 2012163676A JP 2011022633 A JP2011022633 A JP 2011022633A JP 2011022633 A JP2011022633 A JP 2011022633A JP 2012163676 A JP2012163676 A JP 2012163676A
- Authority
- JP
- Japan
- Prior art keywords
- band
- normality
- component
- acoustic
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Engineering & Computer Science (AREA)
- Stereophonic System (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
Abstract
【解決手段】変化度算定部42は、音響信号x(t)の複数の帯域成分X[k,m]の各々について、音響信号x(t)の強度分布の非正規性と音響信号x(t)から当該帯域成分X[k,m]を除去した場合の強度分布の非正規性との相違を示す非正規性変化度V[k,m]を算定する。要素値設定部44は、複数の帯域成分X[k,m]の各々について当該帯域成分X[k,m]の非正規性変化度V[k,m]に応じた要素値g[k,m]を設定する。信号処理部36は、音響信号x(t)の各帯域成分X[k,m]に当該帯域成分X[k,m]の要素値g[k,m]を作用させる。
【選択図】図1
Description
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。図1に示すように、音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号x(t)を音響処理装置100に供給する。音響信号x(t)は、以下の数式(1)で表現されるように、相異なる発音源から発音された音響成分xA(t)と音響成分xB(t)との混合音の波形を示す時間領域信号(t:時間)である。例えば、音響成分xA(t)は歌唱音や発話音等の音声であり、音響成分xB(t)は楽器の演奏音等の複数種の楽音の混合音である。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
本発明の第3実施形態を説明する。第3実施形態では、第2実施形態の数値列生成部34が図5の数値列生成部34Aに置換される。図5に示すように、数値列生成部34Aは、変化度算定部42と要素値設定部44と類否指標算定部46とを含んで構成される。変化度算定部42は、第2実施形態と同様に、音響信号xL(t)と音響信号xR(t)とに応じた各帯域W[k]の非正規性変化度V[k,m](V[1,m]〜V[K,m])を単位期間毎に生成する。
本発明の第4実施形態を説明する。第4実施形態では、第2実施形態の数値列生成部34が図6の数値列生成部34Bに置換される。図6に示すように、数値列生成部34Bは、変化度算定部42と要素値設定部44と類否指標算定部46と帯域選択部48とを含んで構成される。
本発明の第5実施形態を説明する。第5実施形態では、第1実施形態の数値列生成部34が図7の数値列生成部34Cに置換される。図7に示すように、数値列生成部34Cは、変化度算定部42と要素値設定部44と閾値設定部52とを含んで構成される。
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
前述の各形態では、1個の単位期間毎に非正規性変化度V[k,m]を算定したが、複数(M個)の単位期間にわたる(M×K)個の帯域成分X[k,m]から非正規性変化度V[k,m]を算定することも可能である。すなわち、非正規性変化度V[k,m]は、(M×K)個の帯域成分X[k,m]の強度分布の非正規性と、(M×K)個から特定の帯域成分X[k,m]を除去した場合の強度分布の非正規性との相違を示す指標として各帯域W[k]について単位期間毎に算定される。
前述の各形態では、非正規性が高い音響成分xA(t)を強調するとともに非正規性が低い音響成分xB(t)を抑圧したが、音響成分xA(t)を抑圧するとともに音響成分xB(t)を強調する構成も実現される。具体的には、図3の処理SA13の判定において、選択帯域成分X[k,m]の非正規性変化度V[k,m]が閾値Vthを上回る場合(選択帯域成分X[k,m]にて音響成分xA(t)が優勢である場合)に要素値g[k,m]を数値γ0に設定し、非正規性変化度V[k,m]が閾値Vthを下回る場合(選択帯域成分X[k,m]にて音響成分xB(t)が優勢である場合)に要素値g[k,m]を数値γ1に設定すれば、音響成分xA(t)の抑圧と音響成分xB(t)の強調とが実現される。
音響信号x(t)の強度分布の非正規性の指標となる統計量は尖度κに限定されない。例えば、以下の数式(10)で定義されるネゲントロピーJを強度分布の非正規性の指標として利用することが可能である。
以上の各形態では、帯域成分X[k,m]の実際の強度分布(強度z[k]の数値分布)から非正規性変化度V[k,m]を算定したが、実際の強度z[k]のみを使用した構成では、強度z[k]の数値が過度に変動して音源分離の精度が低下するという問題や、尖度κ等の高次統計量を算定する場合に外れ値に脆弱であるという問題がある。そこで、帯域成分X[k,m]の強度分布を各種の確率分布で近似して非正規性変化度V[k,m]を算定する構成が好適である。
要素値g[k,m]の数値は任意である。例えば、数値γ0を0を上回る数値に設定し、数値γ1を1未満の数値や1以上の数値に設定した構成も採用され得る。また、要素値g[k,m]を2値的に設定する構成は本発明において必須ではない。例えば、要素値g[k,m]を0以上かつ1以下の範囲内で非正規性変化度V[k,m]に応じて多値的(3値以上)に設定することも可能である。すなわち、以上の各形態の要素値設定部44は、非正規性変化度V[k,m]に応じた要素値g[k,m]を設定する要素として包括され、要素値g[k,m]の設定方法(非正規性変化度V[k,m]との関係)や要素値g[k,m]の数値範囲は任意に選定される。
第2実施形態から第4実施形態では、音響信号xL(t)のK個の強度z[1]〜z[K]と音響信号xR(t)のK個の強度z[1]〜z[K]とを含む2K個の強度について数式(9)の演算を実行することでK個の非正規性変化度V[k,m](V[1,m]〜V[K,m])を算定したが、ステレオ形式の音響信号x(t)に応じた非正規性変化度V[k,m]を算定する方法は適宜に変更される。例えば、音響信号xL(t)と音響信号xR(t)とを加算した信号のK個の強度z[1]〜z[K]について数式(9)の演算を実行してK個の非正規性変化度V[k,m]を算定する構成や、音響信号xL(t)および音響信号xR(t)の一方の強度z[1]〜z[K]について数式(9)の演算を実行してK個の非正規性変化度V[k,m]を算定する構成も採用され得る。
第2実施形態から第4実施形態では左右2チャネルの音響信号x(t)を例示したが、音響信号x(t)が3チャネル以上である場合にも第2実施形態から第4実施形態は適用される。例えば第3実施形態や第4実施形態の音響信号x(t)をNtチャネル(Nt≧3)で構成した場合(5.1チャネルであればNt=6)、Ntチャネルの全部を対象として類否指標λ[k,m]を算定する構成や、Ntチャネルから選択されたNチャネル(N<Nt)の間で類否指標λ[k,m]を算定する構成が採用され得る。
Claims (5)
- 音響信号の強度分布の非正規性と前記音響信号から特定の帯域成分を除去した場合の強度分布の非正規性との相違を示す非正規性変化度を算定する変化度算定手段と、
前記非正規性変化度に応じて要素値を設定する要素値設定手段と、
前記帯域成分に前記要素値を作用させる信号処理手段と
を具備する音響処理装置。 - 前記変化度算定手段は、前記音響信号の複数の帯域の各々について非正規性変化度を算定し、
前記要素値設定手段は、前記複数の帯域の各々について当該帯域の非正規性変化度に応じて要素値を設定し、
前記信号処理手段は、前記複数の帯域成分の各々に当該帯域の要素値を作用させる
請求項1の音響処理装置。 - 前記音響信号を構成するステレオ形式の第1音響信号と第2音響信号との間で前記各帯域成分の類否を示す類否指標を算定する類否指標算定手段を具備し、
前記変化度算定手段は、前記音響信号の帯域毎に非正規性変化度を算定し、
前記要素値設定手段は、各帯域の非正規性変化度と当該帯域の類否指標とに応じた要素値を設定し、
前記信号処理手段は、前記第1音響信号および前記第2音響信号の各々の各帯域成分に前記当該帯域の要素値を作用させる
請求項2の音響処理装置。 - 前記音響信号を構成するステレオ形式の第1音響信号と第2音響信号との間で前記各帯域成分の類否を示す類否指標を算定する類否指標算定手段と、
前記類否指標に応じて帯域を選択する帯域選択手段とを具備し、
前記変化度算定手段は、前記複数の帯域のうち前記帯域選択手段が選択した帯域について非正規性変化度を算定する
請求項2の音響処理装置。 - 前記音響信号の複数の処理帯域の各々について閾値を設定する閾値設定手段を具備し、
前記変化度算定手段は、前記複数の処理帯域の各々について、当該処理帯域内の帯域成分毎に、当該処理帯域内の強度分布の非正規性と当該処理帯域から当該帯域成分を除去した場合の強度分布の非正規性との相違を示す非正規性変化度を算定し、
前記要素値設定手段は、前記複数の処理帯域の各々について、当該処理帯域内の帯域成分毎に、当該帯域成分の前記非正規性変化度と当該処理帯域について前記閾値設定手段が設定した閾値との比較の結果に応じて要素値を算定する
請求項2の音響処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011022633A JP5621637B2 (ja) | 2011-02-04 | 2011-02-04 | 音響処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011022633A JP5621637B2 (ja) | 2011-02-04 | 2011-02-04 | 音響処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012163676A true JP2012163676A (ja) | 2012-08-30 |
JP5621637B2 JP5621637B2 (ja) | 2014-11-12 |
Family
ID=46843133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011022633A Expired - Fee Related JP5621637B2 (ja) | 2011-02-04 | 2011-02-04 | 音響処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5621637B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017141542A1 (ja) * | 2016-02-16 | 2017-08-24 | 日本電信電話株式会社 | マスク推定装置、マスク推定方法及びマスク推定プログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002078100A (ja) * | 2000-09-05 | 2002-03-15 | Nippon Telegr & Teleph Corp <Ntt> | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 |
JP2002523948A (ja) * | 1998-08-25 | 2002-07-30 | フォード、グローバル、テクノロジーズ、インコーポレーテッド | 信号中のインパルス成分と非インパルス成分を分離する方法及びその装置 |
JP2008252587A (ja) * | 2007-03-30 | 2008-10-16 | Mega Chips Corp | 信号処理装置 |
JP2010020013A (ja) * | 2008-07-09 | 2010-01-28 | Nara Institute Of Science & Technology | 雑音抑圧評価装置およびプログラム |
JP2010020012A (ja) * | 2008-07-09 | 2010-01-28 | Nara Institute Of Science & Technology | 雑音抑圧装置およびプログラム |
JP2010271411A (ja) * | 2009-05-19 | 2010-12-02 | Nara Institute Of Science & Technology | 雑音抑圧装置およびプログラム |
-
2011
- 2011-02-04 JP JP2011022633A patent/JP5621637B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002523948A (ja) * | 1998-08-25 | 2002-07-30 | フォード、グローバル、テクノロジーズ、インコーポレーテッド | 信号中のインパルス成分と非インパルス成分を分離する方法及びその装置 |
JP2002078100A (ja) * | 2000-09-05 | 2002-03-15 | Nippon Telegr & Teleph Corp <Ntt> | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 |
JP2008252587A (ja) * | 2007-03-30 | 2008-10-16 | Mega Chips Corp | 信号処理装置 |
JP2010020013A (ja) * | 2008-07-09 | 2010-01-28 | Nara Institute Of Science & Technology | 雑音抑圧評価装置およびプログラム |
JP2010020012A (ja) * | 2008-07-09 | 2010-01-28 | Nara Institute Of Science & Technology | 雑音抑圧装置およびプログラム |
JP2010271411A (ja) * | 2009-05-19 | 2010-12-02 | Nara Institute Of Science & Technology | 雑音抑圧装置およびプログラム |
Non-Patent Citations (3)
Title |
---|
CSNG200600443001; 半田晶寛他: '"周波数領域ICAの後処理としてWienerフィルタを用いた短時間混合音声の分離"' 情報処理学会研究報告 Vol.2006,No.12, 200602, pp.1-6 * |
JPN6013004064; 坂本真一他: '"短時間平均音圧レベルの出現頻度分布を用いた騒音のレベルと変動量の推定"' 騒音制御 Vol.25,No.6, 200112, pp.388-399, 日本騒音制御工学会 * |
JPN6013028116; 半田晶寛他: '"周波数領域ICAの後処理としてWienerフィルタを用いた短時間混合音声の分離"' 情報処理学会研究報告 Vol.2006,No.12, 200602, pp.1-6 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017141542A1 (ja) * | 2016-02-16 | 2017-08-24 | 日本電信電話株式会社 | マスク推定装置、マスク推定方法及びマスク推定プログラム |
JPWO2017141542A1 (ja) * | 2016-02-16 | 2018-07-12 | 日本電信電話株式会社 | マスク推定装置、マスク推定方法及びマスク推定プログラム |
US10878832B2 (en) | 2016-02-16 | 2020-12-29 | Nippon Telegraph And Telephone Corporation | Mask estimation apparatus, mask estimation method, and mask estimation program |
Also Published As
Publication number | Publication date |
---|---|
JP5621637B2 (ja) | 2014-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7091411B2 (ja) | マルチチャネル信号の符号化方法およびエンコーダ | |
US10210883B2 (en) | Signal processing apparatus for enhancing a voice component within a multi-channel audio signal | |
JP5528538B2 (ja) | 雑音抑圧装置 | |
US8712074B2 (en) | Noise spectrum tracking in noisy acoustical signals | |
US9478232B2 (en) | Signal processing apparatus, signal processing method and computer program product for separating acoustic signals | |
CN110114827B (zh) | 使用可变阈值来分解音频信号的装置和方法 | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
JP6339896B2 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP2013130857A (ja) | 音響処理装置 | |
KR102427414B1 (ko) | 분리 특성으로서 비율을 사용하여 오디오 신호를 분해하기 위한 장치 및 방법 | |
JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
JP5915281B2 (ja) | 音響処理装置 | |
JP2023536104A (ja) | 機械学習を用いたノイズ削減 | |
JP5454330B2 (ja) | 音響処理装置 | |
JP5621637B2 (ja) | 音響処理装置 | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP2008072600A (ja) | 音響信号処理装置、音響信号処理プログラム、音響信号処理方法 | |
JP2006178333A (ja) | 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体 | |
JP5316127B2 (ja) | 音処理装置およびプログラム | |
JPWO2015093025A1 (ja) | 音声処理装置、音声処理方法、及び、音声処理プログラム | |
JP2014102318A (ja) | 雑音除去装置、雑音除去方法、及びプログラム | |
JP5321171B2 (ja) | 音処理装置およびプログラム | |
JP6554853B2 (ja) | 雑音抑圧装置及びプログラム | |
Anushiravani | Example-based audio editing | |
FitzGerald et al. | Improved stereo instrumental track recovery using median nearest-neighbour inpainting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140826 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140908 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5621637 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |