JP2013250380A - 音響処理装置 - Google Patents

音響処理装置 Download PDF

Info

Publication number
JP2013250380A
JP2013250380A JP2012124253A JP2012124253A JP2013250380A JP 2013250380 A JP2013250380 A JP 2013250380A JP 2012124253 A JP2012124253 A JP 2012124253A JP 2012124253 A JP2012124253 A JP 2012124253A JP 2013250380 A JP2013250380 A JP 2013250380A
Authority
JP
Japan
Prior art keywords
harmonic
component
acoustic signal
mask
cepstrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012124253A
Other languages
English (en)
Other versions
JP5772723B2 (ja
Inventor
Yu Takahashi
祐 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2012124253A priority Critical patent/JP5772723B2/ja
Priority to US13/904,185 priority patent/US20130322644A1/en
Publication of JP2013250380A publication Critical patent/JP2013250380A/ja
Application granted granted Critical
Publication of JP5772723B2 publication Critical patent/JP5772723B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

【課題】長時間の音響信号を必要とせずに調波成分または非調波成分を推定する。
【解決手段】特徴抽出部34は、音響信号SXのケプストラムC[n,t]を算定する。調波抑圧部36は、特徴抽出部34が算定したケプストラムC[n,t]のうち音響信号SXの調波構造に対応する高次域QBのピークを抑圧する。分離マスク生成部38は、音響信号SXの調波成分または非調波成分を抑圧する分離マスクを調波抑圧部36による処理結果に応じて生成する。信号処理部40は、分離マスク生成部38が生成した分離マスクを音響信号SXに作用させることで調波成分の周波数成分YH[f,t]と非調波成分の周波数成分YP[f,t]とを生成する。
【選択図】図1

Description

本発明は、音響信号を処理する技術に関する。
弦楽器の演奏音や人間の発声音等の調波成分と打楽器の演奏音等の非調波成分とが混合された音響信号を調波成分と非調波成分とに分離する技術が従来から提案されている。例えば非特許文献1や非特許文献2には、調波成分は時間軸方向に連続するのに対して非調波成分は周波数軸方向に連続するという相違(異方性)を仮定して、音響信号を調波成分と非調波成分とに分離する技術が開示されている。
しかし、非特許文献1や非特許文献2の技術では、音響信号の時間軸方向の連続性を評価する必要があるから、音響信号の特定の時点に関する調波/非調波の解析には、音響信号のうちその時点の前後の相応の時間長にわたる区間が必要である。したがって、音響信号の一時的な保持に必要な記憶容量(バッファ)が増大するという問題や、実時間的な処理が困難であるという問題がある。以上の事情を考慮して、本発明は、長時間にわたる音響信号を必要とせずに音響信号の調波成分または非調波成分を推定することを目的とする。
以上の課題を解決するために本発明が採用する手段を説明する。なお、本発明の理解を容易にするために、以下の説明では、本発明の各要素と後述の各実施形態の要素との対応を括弧書で付記するが、本発明の範囲を実施形態の例示に限定する趣旨ではない。
本発明に係る音響処理装置は、音響信号のケプストラムを算定する特徴抽出手段と、特徴抽出手段が算定したケプストラムのうち音響信号の調波構造に対応する高次域のピークを抑圧する調波抑圧手段と、音響信号の調波成分または非調波成分を抑圧する分離マスク(例えば調波推定マスクMH[t],非調波推定マスクMP[t])を調波抑圧手段による処理結果に応じて生成する分離マスク生成手段と、分離マスクを音響信号に作用させる信号処理手段とを具備する。以上の構成では、音響信号のケプストラムのうち調波成分の調波構造に対応する高次域のピークを抑圧した結果に応じて分離マスクが生成されるから、長時間にわたる音響信号を必要とせずに音響信号の調波成分または非調波成分を推定することが可能である。
本発明に係る音響処理装置の第1態様において、分離マスク生成手段は、音響信号の非調波成分を抑圧する調波推定マスクと調波成分を抑圧する非調波推定マスクとを分離マスクとして生成し、信号処理手段は、調波推定マスクを音響信号に作用させる第1処理手段(例えば第1処理部72A)と、非調波推定マスクを音響信号に作用させる第2処理手段(例えば第2処理部74A)とを含む。また、本発明に係る音響処理装置の第2態様において、分離マスク生成手段は、音響信号の非調波成分を抑圧する調波推定マスクを分離マスクとして生成し、信号処理手段は、調波推定マスクを音響信号に作用させて調波成分を推定する第1処理手段(例えば第1処理部72B)と、第1処理手段が推定した調波成分を音響信号から抑圧して非調波成分を推定する第2処理手段(例えば第2処理部74B)とを含む。
本発明の好適な態様において、分離マスク生成手段は、特徴抽出手段が算定したケプストラムの低次成分と調波抑圧手段がピークを抑圧した高次成分とを周波数領域に変換したスペクトル(例えば周波数成分E[f,t])と、音響信号のスペクトル(例えば周波数成分X[f,t])とに応じて分離マスクを生成する。以上の態様では、特徴抽出手段が算定したケプストラムの低次成分を高次成分とともに変換したスペクトルと音響信号のスペクトルとに応じて分離マスクが生成されるから、音響信号の包絡構造を処理前後で充分に維持することが可能である。
本発明の好適な態様において、調波抑圧手段は、高次域のケプストラムを0に近付ける。高次域のケプストラムを0に近付ける処理は、音響信号の振幅スペクトルのうち調波成分に対応する微細構造を抑圧する処理(すなわち振幅スペクトルを周波数軸方向に平滑化する処理)に相当する。非調波成分は周波数軸方向に連続するという傾向があるから、高次域のケプストラムを0に近付ける構成によれば、調波成分または非調波成分の分離精度を改善できるという利点がある。また、高次域のケプストラムを0に置換する構成によれば、調波抑圧手段の処理が簡素化されるという利点や、周波数領域への変換時に高次域に関する演算を省略できる(したがって処理負荷が軽減される)という利点がある。更に好適な態様において、調波抑圧手段は、高次域のうち低次側の第1範囲(例えば範囲QB1)についてはケフレンシの増加に対して連続的に変化する加重値によりケプストラムを調整して各ピークを抑圧し、高次域のうち第1範囲に対して高次側の第2範囲(例えば範囲QB2)についてはケプストラムを0に近付ける(例えば0または0付近の数値に置換する)。
本発明の好適な態様において、調波抑圧手段は、高次域のうち音響信号の音高に対応する特定の範囲内についてピークの抑圧を実行する。以上の態様では、高次域のうち音響信号の音高に応じた特定の範囲内についてピークの抑圧が実行されるから、高次域の全範囲にわたりピークを抑圧する構成と比較して、調波抑圧手段の処理負荷が軽減されるという利点がある。
本発明は、分離マスクを生成する音響処理装置(分離マスク生成装置)としても実施され得る。すなわち、本発明の別の態様に係る音響処理装置は、音響信号のケプストラムのうち音響信号の調波構造に対応する高次域のピークを抑圧する調波抑圧手段と、音響信号の調波成分または非調波成分を抑圧する分離マスクを調波抑圧手段による処理結果に応じて生成する分離マスク生成手段とを具備する。以上の構成によれば、長時間にわたる音響信号を必要とせずに分離マスクを生成することが可能である。
前述の各態様に係る係数設定装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)等のハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。本発明のプログラムは、音響信号のケプストラムを算定する特徴抽出処理と、特徴抽出処理で算定したケプストラムのうち音響信号の調波構造に対応する高次域のピークを抑圧する調波抑圧処理と、音響信号の調波成分または非調波成分を抑圧する分離マスクを調波抑圧処理の結果に応じて生成する分離マスク生成処理と、分離マスクを音響信号に適用する信号処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の係数設定装置と同様の作用および効果が実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされるほか、通信網を介した配信の形態で提供されてコンピュータにインストールされる。
第1実施形態に係る音響処理装置のブロック図である。 ケプストラムの低次域および高次域の説明図である。 第1実施形態の音響処理装置における調波抑圧部,分離マスク生成部および信号処理部のブロック図である。 第2実施形態の音響処理装置における調波抑圧部,分離マスク生成部および信号処理部のブロック図である。 第3実施形態の音響処理装置における調波抑圧部,分離マスク生成部および信号処理部のブロック図である。 変形例におけるピーク抑圧の説明図である。
<第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。音響処理装置100には信号供給装置200が接続される。信号供給装置200は、音響信号SXを音響処理装置100に供給する。音響信号SXは、調波成分と非調波成分との混合音の波形を示す時間領域信号である。調波成分は、弦楽器または管楽器等の楽器の演奏音や人間の発声音等の調波性の音響成分を意味し、非調波成分は、打楽器の演奏音や各種の雑音(例えば空調設備の動作音や人混み内の雑踏音等の環境音)等の非調波性の音響成分を意味する。例えば、周囲の音響を収音して音響信号SXを生成する収音機器や、可搬型または内蔵型の記録媒体から音響信号SXを取得して音響処理装置100に供給する再生装置や、通信網から音響信号SXを受信して音響処理装置100に供給する通信装置が信号供給装置200として採用され得る。
音響処理装置100は、信号供給装置200が供給する音響信号SXから音響信号SHおよび音響信号SPを生成する。音響信号SH(H:Harmonic)は、音響信号SXの調波成分を推定(非調波成分を抑圧)した時間領域信号であり、音響信号SP(P:Percussive)は、音響信号SXの非調波成分を推定(調波成分を抑圧)した時間領域信号である。音響処理装置100が生成した音響信号SHおよび音響信号SPは、例えば選択的に放音装置(図示略)に供給されることで音波として放音される。
図1に示すように、音響処理装置100は、演算処理装置12と記憶装置14とを具備するコンピュータシステムで実現される。記憶装置14は、演算処理装置12が実行するプログラムPGMや演算処理装置12が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体や複数種の記録媒体の組合せが記憶装置14として任意に採用され得る。音響信号SXを記憶装置14に記憶した構成(したがって信号供給装置200は省略される)も好適である。
演算処理装置12は、記憶装置14に格納されたプログラムPGMを実行することで、音響信号SXから音響信号SHおよび音響信号SPを生成するための複数の機能(周波数分析部32,特徴抽出部34,調波抑圧部36,分離マスク生成部38,信号処理部40,波形生成部42)を実現する。なお、演算処理装置12の各機能を複数の装置に分散した構成や、演算処理装置12の一部の機能を専用の電子回路(DSP)が分担する構成も採用され得る。
周波数分析部32は、音響信号SXの各周波数成分(周波数スペクトル)X[f,t]を時間軸上の単位区間毎に順次に算定する。記号fは、周波数軸上の1個の周波数(周波数ビン)を意味し、記号tは、時間軸上の1個の時点(単位区間)を意味する。各周波数成分X[f,t]の算定には、短時間フーリエ変換等の公知の周波数分析が任意に採用される。
特徴抽出部34は、音響信号SXのケプストラムC[n,t]を単位区間毎に順次に算定する。ケプストラムC[n,t]は、以下の数式(1)で表現されるように、周波数分析部32が算定した周波数成分X[f,t](振幅|X[f,t]|)の対数の離散フーリエ変換で算定される。
Figure 2013250380
数式(1)の記号nは、任意の1個のケフレンシ(quefrency)を意味し、記号Nは、離散フーリエ変換の点数を意味する。なお、数式(1)では実数ケプストラムの算定を例示したが、複素ケプストラムを算定することも可能である。
図2に示すように、音響信号SXのケプストラムC[c,t]の低次域(ケフレンシが低い領域)QAは、音響信号SXの振幅スペクトルの概略的な構造(以下「包絡構造」という)に対応し、高次域(ケフレンシが高い領域)QBは、音響信号SXの振幅スペクトルの微細な周期構造(以下「微細構造」という)に対応する。音響信号SXに含まれる調波成分の調波構造(基音成分と複数の倍音成分とが周波数軸上に等間隔に配列された倍音構造)は微細な周期構造である。したがって、調波成分の調波構造は、ケプストラムC[c,t]の高次域QBに優勢に反映されるという傾向がある。
図3は、第1実施形態における調波抑圧部36,分離マスク生成部38および信号処理部40のブロック図である。調波抑圧部36は、特徴抽出部34が算定したケプストラムC[n,t]のうち微細構造に対応する高次域QBのピークを抑圧する要素であり、図3に例示されるように成分抽出部52Aと抑圧処理部54Aとを含んで構成される。成分抽出部52Aは、音響信号SXのケプストラムC[n,t]から高次域QBの成分(以下「高次成分」という)CB[n,t]を抽出(リフタリング)する。具体的には、成分抽出部52Aは、以下の数式(2)で表現されるように、ケフレンシnが所定の閾値L(図2参照)を下回る低次域QAのケプストラムC[n,t]を0に置換することで高次成分CB[n,t]を算定する。
Figure 2013250380
低次域QAと高次域QBとの境界に相当する閾値Lは、例えば、音響信号SXに想定される主要な調波成分のケプストラムC[n,t]が高次域QBに属するように実験的または統計的に事前に選定される。
図3の抑圧処理部54Aは、成分抽出部52Aが生成した高次成分CB[n,t]のピークを抑圧することで調波抑圧成分(ケプストラム)D[n,t]を生成する。前述のように音響信号SXの微細構造はケプストラムC[n,t]の高次域QBに優勢に寄与し、微細構造は、音響信号SXに含まれる調波成分の調波構造に基本的には由来する。すなわち、高次成分CB[n,t]のピークは音響信号SXの調波成分の調波構造に対応するという傾向がある。したがって、高次成分CB[n,t]のピークを抑圧した調波抑圧成分D[n,t]は、音響信号SXの調波成分を抑圧した成分に相当する。
第1実施形態の抑圧処理部54Aは、以下の数式(3)で表現されるメディアンフィルタで調波抑圧成分D[n,t]を生成する。
Figure 2013250380
数式(3)の関数median{ }は、1個のケフレンシnを中心とする(2ν+1)個のケフレンシにわたる高次成分{CB[n-ν,t]〜CB[n+ν,t]}の中央値(メディアン)を意味する。したがって、高次成分CB[n,t]のピークを抑圧した調波抑圧成分D[n,t]が生成される。
図3の分離マスク生成部38は、音響信号SXを調波成分と非調波成分とに分離するための分離マスクを調波抑圧部36による処理結果(調波抑圧成分D[n,t])に応じて単位区間毎に順次に生成する。第1実施形態の分離マスク生成部38は、音響信号SXのうち非調波成分を抑圧して調波成分を抽出する分離マスク(以下「調波推定マスク」という)MH[t]と、音響信号SXのうち調波成分を抑圧して非調波成分を抽出する分離マスク(以下「非調波推定マスク」という)MP[t]とを単位区間毎に生成する。図3に示すように、第1実施形態の分離マスク生成部38は、周波数変換部62Aと生成処理部64Aとを含んで構成される。
周波数変換部62Aは、成分抽出部52Aが生成した高次成分CB[n,t]と抑圧処理部54Aが生成した調波抑圧成分D[n,t]とを周波数領域のスペクトルに変換する。ケプストラムをスペクトルに変換する処理は、例えば指数変換と離散フーリエ変換とを含んで構成される。具体的には、周波数変換部62Aは、高次成分CB[n,t]に対する以下の数式(4)の演算で周波数成分A[f,t]を算定し、調波抑圧成分D[n,t]に対する以下の数式(5)の演算で周波数成分B[f,t]を算定する。
Figure 2013250380
Figure 2013250380
以上の説明から理解されるように、周波数成分A[f,t]は、音響信号SXの振幅スペクトルから包絡構造(低次域QAのケプストラムC[n,t])を抑圧した振幅スペクトル(すなわち、調波成分および非調波成分の双方の微細構造を抽出した振幅スペクトル)に相当する。他方、周波数成分B[f,t]は、音響信号SXの振幅スペクトルから抽出された微細構造のうち調波成分の調波構造を抑圧した振幅スペクトル(すなわち、非調波成分の微細構造を抽出した振幅スペクトル)に相当する。
図3の生成処理部64Aは、周波数変換部62Aが生成した周波数成分A[f,t]および周波数成分B[f,t]を利用して調波推定マスクMH[t]と非調波推定マスクMP[t]とを単位区間毎に生成する。調波推定マスクMH[t]は、相異なる周波数に対応する複数の処理係数GH[f,t]の数値列である。同様に、非調波推定マスクMP[t]は、相異なる周波数に対応する複数の処理係数GP[f,t]の数値列である。処理係数GH[f,t]および処理係数GP[f,t]は、音響信号SXの周波数成分X[f,t]に対するゲイン(スペクトルゲイン)に相当し、0以上かつ1以下の範囲内で可変に設定される。
具体的には、第1実施形態の生成処理部64Aは、以下の数式(6)の演算で非調波推定マスクMP[t]の各処理係数GP[f,t]を算定し、以下の数式(7)の演算で調波推定マスクMH[t]の各処理係数GH[f,t]を算定する。
Figure 2013250380
Figure 2013250380
前述の通り、周波数成分A[f,t]は、調波成分および非調波成分の双方の微細構造を抽出した振幅スペクトルに相当し、周波数成分B[f,t]は、微細構造から調波成分の調波構造を抑制した振幅スペクトルに相当するから、調波成分が優勢な周波数fでは周波数成分B[f,t]が周波数成分A[f,t]と比較して小さい数値となり、非調波成分が優勢な周波数fほど周波数成分B[f,t]は周波数成分A[f,t]に近付く。したがって、数式(6)から理解されるように、調波成分が優勢な周波数f(すなわち調波成分に該当する可能性が高い周波数f)ほど処理係数GP[f,t]は1以下の範囲内で小さい数値となり、非調波成分が優勢な周波数fほど処理係数GP[f,t]は1に近付く。また、数式(7)から理解されるように、非調波成分が優勢な周波数f(すなわち処理係数GP[f,t]が大きい周波数f)ほど処理係数GH[f,t]は1以下の範囲内で小さい数値となり、調波成分が優勢な周波数fほど処理係数GH[f,t]は1に近付く。
図1の信号処理部40は、分離マスク生成部38が生成した分離マスク(調波推定マスクMH[t],非調波推定マスクMP[t])を音響信号SXに作用させることで音響信号SHの各周波数成分YH[f,t]と音響信号SPの各周波数成分YP[f,t]とを生成する。図3に示すように、第1実施形態の信号処理部40は、周波数成分YH[f,t]を生成する第1処理部72Aと周波数成分YP[f,t]を生成する第2処理部74Aとを含んで構成される。
第1処理部72Aは、調波推定マスクMH[t]を音響信号SXの周波数成分X[f,t]に作用させることで音響信号SHの周波数成分YH[f,t]を算定する。具体的には、第1処理部72Aは、以下の数式(8)のように、調波推定マスクMH[t]の各処理係数GH[f,t]を周波数成分X[f,t]に乗算することで周波数成分YH[f,t]を算定する。
Figure 2013250380
調波成分が非調波成分に対して優勢な周波数fほど処理係数GH[f,t]は大きい数値に設定されるから、数式(8)の演算で算定される周波数成分YH[f,t]は、音響信号SXの非調波成分を抑圧して調波成分を抽出したスペクトルに相当する。
第2処理部74Aは、非調波推定マスクMP[t]を音響信号SXの周波数成分X[f,t]に作用させることで音響信号SPの周波数成分YP[f,t]を算定する。具体的には、第2処理部74Aは、以下の数式(9)のように、非調波推定マスクMP[t]の各処理係数GP[f,t]を周波数成分X[f,t]に乗算することで周波数成分YP[f,t]を算定する。
Figure 2013250380
非調波成分が調波成分に対して優勢な周波数fほど処理係数GP[f,t]は大きい数値に設定されるから、数式(9)の演算で算定される周波数成分YP[f,t]は、音響信号SXの調波成分を抑圧して非調波成分を抽出したスペクトルに相当する。
図1の波形生成部42は、信号処理部40が生成する周波数成分YH[f,t]に対応する音響信号SHと周波数成分YP[f,t]に対応する音響信号SPとを生成する。具体的には、波形生成部42は、単位区間毎の周波数成分YH[f,t]を短時間逆フーリエ変換で時間領域信号に変換して前後の単位区間について相互に連結することで音響信号SHを生成する。音響信号SPも同様の方法で各周波数成分YP[f,t]から生成される。
以上に説明した通り、第1実施形態では、音響信号SXのケプストラムC[n,t]のうち調波成分の調波構造に対応する高次域QBのピークを抑圧した結果(調波抑圧成分D[n,t])に応じて分離マスク(調波推定マスクMH[t],非調波推定マスクMP[t])が生成されるから、長時間にわたる音響信号SXを必要とせずに音響信号SXの調波成分または非調波成分を推定することが可能である。したがって、音響信号SXの一時的な保持に必要な記憶容量(バッファ)を削減できるという利点や、処理遅延を充分に低減した実時間的な処理が可能であるという利点がある。
なお、非特許文献1や非特許文献2の技術では、時間軸方向に連続する音響成分を調波成分と推定するとともに周波数軸方向に連続する音響成分を非調波成分と推定して両成分が分離されるから、時間軸方向および周波数軸方向の双方に連続する成分(例えばハイハットドラムの演奏音)を適切に処理できないという問題がある。第1実施形態では、音響信号SXのケプストラムC[n,t]のうち調波成分の調波構造に対応する高次域QBのピークを抑圧することで分離マスクが生成されるから、時間軸方向および周波数軸方向の双方に連続する音響成分も高精度に調波成分と非調波成分とに分離できるという利点がある。
また、第1実施形態では、微細構造に対応する高次域QB内のケプストラムC[n,t]のピークを抑圧した調波抑圧成分D[n,t]から分離マスクが生成されるから、音響信号SXの包絡構造は分離処理の前後で維持される。したがって、音響信号SXの音質(包絡構造)を維持しながら音響信号SHおよび音響信号SPを生成できるという利点もある。
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図4は、第2実施形態における調波抑圧部36,分離マスク生成部38および信号処理部40のブロック図である。調波抑圧部36(成分抽出部52B,抑圧処理部54B)の構成および動作は第1実施形態と同様である。
第2実施形態の分離マスク生成部38は、周波数変換部62Bと生成処理部64Bとを含んで構成される。周波数変換部62Bは、第1実施形態の周波数変換部62Aと同様に、調波成分および非調波成分の双方の微細構造を推定した高次成分CB[n,t]の周波数成分A[f,t]と、高次成分CBから調波成分の微細構造を抑圧した調波抑圧成分D[n,t]の周波数成分B[f,t]とを生成する。生成処理部64Bは、非調波成分の微細構造の推定結果に相当する周波数成分B[f,t]を雑音成分として周波数成分A[f,t]から抑圧する(すなわち調波成分を推定する)ためのフィルタを調波推定マスクMH[t]として単位区間毎に生成する。
具体的には、生成処理部64Bは、以下の数式(10)で表現されるウィナー(Wiener)フィルタを調波推定マスクMH[t]の処理係数GH[f,t]として算定する。数式(10)の記号max( )は、括弧内の最大値を採択する演算子を意味し、処理係数GH[f,t]を非負数に設定するための演算である。
Figure 2013250380
なお、調波推定マスクMH[t]の生成方法は以上の例示に限定されない。例えば、MMSE-STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude estimator)やMMSE-LSA(MMSE - Log Spectral Amplitude estimator)で生成された雑音抑圧用のフィルタを調波推定マスクMH[t]として生成する構成や、仮決定法(DD:Decision-Directed)で推定された事前SNRに応じた雑音抑圧用のフィルタを調波推定マスクMH[t]として生成する構成も採用され得る。
図4に示すように、第2実施形態の信号処理部40は、第1処理部72Bと第2処理部74Bとを含んで構成される。第1処理部72Bは、第1実施形態の第1処理部72Aと同様に、分離マスク生成部38(生成処理部64B)が生成した調波推定マスクMH[t]を音響信号SXの周波数成分X[f,t]に作用させる(例えば調波推定マスクMH[t]を周波数成分X[f,t]に乗算する)ことで音響信号SHの周波数成分YH[f,t]を生成する。
第2処理部74Bは、第1処理部72Aが算定した周波数成分YH[f,t]を雑音成分として音響信号SXの周波数成分X[f,t]から抑圧する雑音抑圧処理で音響信号SPの周波数成分YP[f,t]を生成する。具体的には、第2処理部74Bは、周波数成分YH[f,t]の抑圧用(非調波成分の推定用)のフィルタを非調波推定マスクMP[t]として周波数成分X[f,t]と周波数成分YH[f,t]とから生成し(例えばGP[f,t]={|X[f,t]|2−|YH[f,t]|2}/|X[f,t]|2)、第1実施形態の第2処理部74Aと同様に非調波推定マスクMP[t]を周波数成分X[f,t]に作用させることで周波数成分YP[f,t]を算定する。なお、非調波推定マスクMP[t]の生成には、MMSE-STSAやMMSE-LSA等の公知の雑音抑圧技術も採用され得る。
第2実施形態においても第1実施形態と同様の効果が実現される。なお、以上の例示では、周波数成分A[f,t]から周波数成分B[f,t]を抑圧するためのフィルタを調波推定マスクMH[t]として生成したが、音響信号SXの周波数成分X[f,t]から周波数成分B[f,t]を抑圧するためのフィルタを調波推定マスクMH[t](例えばGH[f,t]={|X[f,t]|2−|B[f,t]|2}/|X[f,t]|2)として生成することも可能である。
<第3実施形態>
図5は、第3実施形態における調波抑圧部36,分離マスク生成部38および信号処理部40のブロック図である。第3実施形態の調波抑圧部36は、成分抽出部52Cと抑圧処理部54Cとを含んで構成される。成分抽出部52Cは、特徴抽出部34が算定したケプストラムC[n,t]から低次成分CA[n,t]と高次成分CB[n,t]とを抽出する。高次成分CB[n,t]は、第1実施形態と同様に、ケフレンシnが閾値Lを上回る高次域QBの成分であり、低次成分CA[n,t]は、ケフレンシnが閾値Lを下回る低次域QAの成分(すなわち、音響信号SXの包絡構造が優勢に反映される成分)である。抑圧処理部54Cは、第1実施形態の抑圧処理部54Aと同様に、高次成分CB[n,t]のピークを抑圧することで調波抑圧成分D[n,t]を生成する。
第3実施形態の分離マスク生成部38は、周波数変換部62Cと生成処理部64Cとを含んで構成される。周波数変換部62Cは、成分抽出部52Cが抽出した低次成分(すなわち特徴抽出部34が算定したケプストラムC[n,t]の低次域QA)CA[n,t]と調波抑圧部36(抑圧処理部54C)による処理後の調波抑圧成分D[n,t]との双方を周波数領域に変換した周波数成分(振幅スペクトル)E[f,t]を生成する。例えば、低次成分CA[n,t]と高次成分CB[n,t]とを合成したケプストラムを振幅スペクトルに変換する構成や、低次成分CA[n,t]を変換した振幅スペクトルと高次成分CB[n,t]を変換した振幅スペクトルとを合成する構成が採用される。
第1実施形態の周波数成分B[f,t]は、音響信号SXのうち包絡構造(低次成分CA[n,t])を除去した微細構造から調波成分の調波構造を抑圧した振幅スペクトルに相当するが、第3実施形態の周波数成分E[f,t]は、包絡構造および微細構造の双方を含む音響信号SXの全体から調波成分の調波構造を抑圧した振幅スペクトル(すなわち、調波成分および非調波成分の双方の包絡構造と非調波成分の微細構造とを反映した振幅スペクトル)に相当する。
第3実施形態の生成処理部64Cは、周波数変換部62Cが生成した周波数成分E[f,t]を雑音成分として音響信号SXの周波数成分X[f,t]から抑圧する(すなわち調波成分を推定する)ためのフィルタを調波推定マスクMH[t]として単位区間毎に生成する。例えば、生成処理部64Cは、以下の数式(11)で表現されるウィナーフィルタを調波推定マスクMH[t]の処理係数GH[f,t]として算定する。
Figure 2013250380
図5に示すように、第3実施形態の信号処理部40は、第1処理部72Cと第2処理部74Cとを含んで構成される。第1処理部72Cは、第2実施形態の第1処理部72Bと同様に、分離マスク生成部38(生成処理部64C)が生成した調波推定マスクMH[t]を音響信号SXの周波数成分X[f,t]に作用させることで音響信号SHの周波数成分YH[f,t]を生成する。第2処理部74Cは、第2実施形態の第2処理部74Bと同様に、第1処理部72Cが算定した周波数成分YH[f,t]を雑音成分として音響信号SXの周波数成分X[f,t]から抑圧する雑音抑圧処理で音響信号SPの周波数成分YP[f,t]を生成する。
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、特徴抽出部34が算定したケプストラムC[n,t]の低次成分CA[n,t]が高次成分CB[n,t]とともに調波推定マスクMH[t]の生成に利用されるから、低次成分CA[n,t]を加味しない第2実施形態と比較して、音響信号SXを高精度に調波成分と非調波成分とに分離できるという利点がある。
なお、ケプストラムC[n,t]の低次成分CA[n,t]を利用する第3実施形態の構成は、第1実施形態にも同様に適用され得る。例えば、分離マスク生成部38は、周波数成分E[f,t]と周波数成分X[f,t]とに応じて非調波推定マスクMP[t]を算定する(例えばGP[f,t]=E[f,t]/X[f,t])とともに数式(7)の演算で調波推定マスクMH[t]を算定する。信号処理部40は、周波数成分X[f,t]に非調波推定マスクMP[t]を作用させて音響信号SPを生成するとともに周波数成分X[f,t]に調波推定マスクMH[t]を作用させて音響信号SHを生成する。
<変形例>
以上の各形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)高次域QB内のケプストラムC[n,t]のピークを抑圧する方法は以上の例示(数式(3)のメディアンフィルタ)に限定されない。例えば、高次域QB内で所定の閾値を上回るケプストラムC[n,t]を閾値以下の数値に変更する閾値処理で高次域QB内のピークを抑圧することも可能である。ただし、数式(3)のメディアンフィルタを利用した構成によれば、閾値を設定する必要がない(したがって、閾値の適否により分離精度が変動する可能性がない)という利点がある。また、ケプストラムC[n,t]の移動平均の算定により高次域QB内のケプストラムC[n,t]を平滑化してピークを抑圧する構成も採用される。高次域QB内のケプストラムC[n,t]のピークを検出して各ピークを抑圧することも可能である。高次域QB内のピークの検出には、公知のピーク検出技術が任意に採用され得るが、例えば、高次域QB内のケプストラムC[n,t]を微分してケフレンシnに対する変動量を解析する方法が好適である。
第3実施形態では、特徴抽出部34が算定したケプストラムC[n,t]のうち高次域QBの成分を0に置換するとともに低次域QAの成分を維持することで調波抑圧部36が調波抑圧成分D'[n,t]を生成し、周波数変換部62Cが調波抑圧成分D'[n,t]を周波数領域に変換することで周波数成分E[f,t]を生成することも可能である。以上のように高次域QB内のケプストラムC[n,t]を0に置換する構成によれば、周波数変換部62Cによる周波数領域への変換時に高次域QBに関する演算が省略され得るから、周波数変換部62Cの処理負荷が軽減されるという利点がある。また、高次域QB内のケプストラムC[n,t]を0に置換する処理は、微細構造の除去(すなわち、周波数軸方向における振幅スペクトルの平滑化)に相当する。非特許文献1や非特許文献2に記載される通り、非調波成分は周波数軸方向に連続する傾向があるから、高次域QB内のケプストラムC[n,t]を0に置換することで振幅スペクトルを平滑化する構成によれば、調波成分と非調波成分との分離精度を改善することが可能である。以上に説明した振幅スペクトルの平滑化の効果は、高次域QB内のケプストラムC[n,t]を完全に0に置換する構成のほか、高次域QB内のケプストラムC[n,t]を0付近の所定値に置換する構成でも実現される。ケプストラムC[n,t]を0または0付近の数値に置換する処理は、ケプストラムC[n,t]を0に近付ける処理として包括される。
また、図6に例示されるように、所定の閾値QTHを境界として高次域QBを範囲QB1と範囲QB2とに区分し、範囲QB1および範囲QB2の各々にて別個の方法でピークを抑圧することも可能である。具体的には、調波抑圧部36は、以下の数式(12)で算定される加重値W[n]を高次域QB内のケプストラムC[n,t]に乗算したうえで範囲QB1内のピークを抑圧することで調波抑圧成分D'[n,t]を生成する。
Figure 2013250380
数式(12)および図6(実線)から把握されるように、高次域QBのうちケフレンシnが閾値QTHを下回る範囲QB1では、ケフレンシnの増加に対して加重値W[n]が1から0に減少するように加重値W[n]が設定される。数式(12)に例示された範囲QB1内の加重値W[n]の演算式はハニング窓の右半分に相当する。範囲QB1内のケプストラムC[n,t]については加重値W[n]の乗算後に例えば第1実施形態と同様の方法(数式(3))でピークが抑圧される。他方、高次域QBのうちケフレンシnが閾値QTHを上回る範囲QB2では、加重値W[n]を0に設定することでケプストラムC[n,t]が0に置換されてピークが抑圧される。なお、第3実施形態と同様に低次域QA内のケプストラムC[n,t]は維持される。
なお、以上の説明では、範囲QB1内でケフレンシnの増加に対して加重値W[n]が単調減少する場合を例示したが、範囲QB1内での加重値W[n]の変化の態様は適宜に変更される。例えば、図6に破線で図示される通り、範囲QB1の低次側の端点から所定の地点n0(例えば範囲QB1の中点)にかけてケフレンシnの増加に対して加重値W[n]が連続的に増加し、地点n0から範囲QB1の高次側の端点にかけてケフレンシnの増加に対して加重値W[n]が連続的に減少するように、加重値W[n]を設定することも可能である。図6の破線の加重値W[n]をケプストラムC[n,t]に乗算したうえで範囲QB1内のピークが抑圧される。他方、範囲QB2内では、前述の例示と同様にケプストラムC[n,t]が0に近付けられる(典型的には0に置換される)。以上の構成によれば、範囲QB1内の中央付近(地点n0付近)のケフレンシnに対応する基本周波数の音響成分を選択的に強調することが可能である。以上の例示から理解されるように、図6(実線および破線)を参照して説明した本変形例は、高次域QB内の範囲QB1について、ケフレンシnの増加に対して連続的に変化する加重値W[n]によりケプストラムC[n,t]を調整して各ピークを抑圧する構成として包括され、加重値W[n]の変化の態様は任意である。
(2)ケフレンシnの全範囲のうち音響信号SXの音高(ピッチ)に対応する特定の範囲内にケプストラムC[n,t]のピークが偏在するという傾向がある。以上の傾向を考慮すると、高次域QBのうち音響信号SXの調波成分に想定される音高に対応する範囲内のケプストラムC[n,t]についてピークの抑圧(数式(3))を実行し、高次域QB内の残余の範囲についてはピークの抑圧を省略することも可能である。また、音響信号SXから推定される音高に応じてピークの抑圧の範囲を可変に制御する(例えば推定音高を含む範囲をピーク抑圧の対象として設定する)ことも可能である。以上のように高次域QB内の特定の範囲内についてピークを抑圧する構成によれば、高次域QBの全範囲についてピークの抑圧を実行する前述の各形態と比較して抑圧処理部54(54A,54B,54C)の処理負荷が軽減されるという利点がある。また、音響信号SXの音高に応じた範囲内にケプストラムC[n,t]のピークが偏在するという前述の傾向を考慮すると、低次域QAと高次域QBとの境界に相当する閾値Lを音響信号SXの音高に応じて可変に制御する構成も好適である。
(3)高次成分CB[n,t]を抽出する方法(ケプストラムC[n,t]に対するリフタリングの方法)は前述の例示(数式(2))に限定されない。例えば、以下の数式(13)の演算で高次成分CB[n,t]を算定することが可能である。
Figure 2013250380
数式(13)においてケプストラムC[n,t]に作用する係数(加重値)α[n]は、例えば以下の数式(14)で表現される。
Figure 2013250380
数式(14)では、閾値Lの低次側に位置する幅2QLの範囲(L−2QL≦n<L)内の係数α[n]の軌跡がハニング窓で表現される。変数QLはハニング窓のサイズの半分に相当する。以上の説明から理解されるように、係数α[n]は、ケフレンシnの低次域QA((n<L−2QL)で0に設定されるとともに所定の地点(n=L−2QL)から閾値Lにかけて連続的に増加し、高次域QB(n≧L)では1に設定される。前掲の数式(2)のように低次域QAのケプストラムC[n,t]を0に置換する構成では、ケプストラムC[n,t]の不連続な変動に起因したリプルが発生し得る。数式(13)および数式(14)の演算によれば、係数α[n]がケフレンシnに対して連続的に変動するから、数式(2)で問題となるリプルを有効に防止できるという利点がある。
(4)前述の各形態では、音響信号SHまたは音響信号SPを選択的に再生する構成を例示したが、音響信号SHや音響信号SPに対する処理は以上の例示に限定されない。例えば、音響信号SHおよび音響信号SPの各々に別個の音響処理を実行したうえで混合して再生する構成が採用される。音響信号SHおよび音響信号SPの各々に対する音響処理としては音量調整や効果付与が例示される。音高調整(ピッチシフト)や時間軸圧伸(タイムストレッチ)等の音響処理を音響信号SHおよび音響信号SPの各々に個別に実行することも可能である。また、前述の各形態では、音響信号SHおよび音響信号SPの双方を生成する場合を例示したが、音響信号SHおよび音響信号SPの一方を生成する(他方の生成は省略する)構成や、調波推定マスクMH[t]および非調波推定マスクMP[t]の一方を生成する構成も採用され得る。
(5)本発明の利用の態様は任意である。例えば、非調波性の雑音成分を音響信号SXから除去する雑音抑圧装置に本発明は好適に利用される。具体的には、遠隔会議システム等の通信システムで授受される音響信号SXや音声録音装置(ボイスレコーダ)で収録された音響信号SXから、什器等の設備と物品との衝突音(「コツ」という音)や扉の開閉音,空調設備の動作音等の非調波性の雑音成分(非調波成分)を除去することが可能である。また、例えば音響空間内の雑音成分の特性を観測するために音響信号SXから非調波性の雑音成分を抽出することも可能である。
楽器の演奏音を収録した音響信号SXから特定の音響成分(調波成分/非調波成分)を抽出または抑圧する場合にも本発明が好適に利用される。例えば、音響信号SXのうち打楽器の演奏音やリズム音等の非調波性の打撃音を抽出または抑圧することが可能である。また、弦楽器や鍵盤楽器,管楽器等の調波性の楽器の演奏音は、発音が開始された直後の区間(アタック部)にて非調波成分となり、アタック部の経過後の区間(サステイン部)にて調波成分に維持されるという傾向がある。そこで、音響信号SXの楽器の演奏音のうちアタック部(非調波成分)およびサステイン部(調波成分)の一方を抽出または抑圧する場合にも本発明は好適に利用される。また、例えばエレキギターのディストーション音は非調波成分に該当するから、音響信号SXのうちエレキギターのディストーション音を抽出または抑圧する場合にも本発明を利用することが可能である。
(6)前述の各形態では、音響信号SXを音響信号SHと音響信号SPとに分離する要素(信号処理部40)と、音響信号SXの分離に利用される分離マスクを生成する要素(調波抑圧部36,分離マスク生成部38)との双方を具備する音響処理装置100を例示したが、分離マスクを生成する音響処理装置(分離マスク生成装置)としても本発明は特定される。例えば、分離マスク生成装置は、調波抑圧部36と分離マスク生成部38とを具備し、音響信号SX(または音響信号SXから算定される周波数成分X[f,t]やケプストラムC[n,t])を外部装置から取得するとともに、前述の各形態と同様の方法で分離マスクを生成して外部装置に提供する。分離マスク生成装置と外部装置とは、例えばインターネット等の通信網を介して音響信号SXや分離マスクを授受する。外部装置は、分離マスク生成装置から提供された分離マスクを利用して音響信号SXを調波成分と非調波成分とに分離する。以上の例示から理解されるように、周波数分析部32や特徴抽出部34,信号処理部40,波形生成部42は、分離マスクの生成に必須の要件ではない。
100……音響処理装置、12……演算処理装置、14……記憶装置、32……周波数分析部、34……特徴抽出部、36……調波抑圧部、38……分離マスク生成部、40……信号処理部、42……波形生成部、52A,52B,52C……成分抽出部、54A,54B,54C……抑圧処理部、62A,62B,62C……周波数変換部、64A,64B,64C……生成処理部、72A,72B,72C……第1処理部、74A,74B,74C……第2処理部。

Claims (5)

  1. 音響信号のケプストラムを算定する特徴抽出手段と、
    前記特徴抽出手段が算定したケプストラムのうち前記音響信号の調波構造に対応する高次域のピークを抑圧する調波抑圧手段と、
    前記音響信号の調波成分または非調波成分を抑圧する分離マスクを前記調波抑圧手段による処理結果に応じて生成する分離マスク生成手段と、
    前記分離マスクを前記音響信号に作用させる信号処理手段と
    を具備する音響処理装置。
  2. 前記分離マスク生成手段は、前記音響信号の非調波成分を抑圧する調波推定マスクと調波成分を抑圧する非調波推定マスクとを前記分離マスクとして生成し、
    前記信号処理手段は、
    前記調波推定マスクを前記音響信号に作用させる第1処理手段と、
    前記非調波推定マスクを前記音響信号に作用させる第2処理手段とを含む
    請求項1の音響処理装置。
  3. 前記分離マスク生成手段は、前記音響信号の非調波成分を抑圧する調波推定マスクを前記分離マスクとして生成し、
    前記信号処理手段は、
    前記調波推定マスクを前記音響信号に作用させて調波成分を推定する第1処理手段と、
    前記第1処理手段が推定した調波成分を前記音響信号から抑圧して非調波成分を推定する第2処理手段とを含む
    請求項1の音響処理装置。
  4. 前記分離マスク生成手段は、前記特徴抽出手段が算定したケプストラムの低次成分と前記調波抑圧手段がピークを抑圧した高次成分とを周波数領域に変換したスペクトルと、前記音響信号のスペクトルとに応じて前記分離マスクを生成する
    請求項1から請求項3の何れかの音響処理装置。
  5. 前記調波抑圧手段は、前記高次域のうち低次側の第1範囲についてはケフレンシの増加に対して連続的に変化する加重値によりケプストラムを調整して各ピークを抑圧し、前記高次域のうち前記第1範囲に対して高次側の第2範囲についてはケプストラムを0に近付ける
    請求項1から請求項4の何れかの音響処理装置。
JP2012124253A 2012-05-31 2012-05-31 音響処理装置および分離マスク生成装置 Active JP5772723B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012124253A JP5772723B2 (ja) 2012-05-31 2012-05-31 音響処理装置および分離マスク生成装置
US13/904,185 US20130322644A1 (en) 2012-05-31 2013-05-29 Sound Processing Apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012124253A JP5772723B2 (ja) 2012-05-31 2012-05-31 音響処理装置および分離マスク生成装置

Publications (2)

Publication Number Publication Date
JP2013250380A true JP2013250380A (ja) 2013-12-12
JP5772723B2 JP5772723B2 (ja) 2015-09-02

Family

ID=49670274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012124253A Active JP5772723B2 (ja) 2012-05-31 2012-05-31 音響処理装置および分離マスク生成装置

Country Status (2)

Country Link
US (1) US20130322644A1 (ja)
JP (1) JP5772723B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015125239A (ja) * 2013-12-26 2015-07-06 Pioneer DJ株式会社 音声信号処理装置、音声信号処理装置の制御方法、プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220066749A (ko) * 2020-11-16 2022-05-24 한국전자통신연구원 잔차 신호의 생성 방법과 그 방법을 수행하는 부호화기 및 복호화기

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61286900A (ja) * 1985-06-14 1986-12-17 ソニー株式会社 信号処理装置
JPH0431898A (ja) * 1990-05-28 1992-02-04 Matsushita Electric Ind Co Ltd 音声雑音分離装置
WO2006059806A1 (ja) * 2004-12-03 2006-06-08 Honda Motor Co., Ltd. 音声認識装置
US20100182510A1 (en) * 2007-06-27 2010-07-22 RUHR-UNIVERSITäT BOCHUM Spectral smoothing method for noisy signals

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7243060B2 (en) * 2002-04-02 2007-07-10 University Of Washington Single channel sound separation
US8073148B2 (en) * 2005-07-11 2011-12-06 Samsung Electronics Co., Ltd. Sound processing apparatus and method
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
JP2011087118A (ja) * 2009-10-15 2011-04-28 Sony Corp 音声処理装置、音声処理方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61286900A (ja) * 1985-06-14 1986-12-17 ソニー株式会社 信号処理装置
JPH0431898A (ja) * 1990-05-28 1992-02-04 Matsushita Electric Ind Co Ltd 音声雑音分離装置
WO2006059806A1 (ja) * 2004-12-03 2006-06-08 Honda Motor Co., Ltd. 音声認識装置
US20100182510A1 (en) * 2007-06-27 2010-07-22 RUHR-UNIVERSITäT BOCHUM Spectral smoothing method for noisy signals

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015125239A (ja) * 2013-12-26 2015-07-06 Pioneer DJ株式会社 音声信号処理装置、音声信号処理装置の制御方法、プログラム

Also Published As

Publication number Publication date
US20130322644A1 (en) 2013-12-05
JP5772723B2 (ja) 2015-09-02

Similar Documents

Publication Publication Date Title
JP5528538B2 (ja) 雑音抑圧装置
JP5666444B2 (ja) 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法
EP2164066B1 (en) Noise spectrum tracking in noisy acoustical signals
JP5018193B2 (ja) 雑音抑圧装置およびプログラム
JP4818335B2 (ja) 信号帯域拡張装置
JP6019969B2 (ja) 音響処理装置
JPWO2006046293A1 (ja) 雑音抑圧装置
JP5148414B2 (ja) 信号帯域拡張装置
JP5187666B2 (ja) 雑音抑圧装置およびプログラム
JP5034735B2 (ja) 音処理装置およびプログラム
JP5772723B2 (ja) 音響処理装置および分離マスク生成装置
JP2009223210A (ja) 信号帯域拡張装置および信号帯域拡張方法
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JPH11265199A (ja) 送話器
JP5466581B2 (ja) 反響消去方法、反響消去装置及び反響消去プログラム
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
JP2006178333A (ja) 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP2005099405A (ja) 雑音除去方法、雑音除去装置およびプログラム
JP5316127B2 (ja) 音処理装置およびプログラム
JP2015169901A (ja) 音響処理装置
JP6036141B2 (ja) 音響処理装置
WO2022068440A1 (zh) 啸叫抑制方法、装置、计算机设备和存储介质
JP5321171B2 (ja) 音処理装置およびプログラム
JP2004053626A (ja) 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体
JP2014052585A (ja) 音響処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150317

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150410

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150615

R151 Written notification of patent or utility model registration

Ref document number: 5772723

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151