JP6221258B2 - 信号処理装置、方法及びプログラム - Google Patents

信号処理装置、方法及びプログラム Download PDF

Info

Publication number
JP6221258B2
JP6221258B2 JP2013036360A JP2013036360A JP6221258B2 JP 6221258 B2 JP6221258 B2 JP 6221258B2 JP 2013036360 A JP2013036360 A JP 2013036360A JP 2013036360 A JP2013036360 A JP 2013036360A JP 6221258 B2 JP6221258 B2 JP 6221258B2
Authority
JP
Japan
Prior art keywords
signal
directivity
unit
coherence
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013036360A
Other languages
English (en)
Other versions
JP2014164191A (ja
Inventor
克之 高橋
克之 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013036360A priority Critical patent/JP6221258B2/ja
Priority to US14/770,784 priority patent/US9659575B2/en
Priority to PCT/JP2013/081244 priority patent/WO2014132500A1/ja
Publication of JP2014164191A publication Critical patent/JP2014164191A/ja
Application granted granted Critical
Publication of JP6221258B2 publication Critical patent/JP6221258B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Description

本発明は信号処理装置、方法及びプログラムに関し、例えば、電話機やテレビ会議装置などの音声信号(この明細書では、音声信号と音響信号の双方を含めて「音声信号」と呼んでいる)を扱う通信機や通信ソフトウェアに適用し得るものである。
取得した音声信号中に含まれる雑音成分を抑圧する手法の一つとして、スペクトル引き算法(スペクトル減算法や周波数減算法や周波数引き算法とも呼ばれる)が挙げられる。これは、非特許文献1に記載されているように、雑音を含む音声信号のスペクトルから雑音スペクトルを減算する手法である。
ところで、スペクトル引き算処理は雑音成分を抑圧する効果がある一方で、ミュージカルノイズという異音成分(トーン性の雑音)を発生させてしまうという課題がある。
この課題への対策の一つが、非特許文献1に記載されているように、スペクトル引き算処理を反復するという手法(反復スペクトル引き算法)である。反復スペクトル引き算法は、スペクトル引き算処理によって雑音成分が抑圧された信号に対して、再び、スペクトル引き算処理を行い、この反復処理を所定回数(非特許文献1では10回の例が記載されている)だけ繰り返すという手法である。雑音成分抑圧後の信号から再度雑音成分を推定することにより、発生したミュージカルノイズを含む雑音特性を推定し、それを抑圧することを期待している。
緒方伸哉、島村徹也著、「反復スペクトル引き算法によるミュージカルノイズの低減」、日本音響学会講演論文集、pp387−388、2001年3月
しかしながら、反復スペクトル引き算法は、反復を繰り返すたびに音声成分が歪んで自然さが損なわれるという課題がある。
そのため、反復スペクトル引き算法に従って雑音成分を抑圧しても、音質の自然さと、ミュージカルノイズを含む雑音の抑圧性能とがバランス良く実現できる信号処理装置、方法及びプログラムが望まれている。
第1の本発明は、一対の入力音声信号の一方に含まれている雑音成分を、反復スペクトル引き算手段がスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理装置において、(1)当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、(2)上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御する反復回数制御手段とを備え、上記特徴量算出手段は、(3−1)当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、(3−2)上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、(3−3)上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得るコヒーレンス計算部とを備えることを特徴とする。
第2の本発明は、一対の入力音声信号の一方に含まれている雑音成分を、反復スペクトル引き算手段がスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理方法において、(1)特徴量算出手段が、当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出し、(2)反復回数制御手段が、上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御し、(3−1)上記特徴量算出手段の第1の指向性形成部は、当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、(3−2)上記特徴量算出手段の第2の指向性形成部は、上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、(3−3)上記特徴量算出手段のコヒーレンス計算部は、上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得ることを特徴とする。
第3の本発明の信号処理プログラムは、一対の入力音声信号の一方に含まれている雑音成分をスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理装置に搭載されたコンピュータを、(1)当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、(2)上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御する反復回数制御手段として機能させ、上記特徴量算出手段は、(3−1)当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、(3−2)上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、(3−3)上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得るコヒーレンス計算部とを備えることを特徴とする。
本発明によれば、反復スペクトル引き算法に従って雑音成分を抑圧しても、音質の自然さと、ミュージカルノイズを含む雑音の抑圧性能とがバランス良く実現できる信号処理装置、方法及びプログラムを提供できる。
第1の実施形態に係る信号処理装置の構成を示すブロック図である。 第1の実施形態における第1及び第2の指向性形成部からの指向性信号の性質を示す説明図である。 第1の実施形態における第1及び第2の指向性形成部による指向性特性を示す説明図である。 方位ごとのコヒーレンスの挙動を示す説明図である。 第1の実施形態における反復スペクトル引き算部の詳細構成を示すブロック図である。 第1の実施形態の反復スペクトル引き算部における第3の指向性形成部の出力信号の指向性の説明図である。 第1の実施形態における反復回数制御部の詳細構成を示すブロック図である。 第1の実施形態の反復回数制御部における反復回数記憶部の記憶内容の説明図である。 第1の実施形態の反復スペクトル引き算部における詳細動作を示すフローチャートである。 第2の実施形態に係る信号処理装置の構成を示すブロック図である。 第2の実施形態における反復スペクトル引き算部の詳細構成を示すブロック図である。 第2の実施形態における反復回数制御部の詳細構成を示すブロック図である。 第2の実施形態の反復スペクトル引き算部における詳細動作を示すフローチャートである。
(A)第1の実施形態
以下、本発明による信号処理装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
第1の実施形態の信号処理装置、方法及びプログラムは、スペクトル引き算処理を反復して繰り返す反復回数を適応的に制御することを特徴としている。
(A−1)第1の実施形態に至った考え方(反復回数を適応的に制御する理由)
第1の実施形態の信号処理装置の構成及び動作を説明する前に、第1の実施形態に至った考え方、すなわち、反復スペクトル引き算処理の反復回数を適応的に制御する理由を説明する。
反復スペクトル引き算処理によって音声成分が歪む原因は、推定した雑音成分を過剰に引き算しすぎてしまうことにある。この課題は、指向性を形成して雑音信号を推定する場合に顕著となる。
妨害音声(目的話者以外の人の音声)の到来方位が、形成される指向性の方位と一致する場合には、推定した雑音信号の精度が高いため、一度の引き算で大きな抑圧効果が得られる。このような場合には、反復回数は少なくても良いのにも拘わらず、固定の反復回数を適用すると、反復回数が多すぎて必要以上に引き算してしまうため、目的音声成分まで抑圧され、音声に歪みが生じてしまう。
一方、妨害音声の到来方位が、形成した指向性方位から逸れている場合には、推定した雑音成分の精度が低くなり、そのため、一度の引き算での抑圧効果は小さく、反復回数が多いことが好ましい。しかし、反復回数が固定されていると、実際の反復回数が所望する反復回数より少なくなり、目的音声への影響は小さいものの、雑音成分の抑圧性能が不足する。
以上のように、妨害音声の到来方位によって最適な反復回数は変動する。
そこで、第1の実施形態の信号処理装置は、妨害音声の到来方位に応じて、反復スペクトル引き算処理の反復回数を制御し、音声の自然さと雑音の抑圧性能の双方を実現しようとした。
(A−2)第1の実施形態の構成
図1は、第1の実施形態に係る信号処理装置の構成を示すブロック図である。ここで、一対のマイクm1及びm2を除いた部分は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(信号処理プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
図1において、第1の実施形態の信号処理装置1は、一対のマイクm1、m2、FFT部11、第1の指向性形成部12、第2の指向性形成部13、コヒーレンス計算部14、反復回数制御部15、反復スペクトル引き算部16及びIFFT部17を有する。
一対のマイクm1、m2は、所定距離(若しくは任意の距離)だけ離れて配置され、それぞれ、周囲の音声を捕捉するものである。各マイクm1、m2で捕捉された音声信号(入力信号)は、図示しない対応するAD変換器を介してデジタル信号s1(n)、s2(n)に変換されてFFT部11に与えられる。なお、nはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、nが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。
FFT部11は、マイクm1及びm2から入力信号系列s1(n)及びs2(n)を受け取り、その入力信号s1及びs2に高速フーリエ変換(あるいは離散フーリエ変換)を行うものである。これにより、入力信号s1及びs2を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号s1(n)及びs2(n)から、所定のN個のサンプルからなる分析フレームFRAME1(K)及びFRAME2(K)を構成して適用する。入力信号s1(n)から分析フレームFRAME1(K)を構成する例を以下の(1)式に示すが、分析フレームFRAME2(K)も同様である。
Figure 0006221258
なお、Kはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Kが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはKであるとする。
FFT部11は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号X1(f,K)、X2(f,K)に変換し、得られた周波数領域信号X1(f,K)及びX2(f,K)をそれぞれ、反復コヒーレンスフィルタ処理部12に与える。なお、fは周波数を表すインデックスである。また、X1(f,K)は単一の値ではなく、(2)式に示すように、複数の周波数f1〜fmのスペクトル成分から構成されるものである(但し、いずれかの周波数要素の一つを表す場合にも同様の表記を用いることもある)。さらに、X1(f,K)は複素数であり、実部と虚部からなる。X2(f,K)や後述するB1(f,K)及びB2(f,K)も同様である。
X1(f,K)={X1(f1,K),X1(f2,K),…,X1(fm,K)} …(2)
反復スペクトル引き算部16は、スペクトル引き算処理を、反復回数制御部15から与えられた反復回数Θ(K)だけ繰り返し実行し、雑音成分が抑圧された信号SS_out(f,K)を得て、IFFT部17に与えるものである。
IFFT部17は、雑音抑圧後信号SS_out(f,K)に対して、逆高速フーリエ変換を施して時間領域信号である出力信号y(n)を得るものである。
第1の指向性形成部12、第2の指向性形成部13、コヒーレンス計算部14及び反復回数制御部15は、反復スペクトル引き算部16が適用する反復回数Θ(K)を決定するための構成である。上述したように、実施形態の信号処理装置1では、妨害音声の到来方位に応じて、反復スペクトル引き算処理の反復回数を制御し、音声の自然さと雑音の抑圧性能の双方を実現しようとしている。妨害音声の到来方位を反映した特徴量としてコヒーレンスを適用する。
第1の指向性形成部12は、周波数領域信号X1(f,K)及びX2(f,K)から特定方向に指向性が強い信号B1(f,K)を形成するものである。第2の指向性形成部13は、周波数領域信号X1(f,K)及びX2(f,K)から特定方向(上述の特定方向とは異なる)に指向性が強い信号B2(f,K)を形成するものである。特定方向に指向性が強い信号B1(f,K)、B2(f,K)の形成方法としては既存の方法を適用でき、例えば、(3)式を適用して右方向に指向性が強いB1(f,K)や(4)式を適用して左方向に指向性が強いB2(f,K)が形成できる。(3)式及び(4)式では、フレームインデックスKは演算に関与しないので省略している。
Figure 0006221258
これらの式の意味を、(3)式を例に、図2及び図3を用いて説明する。図2(A)に示した方向θから音波が到来し、距離lだけ隔てて設置されている一対のマイクm1及びm2で捕捉されたとする。このとき、音波が一対のマイクm1及びm2に到達するまでには時間差が生じる。この到達時間差τは、音の経路差をdとすると、d=l×sinθなので、音速をcとすると(5)式で与えられる。
τ=l×sinθ/c …(5)
ところで、入力信号s1(n)にτだけ遅延を与えた信号s1(t−τ)は、入力信号s2(t)と同一の信号である。従って、両者の差をとった信号y(n)=s2(t)−s1(t−τ)は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーm1及びm2は図2(B)のような指向特性を持つようになる。
なお、以上では、時間領域での演算を記したが、周波数領域で行っても同様なことがいえる。この場合の式が、上述した(3)式及び(4)式である。今、一例として、到来方位θが±90度であることを想定する。すなわち、第1の指向性形成部12からの指向性信号B1(f)は、図3(A)に示すように右方向に強い指向性を有し、第2の指向性形成部13からの指向性信号B2(f)は、図3(B)に示すように左方向に強い指向性を有する。
コヒーレンス計算部14は、以上のようにして得られた指向性信号B1(f,K)、B2(f,K)に対し、(6)式、(7)式に示す演算を施すことでコヒーレンスCOH(k)を得るものである。(6)式におけるB2(f)はB2(f)の共役複素数である。また、フレームインデックスKは、(6)式、(7)式の演算には関与しないので、(6)式、(7)式ではフレームインデックスKの記載を省略している。
Figure 0006221258
ここで、コヒーレンスの大小で入力信号(目的音声若しくは妨害音声)が正面から到来した信号か否かを判定できる理由を簡単に説明する。
コヒーレンスの概念は、右から到来する信号と左から到来する信号の相関と言い換えられる(上述した(6)式はある周波数成分についての相関を算出する式であり、(7)式は全ての周波数成分の相関値の平均を計算している)。従って、コヒーレンスCOHが小さい場合とは、2つの指向性信号B1及びB2の相関が小さい場合であり、反対にコヒーレンスCOHが大きい場合とは相関が大きい場合と言い換えることができる。そして、相関が小さい場合の入力信号は、入力到来方位が右又は左のどちらかに大きく偏っている、つまり、正面以外から到来している信号といえる。一方、コヒーレンスCOHの値が大きい場合は、到来方位の偏りがないため、入力信号が正面から到来する場合であるといえる。このようにコヒーレンスの大小で入力信号の到来方位が正面か否かを判定することができる。
図4は、コヒーレンスの挙動を示した説明図である。図4に示すように、到来方位に応じて、コヒーレンスの値がとるレンジが変化していることが分かる。この性質を用いることで、妨害音声の到来方位を推定し、その結果に基づいて、反復スペクトル引き算処理の反復回数を制御することとした。
反復回数制御部15は、コヒーレンス計算部14が算出したコヒーレンスCOH(K)がどのような範囲内の値かによって定まる反復回数Θ(K)を得て、反復スペクトル引き算部16に与えるものである。
図5は、反復スペクトル引き算部16の詳細構成を示すブロック図である。なお、反復回数制御部15から与えられた反復回数Θ(K)だけスペクトル引き算処理を実行させる構成が従来と異なっており、スペクトル引き算処理の実行構成や、それを反復させるための構成等は、既存のいかなる構成を適用しても良く、図5は一例として記載したものである。
図5において、反復スペクトル引き算部16は、入力信号・反復回数受信部21、反復回数カウンタ・被減算信号初期化部22、第3の指向性形成部23、スペクトル引き算処理部24、反復回数カウンタ更新・反復実施可否制御部25、被減算信号更新部26及びスペクトル引き算処理後信号送信部27を有する。
反復スペクトル引き算部16においては、これらの各部21〜27が協働して動作することにより、後述する図9のフローチャートに示す処理を実行する。
入力信号・反復回数受信部21は、FFT部11から出力された周波数領域信号X1(f,K)、X2(f,K)と、反復回数制御部15から出力された反復回数Θ(K)とを受け取るものである。
反復回数カウンタ・被減算信号初期化部22は、反復回数を表すカウンタ変数(以下、反復回数カウンタと呼ぶ)pと、スペクトル引き算処理において雑音信号が減算される信号である被減算信号tmp_1ch(f,K,p)、tmp_2ch(f,K,p)を初期化する。反復回数カウンタpの初期化値は0であり、被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)の初期化値はそれぞれ、X1(f,K)、X2(f,K)である。
第3の指向性形成部23は、現反復回数における被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)に基づいて、(8)式に従って、雑音信号(第3の指向性信号)N(f,K,p)を形成する。
Figure 0006221258
雑音信号N(f,K,p)は反復回数によって変化するものである。被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)の初期化値がそれぞれX1(f,K)、X2(f,K)であって、これらの絶対値の差分をとって雑音信号N(f,K,p)を形成していることから理解できるように、雑音信号N(f,K,p)は、図6に示す指向性を有する。すなわち、雑音信号N(f,K,p)は、正面方位に死角を有する指向性を有する。
スペクトル引き算処理部24は、現反復回数における被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)と、雑音信号N(f,K,p)とに基づいて、(9)式及び(10)式に従って、現反復回数におけるスペクトル引き算処理を行い、スペクトル引き算処理後信号SS_1ch(f,K,p)及びSS_2ch(f,K,p)を形成する。
Figure 0006221258
反復回数カウンタ更新・反復実施可否制御部25は、現反復回数におけるスペクトル引き算処理が終了したときに、反復回数カウンタpを1インクリメントした後、反復回数カウンタpが反復回数制御部15から出力された反復回数Θ(K)に達したかを判定し、達しない場合にはスペクトル引き算処理の反復を継続するように各部を制御し、達した場合にはスペクトル引き算処理の反復繰り返しを終了するように各部を制御するものである。
被減算信号更新部26は、スペクトル引き算処理の反復を継続する場合に、被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)をそれぞれ、前回の反復回数でのスペクトル引き算処理後信号SS_1ch(f,K,p−1)及びSS_2ch(f,K,p−1)に更新する。
スペクトル引き算処理後信号送信部27は、スペクトル引き算処理の反復繰り返しを終了する場合に、その時点で得られているスペクトル引き算処理後信号SS_1ch(f,K,p)及びSS_2ch(f,K,p)の一方を、反復スペクトル引き算後信号SS_out(f,K)としてIFFT部17に与えるものである。また、スペクトル引き算処理後信号送信部27は、フレームを規定する変数Kを1だけ増加させて次のフレームの処理を起動させるものである。
図7は、反復回数制御部15の詳細構成を示すブロック図である。
図7において、反復回数制御部15は、コヒーレンス受信部31、反復回数照合部32、反復回数記憶部33及び反復回数送信部34を有する。
コヒーレンス受信部31は、コヒーレンス計算部14から出力されたコヒーレンスCOH(K)を取込むものである。
反復回数照合部32は、コヒーレンスCOH(K)をキーとして、反復回数記憶部33から、反復スペクトル引き算処理の反復回数Θ(K)を取り出すものである。
反復回数記憶部33は、図8に示すように、コヒーレンスCOHの範囲に対応付けて反復回数Θ(K)を記憶している。図8は、コヒーレンスCOHがAより大きくB以下の場合には反復回数αが対応付けられ、コヒーレンスCOHがBより大きくC以下の場合には反復回数β(β<α)が対応付けられ、コヒーレンスCOHがCより大きくD以下の場合には反復回数γ(γ<β)が対応付けられた例を示している。
反復回数送信部34は、反復回数照合部32が得た反復回数Θ(K)を反復スペクトル引き算部16に与えるものである。
(A−3)第1の実施形態の動作
次に、第1の実施形態の信号処理装置1の動作を、図面を参照しながら、全体動作、反復スペクトル引き算部16における詳細動作の順に説明する。
一対のマイクm1及びm2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換された後、第1及び第2の指向性形成部12及び13、反復スペクトル引き算部16に与えられる。
周波数領域の信号X1(f,K)及びX2(f,K)に基づき、第1及び第2の指向性形成部12及び13のそれぞれによって、所定の方位に死角を有する第1及び第2の指向性信号B1(f,K)及びB2(f,K)が生成される。そして、コヒーレンス計算部14において、第1及び第2の指向性信号B1(f,K)及びB2(f,K)を適用して、(6)式及び(7)式の演算が実行され、コヒーレンスCOH(K)が算出され、反復回数制御部15において、算出されたコヒーレンスCOH(K)が属する範囲に応じた反復回数Θ(K)が取り出され、反復スペクトル引き算部16に与えられる。
反復スペクトル引き算部16においては、周波数領域信号X1(f,K)及びX2(f,K)を当初の被減算信号とした、スペクトル引き算処理が反復回数Θ(K)だけ繰り返し実行され、得られた反復スペクトル引き算後信号SS_out(f,K)がIFFT部17に与えられる。
IFFT部17においては、周波数領域信号である反復スペクトル引き算後信号SS_out(f,K)が、逆高速フーリエ変換によって、時間領域信号y(n)に変換され、この時間領域信号y(n)が出力される。
次に、反復スペクトル引き算部16における詳細動作を、図9のフローチャートを参照しながら説明する。なお、図9は、あるフレームの処理を示しており、フレームごとに、図9に示す処理が繰り返される。
新たなフレームになり、新たなフレーム(現フレームK)の周波数領域信号X1(f,K)、X2(f,K)がFFT部11から与えられると、反復回数カウンタpが0に、被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)がそれぞれ、周波数領域信号X1(f,K)、X2(f,K)に初期化される(ステップS1)。
その後、現反復回数における被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)に基づいて、(8)式に従って、雑音信号N(f,K,p)が形成される(ステップS2)。さらに、現反復回数における被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)と、雑音信号N(f,K,p)とに基づいて、(9)式及び(10)式に従って、現反復回数におけるスペクトル引き算処理が実行され、スペクトル引き算処理後信号SS_1ch(f,K,p)及びSS_2ch(f,K,p)が形成される(ステップS3)。
次に、反復回数カウンタpが1インクリメントされた後(ステップS4)、更新された反復回数カウンタpが反復回数制御部15から出力された反復回数Θ(K)より小さいか否かが判定される(ステップS5)。
更新された反復回数カウンタpが反復回数制御部15から出力された反復回数Θ(K)より小さい場合には、被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)がそれぞれ、前回の反復回数でのスペクトル引き算処理後信号SS_1ch(f,K,p−1)及びSS_2ch(f,K,p−1)に更新された後(ステップS6)、上述したステップS2に移行する。
これに対して、更新された反復回数カウンタpが反復回数制御部15から出力された反復回数Θ(K)に一致した場合には、その時点で得られているスペクトル引き算処理後信号SS_1ch(f,K,p)及びSS_2ch(f,K,p)の一方が、反復スペクトル引き算後信号SS_out(f,K)としてIFFT部17に与えられ、また、フレームを規定するパラメータKが1だけ増加され(ステップS7)、今回のフレームの処理を終了し、次のフレームの処理に移行する。
(A−4)第1の実施形態の効果
第1の実施形態によれば、妨害音声の到来方位に応じて、反復スペクトル引き算処理の反復回数を適応的に定めて、その反復回数だけ反復スペクトル引き算処理を実行するようにしたので、音質と抑圧性能とをバランス良く実現することができる。
これにより、第1の実施形態の信号処理装置を、テレビ会議システムや携帯電話やスマートフォンなどの通信装置に適用することで、通話音質の向上が期待できる。
(B)第2の実施形態
次に、本発明による信号処理装置、方法及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
第2の実施形態の信号処理装置、方法及びプログラムも、スペクトル引き算処理を反復して繰り返す反復回数を適応的に制御することを特徴としており、その制御のために利用するパラメータの挙動が第1の実施形態とは異なっている。
(B−1)第2の実施形態に至った考え方
従来では、スペクトル引き算処理の反復回数が固定であった。しかし、最適な反復回数は、雑音の特性によって変動する。そのため、反復回数を固定にした場合、雑音の抑圧量が不足する恐れがある。また、反復を繰り返すたびに音声が歪み自然さが損なわれる場合があり、反復回数を徒に多くしても不都合が生じる。そのため、第2の実施形態でも、歪みやミュージカルノイズが少ない音質の自然さと、抑圧性能とがバランス良く実現されるような最適な反復回数を設定することを意図している。
第2の実施形態では、コヒーレンスCOH(K,p)の挙動を反復の終了判定に利用しており、以下では、利用することとした理由を説明する。
(7)式に示すような平均処理することでコヒーレンスCOH(K,p)を算出させるコヒーレンスフィルタ係数coef(f,K,p)は、(6)式に示すように、左右に死角を有する信号成分の相互相関でもあるので、相関が大きい場合は、到来方位には偏りがない正面から到来する音声成分であり、相関が小さい場合は、到来方位が右か左に偏った成分である、というように入力音声の到来方位とも対応付けられる。
実際に、コヒーレンスフィルタ係数coef(f,K,p)を全ての周枚数成分で平均した値であるコヒーレンスCOH(K,p)を(6)式、(7)式に従って算出して挙動を確認すると、反復回数が増すほど、雑音区間におけるコヒーレンスCOH(K,p)は増大していき、横から到来する成分の寄与が小さくなっていくことが確認できる。
しかし、必要以上に反復した場合には、正面から到来する成分まで抑圧されるようになり、音質が歪む。そして、その際、コヒーレンスCOH(K,p)は正面から到来する成分の影響が小さくなるため減少していく。
以上のような反復回数に応じたコヒーレンスCOH(K,p)の挙動から、コヒーレンスCOH(K,p)が極大値をとる反復回数が、抑圧性能と音質とのバランスがとれる回数であると考えられる。
そこで、第2の実施形態では、反復ごとのコヒーレンスCOH(K,p)を観測し、コヒーレンスCOH(K,p)の変化(挙動)が増加から減少に転じた時点で反復処理を終了することとした。これにより、最適な反復回数で反復スペクトル引き算処理を実行させることができる。
(B−2)第2の実施形態の構成
図10は、第2の実施形態に係る信号処理装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図10において、第2の実施形態の信号処理装置1Aは、一対のマイクm1、m2、FFT部11、第1の指向性形成部12、第2の指向性形成部13、コヒーレンス計算部14、反復回数制御部15A、反復スペクトル引き算部16A及びIFFT部17を有し、反復回数制御部15A及び反復スペクトル引き算部16Aが第1の実施形態のものと異なっている。
第2の実施形態の反復スペクトル引き算部16Aは、各反復回数での被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)がそれぞれ、第1及び第2の指向性形成部12及び13に出力させ、その出力に応じて、反復回数制御部15Aが出力した反復終了フラグFLG(K,p)を取込み、反復終了フラグFLG(K,p)がオフのときに現反復回数pでのスペクトル引き算処理を実行し、反復終了フラグFLG(K,p)がオンのときに現反復回数pでのスペクトル引き算処理を実行しないで、反復スペクトル引き算処理を終了させるものである。
なお、上述したように、第2の実施形態の場合、第1の指向性形成部12及び第2の指向性形成部13にはそれぞれ、被減算信号tmp_1ch(f,K,p)、tmp_2ch(f,K,p)が入力され、この入力信号に対して、第1の実施形態と同様な演算を施して、指向性信号B1(f,K,p)、B2(f,K,p)を形成するようになっている。
第2の実施形態の反復回数制御部15Aは、コヒーレンス計算部14から与えられたコヒーレンスCOH(K,p)の変化が増加から減少に転じたかを判別し、転じていない場合にオフをとり、転じた場合にオンをとる反復終了フラグFLG(K,p)を反復スペクトル引き算部16Aに与えるものである。
図11は、第2の実施形態の反復スペクトル引き算部16Aの詳細構成を示すブロック図であり、第1の実施形態に係る図5との同一、対応部分には同一、対応符号を付して示している。
図11において、反復スペクトル引き算部16Aは、入力信号受信部21A、反復回数カウンタ・被減算信号初期化部22、被減算信号送信・反復終了フラグ受信部28、反復実施可否制御・反復回数カウンタ更新部25A、第3の指向性形成部23、スペクトル引き算処理部24、被減算信号更新部26及びスペクトル引き算処理後信号送信部27を有する。
入力信号・反復回数受信部21Aは、FFT部11から出力された周波数領域信号X1(f,K)、X2(f,K)を受け取るものである。
反復回数カウンタ・被減算信号初期化部22は、第1の実施形態のものと同様であり、その説明は省略する。
被減算信号送信・反復終了フラグ受信部28は、現反復回数における被減算信号tmp_1ch(f,K,p)、tmp_2ch(f,K,p)をそれぞれ第1の指向性形成部12、第2の指向性形成部13に送信すると共に、反復回数制御部15Aが送信した反復終了フラグFLG(K,p)を受け取るものである。
反復実施可否制御・反復回数カウンタ更新部25Aは、受け取った反復終了フラグFLG(K,p)がオンかオフかを判定し、反復終了フラグFLG(K,p)がオフの場合にはスペクトル引き算処理の反復を継続するように各部を制御し、反復終了フラグFLG(K,p)がオンの場合にはスペクトル引き算処理の反復繰り返しを終了するように各部を制御するものである。また、反復実施可否制御・反復回数カウンタ更新部25Aは、反復終了フラグFLG(K,p)がオフの場合に反復回数カウンタpを1インクリメントするものである。
第3の指向性形成部23、スペクトル引き算処理部24、被減算信号更新部26及びスペクトル引き算処理後信号送信部27は、第1の実施形態のものと同様であり、その説明は省略する。
図12は、第2の実施形態の反復回数制御部15Aの詳細構成を示すブロック図である。
図12において、反復回数制御部15Aは、コヒーレンス受信部31、コヒーレンス挙動判定部32A、前コヒーレンス記憶部33A及び反復終了フラグ送信部34Aを有する。
コヒーレンス受信部31は、第1の実施形態と同様に、コヒーレンス計算部14から出力されたコヒーレンスCOH(K,p)を取込むものである。
コヒーレンス挙動判定部32Aは、受信した現反復回数のコヒーレンスCOH(K,p)と、前コヒーレンス記憶部33Aに記憶されている前回の反復回数のコヒーレンスCOH(K,p−1)とから、コヒーレンスの挙動を捉えて、反復終了フラグFLG(K,p)を形成し、その後、現反復回数のコヒーレンスCOH(K,p)を前コヒーレンス記憶部33Aに記憶させるものである。
コヒーレンス挙動判定部32Aは、例えば、現反復回数のコヒーレンスCOH(K,p)が前回の反復回数のコヒーレンスCOH(K,p−1)より大きい場合に反復終了フラグFLG(K,p)をオフとし、現反復回数のコヒーレンスCOH(K,p)が前回の反復回数のコヒーレンスCOH(K,p−1)以下の場合に反復終了フラグFLG(K,p)をオンとする。
前コヒーレンス記憶部33Aは、前回の反復回数におけるコヒーレンスCOH(K,p−1)を記憶しているものである。
反復終了フラグ送信部34Aは、コヒーレンス挙動判定部32Aが形成した現反復回数の反復終了フラグFLG(K,p)を反復スペクトル引き算部16Aに与えるものである。
(B−3)第2の実施形態の動作
次に、第2の実施形態の信号処理装置1Aの動作を、図面を参照しながら、全体動作、反復スペクトル引き算部16Aにおける詳細動作の順に説明する。
一対のマイクm1及びm2から入力された信号s1(n)、s2(n)はそれぞれ、FFT部11によって時間領域から周波数領域の信号X1(f,K)、X2(f,K)に変換されて反復スペクトル引き算部16Aに与えられる。
反復スペクトル引き算部16Aにおいては、反復回数ごとに、その反復回数での被減算信号tmp_1ch(f,K,p)、tmp_2ch(f,K,p)が形成され、これら被減算信号tmp_1ch(f,K,p)、tmp_2ch(f,K,p)が対応する第1又は第2の指向性形成部12又は13に与えられる。
そして、被減算信号tmp_1ch(f,K,p)、tmp_2ch(f,K,p)に基づき、第1及び第2の指向性形成部12及び13のそれぞれによって、所定の方位に死角を有する第1及び第2の指向性信号B1(f,K,p)及びB2(f,K,p)が生成される。そして、コヒーレンス計算部14において、第1及び第2の指向性信号B1(f,K,p)及びB2(f,K,p)を適用して、(6)式及び(7)式の演算が実行され、コヒーレンスCOH(K,p)が算出され、反復回数制御部15Aにおいて、算出された現反復回数のコヒーレンスCOH(K,p)と、内蔵する前回の反復回数におけるコヒーレンスCOH(K,p−1)とに基づいて、反復終了フラグFLG(K,p)が形成されて反復スペクトル引き算部16A与えられる。
反復スペクトル引き算部16Aにおいては、周波数領域信号X1(f,K)及びX2(f,K)を当初の被減算信号とした、スペクトル引き算処理が、反復終了フラグFLG(K,p)がオンとなる反復回数まで繰り返し実行され、得られた反復スペクトル引き算後信号SS_out(f,K)がIFFT部17に与えられる。
IFFT部17においては、周波数領域信号である反復スペクトル引き算後信号SS_out(f,K)が、逆高速フーリエ変換によって、時間領域信号y(n)に変換され、この時間領域信号y(n)が出力される。
次に、反復スペクトル引き算部16Aにおける詳細動作を、図13のフローチャートを参照しながら説明する。なお、図13は、あるフレームの処理を示しており、フレームごとに、図13に示す処理が繰り返される。また、図13において、第1の実施形態に係る図9との同一ステップには同一符号を付して示している。
新たなフレームになり、新たなフレーム(現フレームK)の周波数領域信号X1(f,K)、X2(f,K)がFFT部11から与えられると、反復スペクトル引き算部16Aは、反復回数カウンタpを0に、被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)をそれぞれ、周波数領域信号X1(f,K)、X2(f,K)に初期化する(ステップS1)。
その後、反復スペクトル引き算部16Aは、現反復回数の被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)をそれぞれ、第1の指向性形成部12、第2の指向性形成部13に送信し(ステップS8)、それに応じて形成されて送信されてきた反復終了フラグFLG(K,p)を受信する(ステップS9)。
そして、反復スペクトル引き算部16Aは、受信した反復終了フラグFLG(K,p)がオンか否かを判定する(ステップS10)。
受信した反復終了フラグFLG(K,p)がオフの場合には、反復スペクトル引き算部16Aは、現反復回数における被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)に基づいて、(8)式に従って、雑音信号N(f,K,p)を形成し(ステップS2)、さらに、現反復回数における被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)と、雑音信号N(f,K,p)とに基づいて、(9)式及び(10)式に従って、現反復回数におけるスペクトル引き算処理を実行し、スペクトル引き算処理後信号SS_1ch(f,K,p)及びSS_2ch(f,K,p)を形成する(ステップS3)。次に、反復スペクトル引き算部16Aは、反復回数カウンタpを1インクリメントした後(ステップS4)、被減算信号tmp_1ch(f,K,p)及びtmp_2ch(f,K,p)をそれぞれ、前回の反復回数でのスペクトル引き算処理後信号SS_1ch(f,K,p−1)及びSS_2ch(f,K,p−1)に更新した後(ステップS6)、上述したステップS8に移行する。
これに対して、受信した反復終了フラグFLG(K,p)がオンの場合には、反復スペクトル引き算部16Aは、前回の反復回数で得られているスペクトル引き算処理後信号SS_1ch(f,K,p−1)及びSS_2ch(f,K,p−1)の一方を、反復スペクトル引き算後信号SS_out(f,K)としてIFFT部17に与え、また、フレームを規定するパラメータKを1だけ増加し(ステップS7)、今回のフレームの処理を終了し、次のフレームの処理に移行する。
(B−4)第2の実施形態の効果
第2の実施形態によれば、目的音声の到来方位に応じて、反復スペクトル引き算処理の反復繰り返しの終了タイミングを捉え、その終了タイミングになるまで反復スペクトル引き算処理を実行するようにしたので、音質と抑圧性能とをバランス良く実現することができる。
これにより、第2の実施形態の信号処理装置を、テレビ会議システムや携帯電話やスマートフォンなどの通信装置に適用することで、通話音質の向上が期待できる。
(C)他の実施形態
上述したように、スペクトル引き算処理は、上記実施形態で説明されたものに限定されるものではない。上記実施形態以外でも、スペクトル引き算処理として公知になっているものは多い。例えば、雑音信号N(f,K,p)に減算係数を乗算した後に、減算処理を行うようにしても良い。また例えば、反復スペクトル引き算後信号SS_out(f,K)にフロアリング処理を施してからIFFT部17に与えるようにしても良い。
上記第1の実施形態では、コヒーレンスCOH(K)を用いて全ての周波数成分で同一の反復回数を設定するものを示したが、周波数ごとに異なる反復回数を設定するようにしても良い。この場合は、例えば、コヒーレンスCOH(K)に代えて、(6)式で得られる周波数成分ごとの相関値coef(f)を用いて反復回数を決定するようにすれば良い。
上記第1の実施形態では、コヒーレンスCOH(K)が大きいほど反復回数を少なくするようにしたものを示したが、スペクトル引き算における雑音成分の推定方法によっては、逆に、コヒーレンスCOH(K)が大きいほど反復回数を多くするような構成とするようにしても良い。
上記第1の実施形態では、コヒーレンスの範囲と反復回数とを予め対応付けておき、今回のコヒーレンスが属する範囲に対応付けられている反復回数を反復スペクトル引き算処理での反復回数とするものを示したが、コヒーレンスと反復回数との関係を予め関数化しておき、今回のコヒーレンスを入力とした関数演算により、反復スペクトル引き算処理での反復回数を定めるようにしても良い。
上記第2の実施形態では、現在の反復回数でのコヒーレンスが前回の反復回数でのコヒーレンス以下であることが1回生じたことにより、反復回数ごとのコヒーレンスの挙動が増加から減少に転じたと判定するものを示したが、現在の反復回数でのコヒーレンスが前回の反復回数でのコヒーレンス以下であることが所定回(例えば2回)連続したときに、コヒーレンスの挙動が増加から減少に転じたと判定するようにしても良い。
上記第2の実施形態では、抑圧性能と音質のバランスがとれることを目標として反復回数を制御したが、抑圧性能を重視して音質を低めにしたり、反対に、音質を重視して抑圧性能を控え目に設定したりするようにしても良い。前者の場合であれば、例えば、コヒーレンスが減少に転じた以降も、予め定められている回数だけ反復処理を繰り返す。後者の場合であれば、例えば、コヒーレンスが減少に転じた反復回数より、予め定められている回数だけ前の反復回数でのスペクトル引き算処理後の信号を、出力信号とするようにすれば良い。
なお、第1の実施形態においても、変換テーブルに記述するコヒーレンスの範囲と反復回数との関係を、抑圧性能を重視して音質を低めにするように定めたり、反対に、音質を重視して抑圧性能を控え目に設定したりするように定めても良い。
上記第2の実施形態では、相前後する反復回数でのコヒーレンスの大小に基づいて、反復処理の終了を判定するものを示したが、相前後する反復回数でのコヒーレンスの傾き(微分係数)に基づいて、反復処理の終了を判定するようにしても良い。傾きが0(若しくは0±α(αは極大値を判定できる程度の小さな値)の範囲内の値)に変化したときに、反復処理を終了させると判定する。傾きは、相前後する反復回数でのコヒーレンスの算出時刻の時間差が一定の場合であれば、相前後する反復回数でのコヒーレンスの差として算出することができ、相前後する反復回数でのコヒーレンスの算出時刻の時間差が一定でない場合であれば、コヒーレンスの算出ごとにその時刻を記録しておき、相前後する反復回数でのコヒーレンスの差を、時刻の差で割ることによって算出することができる。
上記第2の実施形態では、コヒーレンスフィルタ係数(周波数成分ごとの相関値であるcoef(f))の平均であるコヒーレンスを反復処理の終了判定に利用するものを示したが、周波数成分ごとのコヒーレンスフィルタ係数coef(0,K,p)〜coef(M−1,K,p)の分布の代表値を表す統計量であれば、コヒーレンスに代えて他の統計量(例えば、メディアン)を適用するようにしても良い。
上記各実施形態では、反復処理の継続か終了かの判定に、コヒーレンスCOH(K)を用いたものを示したが、コヒーレンスCOH(K)に代えて、「入力音声信号における目的音声の含有量」という概念を持つ他の特徴量を用いて、反復処理の継続か終了かの判定を行うようにしても良い。
上記各実施形態において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良い。
上記各実施形態では、一対のマイクが捕捉した信号を直ちに処理する場合を示したが、本発明の処理対象の音声信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音声信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音声信号を処理する場合にも、本発明を適用することができる。このような変形実施形態の場合であれば、信号処理装置に入力される段階で、既に周波数領域の信号になっていても良い。
1、1A…信号処理装置、11…FFT部、12…第1の指向性形成部、13…第2の指向性形成部、14…コヒーレンス計算部、15、15A…反復回数制御部、16、16A…反復スペクトル引き算部、17…IFFT部、m1、m2…マイク、21…入力信号・反復回数受信部、21A…入力信号受信部、22…反復回数カウンタ・被減算信号初期化部、23…第3の指向性形成部、24…スペクトル引き算処理部、25…反復回数カウンタ更新・反復実施可否制御部、25A…反復実施可否制御・反復回数カウンタ更新部、26…被減算信号更新部、27…スペクトル引き算処理後信号送信部、28…被減算信号送信・反復終了フラグ受信部31…コヒーレンス受信部、32…反復回数照合部、32A…コヒーレンス挙動判定部、33…反復回数記憶部、33A…前コヒーレンス記憶部、34…反復回数送信部、34A…反復終了フラグ送信部。

Claims (5)

  1. 一対の入力音声信号の少なくとも一方に含まれている雑音成分を、反復スペクトル引き算手段がスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理装置において、
    当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、
    上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御する反復回数制御手段とを備え
    上記特徴量算出手段は、
    当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
    上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
    上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得るコヒーレンス計算部とを備える
    ことを特徴とする信号処理装置。
  2. 上記第1の指向性形成部及び上記第2の指向性形成部への一対の入力信号が上記一対の入力音声信号であり、
    上記反復回数制御手段は、上記コヒーレンス計算部が計算したコヒーレンスに応じて反復回数を定めて、上記反復スペクトル引き算手段へ通知する
    ことを特徴とする請求項に記載の信号処理装置。
  3. 上記第1の指向性形成部及び上記第2の指向性形成部への一対の入力信号が、新たな反復回数のスペクトル引き算処理に供する一対の信号であり、
    上記反復回数制御手段は、上記コヒーレンス計算部が計算したコヒーレンスが増大から減少に転じたときに、上記反復スペクトル引き算手段へ反復処理の終了を通知する
    ことを特徴とする請求項に記載の信号処理装置。
  4. 一対の入力音声信号の少なくとも一方に含まれている雑音成分を、反復スペクトル引き算手段がスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理方法において、
    特徴量算出手段が、当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出し、
    反復回数制御手段が、上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御し、
    上記特徴量算出手段の第1の指向性形成部は、当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成し、
    上記特徴量算出手段の第2の指向性形成部は、上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成し、
    上記特徴量算出手段のコヒーレンス計算部は、上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得る
    ことを特徴とする信号処理方法。
  5. 一対の入力音声信号の少なくとも一方に含まれている雑音成分をスペクトル引き算処理を反復して繰り返すことによって抑圧して出力する信号処理装置に搭載されたコンピュータを、
    当該特徴量算出手段への入力信号から、その入力信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、
    上記特徴量に基づいて、スペクトル引き算処理の反復回数を制御する反復回数制御手段として機能させ
    上記特徴量算出手段は、
    当該第1の指向性形成部への一対の入力信号に基づいて、第1の所定方位に死角を有する指向性特性を付与した第1の指向性信号を形成する第1の指向性形成部と、
    上記一対の入力信号に基づいて、上記第1の所定方位とは異なる第2の所定方位に死角を有する指向性特性を付与した第2の指向性信号を形成する第2の指向性形成部と、
    上記第1及び第2の指向性信号を用いて、上記特徴量としてのコヒーレンスを得るコヒーレンス計算部とを備える
    ことを特徴とする信号処理プログラム。
JP2013036360A 2013-02-26 2013-02-26 信号処理装置、方法及びプログラム Active JP6221258B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013036360A JP6221258B2 (ja) 2013-02-26 2013-02-26 信号処理装置、方法及びプログラム
US14/770,784 US9659575B2 (en) 2013-02-26 2013-11-20 Signal processor and method therefor
PCT/JP2013/081244 WO2014132500A1 (ja) 2013-02-26 2013-11-20 信号処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013036360A JP6221258B2 (ja) 2013-02-26 2013-02-26 信号処理装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014164191A JP2014164191A (ja) 2014-09-08
JP6221258B2 true JP6221258B2 (ja) 2017-11-01

Family

ID=51427790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013036360A Active JP6221258B2 (ja) 2013-02-26 2013-02-26 信号処理装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US9659575B2 (ja)
JP (1) JP6221258B2 (ja)
WO (1) WO2014132500A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6966039B2 (ja) * 2017-10-25 2021-11-10 住友電工デバイス・イノベーション株式会社 試験装置
CN108257617B (zh) * 2018-01-11 2021-01-19 会听声学科技(北京)有限公司 一种噪声场景识别系统及方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5299148A (en) * 1988-10-28 1994-03-29 The Regents Of The University Of California Self-coherence restoring signal extraction and estimation of signal direction of arrival
JP3278486B2 (ja) 1993-03-22 2002-04-30 セコム株式会社 日本語音声合成システム
JP3270866B2 (ja) * 1993-03-23 2002-04-02 ソニー株式会社 雑音除去方法および雑音除去装置
US5848105A (en) * 1996-10-10 1998-12-08 Gardner; William A. GMSK signal processors for improved communications capacity and quality
US6678211B2 (en) * 1998-04-03 2004-01-13 The Board Of Trustees Of The Leland Stanford Junior University Amplified tree structure technology for fiber optic sensor arrays
US6885746B2 (en) * 2001-07-31 2005-04-26 Telecordia Technologies, Inc. Crosstalk identification for spectrum management in broadband telecommunications systems
JP2004021127A (ja) * 2002-06-19 2004-01-22 Canon Inc 磁性トナー、該トナーを用いた画像形成方法及びプロセスカートリッジ
JP4247037B2 (ja) 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
US7305056B2 (en) * 2003-11-18 2007-12-04 Ibiquity Digital Corporation Coherent tracking for FM in-band on-channel receivers
US7453961B1 (en) * 2005-01-11 2008-11-18 Itt Manufacturing Enterprises, Inc. Methods and apparatus for detection of signal timing
JP4896449B2 (ja) * 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
FR2906070B1 (fr) * 2006-09-15 2009-02-06 Imra Europ Sas Soc Par Actions Reduction de bruit multi-reference pour des applications vocales en environnement automobile
JP5257366B2 (ja) * 2007-12-19 2013-08-07 富士通株式会社 雑音抑圧装置、雑音抑圧制御装置、雑音抑圧方法及び雑音抑圧プログラム
EP2196988B1 (en) * 2008-12-12 2012-09-05 Nuance Communications, Inc. Determination of the coherence of audio signals
JP5263020B2 (ja) * 2009-06-12 2013-08-14 ヤマハ株式会社 信号処理装置
US8340234B1 (en) * 2009-07-01 2012-12-25 Qualcomm Incorporated System and method for ISI based adaptive window synchronization
JP5633673B2 (ja) * 2010-05-31 2014-12-03 ヤマハ株式会社 雑音抑圧装置およびプログラム
US8682006B1 (en) * 2010-10-20 2014-03-25 Audience, Inc. Noise suppression based on null coherence
US9185490B2 (en) * 2010-11-12 2015-11-10 Bradley M. Starobin Single enclosure surround sound loudspeaker system and method
US8525868B2 (en) * 2011-01-13 2013-09-03 Qualcomm Incorporated Variable beamforming with a mobile platform
WO2012117374A1 (en) * 2011-03-03 2012-09-07 Technion R&D Foundation Coherent and self - coherent signal processing techniques
JP5817366B2 (ja) * 2011-09-12 2015-11-18 沖電気工業株式会社 音声信号処理装置、方法及びプログラム
GB2495129B (en) * 2011-09-30 2017-07-19 Skype Processing signals

Also Published As

Publication number Publication date
US20160005418A1 (en) 2016-01-07
JP2014164191A (ja) 2014-09-08
US9659575B2 (en) 2017-05-23
WO2014132500A1 (ja) 2014-09-04

Similar Documents

Publication Publication Date Title
JP6196320B2 (ja) 複数の瞬間到来方向推定を用いるインフォ−ムド空間フィルタリングのフィルタおよび方法
JP5805365B2 (ja) ノイズ推定装置及び方法とそれを利用したノイズ減少装置
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
JP5672770B2 (ja) マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
WO2014054314A1 (ja) 音声信号処理装置、方法及びプログラム
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
US11380312B1 (en) Residual echo suppression for keyword detection
JP6221257B2 (ja) 信号処理装置、方法及びプログラム
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
JP6314475B2 (ja) 音声信号処理装置及びプログラム
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
JP6295650B2 (ja) 音声信号処理装置及びプログラム
JP6263890B2 (ja) 音声信号処理装置及びプログラム
JP6221463B2 (ja) 音声信号処理装置及びプログラム
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置
JP6102144B2 (ja) 音響信号処理装置、方法及びプログラム
JP6252274B2 (ja) 背景雑音区間推定装置及びプログラム
JP2014164192A (ja) 信号処理装置、方法及びプログラム
JP2015025914A (ja) 音声信号処理装置及びプログラム
JP6903947B2 (ja) 非目的音抑圧装置、方法及びプログラム
JP6213324B2 (ja) 音声信号処理装置及びプログラム
JP6314608B2 (ja) エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法
JP2017067990A (ja) 音声処理装置、プログラム及び方法
JP2017067950A (ja) 音声処理装置、プログラム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170918

R150 Certificate of patent or registration of utility model

Ref document number: 6221258

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150