JP2006276856A - 音声信号前処理システム - Google Patents

音声信号前処理システム Download PDF

Info

Publication number
JP2006276856A
JP2006276856A JP2006080355A JP2006080355A JP2006276856A JP 2006276856 A JP2006276856 A JP 2006276856A JP 2006080355 A JP2006080355 A JP 2006080355A JP 2006080355 A JP2006080355 A JP 2006080355A JP 2006276856 A JP2006276856 A JP 2006276856A
Authority
JP
Japan
Prior art keywords
signal
filter bank
noise
frequency band
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006080355A
Other languages
English (en)
Other versions
JP4775056B2 (ja
Inventor
Michel Gaeta
ガエタ ミッシェル
Abderrahman Essebbar
エスバー アブデラマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisin Corp
Original Assignee
Aisin Seiki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisin Seiki Co Ltd filed Critical Aisin Seiki Co Ltd
Publication of JP2006276856A publication Critical patent/JP2006276856A/ja
Application granted granted Critical
Publication of JP4775056B2 publication Critical patent/JP4775056B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

【課題】 音声信号受信中の雑音低減を効果的に行うことができる自動音声認識システム用の音声信号前処理システムを提供する。
【解決手段】 音声信号前処理システムは、音声信号を検出する音響センサと、室内の雑音信号を検出する非音響センサと、音声信号前処理部と、第二フィルタバンクを介し音響センサを前処理部に接続する第二信号処理部と、第一フィルタバンクを介し非音響センサを前処理部に接続する第一信号処理部とからなり、両フィルタバンクは、複数のサブバンドへ受信信号を分離し、前処理部は、コヒーレント周波数帯域信号処理部と、非コヒーレント周波数帯域信号処理部と、受信信号のコヒーレンス特性によりこれらのいずれかを選択する前処理方法選定部とを備え、非コヒーレント周波数帯域信号処理部は室内を伝播する信号の伝達関数を推定する伝達関数推定手段とを有している。
【選択図】 図3

Description

本発明は、自動音声認識システムに適用される音声信号の前処理に関するものである。より詳細には、車両に設けられた自動音声認識システムに適用される音声信号の前処理に関するものである。
安全面の観点では、車両の運転手からの音声指令によって、直接運転に関わらない機器が安全に操作でき、本来の運転操作に集中できることが好ましい。しかし、車両環境は外乱の影響を受けやすく、例えば、風、タイヤ回転、機械的振動、オーディオ系統、ワイパーの摩擦、ウィンカーの信号といった様々な雑音源を有する。よって、これら雑音源から発生した雑音成分が混在する環境の中で運転手の音声指令を正しく抽出するには、自動音声認識システムによる信号解析の前に、まずは観測した信号を処理する必要がある。ここでいう「雑音」とは、騒音、不快音、及び混信などの妨害(例えば電波障害)を意味する。
詳細には、本発明は、音声指令信号が自動音声認識システムに入力される前に本信号を処理することに関する。この前処理によって信号品質がアップすると/音声明瞭度が高まると、自動音声認識システムの信頼性が高まるので、より多くのユーザにより受け入れられる。
自動音声認識システムによる信号解析の前により良質な音声信号(希望信号)を得るために、観測信号から雑音を除去/低減するという従来の方法は既に知られている。図1に示すのは、自動音声認識システムへ音声信号を伝送する前に雑音成分を除去/低減するという指令信号処理の標準的な方法を説明する図である。音声信号s(n)は雑音信号d(n)によって乱され、観測信号y(n)として生成される。この観測信号y(n)は前処理部2へ伝送され、前処理部2では、雑音成分が除去/低減されることで信号品質が向上する/音声明瞭度が高まる。このような前処理部2による雑音除去を介して出力される希望信号s(n)は、自動音声認識部63へ伝送される。
しかし、雑音は様々な源から発生する場合が殆どなので、モデル化が難しい。よって、
効率よく雑音成分を減衰可能なフィルタ決定が難しい場合がある。
さらに、雑音特性に関する誤ったモデリングや不正確な推定に基づいて決定した不適切なフィルタを用いる雑音除去(音声前処理)を施すと、音声信号が部分的に欠損する。この場合、前処理を施さない場合よりも音声明瞭度が低下することもある。
音声信号品質の向上として、いくつかの解決策が提案されている。例えば、話者方向に指向性を制御したマイクロホンアレーをビームフォーマ(指向性制御)とリンクして使用することで特定方向に受ける信号のゲインを大きくし、特定方向の雑音や妨害から自動音声認識システムが受ける影響を軽減することができることは周知の通りである。
しかし、このようなマイクロホンアレーを用いた指向性制御は、指向性を高めようとするほどコストがかかる。また、車両の内装美に関わる制約から判断すると、車両へ簡単には実装しにくい。更に、マイクロホンアレーが受信する車両環境内の外乱は、自動音声認識システムの精度に対する主要な障害ではないので、充分な音声認識性能を依然発揮しにくいままとなる。結果、限られた構造のみでしか問題に対応できなかったり、問題全体の解決には至らないことになる。
他の解決策として、雑音参照信号を得るための雑音参照信号センサを付随することで雑音や妨害を低減する方法がある。例えば、第一マイクロホンを運転手近くに設置し、第二マイクロホンを運転手から遠くに設置する。こうすることで、第一マイクロホンは音声指令、つまり希望信号を受信し、一方、第二マイクロホンは基本的には雑音信号のみを感知する。しかし、発話者(この場合は運転手)から遠くに設置されたマイクロホンでは発話者周辺の局所雑音である信号を受信しづらいので、この解決方法は実際にはそれほど効果的ではない。結果、マイクロホンが発話者から離れている場合、不正確な雑音参照信号が生成されることとなり、上述の通り、この雑音参照信号は自動音声認識システムにおける使用に適さない。反対に、第二マイクロホンが発話者近くに設置されていると、第二マイクロホンが受信する信号には、発話者周辺の局所雑音に相当する雑音成分が反映可能である一方、第二マイクロホンの信号への希望信号の混入を防ぐことが大変困難となる。この場合、希望信号そのものが雑音成分として誤認されてしまい、雑音サブトラクション(雑音低減方法)により誤って抑圧されてしまうので、上記方法では、希望信号の部分的な欠損、もしくは希望信号全体的な破綻につながりうる。
この問題を解決するに当たり他の観点では、雑音参照信号決定手段として考えられる非音響センサと音響センサを併用する方法がある。例えば、オーディオ系統のスピーカに伝達される電気信号を雑音参照信号のソースとして用いることで雑音処理を行う音声信号処理装置が、後述の特許文献1に記載されている。この装置では、雑音参照信号は音響領域に属する希望信号の影響を受けない電気領域に属するので、雑音参照信号と希望信号の結合を回避できる。
非音響センサと音響センサを併用する音声処理方法のその他の例として、振動検出器が挙げられる。振動検出器には、一般的に、次の2タイプのセンサがある。1つは発話者の体に接触している接触センサで、もう1つは、接触していない非接触センサである。1つ目のセンサ(接触式)を車両の運転手へ適用すると、かなりの制約が生じるため好ましくない。しかし、二つ目のセンサ(非接触式)は、本発明が適用可能な用途には適していると考えられ、本出願明細書内においても考察される。
雑音信号を除去/低減する他の可能性としては、音声信号受信前に雑音成分を推定し、希望信号と雑音から構成される混合信号の受信中に受信信号から雑音成分を減算する方法がある。この方法を適切に行うには、音声状態検出器を用いて音声の有無を検出し、音声信号受信直前の雑音推定値を受信信号から音声信号受信中(つまり、音声状態検出器により音声有りと検出した場合)に減算する必要がある。それには、音声信号レベルは大抵、バックグラウンドノイズレベルよりもパワーが高いと考えられる。よって、音声信号の振幅のしきい値を用いれば、音声信号受信フレームが検出でき、事前に推定した雑音は、前記の方法によって抑圧できる。
特開平2−244099号公報
しかし、上記に記載した閾値に基づく音声信号受信フレーム検出方法は、例えば摩擦音や無声音に対してはロバストではない。更に、この検出方法は、音声信号受信中は雑音が発生/変化しないことが絶対前提条件となっている。しかしながら、本検出方法を適用するであろう用途から鑑みると、一般に車両環境は、非定常的な雑音や妨害の原因となる環境が強いられ、車速(加速度や減速度)、オーディオ系統の出力、ワイパー操作、ウィンカー点滅などにより変動する。これより、上記の前提条件はこういった非定常的な車両環境にはあきらかに適用できない。つまり、音声信号受信フレーム中の雑音変動を考慮することが必要であり、雑音成分に関する固定の前提条件を設けることなく、音声信号受信中でも継続的に雑音低減の実現が必要である。
よって、本発明は上記に鑑みてなされたものであり、音声信号受信中の雑音低減も効果的に実現できる自動音声認識システム用の音声信号前処理システムを提供するものである。
本発明にて講じた技術的解決手段は、請求項1記載のように、室内空間の非音響雑音信号を検出する少なくとも一つの非音響センサと、該非音響センサに接続され前記非音響雑音信号に所定の処理を行うための第一音声信号処理部と、該第一信号処理部に接続され前記非音響雑音信号を複数の周波数帯域信号に分離する第一フィルタバンクと、特定者が放つ音声信号を検出する少なくとも一つの音響センサと、該音響センサに接続され受信信号に所定の処理を行うための第二信号処理部と、該第二信号処理部に接続され受信信号を複数の周波数帯域信号に分離する第二フィルタバンクと、前記第一フィルタバンク及び前記第ニフィルタバンクからの受信信号を用いて、前記第二フィルタバンクから伝送される受信信号を音声自動認識システム用に前処理するための音声信号前処理部と、を備える音声信号処理システムにおいて、前記音声信号前処理部は、前記第一フィルタバンク及び前記第二フィルタバンクから伝送されるコヒーレント周波数帯域信号に基づき、前記第二フィルタバンクから伝送される受信信号から雑音信号を低減するためのコヒーレント周波数帯域処理部と、前記一フィルタバンク及び前記第二フィルタバンクから伝送される非コヒーレントな周波数帯域信号に基づき、前記第二フィルタバンクから伝送される受信信号から雑音信号を低減するための非コヒーレント周波数帯域処理部と、前記第一フィルタバンク及び前記第ニフィルタバンクから伝送された信号のコヒーレンス特性を判断し、前記第一フィルタバンク及び前記第ニフィルタバンクから伝送される受信信号がコヒーレントな周波数帯域信号である場合、前記コヒーレント周波数帯域信号処理部により処理し、前記第一フィルタバンク及び前記第ニフィルタバンクから伝送される受信信号が非コヒーレントな周波数帯域信号の場合、前記非コヒーレント周波数帯域信号処理部により処理する前処理方法選定部と、前記コヒーレント周波数帯域処理部と前記非コヒーレント周波数帯域処理部とにより雑音信号が低減された信号を合成する周波数帯域合成部とを備え、前記非コヒーレント周波数帯域処理部は、前記第一フィルタバンクから伝送された雑音信号に基づき伝達関数を推定する伝達関数推定部と、該伝達関数推定部により推定された伝達関数と前記第一フィルタバンクから伝送される受信信号に基づいて、雑音信号の推定を更新するための瞬時雑音推定手段とを備え、該推定された雑音信号と前記第二フィルタバンクから伝送される受信信号に基づき雑音信号を低減すると良い。
好ましくは、請求項2記載のように、前記音声信号を検知したとき、前記伝達関数推定手段での伝達関数の推定の更新を自動的に停止する音声状態検出器を備えると良い。
好ましくは、請求項3記載のように、前記音声状態検出器へ信号を伝送する非音響センサを有すると良い。
好ましくは、請求項4記載のように、前記非コヒーレント周波数帯域信号処理部は、前記瞬時雑音推定手段にて推定された雑音信号の推定値を受信し、前記音声信号から該雑音信号の推定値を減算するスペクトル減算手段を有すると良い。
好ましくは、請求項5記載のように、前記コヒーレント周波数帯域信号処理部は、前記第一フィルタバンクから伝送される音声信号から雑音信号の推定値を減算することで音声信号から雑音信号を低減するものであると良い。
好ましくは、請求項6記載のように、前記自動音声認識システムは、車両用音声認識システムであると良い。
本発明の音声信号前処理システムは、車両用音声自動認識以外の用途にも適用可能であることは明らかである。
また、本発明にて講じた技術的解決手段は、特定者が放つ音声信号を検出する少なくとも一つの音響センサと、室内空間の非音響雑音信号を検出する少なくとも一つの非音響センサと、音声信号前処理部と、第一フィルタバンクを介して前記非音響センサを前記音声信号前処理部に接続する第一信号処理部と、第二フィルタバンクを介して前記音響センサを前記音声信号前処理部に接続する第二信号処理部とを備え、前記第一フィルタバンクと前記第二フィルタバンクは、複数の周波数サブバンドへ各々受信した信号を分離し、前記音声前処理部は、前記第一フィルタバンクによって伝送された信号から雑音を低減するために、コヒーレント周波数帯域の信号を処理するコヒーレント周波数帯域信号処理部と、非コヒーレント周波数帯域の信号を処理し、前記室内空間の信号の伝達関数を推定する伝達関数推定手段を有する非コヒーレント周波数帯域信号処理部と、前記第一フィルタバンクと前記第二フィルタバンクから受信した信号のコヒーレンス特性を決定し、前記コヒーレント周波数帯域信号処理部と前記非コヒーレント周波数帯域信号処理部のうち一つを選択する前処理方法選定部と、を備える自動音声認識システム用の音声信号前処理システムである。
本発明の音声信号前処理システムによれば、音声信号受信中も雑音源の雑音成分が推定できるので、音声信号受信中の雑音低減も効果的に実現できる。また、本発明の音声信号前処理システムによれば、精度良く、信頼性高く、安価に、雑音低減を実現することが音声信号前処理システムを提供することができる。
以下、本発明を実施するための最良の形態を、図面を基に説明する。図2は、自動音声認識システムに用いられる車両の室内空間の雑音源およびセンサを示す概略図である。
車両の室内空間には、例えばマイクロホンやマイクロホンアレー等、車両の運転手7が発声する音声信号を検出するように構成及び配置された少なくとも一つの音響センサ1が設けられる。運転手7が発話するとき、希望信号s(n)である音声指令信号を発することもある。この希望信号s(n)は、自動音声認識システムが解析する車両操作指令として最終的に活用される。図2の付番9により示される複数の雑音源や妨害源は、車両の外的環境、車両の運転状況、及び車両の室内空間の状況に応じた関数であり、時間と共に変化する雑音信号d(n)を生成する。図2において付番4により概略的に示される車両の室内空間(以下、車室とする。)は、雑音源からセンサへ伝送される信号の伝搬媒質に実際のところ相当する。よって、音響センサ1は雑音信号d(n)及び希望信号s(n)から構成される信号y(n)を受信する。
本実施例では、非音響センサ/センサ群11は、タイヤ回転やエンジン作動などに起因する振動のような雑音源や妨害源から放たれる非音響信号d’(n)を計測するように構成されている。非音響センサ11によって実測される非音響信号d’(n)は、雑音参照信号として用いられる。実際、音声信号受信中の雑音や妨害を定常であるとする仮定ほど制限的ではないが、より現実的に考えても、非音響信号d’(n)として実測される雑音は、媒質である車室内を略定常的に伝搬すると考えることができる。実際、車室内における幾何学的配置、材料組成や音響特性は、音声信号受信中でも略一定であるという事実によりこれは立証される。よって、希望信号受信中であっても、雑音源とセンサ群11間の非音響信号d’(n)の伝達関数は、略定常的である。よって、非音響センサ群11の非音響信号d’(n)を用い、雑音の伝搬特性である伝達関数を推定するだけで、従来の様に音声信号受信中は雑音は定常であると仮定することなく、雑音信号d(n)の変化を継続的に推定でき、雑音参照信号内に希望信号が混入することを防ぐことができる。
上記によると、雑音源9の雑音信号d(n)の実測は必要なく、より定常的であり、音声信号受信中も略安定していると考えられる伝搬媒質の伝達関数を推定するだけで、雑音や妨害が希望信号受信中に大幅に変動し続けたとしても、音声信号受信中に雑音や妨害を継続的に推定でき、またそれらを継続的に除去/低減もできる。
図3は、本実施例による音声信号前処理部を備える前処理システムの概略図を示す。非音響センサ群11は、第一信号処理部12と第一フィルタバンク13を介して音声信号前処理部5に接続している。第一信号処理部12は、非音響センサ/センサ群11から受信する非音響信号d’(n)内のインパルスノイズの有無を検出し、インパルスノイズを除いた信号が第一フィルタバンク13を介して前処理システム内を伝搬する。第一フィルタバンク13の受信信号は、第一フィルタバンク13にて複数のスペクトル帯域へ分離され、各帯域ごとに適合した雑音・妨害減衰処理が以下の手順にて行われる。こうして複数のスペクトル帯域へ分離された信号は、音声信号前処理部5へ伝送される。
他方、音響センサ/センサ群1は、第二信号処理部14と第二フィルタバンク15を介して音声信号前処理部5に接続している。第二信号処理部14は、使われるセンサの機能に応じて受信信号を適合させる。例えば、マイクロホンアレーがセンサとして用いられている場合、従来のマイクロホンアレーを用いた音声処理方法を適用する。 第二信号処理部14で信号処理された信号は、 第二フィルタバンク15へ伝送される。第二フィルタバンク15の受信信号は、第二フィルタバンク15にて複数のスペクトル帯域へ分離され、各帯域ごとに適合した雑音・妨害減衰処理が以下の手順にて行われる。こうして複数のスペクトル帯域へ分離された信号は、音声信号前処理部5へ伝送される。
次に、本実施例による音声信号前処理部5をより詳細に説明する。音声信号前処理部5は、信号特性に応じて受信信号を処理するいくつかの部分から構成されている。各帯域に分離した信号は、音声信号前処理部5にてスペクトルサブバンド化され、各スペクトルサブバンド(サブ帯域)ごとに適合した雑音・妨害減衰処理が行われる。
音声信号前処理部5は、前処理方法選定部51を備える。前処理方法選定部51は、例えば第一フィルタバンク13、第二フィルタバンク15からの出力信号の帯域幅、コヒーレンス(相関性)、及び/または状態を基に前処理方法を決定する。この解析結果によって、前処理方法選定部51は、コヒーレント周波数帯域の信号を処理するコヒーレント周波数帯域信号処理部52か、非コヒーレント周波数帯域もしくは弱コヒーレント周波数帯域の信号を処理する非コヒーレント周波数帯域信号処理部53のどちらかを選択する。
また、請求項で示す非コヒーレントとは、非コヒーレント及び弱コヒーレントを含む概念である。
前処理方法選定部51は、第一フィルタバンク13,第二フィルタバンク15から受信した信号のコヒーレンス(相関性)を測定する。ある信号周波数帯域におけるコヒーレンス値が高い場合、前処理方法選定部51はコヒーレント周波数帯域信号処理部52を選択する。コヒーレント周波数帯域信号処理部52では、複数の参照信号を用いた従来の雑音除去による直交性の原理に基づく雑音低減方法が受信信号y(n)に適用される。その雑音低減方法としては、例えば、受信信号y(n)から雑音信号d’(n)の推定値を減算することで希望信号s(n)の推定値を得る方法がある。実際多くの方法が知られているが、例えば、ウィナーフィルターという雑音低減方法が利用可能であるが、詳細な説明はここでは省略する。
非コヒーレント周波数帯域信号処理部53は、伝達関数推定手段55、瞬時雑音推定手段57及びスペクトル減算手段59を有する。図4は、非コヒーレント周波数帯域信号処理部53の詳細を示す概略図である。伝達関数推定手段55は、希望信号s(n)と雑音信号d(n)から構成される受信信号y(n)を受信する。車室内の伝搬媒質は、音声信号受信中も略安定しているので、伝達関数もこの期間中安定していると考えられる。よって、雑音源にて生成される雑音の周波数を非音響センサ群11にて実測し、伝達関数を推定することで、車室内の雑音変動を知ることができる。結果、雑音信号d(n)は、希望信号受信中であっても、継続的に推定及び適合される。よって、従来の雑音信号スペクトル減算にて希望信号から減算されるべき雑音参照信号の信頼性がより高まり、希望信号に含まれる雑音成分がより効果的に低減する。伝達関数推定手段55は伝達関数推定値を出力し、その伝達関数推定値は瞬時雑音推定手段57へ伝送される。これについては、以下に詳細を説明する。
瞬時雑音推定手段57は、非音響センサ群11の実測値d’(n)を受信し、伝達関数推定手段55の推定結果を用いて雑音信号d(n)の推定値を更新する。瞬時雑音推定手段57は、継続的に更新される雑音信号d(n)の推定値をスペクトル減算手段59へ伝送する。
スペクトル減算手段59は、フィルタバンク15から受信する信号から雑音スペクトル推定値を減算する。ここでの詳細な説明は省略するが、雑音の短時間スペクトルは、話者が発話を休止している間に通常測定され、雑音の混入した音声スペクトルの補正に用いられる。
有利な点としては、本実施例の前処理システムは、周知の音声状態検出器を更に有している。車両の運転者が発話し始めると(つまり、音声状態検出器が音声有りと検出した場合)、伝達関数推定値の更新を自動的に停止し、一方、車両の運転者が発話を止めると(つまり、音声状態検出器が音声無しと検出した場合)伝達関数推定値の更新を再開する。
好ましくは、音声状態検出器は、感度や信頼性向上を図るために、非音響センサ21に接続しているとよい。このような音声状態検出器は、図3において付番54で示され、音声信号前処理部5に備えられ、第一フィルタバンク13、第二フィルタバンク15の信号を受信する。非音響センサ21も本前処理システムに含まれ、音声状態検出器54へ信号を伝送する。
音声信号受信有無に応じた、伝達関数推定手段55での伝達関数推定値の更新や凍結制御として、希望信号と雑音信号から構成される信号y(n)を受信し、非音響センサ21の信号をも受信する音声状態検出器54によって、更新指令が伝達関数推定手段55へ送られる。ここで言う非音響センサ21とは、例えば、運転席に座る運転手近傍に配置された振動センサタイプのものであっても良い。
音声信号を受信した音声状態検出器54は、伝達関数推定手段55をフリーズモードにすることで伝達関数の推定を停止する指令を伝達関数推定手段55へ送る。よって、音声信号が受信される間は、伝達関数は更新されないが、雑音推定値d(n)は、瞬時雑音推定手段57により更新され続ける。
これ以上音声信号が受信されなくなると直ちに、音声状態検出器54は、伝達関数推定手段55を更新モードにすることで伝達関数の推定を許可する指令を伝達関数推定手段55へ送る。
コヒーレント周波数帯域信号処理部52で推定された信号及び非コヒーレント周波数帯域信号処理部53にて算出された信号は、周波数帯域合成部61にて合成される。よって、雑音成分が効果的に抑圧された仮希望信号s(n)が自動音声認識システム63へ送信される。
図1は、雑音信号低減の一般的方法を示す概略図である。 図2は、一実施形態の自動音声認識システムに係る車室内の雑音源およびセンサを示す概略図である。 図3は、一実施形態の音声信号前処理部を有する音声信号前処理システムの簡略化したブロック図である。 図4は、一実施形態の音声信号前処理部の要部を示すブロック図である。
符号の説明
1 音響センサ
4 車両の室内空間
5 音声信号前処理部
7 運転手
9 複数の雑音源や妨害源
11 非音響センサ
12 第一信号処理部
13 第一フィルタバンク
14 第二信号処理部
15 第二フィルタバンク
51 前処理方法選定部
52 コヒーレント周波数帯域信号処理部
53 非コヒーレント周波数帯域信号処理部
54 音声状態検出器
55 伝達関数推定手段
57 瞬時雑音推定手段
59 スペクトル減算手段
61 周波数帯域合成部
63 自動音声認識システム

Claims (6)

  1. 室内空間の非音響雑音信号を検出する少なくとも一つの非音響センサと、該非音響センサに接続され前記非音響雑音信号に所定の処理を行うための第一音声信号処理部と、
    該第一信号処理部に接続され前記非音響雑音信号を複数の周波数帯域信号に分離する第一フィルタバンクと、
    特定者が放つ音声信号を検出する少なくとも一つの音響センサと、
    該音響センサに接続され該音響センサからの受信信号に所定の処理を行うための第二信号処理部と、
    該第二信号処理部に接続され受信信号を複数の周波数帯域信号に分離する第二フィルタバンクと、
    前記第一フィルタバンク及び前記第ニフィルタバンクからの受信信号を用いて、前記第二フィルタバンクから伝送される受信信号を音声自動認識システム用に前処理するための音声信号前処理部と、
    を備える音声信号処理システムにおいて、
    前記音声信号前処理部は、
    前記第一フィルタバンク及び前記第二フィルタバンクから伝送されるコヒーレント周波数帯域信号に基づき、前記第二フィルタバンクから伝送される受信信号から雑音信号を低減するためのコヒーレント周波数帯域処理部と、
    前記一フィルタバンク及び前記第二フィルタバンクから伝送される非コヒーレントな周波数帯域信号に基づき、前記第二フィルタバンクから伝送される受信信号から雑音信号を低減するための非コヒーレント周波数帯域処理部と、
    前記第一フィルタバンク及び前記第ニフィルタバンクから伝送された信号のコヒーレンス特性を判断し、前記第一フィルタバンク及び前記第ニフィルタバンクから伝送される受信信号がコヒーレントな周波数帯域信号である場合、前記コヒーレント周波数帯域信号処理部により処理し、前記第一フィルタバンク及び前記第ニフィルタバンクから伝送される受信信号が非コヒーレントな周波数帯域信号の場合、前記非コヒーレント周波数帯域信号処理部により処理する前処理方法選定部と、
    前記コヒーレント周波数帯域処理部と前記非コヒーレント周波数帯域処理部とにより雑音信号が低減された信号を合成する周波数帯域合成部とを備え、
    前記非コヒーレント周波数帯域処理部は、前記第一フィルタバンクから伝送された雑音信号に基づき伝達関数を推定する伝達関数推定部と、該伝達関数推定部により推定された伝達関数と前記第一フィルタバンクから伝送される受信信号に基づいて、雑音信号の推定を更新するための瞬時雑音推定手段とを備え、該推定された雑音信号と前記第二フィルタバンクから伝送される受信信号に基づき雑音信号を低減することを特徴とする自動音声認識システム用の音声信号前処理システム。
  2. 前記音声信号を検知したとき、前記伝達関数推定手段での伝達関数の推定の更新を自動的に停止する音声状態検出器を備える請求項1記載の自動音声認識システム用の声信号前処理システム。
  3. 前記音声状態検出器へ信号を伝送する非音響センサを有する請求項2記載の自動音声認識システム用の音声信号前処理システム。
  4. 前記非コヒーレント周波数帯域信号処理部は、前記瞬時雑音推定手段にて推定された雑音信号の推定値を受信し、前記受信信号から該雑音信号の推定値を減算するスペクトル減算手段を有する請求項1ないし3のいずれかに記載の自動音声認識システム用の音声信号前処理システム。
  5. 前記コヒーレント周波数帯域信号処理部は、前記第二フィルタバンクから伝送される受信信号から雑音信号の推定値を減算することにより音声信号を得るものである請求項1ないし4のいずれかに記載の自動音声認識システム用の音声信号前処理システム。
  6. 前記自動音声認識システムは、車両用音声認識システムである請求項1ないし5のいずれかに記載の自動音声認識システム用の音声信号前処理システム。
JP2006080355A 2005-03-25 2006-03-23 音声信号前処理システム Expired - Fee Related JP4775056B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0503008 2005-03-25
FR0503008A FR2883656B1 (fr) 2005-03-25 2005-03-25 Traitement continu de la parole utilisant une fonction de transfert heterogene et adaptee

Publications (2)

Publication Number Publication Date
JP2006276856A true JP2006276856A (ja) 2006-10-12
JP4775056B2 JP4775056B2 (ja) 2011-09-21

Family

ID=36956232

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006080355A Expired - Fee Related JP4775056B2 (ja) 2005-03-25 2006-03-23 音声信号前処理システム

Country Status (3)

Country Link
US (1) US7693712B2 (ja)
JP (1) JP4775056B2 (ja)
FR (1) FR2883656B1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012068342A (ja) * 2010-09-22 2012-04-05 Nec Tokin Corp 雑音除去装置
JP2013532308A (ja) * 2010-06-01 2013-08-15 クゥアルコム・インコーポレイテッド オーディオ等化のためのシステム、方法、デバイス、装置、およびコンピュータプログラム製品
WO2013136742A1 (ja) * 2012-03-14 2013-09-19 パナソニック株式会社 車載通話装置
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147411A1 (en) * 2006-12-19 2008-06-19 International Business Machines Corporation Adaptation of a speech processing system from external input that is not directly related to sounds in an operational acoustic environment
US8265937B2 (en) * 2008-01-29 2012-09-11 Digital Voice Systems, Inc. Breathing apparatus speech enhancement using reference sensor
US8712069B1 (en) * 2010-04-19 2014-04-29 Audience, Inc. Selection of system parameters based on non-acoustic sensor information
US10115392B2 (en) * 2010-06-03 2018-10-30 Visteon Global Technologies, Inc. Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system
US9772815B1 (en) 2013-11-14 2017-09-26 Knowles Electronics, Llc Personalized operation of a mobile device using acoustic and non-acoustic information
US8861745B2 (en) * 2010-12-01 2014-10-14 Cambridge Silicon Radio Limited Wind noise mitigation
US9459276B2 (en) 2012-01-06 2016-10-04 Sensor Platforms, Inc. System and method for device self-calibration
US9726498B2 (en) 2012-11-29 2017-08-08 Sensor Platforms, Inc. Combining monitoring sensor measurements and system signals to determine device context
US9781106B1 (en) 2013-11-20 2017-10-03 Knowles Electronics, Llc Method for modeling user possession of mobile device for user authentication framework
US9500739B2 (en) 2014-03-28 2016-11-22 Knowles Electronics, Llc Estimating and tracking multiple attributes of multiple objects from multi-sensor data
US9454952B2 (en) 2014-11-11 2016-09-27 GM Global Technology Operations LLC Systems and methods for controlling noise in a vehicle
US10564925B2 (en) 2017-02-07 2020-02-18 Avnera Corporation User voice activity detection methods, devices, assemblies, and components
JP2019124881A (ja) * 2018-01-19 2019-07-25 トヨタ自動車株式会社 音声認識装置および音声認識方法
EP4292295A1 (en) 2021-02-11 2023-12-20 Nuance Communications, Inc. Multi-channel speech compression system and method
US20220254357A1 (en) * 2021-02-11 2022-08-11 Nuance Communications, Inc. Multi-channel speech compression system and method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01239596A (ja) * 1988-03-14 1989-09-25 Internatl Business Mach Corp <Ibm> 雑音消去装置
JPH04245300A (ja) * 1991-01-30 1992-09-01 Nec Corp 雑音除去装置
JPH05119794A (ja) * 1991-10-25 1993-05-18 Matsushita Electric Ind Co Ltd 収音装置
JPH0667691A (ja) * 1992-08-18 1994-03-11 Nec Corp 雑音除去装置
JPH1097281A (ja) * 1996-09-19 1998-04-14 Sony Corp 音声認識装置及びナビゲーション装置
JP2005536128A (ja) * 2002-08-16 2005-11-24 エマ ミックスド シグナル シー. ブイ. 適応型フィルタを用いてサブバンド信号を処理する方法及びシステム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2874176B2 (ja) 1989-03-16 1999-03-24 アイシン精機株式会社 音声信号処理装置
US5574824A (en) * 1994-04-11 1996-11-12 The United States Of America As Represented By The Secretary Of The Air Force Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
AU6244399A (en) * 1998-09-09 2000-03-27 Ericsson Inc. Apparatus and method for transmitting an improved voice signal over a communications device located in a vehicle with adaptive vibration noise cancellation
US7617099B2 (en) * 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
JP4123835B2 (ja) 2002-06-13 2008-07-23 松下電器産業株式会社 雑音抑圧装置および雑音抑圧方法
JP4352790B2 (ja) * 2002-10-31 2009-10-28 セイコーエプソン株式会社 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物
JP2004198810A (ja) 2002-12-19 2004-07-15 Denso Corp 音声認識装置
GB2398913B (en) * 2003-02-27 2005-08-17 Motorola Inc Noise estimation in speech recognition
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01239596A (ja) * 1988-03-14 1989-09-25 Internatl Business Mach Corp <Ibm> 雑音消去装置
JPH04245300A (ja) * 1991-01-30 1992-09-01 Nec Corp 雑音除去装置
JPH05119794A (ja) * 1991-10-25 1993-05-18 Matsushita Electric Ind Co Ltd 収音装置
JPH0667691A (ja) * 1992-08-18 1994-03-11 Nec Corp 雑音除去装置
JPH1097281A (ja) * 1996-09-19 1998-04-14 Sony Corp 音声認識装置及びナビゲーション装置
JP2005536128A (ja) * 2002-08-16 2005-11-24 エマ ミックスド シグナル シー. ブイ. 適応型フィルタを用いてサブバンド信号を処理する方法及びシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
JP2013532308A (ja) * 2010-06-01 2013-08-15 クゥアルコム・インコーポレイテッド オーディオ等化のためのシステム、方法、デバイス、装置、およびコンピュータプログラム製品
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
JP2012068342A (ja) * 2010-09-22 2012-04-05 Nec Tokin Corp 雑音除去装置
WO2013136742A1 (ja) * 2012-03-14 2013-09-19 パナソニック株式会社 車載通話装置

Also Published As

Publication number Publication date
US7693712B2 (en) 2010-04-06
JP4775056B2 (ja) 2011-09-21
FR2883656A1 (fr) 2006-09-29
US20060217977A1 (en) 2006-09-28
FR2883656B1 (fr) 2008-09-19

Similar Documents

Publication Publication Date Title
JP4775056B2 (ja) 音声信号前処理システム
US8050914B2 (en) System enhancement of speech signals
US9997173B2 (en) System and method for performing automatic gain control using an accelerometer in a headset
US9311928B1 (en) Method and system for noise reduction and speech enhancement
CA2562981C (en) Minimization of transient noises in a voice signal
EP2770750B1 (en) Detecting and switching between noise reduction modes in multi-microphone mobile devices
RU2595636C2 (ru) Система и способ для генерации аудиосигнала
US7020288B1 (en) Noise reduction apparatus
US8073689B2 (en) Repetitive transient noise removal
JP2000148172A (ja) 音声の動作特性検出装置および検出方法
US20100267340A1 (en) Method and apparatus to transmit signals in a communication system
JP2002508891A (ja) 特に補聴器における雑音を低減する装置および方法
US20170365249A1 (en) System and method of performing automatic speech recognition using end-pointing markers generated using accelerometer-based voice activity detector
JP2010061151A (ja) 雑音環境のための音声活動検出器及び有効化器
US20140244245A1 (en) Method for soundproofing an audio signal by an algorithm with a variable spectral gain and a dynamically modulatable hardness
JP2011033717A (ja) 雑音抑圧装置
JP4579301B2 (ja) エコー消去装置
EP2823584A2 (en) Voice signal enhancement
EP2823480A2 (en) Formant based speech reconstruction from noisy signals
JP2008070878A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
KR20220130744A (ko) 풍절음 감쇠를 위한 방법 및 장치
US7224809B2 (en) Method for the acoustic localization of persons in an area of detection
JP2007093635A (ja) 既知雑音除去装置
JP2008070877A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
Freudenberger et al. A noise PSD and cross-PSD estimation for two-microphone speech enhancement systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110613

R151 Written notification of patent or utility model registration

Ref document number: 4775056

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140708

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees