JP4649905B2 - 音声入力装置 - Google Patents
音声入力装置 Download PDFInfo
- Publication number
- JP4649905B2 JP4649905B2 JP2004225189A JP2004225189A JP4649905B2 JP 4649905 B2 JP4649905 B2 JP 4649905B2 JP 2004225189 A JP2004225189 A JP 2004225189A JP 2004225189 A JP2004225189 A JP 2004225189A JP 4649905 B2 JP4649905 B2 JP 4649905B2
- Authority
- JP
- Japan
- Prior art keywords
- standard
- filter
- sound
- information
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本実施形態は、本発明の基本的な実施形態である。図1にその基本的な構成例を示す。尚、図1の矢印(a)は入力信号を、矢印(b)は出力信号を示す。
各部の基本的な機能と具体的な実現手段について、図2を用いて説明する。
実環境において発生することが予測される雑音成分をN個のM次元代表点を用いて表現した信号および該代表点に対応する1つ以上の車両信号の組み合わせである雑音成分の識別コードから構成される情報であり、
前記標準記憶部の記憶する標準目的信号情報とは、例えば、実環境において入力されることが予測される目的信号をX個のY次元代表点を用いて表現した信号と、該代表点に対応する1つ以上の声質情報の組み合わせである目的信号の識別コードから構成される情報である。
上述の各構成のより具体的な構成を示す。
本発明は、車室内で想定される音環境を予め収集・分類し、代表となる音環境を決定し、該環境に対応するフィルタを標準フィルタと定義・記憶させて、選択使用することがその基本的な構成となる。従って、該標準フィルタを決定する作業を事前に行うことが前提となる。以下に該作業を具体的に説明する。
先ず、車室内で想定される雑音成分を収集し、これをその周波数成分等に基づき所定の数に分類する。分類には各種クラスタ分析手法等を用いることができる。この時、分割数は後述する標準記憶部103の記憶容量などに基づき決定されることが好ましい。本実施形態では、分割数を4つと定義する。収集された雑音成分を4つのクラスタに分割した例を図3に示す。各分類中の重心点(セントロイド)すなわち代表となる雑音をN1、N2、N3、N4としている。尚、前記収集雑音成分は、収集時の車両情報と共に収録することが好ましい。これにより、分割後の重心点となる雑音成分に対し、車両情報を分類したものを雑音成分の識別コードとして定義することが可能となる。例えば、該雑音を速度と空調機レベルの組み合わせで収録したものとし、分類された雑音成分と車両信号の対応関係から、下記のような識別コードの対応関係が導ける。
代表雑音成分 識別コード
N1: ID-N1 (速度 0〜10km/h、空調機レベル0〜2)
N2: ID-N2 (速度 0〜10km/h、 空調機レベル4 OR速度 10〜30km/ h 空調機レベル0〜3)
N3: ID-N3 (速度 10〜30km/h、 空調機レベル4 OR速度 30〜60km /h 空調機レベル 0〜4)
N4: ID-N4 (速度 60〜km/、 空調機レベル 0〜4)
このように、雑音成分の識別コードとは、車速に関する情報と、空調機の動作に関する情報と、窓の開閉に関する情報と、座席の位置に関する情報と、乗員に関する情報と、車両本体に関する情報と、車内外に設置されたセンサ、カメラにより得られる情報と、タイヤに関する情報と、車室内に設置された操作対象機器に関する情報などに付した識別コードである。
目的信号についても同様に、車室内で入力が想定される目的信号すなわち音声信号を収集し、所定の数に分類する。雑音成分同様、収集時には、例えば性別・年齢などの各種発話者情報とともに記録することが好ましい。これにより、分類後の目的信号と話者情報の対応関係から、重心となる目的信号に対し、話者情報の分類を目的信号の識別コードとして定義することが可能となる。本実施形態では、目的信号を2つに分割すると設定した。その結果、例えば男性と女性のグループへ分類されたものとする。すると、
代表目的信号 識別コード
V1: ID-V1 (男性音声)
V2: ID-V2 (女性音声)
という目的信号の代表と対応する目的信号の識別コードが組み合わせたデータを構築できる。
音環境監視部102の音声区間判定手段1021は、例えば入力音のパワースペクトルを観測する方法や、ピッチ周波数やスペクトル包絡情報の時系列データをマッチングする方法などを用いることで、入力音中に使用話者の音声が含まれることを検出すると共に、該音声が含まれる区間(音声区間)を抽出する機能を備える。更に、図示しないPTT(Push to talk)スイッチ手段を追加して音声の開始位置を決定する手法や、撮像手段を用いて乗員の口の動き等を監視し、音声の有無及び音声区間、更には使用話者であるか否かについて決定する手法を取ることもできる。
具体的な監視手段としては、
・ 使用話者以外の話者音声
・ 車両本体情報(エンジン種類、ボディ形状、車室内容量、タイヤ種類等)
・ 車速
・ 空調機の動作
・ 窓の開閉
・ 座席の位置
・ 乗員(着座位置や動作等)
・ 天候や路面状態・路面種類
等が考えられる。尚雑音成分については、前記音声区間監視部が使用話者[N5]の音声を検出していないと判定している区間の入力音を雑音と判定して抽出、監視するのが好ましい。
・ 入力音声に基づく話者音声の声質に関する情報
・ 話者の識別に基づく話者音声の声質に関する情報
等が考えられる。ちなみに前者は入力音声そのものに基づき声質情報を抽出することであり、後者は使用者声質と使用者識別情報(映像等)を対応させて保存する構成とし、使用者識別結果に基づいて声質情報を抽出することを意味する。
標準記憶部103は、音環境監視部102の雑音監視手段1022が収集する雑音成分に関する情報を含む1.標準雑音成分情報、及び、音声信号監視手段1023が収集する目的信号に関する情報である2.標準目的信号情報、該標準雑音成分情報及び標準目的信号情報によって定義された音環境下で効率的に雑音を抑圧できる標準フィルタである3.標準フィルタとを予め記憶しておくものである。各データは、想定される音環境に応じて複数組保持することが好ましく、想定する音環境は、上述のクラスタリング処理等の方法によって決定する。このようにすれば、観測された現在の音環境に適したフィルタを選択して適用することができ、適切に雑音を抑圧した音声信号を得ることができる。
雑音監視手段の抽出する雑音成分情報のうち、想定する複数の情報を記憶する。すなわち上述の雑音成分のクラスタリング結果に基づき、重心と決定された雑音成分を標準雑音成分と定義し、記憶する。この時、該クラスタリング作業で導いた各分類に対する雑音成分の識別コードも同時に記憶する。
上述のクラスタリング結果から、標準雑音成分情報の内容は例えば以下のようになる。
標準雑音成分 コード( 速度、空調機レベル)
N1(代表雑音) ID-N1(0〜10km/h 、0〜2)
N2 ID-N2(0〜10km/h 、3〜4)
(10〜30km/h 、0〜3)
N3 ID-N3(10〜30km/h 、4)
(30〜60km/h 、0〜4)
N4 ID-N4(60〜km/h 、0〜4)
2. 標準目的信号情報
音声監視手段1023の抽出する目的信号情報のうち、想定する複数の情報を標準目的信号情報として記憶する。すなわち上述の目的信号のクラスタリング結果に基づき、重心と決定された目的信号あるいは分類毎の信号群を加算平均した信号(HSLN)を標準目的信号と定義し、記憶する。該クラスタリング作業で導いた各分類に対する目的信号の識別コードも同時に記憶する。すなわち、該標準目的信号と識別コードを合わせて標準目的信号情報とする。
V1(男性HSLN等) ID-V1(男性音声)
V2(女性HSLN等) ID-V2(女性音声)
V0(男女HSLN等) ID-V0(男性女性全般)
尚、上記例には、クラスタ分析で抽出していない目的信号「V0」及び識別コード「ID-V0」が存在する。これは音声監視手段1023が使用話者の発話を判定するまで(すなわち声質が男性・女性どちらに属するか判定するまで)に暫定的にV0に属すると判定させるためのものである。初めて話者音声が検出される以前や、雑音が大きい等で、検出音声から基本周波数が判定できない場合などはV0に属するすなわち識別コードID-V0を目的信号情報として出力する。
標準フィルタは、前記標準雑音成分情報及び標準目的信号情報の組み合わせから定義される車室内の音環境にて、雑音成分を抑圧し目的信号を強調するフィルタであり、具体的には、前記標準雑音成分及び標準目的信号を用いて車室内該音環境をシミュレートし、該環境で雑音を抑圧するようにフィルタを適応的に生成させる。
標準フィルタ生成処理の一例についてブロック図4を用いて説明する。尚、本例は1チャネルマイクロフォン構成システムとした時の例であるが、複数チャネルの場合であれば、BSS法などにより該音環境に適合する標準フィルタを生成することが可能である。なお、2チャネル以上の場合の詳細は第2実施形態に記載する。
以上1〜3を記憶する標準記憶部103の記憶例を図5に示す。
標準目的信号Vy(y=0、1、2、・・・)と、それに対応する識別コード(性別区分)からなる標準目的信号情報と、
Nx、Vyに対応する標準フィルタF(x,y)から構成される。この構成により、後述のフィルタ制御部105において、前記雑音監視手段1022と、音声監視手段1023の監視結果に基づき標準フィルタを参照することができる。
一時記憶部104 は、後述のフィルタ制御部105の一時フィルタ生成手段1052にて生成された一時フィルタを、該一時フィルタ生成時の雑音成分及び雑音成分の識別コード、目的信号の識別コード、及び目的信号の識別コードに対応する標準音声信号等を組み合わせて記憶する。本一時記憶部104は、こうしたデータ対を複数記憶できる構成とし、一時フィルタが生成される度に該情報を順次記憶していく。尚、本実施形態では、一時記憶部104に、所定数のデータが記憶されたのを機に後述の標準フィルタ更新手段1053が処理を行うものとし、該標準フィルタ更新処理後には、データをクリア或いは上書きすることで、記憶容量内でデータ対を記憶していく構成とする。
フィルタ制御部105の各手段は、以下のような処理を行う。
フィルタ選択手段:
・ 音環境監視部102から得られた現在の雑音監視結果、および音声監視結果に基づき、適合する標準フィルタを選択する。
・ 該標準フィルタが、十分な雑音抑圧効果を持ち合わせるかを判定する。(差異の算出)
・ 判定の結果、標準フィルタで対応可能と判定された場合に、該標準フィルタを選択し、フィルタ部106へ適用する。
一時フィルタ生成手段:
・ フィルタ選択手段1051の判定の結果、標準フィルタが十分な雑音抑圧効果が無いと判定された場合に、現在雑音成分と、標準目的信号(V0、V1、V2等)を用いて目標信号及び擬似観測信号を合成し、これらの信号を用いて適応フィルタを生成する。生成されたフィルタを一時フィルタとしてフィルタ部106へ適用する。
・ 一時記憶部104に該一時フィルタとフィルタ生成時の音環境情報(雑音成分の識別コード及び目的信号の識別コード、目的信号情報の標準目的信号等)を記憶する。
標準フィルタ更新手段:
・ フィルタ選択手段1051の差異算出結果の推移、或いは前記一時フィルタ生成手段1052の生成処理の推移(頻度等)の情報に基づき、ある音環境に対する標準フィルタが無効化していないかを判定する。
本実施形態では、一時記憶部104に所定数のデータ対が格納されたのを機に、記憶された雑音成分情報を分析し、特定の音雑音成分に対する一時フィルタ生成の割合が多くなっていないかを判定する。
・ 特定の標準フィルタが無効化していると判定した場合に、標準フィルタの更新処理を行う。
ステップS1001では、音環境監視部102より現在の雑音情報及び音声情報を取得する。例えば、雑音・目的信号情報として、以下の2種類が得られた場合を考える。
雑音成分情報:現在雑音成分(Na)、識別コード(ID-N2)(車速区分=10−30km/h、空調機レベル=1)、
目的信号情報:現在目的信号(Va)、識別コード(ID-V1)(性別情報=男性)
観測情報b)
雑音成分情報b:現在雑音成分(Nb)、識別コード(ID-N2) (車速区分=10−30km/h、空調機レベル=1)、
目的信号情報b:現在目的信号(Vb)、識別コード(ID-V1)(性別情報=男性)
すなわち、雑音成分の識別コードはa、bとも共通である。(同じ車速と空調機レベルで観測された2つの信号ということになる)
尚、1チャネルマイクロフォンを用いる構成とする場合は、現在音声信号と現在雑音成分を同時に取得できない為、該音声区間判定手段1021が発話区間と判定した区間にて抽出した信号を現在音声信号とし、非発話区間と判定した区間にて抽出した信号を現在雑音成分とする。(つまり「現在雑音成分」「現在目的信号」と明記しているが、1チャネルマイクロフォンの場合は厳密には別時刻の信号ということになる)
ステップS1002では、標準記憶部103を参照し、標準雑音成分情報及び標準目的信号情報を得る。ここでは、前述した図5の内容を標準記憶部103に記憶しているものとする。
現在の雑音成分の識別コードと標準雑音成分の識別コード及び、
現在の目的信号の識別コードと標準目的信号の識別コードをそれぞれ照合し、
現在の音環境に対応する標準記憶部103の標準音環境(標準雑音成分情報と標準目的信号の組み合わせ)を決定する。
すなわち、ステップS1001で得られた情報と標準記憶部103の情報(図5)を照合し、
識別コードID-N2とID-V1の組み合わせから決定されるデータ対を探す。結果インデックス(Index)=5のデータの組み合わせが現在の音環境と判定する。
上述の「差異」は、信号の類似性を判定する指標であり、算出例としては、音信号の音響特徴であるパワースペクトル係数や、線形予測係数、周波数毎のパワー等をベクトル化したものの時系列データを用いて、
・ ベクトル同士の距離
・ ベクトル同士のなす角度の余弦値
等から算出することができる。
ここで、閾値は、現在雑音と参照雑音との差異をどこまで許容するか、すなわちどの程度類似性がある雑音を既存の標準フィルタで処理させるかを決定付ける値であり、既存フィルタが充分な雑音抑圧性能を維持する範囲を実験等から求めて適用することが望ましい。
差異<閾値(すなわちN2を囲む領域の内側に位置する)
となるため、フィルタ選択処理ステップS1005へ移行する。
差異>閾値(すなわちN2を囲む領域の外側に位置する)
となるため、ステップS1006移行の一時フィルタ選択処理へ移行する。
この時の一時フィルタ生成手段1052の構成例と動作を図8を用いて説明する。
先ず、標準音声信号(図8の(a))(この場合V1:男性HSLN)を標準記憶部103から取得し、目的信号d(k)とする。
尚、この一時フィルタ生成時には、該当する標準フィルタ、この場合であればインデックス(Index)=5の標準フィルタF(2,1)をフィルタ初期値として選択するようにすることが好ましい。これにより、更新に必要な適応処理回数を削減することができ、処理負荷の軽減を計ることができる。
生成時の雑音成分識別コード :ID-N2( 車速区分 10-30km/h、空調機レベル1)
生成時の現在雑音成分(一時雑音成分として記憶):Nb
生成された一時フィルタ:Ft(b,1)
生成時の目的信号識別コード:ID-V1(男性)
生成に使用した標準目的信号:V1 (HSLN男性)
上記ステップS1001〜ステップS1007の処理を定期的に、或いは使用話者の入力音声を検出する度に行う。
(A) 目的信号識別コード
(B) 雑音成分識別コード(或いは適合しなかった場合の一時雑音成分(Na、Nb等))
(C) 雑音差異(曲線)と閾値(点線)
(D) 一時フィルタ生成・適用区間
(E) 最終的なフィルタ適用結果を示す。
手法a)
問題の雑音成分情報の識別コード(ID-N2)と共に記憶される一時雑音成分群(Nt2、Nt3、Nt4、Nt6、・・・)を用いて、重心(中央値)となる代表一時雑音成分或いは一時雑音成分群の複数の信号からその信号の特徴を平均的に含む信号を合成した合成一時雑音成分を決定し、これを既存のID-N2に対応する標準雑音成分N2と置き換え、N2'とする。
一時雑音成分群から新たな標準雑音成分が生成され、対応する雑音の領域が変化していることが分かる。これにより雑音環境(識別コードID-N2)に対応する標準雑音が実際の雑音に近づき、標準フィルタで対応できるようになる。
手法b)
標準記憶部103に記憶された標準雑音全て(N1、N2、N3、N4等)と、一時記憶部104のID-N2と共に記憶される一時雑音成分群(Nt2、Nt3、Nt4、Nt6、・・・)を用いて、該信号群が適切に所望の分割数に分類されるよう、再度クラスタリング処理を行う。或いはID_N2に対応する雑音成分に限らず、一時記憶部104に記憶された一時雑音すべてを用いるようにしてもよい。この場合一回の処理で一時雑音環境に対する完全な適応はできないものの、蓄えられる一時雑音情報に基づき段階的に安定して標準雑音成分が更新されていく為、標準フィルタもそれに合わせて緩やかに適応していくこととなる。
標準雑音成分群に対し、一時雑音成分群を加えた状態で再度クラスタリング処理が行われ、標準雑音成分が新たに設定されていることが分かる。
(A)目的信号識別コード
(B)雑音成分識別コード(或いは適合しなかった場合の一時雑音成分(Na、Nb等))
(C)雑音差異(曲線)と閾値(点線)
(D)一時フィルタ生成・適用区間
(E)最終的なフィルタ適用結果
を示す。
一方、時刻T1以降すなわち雑音環境識別コードがID-N2となってから急激に差異が大きくなり、一時フィルタが頻繁に生成されている。
本実施形態では、マイクロフォンを2チャネル以上用いる、マイクロフォンアレーを構成する場合について説明する。
・ 窓の開閉情報を用いて空いている窓の方向を雑音成分到来方向とする、
・ 空調機の風量レベルが所定以上の場合、空調機吹き出し口方向を雑音成分到来方向とする。
・ ワイパーが動作している場合、ワイパー方向を雑音成分到来方向とする、
・ 二人以上乗車の際に、撮像手段から発話衝突を検出し、特定の一人の音声以外を雑音とみなし、当該方向を雑音成分到来方向とする
等と判定できる。
尚、発話衝突に関しては、目的音声の決定方法として、常に運転車を優先する、先に発話を開始した話者を優先する、特定のキーワードの発話や、特定の身体動作をした話者を優先する、あるいは予め使用者に優先話者を決定させる等とすればよい。
尚、標準フィルタとしての音源分離フィルタは、上述のような想定する音環境すなわち目的信号と雑音成分が別の方向から到来する環境を実際に再現あるいは計算機上でシミュレートする等して音信号データを取得し、BSS(ブラインド音源分離)手法等によって該目的信号と雑音成分を分離するフィルタを生成することが好ましい。本フィルタは予め生成して保存するものであるので、生成時間等を考慮する必要は無い。従って、より精密な音源分離フィルタとして、標準フィルタを生成することができる。
N1: 助手席口方向、N2:運転席口方向、N3:運転席窓方向
の3種類を、標準音声情報すなわち目的音の到来方向として、
V1:運転席口方向、V2:助手席口方向 の2種類を想定し、計4つの標準フィルタF(1,1)、F(2,2)を記憶している。
・ 目的信号情報および雑音成分情報を所定期間にわたり監視し、その結果標準記憶部103に記憶(想定)されている雑音成分及び目的信号の到来方向以外の各到来方向が頻繁に検出されていると判定される場合等が考えられる。
i) も使われていない標準フィルタを削除し、頻繁に検出される雑音成分情報及び目的信号情報に対応する一時フィルタを標準フィルタとして再登録する。
ii) 繁に検出される雑音成分情報及び目的信号情報に最も類似する音環境に対応する標準フィルタを再適応する等が考えられる。
標準フィルタ更新手段1053は、図17で示したような音環境が、所定の頻度を超えて検出され、一時フィルタF(a,1)が生成されている状況であると判定する。そこで、標準記憶部103の標準フィルタのうち、最も適用頻度の少ないフィルタを決定する。例えば図18の(a)の、運転席乗員方向を目的信号到来方向とする雑音抑圧フィルタすなわち一時フィルタF(1,1)が選ばれたとする。そこで、標準フィルタ更新手段1053は、図18の(b)に示すように、該標準フィルタF(1,1)を削除し、該一時フィルタF(a,1)を新たな標準フィルタF'(1,1)とする。この時、対応する標準記憶部103の標準雑音成分情報(到来方向:助手席乗員)も一時フィルタF(a,1)生成時の一時雑音成分情報(到来方向:助手席側後部座席)へと更新する。
更新手段i)同様、標準フィルタ更新手段1053は、図16で示したような音環境が、所定の頻度を超えて検出され、一時フィルタF(a,1)が生成されている状況であると判定する。
本実施形態の基本的構成は、第1実施形態と共通であり、音入力部101、音環境監視部102、標準記憶部103、一時記憶部104、フィルタ制御部105、フィルタ部106から構成される。
Claims (8)
- 音信号を取得する1つ以上の音入力手段を有する音入力部と、該音入力部から取得された入力音から雑音成分を除去するフィルタ部とを有する音声入力装置において、
前記入力音から音声区間と非音声区間とを判定する音声区間判定手段と、前記音入力部が取得した入力音から、雑音成分に関する情報を含む雑音成分情報を監視し取得する雑音監視手段と、前記入力音から、使用者が入力した目的信号に関する情報を含む目的信号情報を監視し取得する音声監視手段とから構成される音環境監視部と、
少なくとも1つ以上の標準音環境および該標準音環境に対応する標準フィルタを記憶する標準記憶部と、
前記雑音監視手段が取得した雑音成分情報と、前記音声監視手段が取得した目的信号情報とに基づいて、音環境に適合する、該標準記憶部に記憶されている標準音環境を決定し、該標準音環境に対応する標準フィルタを選択して前記フィルタ部の内容とするフィルタ選択手段と、該音環境監視部から得られた情報と、該標準記憶部に記憶されている該標準音環境とが適合しない場合に、一時フィルタを作成して前記フィルタ部の内容とする一時フィルタ生成手段と、該一時フィルタの生成が局所的に増え、該標準フィルタが無効化していると判定された場合に、該音環境監視部から得られた音環境情報によって構成される情報空間における情報ベクトルの集合と、該標準記憶部に記憶されている該標準音環境によって構成される情報空間における情報ベクトルの重心点との距離が所定の閾値を超えるとき、前記音環境情報に適応するよう該距離が小さくなるように、前記標準音環境および該標準音環境に対応する該標準フィルタを更新する標準フィルタ更新手段とから構成されるフィルタ制御部と、
前記一時フィルタを記憶する一時記憶部と、
を有することを特徴とする音声入力装置。 - 前記標準記憶部は、雑音成分に関する情報を含む標準雑音成分情報と、目的信号に関する情報を含む標準目的信号情報と、該標準雑音成分情報及び標準目的信号情報によって定義された音環境下で雑音を抑圧する標準フィルタとを保持することを特徴とする請求項1記載の音声入力装置。
- 前記標準記憶部の記憶する標準雑音成分情報とは、実環境において発生することが予測される雑音成分をN個のM次元代表点を用いて表現した信号であり、前記標準記憶部の記憶する標準目的信号情報とは、実環境において入力されることが予測される目的信号をX個のY次元代表点を用いて表現した信号であり、前記標準記憶部の記憶する標準フィルタとは、該標準雑音成分情報と該標準目的信号情報とから定義される音環境下で雑音を抑圧するように生成したフィルタであることを特徴とする請求項2記載の音声入力装置。
- 前記標準フィルタ更新手段は、実環境において発生することが予測される雑音成分をN個のM次元代表点を用いて表現した信号と、前記雑音監視手段から得られた雑音成分の集合との距離が所定の閾値を超えるとき、該距離が小さくなるように、前記雑音監視手段から得られた雑音成分の集合と、1つ以上の該代表点によって表現された信号とを用いて、該代表点と、該代表点によって表現された信号が定義される音環境下で雑音を抑圧するように生成した標準フィルタとのいずれも更新することを特徴とする請求項1記載の音声入力装置。
- 音信号を取得する二つ以上の音入力手段を有する音入力部と、該音入力部から取得された入力音から雑音成分を除去するフィルタ部とを有する音声入力装置において、
前記入力音から音声区間と非音声区間とを判定する音声区間判定手段と、前記音入力部が取得した入力音から、使用者が入力した目的信号の到来方向に関する情報を含む目的信号情報を監視し取得する音声監視手段と、前記入力音から、雑音成分の到来方向に関する情報を含む雑音成分情報を監視し取得する雑音監視手段とから構成される音環境監視部と、
少なくとも1つ以上の音環境を想定した標準音環境情報および該標準音環境によって定義された音環境下で雑音を抑圧する標準フィルタを記憶する標準記憶部と、
前記雑音監視手段が取得した雑音成分情報と、前記音声監視手段が取得した目的信号情報とに基づいて、音環境に適合する、該標準記憶部に記憶されている標準音環境を決定し、該標準音環境に対応する標準フィルタを選択するフィルタ選択手段と、該音環境監視部から得られた情報と、該標準記憶部に記憶されている該標準音環境とが適合しない場合に、一時フィルタを作成する一時フィルタ生成手段と、該一時フィルタの生成が局所的に増え、該標準フィルタが無効化していると判定された場合に、該音環境監視部から得られた音環境情報によって構成される情報空間における情報ベクトルの集合と、該標準記憶部に記憶されている該標準音環境によって構成される情報空間における情報ベクトルの重心点との距離が所定の閾値を超えるとき、前記音環境情報に適応するよう該距離が小さくなるように、前記標準音環境および該標準音環境に対応する該標準フィルタを更新する標準フィルタ更新手段とから構成されるフィルタ制御部と、
前記一時フィルタを記憶する一時記憶部と、
を有することを特徴とする音声入力装置。 - 前記フィルタ選択手段は、前記音環境監視部が取得した雑音成分情報及び目的信号情報に適合する情報が標準記憶部にない場合に、該雑音成分情報及び目的信号情報に近い標準雑音成分情報及び標準目的信号情報を決定し、対応する標準フィルタを参照する機能を有し、
前記一時フィルタ生成手段は、該標準フィルタを初期値として、現在音環境に対応する雑音抑圧フィルタを生成し、一時フィルタとすることを特徴とする請求項1記載の音声入力装置。 - 前記一時フィルタ生成手段は、前記音環境監視部から得られた情報と、前記標準記憶部に記憶されている標準音環境とが適合しない場合に、前記標準記憶部に記憶された標準目的信号を目的信号とし、該標準目的信号と現在の雑音信号とから生成した信号を擬似観測信号とし、該標準目的信号と該擬似観測信号とを用いてフィルタを生成し、該フィルタを前記フィルタ部の内容とすることを特徴とする請求項1記載の音声入力装置。
- 前記音環境監視部は、前記音入力手段から取得された音信号を分析し、音声信号の大きさに対して雑音の大きさが無視できるとの結果を得た場合に、該音声信号を一時目的信号として前記一時記憶部に記憶する機能を有し、
前記一時フィルタ生成手段は、前記音環境監視部から得られた情報と、前記標準記憶部に記憶されている標準音環境とが適合しない場合に、前記一時記憶部に記憶された前記一時目的信号を目的信号とし、前記一時目的信号と現在の雑音成分とから生成した擬似観測信号を観測信号とし、該目的信号と該観測信号とを用いて雑音成分抑圧フィルタを生成し、該雑音成分抑圧フィルタを前記フィルタ部の内容とすることを特徴とする請求項1記載の音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004225189A JP4649905B2 (ja) | 2004-08-02 | 2004-08-02 | 音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004225189A JP4649905B2 (ja) | 2004-08-02 | 2004-08-02 | 音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006047447A JP2006047447A (ja) | 2006-02-16 |
JP4649905B2 true JP4649905B2 (ja) | 2011-03-16 |
Family
ID=36026102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004225189A Expired - Fee Related JP4649905B2 (ja) | 2004-08-02 | 2004-08-02 | 音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4649905B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5182113B2 (ja) * | 2009-01-16 | 2013-04-10 | 三菱自動車工業株式会社 | 車載機器用制御装置 |
JP4876136B2 (ja) * | 2009-02-17 | 2012-02-15 | 株式会社日立製作所 | 異常診断装置および異常診断方法 |
JP6854967B1 (ja) * | 2019-10-09 | 2021-04-07 | 三菱電機株式会社 | 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム |
JP7486145B2 (ja) * | 2019-11-21 | 2024-05-17 | パナソニックIpマネジメント株式会社 | 音響クロストーク抑圧装置および音響クロストーク抑圧方法 |
CN111105808A (zh) * | 2019-12-27 | 2020-05-05 | 上海联影医疗科技有限公司 | 语音降噪系统 |
EP4113513A4 (en) * | 2020-03-31 | 2023-04-26 | Huawei Technologies Co., Ltd. | METHOD AND DEVICE FOR AUDIO DENOISE |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06149285A (ja) * | 1992-11-04 | 1994-05-27 | Fujitsu Ten Ltd | 音声認識装置 |
JPH06282297A (ja) * | 1993-03-26 | 1994-10-07 | Idou Tsushin Syst Kaihatsu Kk | 音声符号化方式 |
JP2001154688A (ja) * | 1999-12-01 | 2001-06-08 | Toyota Central Res & Dev Lab Inc | 車両用音声入力装置 |
JP2002236497A (ja) * | 2001-02-08 | 2002-08-23 | Alpine Electronics Inc | ノイズリダクションシステム |
JP2002314637A (ja) * | 2001-04-09 | 2002-10-25 | Denso Corp | 雑音低減装置 |
JP2002351488A (ja) * | 2001-05-28 | 2002-12-06 | Matsushita Electric Ind Co Ltd | ノイズキャンセル装置および車載システム |
JP2004198810A (ja) * | 2002-12-19 | 2004-07-15 | Denso Corp | 音声認識装置 |
JP2004212641A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 音声入力システム及び音声入力システムを備えた端末装置 |
-
2004
- 2004-08-02 JP JP2004225189A patent/JP4649905B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06149285A (ja) * | 1992-11-04 | 1994-05-27 | Fujitsu Ten Ltd | 音声認識装置 |
JPH06282297A (ja) * | 1993-03-26 | 1994-10-07 | Idou Tsushin Syst Kaihatsu Kk | 音声符号化方式 |
JP2001154688A (ja) * | 1999-12-01 | 2001-06-08 | Toyota Central Res & Dev Lab Inc | 車両用音声入力装置 |
JP2002236497A (ja) * | 2001-02-08 | 2002-08-23 | Alpine Electronics Inc | ノイズリダクションシステム |
JP2002314637A (ja) * | 2001-04-09 | 2002-10-25 | Denso Corp | 雑音低減装置 |
JP2002351488A (ja) * | 2001-05-28 | 2002-12-06 | Matsushita Electric Ind Co Ltd | ノイズキャンセル装置および車載システム |
JP2004198810A (ja) * | 2002-12-19 | 2004-07-15 | Denso Corp | 音声認識装置 |
JP2004212641A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 音声入力システム及び音声入力システムを備えた端末装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006047447A (ja) | 2006-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110070868B (zh) | 车载系统的语音交互方法、装置、汽车和机器可读介质 | |
CN105529026B (zh) | 语音识别装置和语音识别方法 | |
US20060031067A1 (en) | Sound input device | |
KR102487160B1 (ko) | 정량적 신호 대 노이즈비 분석 및 적응형 위너 필터링에 기초한 오디오 신호 품질 향상 방법 | |
JP3702978B2 (ja) | 認識装置および認識方法、並びに学習装置および学習方法 | |
JP4352790B2 (ja) | 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物 | |
US9311930B2 (en) | Audio based system and method for in-vehicle context classification | |
JP6977004B2 (ja) | 車載装置、発声を処理する方法およびプログラム | |
JP4357867B2 (ja) | 音声認識装置、音声認識方法、並びに、音声認識プログラムおよびそれを記録した記録媒体 | |
JP2001075594A (ja) | 音声認識システム | |
WO2005098820A1 (ja) | 音声認識装置及び音声認識方法 | |
JPH11133992A (ja) | 特徴抽出装置および特徴抽出方法、並びにパターン認識装置およびパターン認識方法 | |
JP4561222B2 (ja) | 音声入力装置 | |
JP2023011945A (ja) | 音声処理装置、音声処理方法および音声処理システム | |
JP4649905B2 (ja) | 音声入力装置 | |
JP2006039267A (ja) | 音声入力装置 | |
Loh et al. | Speech recognition interactive system for vehicle | |
JP6847324B2 (ja) | 音声認識装置、音声認識システム、及び音声認識方法 | |
US12119013B2 (en) | Acoustic crosstalk suppression device and acoustic crosstalk suppression method | |
JP5037018B2 (ja) | 音声認識装置および音声認識方法 | |
JP2006084974A (ja) | 音声入力装置 | |
JP2016033578A (ja) | 車両用音声認識装置 | |
JP2009073417A (ja) | 騒音制御装置および方法 | |
CN113850106A (zh) | 车辆及其控制方法 | |
JP3444198B2 (ja) | 雑音抑圧装置及び該装置を用いた音声認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070625 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100406 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100810 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100930 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101001 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101116 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101129 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131224 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |