JP4561222B2 - 音声入力装置 - Google Patents
音声入力装置 Download PDFInfo
- Publication number
- JP4561222B2 JP4561222B2 JP2004222969A JP2004222969A JP4561222B2 JP 4561222 B2 JP4561222 B2 JP 4561222B2 JP 2004222969 A JP2004222969 A JP 2004222969A JP 2004222969 A JP2004222969 A JP 2004222969A JP 4561222 B2 JP4561222 B2 JP 4561222B2
- Authority
- JP
- Japan
- Prior art keywords
- standard
- filter
- information
- sound
- noise component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本実施形態は、本発明の基本的な実施形態である。
各部の基本的な機能と具体的な実現手段について、図2を用いて説明する。
音声区間を検出する音声区間判定手段1021と、
雑音に関する情報を監視する雑音成分監視手段1022と、
音声に関する情報を監視する目的信号監視手段1023と、
から構成され、
現在の車室内の音環境を判定するものであり、演算装置(図2の203)および記憶装置(図2の204)を組み合わせることで実現される。
音環境監視部102から得られた情報について、標準記憶部103に記憶されている標準音環境が適合しない場合に、現在の音環境に適合するフィルタを一時フィルタとして新たに生成する一時フィルタ生成手段1052と、
から構成されるものであり、演算装置(図2の203)および記憶装置(図2の204)を組み合わせることで実現される。
上述の各構成のより具体的な構成を示す。
音環境監視部102の音声区間判定手段1021は、例えば入力音のパワースペクトルを観測する方法や、ピッチ周波数やスペクトル包絡情報の時系列データをマッチングする方法などを用いることで、入力音中に使用話者の音声が含まれることを検出すると共に、該音声が含まれる区間(音声区間)を抽出する機能を備える。更に、図示しないPTT(Push to talk)スイッチ手段を追加して音声の開始位置を決定する手法や、撮像手段を用いて乗員の口の動きなどを監視し、音声の有無および音声区間、更には使用話者であるか否かについて決定する手法を取ることもできる。
―雑音成分および他のセンシング情報から雑音環境判定―
具体的な監視情報としては、例えば、
・ 使用話者以外の話者音声
・ 車両本体情報(エンジン種類、ボディ形状、車室内容量、タイヤ種類など)
・ 車速
・ 空調機の動作
・ 窓の開閉
・ 座席の位置
・ 乗員(着座位置や動作など)
・ 天候や路面状態・路面種類
などが考えられる。ここで、雑音成分については、音声区間判定手段1021が使用話者の音声を検出していないと判断している区間の入力音を雑音と判断して抽出、監視するのが好ましい。
1.車速区分、2.空調機レベル、3.窓開閉に関する情報を監視し、雑音成分情報として抽出するものとする。ただし、これは後述の標準記憶部103において、標準雑音成分を1、2、3のデータ組の分類として記憶させていることが前提となる。
・ 入力音声に基づく話者音声の声質に関する情報
・ 話者の識別に基づく話者音声の声質に関する情報
などが考えられる。ちなみに、前者は入力音声そのものに基づき声質情報を抽出することであり、後者は使用者声質と使用者識別情報(映像など)を対応させて保存する構成とし、使用者識別結果に基づいて声質情報を抽出することを意味する。 声質の情報としては、例えばケプストラムやデルタケプストラム、音声パワー、基本周波数、イントネーションなどを分析し、決定することが考えられる。ただし、音声区間判定手段1021が使用話者の音声を検出したと判定している区間の入力音を処理対象とすることが好ましい。この場合、使用話者の音声が検出されていない期間に関しては、前回の監視結果を継続するなどとする。本実施形態では、該分析処理により、男性寄りの声質であるか女性寄りの声質であるかの情報すなわち性別情報を抽出するものとする。ただし、これは後述の標準記憶部103において、標準目的信号を男性、女性の分類として記憶させていることが前提となる。
標準記憶部103は、音環境監視部102の雑音成分監視手段1022が収集する雑音成分に関する情報を有する1.標準雑音成分情報、および目的目的信号監視手段1023が収集する目的信号に関する情報である2.標準目的信号情報、該標準雑音成分情報および標準目的信号情報によって定義された音環境下で効率的に雑音を抑圧できる標準フィルタである3.標準フィルタとを予め記憶しておくものである。各データは、想定される音環境に応じて複数組保持することが好ましく、想定する音環境は、その車両の使用形態などにより、発生する頻度が多いものから選択する。
標準信号情報は、雑音成分監視手段1022の抽出する雑音成分情報のうち、検出頻度が高いと予想されるものを予め記憶するものであり、その導出過程は、例えば車室内雑音を多数収集し、雑音成分の成分に基づきクラスタ分析などを行い、所定数のグループに分類して、代表(重心)となる雑音を複数導くものとする。この時、
車速区分、空調機レベル、窓開閉情報といった車両信号を対応させて分類することで、雑音成分の分類を、該車両信号の分類に置き換えることができる(置き換えない場合は第2実施形態)。
例えば導出された分類は以下のようになる。
N1: 時速=0〜10km 空調機レベル=OFF 窓全閉
N2: 時速=10〜30km 空調機レベル=1
窓全閉 など
標準雑音成分情報は、これら得られた情報から標準記憶部103の容量などに基づき、検出頻度が高いと予想される雑音情報に対応するものを標準雑音情報として決定する。
標準目的信号情報は、目的信号監視手段1023の抽出する目的信号情報に対応する複数の目的信号情報である。
その導出過程は、雑音成分情報の導出と同様、複数の目的信号を収集し、それを信号の性質(=声質)に基づき複数に分類し、代表となる目的信号を標準目的信号とする。ここでは、男性音声と女性音声の2種類に分類することとした。
V0: 男性女性(全般)
V1: 男性
V2: 女性
もちろん、多様な音声を収録し、これを例えばケプストラムやデルタケプストラム、音声パワー、基本周波数、イントネーションなどに基づきクラスタ分析などを行い、更に細分化して分類・記憶することも考えられる。
目的信号分類 性別 標準目的信号
V0: 男性女性(全般) 男性女性平均音声(HSLN)(V0)
V1: 男性 男性平均音声(V1)
V2: 女性 女性平均音声(V2)
となる。
標準フィルタは、前記標準雑音成分情報および標準目的信号情報の組み合わせから定義される車室内の音環境にて、雑音成分を抑圧し目的信号を強調するフィルタであり、具体的には、前記標準雑音情報を選択した際の各分類の雑音成分実データおよび、標準目的信号情報の標準目的信号を用いて車室内音環境をシミュレートし、該環境で雑音を抑圧するようにフィルタを適応的に生成させる。
標準フィルタ生成処理の一例についてブロック図3を用いて説明する。尚、本例は1チャネルマイクロフォン構成システムとした時の例であるが、複数チャネルの場合であれば、BSS法などにより該音環境に適合する標準フィルタを生成することが可能である(後述の第3実施形態参照)。
標準記憶部103の記憶例を図4に示す。
フィルタ制御部105は、音環境監視部102から得られた現在の音環境情報と、標準記憶部103の標準音環境情報に基づき、フィルタ選択処理および一時フィルタ生成処理を行う。
フィルタ制御部105および一時記憶部104の具体的な構成と処理を図10のフローチャートを用いて説明する。
例a)
雑音成分情報:
雑音成分=Noise(Na)、車速区分=10−30km/h、空調機レベル=1、窓=全閉
目的信号情報:男性
例b)
雑音成分情報:
雑音成分=Noise(Nb)、車速区分=10−30km/h、空調機レベル=1、窓=運転席窓開
目的信号情報:女性
尚、1チャネルマイクロフォンを用いる構成とする場合は、厳密には同時刻に目的信号および雑音成分を得ることは難しいため、前期音声区間判断手段が発話区間と判断した区間にて抽出した情報を目的信号情報とし、非発話区間と判断した区間にて抽出した情報を現在雑音成分とする。
例a)の場合
標準雑音成分情報=N5(車速区分:10−30km/h、空調機レベル:1、窓:全閉)
および
標準目的信号情報=V1(男性)
が適合する。従って、標準記憶部103に適合する音環境が存在すると判断し、ステップS1004へ移行する。
例b)の場合
標準雑音成分情報=適合なし(運転席窓開用のフィルタが標準フィルタに用意されていない)
標準目的信号情報=V2(女性)
の結果が得られる。従って、標準記憶部103に適合する音環境が存在しないと判断し、ステップS1005へ移行する。
標準雑音成分情報=N5、標準目的信号情報=V1と判断されたため、これに対応する標準フィルタ=F51を標準記憶部103から選択する。
この時の一時フィルタ生成手段1052の構成例と動作を図5を用いて説明する。
尚、ステップS1005における一時フィルタ生成では、音環境が最も類似するフィルタを適応処理のフィルタ初期値として選択するようにすることが好ましい。
すなわち、上記の例b)の場合であれば、標準雑音=N5、標準音声=V2の場合のフィルタF51を最類似フィルタと判定し、このフィルタを初期値として与える。これにより、更新に必要な適応処理回数を削減することができ、処理負荷の軽減を計ることができる。
また、上記処理により一旦一時フィルタが生成、記憶された場合には、以降のフィルタ制御部105の処理において、標準記憶部103と一時記憶部104双方を参照しながらフィルタ選択を行うことが好ましい。すなわち、音環境監視部102において得られ雑音成分情報および目的信号情報が一時記憶部104に記憶された一時雑音成分情報および標準目的信号情報に合致する場合は該一時フィルタを選択する。標準フィルタに加え、一時フィルタも選択候補に加えることで、一時フィルタが対応する音環境(雑音および音声)が継続して検出されている期間に渡り、該一時フィルタが選択される。
上述した音環境監視部102およびフィルタ制御部105の処理タイミングについては、例えば以下の3通りが考えられる。
(A) 目的信号情報(正確には現在目的信号情報と標準目的信号情報とを照合した後の、適合した標準目的信号情報(V0,V1,V 2のいずれか)を示す)
(B) 雑音差異(曲線)と閾値(点線)
(C) 雑音成分情報(正確には現在雑音成分情報と標準雑音成分情報とを照合した時の、適合した標準雑音成分情報(N1,N2,・・・)或いは適合しなかった場合の一時雑音情報(Na,Nb など)を示す)
(D) 一時フィルタ生成・適用区間
(E)最終的に適用されるフィルタ
を示している。各タイミングでの時刻をTx(x=0,1,・・・)と示し、標準フィルタをF(x,y)(x:標準雑音成分情報、y:標準目的信号情報)と示し、一時フィルタをFt(z,y)(z:一時雑音成分情報,y:標準目的信号情報)と示している。
尚(C)の雑音成分情報は、対応する標準雑音成分情報が存在する場合には、該標準雑音成分情報システム開始時点T0では、目的信号監視手段1023から標準目的信号情報V1、雑音成分監視手段1022から標準雑音成分情報N1が監視結果として得られており、標準フィルタF(1,1)が選択されている。
本実施形態は、第1実施形態と基本的な構成を共通とする。第1実施形態では音環境監視部102の雑音成分監視手段1022が入力音以外の情報(車速区分、空調機レベル、窓開閉情報)を組み合わせた情報として雑音成分情報を抽出し、標準記憶部103にはこれに対応する情報が記憶されていたのに対し、本実施形態では、入力雑音成分自体を用いて雑音成分情報を抽出する場合について述べる。
音環境監視部102の雑音成分監視手段1022は、車室内の話者の雑音に関する情報を監視するものであり、本実施形態では雑音成分自体を用いて監視する。
・雑音成分自体或いはそのスペクトル情報などとする。
ただしこの場合、音声区間判定手段1021連携し、音声区間判定手段1021が音声と判断した区間以外についての情報を雑音とみなすことが好ましい。
標準記憶部103では、
1.標準雑音成分情報と、
2.標準目的信号情報と、
3.標準フィルタとを予め記憶する。
標準雑音情報は、前記雑音成分監視手段1022が監視する雑音成分に関する情報のうち、車両で多く検出が想定される情報とする。ここでは、そうした想定雑音環境に基づく雑音成分データ或いは雑音成分のスペクトルなどとする。本実施形態では、雑音成分実データを記憶するものとし、以降では該信号を標準雑音成分と記述する。
想定する雑音環境に基づく雑音成分を決定・取得するためには、例えば車室内で想定される多様な雑音条件に基づく雑音成分を実際に収録し、各信号のスペクトルや特徴ベクトルに基づき複数のグループに分類するなどの手法を取る。例えばクラスタ分析などが好ましい。分類の後、各グループについての代表となる雑音を決定して標準雑音成分情報とする。この際、代表となる雑音は、分類した雑音の平均的なスペクトルを保持する信号であることが好ましい。また、この時の分類数は、保持する可能なフィル多数すなわちメモリの容量などに基づいて決定する。
第1実施形態同様、声質に関する情報および各声質毎の平均音声信号が記憶されているものとする。
例) ID: 性別情報 標準目的信号
V0:男性女性、 男性女性の平均音声信号
V1:男性、 男性の平均音声信号
V2:女性、 女性の平均音声信号
3.標準フィルタ
標準フィルタは、前記標準雑音情報および標準音声情報の組み合わせからなる車室内の音環境下で、雑音を抑圧し音声を強調するようにフィルタを適応的に生成させたものとして与える。
フィルタ制御部105は、音環境監視部102から得られた現在の音環境情報と、標準記憶部103の標準音環境情報に基づき、標準記憶部103から標準フィルタを選択する処理(フィルタ選択手段1051による)と、現在の音環境に対応する標準フィルタが無い場合に、一時フィルタを生成する処理(一時フィルタ生成手段1052による)とを行う。
上述の「差異」は、信号の類似性を判断する指標であり、算出例としては、音信号の音響特徴であるパワースペクトル係数や、線形予測係数、周波数毎のパワーなどをベクトル化したものの時系列データを用いて、
・ ベクトル同士の距離
・ ベクトル同士のなす角度の余弦値
などから算出することができる。
ここで、閾値は、現在雑音と参照雑音との差異をどこまで許容するか、すなわちどの程度類似性がある雑音を既存の標準フィルタで処理させるかを決定付ける値であり、既存フィルタが充分な雑音抑圧性能を維持する範囲を実験などから求めて適用することが望ましい。
一時フィルタ生成有無の判断について、図13、14を用いて具体的に説明する。
尚、一時フィルタ生成時には、音環境が最も類似するフィルタを適応処理のフィルタ初期値として選択するようにすることが好ましい。
(A) 目的信号情報(正確には現在目的信号情報と標準目的信号情報とを照合した後の、適合した標準目的信号情報(V0,V1,V2いずれか)を示す)
(B) 雑音差異(曲線)と閾値(点線)
(C) 雑音成分情報(正確には現在雑音成分情報と標準雑音成分情報とを照合した時の、適合した標準雑音成分情報(N1,N2,・・・)或いは適合しなかった場合の一時雑音情報(Na,Nbなど)を示す)
(D) 一時フィルタ生成・適用区間
(E)最終的なフィルタ適用結果
を示している。
尚、一時フィルタが生成され、一時記憶部104に記憶された後のフィルタ制御部105の処理は、標準記憶部103と一時記憶部104双方を参照しながら行うことが好ましい。すなわち、雑音成分監視手段1022において、標準雑音に加えて一時雑音をも対象として最も類似する雑音を選択する構成とし、最も類似する雑音が該一時雑音であった場合は、該一時雑音について閾値と比較することで、新たな一時フィルタを生成するか、既存の一時フィルタを適用するかを判断する。この時の閾値は、標準雑音へ適用する閾値と同じでもよいし、別の値を与えてもよい。
本実施形態では、マイクロフォンを2チャネル以上用いる、マイクロフォンアレーを構成する場合について説明する。
・ 窓の開閉情報を用いて空いている窓の方向を雑音成分到来方向とする、
・ 空調機の風量レベルが所定以上の場合、空調機吹き出し口方向を雑音成分到来方向とする、
・ ワイパーが動作している場合、ワイパー方向を雑音成分到来方向とする、
・ 二人以上乗車の際に、撮像手段から発話衝突を検出し、特定の一人の音声以外を雑音とみなし、当該方向を雑音成分到来方向とする、
などと判定できる。
標準雑音成分情報すなわち雑音の到来方向として、
N1: 助手席口方向、N2:運転席口方向、N3:運転席窓方向
などを想定している。また、
標準音声情報すなわち音声の到来方向として、
V1:運転席口方向、V2:助手席口方向 などを想定している。
本実施形態の基本的構成は、第1実施形態と共通であり、音入力部101、音環境監視部102、標準記憶部103、一時記憶部104、フィルタ制御部105、フィルタ部106から構成される。
Claims (7)
- 音信号を取得する1つ以上の音入力手段を有する音入力部と、該音入力部から取得された入力音から雑音成分を除去するフィルタ部とを有する音声入力装置において、
入力音中に使用話者の音声が含まれることを検出すると共に、該音声が含まれる区間である音声区間を抽出する機能を備える音声区間判定手段と、前記音入力部が取得した入力音から雑音成分情報を監視し取得する雑音成分監視手段と、前記入力音から目的信号情報を監視し取得する目的信号監視手段とから構成される音環境監視部と、
少なくとも1つ以上の標準音環境および該標準音環境に対応する標準フィルタを記憶する標準記憶部と、
前記音声区間判定手段が下した判定結果と、前記雑音成分監視手段が取得した雑音成分情報と、前記目的信号監視手段が取得した目的信号情報とに基づいて、音環境に適合する、該標準記憶部に記憶されている標準音環境を決定し、該標準音環境に対応する標準フィルタを選択して前記フィルタ部の内容とするフィルタ選択手段と、該音環境に適合する標準音環境が決定できない場合に、一時フィルタを生成して前記フィルタ部の内容とする一時フィルタ生成手段とから構成されるフィルタ制御部と、
該一時フィルタを記憶する一時記憶部と、
を有することを特徴とする音声入力装置。 - 前記標準記憶部は、雑音成分に関する情報を含む標準雑音成分情報と、目的信号に関する情報を含む標準目的信号情報と、該標準雑音成分情報および標準目的信号情報によって定義された音環境下で雑音を抑圧する標準フィルタとのうちの少なくとも1つを保持することを特徴とする請求項1記載の音声入力装置。
- 前記一時記憶部は、前記フィルタ制御部が作成した一時フィルタと、前記フィルタ制御部がフィルタ作成時に参照した雑音成分情報および目的信号情報とのうちの少なくとも1つ以上記憶することを特徴とする請求項1または2記載の音声入力装置。
- 音信号を取得する2つ以上の音入力手段を有する音入力部と、該音入力部から取得された入力音から雑音成分を除去するフィルタ部とを有する音声入力装置において、
入力音中に使用話者の音声が含まれることを検出すると共に、該音声が含まれる区間である音声区間を抽出する機能を備える音声区間判定手段と、目的信号の到来方向に関する情報を含む目的信号情報を監視し取得する目的信号監視手段と、雑音成分の到来方向に関する情報を含む雑音成分情報を監視し取得する雑音成分監視手段とからなる音環境監視部と、
少なくとも1つ以上の標準音環境および該標準音環境に対応する標準フィルタを記憶する標準記憶部と、
該音環境監視部から得られた情報に基づいて、音環境に適合する、該標準記憶部に記憶されている標準音環境を決定し、該標準音環境に対応する標準フィルタを選択して前記フィルタ部の内容とするフィルタ選択手段と、該音環境に適合する標準音環境が決定できない場合に、一時フィルタを生成して前記フィルタ部の内容とする一時フィルタ生成手段とから構成されるフィルタ制御部と、
該一時フィルタを記憶する一時記憶部と、
を有することを特徴とする音声入力装置。 - 前記フィルタ選択手段は、前記音環境監視部が取得した雑音成分情報および目的信号情報に適合する情報が標準記憶部に無い場合に、該雑音成分情報および目的信号情報に近い標準雑音成分情報および標準目的信号情報を決定し、標準雑音成分情報および標準目的信号情報に対応する標準フィルタを参照し、
前記一時フィルタ生成手段は、該標準フィルタを初期値として、現在音環境に対応する雑音抑圧フィルタを生成し、一時フィルタとすることを特徴とする請求項1ないし4のいずれかに記載の音声入力装置。 - 前記音環境監視部から得られた情報は、前記音入力手段に入力された音から得られる情報と、車速に関する情報と、空調機の動作に関する情報と、窓の開閉に関する情報と、座席の位置に関する情報と、乗員に関する情報と、車両本体に関する情報と、車内外に設置されたセンサ、カメラにより得られる情報と、タイヤに関する情報と、車室内に設置された操作対象機器に関する情報とのうちの少なくとも1つ以上を含むことを特徴とする請求項1ないし5のいずれかに記載の音声入力装置。
- 前記一時記憶部は、前記音入力部から取得された音信号における雑音成分が目的信号に対して無視できる場合は、該音信号を目的信号として記憶し、
前記フィルタ制御部は、時刻t1の一時フィルタを、時刻t1よりも前の時刻t0に記憶された目的信号0と時刻t1に観測された雑音成分とを用いて生成された擬似観測信号と、目的信号0とを用いて生成することを特徴とする請求項1ないし6のいずれかに記載の音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004222969A JP4561222B2 (ja) | 2004-07-30 | 2004-07-30 | 音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004222969A JP4561222B2 (ja) | 2004-07-30 | 2004-07-30 | 音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006039447A JP2006039447A (ja) | 2006-02-09 |
JP4561222B2 true JP4561222B2 (ja) | 2010-10-13 |
Family
ID=35904478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004222969A Expired - Fee Related JP4561222B2 (ja) | 2004-07-30 | 2004-07-30 | 音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4561222B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8417518B2 (en) | 2007-02-27 | 2013-04-09 | Nec Corporation | Voice recognition system, method, and program |
WO2011004503A1 (ja) * | 2009-07-08 | 2011-01-13 | 株式会社日立製作所 | 雑音除去装置及び雑音除去方法 |
JP6127579B2 (ja) * | 2012-12-11 | 2017-05-17 | 株式会社Jvcケンウッド | 雑音除去装置、雑音除去方法、及び雑音除去プログラム |
JP6451606B2 (ja) * | 2015-11-26 | 2019-01-16 | マツダ株式会社 | 車両用音声認識装置 |
JP7370014B2 (ja) * | 2018-06-12 | 2023-10-27 | パナソニックIpマネジメント株式会社 | 収音装置、収音方法、及びプログラム |
JP6635396B1 (ja) * | 2019-04-08 | 2020-01-22 | パナソニックIpマネジメント株式会社 | 音響ノイズ抑圧装置及び音響ノイズ抑圧方法 |
JP7486145B2 (ja) * | 2019-11-21 | 2024-05-17 | パナソニックIpマネジメント株式会社 | 音響クロストーク抑圧装置および音響クロストーク抑圧方法 |
CN112896048A (zh) * | 2021-03-15 | 2021-06-04 | 中电科创智联(武汉)有限责任公司 | 一种基于手机互联和语音识别的车载环视显示系统及方法 |
WO2023074655A1 (ja) * | 2021-10-27 | 2023-05-04 | パイオニア株式会社 | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
WO2023074654A1 (ja) * | 2021-10-27 | 2023-05-04 | パイオニア株式会社 | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06149285A (ja) * | 1992-11-04 | 1994-05-27 | Fujitsu Ten Ltd | 音声認識装置 |
JP2000089799A (ja) * | 1998-09-09 | 2000-03-31 | Clarion Co Ltd | 音声認識システム及び方法並びに音声認識用ソフトウェアを記録した記録媒体 |
JP2001154688A (ja) * | 1999-12-01 | 2001-06-08 | Toyota Central Res & Dev Lab Inc | 車両用音声入力装置 |
JP2002236497A (ja) * | 2001-02-08 | 2002-08-23 | Alpine Electronics Inc | ノイズリダクションシステム |
JP2002314637A (ja) * | 2001-04-09 | 2002-10-25 | Denso Corp | 雑音低減装置 |
JP2002351488A (ja) * | 2001-05-28 | 2002-12-06 | Matsushita Electric Ind Co Ltd | ノイズキャンセル装置および車載システム |
JP2004198810A (ja) * | 2002-12-19 | 2004-07-15 | Denso Corp | 音声認識装置 |
JP2004212641A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 音声入力システム及び音声入力システムを備えた端末装置 |
-
2004
- 2004-07-30 JP JP2004222969A patent/JP4561222B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06149285A (ja) * | 1992-11-04 | 1994-05-27 | Fujitsu Ten Ltd | 音声認識装置 |
JP2000089799A (ja) * | 1998-09-09 | 2000-03-31 | Clarion Co Ltd | 音声認識システム及び方法並びに音声認識用ソフトウェアを記録した記録媒体 |
JP2001154688A (ja) * | 1999-12-01 | 2001-06-08 | Toyota Central Res & Dev Lab Inc | 車両用音声入力装置 |
JP2002236497A (ja) * | 2001-02-08 | 2002-08-23 | Alpine Electronics Inc | ノイズリダクションシステム |
JP2002314637A (ja) * | 2001-04-09 | 2002-10-25 | Denso Corp | 雑音低減装置 |
JP2002351488A (ja) * | 2001-05-28 | 2002-12-06 | Matsushita Electric Ind Co Ltd | ノイズキャンセル装置および車載システム |
JP2004198810A (ja) * | 2002-12-19 | 2004-07-15 | Denso Corp | 音声認識装置 |
JP2004212641A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 音声入力システム及び音声入力システムを備えた端末装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006039447A (ja) | 2006-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110070868B (zh) | 车载系统的语音交互方法、装置、汽车和机器可读介质 | |
JP4352790B2 (ja) | 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物 | |
KR102487160B1 (ko) | 정량적 신호 대 노이즈비 분석 및 적응형 위너 필터링에 기초한 오디오 신호 품질 향상 방법 | |
CN105529026B (zh) | 语音识别装置和语音识别方法 | |
WO2017081960A1 (ja) | 音声認識制御システム | |
US9311930B2 (en) | Audio based system and method for in-vehicle context classification | |
JP2001075594A (ja) | 音声認識システム | |
US20060031067A1 (en) | Sound input device | |
JP6977004B2 (ja) | 車載装置、発声を処理する方法およびプログラム | |
JP4561222B2 (ja) | 音声入力装置 | |
JP2008299221A (ja) | 発話検知装置 | |
CN112397065A (zh) | 语音交互方法、装置、计算机可读存储介质及电子设备 | |
JP4357867B2 (ja) | 音声認識装置、音声認識方法、並びに、音声認識プログラムおよびそれを記録した記録媒体 | |
JP7458013B2 (ja) | 音声処理装置、音声処理方法および音声処理システム | |
JP2017090612A (ja) | 音声認識制御システム | |
JP2010156825A (ja) | 音声出力装置 | |
JP6847324B2 (ja) | 音声認識装置、音声認識システム、及び音声認識方法 | |
CN110211579B (zh) | 一种语音指令识别方法、装置及系统 | |
Feng et al. | On using heterogeneous data for vehicle-based speech recognition: A DNN-based approach | |
JP4649905B2 (ja) | 音声入力装置 | |
JP2006039267A (ja) | 音声入力装置 | |
JP2007298592A (ja) | 音声処理装置 | |
Loh et al. | Speech recognition interactive system for vehicle | |
Krishnamurthy et al. | Car noise verification and applications | |
CN109243457B (zh) | 基于语音的控制方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070625 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100614 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100706 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100719 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130806 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |