JP2002041073A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JP2002041073A JP2002041073A JP2000231660A JP2000231660A JP2002041073A JP 2002041073 A JP2002041073 A JP 2002041073A JP 2000231660 A JP2000231660 A JP 2000231660A JP 2000231660 A JP2000231660 A JP 2000231660A JP 2002041073 A JP2002041073 A JP 2002041073A
- Authority
- JP
- Japan
- Prior art keywords
- detection level
- speech recognition
- calculated
- voice
- environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 オーディオ・サウンド・キャンセル(AS
C)機能を備えた音声認識装置において、ユーザが発し
た音声の区間検出を最適に行い、音声認識性能の向上に
寄与することを目的とする。 【解決手段】 ASC処理部10を通して出力された信
号の加算平均パワーを所定期間に亘って算出(21)
し、この算出した加算平均パワーから音声の区間検出を
行う閾値となる検出レベルを算出(22)し、一方、算
出した検出レベルを所定レベルに増大(24)させ、現
在の車速vと基準値v0とを比較して周囲が静寂環境下
にあるのか又は騒音環境下にあるのかを判定(26)
し、この判定結果に基づき、騒音環境下と判定されたと
きに前記算出(22)された検出レベルを選択出力(2
5)し、静寂環境下と判定されたときに前記増大(2
4)された検出レベルを選択出力(25)する。
C)機能を備えた音声認識装置において、ユーザが発し
た音声の区間検出を最適に行い、音声認識性能の向上に
寄与することを目的とする。 【解決手段】 ASC処理部10を通して出力された信
号の加算平均パワーを所定期間に亘って算出(21)
し、この算出した加算平均パワーから音声の区間検出を
行う閾値となる検出レベルを算出(22)し、一方、算
出した検出レベルを所定レベルに増大(24)させ、現
在の車速vと基準値v0とを比較して周囲が静寂環境下
にあるのか又は騒音環境下にあるのかを判定(26)
し、この判定結果に基づき、騒音環境下と判定されたと
きに前記算出(22)された検出レベルを選択出力(2
5)し、静寂環境下と判定されたときに前記増大(2
4)された検出レベルを選択出力(25)する。
Description
【0001】
【発明の属する技術分野】本発明は、音声認識装置に関
し、特に、音声認識のためのオーディオ・サウンド・キ
ャンセル(ASC)機能を備えた音声認識装置において
ユーザが発した音声の区間検出を最適に行うのに有用な
技術に関する。
し、特に、音声認識のためのオーディオ・サウンド・キ
ャンセル(ASC)機能を備えた音声認識装置において
ユーザが発した音声の区間検出を最適に行うのに有用な
技術に関する。
【0002】
【従来の技術】音声認識のためのASC機能を備えた音
声認識装置では、マイクロホン等を介して入力される信
号に含まれるオーディオ信号成分をキャンセルして、信
号(音声信号)対ノイズ(オーディオ信号)のレベル比
を上げることで、オーディオ信号再生下での音声認識性
能を高めるようにしている。
声認識装置では、マイクロホン等を介して入力される信
号に含まれるオーディオ信号成分をキャンセルして、信
号(音声信号)対ノイズ(オーディオ信号)のレベル比
を上げることで、オーディオ信号再生下での音声認識性
能を高めるようにしている。
【0003】音声認識処理を行うに際しては、ユーザが
発した音声についてその区間検出を最適に行う必要があ
る。かかる音声区間検出を行う方法としては、ASC処
理部を通して出力された信号の所定期間に亘っての平均
パワーを検出し、この平均パワーから音声の区間検出を
行う閾値(検出レベル)を算出し、この閾値に基づいて
音声区間検出を行っているものが一般的である。音声区
間検出は、例えば以下のように行われる。
発した音声についてその区間検出を最適に行う必要があ
る。かかる音声区間検出を行う方法としては、ASC処
理部を通して出力された信号の所定期間に亘っての平均
パワーを検出し、この平均パワーから音声の区間検出を
行う閾値(検出レベル)を算出し、この閾値に基づいて
音声区間検出を行っているものが一般的である。音声区
間検出は、例えば以下のように行われる。
【0004】音声認識を行っていないとき(非音声認識
時)の所定期間における入力の加算平均パワーをP
(n)とすると、これは以下の式で表される。 P(n)=Σp(i)/(j+1) ………………………………(1) 但し、j+1は所定期間としてのサンプル時間、p
(i)はサンプル時刻iにおける入力パワー、Σはiに
ついてn−(j+1)からn−1まで積分することを表
している。
時)の所定期間における入力の加算平均パワーをP
(n)とすると、これは以下の式で表される。 P(n)=Σp(i)/(j+1) ………………………………(1) 但し、j+1は所定期間としてのサンプル時間、p
(i)はサンプル時刻iにおける入力パワー、Σはiに
ついてn−(j+1)からn−1まで積分することを表
している。
【0005】そして、この加算平均パワーP(n)に一
定の係数α(α>1)を乗じて得た値:α・P(n)を
閾値とし、サンプル時刻mにおける入力パワーp(m)
がこの閾値を越えたとき、すなわち、p(m)≧α・P
(n)となったときに、そのp(m)を有効な音声パワ
ーとみなして音声区間が始まったものと判定する(音声
区間の始端検出)。
定の係数α(α>1)を乗じて得た値:α・P(n)を
閾値とし、サンプル時刻mにおける入力パワーp(m)
がこの閾値を越えたとき、すなわち、p(m)≧α・P
(n)となったときに、そのp(m)を有効な音声パワ
ーとみなして音声区間が始まったものと判定する(音声
区間の始端検出)。
【0006】音声区間の終端検出についても同様に行
う。但しこの場合には、上記とは逆にp(m)<α・P
(n)となったときに、有効な音声パワーの継続期間が
終了したものと判定する。このように、従来のASC機
能を備えた音声認識装置では、ユーザ(例えば運転者)
が発した音声の区間検出を行う際に、その検出は、一定
の閾値(検出レベル)に基づいて、しかも周囲の騒音状
況に関係なく行われていた。
う。但しこの場合には、上記とは逆にp(m)<α・P
(n)となったときに、有効な音声パワーの継続期間が
終了したものと判定する。このように、従来のASC機
能を備えた音声認識装置では、ユーザ(例えば運転者)
が発した音声の区間検出を行う際に、その検出は、一定
の閾値(検出レベル)に基づいて、しかも周囲の騒音状
況に関係なく行われていた。
【0007】
【発明が解決しようとする課題】上述したASC機能を
備えた音声認識装置では、ASC処理部において行うオ
ーディオ信号成分のキャンセル量は、通常20dB程度
である。しかし、ASC処理部はリアルタイムで適応処
理を行っているものの、模擬すべき再生空間(音響系)
の特性は時々刻々変動しており、常に最適なキャンセル
性能を得られるとは限らない。つまり、再生空間(音響
系)の特性の変動に追従しきれなかった場合には、キャ
ンセル性能が十分でなく、オーディオ音の残差成分のレ
ベルが大きくなる場合がある。
備えた音声認識装置では、ASC処理部において行うオ
ーディオ信号成分のキャンセル量は、通常20dB程度
である。しかし、ASC処理部はリアルタイムで適応処
理を行っているものの、模擬すべき再生空間(音響系)
の特性は時々刻々変動しており、常に最適なキャンセル
性能を得られるとは限らない。つまり、再生空間(音響
系)の特性の変動に追従しきれなかった場合には、キャ
ンセル性能が十分でなく、オーディオ音の残差成分のレ
ベルが大きくなる場合がある。
【0008】この場合、オーディオ音は存在するものの
他のノイズは少ない環境(例えば、車両のアイドリング
時にオーディオ再生音がある場合など)において、音声
認識処理開始後に、再生空間(音響系)の特性が大きく
変動した場合は、オーディオ音の残差成分のレベルが相
対的に上昇することになり、あたかも音声の入力が行わ
れたときに音声入力レベルが上昇するのと等価な状況に
なってしまう。このため、実際に音声が発生されていな
いにもかかわらず、音声区間が始まったものと誤って判
断し、音声区間の始端検出が行われてしまうという不都
合があった。
他のノイズは少ない環境(例えば、車両のアイドリング
時にオーディオ再生音がある場合など)において、音声
認識処理開始後に、再生空間(音響系)の特性が大きく
変動した場合は、オーディオ音の残差成分のレベルが相
対的に上昇することになり、あたかも音声の入力が行わ
れたときに音声入力レベルが上昇するのと等価な状況に
なってしまう。このため、実際に音声が発生されていな
いにもかかわらず、音声区間が始まったものと誤って判
断し、音声区間の始端検出が行われてしまうという不都
合があった。
【0009】また、音声区間の終端検出についても同様
の問題がある。すなわち、ASC処理部ではその機能
上、音声がエコーを帯びたような形で出力される場合が
ある。この場合、正しい音声区間後にエコーの成分が続
くため、音声区間の終端検出に悪影響を及ぼし、場合に
よっては音声認識性能に悪影響を与えてしまうことにつ
ながる。つまり、正しい音声区間後にエコーの成分が続
くため、有効な音声が続いているものと誤って判断し、
音声認識処理を継続してしまうという不都合があった。
の問題がある。すなわち、ASC処理部ではその機能
上、音声がエコーを帯びたような形で出力される場合が
ある。この場合、正しい音声区間後にエコーの成分が続
くため、音声区間の終端検出に悪影響を及ぼし、場合に
よっては音声認識性能に悪影響を与えてしまうことにつ
ながる。つまり、正しい音声区間後にエコーの成分が続
くため、有効な音声が続いているものと誤って判断し、
音声認識処理を継続してしまうという不都合があった。
【0010】さらに、ノイズが十分に少ない環境下にお
いて閾値を低く設定しすぎると、ちょっとした物音や咳
払い、鼻をすする音などの微小な音に敏感に反応するた
め、音声区間の誤検出を行う可能性が高くなるという不
都合があった。なお、以下の記述において、ノイズが十
分に少ない環境下を「静寂環境下」と称し、これに対
し、車両走行中など相当のノイズが生じている環境下を
「騒音環境下」と称する。
いて閾値を低く設定しすぎると、ちょっとした物音や咳
払い、鼻をすする音などの微小な音に敏感に反応するた
め、音声区間の誤検出を行う可能性が高くなるという不
都合があった。なお、以下の記述において、ノイズが十
分に少ない環境下を「静寂環境下」と称し、これに対
し、車両走行中など相当のノイズが生じている環境下を
「騒音環境下」と称する。
【0011】本発明は、上述した従来技術における課題
に鑑み創作されたもので、ユーザが発した音声の区間検
出を最適に行い、ひいては音声認識性能の向上に寄与す
ることができる音声認識装置を提供することを目的とす
る。
に鑑み創作されたもので、ユーザが発した音声の区間検
出を最適に行い、ひいては音声認識性能の向上に寄与す
ることができる音声認識装置を提供することを目的とす
る。
【0012】
【課題を解決するための手段】上記の従来技術の課題を
解決するため、本発明によれば、オーディオ信号を出力
するオーディオソースと、前記オーディオ信号をオーデ
ィオ音として放射するスピーカと、ユーザが発した音声
を入力すると共に、前記スピーカから放射されたオーデ
ィオ音を検出するマイクロホンと、前記マイクロホンを
介して入力される信号に含まれるオーディオ信号成分を
キャンセルして出力するオーディオ・サウンド・キャン
セル処理部と、該オーディオ・サウンド・キャンセル処
理部を通して出力された信号の加算平均パワーを所定期
間に亘って算出する手段と、該算出された加算平均パワ
ーから前記音声の区間検出を行う閾値となる検出レベル
を算出する手段と、該算出された検出レベルを所定レベ
ルに増大させる検出レベル増大手段と、現在の車速を指
示する信号と予め設定した車速の基準値とを比較して、
周囲が静寂環境下にあるのか又は騒音環境下にあるのか
を判定する手段と、該判定された結果に基づいて、前記
算出された検出レベル及び前記増大された検出レベルの
いずれか一方を選択出力する検出レベル選択手段とを具
備し、前記音声の区間検出を行う閾値として、騒音環境
下と判定されたときに前記算出された検出レベルを選択
出力し、静寂環境下と判定されたときに前記増大された
検出レベルを選択出力することを特徴とする音声認識装
置が提供される。
解決するため、本発明によれば、オーディオ信号を出力
するオーディオソースと、前記オーディオ信号をオーデ
ィオ音として放射するスピーカと、ユーザが発した音声
を入力すると共に、前記スピーカから放射されたオーデ
ィオ音を検出するマイクロホンと、前記マイクロホンを
介して入力される信号に含まれるオーディオ信号成分を
キャンセルして出力するオーディオ・サウンド・キャン
セル処理部と、該オーディオ・サウンド・キャンセル処
理部を通して出力された信号の加算平均パワーを所定期
間に亘って算出する手段と、該算出された加算平均パワ
ーから前記音声の区間検出を行う閾値となる検出レベル
を算出する手段と、該算出された検出レベルを所定レベ
ルに増大させる検出レベル増大手段と、現在の車速を指
示する信号と予め設定した車速の基準値とを比較して、
周囲が静寂環境下にあるのか又は騒音環境下にあるのか
を判定する手段と、該判定された結果に基づいて、前記
算出された検出レベル及び前記増大された検出レベルの
いずれか一方を選択出力する検出レベル選択手段とを具
備し、前記音声の区間検出を行う閾値として、騒音環境
下と判定されたときに前記算出された検出レベルを選択
出力し、静寂環境下と判定されたときに前記増大された
検出レベルを選択出力することを特徴とする音声認識装
置が提供される。
【0013】また、上記の音声認識装置において、前記
検出レベル増大手段に代えて、前記増大された検出レベ
ルに相当する固定の検出レベル値を登録しておくための
検出レベル値登録手段を具備し、前記判定手段は、静寂
環境下と判定したときに前記検出レベル値登録手段から
前記固定の検出レベル値を読み出して前記検出レベル選
択手段に接続するようにしてもよい。
検出レベル増大手段に代えて、前記増大された検出レベ
ルに相当する固定の検出レベル値を登録しておくための
検出レベル値登録手段を具備し、前記判定手段は、静寂
環境下と判定したときに前記検出レベル値登録手段から
前記固定の検出レベル値を読み出して前記検出レベル選
択手段に接続するようにしてもよい。
【0014】また、上記の音声認識装置において、前記
判定手段は、前記現在の車速を指示する信号と予め設定
した車速の基準値との比較に代えて、前記算出された加
算平均パワーと予め設定したパワーの基準値との比較に
基づき、周囲が静寂環境下にあるのか又は騒音環境下に
あるのかを判定するようにしてもよい。本発明に係る音
声認識装置によれば、車速又は入力の加算平均パワーに
基づいて判定手段により、周囲が静寂環境下にあるのか
又は騒音環境下にあるのかを判定し、この判定結果に基
づいて検出レベル選択手段により、静寂環境下と騒音環
境下とで音声の区間検出を行うための閾値(検出レベ
ル)を変えている。すなわち、静寂環境下の場合の検出
レベルを騒音環境下の場合の検出レベルよりも大きく
し、音声検出に係る検出感度を相対的に鈍くしている。
判定手段は、前記現在の車速を指示する信号と予め設定
した車速の基準値との比較に代えて、前記算出された加
算平均パワーと予め設定したパワーの基準値との比較に
基づき、周囲が静寂環境下にあるのか又は騒音環境下に
あるのかを判定するようにしてもよい。本発明に係る音
声認識装置によれば、車速又は入力の加算平均パワーに
基づいて判定手段により、周囲が静寂環境下にあるのか
又は騒音環境下にあるのかを判定し、この判定結果に基
づいて検出レベル選択手段により、静寂環境下と騒音環
境下とで音声の区間検出を行うための閾値(検出レベ
ル)を変えている。すなわち、静寂環境下の場合の検出
レベルを騒音環境下の場合の検出レベルよりも大きく
し、音声検出に係る検出感度を相対的に鈍くしている。
【0015】これによって、従来技術で見られたよう
な、オーディオ音の残差成分のレベル変動やエコー成
分、咳払いなどの微小な音に敏感に反応し過ぎて音声区
間の誤検出を行うといった不都合を解消することができ
る。その結果、音声認識性能を向上させることが可能と
なる。
な、オーディオ音の残差成分のレベル変動やエコー成
分、咳払いなどの微小な音に敏感に反応し過ぎて音声区
間の誤検出を行うといった不都合を解消することができ
る。その結果、音声認識性能を向上させることが可能と
なる。
【0016】
【発明の実施の形態】以下、本発明の実施の形態につい
て、添付の図面を参照しながら説明する。図1は本発明
の第1の実施形態に係る音声認識装置の概略構成をブロ
ック図の形態で示したものである。本実施形態では、そ
の音声認識結果を車載用ナビゲーションシステムに適用
する場合を想定している。
て、添付の図面を参照しながら説明する。図1は本発明
の第1の実施形態に係る音声認識装置の概略構成をブロ
ック図の形態で示したものである。本実施形態では、そ
の音声認識結果を車載用ナビゲーションシステムに適用
する場合を想定している。
【0017】図1において、1はCDプレーヤ、FMチ
ューナ、テープ等のオーディオソース、2はオーディオ
ソース1から出力されたオーディオ信号を増幅する増幅
器、3は増幅されたオーディオ信号をオーディオ音とし
て再生空間(音響系C)に放射するスピーカ、4は車室
内の所定の箇所に設置されたマイクロホンを示す。この
マイクロホン4は、ナビゲーション処理に関してユーザ
が与える指令などの音声を入力するためのものであり、
入力した音声を電気信号に変換して出力する。この際、
マイクロホン4には、音響系Cを介してスピーカ3から
のオーディオ音も入力される。
ューナ、テープ等のオーディオソース、2はオーディオ
ソース1から出力されたオーディオ信号を増幅する増幅
器、3は増幅されたオーディオ信号をオーディオ音とし
て再生空間(音響系C)に放射するスピーカ、4は車室
内の所定の箇所に設置されたマイクロホンを示す。この
マイクロホン4は、ナビゲーション処理に関してユーザ
が与える指令などの音声を入力するためのものであり、
入力した音声を電気信号に変換して出力する。この際、
マイクロホン4には、音響系Cを介してスピーカ3から
のオーディオ音も入力される。
【0018】また、10はオーディオ・サウンド・キャ
ンセル(ASC)処理部を示し、遅延部11、適応フィ
ルタ12、演算部13及びフィルタ14を備えて構成さ
れている。適応フィルタ12は、FIR(Finite Impuls
e Response) フィルタ12aと、LMS(Least Mean Sq
uare) 適応アルゴリズムによりFIRフィルタ12aの
係数を設定するフィルタ係数設定部12bとを有してい
る。
ンセル(ASC)処理部を示し、遅延部11、適応フィ
ルタ12、演算部13及びフィルタ14を備えて構成さ
れている。適応フィルタ12は、FIR(Finite Impuls
e Response) フィルタ12aと、LMS(Least Mean Sq
uare) 適応アルゴリズムによりFIRフィルタ12aの
係数を設定するフィルタ係数設定部12bとを有してい
る。
【0019】遅延部11は、マイクロホン4を介して入
力された信号(音声信号とオーディオ信号)を所定の時
間だけ遅延させて、演算部13に出力する。この場合、
遅延部11には、適応フィルタ12のタップ数の約半分
に相当する遅延時間が設定されている。適応フィルタ1
2は、オーディオソース1から出力されたオーディオ信
号に対し周波数毎のレベル及び位相を調整して、演算部
13に出力する。演算部13は、遅延部11から出力さ
れた信号(音声信号とオーディオ信号)と適応フィルタ
12を通してレベル/位相調整された信号(オーディオ
信号)との差を演算し、その演算結果を誤差信号として
出力する。この誤差信号は、適応フィルタ12のフィル
タ係数設定部12bにフィードバックされる。
力された信号(音声信号とオーディオ信号)を所定の時
間だけ遅延させて、演算部13に出力する。この場合、
遅延部11には、適応フィルタ12のタップ数の約半分
に相当する遅延時間が設定されている。適応フィルタ1
2は、オーディオソース1から出力されたオーディオ信
号に対し周波数毎のレベル及び位相を調整して、演算部
13に出力する。演算部13は、遅延部11から出力さ
れた信号(音声信号とオーディオ信号)と適応フィルタ
12を通してレベル/位相調整された信号(オーディオ
信号)との差を演算し、その演算結果を誤差信号として
出力する。この誤差信号は、適応フィルタ12のフィル
タ係数設定部12bにフィードバックされる。
【0020】一方、フィルタ14は、スピーカ3からマ
イクロホン4までの音響系Cの伝達特性(インパルス応
答)を模擬するものであり、オーディオソース1から出
力されたオーディオ信号を音響系Cの伝達特性に従って
補償する。この補償されたオーディオ信号(C^)は、
適応フィルタ12のフィルタ係数設定部12bに入力さ
れる。適応フィルタ12のフィルタ係数設定部12bで
は、この補償されたオーディオ信号(C^)と演算部1
3の出力信号(誤差信号)とを受けて、誤差信号のパワ
ーを最小にするという基準(LMS適応アルゴリズム)
に基づいてFIRフィルタ12aのフィルタ係数(ゲイ
ン)を調整する。
イクロホン4までの音響系Cの伝達特性(インパルス応
答)を模擬するものであり、オーディオソース1から出
力されたオーディオ信号を音響系Cの伝達特性に従って
補償する。この補償されたオーディオ信号(C^)は、
適応フィルタ12のフィルタ係数設定部12bに入力さ
れる。適応フィルタ12のフィルタ係数設定部12bで
は、この補償されたオーディオ信号(C^)と演算部1
3の出力信号(誤差信号)とを受けて、誤差信号のパワ
ーを最小にするという基準(LMS適応アルゴリズム)
に基づいてFIRフィルタ12aのフィルタ係数(ゲイ
ン)を調整する。
【0021】このようにASC処理部10では、マイク
ロホン4から遅延部11を通して出力された信号(音声
信号とオーディオ信号)とオーディオソース1から適応
フィルタ12を通して出力された信号(オーディオ信
号)との差を演算し、その演算結果である誤差信号のパ
ワーを最小にするように適応処理を行うことで、入力信
号(この場合、マイクロホン4から入力される信号)に
含まれるオーディオ信号成分をキャンセルする。
ロホン4から遅延部11を通して出力された信号(音声
信号とオーディオ信号)とオーディオソース1から適応
フィルタ12を通して出力された信号(オーディオ信
号)との差を演算し、その演算結果である誤差信号のパ
ワーを最小にするように適応処理を行うことで、入力信
号(この場合、マイクロホン4から入力される信号)に
含まれるオーディオ信号成分をキャンセルする。
【0022】また、20は音声認識処理部を示し、加算
平均パワー算出部21、音声区間検出レベル設定部2
2、トークスイッチ23、増幅器24、スイッチ25、
判定部26、特徴抽出部27、データベース28及びマ
ッチング処理部29を備えて構成されている。加算平均
パワー算出部21は、トークスイッチ23からの起動信
号(音声入力の開始を指示するためにユーザの操作に基
づいて発せられるトリガ信号)に応答して、ASC処理
部10を通して供給される信号入力の加算平均パワーP
(n)を算出する。この加算平均パワーP(n)の算出
は、前述した式(1)に基づいて行い、例えば、トリガ
信号が発せられてから3秒間の期間に亘って行う。
平均パワー算出部21、音声区間検出レベル設定部2
2、トークスイッチ23、増幅器24、スイッチ25、
判定部26、特徴抽出部27、データベース28及びマ
ッチング処理部29を備えて構成されている。加算平均
パワー算出部21は、トークスイッチ23からの起動信
号(音声入力の開始を指示するためにユーザの操作に基
づいて発せられるトリガ信号)に応答して、ASC処理
部10を通して供給される信号入力の加算平均パワーP
(n)を算出する。この加算平均パワーP(n)の算出
は、前述した式(1)に基づいて行い、例えば、トリガ
信号が発せられてから3秒間の期間に亘って行う。
【0023】音声区間検出レベル設定部22は、加算平
均パワー算出部21で算出された信号入力の加算平均パ
ワーP(n)から、音声区間検出レベルを設定する。サ
ンプル時刻nにおける音声区間検出レベルをLvとする
と、この検出レベルLvは、加算平均パワーP(n)か
ら、以下のようにして求めることができる。 Lv=|〔α・P(n)〕1/2 | …………………………………(2) 但し、αは1より大きい定数(α>1)である。
均パワー算出部21で算出された信号入力の加算平均パ
ワーP(n)から、音声区間検出レベルを設定する。サ
ンプル時刻nにおける音声区間検出レベルをLvとする
と、この検出レベルLvは、加算平均パワーP(n)か
ら、以下のようにして求めることができる。 Lv=|〔α・P(n)〕1/2 | …………………………………(2) 但し、αは1より大きい定数(α>1)である。
【0024】音声区間検出レベル設定部22の出力端
は、スイッチ25の接点Aに接続されると共に、増幅器
24を介してスイッチ25の接点Bに接続されている。
増幅器24は、音声区間検出レベル設定部22で設定さ
れた音声区間検出レベルLvをk倍(k>1)に増大す
るためのものである。ここに、kの値は、オーディオ音
の残差成分のレベル変動分を考慮して決定される。ま
た、スイッチ25は、判定部26からの判定結果に基づ
いてその接点をA側又はB側に切り替え、音声区間検出
レベル設定部22の出力又は増幅器24の出力を選択的
に特徴抽出部27に接続する。
は、スイッチ25の接点Aに接続されると共に、増幅器
24を介してスイッチ25の接点Bに接続されている。
増幅器24は、音声区間検出レベル設定部22で設定さ
れた音声区間検出レベルLvをk倍(k>1)に増大す
るためのものである。ここに、kの値は、オーディオ音
の残差成分のレベル変動分を考慮して決定される。ま
た、スイッチ25は、判定部26からの判定結果に基づ
いてその接点をA側又はB側に切り替え、音声区間検出
レベル設定部22の出力又は増幅器24の出力を選択的
に特徴抽出部27に接続する。
【0025】判定部26は、パルス信号の形で与えられ
る現在の車速vと、基準値v0として予め設定した車速
(例えば、10km/h)との比較に基づいて、周囲が
静寂環境下にあるのか又は騒音環境下にあるのかを判定
する。本実施形態では、車速vが基準値v0より低いと
き(v<v0)、静寂環境下(典型的には、車両が停車
中の場合)と判定してスイッチ25の接点をB側に切り
替え、車速vが基準値v0以上のとき(v≧v0)、騒
音環境下と判定してスイッチ25の接点をA側に切り替
える。
る現在の車速vと、基準値v0として予め設定した車速
(例えば、10km/h)との比較に基づいて、周囲が
静寂環境下にあるのか又は騒音環境下にあるのかを判定
する。本実施形態では、車速vが基準値v0より低いと
き(v<v0)、静寂環境下(典型的には、車両が停車
中の場合)と判定してスイッチ25の接点をB側に切り
替え、車速vが基準値v0以上のとき(v≧v0)、騒
音環境下と判定してスイッチ25の接点をA側に切り替
える。
【0026】特徴抽出部27は、スイッチ25を介して
入力された信号(音声区間検出が行われた信号)から音
声に係る特徴部分を抽出する。データベース28は、例
えばHDD等の記憶媒体からなり、このデータベース2
8には、特徴抽出部27を通して出力される音声のデー
タと比較・照合するための音声マッチング用データが予
め登録(記憶)されている。マッチング処理部29は、
データベース28に登録されている音声マッチング用デ
ータを参照して、特徴抽出部27から出力された音声の
データとの比較・照合を行い、その結果(音声認識結
果)を出力する。この音声認識結果は、ナビゲーション
装置本体(図示せず)のCPUに取り込まれ、ナビゲー
ションに係る演算処理に供される。
入力された信号(音声区間検出が行われた信号)から音
声に係る特徴部分を抽出する。データベース28は、例
えばHDD等の記憶媒体からなり、このデータベース2
8には、特徴抽出部27を通して出力される音声のデー
タと比較・照合するための音声マッチング用データが予
め登録(記憶)されている。マッチング処理部29は、
データベース28に登録されている音声マッチング用デ
ータを参照して、特徴抽出部27から出力された音声の
データとの比較・照合を行い、その結果(音声認識結
果)を出力する。この音声認識結果は、ナビゲーション
装置本体(図示せず)のCPUに取り込まれ、ナビゲー
ションに係る演算処理に供される。
【0027】この第1の実施形態では、加算平均パワー
算出部21が「加算平均パワー算出手段」を、音声区間
検出レベル設定部22が「検出レベル算出手段」を、増
幅器24が「検出レベル増大手段」を、スイッチ25が
「検出レベル選択手段」を、判定部26が「判定手段」
を構成している。以下、第1の実施形態に係る音声区間
検出レベル算出処理について、その処理フローを示す図
2を参照しながら説明する。
算出部21が「加算平均パワー算出手段」を、音声区間
検出レベル設定部22が「検出レベル算出手段」を、増
幅器24が「検出レベル増大手段」を、スイッチ25が
「検出レベル選択手段」を、判定部26が「判定手段」
を構成している。以下、第1の実施形態に係る音声区間
検出レベル算出処理について、その処理フローを示す図
2を参照しながら説明する。
【0028】先ず、最初のステップS1では、加算平均
パワー算出部21が、ASC処理部10を通して供給さ
れる信号入力の加算平均パワーP(n)を算出する。こ
の算出は、前述した式(1)に基づいて行う。次のステ
ップS2では、音声区間検出レベル設定部22が、加算
平均パワー算出部21で算出された信号入力の加算平均
パワーP(n)から、サンプル時刻nにおける音声区間
検出レベルLvを設定する。この設定は、前述した式
(2)に基づいて行う。
パワー算出部21が、ASC処理部10を通して供給さ
れる信号入力の加算平均パワーP(n)を算出する。こ
の算出は、前述した式(1)に基づいて行う。次のステ
ップS2では、音声区間検出レベル設定部22が、加算
平均パワー算出部21で算出された信号入力の加算平均
パワーP(n)から、サンプル時刻nにおける音声区間
検出レベルLvを設定する。この設定は、前述した式
(2)に基づいて行う。
【0029】次のステップS3では、判定部26におい
て、周囲が静寂環境下にあるのか又は騒音環境下にある
のかを判定する。この判定は、車速vと基準値v0との
比較に基づいて行う。すなわち、v<v0のときは(判
定結果がYESの場合)、静寂環境下と判定してステッ
プS4に進み、v≧v0のときは(判定結果がNOの場
合)、騒音環境下と判定してステップS6に進む。
て、周囲が静寂環境下にあるのか又は騒音環境下にある
のかを判定する。この判定は、車速vと基準値v0との
比較に基づいて行う。すなわち、v<v0のときは(判
定結果がYESの場合)、静寂環境下と判定してステッ
プS4に進み、v≧v0のときは(判定結果がNOの場
合)、騒音環境下と判定してステップS6に進む。
【0030】ステップS4では、増幅器24により、音
声区間検出レベル設定部22で設定された音声区間検出
レベルLvをk倍(k>1)に増大して、静寂環境下の
音声区間検出レベルLv0(=k・Lv)を算出する。
次のステップS5では、判定部26からの判定結果に基
づいてスイッチ25の接点をB側に切り替え、増幅器2
4の出力(Lv0)をスイッチ25(接点B)を介して
特徴抽出部27に接続する。つまり、増幅器24を通し
てk倍に増大された音声区間検出レベルLv0(=k・
Lv)を、静寂環境下の音声区間検出レベルLvとして
選択出力する。この後、音声区間検出レベル算出に係る
処理フローは「終了」となる。
声区間検出レベル設定部22で設定された音声区間検出
レベルLvをk倍(k>1)に増大して、静寂環境下の
音声区間検出レベルLv0(=k・Lv)を算出する。
次のステップS5では、判定部26からの判定結果に基
づいてスイッチ25の接点をB側に切り替え、増幅器2
4の出力(Lv0)をスイッチ25(接点B)を介して
特徴抽出部27に接続する。つまり、増幅器24を通し
てk倍に増大された音声区間検出レベルLv0(=k・
Lv)を、静寂環境下の音声区間検出レベルLvとして
選択出力する。この後、音声区間検出レベル算出に係る
処理フローは「終了」となる。
【0031】一方、ステップS6では、判定部26から
の判定結果に基づいてスイッチ25の接点をA側に切り
替え、音声区間検出レベル設定部22の出力(Lv)を
スイッチ25(接点A)を介して特徴抽出部27に接続
する。つまり、音声区間検出レベル設定部22で設定さ
れた音声区間検出レベルLvを、そのまま騒音環境下の
音声区間検出レベルLvとして選択出力する。この後、
音声区間検出レベル算出に係る処理フローは「終了」と
なる。
の判定結果に基づいてスイッチ25の接点をA側に切り
替え、音声区間検出レベル設定部22の出力(Lv)を
スイッチ25(接点A)を介して特徴抽出部27に接続
する。つまり、音声区間検出レベル設定部22で設定さ
れた音声区間検出レベルLvを、そのまま騒音環境下の
音声区間検出レベルLvとして選択出力する。この後、
音声区間検出レベル算出に係る処理フローは「終了」と
なる。
【0032】以上説明したように、本実施形態に係る音
声認識装置によれば、判定部26により、現在の車速v
と基準値v0との比較に基づいて周囲が静寂環境下にあ
るのか又は騒音環境下にあるのかを判定し、この判定結
果に基づいてスイッチ25により、騒音環境下と判定さ
れたときは音声区間検出レベル設定部22で設定された
音声区間検出レベル(Lv)を選択出力し、静寂環境下
と判定されたときは増幅器24で増幅された音声区間検
出レベル(k・Lv)を選択出力している。つまり、静
寂環境下の場合の検出レベルを相対的に鈍くしている。
声認識装置によれば、判定部26により、現在の車速v
と基準値v0との比較に基づいて周囲が静寂環境下にあ
るのか又は騒音環境下にあるのかを判定し、この判定結
果に基づいてスイッチ25により、騒音環境下と判定さ
れたときは音声区間検出レベル設定部22で設定された
音声区間検出レベル(Lv)を選択出力し、静寂環境下
と判定されたときは増幅器24で増幅された音声区間検
出レベル(k・Lv)を選択出力している。つまり、静
寂環境下の場合の検出レベルを相対的に鈍くしている。
【0033】従って、従来技術で見られたような、オー
ディオ音の残差成分のレベル変動やエコー成分、咳払い
などの微小な音に敏感に反応し過ぎて音声区間の誤検出
を行うといった不都合を解消することができ、ひいては
音声認識性能を向上させることが可能となる。図3は第
2の実施形態に係る音声認識装置の要部(音声認識処理
部)の構成をブロック図の形態で示したものである。こ
の第2の実施形態では、上述した第1の実施形態の場合
と同様に、音声認識結果を車載用ナビゲーションシステ
ムに適用する場合を想定している。
ディオ音の残差成分のレベル変動やエコー成分、咳払い
などの微小な音に敏感に反応し過ぎて音声区間の誤検出
を行うといった不都合を解消することができ、ひいては
音声認識性能を向上させることが可能となる。図3は第
2の実施形態に係る音声認識装置の要部(音声認識処理
部)の構成をブロック図の形態で示したものである。こ
の第2の実施形態では、上述した第1の実施形態の場合
と同様に、音声認識結果を車載用ナビゲーションシステ
ムに適用する場合を想定している。
【0034】また、図4はこの第2の実施形態に係る音
声区間検出レベル算出処理を示したものである。この第
2の実施形態に係る音声認識装置(図3)は、音声認識
処理部20aにおいて、第1の実施形態(図1)で用い
たような静寂環境下の音声区間検出レベルを算出するた
めの増幅器24を設ける代わりに、オーディオ音の残差
成分のレベル変動分を考慮して予め大きめに設定した固
定の検出レベル値を登録しておくためのレジスタ30を
設けたこと、判定部26aが、第1の実施形態の場合と
同様にスイッチ25の切替制御を行うと共に、車速vに
基づいて静寂環境下(典型的には、車両が停車中の場
合)と判定したときにレジスタ30の内容を読み出して
スイッチ25の接点Bに接続するようにしたことを特徴
とする。
声区間検出レベル算出処理を示したものである。この第
2の実施形態に係る音声認識装置(図3)は、音声認識
処理部20aにおいて、第1の実施形態(図1)で用い
たような静寂環境下の音声区間検出レベルを算出するた
めの増幅器24を設ける代わりに、オーディオ音の残差
成分のレベル変動分を考慮して予め大きめに設定した固
定の検出レベル値を登録しておくためのレジスタ30を
設けたこと、判定部26aが、第1の実施形態の場合と
同様にスイッチ25の切替制御を行うと共に、車速vに
基づいて静寂環境下(典型的には、車両が停車中の場
合)と判定したときにレジスタ30の内容を読み出して
スイッチ25の接点Bに接続するようにしたことを特徴
とする。
【0035】ここに、判定部26aは「判定手段」を構
成し、レジスタ30は「検出レベル値登録手段」を構成
している。また、この第2の実施形態に係る音声区間検
出レベル算出処理(図4)については、基本的に第1の
実施形態(図2)の場合と同じである。すなわち、ステ
ップS11〜S16はステップS1〜S6に対応してい
る。
成し、レジスタ30は「検出レベル値登録手段」を構成
している。また、この第2の実施形態に係る音声区間検
出レベル算出処理(図4)については、基本的に第1の
実施形態(図2)の場合と同じである。すなわち、ステ
ップS11〜S16はステップS1〜S6に対応してい
る。
【0036】但し、この第2の実施形態では、ステップ
S14において、レジスタ30に登録されている音声区
間検出レベル値Lv0(固定値)を静寂環境下の音声区
間検出レベルとして読み出し、さらにステップS15に
おいて、この読み出した検出レベル値Lv0をスイッチ
25(接点B)を介して特徴抽出部27に接続するよう
にしている。
S14において、レジスタ30に登録されている音声区
間検出レベル値Lv0(固定値)を静寂環境下の音声区
間検出レベルとして読み出し、さらにステップS15に
おいて、この読み出した検出レベル値Lv0をスイッチ
25(接点B)を介して特徴抽出部27に接続するよう
にしている。
【0037】他の構成及びその作用効果については、第
1の実施形態(図1)の場合と同じであるので、その説
明は省略する。図5は第3の実施形態に係る音声認識装
置の要部(音声認識処理部)の構成をブロック図の形態
で示したものである。この第3の実施形態では、第1,
第2の実施形態の場合と同様に、音声認識結果を車載用
ナビゲーションシステムに適用する場合を想定してい
る。
1の実施形態(図1)の場合と同じであるので、その説
明は省略する。図5は第3の実施形態に係る音声認識装
置の要部(音声認識処理部)の構成をブロック図の形態
で示したものである。この第3の実施形態では、第1,
第2の実施形態の場合と同様に、音声認識結果を車載用
ナビゲーションシステムに適用する場合を想定してい
る。
【0038】また、図6はこの第3の実施形態に係る音
声区間検出レベル算出処理を示したものである。この第
3の実施形態に係る音声認識装置(図5)は、音声認識
処理部20bにおいて、車速vと基準値v0との比較に
基づいて静寂環境下又は騒音環境下の判定を行う判定部
26に代えて、加算平均パワー算出部21で算出された
過去の入力の加算平均パワーP(n)と基準値P0との
比較に基づいて静寂環境下又は騒音環境下の判定を行う
判定部26bを設けたことを特徴とする。
声区間検出レベル算出処理を示したものである。この第
3の実施形態に係る音声認識装置(図5)は、音声認識
処理部20bにおいて、車速vと基準値v0との比較に
基づいて静寂環境下又は騒音環境下の判定を行う判定部
26に代えて、加算平均パワー算出部21で算出された
過去の入力の加算平均パワーP(n)と基準値P0との
比較に基づいて静寂環境下又は騒音環境下の判定を行う
判定部26bを設けたことを特徴とする。
【0039】ここに、判定部26bは「判定手段」を構
成している。また、この第3の実施形態に係る音声区間
検出レベル算出処理(図6)については、基本的に第1
の実施形態(図2)の場合と同じである。すなわち、ス
テップS21〜S26はステップS1〜S6に対応して
いる。但し、この第3の実施形態では、ステップS23
において、判定部26bにより、加算平均パワー算出部
21で算出された過去の加算平均パワーP(n)と、基
準値P0として予め設定した入力パワーとの比較に基づ
き、P(n)≦P0の場合に静寂環境下と判定し、P
(n)>P0の場合に騒音環境下と判定するようにして
いる。
成している。また、この第3の実施形態に係る音声区間
検出レベル算出処理(図6)については、基本的に第1
の実施形態(図2)の場合と同じである。すなわち、ス
テップS21〜S26はステップS1〜S6に対応して
いる。但し、この第3の実施形態では、ステップS23
において、判定部26bにより、加算平均パワー算出部
21で算出された過去の加算平均パワーP(n)と、基
準値P0として予め設定した入力パワーとの比較に基づ
き、P(n)≦P0の場合に静寂環境下と判定し、P
(n)>P0の場合に騒音環境下と判定するようにして
いる。
【0040】他の構成及びその作用効果については、第
1の実施形態(図1)の場合と同じであるので、その説
明は省略する。
1の実施形態(図1)の場合と同じであるので、その説
明は省略する。
【0041】
【発明の効果】以上説明したように本発明によれば、静
寂環境下と騒音環境下とで音声の区間検出を行うための
閾値(検出レベル)を変え、前者の方を後者の方よりも
大きくすることにより、従来技術で見られたような不都
合(オーディオ音の残差成分のレベル変動や微小な音な
どに敏感に反応して音声区間の誤検出を行うといった不
都合)を解消することができ、音声認識性能を向上させ
ることが可能となる。
寂環境下と騒音環境下とで音声の区間検出を行うための
閾値(検出レベル)を変え、前者の方を後者の方よりも
大きくすることにより、従来技術で見られたような不都
合(オーディオ音の残差成分のレベル変動や微小な音な
どに敏感に反応して音声区間の誤検出を行うといった不
都合)を解消することができ、音声認識性能を向上させ
ることが可能となる。
【図1】本発明の第1の実施形態に係る音声認識装置の
構成を概略的に示すブロック図である。
構成を概略的に示すブロック図である。
【図2】第1の実施形態に係る音声区間検出レベル算出
処理を示すフロー図である。
処理を示すフロー図である。
【図3】本発明の第2の実施形態に係る音声認識装置の
要部の構成を示すブロック図である。
要部の構成を示すブロック図である。
【図4】第2の実施形態に係る音声区間検出レベル算出
処理を示すフロー図である。
処理を示すフロー図である。
【図5】本発明の第3の実施形態に係る音声認識装置の
要部の構成を示すブロック図である。
要部の構成を示すブロック図である。
【図6】第3の実施形態に係る音声区間検出レベル算出
処理を示すフロー図である。
処理を示すフロー図である。
1…オーディオソース 3…スピーカ 4…マイクロホン 10…ASC処理部 12…適応フィルタ 20,20a,20b…音声認識処理部 21…加算平均パワー算出部(加算平均パワー算出手
段) 22…音声区間検出レベル設定部(検出レベル算出手
段) 23…トークスイッチ 24…増幅器(検出レベル増大手段) 25…スイッチ(検出レベル選択手段) 26,26a,26b…判定部(判定手段) 30…レジスタ(検出レベル値登録手段)
段) 22…音声区間検出レベル設定部(検出レベル算出手
段) 23…トークスイッチ 24…増幅器(検出レベル増大手段) 25…スイッチ(検出レベル選択手段) 26,26a,26b…判定部(判定手段) 30…レジスタ(検出レベル値登録手段)
Claims (5)
- 【請求項1】 オーディオ信号を出力するオーディオソ
ースと、 前記オーディオ信号をオーディオ音として放射するスピ
ーカと、 ユーザが発した音声を入力すると共に、前記スピーカか
ら放射されたオーディオ音を検出するマイクロホンと、 前記マイクロホンを介して入力される信号に含まれるオ
ーディオ信号成分をキャンセルして出力するオーディオ
・サウンド・キャンセル処理部と、 該オーディオ・サウンド・キャンセル処理部を通して出
力された信号の加算平均パワーを所定期間に亘って算出
する手段と、 該算出された加算平均パワーから前記音声の区間検出を
行う閾値となる検出レベルを算出する手段と、 該算出された検出レベルを所定レベルに増大させる検出
レベル増大手段と、 現在の車速を指示する信号と予め設定した車速の基準値
とを比較して、周囲が静寂環境下にあるのか又は騒音環
境下にあるのかを判定する手段と、 該判定された結果に基づいて、前記算出された検出レベ
ル及び前記増大された検出レベルのいずれか一方を選択
出力する検出レベル選択手段とを具備し、 前記音声の区間検出を行う閾値として、騒音環境下と判
定されたときに前記算出された検出レベルを選択出力
し、静寂環境下と判定されたときに前記増大された検出
レベルを選択出力することを特徴とする音声認識装置。 - 【請求項2】 前記検出レベル増大手段に代えて、前記
増大された検出レベルに相当する固定の検出レベル値を
登録しておくための検出レベル値登録手段を具備し、 前記判定手段は、静寂環境下と判定したときに前記検出
レベル値登録手段から前記固定の検出レベル値を読み出
して前記検出レベル選択手段に接続することを特徴とす
る請求項1に記載の音声認識装置。 - 【請求項3】 前記判定手段は、前記現在の車速を指示
する信号と予め設定した車速の基準値との比較に代え
て、前記算出された加算平均パワーと予め設定したパワ
ーの基準値との比較に基づき、周囲が静寂環境下にある
のか又は騒音環境下にあるのかを判定することを特徴と
する請求項1に記載の音声認識装置。 - 【請求項4】 前記増大された検出レベルは、前記オー
ディオ音の残差成分のレベル変動分を考慮して決定され
ることを特徴とする請求項1に記載の音声認識装置。 - 【請求項5】 前記加算平均パワーを算出する手段は、
当該加算平均パワーP(n)を、以下の式(1)に基づ
いて算出し、 P(n)=Σp(i)/(j+1) ………………………………(1) 但し、j+1は所定期間としてのサンプル時間、p
(i)はサンプル時刻iにおける入力パワー、Σはiに
ついてn−(j+1)からn−1まで積分することを表
す、 前記検出レベルを算出する手段は、当該検出レベルLv
を、以下の式(2)に基づいて算出する、 Lv=|〔α・P(n)〕1/2 | …………………………………(2) 但し、αは1より大きい定数を表す、ことを特徴とする
請求項1から4のいずれか一項に記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000231660A JP2002041073A (ja) | 2000-07-31 | 2000-07-31 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000231660A JP2002041073A (ja) | 2000-07-31 | 2000-07-31 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002041073A true JP2002041073A (ja) | 2002-02-08 |
Family
ID=18724464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000231660A Pending JP2002041073A (ja) | 2000-07-31 | 2000-07-31 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002041073A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005024789A1 (ja) * | 2003-09-05 | 2005-03-17 | Matsushita Electric Industrial Co., Ltd. | 音響処理システム、音響処理装置、音響処理方法、音響処理プログラム及び記憶媒体 |
JP2006171152A (ja) * | 2004-12-14 | 2006-06-29 | Alpine Electronics Inc | 音声入力装置 |
US9230538B2 (en) | 2011-04-08 | 2016-01-05 | Mitsubishi Electric Corporation | Voice recognition device and navigation device |
US9584086B2 (en) * | 2013-02-20 | 2017-02-28 | Bell Helicopter Textron Inc. | Situation responsive audio system |
WO2017032099A1 (zh) * | 2015-08-25 | 2017-03-02 | 中兴通讯股份有限公司 | 一种语音识别参数调整的方法、装置及移动终端 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10247096A (ja) * | 1997-03-04 | 1998-09-14 | Nec Home Electron Ltd | 車載音声認識装置 |
JPH113091A (ja) * | 1997-06-13 | 1999-01-06 | Matsushita Electric Ind Co Ltd | 音声信号の立ち上がり検出装置 |
JP2000172291A (ja) * | 1998-12-02 | 2000-06-23 | Sony Corp | 音声認識装置 |
JP2002535708A (ja) * | 1999-01-18 | 2002-10-22 | ノキア モービル フォーンズ リミティド | 音声認識方法及び音声認識装置 |
-
2000
- 2000-07-31 JP JP2000231660A patent/JP2002041073A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10247096A (ja) * | 1997-03-04 | 1998-09-14 | Nec Home Electron Ltd | 車載音声認識装置 |
JPH113091A (ja) * | 1997-06-13 | 1999-01-06 | Matsushita Electric Ind Co Ltd | 音声信号の立ち上がり検出装置 |
JP2000172291A (ja) * | 1998-12-02 | 2000-06-23 | Sony Corp | 音声認識装置 |
JP2002535708A (ja) * | 1999-01-18 | 2002-10-22 | ノキア モービル フォーンズ リミティド | 音声認識方法及び音声認識装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005024789A1 (ja) * | 2003-09-05 | 2005-03-17 | Matsushita Electric Industrial Co., Ltd. | 音響処理システム、音響処理装置、音響処理方法、音響処理プログラム及び記憶媒体 |
JP2006171152A (ja) * | 2004-12-14 | 2006-06-29 | Alpine Electronics Inc | 音声入力装置 |
US9230538B2 (en) | 2011-04-08 | 2016-01-05 | Mitsubishi Electric Corporation | Voice recognition device and navigation device |
DE112011105136B4 (de) | 2011-04-08 | 2018-12-13 | Mitsubishi Electric Corporation | Spracherkennungsvorrichtung und Navigationsvorrichtung |
US9584086B2 (en) * | 2013-02-20 | 2017-02-28 | Bell Helicopter Textron Inc. | Situation responsive audio system |
WO2017032099A1 (zh) * | 2015-08-25 | 2017-03-02 | 中兴通讯股份有限公司 | 一种语音识别参数调整的方法、装置及移动终端 |
CN106486127A (zh) * | 2015-08-25 | 2017-03-08 | 中兴通讯股份有限公司 | 一种语音识别参数自动调整的方法、装置及移动终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8165310B2 (en) | Dereverberation and feedback compensation system | |
WO2001015137A1 (fr) | Dispositif reducteur de bruit | |
JP2002123278A (ja) | 特に自動車内で、音声信号を介して装置を制御する方法 | |
US6665645B1 (en) | Speech recognition apparatus for AV equipment | |
US20040260549A1 (en) | Voice recognition system and method | |
JP3524370B2 (ja) | 音声起動システム | |
JP2002041073A (ja) | 音声認識装置 | |
US7542577B2 (en) | Input sound processor | |
JP2000231399A (ja) | 騒音低減装置 | |
JP3774580B2 (ja) | 音声入力装置 | |
JP3510458B2 (ja) | 音声認識システムおよび音声認識制御プログラムを記録した記録媒体 | |
JP2002091489A (ja) | 音声認識装置 | |
JP2008070877A (ja) | 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム | |
JPH0787587A (ja) | 車載用音響信号処理装置 | |
JP2010041188A (ja) | 音声認識装置 | |
JP3350106B2 (ja) | 音声認識装置 | |
JP2990051B2 (ja) | 音声認識装置 | |
JP4166000B2 (ja) | 音声認識装置 | |
JP2686390B2 (ja) | 車載音響装置 | |
JP4313294B2 (ja) | 音声出力装置 | |
US11942068B2 (en) | Adaptive active noise control system with unstable state handling and associated method | |
WO2023157783A1 (ja) | 情報処理装置、情報処理方法、プログラムおよび記録媒体 | |
JPH0536500U (ja) | 車載用音響機器の音声認識装置 | |
JPH11312939A (ja) | 積分装置 | |
JP3267866B2 (ja) | 騒音感応ボリューム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060523 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061017 |