JP2002258898A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2002258898A
JP2002258898A JP2001057683A JP2001057683A JP2002258898A JP 2002258898 A JP2002258898 A JP 2002258898A JP 2001057683 A JP2001057683 A JP 2001057683A JP 2001057683 A JP2001057683 A JP 2001057683A JP 2002258898 A JP2002258898 A JP 2002258898A
Authority
JP
Japan
Prior art keywords
signal
unit
input
voice
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001057683A
Other languages
English (en)
Other versions
JP4166000B2 (ja
Inventor
Koichi Nakada
孝一 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2001057683A priority Critical patent/JP4166000B2/ja
Publication of JP2002258898A publication Critical patent/JP2002258898A/ja
Application granted granted Critical
Publication of JP4166000B2 publication Critical patent/JP4166000B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Filters That Use Time-Delay Elements (AREA)

Abstract

(57)【要約】 【課題】音声認識装置において、発話スイッチ等を持た
ない製品では、利用者が欲する音声認識動作の開始を知
る術が無く、車室内に存在する利用者以外が発生する音
を除去するキャンセル装置の動作に利用者自身の音声が
重畳し、認識対象の音声にエコー等が存在し、音声認識
の効率が非常に悪かった。 【解決手段】利用者が欲する音声認識のタイミングを音
声認識装置1内に設けられたレベル判定部14で検知す
ると共に、第1並びに第2の遅延回路12,13により、
最初のコマンドが認識されるまで音声信号に遅延をかけ
ることで、エコーの発生を防ぎ音声認識率を向上させ、
最初のコマンド以降の音声認識を行う際は、第1並びに
第2の遅延回路12、13の遅延量を制御することで音
声認識装置の応答性を高めることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置にお
いて、マイクから入力されるオーディオ音を消去するこ
とにより音声認識率を高める音声認識用オーディオキャ
ンセル装置に関し、特に、適応フィルタを用いてマイク
からの信号と適応フィルタからの信号の誤差信号により
適応フィルタのタップ係数を適応アルゴリズムで制御
し、オーディオキャンセルを行うシステムで生じる、エ
コーがかかったような音声信号の出力を防止するように
した、音声認識用オーディオキャンセル装置を備えた音
声認識装置において、トークスイッチなどの操作をする
ことなく車室内で操作者が発声する音声のレベルを認識
して、音声認識部を作動させるようにした音声認識装置
に関するものである。
【0002】
【従来の技術】近年、各種機器の作動を音声により指示
し、音声認識装置によりこれを認識して機器の作動制御
を行うことが、パソコンを初めとして一般家庭用機器等
の各種の分野で広く行われており、その研究開発が急速
に進められている。このような音声により機器の作動を
制御する分野の一つとして、各種の車載機器を音声によ
り操作することが注目されている。即ち、車載機器の多
くは運転者が操作する場合が多く、一方、運転者は安全
運転のために、できる限り車載機器の操作に注意をそら
せることは好ましくない。
【0003】近年の車載機器はオーディオ装置の高度
化、ナビゲーション装置の機能の多様化等のため、これ
らの機器に対して各種の作動指示を行うことが多くなっ
ている。この対策として、上記音声認識装置を用い、運
転者は前方を注視したままで、例えばナビゲーション装
置の近隣施設検索を音声で指示し、ナビゲーション装置
では音声でこれに応える、というシステムが考えられて
おり、一部実用化されている。
【0004】しかしながら、音声認識装置を上記のよう
な車載機器の制御を行うために、車両に搭載すると、車
内にはエンジン音、タイヤの走行音、車の風切り音、更
にはオーディオ音や周囲の人の話し声などが混在し、こ
のような騒音の中でマイクに向かって話した言葉に基づ
いて、操作指示の内容を認識することはきわめて困難で
ある。したがって、広く研究開発が行われている音声認
識の技術分野において、車載機器の操作指示のための音
声認識は、最も困難な分野の一つということができる。
このように騒音の多い環境下で音声認識を行うために
は、マイクから入力される音声に混じって入ってくる騒
音成分を取り除いて、できる限り使用者の音声のみを入
力することが必要となる。
【0005】一方、従来から例えば車の騒音対策とし
て、車において最も大きな騒音源である排気音の消去に
際し、排気音をマイクにより検出し、これを分析して、
排気音に対応する音をスピーカから出力し、両者の音の
相殺により排気音を消去することが試みられている。ま
た、車室内の居住環境を向上させるため、車内の音をマ
イクにより検出し、これを分析して、車内の音を人間に
とって心地よい程度のノイズである所定の白色ノイズに
なるように、スピーカから騒音消去用の所定の音を出力
することも試みられている。また、車以外の分野におい
ても、マイクで入力された音をその場でスピーカにより
出力する際、マイクから現在入力されている音声以外の
音をできる限り入力しないように、また、スピーカの音
が再びマイクに入力してエコーがかかることを防止する
ため、周囲の音やスピーカからの音を消し、音声を際立
たせるための研究がなされている。更に、特に近年急速
に普及している携帯電話の技術分野において、マイクか
ら入力される小さな音声でも明瞭に送信することができ
るように、通話中における周囲の騒音のみを消去し、音
声を際立たせる研究も行われている。
【0006】上記のような種々の技術においては、騒音
や音声を適応フィルタを通し、各種処理を行い、所望の
特性を得る研究が行われている。適応フィルタによる制
御方式自体は広く知られている技術であり、例えば第6
図に示すように、第1信号入力x(n)をタップ係数w
(n)が可変のFIRフィルタ(有限インパルス応答フ
ィルタ)21を通し、出力y(n)を得る。この出力y
(n)と目標信号としての第2信号入力d(n)を減算
器22に入れ、その誤差e(n)を得る。この誤差e
(n)によって変化する適応アルゴリズム(LMS)2
3により、FIRフィルタ21のタップ係数w(n)を
制御し、誤差e(n)のパワーをできる限り0に近づけ
る。ここで、第1信号入力側をマイクからの信号とし、
第2信号入力側を目標信号とすることができ、逆に第1
信号入力側を目標信号とし、第2信号入力側をマイク等
からの信号とすることもできる。この適応フィルタで用
いられる適応アルゴリズムとしては種々のものが提案さ
れており、例えば学習同定法、LMS法、RMS法、射
影法等が知られている。このような適応フィルタを用い
ることにより、フィルタ係数は、任意の初期状態から逐
次書き換えられ、徐々に誤差を最小にするタップ係数w
0に近づけていくことができる。
【0007】上記適応フィルタにおいて例えばLMSア
ルゴリズムを用いてタップ係数をリアルタイムに更新す
るものにおいては、 wj(n+1)=wj(n)+2μ・e(n)・xj(n) ・・・(1) j=0,1・・・,N e(n)=d(n)−y(n) の更新式を用いている。ここでμはステップサイズパラ
メータと呼ばれ、適応フィルタのタップ係数の更新の度
合いを制御するパラメータであり、これが大きいとタッ
プ係数の修正量が多くなるため収束が強くなる。しかし
ながら、修正量が大きい分だけ、係数更新の妨害となる
成分が存在する場合にはその影響を強く受けて、残留誤
差量が多くなる。一方反対にステップサイズパラメータ
が小さい場合には、収束が遅くなるが、妨害信号成分の
影響が少なく残留誤差量は小さくなる。
【0008】一方、例えば車室内で音声認識装置を用い
るに際して、車室内で最も音声認識を妨害する大きな音
としては、オーディオ装置からの音が存在し、したがっ
て、音声認識時にはこのオーディオ装置の音を消すこと
が好ましい。しかしながら、音声で指示を行う度にオー
ディオ装置を消す操作は面倒であり、かつ、例えばオー
ディオの使用中にオーディオ装置に対して音量の変更等
の操作指示を行うときには、そのたび毎にオーディオ装
置の音を消すことは適切ではない。その対策として、音
声認識装置において、マイクから入るオーディオ音をキ
ャンセルするために、スピーカから出力されるオーディ
オ信号を直接入力して、このオーディオ信号を前記適応
フィルタに入力し、適応フィルタから出力されたオーデ
ィオの調整信号と、マイクから音声信号と共に入力され
たオーディオ信号とを減算器に入力し、その誤差が最小
となるように、あるいは所定の状態になるように適応フ
ィルタを調整し、それにより減算器からの出力信号中に
オーディオ信号が残留しないようにすることが考えられ
ている。
【0009】このようなオーディオキャンセルシステム
の基本的な構成は、第7図に示すように、第6図の適応フ
ィルタの構成を備え、特にこのシステムにおいては、L
MSアルゴリズム23でタップ係数w(n)が制御され
るFIRフィルタ21への入力信号である第1入力x
(n)としては、車室内のスピーカ25に出力するオー
ディオ出力部が参照信号発生部26を対応させて接続して
おり、また、減算器22への第2入力d(n)としては、
車室内に設けた音声認識装置用のマイク27からの信号
を減算器22に出力するようにしている。この時マイク
27からは、利用者30からの認識すべき音声Xs−C
sと、音声認識装置作動中はキャンセルされるべき騒音
となるオーディオ音Xn−Cnが入力される。減算器2
2における誤差信号e(n)はLMSアルゴリズム23
に入力すると共に、この信号は音声認識装置31に出力
するシステムを形成している。
【0010】このようなシステムにおいて、利用者5が
車室内でスピーカ25からのオーディオを聴いている状
態で、音声認識装置31を利用するためマイク27に音
声を発するときには、マイク27には車室内において特
に大きな音であるオーディオからの音も入力される。マ
イク27から入力されたこれら音声等の信号は、減算器
22のプラス側にd(n)として入力される。一方、ス
ピーカ25にオーディオ信号を出力しているオーディオ
出力部の信号を参照信号x(n)としてFIRフィルタ
21に入力し、FIRフィルタ21においてはLMSア
ルゴリズム23によりタップ係数w(n)が制御され、
出力信号y(n)を得る。
【0011】この出力信号y(n)を減算器のマイナス
側に入力し、両者の減算値、即ち両者の誤差である、e
(n)=d(n)−y(n)を得る。この誤差e(n)
は理想的には車室内のスピーカからマイクに入力された
オーディオ音が、適応フィルタで処理されたオーディオ
信号によりキャンセルされたものとなる。したがって、
これを音声認識装置31に入力すると、車室内のオーデ
ィオ音がキャンセルされた、ほぼ利用者の音声のみの信
号となる。しかしながら、両者に誤差が生じているとき
には、この誤差e(n)をフィードバックしてLMSア
ルゴリズム23に入れ、FIRフィルタ21のタップ係
数w(n)を調整して、前記誤差e(n)のパワーを最
小にするように制御する。
【0012】上記のように、車室内においてオーディオ
装置が作動しスピーカから音が出ている状態の中で、音
声認識装置により各種機器の作動を行わせるため、マイ
クから音声認識装置に音声を入力するとき、音声と共に
オーディオの音も入力され、音声認識の精度が悪くな
る。これを防止するため、上記のようなLMSアルゴリ
ズムにより変化するタップ係数w(n)を用いる適応フ
ィルタを使用する際には、その誤差e(n)にはオーデ
ィオ部分の誤差の他に、音声信号成分が含まれており、
これもLMSアルゴリズムにフィードバックせざるを得
ない。
【0013】このように音声信号成分もフィードバック
されることにより、前記更新式に影響を及ぼし、e
(n)が最小になるように更新しているw(n)が微少
に変動してしまうこととなる。そのため、減算器22か
ら音声認識装置31に入力される音声信号にエコーがか
かったような信号等の不適切な信号を出力してしまい、
音声認識性能を悪化させる原因となる。また、このよう
な音声認識装置に入力される信号の中には更に種々の不
適切な信号が存在し、音声認識性能を悪化させているこ
とが考えられ、これらの信号を除去する必要がある。
【0014】このような音声認識性能を悪化させている
エコー成分を発生させないようにするため、音声認識処
理を行うときには、タップ係数を制御して、音声信号成
分をフィードバックしないようにオーディオキャンセル
処理を一時停止するか、あるいはフィードバックによる
処理効果を弱めるようにしている。
【0015】
【発明が解決しようとする課題】従来の装置では、音声
認識を開始するために、例えばトークスイッチなどを操
作することで、音声認識を開始するトリガとしていたた
め、前記のオーディオキャンセル装置における音声認識
用のオーディオキャンセル処理の効果を停止あるいは弱
めることを容易に行うことができる。しかしながら、音
声認識装置で、トークスイッチなどを使用せずに、常に
音声認識装置を作動させておき、マイクから入力される
音声中に所定のコマンドが認識された場合に車室内の機
器を操作するようなシステムにおいては、音声認識が開
始されたタイミングを知るすべがなくなり、オーディオ
キャンセル処理の効果を停止あるいは弱めることが十分
にできず、音声認識部に入力される信号にオーディオ音
と音声が混在し、また、音声信号を含んだ誤差信号がフ
ィードバックされるため音声認識部に入力される信号が
エコーを帯びたような信号となり、正しく認識されない
という問題がある。また、音声認識部が常に作動してい
ることで消費電力の面からも好ましくない。
【0016】したがって、本発明は、トークスイッチな
どの操作をすることなく、マイクから入力される車室内
の音声が所定のレベル以上となったことに基づき音声認
識機能を作動させると共に、マイクから入力される音声
信号を、通常の状態では、所定の期間遅延させること
で、適応フィルタにフィードバックされる誤差信号e
(n)中に、操作者の音声を含まないようにするととも
に、タップ係数の制御の効果を弱めることで、音声認識
率の向上を図り、かつ、所定のコマンドが認識された後
は、マイクから入力される音声等の信号の減算器への入
力ならびにオーディオ装置からの信号の適応フィルタへ
の入力を遅延回路を経由せずに行うことで、応答性に優
れた音声認識装置を提供することを目的としている。
【0017】
【課題を解決するための手段】本発明は、上記課題を解
決するため、音声認識装置に入力する音声とオーディオ
音とを集音するマイクと、前記マイクからの信号を遅延
させる第1の遅延部と、前記マイクからの入力信号レベ
ルを判定するレベル判定部と、オーディオ装置から入力
されるオーディオ信号を入力し適応アルゴリズムにより
タップ係数を変化させる適応フィルタと、前記オーディ
オ信号の適応フィルタへの入力を遅延させる第2の遅延
部と、前記適応フィルタの出力信号と前記マイクからの
信号を入力する減算器と、前記減算器から出力する両信
号の誤差信号を前記適応アルゴリズムに入力すると共に
音声認識部に出力するようにした音声認識装置におい
て、前記マイクからの入力信号が所定のレベル以上とな
ったと前記レベル判定部が判定したときに、前記適応フ
ィルタのタップ係数を変化すると共に、減算器から出力
される誤差信号に対する音声認識を作動し、前記音声認
識部が所定の音声コマンドを認識した場合には、前記マ
イクからの入力信号ならびにオーディオ信号を前記第1
並びに第2の遅延部を経由せずに前記減算器に入力する
ようにしたことを特徴とする音声認識装置としたもので
ある。
【0018】
【発明の実施の形態】本発明の実施の形態を図面に沿っ
て説明する。第1図は本発明の音声認識装置用オーディ
オキャンセル部を備えた音声認識装置の実施例を示し、
この実施例においては車内用オーディオ装置40からオ
ーディオ出力x(n)が出力されており、各出力は車室
内に配置したスピーカ41に出力すると共に、同じ信号
を音声認識装置1に設けられた第2の遅延回路13なら
びに切替スイッチSW3を介して、適応フィルタとして
のFIRフィルタ15に出力している。FIRフィルタ
15は第6図の基本原理に基づき作動するものであり、
第7図に示す音声認識装置用オーディオキャンセルシス
テムにおける適応フィルタと同様に作動する。
【0019】オーディオ信号に対応するFIRフィルタ
15の出力信号y(n)は減算器18のマイナス側に出
力している。一方車室内に設けたマイク11には、利用
者5の発する音声Xsが伝わる伝達関数Cs、及びスピ
ーカ41から出力されるオーディオ音Xnが伝わる伝達
関数Cnを経由して、室内の音Xs・Cs+Xn・Cn
が入力される。このマイクからの信号は適宜の時定数を
持つ遅延回路12ならびに切替スイッチSW2を介して
減算器18のプラス側に出力している。減算18におい
ては両信号に基づいて、e(n)=d(n)−y(n)
を演算し、誤差信号e(n)を得ている。
【0020】また、マイク11からの音声信号は、レベ
ル判定部14に入力され、レベル判定部14は、常時車
室内の音声信号d(n)のレベルを判定し、所定のレベ
ル以上の変化を検出した際に、その検出内容を制御部2
0に伝達するように構成されている。
【0021】減算器18において誤差信号e(n)は、
音声認識部19に出力されると共に、切替スイッチSW
1を介して適応フィルタ15のタップ係数w(n)を変
化させる適応アルゴリズムを算出するLMSアルゴリズ
ム算出部16に入力され、適応フィルタ15は選択され
た適応アルゴリズム値に基づき、オーディオ装置40か
ら遅延回路13ならびにSW3を介して入力されている
オーディオ信号x(n)を変化させ、減算器18へ信号
y(n)として出力する。
【0022】減算器18から出力される誤差信号e
(n)はステップサイズパラメータ変更部17の入力端
にも出力されている。このステップサイズパラメータ変
更部17は、誤差信号e(n)を小さな値とする構成を
とっており、レベル判定部14が車室内の音声信号が所
定のレベル以上と判定した場合に、制御部20からの制
御信号に基づき、SW1がBに切り替えられて、誤差信
号e(n)が、ステップサイズパラメータ変更部17に
より小さな値に変換され、LMSアルゴリズム算出部1
6に入力される。
【0023】また、減算器18から出力される誤差信号
e(n)は音声認識部19にも入力され、レベル判定部
14が所定のレベル以上の変化を検出した場合、誤差信
号e(n)に対する音声認識処理が行われる。
【0024】上記構成からなる第1図に示す音声認識装
置用オーディオキャンセル装置においては、車室内にお
いてオーディオ装置からの音楽等の音が出力されている
ときに、利用者5が例えばナビゲーション装置に対して
周辺施設情報検索等を行うために例えば第4図に例示さ
れている所定のコマンドの一つを発声する。
【0025】この時、スピーカ41からのオーディオ信
号ならびに利用者5からの発生信号の双方が重畳された
音声信号d(n)がマイク11に入力され、この音声信
号d(n)がレベル判定部14に入力される。
【0026】レベル判定部14は、音声信号d(n)が
それ以前の音声信号のレベルに対して、利用者の音声が
重畳された分だけ所定のレベル以上にあることを判定
し、制御部20に対して、所定のレベル以上の変化の検
出を通知する。
【0027】制御部20は、レベル判定部14からの通
知に基づき、SW1をBに切替え、ステップサイズパラ
メータ変更部17を介してLMSアルゴリズム算出部1
6にフィードバックされる誤差信号e(n)の値を変更
するとともに、音声認識部19を作動させる。
【0028】マイク11から入力された音声信号d
(n)は、レベル判定部14に出力されると共に、第1
の遅延回路12にも出力される。この第1の遅延回路1
2ならびにSW2を経由した音声信号d(n)と、第2
の遅延回路13ならびにSW3と、ステップサイズパラ
メータ変更部17で値が変更された誤差信号e(n)に
基づきLMSアルゴリズムが算出されたタップ係数w
(n)による適応フィルタ15を通したオーディオ信号
x(n)とが、減算器18で減算され、誤差信号e
(n)として得られる。
【0029】この誤差信号e(n)には、利用者5が発
生した所定のコマンドが含まれており、この誤差信号e
(n)が音声認識部19に入力され、誤差信号e(n)
に含まれている発生コマンドの音声認識が行われる。同
時に、誤差信号e(n)はステップサイズパラメータ変
更部17を介して、LMSアルゴリズム算出部16に送
られ、適応フィルタ15のタップ係数が変更される。
【0030】この際、誤差信号e(n)のフィードバッ
ク値は、ステップサイズパラメータ変更部17によって
その効果が弱められており、誤差信号e(n)に含まれ
る利用者5の発生音声のフィードバックが抑えられ、エ
コーの発生を防止することとなり、音声認識部19にお
ける音声認識率が向上する。
【0031】上記のような本発明の音声認識用オーディ
オキャンセル装置は、第2図に示される作動フローに沿
って処理される。即ち、このフローの開始後、SW1、
SW2、SW3がそれぞれA側に設定され(ステップS
0)、その後、レベル判定部14により、常時マイク1
1からの音声入力信号d(n)の入力レベルの監視が行
われる。レベル判定部14がマイク11から入力される
音声信号d(n)のレベルが所定の変化があったことを
検知する(ステップS2)と、その結果が制御部20に
通知され、制御部20からの制御信号に基づき、まず、
SW1がB側に切り替えられると同時に、音声認識部1
9の音声認識動作が開始される。SW1のB側への切替
により誤差信号e(n)に基づき適応フィルタ15に供
給されるタップ係数の値がステップサイズパラメータ変
更部17により弱められる。
【0032】レベル判定部14は、例えば次のような判
定基準で判定を行う。 つまり、つまり、過去の(k+1)個のサンプル値の平
均値と最新のサンプル値d(n)を比較し、最新のサンプル
値が平均値のα倍以上であるかどうかを判定する。ま
た、レベルのみに限らず、パワーで比較を行ってもよ
い。さらに、以下のように、最新のサンプル値d(n)のみ
ではなく、最近の(m+1)個のサンプル値の平均と、それ
以前の(k+1)個のサンプル値の平均を比較するなどの方
法も考えられる。 ここで、α>1,m<<kとする。
【0033】上記のような方法で判定されたレベルの変
化に基づき、SW1の切替ならびに音声認識部19の動
作が開始される。
【0034】音声認識部19に入力される音声認識用の
信号e(n)は、第1の遅延回路12ならびにSW2を
通して減算器18に供給されるマイク11が取得した車
室内の音声信号d(n)と、第2の遅延回路13、SW
3と、ステップサイズパラメータ変更部17でその効果
を弱められた適応フィルタ15を通して減算器18に供
給されるオーディオ装置40からのオーディオ信号x
(n)との差分であり、第1並びに第2の遅延回路は、
レベル判定部14における所定のレベル変化の検知に基
づき制御部20がSW1の切替ならびに音声認識部19
に対する音声認識開始のための制御信号を出力するまで
の期間マイク11からの信号d(n)並びにオーディオ
装置40からの信号x(n)を遅延させるように設定さ
れている。
【0035】音声認識部19は、入力された音声信号e
(n)に対する音声認識動作を行い、第4図に例示され
る所定のコマンドの一つを認識した場合(ステップS
4)、その認識の結果を制御部20に通知し、制御部2
0は、SW2ならびにSW3をB側に切り替える。この
動作により、マイク11から入力される音声信号d
(n)ならびにオーディオ装置40からのオーディオ信
号x(n)は第1並びに第2の遅延回路12,13を通
さずに減算器18に供給されることとなり、音声認識装
置1の応答性を損なうことがなくなる。
【0036】音声認識装置1は、認識されたコマンドに
基づき、利用者5に次の操作を促すためのシステム応答
処理を行い、次のコマンドの入力を待つ(ステップS
6)。マイク11から利用者の音声が入力され(ステッ
プS7)、入力された音声d(n)と、適応フィルタ1
5で適応化されたオーディオ装置からのオーディオ信号
x(n)とが前記と同様に減算器18でオーディオ信号
のキャンセル処理が行われた信号e(n)として音声認
識部19に入力され音声認識処理が行われる(ステップ
S8)。
【0037】この応答処理は、例えば、利用者5が発生
した音声から認識されたコマンドを車室内に設けられた
音声認識装置専用のスピーカなどから発音し、その後次
の音声を入力するように音声で利用者5に促すように発
音することが考えられる。
【0038】この処理期間中においては、通常利用者5
は応答内容を確認するため、コマンドなどの発音を控え
ていることが一般的であると考えられる。したがって、
この応答処理期間中において、エコー音の発生を防ぐた
めに音声認識を実施中にステップサイズパラメータ変更
部17の動作によりその効果が弱められていたオーディ
オキャンセル処理のための誤差信号のフィードバック量
をステップサイズパラメータ変更部17で弱めることな
く適応アルゴリズム算出部16に出力することで、音声
認識処理期間中に弱められていたオーディオキャンセル
効果の効率を最大限とし、次の音声認識処理におけるオ
ーディオキャンセルのための適応アルゴリズムを最適化
することが望まれる。
【0039】このシステム応答処理期間中のフローを第
3図に示す。ここで、システム応答処理が開始される
と、この応答期間中は、利用者5からの音声入力を処理
する必要がないため、音声認識部19における音声認識
処理を停止する(ステップS100)。
【0040】次に、ステップサイズパラメータ変更部1
7からの出力をSW1で切替(B→A)、ステップサイ
ズパラメータ変更部17で減少されていた誤差信号e
(n)のフィードバック量を初期状態とする(ステップ
S101)。
【0041】SW1が初期状態となった時点で、音声認
識装置1は利用者に対する応答メッセージ(利用者5の
発声音声から認識されたコマンドの確認並びに次に入力
すべき項目)を発声する(ステップS102)。
【0042】応答メッセージの再生が完了すると、音声
認識装置1の制御部20は、SW1をB側に切替、エコ
ーなどが発生しないようにステップサイズパラメータ変
更部17により誤差信号e(n)を減少して適応アルゴ
リズム算出部16に出力するようにする(ステップS1
03)。
【0043】最後に、音声認識装置1の制御部20は、
音声認識部19に対して、音声認識処理の開始のための
制御信号を発する。
【0044】音声認識は、或るコマンド、例えば最初の
コマンドが「住所」であった場合、音声認識装置は、住
所を特定するために都道府県名、市区町村名、所番地な
どを階層的に処理するように構成されている。このよう
な階層が存在する場合、音声認識装置1は、ステップS
8で認識された音声コマンドに基づき、音声認識の一つ
の階層が終了したか否かを音声認識部19が確認するよ
うに構成されている(ステップS9)。
【0045】階層を終了するコマンドがステップS9で
認識できなかった場合、音声認識装置1はステップS6
のシステム応答処理により再度の音声入力を促す。
【0046】ステップS9で階層の終了を検知した場
合、音声認識装置1は、次の階層の処理が必要であるか
否かを判断し(ステップS10)、次の階層がある場
合、その処理はステップS6に戻り、次の階層のための
利用者5の音声入力を促すためのシステム応答処理を行
う。
【0047】ステップS9で次の階層が無いことが検知
された場合、音声認識装置は、SW1を初期値であるA
側に切替、ステップサイズパラメータ変更部17による
誤差信号e(n)への処理を停止し、オーディオ音のキ
ャンセル効果を最大限とする(ステップS11)。
【0048】続いて、SW2、SW3を同様に初期設定
であるA側に切り替えることで、マイク11からの音声
信号d(n)ならびにオーディオ装置40からのオーデ
ィオ音x(n)を第1並びに第2の遅延回路12、13
を通して減算器18に供給するように切り替える(ステ
ップS12)。
【0049】以上の実施例では、第1並びに第2の遅延
部12、13を経由せずにマイク11からの音声信号d
(n)ならびにオーディオ装置40からのオーディオ音
x(n)を切り替えるための切替スイッチSW1、SW
2とステップサイズパラメータ変更部17からの出力を
切り替えるための切替スイッチSW3を有しているもの
である。
【0050】しかしながら、遅延回路を通さずに直接減
算器にオーディオ装置からのオーディオ音ならびにマイ
クからの音声を入力した場合、車室内における音の伝達
関数により、オーディオ装置からのオーディオ音に時間
的なずれが生じるおそれがある。
【0051】このようなおそれを解決するため、音声認
識装置1の制御部20により第1並びに第2の遅延回路
部における遅延量を制御し、時間的なずれを最小とする
ことで、さらなる音声認識率の向上を図ることが可能で
ある。
【0052】第5図は、上記の本発明に係る第2の実施
例を示すものである。第1図における実施例のSW1、
SW2、SW3を排除し、制御部20が第1並びに第2
の遅延回路12、13、ならびに、ステップサイズパラ
メータ変更部17を直接制御するように構成している。
【0053】第5図における第1並びに第2の遅延回路
12、13に対する遅延量は、利用者5からの音声入力
がない状態で、第1の遅延回路12に対するレベル判定
部14のマイク11からの入力レベルの変化を検出する
に必要な期間をまず設定し、その上で、減算器から出力
される誤差信号e(n)を極小化するように第2の遅延
回路の遅延量を調節することで行われる。第2の遅延回
路13の遅延量は、第1の遅延回路12の遅延量は等し
い値とする。
【0054】また、本第2の実施例においては、システ
ム応答処理期間中に音声認識装置1が発生する音声と同
じ音声信号s(n)をオーディオ装置40からのオーデ
ィオ信号x(n)に重畳する加算器50を有し、マイク
11からの入力に対するキャンセル対象としている。
【発明の効果】本発明は、レベル判定部でマイクから入
力される音声信号のレベル変化が所定の値以上である場
合に、音声認識装置を作動させると共に、通常の状態で
は、レベル判定部がレベル変化を検知し、ステップサイ
ズパラメータ変更部が動作するまでの間、音声認識部に
入力される音声信号を遅延させるようにしたため、発話
スイッチ等の利用者による操作なしでも、音声認識時に
音声認識部に入力される信号へのエコーなどの発生を防
止でき、音声認識率が向上するとの効果を奏する。ま
た、所定のコマンド認識後においては、マイクから入力
される車室内の音声信号に対する第1の遅延回路ならび
にオーディオ装置から入力されるオーディオ音に対する
第2の遅延回路の遅延量を極小化することで、音声認識
開始後の音声認識装置の応答性が向上するとの効果を奏
する。また、音声認識装置がシステムとして応答する処
理期間中は、ステップサイズパラメータ変更部の設定を
最適なオーディオキャンセルのためのフィードバックを
行うように制御しているため、音声認識処理のための最
適なキャンセル処理が行えるとの効果を奏する。また、
本発明においては、レベル判定部のレベル変化の検出結
果に基づき、音声認識部を作動させるように構成してい
るため、音声認識装置の消費電力を削減できるとの効果
をも奏するものである。
【図面の簡単な説明】
【図1】本発明に関する音声認識装置の第1の実施例の
ブロック図である。
【図2】本発明に関する音声認識装置の動作フロー図で
ある。
【図3】第2図に記載のシステム応答処理に関する音声
認識装置の動作フロー図である。
【図4】音声認識コマンドの一例を示す図である。
【図5】本発明に関する音声認識装置の第2の実施例の
ブロック図である。
【図6】本発明の音声認識装置に採用されている適応フ
ィルタの原理図である。
【図7】第6図の適応フィルタを応用したオーディオキ
ャンセル装置の原理図である。
【符号の説明】
1 音声認識装置 12 第1の遅延回路 13 第2の遅延回路 15 適応フィルタ 17 ステップサイズパラメータ変更部 19 音声認識部 20 制御部 40 オーディオ装置 SW1、SW2、SW3 切替スイッチ

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】音声認識装置に入力する音声とオーディオ
    音とを集音するマイクと、前記マイクからの信号を遅延
    させる第1の遅延部と、前記マイクからの入力信号レベ
    ルの変化を判定するレベル判定部と、オーディオ装置か
    ら入力されるオーディオ信号を入力し適応アルゴリズム
    算出部によりタップ係数が変化される適応フィルタと、
    前記オーディオ信号の適応フィルタへの入力を遅延させ
    る第2の遅延部と、前記適応フィルタの出力信号と前記
    マイクからの信号を入力する減算器と、前記減算器から
    出力する両信号の誤差信号を前記適応アルゴリズムに入
    力すると共に音声認識部に出力するようにした音声認識
    装置において、前記誤差信号の出力部に前記適応フィル
    タのタップ係数の変更度合いを調節するステップサイズ
    パラメータ変更部を備え、前記マイクからの入力信号の
    変化が所定のレベル以上になったことを前記レベル判定
    部が判定したときに、ステップサイズパラメータを変更
    すると共に、減算器から出力される誤差信号に対する音
    声認識を実施するよう音声認識部を作動し、前記誤差信
    号に対する音声認識により前記音声認識部が所定の音声
    コマンドを認識した場合には前記マイクからの入力信号
    ならびに前記適応フィルタを通過するオーディオ信号を
    前記第1並びに第2の遅延部を経由せずに前記減算器に
    入力するように制御する制御部を設けたことを特徴とす
    る音声認識装置。
  2. 【請求項2】前記音声認識部が所定のコマンドを認識し
    たことを利用者に通知する通知手段を設けたことを特徴
    とする特許請求の範囲第1項記載の音声認識装置。
  3. 【請求項3】前記通知手段は、音声認識装置が利用者に
    対して発する音声応答であることを特徴とする特許請求
    の範囲第2項記載の音声認識装置。
  4. 【請求項4】前記通知手段が利用者に対して応答する期
    間中は、ステップサイズパラメータを変更しないように
    前記制御部を制御することを特徴とする特許請求の範囲
    第2項記載の音声認識装置。
  5. 【請求項5】音声認識装置に入力する音声とオーディオ
    音とを集音するマイクと、前記マイクからの信号を遅延
    させる第1の遅延部と、前記マイクからの入力信号レベ
    ルの変化を判定するレベル判定部と、オーディオ装置か
    ら入力されるオーディオ信号を入力し適応アルゴリズム
    算出部によりタップ係数が変化される適応フィルタと、
    前記オーディオ信号の適応フィルタへの入力を遅延させ
    る第2の遅延部と、前記適応フィルタの出力信号と前記
    マイクからの信号を入力する減算器と、前記減算器から
    出力する両信号の誤差信号を前記適応アルゴリズムに入
    力すると共に音声認識部に出力するようにした音声認識
    装置において、前記誤差信号の出力部に前記適応フィル
    タのタップ係数の変更度合いを調節するステップサイズ
    パラメータ変更部を備え、前記マイクからの入力信号の
    変化が所定のレベル以上になったことを前記レベル判定
    部が判定したときに、ステップサイズパラメータを変更
    すると共に、減算器から出力される誤差信号に対する音
    声認識を実施するよう音声認識部を作動し、前記誤差信
    号に対する音声認識により前記音声認識部が所定の音声
    コマンドを認識した場合には前記マイクからの入力信号
    ならびに前記適応フィルタを通過するオーディオ信号に
    対する前記第1並びに第2の遅延回路の遅延量を前記制
    御部が制御し、前記マイクからの入力信号ならびに前記
    適応フィルタを通過したオーディオ信号の遅延量を減少
    させるようにしたことを特徴とする特許請求の範囲第1
    項記載の音声認識装置。
  6. 【請求項6】前記音声認識部が所定のコマンドを認識し
    たことを利用者に通知する通知手段を設けたことを特徴
    とする特許請求の範囲第5項記載の音声認識装置。
  7. 【請求項7】前記通知手段は、音声認識装置が利用者に
    対して発する音声応答であることを特徴とする特許請求
    の範囲第6項記載の音声認識装置。
  8. 【請求項8】前記通知手段が利用者に対して応答する期
    間中は、ステップサイズパラメータを変更しないように
    前記制御部を制御することを特徴とする特許請求の範囲
    第6項記載の音声認識装置。
JP2001057683A 2001-03-02 2001-03-02 音声認識装置 Expired - Fee Related JP4166000B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001057683A JP4166000B2 (ja) 2001-03-02 2001-03-02 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001057683A JP4166000B2 (ja) 2001-03-02 2001-03-02 音声認識装置

Publications (2)

Publication Number Publication Date
JP2002258898A true JP2002258898A (ja) 2002-09-11
JP4166000B2 JP4166000B2 (ja) 2008-10-15

Family

ID=18917522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001057683A Expired - Fee Related JP4166000B2 (ja) 2001-03-02 2001-03-02 音声認識装置

Country Status (1)

Country Link
JP (1) JP4166000B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005024787A1 (ja) * 2003-09-02 2005-03-17 Nec Corporation 信号処理方法および装置
JP2007292814A (ja) * 2006-04-20 2007-11-08 Alpine Electronics Inc 音声認識装置
US8184940B2 (en) 2004-06-18 2012-05-22 Adc Telecommunications, Inc. Telecommunications cabinet with connector storage
US10634860B2 (en) 2003-06-30 2020-04-28 Commscope Technologies Llc Fiber optic connector holder and method

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11119285B2 (en) 2003-06-30 2021-09-14 Commscope Technologies Llc Fiber optic connector holder and method
US10634860B2 (en) 2003-06-30 2020-04-28 Commscope Technologies Llc Fiber optic connector holder and method
US9543926B2 (en) 2003-09-02 2017-01-10 Nec Corporation Signal processing method and device
US7720233B2 (en) 2003-09-02 2010-05-18 Nec Corporation Signal processing method and apparatus
WO2005024787A1 (ja) * 2003-09-02 2005-03-17 Nec Corporation 信号処理方法および装置
US8538228B2 (en) 2004-06-18 2013-09-17 Adc Telecommunications, Inc. Telecommunications cabinet with connector storage
US9201206B2 (en) 2004-06-18 2015-12-01 Commscope Emea Limited Telecommunications cabinet with connector storage
US9341798B2 (en) 2004-06-18 2016-05-17 Commscope Technologies Llc Telecommunications cabinet with connector storage
US8818158B2 (en) 2004-06-18 2014-08-26 Adc Telecommunications, Inc. Telecommunications cabinet with connector storage
US10126509B2 (en) 2004-06-18 2018-11-13 Commscope Technologies Llc Telecommunications cabinet with connector storage
US10274686B2 (en) 2004-06-18 2019-04-30 Commscope Technologies Llc Telecommunications cabinet with connector storage
US10345539B2 (en) 2004-06-18 2019-07-09 Commscope Technologies Llc Telecommunications cabinet with connector storage
US10634859B2 (en) 2004-06-18 2020-04-28 Commscope Technologies Llc Fiber optic connector holder unit
US8184940B2 (en) 2004-06-18 2012-05-22 Adc Telecommunications, Inc. Telecommunications cabinet with connector storage
US10809467B2 (en) 2004-06-18 2020-10-20 Commscope Technologies Llc Telecommunications cabinet with connector storage
US11428876B2 (en) 2004-06-18 2022-08-30 Commscope Technologies Llc Telecommunications cabinet with connector storage
JP2007292814A (ja) * 2006-04-20 2007-11-08 Alpine Electronics Inc 音声認識装置

Also Published As

Publication number Publication date
JP4166000B2 (ja) 2008-10-15

Similar Documents

Publication Publication Date Title
US7890321B2 (en) Noise reduction device, program and method
US20080249779A1 (en) Speech dialog system
WO2001015137A1 (fr) Dispositif reducteur de bruit
US20080031471A1 (en) System for equalizing an acoustic signal
JP2007266754A (ja) 車両用音声入出力装置および音声入出力装置用プログラム
JP6635394B1 (ja) 音声処理装置および音声処理方法
JP3877271B2 (ja) 音声認識用オーディオキャンセル装置
US7106868B2 (en) Active noise control for vehicle door noise
JP5115944B2 (ja) 音声認識装置
JP3524370B2 (ja) 音声起動システム
JP4166000B2 (ja) 音声認識装置
KR20190016851A (ko) 음성 인식 방법 및 이에 사용되는 장치
JP2002091489A (ja) 音声認識装置
JP3688934B2 (ja) マイクロホンシステム
JP5373473B2 (ja) 音声抽出装置
JP5383008B2 (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
JP2002171587A (ja) 車載音響装置の音量調節装置およびそれを用いた音声認識装置
JP4162860B2 (ja) 不要音信号除去装置
JP4765394B2 (ja) 音声対話装置
JP2008225056A (ja) 音声明瞭度改善装置およびその騒音レベル推定方法
JP2010041188A (ja) 音声認識装置
JP3049261B2 (ja) 音響選択装置
JP2004309536A (ja) 音声処理装置
JP2003255987A (ja) 音声認識を利用した機器の制御方法、制御装置及び制御プログラム
JPH0695694A (ja) 音声認識装置用騒音低減回路

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080729

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080729

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4166000

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110808

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120808

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120808

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130808

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130808

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140808

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees