JP3005330B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3005330B2
JP3005330B2 JP3197542A JP19754291A JP3005330B2 JP 3005330 B2 JP3005330 B2 JP 3005330B2 JP 3197542 A JP3197542 A JP 3197542A JP 19754291 A JP19754291 A JP 19754291A JP 3005330 B2 JP3005330 B2 JP 3005330B2
Authority
JP
Japan
Prior art keywords
voice
input
pattern
time
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3197542A
Other languages
English (en)
Other versions
JPH0540498A (ja
Inventor
真一 鶴藤
正幸 飯田
宏樹 大西
孝次 荒木
浩次 出島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP3197542A priority Critical patent/JP3005330B2/ja
Publication of JPH0540498A publication Critical patent/JPH0540498A/ja
Application granted granted Critical
Publication of JP3005330B2 publication Critical patent/JP3005330B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は音声認識装置に関し、
特にマイクロフォンから入力された音声を分析して得ら
れる音声パターンによって当該音声を認識する、音声認
識装置に関する。
【0002】
【従来の技術】この種の音声認識装置をステレオなどの
音響機器の近傍で用いる場合、音響機器からの出力音響
が音声認識装置に対して周囲雑音となり、誤認識を多発
する危惧がある。特に、たとえば、このような音響機器
を音声認識装置の認識結果に基づいて制御ないし操作し
ようとする場合には、音響機器から出力される音声や音
楽がかなりの大きさで音声認識装置に入力されるので、
音声認識装置が不所望に動作してしまうという不都合が
ある。このような誤動作を防止するために、音声認識装
置に対して音声入力を行うときには、音声入力期間だけ
音響機器の出力を小さくするような音声認識装置が提案
されている(特開昭63−29755号公報参照)。
【0003】また、このような音声認識装置において
は、一般的には、マイクロフォンから入力された音声を
分析して得られる音声の特徴を表すパラメータを含む音
声パターンを、予め設定された標準パターンと比較し
て、最も類似した標準パターンを選択することによって
入力音声を認識する。このような音声認識装置において
は、最も類似する標準パターンを選択しても、その類似
度が極めて小さいときには、誤認識である可能性が高い
ので、これを防止するために、その類似度が一定の閾値
を超えなければ認識棄却(リジェクト)するのが一般的
である。
【0004】
【発明が解決しようとする課題】前者においては、音声
入力可能期間を設定するために、音声入力の都度スイッ
チを操作するなど煩雑な操作が必要であった。また、後
者においては、類似度の閾値が大きすぎる場合には音声
の微妙な曖昧要素によって認識結果が得られないことが
多く、また閾値を小さくすると雑音までも音声として誤
認識してしまうなど種々の不都合がある。
【0005】それゆえに、この発明の主たる目的は、煩
雑な操作なしに周囲雑音等による誤動作を防止できる、
音声認識装置を提供することである。この発明の他の目
的は、類似度の閾値設定に伴う不都合を解消できる、音
声認識装置を提供することである。この発明のさらに他
の目的は、認識対象外の音声が入力された場合の誤認識
を防止できる、音声認識装置を提供することである。
【0006】この発明のさらに他の目的は、1つの項目
に対して複数の音声を標準パターンとして登録する場合
に登録誤りを可及的防止できる、音声認識装置を提供す
ることである。
【0007】
【課題を解決するための手段】第1発明は、マイクロフ
ォンから入力された音声を分析して音声パターンを作成
するパターン作成手段、および前記音声パターンによっ
音声認識する認識手段を備える音声認識装置におい
て、前記マイクロフォンからの音声入力を許容する入力
時間を設定する時間設定手段、および前記時間設定手段
によって設定された前記入力時間内に前記認識手段によ
って音声が音声認識されたとき入力時間を延長する延長
手段をさらに備えることを特徴とする。
【0008】第2本発明は、マイクロフォンから入力さ
れた音声を分析して音声パターンを作成するパターン作
成手段、および前記音声パターンによって音声認識する
認識手段を備える音声認識装置において、前記マイクロ
フォンからの音声入力を許容する入力時間を設定する時
間設定手段、および前記時間設定手段によって設定され
た前記入力時間内に前記認識手段によって音声が音声認
識されたとき、該認識された音声に応じて入力時間を延
長する延長手段をさらに備えることを特徴とする。
【0009】第3本発明は、マイクロフォンから入力さ
れた音声を分析して音声パターンを作成するパターン作
成手段と、標準パターンが登録された標準パターン記憶
手段と、前記パターン作成手段で作成した音声パターン
と前記標準パターン記憶手段に登録された標準パターン
との比較に基づいて音声認識する認識手段とを備える音
声認識装置において、前記標準パターン毎の時間情報が
登録された時間情報記憶手段と、前記マイクロフォンか
らの音声入力を許容する入力時間を設定する時間設定手
段と、前記時間設定手段によって設定された前記入力時
間内に前記認識手段によって音声が音声認識されたとき
入力時間を延長する延長手段とをさらに備えることを特
徴とする。
【0010】第4本発明は、マイクロフォンから入力さ
れた音声を分析して音声パターンを作成するパターン作
成手段と、標準パターンが登録された標準パターン記憶
手段と、前記パターン作成手段で作成した音声パターン
と前記標準パターン記憶手段に登録された標準パターン
との比較に基づいて音声認識する認識手段とを備える音
声認識装置において、前記標準パターン毎の延長時間情
報が登録された時間情報記憶手段と、前記マイクロフォ
ンからの音声入力を許容する入力時間を設定する時間設
定手段と、前記時間設定手段によって設定された前記入
力時間内に前記認識手段によって音声が音声認識された
とき、該音声認識された音声入力に対応する標準パター
ンについての前記延長時間情報に基づいて入力時間を延
長する延長手段とをさらに備えることを特徴とする。
【0011】
【作用】第1の発明においては、前記時間設定手段によ
って設定された前記入力時間内に前記認識手段によって
音声が音声認識されたとき、前記延長手段が入力時間を
延長する。
【0012】第2の発明においては、前記時間設定手段
によって設定された前記入力時間内に前記認識手段によ
って音声が音声認識されたとき、該音声認識された音声
に応じて前記延長手段が入力時間を延長する。
【0013】第3の発明においては、前記時間設定手段
によって設定された前記入力時間内において、前記パタ
ーン作成手段で作成した音声パターンと前記標準パター
ン記憶手段に登録された標準パターンとの比較に基づい
て音声が音声認識されたとき、前記延長手段が入力時間
を延長する。 第4の発明においては、前記時間設定手段
によって設定された前記入力時間内において、前記パタ
ーン作成手段で作成した音声パターンと前記標準パター
ン記憶手段に登録された標準パターンとの比較に基づい
て音声が音声認識されたとき、前記延長手段が音声認識
された音声入力に対応する標準パターンについての前記
延長時間情報に基づいて入力時間入力時間を延長する。
【0014】
【発明の効果】第1及び第3の発明に依れば、音声が一
旦認識されると音声入力可能時間が延長されるので、連
続して音声入力する場合に再度入力時間を設定する必要
はない。したがって、誤動作を防止するために音声入力
可能期間を設定するのに、従来のように煩雑なスイッチ
操作は必要なくなる。また、入力時間にのみ音声を認識
するので、周囲雑音がマイクロフォンに入力される可能
性が小さくなり、従来と同様に、雑音で誤動作すること
はない。
【0015】さらに、第2及び第4の発明に依れば、認
識した音声に応じて入力時間が延長されるので、周囲雑
音による誤動作の可能性をより一層低減することができ
る。
【0016】
【0017】
【0018】
【実施例】図1に示す実施例のカーオーディオシステム
10はマイクロコンピュータ12を含み、マイクロコン
ピュータ12によってオーディオ部14が制御される。
オーディオ部14は、チューナ18,テープデッキ20
およびCDプレーヤ22等を含むステレオ音源16を含
み、このステレオ音源16からの右信号Rおよび左信号
Lは、それぞれ、アンプ24Rおよび24Lを通して、
自動車(図示せず)の室内の適宜の位置に配置されたス
ピーカ26Rおよび26Lに与えられる。ステレオ音源
16が4チャネルステレオである場合、さらにリア信号
が出力される。オーディオ部14は、さらに、コントロ
ーラ28を含み、このコントローラ28はステレオ音源
16を手動的に操作するための操作スイッチ(図示せ
ず)を備える。ただし、マイクロコンピュータ12から
の制御信号によってオーディオ部14すなわちステレオ
音源16を制御する場合には、オーディオ部14に設け
られた音声入力スイッチ30が操作される。この場合に
は、上述の操作スイッチからの操作信号に代えて、マイ
クロコンピュータ12からの制御信号がステレオ音源1
6に入力される。なお、オーディオ部14には、発光ダ
イオード(LED)31が設けられ、このLED31に
よって、後述のように、たとえば認識対象外の音声が入
力されたこと、そのために再度音声入力が必要なこと、
あるいは登録の手順等を操作者に種々報知する。
【0019】一方、自動車のダッシュボード(図示せ
ず)には、オーディオ部分14を制御するためのドライ
バの音声をピックアップするためのマイクロフォン32
が配置される。このマイクロフォン32からの音声信号
はフィルタバンク34に与えられる。フィルタバンク3
4は、よく知られているように、たとえば8チャネルの
バンドパスフィルタを含み、そのバンドパスフィルタに
よって、マイクロフォン32から入力された音声信号の
特徴パラメータを抽出する。すなわち、フィルタバンク
34は、各チャネル毎に、プリアンプ,AGC,バンド
パスフィルタ,整流回路およびローパスフィルタを備え
る。フィルタバンク34からの各特徴パラメータ(アナ
ログ信号)はマルチプレクサ36に入力される。マルチ
プレクサ36は、フィルタバンク34から入力される8
チャネルの特徴パラメータ信号を時間順次に出力する。
マルチプレクサ36から出力された音声信号はA/D変
換器38によって、特徴パラメータデータに変換され
る。
【0020】上述の音声入力スイッチ30からの信号お
よびA/D変換器38の出力は、入力ポート40を通し
て、上述のマイクロコンピュータ12に入力される。マ
イクロコンピュータ12は、後述のようにして、入力ポ
ート40から入力された特徴パラメータをメモリ42に
形成されている標準パターンテーブル42a(図2)の
各標準パターンと比較することによって、マイクロフォ
ン32から入力された音声を認識する。そして、その認
識結果に応じて、出力ポート44を通して、オーディオ
部14に前述の制御信号を出力する。
【0021】したがって、音声入力スイッチ30が操作
されているときマイクロフォン32にオーディオ部14
を制御するための音声が入力されると、その音声に応じ
て、マイクロコンピュータ12から制御信号が出力され
る。この制御信号に応答して、コントローラ28が、ス
テレオ音源16を制御する。メモリ42は、図2に示す
ように、標準パターンテーブル42aを含み、この標準
パターンテーブル42aには、フィルタバンク34によ
って切り出された特徴パラメータに基づいて音声を認識
するための各音ないし単語の標準的な特徴パラメータの
パターンが各番号毎に予め登録されている。なお、この
標準パターンテーブル42aはたとえばバックアップR
AMで構成される。メモリ42には、さらに、始端フラ
グ42が形成され、この始端フラグ42bは、図3に
示すように音声データが最初に閾値を超えたときすなわ
ち“Fh”で示す音声の始端が検出されたときオンされ
る。メモリ42はさらに音声データバッファ42cを含
み、この音声データバッファ42cにはマイクロコンピ
ュータ12が取り込んだA/D変換器38からの音声デ
ータがストアされる。この音声データバッファ42cは
複数のフレームに亘って図3に示す始端(“Fh”で示
す)から終端(“Ft”で示す)までの一連の音声デー
タをストア可能なように、複数のアドレスを有する。た
だし、1フレームはたとえば5ミリ秒に設定される。す
なわち、音声データバッファ42cは、A/D変換器3
8から出力されるマイク32に入力された音声の特徴パ
ラメータデータをフレーム順次にストアする。
【0022】メモリ42はさらに前述の標準パターンテ
ーブル42aの各番号毎に固有の設定領域を有する時間
テーブル42dを含み、この時間テーブル42dには、
標準パターンテーブル42aに設定される標準パターン
毎に特有に決定される「延長時間」が設定される。この
延長時間は、前述の音声入力スイッチ30のオン時間を
延長すべき時間を意味する。たとえば、一連の2以上の
音声で1つの制御を達成する場合、先の音声が認識され
た後、音声入力スイッチ30のオン状態を継続しておく
必要があるが、そのオン時間をどの程度延長すべきかを
示す延長時間が、この時間テーブル42dに設定され
る。そして、後述のように、この時間テーブル42dか
ら読み出した時間が同じくメモリ42に割り付けられて
いるオン時間タイマ42eに設定される。
【0023】メモリ42に含まれるリジェクトフラグ4
2fは適正な認識ができなかったとき(認識棄却のと
き)にオンされるものであり、リジェクト番号レジスタ
42gはそのようにしてリジェクトされた単語を示す標
準パターンテーブル42aの番号をストアする。リジェ
クトカウンタ42hは、リジェクトされた回数をカウン
トするもので、リジェクトされる毎にインクリメントさ
れる。
【0024】なお、メモリ42の再入力タイマ42i
は、認識対象外の単語が入力されたとき操作者に再入力
を許容する時間を設定するためのタイマである。また、
点滅時間タイマ42jは、LED31を点滅させる時間
間隔を設定するためのタイマである。図4に示す登録モ
ードは図示しない登録キーの操作に応じて設定され、最
初のステップS1においては、同じく図示しないテンキ
ーなどを用いて登録番号を設定する。この登録番号は標
準パターンテーブル42aにおける番号であり、その番
号毎に認識すべき単語の標準パターンを登録する。その
ために、使用者がマイクロフォン32(図1)に向かっ
てその番号で登録したい単語を音声入力する。応じて、
ステップS2において、音声入力のサンプリングが開始
され、先に説明したように、フィルタバンク34,マル
チプレクサ36およびA/D変換器38を経て、マイク
ロコンピュータ12に音声(パラメータ)データが入力
される。したがって、ステップS3において、マイクロ
コンピュータ12は、その音声データを取り込み、図示
しないバッファに一時的にストアする。次のステップS
4においては、マイクロコンピュータ12は、音声の始
端(これは図3の“Fh”に相当する)を既に検出して
いるかどうかを判断する。もし音声の始端がまだ入力さ
れていないときには、続くステップS5において、その
ステップS3で入力された音声データは始端のものであ
るかどうか判断する。このステップS5において“N
O”が判断されると、ステップS3に戻る。入力された
音声データが始端のものであると、マイクロコンピュー
タ12は始端フラグ42b(図2)をセットして、先の
ステップS4において“YES”と判断されたときと同
様に、次のステップS7を実行する。ステップS7にお
いては、先に取り込んだ音声データを音声バッファ42
c(図2)にストアする。そして、ステップS8におい
て、入力された音声データが終端(これは図3における
“Ft”に相当する)のものであるかどうか判断する。
そうでなければ、先のステップS3に戻る。このように
して、ステップS3〜S8が繰り返し実行され、始端か
ら終端までの音声データが音声バッファ42cにフレー
ム順次にストアされる。
【0025】その後、ステップS9において、マイクロ
コンピュータ12はこの音声バッファ42cにストアし
たデータを正規化(具体的にはデータ圧縮)する。正規
化された音声データが、ステップS10において、標準
パターンテーブル42aのステップS1において設定さ
れた番号に相当する領域にセーブされる。次のステップ
S11においては、時間テーブル42dに、「延長時
間」を設定する。すなわち、このステップS11におい
ては、標準パターンテーブル42aに標準パターンが設
定されたその単語が入力されたときに、音声入力可能時
間(後述)をどの程度延長すべきかを示す延長時間が個
々に設定される。そして、ステップS12において、登
録キーが再度操作されたかどうかなどに応じて、登録モ
ードを終了するかどうか判断される。もし登録動作を継
続するならば、ステップS13において、登録番号を変
更して先のステップS2に戻る。このようにして、標準
パターンテーブル42aに認識すべき単語の標準パター
ンデータが、そして時間テーブル42dに個々の単語を
認識したときの延長時間を表すデータが予め登録され
る。
【0026】図5に示す認識モードの最初のステップS
101では、マイクロコンピュータ12は、入力ポート
40(図1)からの信号によって、音声入力スイッチ3
0が操作されているかどうか、すなわち音声入力可能期
間であるかどうか判断する。そして、ステップS101
において音声入力スイッチ30のオンが検出されると、
次のステップS102において、マイクロコンピュータ
12は、オン時間タイマ42e(図2)に、この音声入
力スイッチ30のオン状態を継続する所定の時間(たと
えば、10秒)を設定する。
【0027】その後、ステップS103,S104,S
105,S106およびS108が実行される。これら
のステップは、先の図5の登録モードで説明したステッ
プS2,S3,S4,S5およびS6にそれぞれ相当す
るので、ここでは重複する説明は省略する。そして、ス
テップS107において、ステップS104で入力され
た音声データが、先のステップS102においてオン時
間タイマ42eに設定した音声入力可能時間内に入力さ
れたものかどうか判断する。このステップS107にお
いて“YES”が判断されると、先のステップS104
に戻るが、“NO”が判断されるとステップS107a
において、マイクロコンピュータ12は、音声入力スイ
ッチ30をオフ状態に強制し、ステップS101に戻
る。すなわち、音声入力スイッチ30がオンされた後オ
ン時間タイマ42eに設定された所定時間内に音声入力
がなければ、マイクロコンピュータ12は音声入力スイ
ッチ30をオフして、それ以後の認識動作は実行されな
い。
【0028】ステップS108に続いて、図6に示すス
テップS109および110が実行されるが、このステ
ップは先の登録モードにおけるステップS7およびS8
と同様であり、ここでは重複する説明は省略する。そし
て、ステップS111において、マイクロコンピュータ
12は、音声バッファ42cにストアされた音声データ
と標準パターンテーブル42aに予め登録されている標
準パターンの各々との類似度を計算する。そして、その
うち最大類似度を示す標準パターンをステップS112
で決定するとともに、ステップS113においてその類
似度を弁別するための第1の閾値を設定し、ステップS
114に進む。ステップS113において設定される第
1の閾値は、比較的大きく、完全同一の場合の類似度を
「100」とすると、この第1の閾値はたとえば「9
0」に設定される。そして、ステップS114におい
て、ステップS112において選択した標準パターンの
類似度が、ステップS113で設定した第1の閾値を超
えるかどうか判断する。最大類似度が第1の閾値より大
きいとき、その最大類似度を与える標準パターンで示さ
れる単語を認識結果として出力する(ステップS11
5)。
【0029】続くステップS116においては、時間テ
ーブル42dのその単語に相当する番号の領域から延長
時間データを読み出し、その延長時間を、先のステップ
S102と同様にして、オン時間タイマ42eに設定す
る。すなわち、ステップS115において、入力された
音声が標準パターンテーブル42aに予め登録されてい
る標準パターンによって識別されると、引き続き音声入
力を許容するために、ステップS116においてオン時
間タイマ42eを再設定して、ステップS103(図
5)に戻り、後続の音声入力を待つ。このように、入力
音声が認識されると音声入力可能時間が延長されるの
で、その後続けて音声入力する場合でも、音声入力スイ
ッチ30を再度操作する必要はない。たとえば、カーオ
ーディオシステム10のテープデッキ20を制御して、
「早送り」したいときには、「早送り」,「再生」,
「早送り」,…「再生」と連続して音声入力すればよい
が、この場合でも、最初に1回音声入力スイッチ30を
オンするだけで、以後連続して音声入力することができ
る。また、ステップS107およびS107aによっ
て、オン時間タイマ40eに設定した時間が経過した後
は、音声入力できなくなるので、周囲の雑音による誤動
作を防ぐことができる。
【0030】なお、ステップS116がステップS11
5において特定番号で示される単語を認識したときにの
み実行されるようにすれば、すなわち特定の単語を認識
したときにのみ音声入力可能時間を延長するようにすれ
ば、周囲雑音による誤動作の可能性をより一層低減する
ことができる。先のステップS114(図6)において
ステップS112で選択された最大類似度を示す標準パ
ターンの類似度が第1の閾値より小さいと判定した場合
には、図7に示すステップS117に進む。すなわち、
ステップS117においては、リジェクトフラグ42f
がオンされているかどうかを判断する。もし、リジェク
トフラグ42fがオフされているときには、ステップS
118において、リジェクトフラグ42fをセットする
とともに、リジェクト番号レジスタ42gにリジェクト
された単語(標準パターン)の番号をストアしかつリジ
ェクトカウンタ40hをインクリメントし、その後先の
ステップS103(図5)に戻る。
【0031】ステップS117においてリジェクトフラ
グ42fが既にオンされていることを検出すると、次の
ステップS119において、マイクロコンピュータ12
は、リジェクト番号レジスタ42gを参照して、直前に
リジェクトされた標準パターンの番号と今回リジェクト
された標準パターンの番号とが同じであるかどうか、す
なわち同じ単語が続けてリジェクトされたかどうかを判
断する。前にリジェクトされた単語と今回リジェクトさ
れた単語とが異なる場合、すなわち“NO”の場合、ス
テップS120において、リジェクト番号レジスタ42
gを今回リジェクトされた標準パターンの番号で更新す
るとともに、リジェクトカウンタ42hをインクリメン
トし、ステップS103に戻る。
【0032】前にリジェクトされた番号と今回リジェク
トされた番号とが同じである場合、すなわちステップS
119において“YES”が判断された場合、マイクロ
コンピュータS121は、第1閾値よりやや小さいたと
えば「80」のような第2の閾値を設定し、ステップS
122において、ステップS112(図6)で選択され
た最大類似度がステップS121で設定された第2の閾
値を超えるかどうかを判断する。もし最大類似度がその
第2の閾値を超える場合には、その標準パターンに基づ
いて認識結果が出力される。しかしながら、最大類似度
が第2の閾値以下である場合には、ステップS123に
おいて、マイクロコンピュータ12はリジェクトカウン
タ42hを参照して、リジェクト回数が所定回数n(た
とえば3回)に達したかどうかを判断する。ステップS
123において“YES”と判断されると、マイクロコ
ンピュータ12は、ステップS124において、リジェ
クト番号レジスタ42gにロードされている番号を認識
結果として出力する。また、リジェクト回数が所定回数
に達していないときには、ステップS125において、
リジェクトカウンタ42hをインクリメントするととも
に、第2の閾値よりさらに小さいたとえば「70」の第
3の閾値を設定して、ステップS103に戻る。
【0033】このようにして、連続する音声入力が同一
の標準パターンとして同定されかつ同じようにリジェク
トされた場合には、類似度の閾値を徐々に小さく設定す
るようにしているので、再度音声入力すれば認識され得
る。したがって、最初に設定する第1の閾値を比較的大
きく設定して誤認識を可及的減じるようにしても、リ
ジェクトされ続けて音声入力できなくなるということは
ない。さらに、所定回数(たとえば3回)同じようにリ
ジェクトされてしまうと、そのリジェクトされた番号で
示す標準パターンによって同定される音声を識別する
(ステップS124)ので、何回か同じように音声入力
を繰り返すことによって、確実にその音声が入力され
る。なお、突発音や会話の場合には同じ単語が繰り返さ
れることは少ないので、突発音や会話によって誤動作す
ることはない。
【0034】図7のステップS118,S120または
S125からは、図5のステップS103に戻るが、そ
のときにもステップS102で設定された入力時間は有
効であるので、ここで設定された入力時間内に繰り返し
て同じ音声が入力されかつリジェクトされた場合に、図
7に示すプロセスが有効となる。その入力時間内に再音
声入力がない場合は、リジェクトされたままで終わる。
【0035】別の実施例では、図6に示すステップS1
13に続いて、図8に示すステップS201を実行す
る。このステップS201では、ステップS114と同
様にして、ステップS112で示される最大類似度がス
テップS113で決定された第1の閾値を超えるかどう
かを判断する。最大類似度が第1の閾値を超えない場合
には、すなわちリジェクトする場合には、先の実施例と
同じように図7のステップS117に移るようにしても
よいし、そのまま終わるようにしてもよい。
【0036】また、最大類似度が第1の閾値を超える場
合には、ステップS202において、マイクロコンピュ
ータ12は、その最大類似度を与える単語が認識対象の
ものかどうかを判断する。すなわち、図1の実施例にお
いてカセットテープモードとチューナモードとがあると
すると、それぞれのモードにおいては、表1に示すよう
に、認識対象となる単語がモード毎に予め限定されてい
るものとする。
【0037】
【表1】
【0038】この場合、マイクロコンピュータ12は、
たとえばチューナモードにおいて登録番号「1」〜
「5」のいずれかが最大類似度を与える場合またはカセ
ットモードにおいて登録番号「6」〜「13」のいずれ
かの標準パターンが最大類似度を与える場合には、ステ
ップS202において、そのときの音声入力は認識対象
外であると判断する。認識対象外であることを判断する
と、すなわちステップS202において“NO”が判断
されると、ステップS203においては、マイクロコン
ピュータ12は、たとえばブザー(図示せず)を鳴らし
たり、LED31(図1)を点灯するなどして、認識対
象外の単語が最大類似度を示したことおよびしたがって
再入力の必要があることを使用者に報知する。それとと
もに、ステップS204において、再入力タイマ42i
(図2)に所定時間たとえば3秒を設定する。次のステ
ップS204aでは、先のステップS103(図5)す
なわちステップS2(図4)と同様にして、音声入力の
サンプリングが開始され、フィルタバンク34,マルチ
プレクサ36およびA/D変換器38を経て、マイクロ
コンピュータ12に音声(パラメータ)データが入力さ
れる。そして、ステップS204bでは、マイクロコン
ピュータ12はその音声データを取り込み、バッファ
(図示せず)に一時的にストアする。ステップS204
cで、ステップS204bで入力された音声データが始
端のものであるかどうか判断される。入力音声データが
始端データであれば、先のステップS105に戻る。始
端データでないときには、マイクロコンピュータ12
は、次のステップS205において、上述の音声データ
の入力は、ステップS204で設定した再入力タイマ4
2iの設定時間内に入力されたかどうか、判断される。
そして、再入力タイマ42iに設定された時間内に音声
入力がない場合には、ステップS205を経て、ステッ
プS206において、マイクロコンピュータ12は、認
識対象内で最大類似度を与える標準パターンを決定す
る。たとえばカセットモードにおいて「巻戻し」の音声
入力があったとき、それが曖昧に発声されたため、ステ
ップS112においてそれが「バンドチェンジ」の標準
パターンと最も類似している判断され、次に類似してい
るのが「巻戻し」の標準パターンである場合には、ステ
ップS206では、認識対象内で最大類似度を示す単語
すなわち「巻戻し」を決定し、その類似度が第1の閾値
を超えているかどうかを、先のステップS201と同様
にして、ステップS207で判断する。
【0039】に、図9を参照して、図4に示す登録モ
ードの変形例について説明する。この変形例において
は、表2に示すように、1つのキーないしスイッチに複
数の機能を持たせるいわゆる「マルチファンクション」
を達成する場合の登録方法である。
【0040】
【表2】
【0041】このようなマルチファンクション効果を達
成するためには、1つの表示に対して2以上の音声を予
め登録する必要があるが、これらを区別することは難し
く、したがって誤登録、誤認識の原因になっていた。図
9に示す実施例はこのような問題を解決するように、2
以上の音声によって制御される機器を制御するための音
声を登録する場合には、特定の表示に従って、そのこと
を使用者に知らしめ、結果的に誤登録、誤認識を低減す
るようにするものである。すなわち、ステップS301
においては、マイクロコンピュータ12は、表2に示す
「1/AMSS」や「2/RPT」のように1つのスイ
ッチにモード毎に異なる単語を登録する場合であるかど
うかを判断する。たとえば「1/AMSS」スイッチ
は、AMラジオモードではAM放送の1チャネルを設定
するために用いられ、FMラジオモードではFM放送の
1チャネルを設定するために用いられ、カセットテープ
モードでは頭出しの設定のために用いられる。したがっ
て、この場合、ステップS301では“YES”と判定
される。もしそうでなければ、マイクロコンピュータ1
2は、次のステップS302において、LED31(図
1)を常時点灯する。もし“YES”が判断されると、
すなわち1つのスイッチに対して複数の音声登録を行う
場合であれば、次のステップS303において、マイク
ロコンピュータ12は、LED31の点滅モードを設定
する。そして、ステップS304において、たとえば
「1/AMSS」のように1つのスイッチに対して3つ
以上の音声の登録が必要なのかどうかを判断する。1つ
のスイッチに対して2つの音声登録のみでよい場合すな
わち“NO”が判断される場合には、ステップS305
において、マイクロコンピュータ12は点滅用タイマ4
2j(図2)に第1のタイマ時間を設定し、逆に“YE
S”が判断されたときには、ステップS306において
マイクロコンピュータ12は第2タイマ時間を設定す
る。第1タイマ時間と第2タイマ時間とはLED31の
点滅速度や間隔が異なるように予め決められているもの
である。したがって、使用者は、LED31の点灯状態
(すなわち常時点灯,点滅1および点滅2)を判断する
ことによって各モードに適合した音声パターンを登録す
ることができ、誤登録をなくすことができる。
【0042】なお、上述の実施例では、音声入力を許容
するために音声入力スイッチ30を設けたが、このよう
な特別なスイッチを設けることなく、たとえば「入力
(にゅうりょく)」のような音声入力によって音声入力
可能状態を設定するようにしてもよい。
【図面の簡単な説明】
【図1】この発明の一実施例を示すブロック図である。
【図2】図1のメモリをより詳細に示す図解図である。
【図3】認識される音声の始端と終端とを示す波形図で
ある。
【図4】図1の実施例における登録モードを示すフロー
図である。
【図5】図1の実施例における認識モードの一部を示す
フロー図である。
【図6】図1の実施例における認識モードの一部を示す
フロー図である。
【図7】図1の実施例における認識モードの一部を示す
フロー図である。
【図8】図1の実施例における認識モードの変形例を示
すフロー図である。
【図9】図1の実施例における登録モードの変形例を示
すフロー図である。
【符号の説明】
10 …カーオーディオシステム 12 …マイクロコンピュータ 14 …オーディオ部 16 …ステレオ音源 30 …音声入力スイッチ 31 …LED 32 …マイクロフォン 34 …フィルタバンク 36 …マルチプレクサ 38 …A/D変換器 42 …メモリ 42a …標準パターンテーブル 42c …音声バッファ 42d …時間テーブル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 荒木 孝次 大阪府守口市京阪本通2丁目18番地 三 洋電機株式会社内 (72)発明者 出島 浩次 大阪府守口市京阪本通2丁目18番地 三 洋電機株式会社内 (56)参考文献 特開 昭63−259690(JP,A) 特開 昭58−151000(JP,A) 特開 平1−222299(JP,A) 特開 昭55−21035(JP,A) 特開 昭57−127388(JP,A) 特開 昭58−70283(JP,A) 特開 昭60−95598(JP,A) 特開 昭56−121100(JP,A) 特開 平4−260100(JP,A) 特開 平2−193198(JP,A) 特開 平1−116700(JP,A) 特開 昭59−107395(JP,A) 特開 昭59−185394(JP,A) 特開 平3−204699(JP,A) 特開 平4−306700(JP,A) 実開 昭61−189635(JP,U) 特公 昭61−18758(JP,B2) 特公 平2−35988(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 3/00 - 9/20

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 マイクロフォンから入力された音声を分
    析して音声パターンを作成するパターン作成手段、およ
    び前記音声パターンによって音声認識する認識手段を備
    える音声認識装置において、 前記マイクロフォンからの音声入力を許容する入力時間
    を設定する時間設定手段、および前記時間設定手段によ
    って設定された前記入力時間内に前記認識手段によって
    音声が音声認識されたとき入力時間を延長する延長手段
    をさらに備えることを特徴とする、音声認識装置。
  2. 【請求項2】 マイクロフォンから入力された音声を分
    析して音声パターンを作成するパターン作成手段、およ
    び前記音声パターンによって音声認識する認識手段を備
    える音声認識装置において、 前記マイクロフォンからの音声入力を許容する入力時間
    を設定する時間設定手段、および前記時間設定手段によ
    って設定された前記入力時間内に前記認識手段によって
    音声が音声認識されたとき、該音声認識された音声に応
    じて入力時間を延長する延長手段をさらに備えることを
    特徴とする音声認識装置。
  3. 【請求項3】 マイクロフォンから入力された音声を分
    析して音声パターンを作成するパターン作成手段と、標
    準パターンが登録された標準パターン記憶手段と、前記
    パターン作成手段で作成した音声パターンと前記標準パ
    ターン記憶手段に登録された標準パターンとの比較に基
    づいて音声認識する認識手段とを備える音声認識装置に
    おいて、 前記標準パターン毎の時間情報が登録された時間情報記
    憶手段と、前記マイクロフォンからの音声入力を許容す
    る入力時間を設定する時間設定手段と、前記時間設定手
    段によって設定された前記入力時間内に前記認識手段に
    よって音声が音声認識されたとき入力時間を延長する延
    長手段とをさらに備えることを特徴とする音声認識装
    置。
  4. 【請求項4】 マイクロフォンから入力された音声を分
    析して音声パターンを作成するパターン作成手段と、標
    準パターンが登録された標準パターン記憶手段と、前記
    パターン作成手段で作成した音声パターンと前記標準パ
    ターン記憶手段に登録された標準パターンとの比較に基
    づいて音声認識する認識手段とを備える音声認識装置に
    おいて、 前記標準パターン毎の延長時間情報が登録された時間情
    報記憶手段と、前記マイクロフォンからの音声入力を許
    容する入力時間を設定する時間設定手段と、前記時間設
    定手段によって設定された前記入力時間内に前記認識手
    段によって音声が音声認識されたとき、該音声認識され
    た音声入力に対応する標準パターンについての前記延長
    時間情報に基づいて入力時間を延長する延長手段とをさ
    らに備えることを特徴とする音声認識装置。
JP3197542A 1991-08-07 1991-08-07 音声認識装置 Expired - Fee Related JP3005330B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3197542A JP3005330B2 (ja) 1991-08-07 1991-08-07 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3197542A JP3005330B2 (ja) 1991-08-07 1991-08-07 音声認識装置

Publications (2)

Publication Number Publication Date
JPH0540498A JPH0540498A (ja) 1993-02-19
JP3005330B2 true JP3005330B2 (ja) 2000-01-31

Family

ID=16376215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3197542A Expired - Fee Related JP3005330B2 (ja) 1991-08-07 1991-08-07 音声認識装置

Country Status (1)

Country Link
JP (1) JP3005330B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001154694A (ja) * 1999-09-13 2001-06-08 Matsushita Electric Ind Co Ltd 音声認識装置及び方法
EP2006836A4 (en) * 2006-03-24 2010-05-05 Pioneer Corp VOICE MODEL REGISTRATION DEVICE AND METHOD IN A VOICE RECOGNITION SYSTEM AND COMPUTER PROGRAM

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56121100A (en) * 1980-02-29 1981-09-22 Nissan Motor Voice identification driving device
JPS57127388A (en) * 1981-01-30 1982-08-07 Toshiba Corp Voice remote controller
JPS5870283A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 車両用音声認識装置
JPS59107395A (ja) * 1982-12-13 1984-06-21 三菱自動車工業株式会社 登録型音声認識装置
JPS59185394A (ja) * 1983-04-05 1984-10-20 松下電器産業株式会社 音声認識装置
JPS61189635U (ja) * 1985-05-16 1986-11-26
JP3128251B2 (ja) * 1991-02-15 2001-01-29 株式会社東芝 音声認識装置

Also Published As

Publication number Publication date
JPH0540498A (ja) 1993-02-19

Similar Documents

Publication Publication Date Title
US7885818B2 (en) Controlling an apparatus based on speech
US5450525A (en) Vehicle accessory control with manual and voice response
US20070203699A1 (en) Speech recognizer control system, speech recognizer control method, and speech recognizer control program
JP2004086150A (ja) 音声制御装置
JP2006194959A (ja) 音声検出装置、自動撮像装置、および音声検出方法
JP2002258892A (ja) 音声認識機器操作装置
JPH1152976A (ja) 音声認識装置
JP3005330B2 (ja) 音声認識装置
EP1316944B1 (en) Sound signal recognition system and method, and dialog control system and method using it
JP3530035B2 (ja) 音認識装置
JP2003195890A (ja) 音声操作装置
JP2000276187A (ja) 音声認識方法及び音声認識装置
EP1065652B1 (en) Voice-based manipulation method and apparatus
JP4624825B2 (ja) 音声対話装置および音声対話方法
JPH05249989A (ja) 音声認識制御装置
US20220095039A1 (en) Headphone, acoustic signal processing method, and program
JPH0749697A (ja) 音声認識装置
JP2004184803A (ja) 車両用音声認識装置
JP2002182691A (ja) 音を出力する機器を制御する制御装置
JPS59117610A (ja) 車載機器制御装置
JPH06259091A (ja) 音声認識装置
JPH11109987A (ja) 音声認識装置
JPH0535294A (ja) 音声認識装置
JPH02103599A (ja) 音声認識装置
JP3003130B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19991026

LAPS Cancellation because of no payment of annual fees