JPH11231892A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH11231892A
JPH11231892A JP10035817A JP3581798A JPH11231892A JP H11231892 A JPH11231892 A JP H11231892A JP 10035817 A JP10035817 A JP 10035817A JP 3581798 A JP3581798 A JP 3581798A JP H11231892 A JPH11231892 A JP H11231892A
Authority
JP
Japan
Prior art keywords
voice
recognition
input
speech
guidance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10035817A
Other languages
English (en)
Other versions
JP3849283B2 (ja
Inventor
Isamu Tateno
勇 立野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP03581798A priority Critical patent/JP3849283B2/ja
Publication of JPH11231892A publication Critical patent/JPH11231892A/ja
Application granted granted Critical
Publication of JP3849283B2 publication Critical patent/JP3849283B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識を失敗したとき再度の音声入力を促
す構成において、音声認識をより確実に素早くできるよ
うにする。 【解決手段】 初期値(i=1)を設定してから(S
1)、音声入力を受付ける(S2)。このとき、音声デ
ータを音声認識できなかった場合に(S3:NO)、前
回データと同一であると判断される共に(S6:YE
S)、i≧N(例えば3)であったときは、iをインク
リメントしてから(S10)、上位音声認識候補をデー
タ保存し(S12)、「もう一度言って下さい」と音声
出力する。そして、i≧3となったときは、データ保存
している上位音声認識候補を順に音声案内し、使用者が
「はい」と返答した音声認識候補を音声認識結果として
確定する。これにより、音声認識できない状態が継続し
ているときは、異なる音声案内により音声認識をより確
実に素早くできるようになる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声と複数の
比較対象パターン候補とを比較して類似度の高いものを
認識結果として出力するような音声認識装置に関する。
【0002】
【従来の技術】従来より、入力音声から判読されたデー
タを予め記憶してある標準パターンと比較し、その類似
度が最大となる標準パターンを認識結果とする音声認識
装置が実用化されている。
【0003】
【発明が解決しようとする課題】しかしながら、入力音
声の高低、強弱、イントネーション等の入力要因や、判
別処理能力によっては常に識別できるとは限らないの
で、認識不具合時には使用者に再入力を促す同じ音声案
内を実行するようにしているが、音声認識できない毎に
再入力を促す同じ音声案内を繰返すことから、使用者に
とって使い勝手が悪く使用感が著しく低下する場合があ
る。
【0004】例えば、入力音声を認識できない場合、
「もう一度言って下さい」と音声案内するようになって
いる構成がある。このような構成では、複数回同じよう
な音声入力を行うことが多いため、次回以降も入力音声
の認識ができない確率が高い。結果としてその都度「も
う一度言って下さい」と繰返して音声案内されることと
なる。このため、使用者にとっては不快であり、逐一音
声入力しているにもかかわらず一向に音声認識できな
い。また、認識不良を解消するために、次にどのように
発声すればよいかの推定も容易ではなく、使い勝手が悪
い。
【0005】本発明は上記事情に鑑みてなされたもの
で、その目的は、音声認識を失敗したとき再度の音声入
力を促す構成において、音声認識をより確実に行うこと
が可能な使い勝手に優れた音声認識装置を提供すること
にある。
【0006】
【課題を解決するための手段】請求項1の発明によれ
ば、使用者が音声入力すると、音声入力手段は、入力音
声を音声信号に変換する。そして、認識手段は、音声入
力手段からの音声信号を、予め辞書手段に記憶されてい
る複数の比較対象パターン候補と比較して類似度の高い
ものを認識結果とする。ここで、音声案内手段は、認識
手段による音声認識が失敗したときは、例えば「もう一
度言って下さい」と再度の音声入力を促す音声案内を実
行する。
【0007】ところで、認識手段による音声認識が失敗
する毎に「もう一度言って下さい」と音声案内すること
は使用者にとっては煩わしいと共に、音声入力できない
状態が継続することになる。
【0008】そこで、音声案内手段は、認識手段による
音声認識が所定回数失敗したときは、「もう一度言って
下さい」という音声案内に代えて、別の音声入力が発声
させるように準備された所定の予備音声案内を実行す
る。従って、認識手段は、音声案内手段による予備音声
案内に応じて入力された音声データに基づいて音声認識
することによりより確実に音声認識することができるよ
うになる。よって、使用者にとっては、次にどのように
発声すれば正しく音声認識されるか好適に誘導されるこ
とになり、使い勝手がよい。
【0009】請求項2の発明によれば、上述した音声案
内動作は、使用者が同一の入力音声を繰返して音声入力
したと判断した際に音声認識できなかったとみなすよう
にしているので、再度の音声入力を促す音声案内を効果
的に行うことができる。
【0010】請求項3の発明によれば、使用者の好みに
よって再度の音声入力を促す音声案内を行う回数を任意
に設定することができるので、使用者の使い勝手を向上
することができる。
【0011】請求項4の発明によれば、認識手段が入力
音声を認識できなかったときは、認識候補記憶手段は、
音声認識候補のうちから類似度の高い上位音声認識候補
を記憶する。つまり、音声認識結果が「ふじ**」であ
れば、「富士宮市」、「富士山」、「富士急ハイラン
ド」などを上位音声認識候補とする。
【0012】そして、音声案内手段は、認識候補記憶手
段に記憶された上位音声認識候補を用いて問い掛ける。
つまり、「富士宮市ですか」、「富士山ですか」、「富
士急ハイランドですか」などと音声案内するので、認識
手段は、問い掛けに応じた返答に対して音声認識するこ
とにより、音声認識を素早く行うことができる。尚、こ
の問い掛けとして、記憶された上位音声認識候補を類似
度の高い順に問い掛けるようにしてもよい。
【0013】請求項5の発明によれば、属性確定手段
は、認識手段による認識結果に基づいて音声データの属
性を確定する。つまり、音声認識した音声データが地名
データに属するのか、施設データに属するのか、遊園地
データに属するのか等を確定する。
【0014】そして、音声案内手段は、属性確定手段が
例えば入力音声は地名データに属していると判断したと
きは、この属性に適した質問として例えば「東京都です
か」とか、「都道府県名を教えて下さい」と音声案内す
る。これにより、認識手段は、使用者の返答に対して音
声認識することにより、音声認識をより確実に素早く行
うことができる。
【0015】請求項6の発明によれば、音声案内手段
は、学習手段が必要とする所定の音声を使用者に対して
発声させるように問い掛ける。例えば「音声を学習しま
す あいうえおとお話し下さい」と問い掛ける。
【0016】そして、学習手段は、使用者が音声入力し
た「あいうえお」という音声データに基づいて使用者の
音声データの特徴を学習する。これにより、認識手段
は、学習手段が学習した特徴に基づいて音声認識するこ
とにより、音声認識をより確実に素早く行うことができ
る。
【0017】請求項7の発明によれば、音声案内手段
は、使用者を特定するための質問を問い掛ける。つま
り、「あなたの名前を言って下さい」とか、「あなたに
登録された番号を入力して下さい」と問い掛ける。
【0018】そして、使用者が自分の名前を音声入力し
たり、或いは登録された番号を操作入力すると、認識手
段は、問い掛けに応じて特定した使用者に対応して特徴
記憶手段に記憶されている特徴に基づいて音声認識する
ので、音声認識をより確実に素早く行うことができる。
【0019】
【発明の実施の形態】(第1の実施の形態)以下、本発
明をカーナビゲーションに適用した第1の実施の形態を
図面を参照して説明する。図1は本発明の概略構成を示
すブロック図である。この図1において、カーナビゲー
ションシステム1は、位置検出器2、地図データ入力器
3、操作スイッチ群4、これらに接続された制御回路
5、この制御回路5に接続された外部メモリ6、表示装
置7、リモコンセンサ8及び音声認識装置9を備えて構
成されている。制御回路5はマイクロコンピュータを主
体として構成されており、内部には、周知のCPU、R
OM、RAM、I/O及びこれらの構成を接続するバス
ライン(何れも図示せず)が備えられている。
【0020】位置検出器2は、周知構成の地磁気センサ
10、ジャイロスコープ11、距離センサ12、及び衛
星からの電波に基づいて車両の位置を検出するGPS
(Global Positioning System )のためのGPS受信機
13を有している。制御回路5は、位置検出器2の各セ
ンサが性質の異なる誤差を有しているため、各々補間し
ながら使用するように構成されている。
【0021】地図データ入力器3は、位置検出の精度向
上のための所謂マップマッチング用データ、地図データ
及び目印データを含む各種データを入力するための装置
である。そのための媒体としては、CD−ROMを用い
るのが一般的であるが、メモリカードなどの他の媒体を
用いるようにしてもよい。
【0022】表示装置7はカラー表示機能を備えてお
り、その画面には、位置検出器2から入力された車両現
在位置マークと、地図データ入力器3より入力された地
図データと、さらに地図上に表示する誘導経路や後述す
る設定地点の目印などの付加データとを重ねて表示する
ようになっている。
【0023】また、カーナビゲーションシステム1は、
リモートコントロール端末14(以下、リモコンと称す
る)に対する操作によりリモコンセンサ8から、或いは
操作スイッチ群4により目的地の位置を入力すると、現
在位置からその目的地までの最適な経路を自動的に選択
して誘導経路を形成して表示する所謂経路案内機能も備
えている。このような自動的に最適な経路を設定する手
法は、ダイクストラ法などの手法が知られている。操作
スイッチ群4は、例えば、表示装置7と一体になったタ
ッチスイッチ若しくはメカニカルスイッチなどが用いら
れ、各種入力に使用される。
【0024】そして、音声認識装置9は、上記操作スイ
ッチ群4或いはリモコン14が手動操作により目的地な
どを指示するために用いられるのに対して、使用者が音
声で入力することによっても同様に目的地などを指示す
ることができるようにするための装置として設けられて
いる。
【0025】この音声認識装置9は、対話制御部15
(音声案内手段、属性確定手段、学習手段に相当)、音
声合成部16、音声認識部17(認識手段、辞書手段、
認識候補記憶手段、特徴記憶手段に相当)、音声入力部
18、マイク19、PTT(Push-To-Talk)スイッチ2
0、スピーカ21を備えて構成されている。
【0026】音声認識部17は、音声入力部18から入
力された音声データ(入力音声)を、対話制御部15か
らの指示により入力音声の認識処理を行い、その認識結
果を対話制御部15に返す。即ち、音声入力部18から
取得した音声データに対し、記憶している辞書データを
用いて照合を行い、複数の比較対象パターン候補と比較
して類似度の高い上位比較対象パターンを対話制御部1
5へ出力する。入力音声中の単語系列の認識は、音声入
力部18から入力された音声データを順次音響分析して
音響特徴量(例えばケプストラム)を抽出し、この音響
分析によって得られた音響的特徴量時系列データを得
る。そして、周知のDPマッチング法によって、この時
系列データをいくつかの区間に分け、各区間が辞書デー
タとして格納されたどの単語に対応しているかを求め
る。
【0027】また、音声入力部18は、マイク19にて
取り込んだ周囲の音声をデジタルデータに変換して音声
認識部17に出力するものである。本実施形態において
は、使用者がPTTスイッチ20を押しながらマイク1
9を介して音声を入力するようになっている。具体的に
は、音声入力部18は、PTTスイッチ20が押された
かどうかを判断しており、PTTスイッチ20が押され
ていない場合には、その音声入力処理を実行しないよう
にしている。従って、PTTスイッチ20が押されてい
る間にマイク19を介して入力された音声データのみが
音声認識部17へ出力されることになる。
【0028】ここで、音声認識部17と対話制御部15
について説明する。図2は、音声認識部17及び対話制
御部15の詳細構成を示したものである。まず、図2に
示す構成では、音声認識部17が照合部22と辞書部2
3とで構成されており、対話制御部15が記憶部24、
入力部25、後処理部26及び辞書制御部27で構成さ
れている。音声認識部17においては、照合部22が、
音声入力部18から取得した音声データに対し、辞書部
23内に記憶されている辞書データを用いて照合を行う
のであるが、その照合部における照合処理に先立って、
対話制御部15の辞書制御部27が辞書に記憶されてい
る辞書データの制御を行う。具体的には、記憶部24に
記憶されている参照データを参照して省略可能な上位階
層リストを作成し、その省略可能な上位階層部分を辞書
部23内に記憶されている辞書データから一時的に省略
する。このように辞書制御がなされた辞書データを用い
て照合部22が照合処理を実行するものである。
【0029】そして、照合部22にて複数の比較対象パ
ターン候補と比較されて類似度が高いとされた上位比較
対象パターンは、対話制御部15の記憶部へ出力される
こととなる。
【0030】音声認識部17においては、照合部22
が、音声入力部18から取得した音声データに対し、辞
書部23内に記憶されている複数の比較対象パターン候
補と比較して類似度の高い上位比較対象パターンを対話
制御部15の記憶部24へ出力する。そして、記憶部2
4では、この上位比較対象パターンを記憶しておく。ま
た、入力部25は制御回路5からの外部状況を入力する
のであるが、その入力した外部状況も記憶部24に記憶
される。この場合の外部状況とは、上述した位置検出器
2によって検出した位置に基づく現在値のデータであ
る。尚、この記憶部24に記憶された上位比較対象パタ
ーンや入力した外部状況である現在データなどは、所定
の確定指示がなされた場合にはクリアされる。
【0031】そして、後処理部26では、例えば上記所
定の確定指示がなされた場合に制御回路5へデータを送
って所定の処理をするように指示する「確定後処理」を
実行したり、或いは音声合成部16へ音声データを送っ
て発音させるように指示する処理を実行する。尚、この
場合の制御回路5へ送るデータとしては、最終的な認識
結果としての上位比較対象パターンの全てでもよいし、
或いはその内の最上位のものだけでもよい。
【0032】次に、本実施の形態のカーナビゲーション
システム1の動作について説明する。尚、音声認識装置
9に関係する部分が特徴であるので、カーナビゲーショ
ンシステムとしての一般的な動作を簡単に説明した後、
音声認識装置9に関係する部分の動作について詳しく説
明する。
【0033】カーナビゲーションシステム1の電源オン
後に、表示装置7上に表示されるメニューから、運転者
がリモコン14(操作スイッチ群4でも同様に操作でき
る。以後の説明においても同じ)により、案内経路を表
示装置7に表示させるために経路情報表示処理を選択し
た場合、或いは音声認識装置9を介して希望するメニュ
ーをマイク19を介して音声入力することで、対話制御
部15から制御回路5へ、リモコン14に対する操作に
より選択されるのと同様の指示がなされた場合、次のよ
うな処理を実施する。
【0034】即ち、運転者が表示装置7上の地図に基づ
いて、音声或いはリモコン14などの操作によって目的
地を入力すると、位置検出器2により車両の現在地が求
められ、目的地と現在地との間に、ダイクストラ法によ
りコスト計算して、現在地から目的地までの最も短距離
の経路を誘導経路として求める処理が行われる。そし
て、表示装置7上の道路地図に重ねて誘導経路を表示し
て、運転者に適切なルートを案内する。このような誘導
経路を求める計算処理や案内処理は一般的によく知られ
た処理であるので説明は省略する。
【0035】次に、カーナビゲーションシステム1にお
ける動作について、上述の経路案内のための目的地を音
声入力する場合を例にとって説明する。図3は、その場
合の処理を示すフローチャートである。
【0036】まず、初期値を設定する(S1)。つま
り、iを1に設定すると共に、繰返し許容回数Nを予め
使用者により設定されている例えば3に設定する。そし
て、使用者による音声入力を受け付ける(S2)。つま
り、上述したように、PTTスイッチ20が押されてい
る間にマイク19を介して入力された音声データのみが
音声入力部18から音声認識部17に出力されるので、
この音声入力部17からの音声入力を受け付ける。
【0037】ここで、例えば使用者が「ふじさん(富士
山)」と音声入力したときは、地名辞書のtree構成を示
す図4に示すように、「ふ」が「根」(tree構成のもっ
とも左に位置する◎(ノード)から先行順走査にしたが
って各辺(tree構成の−)に割り付けられた音節を辿る
ことで「ふじさん」という単語が完成する。
【0038】次に音声認識処理を実行する。基本的に
は、取得した音声データに対して辞書部23内に記憶さ
れている辞書データを用いて照合を行う。そして、照合
開始頂点から始まる単語との照合結果により「ふじさ
ん」を認識することができるので(S3:YES)、
「富士山を表示します」と音声出力してから(S4)、
該当する地図画面を表示する(S5)。
【0039】ところで、使用者が「ふじ」とだけ音声入
力したときは、「ふじ」が「富士宮市」なのか、「富士
山」なのか、「富士急ハイランド」なのか、それとも他
の「ふじ」が頭につく語なのかを音声認識ができないこ
とがある(S3:NO)。また、使用者が「ふじさん」
と早口で音声入力した場合において、「ふじ」と認識す
ることができるものの、それ以降の語を認識できないと
きは、同様に「ふじ」を正しく音声認識できないことに
なる。
【0040】このような場合、次のようにして予備音声
案内を実行する。即ち、音声認識データが前回データと
同一かを判断する(S6)。このとき、音声認識データ
は前回データと同一でないと共に(S6:NO)、i=
1であることから(S9:YES)、iをインクリメン
ト(i=2)すると共に、照合結果による上位音声認識
候補(例えば富士宮市、富士山、富士急ハイランド、…
…)をデータ保存してから(S12)、「もう一度言っ
て下さい」と音声案内する(S13)。
【0041】そして、使用者が「ふじ」と再び音声入力
したと認識した場合は、再び音声認識できない。このと
き、音声認識できなかった音声データが前回データであ
ると判断されると共に(S6:YES)、i≧3でない
ことを確認してから(S7:NO)、iをインクリメン
ト(i=3)すると共に、照合結果による上位候補をデ
ータ保存してから(S12)、「もう一度言って下さ
い」と音声案内する(S13)。
【0042】ここで、以上のようにして「もう一度言っ
て下さい」と2回音声案内するにもかかわらず再度同一
の音声データを音声認識できなかったときは、i=3で
あることから(S7:YES)、データ保存されている
照合結果のうちの上位音声認識候補から順に使用者に音
声案内する。この場合、上位候補は、照合結果の類似度
を数値化して決定する。
【0043】そして、上位候補から順に「富士宮市です
か」、「富士山ですか」、「富士急ハイランドですか」
などと順に問い掛け(S8)、使用者が「はい」若しく
は「***です」などと上位候補の何れかを特定するよ
うな返答した問い掛けを認識結果として確定し、該当す
る地図を表示する。
【0044】このような第1の実施の形態によれば、所
定回数連続して音声認識に失敗したときは、音声認識結
果による上位候補から順に問い掛けるようにしたので、
音声認識を失敗する毎に「もう一度入力下さい」と繰返
して音声案内する構成に比較して、使用者にとっては、
使用感が向上すると共に、音声認識をより確実に素早く
行うことができるようになる。
【0045】また、音声認識結果ができなかった場合に
おいて前回の音声認識結果と同一のときのみ音声認識を
失敗したとみなすようにしたので、使用者が入力音声を
途中で変更した場合には、そのタイミングから失敗回数
をカウントすることになり、再入力を促す音声案内を適
切な回数だけ行うことができ、使用感の向上を図ること
ができる。
【0046】また、音声認識を失敗したときは、音声認
識の上位候補データを保存し、その上位候補のうちの類
似度の高い順に問い掛けるようにしたので、少ない問い
掛けにより音声入力を認識することができる。
【0047】尚、問い掛け音声は、保存データのうち類
似度の高い順にしなくとも、保存データをランダムに
(順次)問い掛けるようにしてもよい。
【0048】(第2の実施の形態)音声認識部17には
複数の音声データの属性(例えばコマンドデータ、施設
データ、住所データ等)を確定する属性確定機能が備え
られている(属性確定手段に相当)。
【0049】即ち、上述したように使用者が発声する音
声データの認識が所定回数連続して失敗している状態で
は、一方において音声認識結果に基づいて音声データの
属性を確定し、その確定した属性に適した音声案内を行
う。つまり、音声認識により音声データが住所データで
あると確定した場合は、まず、「都道府県名を入力して
下さい」と音声案内する。そして、使用者が「静岡県」
と音声入力することにより上位階層データを確定したと
きは、「次に市区郡町村名を入力して下さい」と音声案
内することにより、中間階層データを音声入力により確
定し、以後、下位階層データである町域データ(大字、
小字、番地)を確定することにより住所データを確定す
るようにしてもよい。
【0050】このような第2の実施の形態によれば、音
声データの属性が確定したときは、属性に適した質問を
問い掛けることにより、音声データの属性に適した音声
認識を行うことができ、第1の実施の形態と同様に、音
声認識をより確実に素早く行うことができる。
【0051】(第3の実施の形態)音声認識部17には
使用者の発声特徴を学習する学習機能が備えられている
(学習手段に相当)。即ち、使用者の音声データを所定
回数連続して音声認識できなかったときは、例えば「音
声を学習します あいうえおとお話し下さい」と音声案
内する。
【0052】そして、使用者が「あいうえお」と音声入
力したときは、音声データに基づいて使用者の音声の特
徴を学習してから、「学習完了しました 入力下さい」
と音声案内し、学習した音声の特徴に基づいて音声デー
タを音声認識する。
【0053】この第3の実施の形態によれば、使用者の
音声の特徴を学習し、学習した音声の特徴に基づいて音
声認識を行うようにしたので、第1の実施の形態と同様
に、音声認識をより確実に素早く行うことができる。
【0054】(第4の実施の形態)音声認識装置17に
は、予め使用者の音声の特徴が学習により記憶されてい
る(特徴記憶手段に相当)。
【0055】この場合、使用者の音声データを所定回数
連続して音声認識できなかったときは、音声入力或いは
スイッチ操作により使用者を特定するように音声案内
し、音声データ或いはスイッチ入力により使用者が特定
できたときは、その使用者に対応して学習記憶してある
特徴で音声認識する。
【0056】この第4の実施の形態によれば、使用者の
音声特徴を予め学習記憶しておき、使用者を特定したと
きに使用者の音声の特徴に基づいて音声認識するように
したので、第1の実施の形態と同様に、音声認識をより
確実に素早く行うことができる。
【0057】本発明は、上記実施の形態にのみ限定され
るものではなく、次のように変形または拡張できる。音
声認識データを所定回数連続して失敗したときの音声案
内としては、「もう一度言って下さい」という音声案内
に代えて、「もっとゆっくり言って下さい」、或いは
「もっとはっきり言って下さい」、或いは「省略せずに
言って下さい」というように音声案内するようにしても
よい。尚、上記実施の形態に示される繰返し許容回数N
が1であれば、音声認識が一回失敗した時点で即予備案
内が実行される。
【0058】音声認識装置の適用としては、空調システ
ムに適用して、音声入力により設定温度、空調モード
(冷房、暖房、ドライ)の選択、或いは風向モードの選
択を行うようにしてもよい。さらには、カーオーディ
オ、パワ−ウインドの開閉、ミラーの角度調整に適用す
るようにしてもよい。
【0059】ナビゲーションシステムや空調システム
を、例えば携帯型ナビゲーションシステム或いは屋内用
空調装置などのように車載機器以外に適用してもよい。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における全体構成を
示すブロック図
【図2】音声認識部及び対話制御部を詳細に示すブロッ
ク図
【図3】全体の動作を示すフローチャート
【図4】地名の階層構造の説明図
【符号の説明】
1はカーナビゲーションシステム、15は対話制御部
(音声案内手段、属性確定手段、学習手段)、17は音
声認識部(認識手段、辞書手段、認識候補記憶手段、特
徴記憶手段)、19はマイク(音声入力手段)である。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を音声信号に変換するための音
    声入力手段と、 この音声入力手段からの音声信号を、予め辞書手段に記
    憶されている複数の比較対象パターン候補と比較して類
    似度の高いものを認識結果とする認識手段と、この認識
    手段による音声認識が失敗したときは再度の音声入力を
    促す音声案内を実行する音声案内手段とを備えた音声認
    識装置において、 前記音声案内手段は、前記認識手段による音声認識が所
    定回数失敗したときは、再度の音声入力を促す前記音声
    案内に代えて別の音声入力を促す所定の予備音声案内を
    実行し、 前記認識手段は、前記音声案内手段による予備音声案内
    に応じて入力された音声入力に基づいて音声認識するこ
    とを特徴とする音声認識装置。
  2. 【請求項2】 前記音声案内手段は、前記認識手段が音
    声認識できなかった入力音声が前回認識できなかった入
    力音声と同一であると判断した場合に音声認識を失敗し
    たとみなすことを特徴とする請求項1記載の音声認識装
    置。
  3. 【請求項3】 前記所定回数は、使用者により更新可能
    であることを特徴とする請求項1または2記載の音声認
    識装置。
  4. 【請求項4】 前記認識手段が音声認識できなかったと
    きは音声認識候補のうちから類似度の高い上位音声認識
    候補を記憶する認識候補記憶手段を備え、 前記音声案内手段は、前記認識候補記憶手段に記憶され
    た上位音声認識候補を用いた問い掛けを前記予備音声案
    内として実行し、 前記認識手段は、前記音声案内手段による問い掛けに応
    じた返答に対して音声認識することを特徴とする請求項
    1乃至3の何れかに記載の音声認識装置。
  5. 【請求項5】 前記認識手段による認識結果に基づいて
    音声データの属性を確定する属性確定手段を備え、 前記音声案内手段は、前記属性確定手段が確定した属性
    に適した質問の問い掛けを前記予備音声案内として実行
    し、 前記認識手段は、前記音声案内手段による問い掛けに応
    じた返答に対して音声認識することを特徴とする請求項
    1乃至3の何れかに記載の音声認識装置。
  6. 【請求項6】 音声データの特徴を学習する学習手段を
    備え、 前記音声案内手段は、前記学習手段が必要とする所定の
    音声を使用者に対して発声させるような問い掛けを前記
    予備音声案内として実行し、 前記学習手段は、前記音声案内手段による問い掛けに応
    じた返答に基づいて音声の特徴を学習し、 前記認識手段は、前記学習手段が学習した音声の特徴に
    基づいて音声認識することを特徴とする請求項1乃至3
    の何れかに記載の音声認識装置。
  7. 【請求項7】 予め使用者毎の音声データの特徴を記憶
    している特徴記憶手段を備え、 前記音声案内手段は、使用者を特定するための質問の問
    い掛けを前記予備音声案内として実行し、 前記認識手段は、前記音声案内手段による問い掛けに応
    じて特定した使用者に対応して前記特徴記憶手段に記憶
    されている特徴に基づいて音声認識することを特徴とす
    る請求項1乃至3の何れかに記載の音声認識装置。
JP03581798A 1998-02-18 1998-02-18 音声認識装置 Expired - Fee Related JP3849283B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03581798A JP3849283B2 (ja) 1998-02-18 1998-02-18 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03581798A JP3849283B2 (ja) 1998-02-18 1998-02-18 音声認識装置

Publications (2)

Publication Number Publication Date
JPH11231892A true JPH11231892A (ja) 1999-08-27
JP3849283B2 JP3849283B2 (ja) 2006-11-22

Family

ID=12452505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03581798A Expired - Fee Related JP3849283B2 (ja) 1998-02-18 1998-02-18 音声認識装置

Country Status (1)

Country Link
JP (1) JP3849283B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008241933A (ja) * 2007-03-26 2008-10-09 Kenwood Corp データ処理装置及びデータ処理方法
WO2011030404A1 (ja) * 2009-09-09 2011-03-17 トヨタ自動車株式会社 オペレーティングシステム及びオペレーティング方法
CN107678465A (zh) * 2017-11-07 2018-02-09 厦门盈趣科技股份有限公司 温度控制系统及方法
US10589429B2 (en) 2017-03-08 2020-03-17 Fanuc Corporation Machine system
WO2021020624A1 (ko) * 2019-07-30 2021-02-04 미디어젠 주식회사 음성인식 서비스 선별 조정장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101556594B1 (ko) * 2009-01-14 2015-10-01 삼성전자 주식회사 신호처리장치 및 신호처리장치에서의 음성 인식 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008241933A (ja) * 2007-03-26 2008-10-09 Kenwood Corp データ処理装置及びデータ処理方法
WO2011030404A1 (ja) * 2009-09-09 2011-03-17 トヨタ自動車株式会社 オペレーティングシステム及びオペレーティング方法
US10589429B2 (en) 2017-03-08 2020-03-17 Fanuc Corporation Machine system
CN107678465A (zh) * 2017-11-07 2018-02-09 厦门盈趣科技股份有限公司 温度控制系统及方法
WO2021020624A1 (ko) * 2019-07-30 2021-02-04 미디어젠 주식회사 음성인식 서비스 선별 조정장치

Also Published As

Publication number Publication date
JP3849283B2 (ja) 2006-11-22

Similar Documents

Publication Publication Date Title
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
US6230132B1 (en) Process and apparatus for real-time verbal input of a target address of a target address system
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
JPH09292255A (ja) ナビゲーション方法及び装置
US20030065516A1 (en) Voice recognition system, program and navigation system
JP2002123290A (ja) 音声認識装置ならびに音声認識方法
KR101063607B1 (ko) 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법
US6721702B2 (en) Speech recognition method and device
JP3849283B2 (ja) 音声認識装置
JP2000338993A (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP3890774B2 (ja) ナビゲーションシステム
JP3700533B2 (ja) 音声認識装置及び処理システム
JP2947143B2 (ja) 音声認識装置及びナビゲーション装置
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP4938719B2 (ja) 車載情報システム
JP3911835B2 (ja) 音声認識装置及びナビゲーションシステム
JPH11231894A (ja) 音声認識装置
JP2001075589A (ja) 音声認識方法及び音声認識装置
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JP3358498B2 (ja) 音声認識装置及びナビゲーションシステム
JP2003330488A (ja) 音声認識装置
JP4281369B2 (ja) 音声認識装置
JP2007183516A (ja) 音声対話装置及び音声認識方法
JP3654262B2 (ja) 音声認識装置及びナビゲーションシステム
JPH09114491A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060821

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130908

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees