JP2006078791A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2006078791A
JP2006078791A JP2004262816A JP2004262816A JP2006078791A JP 2006078791 A JP2006078791 A JP 2006078791A JP 2004262816 A JP2004262816 A JP 2004262816A JP 2004262816 A JP2004262816 A JP 2004262816A JP 2006078791 A JP2006078791 A JP 2006078791A
Authority
JP
Japan
Prior art keywords
recognition
speech recognition
recognition dictionary
dictionary
local mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004262816A
Other languages
English (en)
Inventor
Akihiro Oya
章博 大矢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2004262816A priority Critical patent/JP2006078791A/ja
Publication of JP2006078791A publication Critical patent/JP2006078791A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】ユーザが、音声認識に利用する音声認識辞書がいずれかのものであるかを把握することができること。
【解決手段】音声認識に利用する音声認識辞書と一義的に対応するものであって、当該音声認識に利用する音声認識辞書を特定するためのキャラクターを表示部60に表示する。また、音声認識に利用する音声認識辞書が選択された場合であっても、選択された音声認識に利用する音声認識辞書を特定するためのキャラクターが表示部60に表示される。このようにすることにより、ユーザは、キャラクターから音声認識に利用する音声認識辞書を常に特定することができる。これにより、ユーザが、音声認識に利用する音声認識辞書がいずれかのものであるかを把握することができる。
【選択図】 図1

Description

本発明は、音声認識装置に関する。
従来、認識率及び認識速度の性能を低下させずに、大語彙音声認識システムを低価格で実現する音声認識装置が提案されている(例えば、特許文献1参照。)。この特許文献1に開示されている音声認識装置によれば、例えば、認識すべき語彙を複数のグループに分けそれぞれを音声認識辞書として記憶する第1のメモリと、音声認識辞書切り換え情報にしたがって、音声認識に利用する音声認識辞書を切り換える音声認識切換部と、音声認識に利用する1つの音声認識辞書を記憶する第2のメモリと、音声認識処理を行なう音声認識部とを備え、必要に応じて音声認識辞書を切り換えて音声認識を行なう。
具体的には、例えば、当該装置は周知のナビゲーションシステムの入力装置として利用されており、音声認識辞書切り換え情報としては、自車両の現在位置が所定のエリア内に属したという情報が用いられる。例として、自車両の現在位置がX地点からY地点へ向かって走行しているとしたときには、自車両の現在位置がX地点を含む所定のエリアEX内にある場合には、エリアEX内で用いる音声認識辞書DXを用い、自車両の現在位置がY地点を含む所定のエリアEY内に入った場合には、エリアEY内で音声認識に利用する音声認識辞書DYに切り換える。
特開平10−143191号公報
しかしながら、ユーザは、上述した所定のエリアを知らないため、いつ音声認識に利用する音声認識辞書が切り換えられたかを認識することができない。このため、ユーザは、現在、音声認識に利用する音声認識辞書がいずれかのものであるかを把握することができなかった。
本発明は、上述した点に鑑みてなされたもので、ユーザが、音声認識に利用する音声認識辞書がいずれかのものであるかを把握することが可能な音声認識装置を提供することを目的とする。
上記目的を達成するために、請求項1に記載の音声認識装置は、
認識語彙を複数のグループに分け、それぞれのグループに含まれる認識語彙を音声認識辞書として記憶する第1の記憶手段と、
複数の音声認識辞書から、音声認識に利用する音声認識辞書を選択する選択手段と、
選択手段によって選択された音声認識に利用する音声認識辞書に基づいて、ユーザが発話した音声を認識する音声認識手段とを備えた音声認識装置であって、
表示部と、
各音声認識辞書と一義的に対応しているものであって、音声認識に利用する音声認識辞書を特定するための表示データを記憶する第2の記憶手段と、
音声認識に利用する音声認識辞書と対応する記憶された表示データを、表示部に表示する表示制御手段とを備えることを特徴とする。
上述したように、請求項1に記載の音声認識装置は、音声認識に利用する音声認識辞書と一義的に対応するものであって、当該音声認識に利用する音声認識辞書を特定するための表示データを表示部に表示する。また、音声認識に利用する音声認識辞書が選択された場合であっても、選択された音声認識に利用する音声認識辞書を特定するための表示データが表示部に表示される。このようにすることにより、ユーザは、表示データから音声認識に利用する音声認識辞書を常に特定することができる。これにより、ユーザが、音声認識に利用する音声認識辞書がいずれかのものであるかを把握することができる。
請求項2に記載したように、表示データは、キャラクターデータ、テキストデータ、及びアイコンデータの少なくともいずれか1つであることが好ましい。このように、表示データとして、キャラクターデータ、テキストデータ、及びアイコンデータの少なくとも1つを使用することによって、ユーザはこの表示データから音声認識に利用する音声認識辞書を特定することが容易になる。また、表示データとしてキャラクターデータを使用する場合には、キャラクター非表示の音声認識装置に対して発話する場合と比べて、ユーザはキャラクターと対話をするような感覚になり、当該装置に対する発話の違和感を低減することができる。
請求項3に記載したように、表示制御手段による表示データの表示の有無が、ユーザによって変更可能に構成されていることもできる。これにより、ユーザは、表示データの表示の有無を設定することができる。
請求項4に記載したように、複数の音声認識辞書は、ローカルモード用音声認識辞書とローカルモード選択用音声認識辞書との2種類があり、ローカルモード選択用音声認識辞書は、複数のローカルモード用音声認識辞書を選択するための選択用認識語彙を有し、選択手段は、ユーザの発話した音声と選択用認識語彙とに基づいて、音声認識に利用するローカルモード用音声認識辞書を選択することが好ましい。これにより、ユーザは、所望する音声認識に利用するローカルモード用音声認識辞書を選択することができる。
以下、本発明の好ましい実施形態について図面を参照して説明する。図1は、本実施形態による音声認識装置100の概略構成を示すブロック図である。以下、本実施形態による音声認識装置100について詳細に説明する。
図1に示すように、音声認識装置100は、音声認識部30、及び出力制御部40から構成されている。また、音声認識装置100は、音声入力に用いられる音声入力部10、トークスイッチ20、スピーカ50、表示部60、及び制御対象機器70が接続されている。
音声入力部10、及びトークスイッチ20は、音声入力に用いられる装置である。音声を入力する場合には、例えば、トークスイッチ20の押しボタンを押すことで、入力トリガが後述する音声認識部30に送信され、この音声認識部30は、入力トリガを受信すると、音声入力部10から音声入力を受け付けるモードに変更される。
この音声入力を受け付けるモードのとき、ユーザが、例えば「CDを再生して」と発話すると、その音声が音声入力部10によって音声信号に変換され、音声認識部30に送られる。音声認識部30は、この音声を認識して、音声に対応するメッセージを生成し、出力制御部40に与える。例えば、入力された音声が「CDを再生して」と認識されると、それに応答して「CDを再生します」というメッセージが生成される。このメッセージは、出力制御部40にて、音声信号に変換され、スピーカ50から出力される。なお、このメッセージは、後述するメッセージコードからなるものである。
スピーカ50は、車室内に設けられており、上述したメッセージを音声で出力するために使用するものである。表示部60は、後述するローカルモード用認識辞書と一義的に対応するものであって、音声認識に利用するローカルモード用認識辞書を特定するためのキャラクターを表示するものである。制御対象機器70は、音声認識部30によって認識された発話内容に応じて、所定の制御が実行される機器である。なお、この制御対象機器70は、車両に搭載され、ユーザによって操作可能な全ての機器が含まれる。
次に、音声認識装置100の音声認識部30について、図2を用いて説明する。図2は、音声認識部30の構成を示すブロック図である。同図に示すように音声認識部30は、AD変換回路31、認識プログラム処理部32、音響モデル記憶部33、認識辞書記憶部34、メッセージコード記憶部35、コマンドコード記憶部36、及び認識辞書コード記憶部37によって構成される。
AD変換回路31は、音声入力部10を介して入力されるアナログの音声信号を受信し、この信号をデジタル化した信号に変換する。変換されたデジタル音声信号は、認識プログラム処理部32に送信される。
認識プログラム処理部32は、音響モデル記憶部33、及び認識辞書記憶部34を用いて、デジタル音声信号を認識語コードに変換するものである。まず、認識プログラム処理部32は、音響モデル記憶部33に記憶される、例えば、周知の隠れマルコフモデル等の手法を用いて、デジタル音声信号に対応する発話内容を解析する。
ここで、認識辞書記憶部34について説明する。認識辞書記憶部34は、例えば、制御対象機器を操作するためのコマンドに対応する認識語彙を、制御対象機器毎に複数のグループに分け、それぞれのグループに含まれる認識語彙を認識辞書として記憶している。この複数の認識辞書には、複数のローカルモード用認識辞書と1つのローカルモード選択用認識辞書の2種類がある。ローカルモード用認識辞書は、所定の制御対象機器70に、所定の制御をさせるための認識語彙が記憶されているものである。具体的には、例えば、CDプレーヤーに所定の制御をさせるための認識語彙は、CDを再生させるための「CDを再生して」、CDを停止させるための「CDを停止して」、及びCDを一時停止させるための「CDを一時停止して」などがある。また、ローカルモード用認識辞書として、このCDプレーヤーに所定の制御をさせるための認識語彙を記憶している「CDプレーヤー操作モード用認識辞書」がある。
ローカルモード選択用認識辞書は、ユーザの発話内容に基づいて、音声認識に利用するローカルモード用認識辞書を選択するための選択用認識語彙を記憶している。具体的には、例えば、図4に示すように、選択用認識語彙は、「しーでぃーをそうさする」、「でぃーぶいでぃーをそうさする」、「みゅーじっくさーばーをそうさする」などがある。また、この選択用認識語彙は、ローカルモード用認識辞書と一義的に対応している。
ここで、ローカルモード選択用認識辞書を用いて、音声認識に利用するローカルモード用認識辞書の選択方法について説明する。まず、ユーザの音声が入力され、発話内容が解析される。この解析された発話内容と、予めローカルモード選択用認識辞書に記憶されている選択用認識語彙とを照合し、ローカルモード選択用認識辞書に最も確からしい選択用認識語彙があるか否かを判定する。最も確からしい選択用認識語彙があると判定された場合、この最も確からしい選択用認識語彙に対応するローカルモード用認識辞書が、音声認識に利用するローカルモード用認識辞書として選択される。このようにすることにより、ユーザは、所望する音声認識に利用するローカルモード用認識辞書を選択することができる。
再度、図4を例として用いる。ユーザの発話内容に対して、ローカルモード選択用認識辞書に最も確からしい選択用認識語彙「しーでぃーをそうさする」があると判定された場合、この選択用認識語彙に対応する「CDプレーヤー操作モード用認識辞書」が音声認識に利用される。
なお、音声認識に利用するローカルモード用認識辞書Aが選択されている状態において、ユーザの発話内容に基づいて、音声認識に利用するローカルモード用認識辞書Bが選択された場合には、音声認識に利用するローカルモード用認識辞書は、ローカルモード用認識辞書Aからローカルモード用認識辞書Bに切り換えられる。具体的には、例えば、音声認識に利用する「CD操作モード用認識辞書」が選択されている状態において、ユーザが「DVDを操作する」という発話を行い、「DVD操作モード用認識辞書」が選択されると、音声認識に利用するローカルモード用認識辞書は、「CD操作モード用認識辞書」から「DVD操作モード用認識辞書」に切り換えられる。なお、ユーザの発話内容に応じて、音声認識に利用するローカルモード用認識辞書を選択するために、ローカルモード選択用認識辞書は常に音声認識に利用される。
上述した解析された発話内容は、認識辞書記憶部34にて、音声認識に利用するローカルモード用認識辞書に記憶された認識語彙と照合され、最も確からしい認識語彙、及びその認識語彙に対応する認識語コードが抽出される。
この認識辞書記憶部34におけるローカルモード用認識辞書は、図5に示すように、認識語彙と、その認識語彙と一対一に対応する認識語コードが記憶された構成となっている。
また、認識プログラム処理部32は、メッセージコード記憶部35、及びコマンドコード記憶部36を参照して、この認識語コードに対応するメッセージコード、及びコマンドコードを抽出する。メッセージコード記憶部35は、図6に示すように、認識語コードと、その認識語コードと一対一に対応するメッセージコードが記憶された構成となっている。同様に、コマンドコード記憶部36は、図7に示すように、認識語コードと、その認識語コードと一対一に対応するコマンドコードが記憶された構成となっている。このメッセージコードとは、出力制御部40のメッセージ出力部42が識別可能なコードであり、メッセージコードをメッセージ出力部42に与えることで、そのメッセージコードに対応するメッセージを出力することができる。また、このコマンドコードとは、出力制御部40の制御実行部45が識別可能なコードであり、コマンドコードに対応する制御が実行されるように制御対象機器70に制御信号を出力する。
さらに、認識プログラム処理部32は、認識辞書コード記憶部37を参照し、認識辞書記憶部34にて音声認識に利用するローカルモード用認識辞書と対応する認識辞書コードを抽出する。認識辞書コード記憶部37は、図8に示すように、ローカルモード用認識辞書と一対一に対応する認識辞書コードが記憶された構成となっている。この認識辞書コードとは、出力制御部40のキャラクター出力部44が識別可能なコードであり、認識辞書コードをキャラクター出力部44に与えることで、その認識辞書コードに対応するキャラクターを表示部60に表示することができる。
なお、認識辞書コード記憶部37は、ローカルモード選択用認識辞書に対応する認識辞書コードを記憶していない。上述したように、ローカルモード選択用認識辞書は常に音声認識に利用されている。このため、ローカルモード選択用認識辞書を特定するためのキャラクターを表示部60に表示することは必要ない。したがって、ローカルモード選択用認識辞書に対応するキャラクター、及び認識辞書コードの記憶は必要ない。
そして、認識プログラム処理部32は、上述の処理により得られたメッセージコード、コマンドコード、及び認識辞書コードを出力制御部40に出力する。
続いて、音声認識装置100の出力制御部40について、図3を用いて説明する。図3は、出力制御部40の構成を示すブロック図である。同図に示すように出力制御部40は、メッセージ記憶部41、メッセージ出力部42、キャラクター記憶部43、キャラクター出力部44、及び制御実行部45から構成される。
メッセージ出力部42は、メッセージ記憶部41を参照して、音声認識部30から受け取ったメッセージコードに対応するメッセージを抽出する。メッセージ記憶部41は、図9に示すように、メッセージコードと、そのメッセージコードと一対一に対応するメッセージが記憶された構成となっている。そして、メッセージ出力部42は、スピーカ50を介して、抽出したメッセージを出力する。
キャラクター出力部44は、キャラクター記憶部43を参照して、音声認識部30から受け取った認識辞書コードに対応するキャラクターを抽出する。キャラクター記憶部44は、図10に示すように、認識辞書コードと、そのキャラクターと一対一に対応するものであって、音声認識に利用するローカルモード用認識辞書を特定するためのキャラクターが記憶された構成となっている。そして、キャラクター出力部44は、表示部60に、抽出したキャラクターを表示する。
制御実行部45は、制御対象機器70に対して、音声認識部30から受け取ったコマンドコードに対応する制御を実行する。例えば、制御対象機器70は、CDプレーヤーであり、CDプレーヤーに対して実行される制御は、CDの再生、CDの停止などである。
次に、上述した本実施形態の音声認識装置の処理について、図11〜図13のフローチャートを用いて説明する。図11は、音声認識装置のメインルーチンを示すフローチャートであり、図12は、ローカルモード用認識辞書選択処理のルーチンを示すフローチャートである。そして、図13は、出力制御処理を示すフローチャートである。なお、具体的な例として、ローカルモード用認識辞書が選択されておらず、「CDを操作する」という音声が入力され、続けて、「CDを再生して」という音声が入力された場合を想定して説明を進める。
まず、図11のステップS10では、トークスイッチ20が操作されたか否かを判定する。操作されなかったと判定された場合、そのまま待機状態となる。一方、操作されたと判定された場合、ステップS20に進む。ステップS20では、音声認識部30が入力モードに切り換わり、音声の入力を受け付ける状態となる。ここで、例えば、「CDを操作する」と言った音声が入力された場合には、ステップS30に進む。ステップS30では、ステップS20にて入力された発話内容「CDを操作する」が解析される。
ステップS40では、ステップS30にて解析された発話内容がローカルモード用認識辞書の選択に関する発話内容か否かを判定する。具体的には、例えば、ステップS30にて解析された発話内容とローカルモード選択用認識辞書とを照合し、ローカルモード選択用認識辞書に最も確からしい選択用認識語彙があるか否かを判定する。最も確からしい選択用認識語彙がないと判定された場合、ステップS60に進む。一方、最も確からしい選択用認識語彙があると判定された場合、ステップS50に進む。ここでは、最も確からしい選択用認識語彙「しーでぃーをそうさする」があると判定される(図4参照。)ので、ステップS50に進む。
ステップS50では、ローカルモード用認識辞書選択処理が実行される。このローカルモード用認識辞書選択処理を図12のフローチャートを用いて説明する。
図12のフローチャートにおいて、まず、ステップS110では、最も確からしい選択用認識語彙に対応するローカルモード用認識辞書が抽出される。ここでは、図11のステップS40における最も確からしい選択認識語彙「しーでぃーをそうさする」に対応するローカルモード用認識辞書「CDプレーヤー操作用認識辞書」が抽出される(図4参照)。
ステップS120では、現在の選択されているローカルモード用認識辞書と、ステップS110にて抽出されたローカルモード用認識辞書とが一致するか否かを判定する。一致すると判定された場合、処理が終了される。一方、一致しない(現在、ローカルモード用認識辞書が選択されていない場合も含む)と判定された場合、ステップS130に進む。ここでは、ローカルモード選択用認識辞書が選択されていないので、ステップS130に進む。
ステップS130では、ステップS110にて抽出されたローカルモード用認識辞書が、音声認識に利用されるローカルモード用認識辞書として選択される。ここでは、「CDプレーヤー操作用認識辞書」が、音声認識に利用されるローカルモード用認識辞書として選択される。
ステップS140では、ステップS130にて選択されたローカルモード用認識辞書に対応する認識辞書コードが認識辞書コード記憶部37から抽出される。ここでは、ローカルモード用認識辞書「CDプレーヤー操作用認識辞書」に対応する認識辞書コード「D0001」が抽出される(図8参照)。
ステップS150では、抽出された認識辞書コードが出力制御部40に送信される。ステップS160では、キャラクター出力部44は、認識辞書コードに対応するキャラクターをキャラクター記憶部43から抽出する。ここでは、認識辞書コード「D0001」に対応するキャラクター「DJキャラ(タイプ1)」が抽出される(図10参照)。
ステップS170では、キャラクター出力部44は、ステップS160にて抽出されたキャラクターを表示部60に出力する。ここでは、キャラクター「DJキャラ(タイプ1)」を表示部60に表示する。例えば、図14に示すようなキャラクター表示画面400が表示部60に表示される。キャラクター表示画面400には、画面右下にキャラクター「DJキャラ(タイプ1)」が道路地図に重ねて表示されている。このようにすることにより、ユーザはこのキャラクターから音声認識に利用するローカルモード用認識辞書を特定することが容易になる。また、キャラクターを表示することにより、キャラクター非表示の音声認識装置に対して発話する場合と比べて、ユーザはキャラクターと対話をするような感覚になり、音声認識装置100に対する発話の違和感を低減することができる。
図11のフローチャートに戻り、ステップS10に戻る。ステップS10にて、トークスイッチ20が操作されたと判定され、ステップS20に進む。ステップS20にて、ここで、例えば、「CDを再生して」と言った音声が入力された場合には、ステップS30に進む。ステップS30にて、ステップS20にて入力された発話内容「CDを再生して」が解析される。
ステップS40にて、ここでは、ローカルモード選択用認識辞書に最も確からしい選択用認識語彙がないと判定される(図4参照。)ので、ステップS60に進む。
ステップS60では、出力制御処理が実行される。この出力制御処理を図13のフローチャートを用いて説明する。
図13のフローチャートにおいて、まず、ステップS210では、ローカルモード選択用認識辞書が選択されているか否かを判定する。選択さていないと判定された場合、ステップS300に進む。ステップS300では、エラーが報知される。具体的には、例えば、メッセージ「認識できませんでした」が、スピーカ50を介して音声で出力されるとともに、表示部60に表示される。
一方、ステップS210にて、選択されていると判定された場合、ステップS220に進む。ここでは、「CDプレーヤー操作用認識辞書」が選択されているので、ステップS220に進む。
ステップS220では、図11のステップS30にて解析された発話内容と、選択されているローカルモード用認識辞書とを照合し、ローカルモード用認識辞書に最も確からしい認識語彙があるか否かを判定する。最も確からしい認識語彙がないと判定された場合、ステップS300に進む。一方、最も確からしい認識語彙があると判定された場合、ステップS230に進む。ここでは、最も確からしい認識語彙「しーでぃーをさいせいする」があると判定される(図5参照。)ので、ステップS230に進む。
ステップS230では、ステップS220における最も確からしい認識語彙に対応する認識語コードが抽出される。ここでは、「しーでぃーをさいせいして」という最も確からしい認識語彙に対応する認識語コード「R0001」が抽出される(図5参照)。
ステップS240では、ステップS230にて抽出された認識語コードに対応するメッセージコードを、メッセージコード記憶部35から抽出する。ここでは、認識語コード「R0001」に対応するメッセージコード「M0001」が抽出される(図6参照)。
ステップS250では、ステップS230にて抽出された認識語コードに対応するコマンドコードを、コマンドコード記憶部36から抽出する。ここでは、認識語コード「R0001」に対応するコマンドコード「C0001」が抽出される(図7参照)。
ステップS260では、抽出されたメッセージコード、及びコマンドコードが出力制御部40に送信される。ステップS270では、メッセージ出力部42は、メッセージコードに対応するメッセージを、メッセージ記憶部41から抽出する。ここでは、メッセージコード「M0001」であるため、「CDを再生します」というメッセージが抽出される(図9参照)。
ステップS280では、メッセージ出力部42は、スピーカ50を介して、抽出したメッセージを音声で出力する。ステップS290では、制御実行部45は、コマンドコードに対応する制御を実行する。ここでは、コマンドコード「C0001」に基づいて、CDを再生する。
以上、説明したように本実施形態によれば、音声認識に利用するローカルモード用認識辞書と一義的に対応するものであって、当該音声認識に利用するローカルモード用認識辞書を特定するためのキャラクターを表示部60に表示することができるようにした。また、音声認識に利用するローカルモード用認識辞書が選択された場合であっても、選択された音声認識に利用するローカルモード用認識辞書を特定するためのキャラクターが表示部60に表示することができるようにした。このようにすることにより、ユーザは、キャラクターから音声認識に利用するローカルモード用認識辞書を常に特定することができる。これにより、ユーザが、音声認識に利用するローカルモード用認識辞書がいずれかのものであるかを把握することができる。
なお、本発明は、上述した実施形態になんら制限されることなく、本発明の主旨を逸脱しない範囲において、種々変形して実施することができる。
例えば、上述した実施形態においては、音声認識に利用するローカルモード用認識辞書を特定するためのキャラクターを表示部60に表示する例を説明した。しかしながら、音声認識に利用するローカルモード用認識辞書を特定するためのテキスト及び/又はアイコンを表示しても良い。
また、上述した実施形態では、キャラクターが表示部60に表示される例について説明した。しかしながら、キャラクターの表示の有無を、ユーザが設定できるようにしても良い。これにより、ユーザは、キャラクターの表示の有無を設定することができる。
さらに、上述した実施形態では、音声認識に利用するローカルモード用認識辞書を1つ選択する例について説明した。しかしながら、音声認識に利用するローカルモード用認識辞書を複数選択できる場合には、各々ローカルモード用認識辞書を特定するためのキャラクターを表示しても良い。
本実施形態における、音声認識装置100の概略構成を示すブロック図である。 本実施形態における、音声認識部30の構成を示すブロック図である。 本実施形態における、出力制御部40の構成を示すブロック図である。 本実施形態における、選択用認識語彙とローカルモード用認識辞書との対応関係を示す表である。 本実施形態における、認識語彙と認識語コードとの対応関係を示す表である。 本実施形態における、認識語コードとメッセージコードとの対応関係を示す表である。 本実施形態における、認識語コードとコマンドコードの対応関係を示す表である。 本実施形態における、ローカルモード用認識辞書と認識辞書コードとの対応関係を示す表である。 本実施形態における、メッセージコードとメッセージとの対応関係を示す表である。 本実施形態における、認識辞書コードとキャラクターとの対応関係を示す表である。 本実施形態における、音声認識装置のメインルーチンを示すフローチャートである。 本実施形態において、ローカルモード用認識辞書選択処理のルーチンを示すフローチャートである。 本実施形態において、出力制御処理のルーチンを示すフローチャートである。 本実施形態における、キャラクター表示画面400の表示例を示すイメージ図である。
符号の説明
10…音声入力部
20…トークスイッチ
30…音声認識部
40…メッセージ出力制御部
50…スピーカ
60…表示部
70…制御対象機器

Claims (4)

  1. 認識語彙を複数のグループに分け、それぞれのグループに含まれる認識語彙を音声認識辞書として記憶する第1の記憶手段と、
    複数の音声認識辞書から、音声認識に利用する音声認識辞書を選択する選択手段と、
    前記選択手段によって選択された音声認識に利用する音声認識辞書に基づいて、ユーザが発話した音声を認識する音声認識手段とを備えた音声認識装置であって、
    表示部と、
    各音声認識辞書と一義的に対応しているものであって、音声認識に利用する音声認識辞書を特定するための表示データを記憶する第2の記憶手段と、
    音声認識に利用する音声認識辞書と対応する前記記憶された表示データを、前記表示部に表示する表示制御手段とを備えることを特徴とする音声認識装置。
  2. 前記表示データは、キャラクターデータ、テキストデータ、及びアイコンデータの少なくともいずれか1つであることを特徴とする請求項1に記載の音声認識装置。
  3. 前記表示制御手段による前記表示データの表示の有無が、ユーザによって変更可能に構成されていることを特徴とする請求項1または請求項2に記載の音声認識装置。
  4. 前記複数の音声認識辞書は、ローカルモード用音声認識辞書とローカルモード選択用音声認識辞書との2種類があり、
    前記ローカルモード選択用音声認識辞書は、複数のローカルモード用音声認識辞書を選択するための選択用認識語彙を有し、
    前記選択手段は、ユーザの発話した音声と前記選択用認識語彙とに基づいて、音声認識に利用するローカルモード用音声認識辞書を選択することを特徴とする請求項1乃至請求項3のいずれかに記載の音声認識装置。
JP2004262816A 2004-09-09 2004-09-09 音声認識装置 Pending JP2006078791A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004262816A JP2006078791A (ja) 2004-09-09 2004-09-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004262816A JP2006078791A (ja) 2004-09-09 2004-09-09 音声認識装置

Publications (1)

Publication Number Publication Date
JP2006078791A true JP2006078791A (ja) 2006-03-23

Family

ID=36158293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004262816A Pending JP2006078791A (ja) 2004-09-09 2004-09-09 音声認識装置

Country Status (1)

Country Link
JP (1) JP2006078791A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104020A (ja) * 2007-10-25 2009-05-14 Panasonic Electric Works Co Ltd 音声認識装置
WO2014069798A1 (en) * 2012-10-29 2014-05-08 Samsung Electronics Co., Ltd. Voice recognition apparatus and voice recognition method thereof

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124085A (ja) * 1996-10-18 1998-05-15 Matsushita Electric Ind Co Ltd 音声認識装置及び認識方法
JPH11125533A (ja) * 1997-10-21 1999-05-11 Sony Corp ナビゲーション装置及びナビゲート方法
JP2000137729A (ja) * 1998-11-02 2000-05-16 Fujitsu Ltd 辞書検索装置及び辞書検索プログラムを記録した記録媒体
JP2003122393A (ja) * 2001-10-19 2003-04-25 Denso Corp 入力装置、プログラム
JP2004053251A (ja) * 2001-11-13 2004-02-19 Equos Research Co Ltd 車載装置、データ作成装置、及びデータ作成プログラム
JP2004245938A (ja) * 2003-02-12 2004-09-02 Fujitsu Ten Ltd 音声認識装置及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124085A (ja) * 1996-10-18 1998-05-15 Matsushita Electric Ind Co Ltd 音声認識装置及び認識方法
JPH11125533A (ja) * 1997-10-21 1999-05-11 Sony Corp ナビゲーション装置及びナビゲート方法
JP2000137729A (ja) * 1998-11-02 2000-05-16 Fujitsu Ltd 辞書検索装置及び辞書検索プログラムを記録した記録媒体
JP2003122393A (ja) * 2001-10-19 2003-04-25 Denso Corp 入力装置、プログラム
JP2004053251A (ja) * 2001-11-13 2004-02-19 Equos Research Co Ltd 車載装置、データ作成装置、及びデータ作成プログラム
JP2004245938A (ja) * 2003-02-12 2004-09-02 Fujitsu Ten Ltd 音声認識装置及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104020A (ja) * 2007-10-25 2009-05-14 Panasonic Electric Works Co Ltd 音声認識装置
WO2014069798A1 (en) * 2012-10-29 2014-05-08 Samsung Electronics Co., Ltd. Voice recognition apparatus and voice recognition method thereof

Similar Documents

Publication Publication Date Title
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
KR100547900B1 (ko) 데이터 입력 방법 및 데이터 입력 장치
JP4131978B2 (ja) 音声認識機器制御装置
US7827232B2 (en) Record button on a computer system
JP2011059659A (ja) 第1の機能及び第2の機能を含む複数の機能を有効にするためのシステムおよび方法
JP3702867B2 (ja) 音声制御装置
JP2003076389A (ja) タッチスクリーン又は音声認識を通じて動作制御される情報端末及びその命令実行方法
JP2011059676A (ja) 発話入力に基づいて複数の機能を有効にするためのシステム及び方法
JP2008145693A (ja) 情報処理装置及び情報処理方法
WO2006049249A1 (ja) ディジタル映像再生装置
JP2006208486A (ja) 音声入力装置
JP2006078791A (ja) 音声認識装置
JP2006058641A (ja) 音声認識装置
JP4498906B2 (ja) 音声認識装置
JP4585759B2 (ja) 音声合成装置、音声合成方法、プログラム、及び記録媒体
JP4268325B2 (ja) 音声操作語句の提示装置及び提示方法
JP2008310344A (ja) 提示装置及び提示方法
JP2000305596A (ja) 音声認識装置及びナビゲーション装置
KR101715381B1 (ko) 전자장치 및 그 제어방법
JP2005053331A (ja) 車載機器用情報提示装置
JP7323050B2 (ja) 表示制御装置及び表示制御方法
JP2008233009A (ja) カーナビゲーション装置及びカーナビゲーション装置用プログラム
JP2019020475A (ja) 音声認識装置、音声認識方法
WO2015102039A1 (ja) 音声認識装置
JP2019086599A (ja) 音声認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100824