JP2007163895A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2007163895A
JP2007163895A JP2005360829A JP2005360829A JP2007163895A JP 2007163895 A JP2007163895 A JP 2007163895A JP 2005360829 A JP2005360829 A JP 2005360829A JP 2005360829 A JP2005360829 A JP 2005360829A JP 2007163895 A JP2007163895 A JP 2007163895A
Authority
JP
Japan
Prior art keywords
user
proficiency level
speech recognition
voice recognition
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005360829A
Other languages
English (en)
Inventor
Reiko Okada
玲子 岡田
Yuki Sumiyoshi
悠希 住吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2005360829A priority Critical patent/JP2007163895A/ja
Publication of JP2007163895A publication Critical patent/JP2007163895A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】使用者の習熟度に応じて複数の音声認識辞書を適宜選択して、誤認識率を低減するとともに操作性を向上させる。
【解決手段】音声認識装置10は、音声認識辞書11−1〜11−4を参照して入力音声を音声認識して音声認識結果を出力する。音声認識辞書は予め定められた分類に応じて複数備えられており、音声認識装置は、音声認識結果に対する訂正操作に応じて利用者習熟度を判定して習熟度判定結果を得る利用者習熟度判定手段16と、習熟度判定結果に基づいて音声認識辞書から使用すべき音声認識辞書を選択音声認識辞書として選択する辞書選択手段14と、選択音声認識辞書を参照して入力音声を音声認識して音声認識結果を得る音声認識手段13とを有している。
【選択図】図1

Description

この発明は、複数の音声認識辞書を備えて、音声認識を行う音声認識装置に関し、特に、ユーザの習熟度に応じて音声認識辞書を選択して誤認識の発生を低減する音声認識装置に関するものである。
一般に、音声認識装置においては、多数の語彙が格納された音声認識辞書を用いて音声認識を行っており、音声認識辞書に格納する語彙数を多くすれば、ユーザが発話した種々の語彙を認識することが可能となるものの、音声認識辞書に格納された語彙数が増えるほど、ユーザが発話した語彙を音声認識辞書に格納された語彙と一意にマッチングさせることが難しくなる。この結果、音声認識辞書に格納された語彙数が増加すると、認識誤りが発生し易くなる。そして、認識誤りが多くなると、音声認識装置を使い慣れていない初心者ユーザにとって、使用しづらくなってしまう。
このような点を改善するため、音声認識辞書を階層構造として包括範囲を次第に狭める構成とし、次の発話内容を予測しつつ認識処理を行うとともに、ユーザの習熟度向上に伴って長文節の入力を可能とするように適時的に上位の階層を修正して利用頻度の少ない語彙を新しい語彙と入れ替えるようにしたものがある(例えば、特許文献1)。
つまり、特許文献1に記載された音声認識装置では、音声認識用の語彙を階層構造として、ユーザの習熟度に応じて下位の階層にある語彙を繋げた連続語を認識用語彙として追加して、これによって、次回から連続して発話することができるようにして、認識性能を維持しつつ、短い入力時間で認識処理を行うことができるようにしている。
特開2004−325704公報(第4頁〜第9頁、第1図〜第9図)
従来の音声認識装置は以上のように構成されているので、つまり、音声認識辞書を階層構造として、ユーザの習熟度に応じて連続語を認識用語彙として音声認識辞書に追加するようにしているものの、階層構造をとることができない語彙を連続語とすることはできず、この結果、上位の階層に位置する語彙が増加してしまうと、認識誤りが多くなってしまい、音声認識装置を使い慣れない初心者又は初級者ユーザにとって使用しづらいという点を、改善することが難しいという課題があった。
さらに、従来の音声認識装置では、ユーザが発話した語彙に関連して、次回から下位の階層に位置する語彙も連続して発話できるようにしているため、新たな語彙を音声認識辞書に追加することができないという課題があった。
この発明は上記のような課題を解決するためになされたもので、ユーザの習熟度に応じて複数の音声認識辞書を適宜選択して、誤認識率を低減するとともに使用し易い音声認識装置を得ることを目的とする。
この発明に係る音声認識装置は、予め定められた分類に応じた複数の音声認識辞書と、音声認識結果に対する訂正操作に応じて利用者習熟度を判定して習熟度判定結果を得る利用者習熟度判定手段と、習熟度判定結果に基づいて音声認識辞書から使用すべき音声認識辞書を選択音声認識辞書として選択する辞書選択手段と、選択音声認識辞書を参照して入力音声を音声認識して音声認識結果を得る音声認識手段とを有することを特徴とするものである。
この発明によれば、利用者の習熟度に応じて選択すべき(アクティブとすべき)音声認識辞書を変更するように構成したので、利用者はその習熟度に応じて認識可能な語彙を確実に習得でき、その結果、誤認識の発生を防止して操作性を向上できるという効果がある。
実施の形態1.
図1は本発明の実施の形態1による音声認識装置の一例を示すブロック図であり、図示の音声認識装置10は、複数の音声認識辞書11−1乃至11−N(Nは2以上の整数:図示の例ではN=4である)を備えており、音声認識辞書11−1乃至11−4は音声認識部12に接続されている。これら音声認識辞書11−1乃至11−4は、例えば、互いに異なる分類で語彙が格納されている。例えば、音声認識辞書11−1は基本コマンド辞書であり、基本的なコマンドが語彙として格納されている。そして、音声認識辞書11−1乃至11−4の順にレベルの高い語彙が格納されている。
音声認識装置10は、音声認識手段13、認識辞書選択手段14、利用者(ユーザ)習熟度保存手段15、利用者習熟度判定手段16、制御手段17、出力情報生成手段18、手動入力手段19、音声入力手段20、画面出力手段21、及び音声出力手段22を備えており、図示の例では、手動入力手段19にはリモコン/タッチパネル23が接続されている。また、音声入力手段20にはマイク24が接続され、画面出力手段21にはモニタ25が接続されている。そして、音声出力手段22にはスピーカー26が接続されている。
リモコン/タッチパネル23には、音声認識処理を開始するための認識開始ボタン(図示せず)及び誤認識の際訂正を行うための訂正ボタン(図示せず)等のユーザ入力ボタンが備えられ、手動入力手段19はリモコン/タッチパネル23からのキー入力(ボタン入力)を受け付けて制御手段17に渡す。また、音声入力手段20はマイク24からの音声を受け付けて制御手段17に渡す。制御手段17は音声入力手段20からの入力音声を受けると、この入力音声を音声認識手段13に渡す。そして、音声認識手段13は認識辞書選択手段14で選択された(アクティブ)にされた音声認識辞書を参照して入力音声について音声認識処理を行い、音声認識結果を得る。
この音声認識結果は制御手段17を介して出力情報生成手段18に送られて、出力情報生成手段18では音声認識結果に応じた出力情報(画像又は音声)を生成して、画面出力手段21及び/又は音声出力手段22に渡す。そして、画像出力手段21では出力情報を画像又はテロップとしてモニタ25に表示し、音声出力手段22では出力情報をスピーカー26から音声として出力する。
利用者習熟度判定手段16は、後述するようにして、利用者の習熟度を判定して利用者習熟度を得て、この利用者習熟度を利用者習熟度保存手段15に保存する。そして、音声認識処理を行う際には、制御手段17は、後述するようにして、利用者習熟度判定手段16を介して利用者習熟度保存手段15から該当する利用者習熟度に対応して選択すべき音声認識辞書を示す辞書識別番号を読み出して、この辞書識別番号を認識辞書選択手段14に渡し、認識辞書選択手段は辞書識別番号に基づいて少なくとも1つの音声認識辞書を選択する。
なお、制御手段17は音声認識処理の際、出力情報生成手段18を制御してガイダンス情報を生成し、このガイダンス情報をそれぞれ画面出力手段21及び音声出力手段22を介してモニタ25に表示するとともに、スピーカー26から出力する。
次に動作について説明する。
図1及び図2を参照して、いま利用者習熟度保存手段15には、この音声認識装置10を用いる利用者毎に利用者習熟度が保存されているものとする。音声認識装置10がオンされて、使用者がリモコン/タッチパネル23を用いて利用者自身のID(利用者識別コード)を入力すると、手動入力手段を介して当該IDが制御手段17に与えられる。
図3に示すように、利用者習熟度保存手段15には、利用者習熟度に対応して選択すべき音声認識辞書を示す辞書対応テーブルが保存されており、図示の例では、利用者習熟度“1”に音声認識辞書11−1が対応し、利用者習熟度“2”に音声認識辞書11−1及び11−2が対応する。また、利用者習熟度“3”に音声認識辞書11−1乃至11−3が対応し、利用者習熟度“4”に音声認識辞書11−1乃至11−4が対応する。
さらに、利用者習熟度保存手段15には、図4に示す利用者対応テーブルが保存されている。図示のように、利用者対応テーブルには、利用者(つまり、ID)U1乃至U3毎の利用者習熟度が格納され、図示の例では、利用者U1、U2、及びU3の利用者習熟度は、それぞれ“1”、“4”、及び“2”である。
制御手段17はIDに応じて利用者習熟度判定手段16を介して利用者習熟度保存手段15から当該IDに対応する利用者習熟度を得(ステップST1)、さらに利用者習熟度に対応して選択すべき音声認識辞書を示す辞書識別番号を読み出す。そして、制御手段17はこの辞書識別番号を認識辞書選択手段14に渡し、認識辞書選択手段14は辞書識別番号に応じて音声認識辞書11−1乃至11−4の少なくとも1つを選択する(ステップST2)。
なお、初期状態(例えば、利用者が初めて音声認識装置10を使用する場合等)では、利用者習熟度は“1”であり、この結果、音声認識辞書11−1が選択されることになる。続いて、制御手段17は、出力情報生成手段18を制御して現在の利用者習熟度(利用者習熟度保存手段15から読み出した利用者習熟度)を画面出力手段21によってモニタ25上に表示する(ステップST3)。例えば、モニタ25上には「現在の音声認識レベル:1」のように画面表示される。
その後、制御手段17はリモコン/タッチパネル23からのキー入力が認識開始ボタンの押し下げであるか否かを監視して(ステップST4)、使用者が認識開始ボタンを押し下げると、制御手段17は音声認識開始であると判定し、出力情報生成手段18を制御して画像出力手段21及び音声出力手段22を介して、モニタ25にー音声認識開始状態を示す画面を表示するとともに、スピーカー26から音声出力を行う(ステップST5)。例えば、モニタ25には「音声認識開始」が表示ガイダンスとして表示され、スピーカー26からは「お話ください」等の音声ガイダンスが出力される。
マイク24から入力音声が音声入力手段20を介して制御手段17に与えられると、制御手段17の制御下で、音声認識手段13は、音声認識処理を開始し(ステップST6)、認識辞書選択手段14で選択された音声認識辞書を参照して、入力音声について音声認識処理を行う。音声認識手段13で得られた音声認識結果は制御手段17を介して出力情報生成手段18に送られて、出力情報生成手段18では音声認識結果に応じた出力情報を生成して、画面出力手段21及び/又は音声出力手段22を介して出力情報を画像又はテロップとしてモニタ25に表示し、出力情報をスピーカー26から音声として出力する(音声結果提示:ステップST7)。
制御手段17は音声結果提示後、内蔵するタイマーの計時を開始して、一定時間(所定の時間)内に訂正操作があったか否かを監視する(ステップST8)。所定の時間内に使用者がリモコン/タッチパネル23の訂正ボタンを押すと、制御手段17では訂正ボタンの押し下げを検知して、その旨利用者習熟度判定手段16に連絡する。これに応答して、利用者習熟度判定手段16では当該利用者に係る利用者習熟度をアップさせて(ステップST9)、現利用者習熟度としてIDに対応付けて利用者習熟度保存手段15に保存する。
さらに、現利用者習熟度は制御手段17に送られて、制御手段17では出力情報生成手段18を制御して、画面出力手段21によってモニタ25上に現利用者習熟度を表示する(利用者習熟度判定表示:ステップST10)。例えば、アップさせる前の利用者習熟度が“1”であれば、モニタ25上には「現在の音声認識レベル:2」のように画面表示される。
一方、ステップST8において、所定の時間内に訂正ボタンが押されないと、制御手段17はステップST10に移行し、「現在の音声認識レベル:1」をモニタ25に表示する。
なお、音声認識辞書11−1乃至11−4は、語彙の種類(種別)によって分類され、基本的で簡単な語彙は音声認識辞書11−1に、最もむ高度な語彙を音声認識辞書11−4に格納する。例えば、カーナビゲーション装置で用いる音声認識装置では、音声認識辞書11−1には、「自宅」、「現在地」、及び「目的地」等の基本的なナビ用コマンドが格納され、音声認識辞書11−2には、施設検索用語彙が格納される。また、音声認識辞書11−3には音楽検索用コマンドが語彙として格納され、音声認識辞書11−4には住所認識用語彙が格納される(これは単なる一例である)。
また、上述の例では、4つの音声認識辞書を備えて、利用者習熟度を4レベルとしたが、利用者習熟度のレベル数及び音声認識辞書数は適宜設定することができる。さらに、図示の例では、利用者習熟度=4である際においては、レベルアップ後の利用者習熟度も4とされる。
このようにして、音声認識結果を提示した後、所定の時間内に当該音声認識結果について訂正操作があると、この利用者は音声認識装置の使用に慣れているとして利用者習熟度をアップさせて、以後この利用者習熟度を用いて音声認識辞書を選択するようにすれば、使用者の習熟度に応じた音声認識辞書が選択されることになって、誤認識率が低減されるばかりでなく、容易に使用することができる。
ところで、図2に符号“A”で示す位置に、図5に示す処理を挿入するようにしてもよい。前述したように、図2に示すステップST5においては、ガイダンスとして画面表示・音声出力が行われるが、この際、制御手段17では図5に示すように、ガイダンススキップ操作が行われたか否かを監視しており(ステップST11)、使用者がリモコン/タッチパネル23のガイダンススキップキーを押し下げて、ガイダンススキップを行うと、制御手段17ではガイダンススキップキーの押し下げを検知して、その旨利用者習熟度判定手段16に連絡する(つまり、制御手段17がスキップ操作検知手段として機能する)。これに応答して、利用者習熟度判定手段16では当該利用者に係る利用者習熟度をアップさせて(ステップST12)、現利用者習熟度としてIDに対応付けて利用者習熟度保存手段15に保存する。
上述のように、ガイダンススキップを行う利用者は、音声認識装置の使用に慣れていることが多いから、このような利用者について利用者習熟度をアップさせて、音声認識辞書を選択するようにすれば使用者の習熟度に応じた音声認識辞書が選択されることになって、誤認識率が低減されるばかりでなく、当該利用者にとって音声認識装置の操作性が向上する。
さらに、図2に符号“B”で示す位置に、図6に示す処理を挿入するようにしてもよい。音声認識手段13で音声認識の際に音声認識結果とともに、音声認識結果に係るスコア値(認識スコア:音声認識結果の確からしさ)を求めており、制御手段17では認識スコアを予め規定された閾値と比較して(ステップST13)、認識スコアが閾値以上であると、その旨利用者習熟度判定手段16に連絡する。これに応答して、利用者習熟度判定手段16では当該利用者に係る利用者習熟度をアップさせて(ステップST14)、現利用者習熟度としてIDに対応付けて利用者習熟度保存手段15に保存する。
上述のように、認識スコアが閾値以上である(つまり、認識スコアが高い)利用者は、音声認識装置の使用に慣れていると看做して、このような利用者について利用者習熟度をアップさせて、音声認識辞書を選択するようにすれば使用者の習熟度に応じた音声認識辞書が選択されることになって、利用者のレベルに応じた操作が行えることになり、音声認識装置の操作性が向上する。
なお、上述の例では、認識スコアが閾値以上であると、利用者習熟度をアップさせるようにしたが、認識スコアが閾値未満である際に(認識スコアが低い場合には)、利用者習熟度をダウンさせるようにしてもよい。
また、図2に符号“C”で示す位置に、図7に示す処理を挿入するようにしてもよい。制御手段17は利用者が音声認識操作(音声操作の完了)を達成したか否かを監視しており(ステップST15:つまり、入力音声について音声認識結果を確定するためには、利用者はリモコン/タッチパネル23を用いて音声認識結果を確定する必要があり、この確定した状態を音声認識操作達成という)、制御手段17は音声認識操作達成回数が所定回数となると、その旨利用者習熟度判定手段16に連絡する。これに応答して、利用者習熟度判定手段16では当該利用者に係る利用者習熟度をアップさせて(ステップST16)、現利用者習熟度としてIDに対応付けて利用者習熟度保存手段15に保存する。
上述のように、音声認識操作を達成した利用者は、音声認識装置の使用に慣れている(使用できる)と看做して、このような利用者について利用者習熟度をアップさせて、音声認識辞書を選択するようにすれば、使用者の習熟度に応じた音声認識辞書が選択されることになり、利用者のレベルに応じて語彙数を増やして、音声認識装置の操作性を向上させることができる。
図2に符号“D”で示す位置に、図8に示す処理を挿入するようにしてもよい。利用者習熟度判定手段16には制御手段17を介して利用者が発話した語彙が送られ、利用者習熟度判定手段16は今までに発話された語彙数をカウントしており、そのカウント値が所定値に達すと(発話語彙数判定:ステップST18)、利用者習熟度判定手段16では当該利用者に係る利用者習熟度をアップさせて(ステップST19)、現利用者習熟度としてIDに対応付けて利用者習熟度保存手段15に保存する。
例えば、現在の利用者習熟度に対応する認識語彙数が50であった際、利用者がその内の40の語彙を発話して使用した際には、利用者習熟度判定手段16は利用者習熟度をアップする。これによって、利用者が現在使用可能な語彙の内多くのの語彙を認識させることができた際には、現在の利用者習熟度に対して音声認識が十分に使用できたと看做せ、習熟度を上げることによって、認識可能な語彙数を増やすことができる。
上述のように、発話語彙数が多い利用者は、音声認識装置の使用に慣れている(使用できる)と看做して、このような利用者について利用者習熟度をアップさせて、音声認識辞書を選択するようにすれば、使用者の習熟度に応じた音声認識辞書が選択されることになって、音声認識装置の操作性を向上させることができる。
加えて、図2に符号“E”で示す位置に、図9に示す処理を挿入するようにしてもよい。前述のように、音声認識結果はモニタ25に表示されるとともに、スピーカー26から出力されるが、この音声認識結果が正しい認識結果であるか否かを判断して、利用者は、例えば、リモコン/タッチパネル23を用いてその旨入力する(正認識であるか誤認識であるかを示す認識情報を入力する)。
この認識情報は制御手段17を介して利用者習熟度判定手段16に送られて、利用者習熟度判定手段16は音声認識結果についてその誤認識の回数をカウントし、誤認識の回数(又は誤認識の発生率)が予め設定された閾値以上であると(ステップST20)、当該利用者に係る利用者習熟度をダウンさせて(ステップST21)、現利用者習熟度としてIDに対応付けて利用者習熟度保存手段15に保存する。
例えば、誤認識発生率が50%未満であると、利用者習熟度判定手段16は利用者習熟度をダウンさせて、当該利用者が音声認識に慣れるまで、基本的なコマンド語彙のみを使用可能なようにする。これによって、認識誤りが多い利用者については、利用習熟度を落として、実質的に認識語彙数を削減し、利用者が確実に音声認識装置を使用することができるようにする。なお、利用者習熟度=1である際には、利用者習熟度=1のままとされる。
上述のように、誤認識が多い利用者は、音声認識装置の使用に不慣れであると看做して、このような利用者について利用者習熟度をダウンさせて、音声認識辞書を選択するようにすれば使用者の習熟度に応じた音声認識辞書が選択されることになって、利用者のレベルに応じた操作が行えることになり、音声認識装置の操作性が向上する。
ここで、図10を参照して、利用者は必要に応じて、チュートリアル(Tutorial)を行うようにしてもよい。図示の例では、チュートリアルは音声認識辞書11−1乃至11−4に対応付けて、チュートリアル”1”乃至”4”があり、制御手段17はチュートリアルが実施されたか否かを監視しており(ステップST22)、利用者がリモコン/タッチパネル23を用いてチュートリアルを指示(実施)すると、その旨制御手段17から利用者習熟度判定手段16に通知され、利用者習熟度判定手段16はこれに応答して利用者習熟度をアップして(ステップST23)、現利用者習熟度としてIDに対応付けて利用者習熟度保存手段15に保存する。
例えば、チュートリアル“1”を実施すると、利用者習熟度判定手段16は利用者習熟度を“2”にアップして、音声認識の際に音声認識辞書11−2が追加されることになる。また、利用者習熟度=3に対応する音声認識辞書11−3が音楽検索コマンド辞書である際には、利用者が音楽検索コマンドに関するチュートリアルを実施すると、利用者習熟度は“3”にレベルアップされる。これによって、音声認識辞書11−1乃至11−4に対応するチュートリアルを実施すると、当該対応する音声認識辞書がアクティブとされることになる。
ところで、図11はモニタ25に表示される画面の一例を示す図であり、図示の例では、モニタ25は地図画面25aが表示され、その下側には、音声入力可(Voice OK)欄25bが表示されるとともに、習熟度レベルを示す習熟度レベル欄25cが表示されている。習熟度レベルは必要に応じて表示され、例えば、図11に示すように、音声認識処理を開始する際に表示される。また、利用者がリモコン/タッチパネル23を操作して、習熟度レベル表示を指令すると、制御手段17は利用者習熟度判定手段16を介して利用者習熟度保存手段15から当該利用者に係る利用者習熟度を読み出して、モニタ25に表示する。
図12はモニタ25に表示される画面の他の例を示す図であり、図示の例では、モニタ25は、習熟度レベル一覧25dが表示され、習熟度レベル一覧25dの下側には認識可能語彙画面25eが表示されている。ここでは、習熟度レベル一覧25dには利用者の習熟度に対応した習熟度レベルを他の習熟度レベルと異ならせて表示しており、図示の例では、利用者の習熟度レベルは“3”である。また、認識可能語彙画面25eには認識語句一覧(音楽検索)が示されている。
なお、利用者がリモコン/タッチパネル23を用いて利用者習熟度設定指令を入力すると、制御手段17はモニタ25上に利用者習熟度設定画面を表示するようにしてもよい。そして、利用者がリモコン/タッチパネル23を用いて利用者習熟度設定画面から利用者が希望する利用者習熟度を入力すると、制御手段17はその設定・変更を利用者習熟度判定手段16に渡し、利用者習熟度保存手段15に変更後の利用者習熟度を保存する。これによって、利用者は任意に利用者習熟度の設定・変更を行うことができる。
また、上述の説明から明らかなように、制御手段17、出力情報生成手段18、画面出力手段21、音声出力手段22、モニタ25、及びスピーカー26が集合的にガイダンス提示手段として機能し、リモコン/タッチパネル23及び手動入力手段19が誤認識であるか否かを入力するための入力手段として機能する。さらに、制御手段17、出力情報生成手段18、画面出力手段21、及びモニタ25が利用者習熟度を提示する習熟度提示手段として機能し、リモコン/タッチパネル23及び手動入力手段19が習熟度の設定・変更を利用者によって行うための習熟度設定変更手段として機能する。
この実施の形態1によれば、音声認識結果に対する訂正操作に応じて利用者習熟度を判定し、習熟度判定結果に基づいて音声認識辞書から使用すべき音声認識辞書を選択音声認識辞書として選択するように構成したので、利用者の習熟度に応じて複数の音声認識辞書を適宜選択して、誤認識率を低減するとともに操作性を向上できる。
この実施の形態1によれば、操作ガイダンスについてスキップ操作が行われると利用者習熟度を変更し、さらには、認識スコア、音声認識結果を確定するまで利用者操作が行われたか否か、又は利用者の発話語彙数に応じて利用者習熟度を判定するように構成したので、利用者習熟度を的確に判定することができる。
この実施の形態1によれば、誤認識の頻度に応じて利用者習熟度を判定するように構成したので、習熟度を的確に判定でき、さらには、チュートリアルの実施状況に応じて利用者習熟度の判定を行うようにしたので、利用者がチュートリアルを実施することにより、操作方法や、認識可能な語彙を把握することができ、操作性や認識率が向上する。
この実施の形態1によれば、利用者習熟度に対応して使用される音声認識辞書が規定された対応辞書テーブルと、利用者毎の利用者習熟度が規定された利用者テーブルと備えているので、複数の利用者について習熟度に応じて音声認識辞書を選択できる。
この実施の形態1によれば、利用者によって利用者習熟度の設定変更を行うことができ、その結果、自分自身の習熟度が最も分かる利用者によって習熟度の設定変更を行うことができる。
この発明の実施の形態1による音声認識装置の一例を示すブロック図である。 図1に示す音声認識装置の動作の第1の例を説明するためのフローチャートである。 図1に示す利用者習熟度保存手段に格納される対応辞書テーブルの一例を示す図である。 図1に示す利用者習熟度保存手段に格納される利用者テーブルの一例を示す図である。 図2に示すフローチャートに追加される処理の第1の例を説明するためのフローチャートである。 図2に示すフローチャートに追加される処理の第2の例を説明するためのフローチャートである。 図2に示すフローチャートに追加される処理の第3の例を説明するためのフローチャートである。 図2に示すフローチャートに追加される処理の第4の例を説明するためのフローチャートである。 図2に示すフローチャートに追加される処理の第5の例を説明するためのフローチャートである。 図2に示すフローチャートに追加される処理の第6の例を説明するためのフローチャートである。 図1に示すモニタに表示される画面の一例を示す図である。 図1に示すモニタに表示される画面の他の例を示す図である。
符号の説明
10 音声認識装置、11−1〜11−4 音声認識辞書、12 音声認識部、13 音声認識手段、14 認識辞書選択手段、15 利用者習熟度保存手段、16 利用者習熟度判定手段、17 制御手段、18 出力情報生成手段、19 手動入力手段、20 音声入力手段、21 画面出力手段、22 音声出力手段、23 リモコン/タッチパネル、24 マイク、25 モニタ、26 スピーカー、25a 地図画面、25b 音声入力可(Voice OK)、25c 習熟度レベル、25d 習熟度レベル一覧、25e 認識可能語彙画面。

Claims (7)

  1. 音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力する音声認識装置において、
    予め定められた分類に応じた複数の前記音声認識辞書と、
    前記音声認識結果に対する訂正操作に応じて利用者習熟度を判定して習熟度判定結果を得る利用者習熟度判定手段と、
    前記習熟度判定結果に基づいて前記音声認識辞書から使用すべき音声認識辞書を選択する認識辞書選択手段と、
    前記選択音声認識辞書を参照して前記入力音声を音声認識して前記音声認識結果を得る音声認識手段とを有することを特徴とする音声認識装置。
  2. 音声認識が開始されると操作ガイダンスを提示するガイダンス提示手段を有し、
    利用者習熟度判定手段は前記操作ガイダンスについてスキップ操作が行われると利用者習熟度を変更するようにしたことを特徴とする請求項1記載の音声認識装置。
  3. 利用者習熟度判定手段は、音声認識結果の確からしさを示す認識スコア、前記音声認識結果を確定するまで利用者操作が行われたか否か、及び利用者の発話語彙数の少なくとも1つに応じて利用者習熟度を変更するようにしたことを特徴とする請求項1又は2記載の音声認識装置。
  4. 音声認識結果が提示された際誤認識であるか否かを入力するための入力手段を有し、
    利用者習熟度判定手段は、誤認識の頻度に応じて利用者習熟度を変更するようにしたことを特徴とする請求項1又は2記載の音声認識装置。
  5. 音声認識辞書に対応してチュートリアルが規定されており、
    利用者習熟度判定手段は、チュートリアルの実施状況に応じて利用者習熟度の判定を行うようにしたことを特徴とする請求項1乃至4いずれか1項記載の音声認識装置。
  6. 利用者習熟度に対応して使用される音声認識辞書が規定された対応辞書テーブルと、利用者毎の利用者習熟度が規定された利用者テーブルとが保存された利用者習熟度保存手段とを備え、
    利用者習熟度判定手段は前記利用者習熟度を変更する都度前記利用者テーブルを更新しており、
    辞書選択手段は前記対応辞書テーブル及び前記利用者テーブルを参照して音声認識辞書を選択することを特徴する請求項1乃至5いずれか1項記載の音声認識装置。
  7. 利用者習熟度を提示する習熟度提示手段と、
    前記習熟度の設定・変更を利用者によって行うための習熟度設定変更手段とを有することを特徴とする請求項1乃至6いずれか1項記載の音声認識装置。
JP2005360829A 2005-12-14 2005-12-14 音声認識装置 Pending JP2007163895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005360829A JP2007163895A (ja) 2005-12-14 2005-12-14 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005360829A JP2007163895A (ja) 2005-12-14 2005-12-14 音声認識装置

Publications (1)

Publication Number Publication Date
JP2007163895A true JP2007163895A (ja) 2007-06-28

Family

ID=38246836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005360829A Pending JP2007163895A (ja) 2005-12-14 2005-12-14 音声認識装置

Country Status (1)

Country Link
JP (1) JP2007163895A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013038440A1 (ja) * 2011-09-13 2013-03-21 三菱電機株式会社 ナビゲーション装置
WO2020004213A1 (ja) * 2018-06-29 2020-01-02 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0434499A (ja) * 1990-05-30 1992-02-05 Sharp Corp 発声法指示装置
JPH0451299A (ja) * 1990-06-20 1992-02-19 Hitachi Ltd 音声認識制御装置
JPH04167020A (ja) * 1990-10-30 1992-06-15 Ricoh Co Ltd 操作マニュアル作成装置
JPH0535383A (ja) * 1991-07-26 1993-02-12 Matsushita Electric Ind Co Ltd 操作ガイド装置
JPH1020884A (ja) * 1996-07-04 1998-01-23 Nec Corp 音声対話装置
JP2000194386A (ja) * 1998-12-24 2000-07-14 Omron Corp 音声認識応答装置及び方法
JP2000244609A (ja) * 1999-02-23 2000-09-08 Omron Corp 話者状況適応型音声対話装置及び発券装置
JP2004333543A (ja) * 2003-04-30 2004-11-25 Matsushita Electric Ind Co Ltd 音声対話システム及び音声対話方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0434499A (ja) * 1990-05-30 1992-02-05 Sharp Corp 発声法指示装置
JPH0451299A (ja) * 1990-06-20 1992-02-19 Hitachi Ltd 音声認識制御装置
JPH04167020A (ja) * 1990-10-30 1992-06-15 Ricoh Co Ltd 操作マニュアル作成装置
JPH0535383A (ja) * 1991-07-26 1993-02-12 Matsushita Electric Ind Co Ltd 操作ガイド装置
JPH1020884A (ja) * 1996-07-04 1998-01-23 Nec Corp 音声対話装置
JP2000194386A (ja) * 1998-12-24 2000-07-14 Omron Corp 音声認識応答装置及び方法
JP2000244609A (ja) * 1999-02-23 2000-09-08 Omron Corp 話者状況適応型音声対話装置及び発券装置
JP2004333543A (ja) * 2003-04-30 2004-11-25 Matsushita Electric Ind Co Ltd 音声対話システム及び音声対話方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013038440A1 (ja) * 2011-09-13 2013-03-21 三菱電機株式会社 ナビゲーション装置
CN103842773A (zh) * 2011-09-13 2014-06-04 三菱电机株式会社 导航装置
JPWO2013038440A1 (ja) * 2011-09-13 2015-03-23 三菱電機株式会社 ナビゲーション装置および方法
US9514737B2 (en) 2011-09-13 2016-12-06 Mitsubishi Electric Corporation Navigation apparatus
WO2020004213A1 (ja) * 2018-06-29 2020-01-02 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JPWO2020004213A1 (ja) * 2018-06-29 2021-07-08 ソニーグループ株式会社 情報処理装置、情報処理方法、およびプログラム
JP7459791B2 (ja) 2018-06-29 2024-04-02 ソニーグループ株式会社 情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
JP3627006B2 (ja) 音声を転写するための方法及び装置
EP1941344B1 (en) Combined speech and alternate input modality to a mobile device
KR101971513B1 (ko) 전자 장치 및 이의 음성 인식 오류 수정 방법
US6321196B1 (en) Phonetic spelling for speech recognition
US20060190255A1 (en) Speech recognition method
JP5756555B1 (ja) 発話評価装置、発話評価方法及びプログラム
US20060293889A1 (en) Error correction for speech recognition systems
JP2005331882A (ja) 音声認識装置、音声認識方法、および音声認識プログラム
WO2014199803A1 (en) System and methods for recognizing speech
KR20060037228A (ko) 음성인식을 위한 방법, 시스템 및 프로그램
JP2006351028A (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
US20110276329A1 (en) Speech dialogue apparatus, dialogue control method, and dialogue control program
JP2004061576A (ja) 音声制御装置
JP2011002656A (ja) 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム
JPWO2007069372A1 (ja) 音声認識装置
JP2017167247A (ja) 誤認識訂正方法、誤認識訂正装置及び誤認識訂正プログラム
KR102498172B1 (ko) 단말기의 음성인식 기능과 tts 기능을 이용한 상호 음성전달에 의한 대화형 외국어 학습방법
JP2006189730A (ja) 音声対話方法および音声対話装置
JP2006208486A (ja) 音声入力装置
JP2007163895A (ja) 音声認識装置
KR20210135151A (ko) 단말기의 음성인식 기능과 tts 기능을 이용한 상호 음성전달에 의한 대화 형 외국어 학습방법
KR20130128172A (ko) 장애인을 위한 이동통신 단말기 및 문자생성방법
KR20200086611A (ko) 단말기의 음성인식 기능과 tts 기능을 이용한 상호 음성전달에 의한 대화형 외국어 학습방법
JP2004333703A (ja) 音声認識システムおよび音声認識の訂正・学習方法
JP2008243076A (ja) 翻訳装置、方法及びプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071003

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080110

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110208