JP4628803B2 - 音声認識型機器制御装置 - Google Patents

音声認識型機器制御装置 Download PDF

Info

Publication number
JP4628803B2
JP4628803B2 JP2005016960A JP2005016960A JP4628803B2 JP 4628803 B2 JP4628803 B2 JP 4628803B2 JP 2005016960 A JP2005016960 A JP 2005016960A JP 2005016960 A JP2005016960 A JP 2005016960A JP 4628803 B2 JP4628803 B2 JP 4628803B2
Authority
JP
Japan
Prior art keywords
control
control operation
information
voice
voice input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005016960A
Other languages
English (en)
Other versions
JP2006208461A (ja
Inventor
久幸 長島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2005016960A priority Critical patent/JP4628803B2/ja
Publication of JP2006208461A publication Critical patent/JP2006208461A/ja
Application granted granted Critical
Publication of JP4628803B2 publication Critical patent/JP4628803B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、音声認識型機器制御装置に関するものである。
従来、例えば入力音声信号に対する認識結果の履歴を記憶し、記憶した履歴に基づき複数の各認識結果の使用頻度を検知し、検知した使用頻度を参照することで音声認識処理の認識精度を向上させる音声認識装置(例えば、特許文献1参照)が知られている。
特開2003−108189号公報
ところで、上記従来技術に係る音声認識装置においては、単に、入力音声信号に対する認識精度を向上させるだけであるから、例えば入力音声信号に対する認識結果に応じて適宜の制御動作を実行する際において、入力音声自体が曖昧な意味内容を有する場合には、この入力音声を構成する文字列を精度良く認識したとしても、操作者が意図する意味内容を精度良く把握することはできず、適切な制御動作を実行することができない虞がある。
本発明は上記事情に鑑みてなされたもので、音声入力の意味内容が曖昧であっても、音声入力に応じた適切な制御動作を実行することが可能な音声認識型機器制御装置を提供することを目的とする。
上記課題を解決して係る目的を達成するために、請求項1に記載の本発明の音声認識型機器制御装置は、音声を入力する音声入力手段(例えば、実施の形態での音声入力装置11)と、前記音声入力手段により入力された音声の意味内容を認識する音声認識手段(例えば、実施の形態での音声認識部21、解析部22)と、前記音声認識手段により認識された前記音声の意味内容に対応する制御機器の制御動作として、複数の異なる選択候補が存在する場合に、直近又は過去所定回数以内に実行された制御動作を抽出する抽出手段と、前記抽出手段により抽出された前記制御動作と各前記選択候補との間の遷移確率を、該遷移確率を記憶している記憶手段(例えば、実施の形態での関連情報記憶部27)から検索して、最も高い遷移確率に対応付けられた前記選択候補を実行対象として設定する制御動作設定手段(例えば、実施の形態での制御動作判定部26)と、前記制御動作設定手段により設定された前記実行対象に応じて前記制御機器を制御する制御手段(例えば、実施の形態での機器制御部30)と前記実行対象の実行取消しを示すキャンセル入力が無い場合に前記記憶手段に記憶されている前記実行対象に対応する前記遷移確率を増大させ、前記実行対象の実行取消しを示すキャンセル入力が有る場合に前記記憶手段に記憶されている前記実行対象に対応する前記遷移確率を減少させる変更手段とを備えることを特徴としている。
上記構成の音声認識型機器制御装置によれば、予め記憶手段には、複数の機器の制御動作に対する情報として、順次実行される機器の制御動作同士間の遷移確率が記憶されている。そして、例えば入力された音声の意味内容自体が曖昧であって、音声認識手段による認識結果に対して制御機器の制御動作として複数の選択候補が存在する場合等において、先ず、直近又は過去所定回数以内に実行された制御動作を抽出する。そして、制御動作設定手段は、抽出手段により抽出された制御動作と各選択候補との間の遷移確率を、該遷移確率を記憶している記憶手段から検索して、最も高い遷移確率に対応付けられた選択候補を実行対象として設定する。
これにより、音声入力の意味内容が曖昧であっても、適切な制御動作を設定することができる。
上記構成の音声認識型機器制御装置によれば、複数の異なる選択候補に対する遷移確率を記憶しておくことで、多様な制御内容に対応しつつ、音声認識手段による認識結果に応じた適切な制御動作を設定することができる。
以上説明したように、本発明の音声認識型機器制御装置によれば、音声入力の意味内容が曖昧であっても、適切な制御動作を設定することができる。
さらに、複数の異なる選択候補に対する遷移確率を記憶しておくことで、多様な制御内容に対応しつつ、音声認識手段による認識結果に応じた適切な制御動作を設定することができる
以下、本発明の実施形態に係る音声認識型機器制御装置について添付図面を参照しながら説明する。
本実施の形態による音声認識型機器制御装置10は、例えば図1に示すように、車両に搭載され、音声入力装置11と、出力装置12と、電子制御ユニット(ECU)13と、制御機器14とを備えて構成され、例えばマイク等を具備する音声入力装置11に操作者から入力される音声入力に応じて、例えばスピーカやディスプレイ等の出力装置12から適宜の応答を出力すると共に、例えばナビゲーション装置、空調装置、音響装置、放送受像装置、通信装置等の車両に搭載された各種の制御機器14の動作を制御する。
電子制御ユニット(ECU)13は、例えば音声認識部21と、解析部22と、対応情報記憶部23と、対話制御部24と、対話データ記憶部25と、制御動作判定部26と、関連情報記憶部27と、操作履歴記憶部28と、機器操作検知部29と、機器制御部30とを備えて構成されている。
音声認識部21は、音声入力装置11を介して操作者から入力される音声入力に対して、予め記憶している語彙データに基づき音声認識処理を行い、音声入力に対応する文字データである認識言語を生成し、この認識言語を解析部22へ出力する。
解析部22は、音声認識部21にて生成された認識言語を解析し、認識言語の意味内容を把握すると共に、この解析結果を対話制御部24へ出力する。例えば、解析部22は、制御機器14の制御動作に係る動作情報を認識言語から抽出し、予め対応情報記憶部23に格納された対応情報(例えば、制御機器14の制御動作と、解析部22にて認識言語から抽出される動作情報との対応関係に係る情報)に基づき、認識言語の意味内容に応じた制御機器14の制御動作として複数の異なる選択候補が存在するか否かを判定し、この判定結果を対話制御部24へ出力する。
対話制御部24は、解析部22での解析結果、例えば認識言語から抽出された制御機器14の制御動作に係る動作情報および認識言語の意味内容に応じた制御機器14の制御動作として複数の異なる選択候補が存在するか否かの判定結果を制御動作判定部26へ出力すると共に、制御動作判定部26での判定結果を取得する。そして、予め対話データ記憶部25に格納された文字データや音声データ等の複数の対話データから、解析部22にて把握された意味内容に応じた適宜の対話データあるいは制御動作判定部26での判定結果に応じた適宜の対話データを検索し、出力装置12へ出力する。
制御動作判定部26は、対話制御部24から入力された解析結果、つまり認識言語の意味内容に応じた制御機器14の制御動作として複数の異なる選択候補が存在するか否かの判定結果に応じて、この判定結果が「NO」の場合、つまり解析結果に対して単一の制御動作のみが存在する場合には、この制御動作を制御機器14に実行させるための指令信号を機器制御部30へ出力する。
一方、この判定結果が「YES」の場合、つまり解析結果に対して複数の制御動作が存在する場合には、先ず、これらの複数の制御動作のうちから、予め関連情報記憶部27に格納された関連情報(例えば、複数の各制御機器14の制御動作同士間の関連度の情報)および操作履歴記憶部28に格納された操作履歴の情報(例えば、過去に操作者の音声入力あるいは直接操作により操作された制御機器14の制御動作の履歴情報または過去に制御動作判定部26により選択された制御機器14の制御動作の履歴情報)に基づき、直近の過去に操作された制御機器14の制御動作(前操作)に関連する制御動作を抽出する。そして、抽出した制御動作のうち、前操作に対して最も関連度が高い制御動作を選択し、この制御動作を制御機器14に実行させるための指令信号を機器制御部30へ出力する。
そして、機器制御部30は、制御動作判定部26から入力される指令信号に応じて制御機器14を制御する。
なお、関連情報記憶部27には、複数の各制御機器14の制御動作同士間の関連度の情報が、関連情報として格納されている。予め関連情報記憶部27に格納される関連度の情報は、例えば時系列上で各実行タイミングが隣り合う制御動作同士間の関連度であって、例えば統計的なデータや各制御機器14のインターフェース等に応じて設定され、適宜の単一の制御機器14の制御動作毎に対して複数の制御機器14の制御動作の関連度が設定されている場合には、関連度の総和が所定値(例えば、1等)に等しくなるように設定されている。
また、操作履歴記憶部28には、機器操作検知部29にて検知された操作者の操作に応じた制御機器14の制御動作の実行に係る情報、および、制御動作判定部26により選択された制御機器14の制御動作に係る情報が、時系列データとして格納されている。そして、この操作履歴記憶部28に格納されている情報は、例えば車両始動時等において初期化され、前操作無しの状態に設定される。
本実施の形態による音声認識型機器制御装置10は上記構成を備えており、次に、この音声認識型機器制御装置10の動作について添付図面を参照しながら説明する。
先ず、例えば図2に示すステップS01においては、音声入力装置11を介して操作者から入力された音声入力を取得する。
次に、ステップS02においては、取得した音声入力に対して音声認識処理を実行し、音声入力に対応する文字データである認識言語を生成する。
次に、ステップS03においては、生成された認識言語を解析し、認識言語の意味内容を把握するために必要となる情報、例えば制御機器14の制御動作に係る動作情報を抽出する。
次に、ステップS04においては、例えば認識言語の解析結果に応じた対話データを出力装置12から出力すると共に、解析結果に応じた対応情報(例えば、制御機器14の制御動作と、認識言語から抽出される動作情報との対応関係に係る情報)を対応情報記憶部23内にて検索する。
そして、ステップS05においては、対応情報が存在するか否かを判定する。
この判定結果が「NO」の場合、つまり取得した音声入力の意味内容に対応した制御機器14の制御動作の情報が存在しない場合には、例えば音声入力の再入力を促す対話データを出力装置12から出力して、一連の処理を終了する。
一方、この判定結果が「YES」の場合、つまり取得した音声入力の意味内容に対応した制御機器14の制御動作の情報が存在する場合には、ステップS06に進む。
そして、ステップS06においては、取得した音声入力の意味内容に対応した制御機器14の制御動作の情報として複数の異なる選択候補が存在するか否かを判定する。
ステップS06の判定結果が「NO」の場合、つまり選択候補として単一の制御動作の情報のみが存在する場合には、後述するステップS09に進む。
一方、ステップS06の判定結果が「YES」の場合、つまり選択候補として複数の制御動作の情報が存在する場合には、ステップS07に進む。例えば音声入力が「もっと上げて」であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報としては、空調装置により車室内温度を上昇させる制御動作と、音響装置において音量を増大させる制御動作と、ナビゲーション装置の表示画面上でのスクロール動作に対する制御動作との、複数の異なる選択候補が存在する。
そして、ステップS07においては、制御機器14の操作履歴の情報(例えば、過去に操作者により操作された制御機器14の制御動作の履歴情報)を操作履歴記憶部28から取得する。
そして、ステップS08においては、予め関連情報記憶部27に格納された関連情報(例えば、複数の各制御機器14の制御動作同士間の関連度の情報)から、選択候補とされる複数の制御動作の情報に係る関連情報を検索し、検索して得た関連情報および操作履歴の情報に基づき、複数の制御動作の情報のうちから、直近の過去に操作者により操作された制御機器14の制御動作に関連する制御動作を抽出する。そして、抽出した制御動作のうち、直近の過去に操作者により操作された制御機器14の制御動作に対して最も関連度が高い制御動作を選択する。そして、選択した制御動作に応じた対話データを出力装置12から出力する。
そして、ステップS09においては、後述する関連度変更処理を実行する。
そして、ステップS10においては、上述したステップS08にて選択した制御動作の実行取消を意図する音声入力(キャンセル入力)が入力されたか否かを判定する。
この判定結果が「YES」の場合には、例えば音声入力の再入力を促す対話データを出力装置12から出力して、一連の処理を終了する。
一方、この判定結果が「NO」の場合には、ステップS11に進む。
そして、ステップS11においては、選択した制御動作の情報に応じて制御機器14を制御し、一連の処理を終了する。
以下に、上述したステップS09における関連度変更処理について説明する。
先ず、例えば図3に示すステップS21においては、前操作からの経過時間が所定時間(例えば、30秒等)以内か否かを判定する。
この判定結果が「NO」の場合には、一連の処理を終了する。
一方、この判定結果が「YES」の場合には、ステップS22に進む。
なお、このステップS21では、例えば車両始動時等において前操作無しの状態である場合には、ステップS22に進む。
そして、ステップS22においては、取得した音声入力の意味内容に対応した単一の制御動作あるいは上述したステップS08にて選択した制御動作と、前操作との関連度を増大側に変更する。
次に、ステップS23においては、取得した音声入力の意味内容に対応した単一の制御動作、あるいは、上述したステップS08にて選択した制御動作の実行取消を意図する音声入力(キャンセル入力)が入力されたか否かを判定する。
この判定結果が「NO」の場合には、一連の処理を終了する。
一方、この判定結果が「YES」の場合には、ステップS24に進む。
そして、ステップS24においては、関連度の変更処理を取り消し、関連度を変更以前の値に戻し、一連の処理を終了する。
関連情報記憶部27に格納されている関連情報には、複数の各制御機器14の制御動作として、例えば図4および図5に示すように、ナビゲーション装置に対する制御動作と、携帯端末等の通信装置や放送受信装置を介した交通情報の取得に係る制御動作と、空調装置に対する制御動作と、音響装置に対する制御動作と、携帯端末等の通信装置や放送受信装置を介した天候情報の取得に係る制御動作とが設定されている。そして、各制御動作同士間には、連続して実行される場合に対する双方向あるいは所定の一方向の遷移確率が各制御動作同士間の関連度として設定されている。なお、車両始動時等において、操作履歴記憶部28に格納されている情報が初期化され、前操作無しの状態に設定されることに対応して、前操作無しの状態から連続して実行される各制御動作に対して一方向の遷移確率が設定されている。
例えば図4に示すように、前操作無しの状態から連続して実行される各制御動作として、ナビゲーション装置に対する制御動作には関連度a1(例えば、a1=0.5)が設定され、交通情報の取得に係る制御動作には関連度a2(例えば、a2=0.2)が設定され、空調装置に対する制御動作には関連度a3(例えば、a3=0.15)が設定され、音響装置に対する制御動作には関連度a4(例えば、a4=0.1)が設定され、天候情報の取得に係る制御動作には関連度a5(例えば、a5=0.05)が設定されている。
例えば車両始動時に運転者が車両に乗車した後の最初の音声入力が、
(A1)「東京都千代田区麹町」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報としては、例えば、ナビゲーション装置の経路設定に係る制御動作と、天候情報の取得に係る制御動作との複数の異なる選択候補が対応情報記憶部23の対応情報に基づき検索される。そして、選択候補とされる複数の制御動作の情報に係る関連情報が関連情報記憶部27に格納された関連情報から検索される。
ここで、前操作無しの状態に対して、ナビゲーション装置に対する制御動作の関連度a1(例えば、a1=0.5)は、天候情報の取得に係る制御動作の関連度a5(例えば、a5=0.05)よりも大きい値を有することが、関連情報記憶部27の関連情報に基づき判定され、ナビゲーション装置の経路設定に係る制御動作の実行が選択される。
そして、この音声入力に対する応答の対話データが対話データ記憶部25から検索され、例えば、
(A2)「東京都千代田区麹町を目的地に設定しますか?」
が出力装置12から出力される。
そして、この出力に対して、制御動作判定部26により選択された制御動作の実行取消を意図する音声入力(キャンセル入力)が操作者から入力されず、例えば、音声入力が、出力装置12から出力された対話データの問い合わせに対する応答として、
(A3)「OK」
であった場合、関連情報記憶部27の関連情報を変更する処理、つまり選択した制御動作(例えば図4に示すナビゲーション装置に対する制御動作)と前操作(例えば図4に示す前操作無しの状態)との関連度(例えば図4に示す関連度a1=0.5)を増大側に変更する処理が実行される。
これにより、例えば下記表1に示すように、この時点での関連情報において、前操作が前操作無しの状態である場合の次操作であるナビゲーション装置に対する制御動作の関連度a1は所定倍率r(例えば、r=1.05)だけ増大し、これに伴い、他の制御動作に対する関連度a2,…,a5は減少する。
Figure 0004628803
そして、ナビゲーション装置の経路探索に関する制御動作を問い合わせる対話データが対話データ記憶部25から検索され、例えば、
(A4)「高速道路は使いますか?」
が出力装置12から出力される。
この出力に対して、制御動作判定部26により選択された制御動作、つまりナビゲーション装置の経路探索に関する制御動作の実行取消を意図する音声入力(キャンセル入力)が操作者から入力されず、例えば、音声入力が、
(A5)「いや、使わない」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報としては、ナビゲーション装置の経路設定に係る制御動作が、単一の選択候補であると対応情報記憶部23の対応情報に基づき判定される。
そして、ナビゲーション装置の経路探索の実行を確認する対話データが対話データ記憶部25から検索され、例えば、
(A6)「東京都千代田区麹町まで最短ルートをご案内します」
が出力装置12から出力される。
そして、関連情報記憶部27の関連情報を変更する処理、つまり選択した制御動作(例えば図5に示すナビゲーション装置に対する制御動作)と前操作(例えば図5に示すナビゲーション装置に対する制御動作)との関連度(例えば図5に示す関連度b1=0.5)を増大側に変更する処理が実行される。
なお、例えば図5に示すように、ナビゲーション装置に対する適宜の制御動作から連続して実行される各制御動作として、ナビゲーション装置に対する他の制御動作には関連度b1(例えば、b1=0.6)が設定され、交通情報の取得に係る制御動作には関連度b2(例えば、b2=0.22)が設定され、空調装置に対する制御動作には関連度b3(例えば、b3=0.06)が設定され、音響装置に対する制御動作には関連度b4(例えば、b4=0.06)が設定され、天候情報の取得に係る制御動作には関連度b5(例えば、b5=0.06)が設定されている。
これにより、例えば下記表2に示すように、この時点での関連情報において、前操作がナビゲーション装置に対する制御動作である場合の次操作であるナビゲーション装置に対する制御動作の関連度b1は所定倍率r(例えば、r=1.05)だけ増大し、これに伴い、他の制御動作に対する関連度b2,…,b5は減少する。
Figure 0004628803
次に、例えば、音声入力が、
(A7)「東京は今何度ぐらい?」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報としては、天候情報の取得に係る制御動作が、単一の選択候補であると対応情報記憶部23の対応情報に基づき判定される。
そして、携帯端末等の通信装置や放送受信装置を介して天候情報が取得され、天候情報を報知する対話データが対話データ記憶部25から検索され、例えば、
(A8)「現在の気温は18度です」
が出力装置12から出力される。
そして、関連情報記憶部27の関連情報を変更する処理、つまり選択した制御動作(例えば図5に示す天候情報の取得に係る制御動作)と前操作(例えば図5に示すナビゲーション装置に対する制御動作)との関連度(例えば図5に示す関連度b3=0.06)を増大側に変更する処理が実行される。
これにより、例えば下記表3に示すように、この時点での関連情報において、前操作がナビゲーション装置に対する制御動作である場合の次操作である天候情報の取得に係る制御動作の関連度b5は所定倍率r(例えば、r=1.05)だけ増大し、これに伴い、他の制御動作に対する関連度b1,…,b4は減少する。
Figure 0004628803
また、例えば車両始動時に運転者が車両に乗車した後の最初の音声入力が、
(B1)「東京駅まで案内して」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報としては、ナビゲーション装置の経路設定に係る制御動作が、単一の選択候補であると対応情報記憶部23の対応情報に基づき判定される。
そして、ナビゲーション装置の経路探索の実行を確認する対話データが対話データ記憶部25から検索され、例えば、
(B2)「はい、東京駅までご案内します」
が出力装置12から出力される。
そして、関連情報記憶部27の関連情報を変更する処理、つまり選択した制御動作(例えば図4に示すナビゲーション装置に対する制御動作)と前操作(例えば図4に示す前操作無しの状態)との関連度(例えば図4に示す関連度a1=0.5)を増大側に変更する処理が実行される。
これにより、例えば上記表1に示すように、この時点での関連情報において、前操作が前操作無しの状態である場合の次操作であるナビゲーション装置に対する制御動作の関連度a1は所定倍率r(例えば、r=1.05)だけ増大し、これに伴い、他の制御動作に対する関連度a2,…,a5は減少する。
次に、例えば、音声入力が、
(B3)「ここ暑い?」
であった場合、この音声入力の意味内容に対応した制御機器14の制御動作の情報としては、例えば、空調装置に対する制御動作と、天候情報の取得に係る制御動作との複数の異なる選択候補が対応情報記憶部23の対応情報に基づき検索される。そして、選択候補とされる複数の制御動作の情報に係る関連情報が関連情報記憶部27に格納された関連情報から検索される。
ここで、例えば図5に示すように、前操作がナビゲーション装置に対する制御動作である場合に対して、空調装置に対する制御動作の関連度b3(例えば、b3=0.06)と、天候情報の取得に係る制御動作の関連度b5(例えば、b5=0.06)とは、同等の値を有することが、関連情報記憶部27の関連情報に基づき判定され、例えば空調装置に対する制御動作の実行が選択される。
そして、この音声入力に対する応答の対話データが対話データ記憶部25から検索され、例えば、
(B4)「設定温度を下げます」
が出力装置12から出力される。
そして、関連情報記憶部27の関連情報を変更する処理、つまり選択した制御動作(例えば図5に示す空調装置に対する制御動作)と前操作(例えば図5に示すナビゲーション装置に対する制御動作)との関連度(例えば図5に示す関連度b3=0.06)を増大側に変更する処理が実行される。
これにより、例えば下記表4に示すように、この時点での関連情報において、前操作がナビゲーション装置に対する制御動作である場合の次操作である空調装置に対する制御動作の関連度b3は所定倍率r(例えば、r=1.05)だけ増大し、これに伴い、他の制御動作に対する関連度a1,a2,a4,a5は減少する。
Figure 0004628803
そして、出力装置12から出力された応答に対して、制御動作判定部26により選択された制御動作の実行取消を意図する音声入力(キャンセル入力)として、例えば、
(B5)「ちがうよ。東京は暑い?」
が操作者から入力された場合、既に実行された関連情報記憶部27の関連情報を変更した処理、つまり選択した制御動作(例えば図5に示す空調装置に対する制御動作)と前操作(例えば図5に示すナビゲーション装置に対する制御動作)との関連度(例えば図5に示す関連度b3=0.06)を増大側に変更した処理を取り消す。
これにより、例えば下記表5に示すように、この時点での関連情報において、前操作がナビゲーション装置に対する制御動作である場合の次操作である各制御動作の関連度b1,…,b5は、前回の変更処理の実行以前の値に戻される。
Figure 0004628803
そして、操作者の音声入力の意味内容に対応した制御機器14の制御動作の情報としては、天候情報の取得に係る制御動作が、単一の選択候補であると対応情報記憶部23の対応情報に基づき判定される。
そして、携帯端末等の通信装置や放送受信装置を介して天候情報が取得され、天候情報を報知する対話データが対話データ記憶部25から検索され、例えば、
(B6)「失礼しました。東京の予想気温は23度です」
が出力装置12から出力される。
上述したように、本実施の形態による音声認識型機器制御装置10によれば、予め、制御機器14の制御動作と解析部22にて認識言語から抽出される動作情報との対応関係に係る情報を対応情報として対応情報記憶部23に格納しておき、さらに、複数の各制御機器14の制御動作同士間の関連度の情報を関連情報として関連情報記憶部27に格納しておき、音声入力に対する解析結果と、この解析結果に応じて関連情報記憶部27から検索した関連情報とに基づき、制御機器14を制御することから、例えば車両の走行状態や運転操作の負荷状態あるいは音声認識型機器制御装置10の操作に対する習熟度等に起因して操作者による音声入力の意味内容が曖昧となる場合であっても、操作者の意志に応じた適切な制御機器14の制御動作を選択することができる。すなわち、単に、音声入力に対する解析結果や操作者による制御機器14の操作履歴等を参照しただけでは、複数の選択候補から単一の制御動作を特定することが困難な場合であっても、複数の各制御機器14の制御動作同士間の関連度の情報に応じて制御動作を選択することで、操作者の意志に反した選択が行われてしまうことを抑制することができる。
しかも、選択した制御動作に対する操作者の応答に応じて関連情報記憶部27に格納されている関連情報を更新することから、音声入力の解析結果に対して制御機器14の制御動作として複数の異なる選択候補が存在する場合であっても、制御動作の選択に操作者の意志を的確に反映させることができる。
なお、上述した実施の形態においては、解析部22での音声入力の解析結果に対して制御機器14の制御動作として複数の異なる選択候補が存在する場合、直近の過去に操作者により操作された制御機器14の制御動作(前操作)に関連する制御動作を抽出するとしたが、これに限定されず、例えば所定回数(例えば、2回〜3回等)に亘る過去の操作に関連する制御動作を抽出してもよい。この場合には、制御動作の選択に対する信頼度を向上させることができる。
なお、上述した実施の形態においては、ステップS21からステップS24に示すように、取得した音声入力の意味内容に対応した単一の制御動作が対応情報に基づき検索された場合、あるいは、操作者による過去の操作履歴および対応情報および関連度の情報に基づき複数の選択候補から単一の制御動作が選択された場合に、先ず、選択された制御動作と前操作との関連度を増大側に変更し、そして、キャンセル入力があった場合に、関連度の変更処理を取り消すとしたが、これに限定されず、例えば図6に示す第1変形例のように、キャンセル入力の有無に応じて関連度の変更処理を実行してもよい。
すなわち、この第1変形例では、先ず、図6に示すステップS21において、前操作からの経過時間が所定時間以内か否かを判定する。
この判定結果が「NO」の場合には、一連の処理を終了する。
一方、この判定結果が「YES」の場合には、ステップS31に進む。
次に、ステップS31においては、取得した音声入力の意味内容に対応した単一の制御動作、あるいは、上述したステップS08にて選択した制御動作の実行取消を意図する音声入力(キャンセル入力)が入力されたか否かを判定する。
この判定結果が「YES」の場合には、一連の処理を終了する。
一方、この判定結果が「NO」の場合には、ステップS32に進む。
そして、ステップS32においては、取得した音声入力の意味内容に対応した単一の制御動作あるいは上述したステップS08にて選択した制御動作と、前操作との関連度を増大側に変更し、一連の処理を終了する。
また、例えば図7に示す第2変形例のように、キャンセル入力がある場合に関連度を減少側に変更してもよい。
すなわち、この第2変形例では、先ず、図7に示すステップS21において、前操作からの経過時間が所定時間以内か否かを判定する。
この判定結果が「NO」の場合には、一連の処理を終了する。
一方、この判定結果が「YES」の場合には、ステップS31に進む。
次に、ステップS31においては、取得した音声入力の意味内容に対応した単一の制御動作、あるいは、上述したステップS08にて選択した制御動作の実行取消を意図する音声入力(キャンセル入力)が入力されたか否かを判定する。
この判定結果が「NO」の場合には、ステップS32に進む。
一方、この判定結果が「YES」の場合には、ステップS33に進む。
そして、ステップS32においては、取得した音声入力の意味内容に対応した単一の制御動作あるいは上述したステップS08にて選択した制御動作と、前操作との関連度を増大側に変更し、一連の処理を終了する。
また、ステップS33においては、取得した音声入力の意味内容に対応した単一の制御動作あるいは上述したステップS08にて選択した制御動作と、前操作との関連度を減少側に変更し、一連の処理を終了する。
また、上述した実施の形態においては、ステップS06からステップS09に示すように、取得した音声入力の意味内容に対応した単一の制御動作が対応情報に基づき検索された場合に関連度の変更処理を実行するとしたが、これに限定されず、例えば図8に示す第3変形例のように、単一の制御動作のみが検索された場合には、関連度の変更処理を実行しないように設定してもよい。
すなわち、この第3変形例では、ステップS06において、取得した音声入力の意味内容に対応した制御機器14の制御動作の情報として複数の異なる選択候補が存在するか否かを判定する。
そして、この判定結果が「YES」の場合、つまり選択候補として複数の制御動作の情報が存在する場合には、ステップS07に進む。
一方、この判定結果が「NO」の場合、つまり選択候補として単一の制御動作の情報のみが存在する場合には、ステップS10に進む。
本発明の実施形態に係る音声認識型機器制御装置の構成図である。 図1に示す音声認識型機器制御装置の動作を示すフローチャートである。 図2に示す関連度変更処理を示すフローチャートである。 前操作無しの状態から連続して実行される各制御動作の関連度の一例を示す図である。 ナビゲーション装置に対する適宜の制御動作から連続して実行される各制御動作の関連度の一例を示す図である。 本発明の実施形態の第1変形例に係る関連度変更処理を示すフローチャートである。 本発明の実施形態の第2変形例に係る関連度変更処理を示すフローチャートである。 本発明の実施形態の第3変形例に係る音声認識型機器制御装置の動作を示すフローチャートである。
符号の説明
10 音声認識型機器制御装置
11 音声入力装置(音声入力手段)
14 制御機器
21 音声認識部(音声認識部)
22 解析部(音声認識部)
23 対応情報記憶部
24 対話制御部
25 対話データ記憶部
26 制御動作判定部(動作状態取得手段、制御動作設定手段、関連度変更手段)
27 関連情報記憶部(関連度記憶手段)
28 操作履歴記憶部
29 機器操作検知部(動作状態取得手段)
30 機器制御部(制御手段)

Claims (1)

  1. 音声を入力する音声入力手段と、
    前記音声入力手段により入力された音声の意味内容を認識する音声認識手段と、
    前記音声認識手段により認識された前記音声の意味内容に対応する制御機器の制御動作として、複数の異なる選択候補が存在する場合に、直近又は過去所定回数以内に実行された制御動作を抽出する抽出手段と、
    前記抽出手段により抽出された前記制御動作と各前記選択候補との間の遷移確率を、該遷移確率を記憶している記憶手段から検索して、最も高い遷移確率に対応付けられた前記選択候補を実行対象として設定する制御動作設定手段と、
    前記制御動作設定手段により設定された前記実行対象に応じて前記制御機器を制御する制御手段と、
    前記実行対象の実行取消しを示すキャンセル入力が無い場合に前記記憶手段に記憶されている前記実行対象に対応する前記遷移確率を増大させ、前記実行対象の実行取消しを示すキャンセル入力が有る場合に前記記憶手段に記憶されている前記実行対象に対応する前記遷移確率を減少させる変更手段と
    を備えることを特徴とする音声認識型機器制御装置。
JP2005016960A 2005-01-25 2005-01-25 音声認識型機器制御装置 Expired - Fee Related JP4628803B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005016960A JP4628803B2 (ja) 2005-01-25 2005-01-25 音声認識型機器制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005016960A JP4628803B2 (ja) 2005-01-25 2005-01-25 音声認識型機器制御装置

Publications (2)

Publication Number Publication Date
JP2006208461A JP2006208461A (ja) 2006-08-10
JP4628803B2 true JP4628803B2 (ja) 2011-02-09

Family

ID=36965428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005016960A Expired - Fee Related JP4628803B2 (ja) 2005-01-25 2005-01-25 音声認識型機器制御装置

Country Status (1)

Country Link
JP (1) JP4628803B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8818816B2 (en) 2008-07-30 2014-08-26 Mitsubishi Electric Corporation Voice recognition device
JP5617083B2 (ja) * 2009-09-03 2014-11-05 本田技研工業株式会社 コマンド認識装置、コマンド認識方法、及びコマンド認識ロボット
CN104713194A (zh) * 2013-12-17 2015-06-17 安波 空调语音控制系统
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
CN112786046B (zh) * 2021-01-15 2022-05-17 宁波方太厨具有限公司 多设备语音控制方法、系统、设备及可读存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535291A (ja) * 1991-05-20 1993-02-12 Ricoh Co Ltd 音声認識装置及び音声認識を利用した制御機器
JPH0675729A (ja) * 1992-08-27 1994-03-18 Omron Corp コマンド入力装置
JPH0757336A (ja) * 1993-08-12 1995-03-03 Sony Corp 音声入力操作装置
JPH07306847A (ja) * 1994-05-12 1995-11-21 Sharp Corp コンピュータオペレーション支援装置
JPH09160704A (ja) * 1995-12-14 1997-06-20 Fuji Facom Corp コマンド補完装置
JP2001296881A (ja) * 2000-04-14 2001-10-26 Sony Corp 情報処理装置および方法、並びに記録媒体
JP2002258892A (ja) * 2001-03-05 2002-09-11 Alpine Electronics Inc 音声認識機器操作装置
JP2003076398A (ja) * 2001-09-04 2003-03-14 Sony Corp ロボット装置およびロボット制御方法、記録媒体、並びにプログラム
JP2003084791A (ja) * 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム
JP2003084794A (ja) * 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535291A (ja) * 1991-05-20 1993-02-12 Ricoh Co Ltd 音声認識装置及び音声認識を利用した制御機器
JPH0675729A (ja) * 1992-08-27 1994-03-18 Omron Corp コマンド入力装置
JPH0757336A (ja) * 1993-08-12 1995-03-03 Sony Corp 音声入力操作装置
JPH07306847A (ja) * 1994-05-12 1995-11-21 Sharp Corp コンピュータオペレーション支援装置
JPH09160704A (ja) * 1995-12-14 1997-06-20 Fuji Facom Corp コマンド補完装置
JP2001296881A (ja) * 2000-04-14 2001-10-26 Sony Corp 情報処理装置および方法、並びに記録媒体
JP2002258892A (ja) * 2001-03-05 2002-09-11 Alpine Electronics Inc 音声認識機器操作装置
JP2003076398A (ja) * 2001-09-04 2003-03-14 Sony Corp ロボット装置およびロボット制御方法、記録媒体、並びにプログラム
JP2003084791A (ja) * 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム
JP2003084794A (ja) * 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム

Also Published As

Publication number Publication date
JP2006208461A (ja) 2006-08-10

Similar Documents

Publication Publication Date Title
US9558745B2 (en) Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
JP5334178B2 (ja) 音声認識装置およびデータ更新方法
CN105222797B (zh) 利用口授和部分匹配搜索的导航系统的系统和方法
US10733986B2 (en) Apparatus, method for voice recognition, and non-transitory computer-readable storage medium
US9601107B2 (en) Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus
JP2014142566A (ja) 音声認識システムおよび音声認識方法
JP4867622B2 (ja) 音声認識装置、および音声認識方法
JP4628803B2 (ja) 音声認識型機器制御装置
JP4634156B2 (ja) 音声対話方法および音声対話装置
JP2012088370A (ja) 音声認識システム、音声認識端末、およびセンター
JP5434731B2 (ja) 音声認識システム及び自動検索システム
JP5606951B2 (ja) 音声認識システムおよびこれを用いた検索システム
JP2009230068A (ja) 音声認識装置及びナビゲーションシステム
US11164578B2 (en) Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program
JP4056711B2 (ja) 音声認識装置
JP2019001428A (ja) 車載装置、音声操作システムおよび音声操作方法
JP2017151578A (ja) 言語設定システムおよび言語設定プログラム
JP4639990B2 (ja) 音声対話装置及び音声理解結果生成方法
WO2012174515A1 (en) Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
KR101945190B1 (ko) 음성인식 작동 시스템 및 방법
CN111798842B (zh) 对话系统和对话处理方法
JP4736962B2 (ja) キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置
KR100749088B1 (ko) 대화형 네비게이션 시스템 및 그 제어방법
JP4635743B2 (ja) 音声対話装置及び音声理解結果生成方法
CN112995270B (zh) 智能体系统、智能体系统的控制方法及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101102

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101110

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131119

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees