JP2017102320A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2017102320A
JP2017102320A JP2015236474A JP2015236474A JP2017102320A JP 2017102320 A JP2017102320 A JP 2017102320A JP 2015236474 A JP2015236474 A JP 2015236474A JP 2015236474 A JP2015236474 A JP 2015236474A JP 2017102320 A JP2017102320 A JP 2017102320A
Authority
JP
Japan
Prior art keywords
voice
address
recognition
user
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015236474A
Other languages
English (en)
Inventor
大和 鈴木
Yamato Suzuki
大和 鈴木
佐藤 義一
Giichi Sato
義一 佐藤
義久 根本
Yoshihisa Nemoto
義久 根本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2015236474A priority Critical patent/JP2017102320A/ja
Publication of JP2017102320A publication Critical patent/JP2017102320A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】住所を音声入力する際の発話回数を減らすとともに操作を簡略化することができる音声認識装置を提供すること。
【解決手段】車載装置1は、住所に対応する入力音声に対して音声認識処理を行うことにより、住所を構成する複数の単語のそれぞれに対応する第1候補を決定する住所(全体)音声認識部53と、決定された複数の単語のそれぞれに対応する複数の第1候補を利用者に向けて提示する認識結果提示部54と、認識結果提示の後に、誤認識があった単語に対応する入力音声に対して再度の音声認識処理を行うことにより、この単語に対応する第1候補を除く第2候補を決定する住所(部分)音声認識部56とを備えている。
【選択図】図1

Description

本発明は、利用者が発声した音声に基づいて住所を入力する音声認識装置に関する。
従来から、入力した音声に対して音声認識処理を行い、認識結果としての複数の候補音節を表示させ、利用者が所定の操作を行うことにより一の候補音節を選択するようにした音声認識装置が知られている(例えば、特許文献1参照。)。例えば、この音声認識装置を用いて米国の住所を、州−都市−通り−番号の順で入力する場合を考えると、最初に、利用者は「州」を音声で入力して、その音声認識結果としての複数の候補の中からいずれかを選択する。次に、利用者は「都市」を音声で入力して、その音声認識結果としての複数の候補の中からいずれかを選択する。次に、利用者は「通り」を音声で入力して、その音声認識結果としての複数の候補の中からいずれかを選択する。最後に、利用者は「番号」を音声で入力して、その音声認識結果としての複数の候補の中からいずれかを選択する。このようにして、住所全体を音声認識処理により決定することができる。
特開2008−164809号公報
ところで、上述した特許文献1の音声認識装置では、住所を構成する州、都市等のそれぞれについて複数の候補を表示し、その都度選択操作を行う必要があるため、利用者の発話回数が多くなるとともに、それぞれの候補を選択する操作の回数も多くなり、操作が煩雑であって操作性が悪いという問題があった。
本発明は、このような点に鑑みて創作されたものであり、その目的は、住所を音声入力する際の発話回数を減らすとともに操作を簡略化することができる音声認識装置を提供することにある。
上述した課題を解決するために、本発明の音声認識装置は、利用者によって入力された音声に対して音声認識処理を行って、複数の単語からなる住所の内容を決定する音声認識装置であって、利用者の発話による音声が入力される音声入力手段と、音声入力手段に入力された住所に対応する音声に対して音声認識処理を行うことにより、住所を構成する複数の単語のそれぞれに対応する第1候補を決定する第1の音声認識処理手段と、第1の音声認識処理手段によって決定された複数の単語のそれぞれに対応する複数の第1候補を利用者に向けて提示する認識結果提示手段と、認識結果提示手段による提示の後に、音声入力手段に入力されたいずれかの単語に対応する音声に対して音声認識処理を行うことにより、この単語に対応する第1候補を除く第2候補を決定する第2の音声認識処理手段とを備えている。
住所全体の音声を一括で音声入力し、住所を構成する複数の単語のそれぞれに対応する第1候補を得ることにより、各単語毎に音声認識の候補を表示して利用者にその中の一つを選択させる場合に比べて、発話回数や操作回数を減らすことができる。また、このようにして得られた住所全体に対応する一連の認識結果を利用者に提示し、その少なくとも一部が誤っている場合に、再度この認識結果が誤っている単語のみを対象に2度目の音声入力および音声認識処理を行うことにより、住所全体について正しい音声認識結果を得ることができる。しかも、住所を構成する全ての単語に対応する1回目の音声認識結果が全て誤りである可能性は低いため、一部の単語について2回目の音声入力および音声認識処理を行えばよく、住所全体に対する正しい音声認識結果を得るまでの発話回数を減らすとともに操作を簡略化することが可能となる。
また、上述した認識結果提示手段による提示の後に、利用者による認識結果修正指示を受け付ける修正指示入力手段をさらに備え、第2の音声認識処理手段は、修正指示入力手段によって認識結果修正指示が受け付けられた後に利用者によって発声された音声に対して音声認識処理を行い、認識結果提示手段は、第2の音声認識処理手段による音声認識処理が行われた場合には、第1および第2の音声認識処理手段によって決定された複数の単語のそれぞれに対応する第1候補あるいは第2候補を利用者に向けて提示することが望ましい。これにより、利用者は、誤認識が生じたことを伝えることができ、誤認識が生じた単語に対する再度の音声認識処理を確実に実施することが可能となる。
また、上述した修正指示入力手段によって認識結果修正指示を受け付けない状態が所定時間継続したときに、第1候補あるいは第1および第2候補が住所の内容として決定されることが望ましい。これにより、認識結果が正しい場合に、特別な操作を行うことなく、次の処理に移行することが可能となる。
また、上述した認識結果提示手段による提示は、音声認識処理によって得られた住所の内容を音声で読み上げることにより、あるいは、音声で読み上げるとともに音声認識処理によって得られた住所の内容を表示することにより行われることが望ましい。これにより、認識結果を利用者に確実に通知することが可能となる。
また、上述した第2の音声認識処理手段によって決定された第2候補が複数ある場合に、これら複数の第2候補を一覧形式で表示する修正候補表示手段と、修正候補表示手段によって一覧形式で表示された複数の第2候補の中から、利用者の指示に応じて一つを選択する修正候補選択手段とをさらに備えることが望ましい。これにより、誤認識が生じた単語に対する正しい認識結果を確実に得ることができる。
一実施形態の車載装置の構成を示す図である。 利用者が住所全体を発声して入力する動作手順を示す流れ図である。 音声入力した住所の内容を確定するまでの表示例を示す図である。 音声入力した住所の内容を確定するまでの表示例を示す図である。
以下、本発明の音声認識装置を適用した一実施形態の車載装置について、図面を参照しながら説明する。
図1は、一実施形態の車載装置1の構成を示す図である。図1に示すように、車載装置1は、ナビゲーション処理部10、音声入力処理部20、操作部40、発話スイッチ(SW)42、バックスイッチ(B−SW)44、入力制御部46、制御部50、表示処理部60、表示装置62、デジタル−アナログ変換器(D/A)64、スピーカ66、ハードディスク装置(HDD)70を備えている。
ナビゲーション処理部10は、ハードディスク装置70に記憶されている地図データ71を用いて車載装置1が搭載された車両の走行を案内するナビゲーション動作を行う。自車位置を検出するGPS装置12とともに用いられる。車両の走行を案内するナビゲーション動作には、地図表示の他に、経路探索処理部14によって行われる経路探索処理や、施設検索部16によって行われる周辺施設検索処理などが含まれる。なお、自車位置検出は、GPS12の他にジャイロセンサや車速センサ等の自律航法センサを組み合わせて用いるようにしてもよい。
音声入力処理部20は、マイクロホン22によって集音された利用者(話者)の音声の入力処理を行う。例えば、音声入力処理部20にはアナログ−デジタル変換器(A/D)が備わっており、マイクロホン22の出力信号がデジタルの音声データに変換される。
操作部40は、車載装置1に対する利用者による手動操作を受け付けるためのものであり、各種の操作キー、操作スイッチ、操作つまみ等が含まれる。また、表示装置62に各種の操作画面や入力画面が表示された時点で、これらの操作画面や入力画面の一部を利用者が指などで直接指し示すことにより、操作画面や入力画面の表示項目を選択することができるようになっており、このような操作画面や入力画面を用いた操作を可能とするために、指し示された指などの位置を検出するタッチパネルが操作部40の一部として備わっている。なお、タッチパネルを用いる代わりに、リモートコントロールユニット等を用いて操作画面や入力画面の一部を利用者の指示に応じて選択するようにしてもよい。発話スイッチ42は、利用者がマイクロホン22に向けて発声する際に利用者によって操作されて発話タイミングを指示するために用いられる。バックスイッチ44は、利用者が発声した住所の一部の単語に認識誤りがあったときに、認識誤りがあった一部の単語について音声認識修正指示をするために用いられる。入力制御部46は、操作部40、発話スイッチ42およびバックスイッチ44を監視しており、これらの操作内容を決定する。
制御部50は、車載装置1の全体を制御するとともに、利用者によって入力された音声に対して音声認識処理を行って複数の単語からなる住所の内容を決定する動作などを行う。この制御部50は、ROMやRAMなどに格納された動作プログラムをCPUによって実行することにより実現される。また、図1では、この制御部50とは別にナビゲーション処理部10を設けたが、その一部の機能を制御部50によって実現するようにしてもよい。制御部50の詳細については後述する。
表示処理部60は、各種の操作画面や入力画面、ナビゲーション処理部10によって作成した地図画像を含む画面、利用者の入力音声に対する音声認識処理の結果画面等を表示する映像信号を出力し、表示装置62にこれらの各種画面を表示する。デジタル−アナログ変換器64は、車載装置1が音声認識処理によって決定された住所の内容を音声に出力する際の音声データやナビゲーション処理部10によって作成される交差点案内などの音声データなどをアナログの音声信号に変換してスピーカ66から出力する。なお、実際には、デジタル−アナログ変換器64とスピーカ66の間には信号を増幅する増幅器が接続されているが、図1ではこの増幅器は省略されている。
ハードディスク装置70は、地図データ71の他に音声認識辞書72が格納されている。音声認識辞書72は、少なくとも利用者が発声する住所について音声認識処理を行うためのものであるが、車載装置1に対して操作指示を行う操作コマンドなども音声認識対象に含めるようにしてもよい。
次に、制御部50の詳細について説明する。図1に示すように、制御部50は、目的地設定部51、住所入力判定部52、住所(全体)音声認識部53、認識結果提示部54、修正指示入力部55、住所(部分)音声認識部56、修正候補表示部57、修正候補選択部58を有している。
目的地設定部51は、経路探索処理部14に必要な目的地を設定する。例えば、施設検索部16によって特定の検索条件を満たす施設を検索して目的地として設定する場合や、利用者が発声する音声に対して音声認識処理によって決定した住所を目的地として設定する場合などが考えられる。
住所入力判定部52は、音声認識処理を用いた住所入力の処理動作を開始するか否かを判定する。例えば、経路探索処理部14による経路探索処理に先立って目的地設定のための住所入力画面が表示された状態で、発話スイッチ42が押下されたときに、音声認識処理を用いた住所入力の処理動作を開始する旨の判定が行われる。
住所(全体)音声認識部53は、マイクロホン22を介して入力された住所に対応する音声に対して音声認識辞書72を用いて音声認識処理を行うことにより、住所を構成する複数の単語(文字列)のそれぞれに対応する第1候補を決定する。ここで行われる音声認識処理は、住所全体を対象にしている。例えば、米国住所の場合は、州、都市、通り、番号の順番で、利用者はマイクロホン22に向かって発声するものとする。
認識結果提示部54は、住所(全体)音声認識部53や住所(部分)音声認識部56によって決定された住所を構成する複数の単語のそれぞれに対応する複数の第1候補あるいは第2候補を利用者に向けて提示する。提示方法としては、音声認識処理によって決定した住所の内容をスピーカ66から音声出力する場合や、この音声出力と並行して住所の内容を表示する場合、住所の内容表示のみを行う場合などが考えられる。
修正指示入力部55は、認識結果提示部54による提示の後に、利用者による認識結果修正指示を受け付ける処理を行う。例えば、利用者は、バックスイッチ44を押下することによりこの修正指示を行うことができ、修正指示入力部55は、バックスイッチ44が押下されたときにこの修正指示を受け付ける。
住所(部分)音声認識部56は、修正指示入力部55によって認識結果修正指示が受け付けられた後に、マイクロホン22を介して入力された住所に対応する音声に対して音声認識辞書72を用いて音声認識処理を行うことにより、認識誤りが生じた単語に対応する候補(第2候補、住所(全体)音声認識部53によって既に決定された第1候補を除く)を決定する。ここで行われる音声認識処理は、住所全体を対象にするのではなく、認識誤りが生じた単語のみを対象に行われる。例えば、米国住所を構成する州、都市、通り、番号の中で「都市」について認識誤りが生じた場合には、利用者は、この「都市」のみを発声し、この発生した内容について住所(部分)音声認識部56による音声認識処理が行われる。
修正候補表示部57は、住所(部分)音声認識部56によって決定された候補が複数ある場合に、これら複数の候補を表示装置62に一覧形式で表示する。修正候補選択部58は、修正候補表示部57によって一覧形式で表示された複数の候補の中から、利用者の指示に応じて一つを選択する。例えば、この利用者の指示は、利用者が操作部40を操作することにより行われる。
上述したマイクロホン22、音声入力処理部20が音声入力手段に、住所(全体)音声認識部53が第1の音声認識処理手段に、認識結果提示部54が認識結果提示手段に、住所(部分)音声認識部56が第2の音声認識処理手段に、修正指示入力部55が修正指示入力手段に、修正候補表示部57が修正候補表示手段に、修正候補選択部58が修正候補選択手段にそれぞれ対応する。
本実施形態の車載装置1はこのような構成を有しており、次に、住所を音声入力する動作について説明する。図2は、利用者が住所全体を発声して入力する動作手順を示す流れ図である。
まず、住所入力判定部52は、住所の音声入力が指示されたか否かを判定する(ステップ100)。音声入力が指示されない場合には否定判断が行われ、この判定を繰り返す。また、音声入力が指示された場合にはステップ100の判定において肯定判断が行われる。例えば、住所入力画面において発話スイッチ42が押下されると、音声入力が指示されたものとする場合が考えられる。
次に、利用者が住所を発声することにより住所の音声入力が行われると(ステップ102)、住所(全体)音声認識部53は、入力音声に対して音声認識辞書72を用いて音声認識処理を行うことにより、住所を構成する複数の単語(文字列)のそれぞれに対応する第1候補を決定する(ステップ104)。次に、認識結果提示部54は、住所(全体)音声認識部53によって決定された住所を構成する複数の単語のそれぞれに対応する複数の第1候補を利用者に向けて提示する(ステップ106)。具体的には、住所の内容をスピーカ66から音声出力するトークバックとともに、表示装置62に住所の内容を示す文字列を表示することにより提示が行われる。
次に、修正指示入力部55は、利用者によってバックスイッチ44が押下されたか否かを判定する(ステップ108)。押下スイッチが押下されない場合には否定判断が行われ、次に、修正指示入力部55は、ステップ106の認識結果の提示から2秒経過したか否かを判定する(ステップ110)。経過していない場合には否定判断が行われ、ステップ108に戻って、バックスイッチ44についての判定が繰り返される。また、ステップ106の認識結果の提示からバックスイッチ44の押下なしに2秒が経過した場合にはステップ110の判定において肯定判断が行われる。この場合には、音声入力された住所の内容が確定する(ステップ112)。その後、この内容が確定した住所を用いて、経路探索処理の目的地設定等の処理が行われる。
また、バックスイッチ44が押下された場合にはステップ108の判定において肯定判断が行われる。次に、利用者が修正箇所の住所を発声することにより住所の一部の音声入力が行われると(ステップ114)、住所(部分)音声認識部56は、入力音声に対して音声認識辞書72を用いて音声認識処理を行うことにより、認識誤りが生じた単語に対応する候補(第2候補)を決定する(ステップ116)。
次に、修正候補表示部57は、住所(部分)音声認識部56によって決定された候補が複数あるか否かを判定する(ステップ118)。複数ある場合には肯定判断が行われる。次に、修正候補表示部57は、これら複数の候補を表示装置62に一覧形式で表示する(ステップ120)。また、修正候補選択部58は、一覧形式で表示された複数の候補の中から1つが選択されたか否かを判定する(ステップ122)。未選択の場合にはこの判定が繰り返される。また、一覧形式で表示された複数の候補の中から1つが選択された場合にはステップ122の判定において肯定判断がなされる。
その後、あるいは、認識誤りが生じた単語に対応する候補が1つであってステップ118の判定において否定判断が行われた後、ステップ106に戻って、第2候補を含む住所全体について利用者に提示(トークバックおよび表示)が行われる。この住所を構成する一部の単語に認識誤りがある場合には、同様にしてその一部の単語について修正処理が繰り返される。
図3および図4は、音声入力した住所の内容を確定するまでの表示例を示す図である。例えば、米国住所として「1900 Harpersway Torrance California」を入力する場合の例が示されている。
図3(A)は、図2のステップ100の判定において肯定判断が行われた後の音声入力待ちの画面を示している。この画面には、住所を音声入力することを促す「Say the adress」のメッセージが含まれている。この状態で、利用者は、発話スイッチ42を押下した後、マイクロホン22に向かって、州(California)、都市(Torrance)、通り(Harpersway)、番号(1900)の順番で住所を入力することができる。
図3(B)は、図2のステップ106において行われる認識結果の提示画面(確認画面)を示している。例えば、認識結果として「1901 Harpersway Torrance California」が表示され、並行してこの認識結果としての住所がトークバックとしてスピーカ66から音声出力される。なお、この認識結果に含まれる「1901」は正しくは「1900」であって、認識誤りが生じている。
図3(C)は、図3(B)に示す認識結果の確認画面が表示された状態でバックスイッチ44が押下されてステップ108の判定において肯定判断が行われた後の音声入力待ちの画面を示している。例えば、バックスイッチ44を押下する毎に、番号(Number)→通り(Street)→都市(City)→州(State)の順番に音声入力の対象が切り替わるものとする。図3(C)に示す例では、番号の入力待ち画面が示されている。この状態で、利用者は、発話スイッチ42を押下した後、マイクロホンに向かって番号を入力することができる。
図4(A)は、図2のステップ116において行われる「番号」の音声入力に対して行われた音声認識の結果として複数(3つ)の候補が得られた場合の一覧表示画面(ステップ120)を示している。例えば、「19」、「1900」、「190」の3つの候補が含まれている。なお、「1901」は、認識誤りであることがわかっているため、この一覧表示画面には含まれない。利用者は、操作部40を操作することにより、あるいは、2番目の候補の先頭に付された選択番号「2」を音声入力することにより、「1900」を選択することができる。
図4(B)は、「番号」が修正された後に、図2のステップ106において行われる認識結果の提示画面(確認画面)を示している。例えば、認識結果として「1900 Harpersway Torrance California」が表示され、並行してこの認識結果としての住所がトークバックとしてスピーカ66から音声出力される。
図4(C)は、認識結果を提示した状態(ステップ106)でバックスイッチ44が押下されずに2秒が経過した後の表示の一例を示している。例えば、内容が決定した住所「1900 Harpersway Torrance California」を用いて、目的地設定や経路表示、周辺検索などを行う場合が示されている。
このように、本実施形態の車載装置1では、住所全体の音声を一括で音声入力し、住所を構成する複数の単語のそれぞれに対応する第1候補を得ることにより、各単語毎に音声認識の候補を表示して利用者にその中の一つを選択させる場合に比べて、発話回数や操作回数を減らすことができる。また、このようにして得られた住所全体に対応する一連の認識結果を利用者に提示し、その少なくとも一部が誤っている場合に、再度この認識結果が誤っている単語のみを対象に2度目の音声入力および音声認識処理を行うことにより、住所全体について正しい音声認識結果を得ることができる。しかも、住所を構成する全ての単語に対応する1回目の音声認識結果が全て誤りである可能性は低いため、一部の単語について2回目の音声入力および音声認識処理を行えばよく、住所全体に対する正しい音声認識結果を得るまでの発話回数を減らすとともに操作を簡略化することが可能となる。
また、認識結果提示の後に、利用者は、バックスイッチ44を押下することで認識結果修正指示を行うことができるため、誤認識が生じたことを容易に伝えることができ、誤認識が生じた単語に対する再度の音声認識処理を確実に実施することが可能となる。
また、認識結果提示の後に、バックスイッチ44を押下しない状態が所定時間(2秒間)継続したときに、得られた候補を住所の内容として決定しているため、認識結果が正しい場合に、特別な操作を行うことなく、次の処理に移行することが可能となる。
また、認識結果をトークバックにより音声で読み上げることにより、あるいは、音声で読み上げるとともに住所の内容を表示することにより、認識結果を利用者に確実に通知することが可能となる。
また、誤認識した単語について再度音声入力して音声認識処理を行った結果複数の候補がある場合にこれら複数の候補を一覧形式で表示し、利用者の指示に応じてその中の一つを選択することにより、誤認識が生じた単語に対する正しい認識結果を確実に得ることができる。
なお、本発明は上記実施形態に限定されるものではなく、本発明の要旨の範囲内において種々の変形実施が可能である。上述した実施形態では、最初に住所全体を一括して利用者が発声するようにしたが、住所が長い場合などにおいては、途中で一旦区切って音声認識処理を実施するようにしてもよい。例えば、利用者は最初に州(California)と都市(Torrance)を発声し、その内容に対して図2に示した一連の動作を実施する。これにより、住所の一部である「Torrance California」が確定する。次に、利用者は残りの部分である通り(Harpersway)と番号(1900)を発声し、その内容に対して図2に示した一連の動作を実施する。これにより、住所の残りの部分である「1900 Harpersway」が確定する。このようにして、2回に分けて住所全体に対する音声認識処理を実施するようにしてもよい。なお、この場合には、1回目の音声認識処理が終わった際に、続けて2回目の音声認識処理に移行する旨の意思表示を利用者が行う必要がある。例えば、この意思表示は、操作部40を用いて、あるいは、音声にて特定の命令を発声することにより行うようにすればよい。
また、上述した実施形態では、車載装置に本発明を適用したが、車載装置以外の装置において住所を音声入力する場合について本発明を適用することができる。例えば、パーソナルコンピュータや携帯端末装置等において住所を音声入力する際に本発明を適用するようにしてもよい。
また、上述した実施形態では、認識結果を提示した状態(図2のステップ106)で、利用者がバックスイッチ44を押下した後に、誤認識した単語について再度の音声入力を行うようにしたが、バックスイッチ44の押下を省略してもよい。すなわち、認識結果を提示した状態で、利用者は発話スイッチ42を押下して直ちに誤認識した単語について再度の音声入力を開始するようにしてもよい。
また、上述した実施形態では、図3(A)に示した音声入力待ちの画面から図3(B)に示した認識結果の提示画面に遷移するようにしたが、住所を構成する各単語毎の認識結果をその都度表示するようにしてもよい。例えば、利用者は、州(California)、都市(Torrance)、通り(Harpersway)、番号(1900)の順番で住所を構成する各単語を発声するため、州(California)を発声してその内容に対応する認識結果「California」を表示し、次に都市(Torrance)を発声してその内容に対応する認識結果「Torrance」を表示し、次に通り(Harpersway)を発声してその内容に対応する認識結果「Harpersway」を表示し、最後に番号(1900)を発声してその内容に対応する認識結果「1901」を表示する。ただし、これらの表示においては、複数の候補を表示することはなく、従ってその都度の操作は要求されない。その後、住所全体の認識結果の提示(ステップ106)を行うようにしてもよい。
上述したように、本発明によれば、住所全体の音声を一括で音声入力し、住所を構成する複数の単語のそれぞれに対応する第1候補を得ることにより、各単語毎に音声認識の候補を表示して利用者にその中の一つを選択させる場合に比べて、発話回数や操作回数を減らすことができる。また、このようにして得られた住所全体に対応する一連の認識結果を利用者に提示し、その少なくとも一部が誤っている場合に、再度この認識結果が誤っている単語のみを対象に2度目の音声入力および音声認識処理を行うことにより、住所全体について正しい音声認識結果を得ることができる。
1 車載装置
20 音声入力処理部
22 マイクロホン
40 操作部
42 発話スイッチ(SW)
44 バックスイッチ(B−SW)
50 制御部
62 表示装置
66 スピーカ
51 目的地設定部
52 住所入力判定部
53 住所(全体)音声認識処理部
54 認識結果提示部
55 修正指示入力部
56 住所(部分)音声認識部
57 修正候補表示部
58 修正候補選択部
72 音声認識辞書

Claims (5)

  1. 利用者によって入力された音声に対して音声認識処理を行って、複数の単語からなる住所の内容を決定する音声認識装置であって、
    利用者の発話による音声が入力される音声入力手段と、
    前記音声入力手段に入力された前記住所に対応する音声に対して音声認識処理を行うことにより、住所を構成する複数の単語のそれぞれに対応する第1候補を決定する第1の音声認識処理手段と、
    前記第1の音声認識処理手段によって決定された前記複数の単語のそれぞれに対応する複数の第1候補を利用者に向けて提示する認識結果提示手段と、
    前記認識結果提示手段による提示の後に、前記音声入力手段に入力されたいずれかの前記単語に対応する音声に対して音声認識処理を行うことにより、この単語に対応する前記第1候補を除く第2候補を決定する第2の音声認識処理手段と、
    を備えることを特徴とする音声認識装置。
  2. 請求項1において、
    前記認識結果提示手段による提示の後に、利用者による認識結果修正指示を受け付ける修正指示入力手段をさらに備え、
    前記第2の音声認識処理手段は、前記修正指示入力手段によって前記認識結果修正指示が受け付けられた後に利用者によって発声された音声に対して音声認識処理を行い、
    前記認識結果提示手段は、前記第2の音声認識処理手段による音声認識処理が行われた場合には、前記第1および第2の音声認識処理手段によって決定された前記複数の単語のそれぞれに対応する前記第1候補あるいは前記第2候補を利用者に向けて提示することを特徴とする音声認識装置。
  3. 請求項2において、
    前記修正指示入力手段によって前記認識結果修正指示を受け付けない状態が所定時間継続したときに、前記第1候補あるいは前記第1および第2候補が前記住所の内容として決定されることを特徴とする音声認識装置。
  4. 請求項1〜3のいずれか一項において、
    前記認識結果提示手段による提示は、音声認識処理によって得られた前記住所の内容を音声で読み上げることにより、あるいは、音声で読み上げるとともに音声認識処理によって得られた前記住所の内容を表示することにより行われることを特徴とする音声認識装置。
  5. 請求項1〜4のいずれか一項において、
    前記第2の音声認識処理手段によって決定された前記第2候補が複数ある場合に、これら複数の第2候補を一覧形式で表示する修正候補表示手段と、
    前記修正候補表示手段によって一覧形式で表示された前記複数の第2候補の中から、利用者の指示に応じて一つを選択する修正候補選択手段と、
    をさらに備えることを特徴とする音声認識装置。
JP2015236474A 2015-12-03 2015-12-03 音声認識装置 Pending JP2017102320A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015236474A JP2017102320A (ja) 2015-12-03 2015-12-03 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015236474A JP2017102320A (ja) 2015-12-03 2015-12-03 音声認識装置

Publications (1)

Publication Number Publication Date
JP2017102320A true JP2017102320A (ja) 2017-06-08

Family

ID=59017118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015236474A Pending JP2017102320A (ja) 2015-12-03 2015-12-03 音声認識装置

Country Status (1)

Country Link
JP (1) JP2017102320A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019058453A1 (ja) * 2017-09-20 2019-03-28 三菱電機株式会社 音声対話制御装置および音声対話制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019058453A1 (ja) * 2017-09-20 2019-03-28 三菱電機株式会社 音声対話制御装置および音声対話制御方法
JPWO2019058453A1 (ja) * 2017-09-20 2019-12-12 三菱電機株式会社 音声対話制御装置および音声対話制御方法

Similar Documents

Publication Publication Date Title
CN106796786B (zh) 语音识别系统
US8818816B2 (en) Voice recognition device
US20130080146A1 (en) Speech recognition device
WO2013005248A1 (ja) 音声認識装置およびナビゲーション装置
JP5637131B2 (ja) 音声認識装置
JP4997796B2 (ja) 音声認識装置、及びナビゲーションシステム
JP4466379B2 (ja) 車載音声認識装置
JP5364412B2 (ja) 検索装置
JP5277704B2 (ja) 音声認識装置及びこれを用いる車両システム
JP4914632B2 (ja) ナビゲーション装置
JP6522009B2 (ja) 音声認識システム
JP2010039099A (ja) 音声認識および車載装置
JP2005275228A (ja) ナビゲーション装置
JP5455355B2 (ja) 音声認識装置及びプログラム
JP2007127896A (ja) 音声認識装置及び音声認識方法
JP2017102320A (ja) 音声認識装置
WO2006137246A1 (ja) 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体
JP3718088B2 (ja) 音声認識修正方式
JP2007057805A (ja) 車両用情報処理装置
US20150192425A1 (en) Facility search apparatus and facility search method
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JP2007183516A (ja) 音声対話装置及び音声認識方法
JP4645708B2 (ja) コード認識装置および経路探索装置
WO2015102039A1 (ja) 音声認識装置
JP2009271835A (ja) 機器操作制御装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190604

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191224

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200623