JP4466379B2 - 車載音声認識装置 - Google Patents

車載音声認識装置 Download PDF

Info

Publication number
JP4466379B2
JP4466379B2 JP2005004360A JP2005004360A JP4466379B2 JP 4466379 B2 JP4466379 B2 JP 4466379B2 JP 2005004360 A JP2005004360 A JP 2005004360A JP 2005004360 A JP2005004360 A JP 2005004360A JP 4466379 B2 JP4466379 B2 JP 4466379B2
Authority
JP
Japan
Prior art keywords
display
identification character
vehicle
speech recognition
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005004360A
Other languages
English (en)
Other versions
JP2006195576A (ja
Inventor
雅明 市原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2005004360A priority Critical patent/JP4466379B2/ja
Publication of JP2006195576A publication Critical patent/JP2006195576A/ja
Application granted granted Critical
Publication of JP4466379B2 publication Critical patent/JP4466379B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音声認識を用いて検索を行う車載音声認識装置に関する。
従来から、音声認識時に順位の低い認識結果を予備的な認識候補(誤認識候補)として記憶しておき、順位の高い認識結果を表示し、順位の高い認識結果に対してユーザから誤認識の指摘があった場合に当該予備的な認識候補の中から所望の認識結果をユーザに選択させることができるようにした技術が知られている(例えば、特許文献1参照)。この従来技術では、ユーザが表示画面に表示されたファンクションキーを操作すると、予備的な認識候補(誤認識候補)が表示画面に列挙され、その中からユーザが所望の認識結果を選択できるので、ユーザは再度発話する必要が無くなる。
特開2000−259178号公報
ところで、車両に搭載されるこの種の音声認識装置は、ナビゲーション装置の目的地検索設定機能と結びつくことができる。例えばこの付近のハンバーガー屋に行きたいユーザは、「ハンバーガー」と発声し、音声認識装置に“ハンバーガー”を認識させ、検索ボタンを操作する。この場合、音声認識装置は、現在の車両位置と所定の地図データに基づいて周辺のハンバーガー屋を検索し、ディスプレイに検索結果を一斉に表示する。
ここで、ユーザは、同じハンバーガー屋であっても、“ABCバーガー(店名)”以外のハンバーガー屋に行きたい場合や、“DCEバーガーハウス(店名)”若しくは“FGHバーガー(店名)”に行きたい場合がありうる。
しかしながら、上述のような従来的な音声認識装置では、膨大となり得る検索結果(多数のハンバーガー屋のリスト)の中から所望の“ハンバーガー屋”(例えば“ABCバーガー”以外のハンバーガー屋)をユーザが自ら探して選択しなければならず、利便性やユーザフレンドリ性の観点から不十分な一面があった。
一方、現時点で車両に搭載可能な音声認識装置では、検索結果の絞込みを音声認識により行おうにも、音声認識精度上の問題で、“以外の”や“ではなく”といった排他条件や“または”や“若しくは”といったOR条件を音声認識することが困難な現状である。
そこで、本発明は、高い音声識別能力を有さなくても利便性の高い検索機能を提供できる音声認識装置の提供を目的とする。
上記課題を解決するため、本発明の一局面によれば、車内で検出される発話に対して音声認識処理を行い、前記発話に含まれる各識別文字列を認識する音声認識手段と、
タッチパネル式ディスプレイ上に、前記認識された各識別文字列を、互いに区別可能な別々の表示領域内にそれぞれ表示すると共に、タッチパネル式ディスプレイ上の各表示領域に対するユーザのタッチ操作を検出する表示制御手段と、
タッチパネル式ディスプレイ上に表示された各識別文字列に基づいて、所定の検索条件に従ってデータベース内における情報検索を行う検索システムとを備え、
タッチパネル式ディスプレイ上の前記表示領域に対するタッチ操作回数に応じて、該表示領域内に表示されている識別文字列が、前記検索条件において排他条件として使用(考慮)される状態が形成されることを特徴とする、車載音声認識装置が提供される。

本局面において、タッチパネル式ディスプレイ上の前記表示領域に対するタッチ操作回数に応じて、
(1)該表示領域内に表示されている識別文字列が、前記検索条件において他の識別文字列に対してAND条件として考慮される第1の状態、
(2)該識別文字列が前記検索条件においてなんら考慮されない第2の状態、及び、
(3)該識別文字列が前記検索条件において排他条件として考慮される第3の状態の何れかが形成されてよい。
また、前記表示制御手段は、タッチパネル式ディスプレイ上の前記表示領域に対するタッチ操作回数に応じて、該表示領域内に表示されている識別文字列の表示状態を変化させるものであってよい。また、前記表示制御手段は、タッチパネル式ディスプレイ上でのタッチ操作による再認識指令に応じて、前記音声認識手段に、前記第2の状態が形成された識別文字列を認識辞書から除外した状態で前記音声認識処理を再度実行させるものであってよい。また、前記音声認識手段は、「または」「および」「以外」「ではなく」のような検索条件に関わる単語を識別しないものであってよい。
また、前記表示領域のうちの所定の2つ以上の前記表示領域内に表示されている2つ以上の識別文字列は、前記検索条件において他の識別文字列に対してOR条件として考慮されてよい。前記所定の2つ以上の表示領域は、他の表示領域に対して区別可能な方向に配列されてよい。前記表示制御手段は、前記所定の2つ以上の表示領域には、前記識別文字列のうち同種の識別文字列を表示するものであってよい。
また、前記各表示領域内に表示されている各識別文字列間が、前記検索条件においてAND条件で互いに結ばれるように初期設定される場合、
所定の隣接する2つの表示領域毎に、1つの操作領域が割り当てられ、
前記1つの操作領域に対するタッチ操作に応じて、該1つの操作領域に係る2つの表示領域内に表示されている2つの識別文字列間の前記検索条件における結びつきが、AND条件からOR条件に切り換えられてよい。この場合において、ユーザが未確定の目的地を確定していくのに適した第1モードでは、前記第1の状態、第2の状態又は第3の状態が選択的に形成されるのに対して、ユーザが確定している目的地を発話して音声認識させるのに適した第2モードでは、前記第1の状態又は第2の状態しか形成されないこととしてよい。また、前記2つのモード間は、ユーザによるスイッチ操作、若しくは、前記発話に含まれる特定のキーワードに応じて切り換えられてよい。前記第2モードでは、前記音声認識手段は、地図関連用語のみを含む認識辞書に基づいて音声識別を行うものであってよい。
本発明によれば、高い音声識別能力を有さなくても利便性の高い検索機能を提供できる音声認識装置を得ることができる。
以下、図面を参照して、本発明を実施するための最良の形態の説明を行う。
図1は、本発明による車載音声認識装置の一実施例を示すシステム構成図である。本実施例の音声認識装置10は、音声認識エンジン20を搭載したマイクロコンピューターからなる。音声認識エンジン20は、前処理部22、特徴量抽出部24、音響モデル処理/マッチング部26、及び、言語モデル処理/マッチング部28を備える。
音声認識装置10は、車室内の音(音声)を拾うマイク40を備える。マイク40により検出された音声は、前処理部22にて増幅、ノイズ除去などの所定処理を受けて、特徴量抽出部24に送られる。特徴量抽出部24では、検出された音声信号(発話データ)から特徴量が抽出され、次いで、音響モデル処理/マッチング部26及び言語モデル処理/マッチング部28を介して、認識候補が決定される。尚、本発明は、音声認識処理の詳細を特定するものでなく、如何なる音声認識技術に基づくものであってもよい。
音声認識装置10は、更に、ユーザとの対話を制御する対話制御部30を備える。上述の音声認識エンジン20にて得られた認識候補(音声認識エンジン20の認識結果)は、文字データとして対話制御部30に入力される。対話制御部30は、後述の如く、車内に配設されるディスプレイ44に、音声認識エンジン20の認識結果を表示する。また、対話制御部30は、車内に配設されるスピーカ42から、音声認識エンジン20の認識結果を音声合成部32を介して音声出力してもよい。
ディスプレイ44は、ユーザがタッチ操作することで各種入力が可能なタッチパネル式ディスプレイである。対話制御部30は、タッチパネル式ディスプレイ44上の各表示領域(後述するキーワード枠90等)に対するユーザのタッチ操作を検出する手段を備え、グラフィカルユーザーインターフェースを介した対話入力が実現される態様で画面制御を行う。
対話制御部30には、検索システム70が接続される。対話制御部30は、後述の如く、タッチパネル式ディスプレイ44を介して検索システム70に対する検索指示等をユーザから受け付けると共に、タッチパネル式ディスプレイ44上に検索システム70による検索結果を表示する。
検索システム70は、地名や施設、それらの位置やジャンルなど各種情報を格納した地図データベース72を備える。検索システム70は、以下詳説する如く、地図データベース72の中から、タッチパネル式ディスプレイ44を介してユーザが設定した検索条件に従って、適切な情報を検索・抽出する機能を有する。
例えば、ユーザが、近くのハンバーガー屋に行きたい場合に、マイク40に向かって「ハンバーガー」と発声すると、対話制御部30は、音声認識エンジン20の認識結果として“ハンバーガー”をディスプレイ44上に表示する。この際、ユーザが、例えばタッチパネル式ディスプレイ44上の検索スイッチ86(図3参照)にタッチすると、対話制御部30は、検索システム70により地図データベース72の中からカテゴリ[ハンバーガー屋]に属するレストラン情報を抽出する。対話制御部30は、検索システム70が抽出したレストラン情報を、ディスプレイ44上に表示する。そして、ユーザは、ディスプレイ44上に表示されたレストラン情報の中から所望のハンバーガー屋を目的地として選択・設定する。この結果、対話制御部30は、検索システム70により当該ハンバーガー屋までのルート検索を実行し、この検索ルートをディスプレイ44上に地図と共に表示させる。基本的には、このような対話の流れで目的地設定からルート案内開始までが進む。
ところで、一般的に、ディスプレイ44上に表示できる情報量には限りがあり、また、膨大な情報を表示するのは却って不便であるので、該当する情報量(先の例ではカテゴリ[ハンバーガー屋]に属するレストラン情報)が所定量以上ある場合には、情報の絞込みのための検索条件を追加する必要が生ずる。
しかしながら、上述の如く音声認識により検索条件を入力する構成では、キーボードなどを用いてパーソナルコンピューター上で行う検索システムとは異なり、複雑な検索条件の入力が困難である。従って、検索条件の絞込みとしては、例えば地域に関する条件をアンド条件として加えたり、更なる詳細な条件(例えば、先の例では店名)に変更したりすることが一般的である。
これに対して、本実施例では、以下詳説する如く、音声認識による入力を主体としつつ、非常に簡易なスイッチ操作を補助的に用いることで、多様な検索条件の絞込みの設定を可能とする。
図2は、本実施例の音声認識装置10により実行される特徴的な処理の流れを示すフローチャートである。本例では、ユーザが豊田市内で“ABCバーガー(店名)”以外のハンバーガー屋に行きたい場合を想定する。
先ず、ステップ100として、音声認識装置10は、例えばイグニッションスイッチがオンとなった際に起動され、ユーザの発話に対する待ち受け状態となる。尚、音声認識装置10は、所定の条件が成立した場合のみ(例えば、所定のボタンが操作された場合のみ)、マイク40により検出された音声に対して上述の音声認識処理を実行するように構成されていてよい。
ユーザの発話があると、音声認識装置10は、音声認識処理を実行して認識結果をディスプレイ44上に表示する(ステップ110)。この際、ユーザが「ハンバーガーが食べたいんだけど、ABCバーガーはなしにして。できれば豊田市がいいなー」と発話し、音声認識装置10が、キーワード候補(識別文字列)として“ハンブルグ”、“ABCバーガー”及び“豊田市”を認識したとする。この場合、ディスプレイ44上には、図3に示すように、認識結果が、各種の機能スイッチ80と共に、キーワード枠90内に表示される。
キーワード枠90は、キーワード毎に設けられる。即ち、ある発話データにおいてi個のキーワードが確認される場合、i個のキーワード枠90(i=1,2,…)が用意される。尚、1つのキーワードに対して複数のキーワード候補が認識される認識エンジンの場合、最も信頼度の高いキーワード候補がキーワード枠90内に表示される。
本実施例のキーワード枠90は、キーワード候補を表示するだけでなく、当該キーワード候補に係る検索条件を決定するためのタッチスイッチとしての機能も有する。即ち、キーワード枠90は、それに対するユーザの操作態様によって検索条件が変わるように構成されている。
対話制御部30は、上述の如くディスプレイ44上のキーワード枠90内に各認識結果を表示した後、ステップ120として、ユーザからの更なる入力を待機する状態に入る。
この際、対話制御部30は、キーワード枠90に対するユーザのタッチ回数Sに基づいて、キーワード枠90内のキーワード候補の検索条件を判断する。ここで、タッチ回数Sは初期値が0であり、一回タッチする毎に1ずつ増え、3回タッチすると0に戻るように設定される。即ち、初期値S=0(S=S+1)であり、S=3のときS=0となる。これは、各キーワード枠90に対してそれぞれ付与される。即ち、キーワード枠90に係るタッチ回数はS(i)である。
本例の対話制御部30は、キーワード枠90に対するユーザのタッチ回数S(i)に応じて、当該キーワード枠90の検索条件を判断するだけでなく、当該キーワード枠90の表示状態をも変化させる。
例えば、キーワード枠90に対して1回タッチすると(S(i)=1)、対話制御部30は、図3に示すように、キーワード枠90の色を初期状態に比して薄くする(ステップ130)。これは、当該キーワード枠90内のキーワード候補が検索条件から除外されることを意味する。即ち、本例では、ユーザは、“ハンバーガー”の誤認識結果である“ハンブルグ”に係るキーワード枠90(i=1)に1回タッチすることで、“ハンブルグ”をキーワード候補から外すことができる。
また、キーワード枠90に対して2回タッチすると(S(i)=2)、対話制御部30は、図3に示すように、キーワード枠90内のキーワード候補の横に“×”なる表示を生成する(ステップ140)。これは、当該キーワード枠90内のキーワード候補が排除条件であることを意味する。即ち、本例では、ユーザは、“ABCバーガー” に係るキーワード枠90(i=3)に2回タッチすることで、“ABCバーガー”を排除条件として設定することができる。
尚、キーワード枠90に対して3回タッチすると(S(i)=3=0)、対話制御部30は、キーワード枠90の表示状態を初期状態に戻す(ステップ150)。
このように本実施例では、ユーザは、キーワード枠90の表示状態を一目するだけで当該キーワード枠90内のキーワード候補に係る検索条件が容易に判断できる。尚、キーワード枠90の表示状態の変化態様は、表示の明度や輝度を変化させるのみならず付加表示の重畳や点滅などの強調表示等々多種多様であり、本発明は、上記の変化態様に限られることない。
尚、先の例において、除外された“ハンブルグ”に代えて“ハンバーガー”をキーワード枠90内に入れるため、ユーザは、ディスプレイ44上の再認識スイッチ84にタッチしてよい。この場合、音声認識エンジン20は、対話制御部30からの指令に応じて、“ハンブルグ”を認識辞書から除外して、バッファ内に格納しておいた発話データに対して再度認識処理を実行してもよい。或いは、音声認識エンジン20が初めから複数の候補を出力しうる構成では、再認識スイッチ84に操作に応答して、“ハンブルグ”の次候補としてメモリに格納されていた“ハンバーガー”がキーワード枠90内に表示されうる。
また、本例では、その他の機能スイッチ80として、リセットスイッチ88が用意されている。リセットスイッチ88が操作されると(ステップ160)、対話制御部30は、全てのキーワード枠90の表示状態を初期状態に戻し、それに伴い、全てのキーワード枠90のタッチ回数S(i)が初期値0に戻される。尚、その後、もしユーザにより再度発話が実行されると、上記ステップ100からの処理が再度実行されることになる。
上述のようなユーザによる検索条件設定操作が完了すると、ユーザは、ディスプレイ44上の検索スイッチ86にタッチすることになる。検索スイッチ86が操作されると(ステップ170)、対話制御部30による指令に基づいて検索システム70による検索が実行される。この際、検索システム70は、上述のようなキーワード枠90内の各キーワード候補の検索条件に従って(即ち、S(i)の値に従って)、検索を実行する。先の例では、キーワード枠90内に“ハンバーガー”が入れ直されたとして、検索システム70は、ユーザの望みどおり、“豊田市”という地域で“ABCバーガー”以外のハンバーガー屋を地図データベース72の中から検索・抽出することになる。或いは、先の例のように、“ABCバーガー”からハンバーガー屋が推定できる場合には、キーワード枠90のタッチ回数S(1)=1の場合でも(即ち“ハンブルグ”をキーワード候補から外すだけで)、“豊田市”という地域で“ABCバーガー”以外のハンバーガー屋が適切に検索・抽出されうる。尚、この検索の際、通常通り、キーワード枠90内の各キーワード候補間はAND条件で結ばれているとみなされている。
このように本実施例によれば、上述の如く簡易なスイッチ操作で排他条件を設定できるので、検索条件の絞込み方法の選択肢が広がり、ユーザの希望に合った検索条件の設定が可能となり、音声認識による検索システムの利便性が向上する。
また、上述の如く排他条件を簡易なスイッチ操作で設定可能とすることで、“以外の”や“ではなく”といった排他条件を音声認識させる必要が無くなる。これに伴い、ユーザの発話データに対して、認識の困難な助詞や接続詞などを認識対象(即ちキーワード)から外し、住所、ジャンル、名詞などの特定ワードのみを認識対象とすることが可能となる。この結果、音声認識エンジン20に非常に高い認識能力を要求することなく、高精度の認識結果を得ることが可能となる。
尚、本実施例において、検索スイッチ86のようなキーワード枠90以外の機能スイッチ80の操作は、音声入力により代替されても良い。これにより、ユーザによる手による操作を可能な限り減らし、音声入力の利便性を高めても良い。
図4は、本発明のその他の実施例による検索条件設定態様の説明図であり、ディスプレイ44上の表示画面を示す(図3と同様の表示画面)。本例では、ユーザが豊田市内で“DCEバーガーハウス(店名)”若しくは“FGHバーガー(店名)”に行きたい場合を想定する。
この場合、ユーザは例えば「ハンバーガーが食べたいんだけど、DCEバーガーハウスかFGHバーガーに行きたい気分。豊田市限定で探して」と発話する。これに対して、音声認識装置10が、キーワード候補として“ハンバーガー”、“DCEバーガーハウス”、“FGHバーガー”及び“豊田市”を適切に認識できたとする。
本実施例の対話制御部30は、図4に示すように、“DCEバーガーハウス”及び“FGHバーガー”を同類のキーワード候補とし、ディスプレイ44上に横並びで並列的に配設されたキーワード枠90内にこれらの同類のキーワード候補を表示する。尚、説明上、これらの同類のキーワード候補が表示されるキーワード枠90を「同類キーワード枠90」と称する。但し、同類キーワード枠90は、キーワード枠90としての機能も上述の実施例と同様に有している。即ち、同類キーワード枠90を含むそれぞれのキーワード枠90は、そのタッチ回数に応じて排他条件の設定や認識辞書からのキーワード候補の削除が可能である。
隣接する同類キーワード枠90間には、図4に示すように、反転スイッチ89が設けられる。反転スイッチ89は、初期状態(デフォルト)で検索条件がOR条件であり、それに対するユーザの操作態様によって検索条件がAND条件に反転するように構成されている。
対話制御部30は、隣接する2つの同類キーワード枠90間の検索条件を、その間の反転スイッチ89に対するユーザのタッチ回数Gに基づいて、判断する。ここで、タッチ回数Gは初期値が0であり、一回タッチする毎に1ずつ増え、2回タッチすると0に戻るように設定される。また、各反転スイッチ89は、各キーワード枠90と同様、互いに独立して操作される。
対話制御部30は、反転スイッチ89に対するユーザのタッチ回数Gに応じて、当該反転スイッチ89の検索条件を判断するだけでなく、当該反転スイッチ89の表示状態をも変化させる。例えば、初期状態(G=0)の反転スイッチ89には、“OR”なる表示がなされ、反転状態(G=1)の反転スイッチ89には、“AND”なる表示がなされてよい。
先の例では、ユーザは、特に反転スイッチ89を操作することなく、ディスプレイ44上の検索スイッチ86にタッチして、検索を開始させることができる。検索スイッチ86が操作されると、対話制御部30による指令に基づいて検索システム70による検索が実行される。この際、検索システム70は、上述のようなキーワード枠90内の各キーワード候補の検索条件(即ち、S(i)の値)と反転スイッチ89の検索条件(即ち、Gの値)とに従って、検索を実行する。従って、先の例では、“DCEバーガーハウス”及び“FGHバーガー”を入れる2つの同類キーワード枠90間の反転スイッチ89がOR条件で結ばれているので、検索システム70は、ユーザの望みどおり、“豊田市”という地域で“DCEバーガーハウス”または“FGHバーガー”という名のハンバーガー屋を地図データベース72の中から検索・抽出することになる。尚、この検索の際、同類キーワード枠90内のキーワード候補と、キーワード枠90内の各キーワード候補とはAND条件で結ばれているとみなされている。
このように本実施例によれば、上述の如く簡易なスイッチ操作で複数のキーワード候補間をOR条件又はAND条件で結びつけることができるので、検索条件の絞込み方法の選択肢が広がり、ユーザの希望に合った検索条件の設定が可能となり、音声認識による検索システムの利便性が向上する。
尚、本実施例において、同類キーワード枠90内のキーワード候補と、キーワード枠90内の各キーワード候補と入れ替え可能とされてよい。例えば、先の例で、“FGHバーガー”が通常のキーワード枠90内に誤って表示された場合には、ユーザが、例えば入れ替えスイッチ82を操作した後に、“FGHバーガー”が入っているキーワード枠90にタッチする。これに応答して、対話制御部30は、当該キーワード枠90内のキーワード候補(即ち“FGHバーガー”)を同類キーワード枠90内に移してよい。或いは、ユーザが、“FGHバーガー”が入っているキーワード枠90を長押しすることで、これに応答して、対話制御部30が、当該キーワード枠90自体を同類キーワード枠90に変化させてよい。この場合、対話制御部30は、これら2つの同類キーワード枠90に係る検索条件を決定するための反転スイッチ89を適切な位置に表示してよい。
以上説明した各実施例は、特に、ユーザが当初決まった目的地が無く、対話式で目的地を設定していく場合に好適である。従って、本実施例の音声認識装置10は、対話型で目的地を設定する対話型設定モードと、通常的な目的地設定モードとで選択的に動作可能であってよい。これは、後者の目的地設定モードでは、当初から決まった目的地があるときは、ユーザが単にその目的地を発声するだけなので、上述のような各種検索条件の絞込みの必要性が乏しく、むしろ認識対象を地図関連の用語(地名)に絞る方が認識精度の観点から有用であるからである。従って、目的地設定モードでは、上述のような図3や図4に示す態様でない別の態様の表示制御・識別辞書が採用されてもよい。例えば、目的地設定モードでは、キーワード枠90は、それに対するタッチの有無に応じて認識辞書からのキーワード候補の削除のみが可能とされてよい。また、目的地設定モードでは、1つのキーワードに対して複数のキーワード候補が認識された場合、ユーザがキーワード枠90の操作で選択・除外できるように、複数のキーワード候補がキーワード枠90内に表示されてもよい。
尚、これら2つのモード間(対話型設定モードと目的地設定モード)の切換は、ユーザによるスイッチ操作により実現されてもよいが、ユーザの会話や発話に対する識別結果に基づいてユーザの意図を推定することで自動切換えにより実現されてもよい。後者の場合、例えば、特定のキーワードに基づいてユーザの目的地が既に決まっているか、現在検討中かを判断してもよい。
以上、本発明の好ましい実施例について詳説したが、本発明は、上述した実施例に制限されることはなく、本発明の範囲を逸脱することなく、上述した実施例に種々の変形及び置換を加えることができる。
例えば、上述した各実施例では、キーワード枠90に対するタッチ回数に応じて検索条件が変化させているが、長押しなどの他のタッチ操作態様に応じて変化させてもよい。
また、上述した各実施例において、ディスプレイ44上の表示画面におけるキーワード枠90や数や配置、反転スイッチ89の位置や配置は種々の変更が可能である。例えば、図4の破線で示すように、デフォルトでAND条件を示す反転スイッチ89bが縦列のキーワード枠90間に設定されてもよい。
また、上述した各実施例は、主に目的地設定までの処理に関するものであったが、目的地設定後の案内ルート検索・選択時にも適用可能である。例えば、対話制御部30は、案内ルート検索時、“高速道路”との音声認識結果に応答して、高速道路を利用するルートを希望するか否かをユーザに問うためのタッチスイッチを表示させても良い。この場合、ユーザが当該タッチスイッチを操作した場合には、高速道路を利用しない案内ルートのみを検索するようにしてよい。
また、上述した各実施例においては、地域に関する条件(先の例では豊田市)が付与されていない場合には、検索システム70は、車両の現在位置に対して所定エリア内における情報のみを抽出するものであってもよい。この場合、車両の現在位置は、GPS(Global Positioning System)受信機、ビーコン受信機及びFM多重受信機や、車速センサやジャイロセンサ等の各種センサに基づいて検出されて良い。
また、上述した各実施例において、対話制御部30は、キーワード枠90に対するユーザのタッチ操作に応じて、スピーカ42を介して音声出力を行ってもよい。例えば「排他条件」といったように、設定変更された検索条件を音声出力させてよい。
また、上述からも明らかなように、上述した各実施例において、音声認識装置10その他構成要素は、全て若しくはその一部がナビゲーション装置に組み込まれて具現化されてよい。例えば、ディスプレイ44や地図データベース72は、ナビゲーション装置が通常的に備えるディスプレイや地図データであってよい。
本発明による車載音声認識装置の一実施例を示すシステム構成図である。 本実施例の音声認識装置10により実行される特徴的な処理の流れを示すフローチャートである。 本発明の一実施例によるディスプレイ44上の表示画面を示す図である。 本発明のその他の一実施例によるディスプレイ44上の表示画面を示す図である。
符号の説明
10 音声認識装置
20 音声認識エンジン
22 前処理部
24 特徴量抽出部
26 音響モデル処理/マッチング部
28 言語モデル処理/マッチング部
30 対話制御部
40 マイク
42 スピーカ
44 ディスプレイ
70 検索システム
72 地図データベース
80 機能スイッチ
84 再認識スイッチ
86 検索スイッチ
88 リセットスイッチ
89 反転スイッチ
90 キーワード枠

Claims (12)

  1. 車内で検出される発話に対して音声認識処理を行い、前記発話に含まれる各識別文字列を認識する音声認識手段と、
    タッチパネル式ディスプレイ上に、前記認識された各識別文字列を、互いに区別可能な別々の表示領域内にそれぞれ表示すると共に、タッチパネル式ディスプレイ上の各表示領域に対するユーザのタッチ操作を検出する表示制御手段と、
    タッチパネル式ディスプレイ上に表示された各識別文字列に基づいて、所定の検索条件に従ってデータベース内における情報検索を行う検索システムとを備え、
    タッチパネル式ディスプレイ上の前記表示領域に対するタッチ操作回数に応じて、該表示領域内に表示されている識別文字列が、前記検索条件において排他条件として使用される状態が形成されることを特徴とする、車載音声認識装置。
  2. タッチパネル式ディスプレイ上の前記表示領域に対するタッチ操作回数に応じて、
    (1)該表示領域内に表示されている識別文字列が、前記検索条件において他の識別文字列に対してAND条件として使用される第1の状態、
    (2)該識別文字列が前記検索条件においてなんら使用されない第2の状態、及び、
    (3)該識別文字列が前記検索条件において排他条件として使用される第3の状態の何れかが形成される、請求項1に記載の車載音声認識装置。
  3. 前記表示制御手段は、タッチパネル式ディスプレイ上の前記表示領域に対するタッチ操作回数に応じて、該表示領域内に表示されている識別文字列の表示状態を変化させる、請求項1に記載の車載音声認識装置。
  4. 前記表示制御手段は、タッチパネル式ディスプレイ上でのタッチ操作による再認識指令に応じて、前記音声認識手段に、前記第2の状態が形成された識別文字列を認識辞書から除外した状態で前記音声認識処理を再度実行させる、請求項2に記載の車載音声認識装置。
  5. 前記音声認識手段は、「または」「および」「以外」「ではなく」のような検索条件に関わる単語を識別しない、請求項1に記載の車載音声認識装置。
  6. 前記表示領域のうちの所定の2つ以上の前記表示領域内に表示されている2つ以上の識別文字列は、前記検索条件において他の識別文字列に対してOR条件として使用される、請求項1に記載の車載音声認識装置。
  7. 前記所定の2つ以上の表示領域は、他の表示領域に対して区別可能な方向に配列される、請求項6に記載の車載音声認識装置。
  8. 前記表示制御手段は、前記所定の2つ以上の表示領域には、前記識別文字列のうち同種の識別文字列を表示する、請求項6に記載の車載音声認識装置。
  9. 前記各表示領域内に表示されている各識別文字列間が、前記検索条件においてAND条件で互いに結ばれるように初期設定される請求項1に記載の車載音声認識装置において、
    所定の隣接する2つの表示領域毎に、1つの操作領域が割り当てられ、
    前記1つの操作領域に対するタッチ操作に応じて、該1つの操作領域に係る2つの表示領域内に表示されている2つの識別文字列間の前記検索条件における結びつきが、AND条件からOR条件に切り換えられる、車載音声認識装置。
  10. 請求項2に記載の車載音声認識装置において、
    ユーザが未確定の目的地を確定していくのに適した第1モードでは、前記第1の状態、第2の状態又は第3の状態が選択的に形成されるのに対して、
    ユーザが確定している目的地を発話して音声認識させるのに適した第2モードでは、前記第1の状態又は第2の状態しか形成されない、車載音声認識装置。
  11. 前記2つのモード間は、ユーザによるスイッチ操作、若しくは、前記発話に含まれる特定のキーワードに応じて切り換えられる、請求項10に記載の車載音声認識装置。
  12. 前記第2モードでは、前記音声認識手段は、地図関連用語のみを含む認識辞書に基づいて音声識別を行う、請求項10に記載の車載音声認識装置。
JP2005004360A 2005-01-11 2005-01-11 車載音声認識装置 Expired - Fee Related JP4466379B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005004360A JP4466379B2 (ja) 2005-01-11 2005-01-11 車載音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005004360A JP4466379B2 (ja) 2005-01-11 2005-01-11 車載音声認識装置

Publications (2)

Publication Number Publication Date
JP2006195576A JP2006195576A (ja) 2006-07-27
JP4466379B2 true JP4466379B2 (ja) 2010-05-26

Family

ID=36801637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005004360A Expired - Fee Related JP4466379B2 (ja) 2005-01-11 2005-01-11 車載音声認識装置

Country Status (1)

Country Link
JP (1) JP4466379B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5182614B2 (ja) * 2007-12-07 2013-04-17 アイシン・エィ・ダブリュ株式会社 検索装置、ナビゲーション装置、及び検索プログラム
JP5436771B2 (ja) * 2007-12-11 2014-03-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 複数単語を使用する検索式の作成を支援する方法、装置およびプログラム
JP5355114B2 (ja) * 2009-01-29 2013-11-27 キヤノン株式会社 データ検索装置及びその制御方法、コンピュータプログラム
JP2010276869A (ja) * 2009-05-28 2010-12-09 Funai Electric Co Ltd 自動翻訳対応電話機および自動翻訳対応電話システム
JP5542559B2 (ja) * 2010-07-16 2014-07-09 三菱電機株式会社 音声検索インタフェース装置及び音声入力検索方法
DE112012002190B4 (de) * 2011-05-20 2016-05-04 Mitsubishi Electric Corporation Informationsgerät
JP6330508B2 (ja) 2014-06-19 2018-05-30 株式会社デンソー 車両用目的地決定装置および車両用目的地決定システム
JP2016024378A (ja) * 2014-07-22 2016-02-08 Necパーソナルコンピュータ株式会社 情報処理装置、その制御方法及びプログラム
CN106407198A (zh) * 2015-07-28 2017-02-15 百度在线网络技术(北京)有限公司 问答信息的处理方法及装置
US20210357177A1 (en) * 2018-11-30 2021-11-18 Lg Electronics Inc. Vehicle control device and vehicle control method
JP7469050B2 (ja) 2020-01-14 2024-04-16 東芝テック株式会社 プログラムおよび情報処理システム

Also Published As

Publication number Publication date
JP2006195576A (ja) 2006-07-27

Similar Documents

Publication Publication Date Title
JP4466379B2 (ja) 車載音声認識装置
JP4736982B2 (ja) 作動制御装置、プログラム
JP5637131B2 (ja) 音声認識装置
JP2010139826A (ja) 音声認識システム
KR101063607B1 (ko) 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법
JP5364412B2 (ja) 検索装置
JP2009230068A (ja) 音声認識装置及びナビゲーションシステム
JP5217838B2 (ja) 車載機器の操作装置及び車載機器の操作方法
JP2010039099A (ja) 音声認識および車載装置
JP2002350163A (ja) ナビゲーション装置
JP4262837B2 (ja) 音声認識機能を用いたナビゲーション方法
JP5455355B2 (ja) 音声認識装置及びプログラム
JP2000338993A (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP2009140287A (ja) 検索結果表示装置
JP3624698B2 (ja) 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム
JP2005275228A (ja) ナビゲーション装置
US20040015354A1 (en) Voice recognition system allowing different number-reading manners
JP2011232668A (ja) 音声認識機能を備えたナビゲーション装置およびその検出結果提示方法
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP3700533B2 (ja) 音声認識装置及び処理システム
KR100677711B1 (ko) 음성 인식 장치, 기억 매체 및 네비게이션 장치
JP2000122685A (ja) ナビゲーションシステム
JP3759313B2 (ja) 車載用ナビゲーション装置
JPH09114487A (ja) 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
JP2006039954A (ja) データベース検索装置、プログラム及びナビゲーション装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100215

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140305

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees