JP4928701B2 - 目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための方法 - Google Patents
目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための方法 Download PDFInfo
- Publication number
- JP4928701B2 JP4928701B2 JP2001567584A JP2001567584A JP4928701B2 JP 4928701 B2 JP4928701 B2 JP 4928701B2 JP 2001567584 A JP2001567584 A JP 2001567584A JP 2001567584 A JP2001567584 A JP 2001567584A JP 4928701 B2 JP4928701 B2 JP 4928701B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- language
- additional information
- expression
- destination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000014509 gene expression Effects 0.000 claims abstract description 60
- 230000001755 vocal effect Effects 0.000 abstract 3
- 230000001747 exhibiting effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Navigation (AREA)
- Alarm Systems (AREA)
Description
本発明は、請求項1の前提部に記載した、目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力(音声入力)するための方法に関する。
【0002】
この種の装置及びこの種の方法は、例えばドイツ特許発明第19709518号明細書から知られている。この周知の方法では、言語コマンドにより選択可能な複数の操作機能が利用者に提供される。選択可能な各操作機能のために、全データベースから辞書が生成され、それにより、迅速で且つユーザフレンドリな言語制御式の目的住所検索が可能とされている。この際、ドイツ特許発明第19709518号明細書では、目的地を1字ずつ区切って読むことを要求する周知のシステムに由来しているが、ドイツ特許発明第19709518号明細書に記載された目的案内システムにおいてもユーザフレンドリな入力可能性が与えられているわけではなく、その理由は、目的地入力以前に前もって所望の操作機能を選択するための言語コマンドが必要とされているからである。ユーザは目的地入力以前に目的地入力の形式を選択しなくてはならない。例えば、目的地が1字ずつ区切って読まれるべきかどうか、目的地が大まかな目的入力を介して検索されるべきかどうか、又は、目的地が目的地名称の入力を介して検索されるべきかどうかである。目的地名称の入力では、全ての目的地名称を有する辞書における検索が必要とされる。ドイツではこの種の辞書はほぼ60000箇所の内容を含むことになる。記憶されている言語表現のこの大容量は、周知の言語認識システム(多くの場合は所謂HMMシステム)では良好な言語認識レートのための限界が経験に従ってほぼ1000ワードであるので、満足のいく結果をもたらすことはない。
【0003】
本発明の課題は、より容易な操作性に関し且つ上記の言語認識システムの限界に関し、冒頭に掲げた形式の方法を改善することである。
【0004】
この課題は、請求項1に記載した特徴により解決される。本発明の有利な構成は従属請求項に記載されている。
【0005】
本発明において、目的地に割り当てられ且つ記憶されている言語表現は、少なくとも、目的地名称と、目的地名称を一義的に特定し且つ地域を限定する少なくとも1つの追加情報とから構成されている。各目的地名称は第1データベース内に保存されていて、問題とされる各追加情報は(目的地名称を伴わずに)第2データベース内に保存されている。第1データベース内の各目的地名称・データ或いは目的地名称に関する各登録事項は指示シンボルを含んでいる。この種の指示シンボルは、例えば、データを迅速に発見するためのプログラム技術的なマークであり得る。これらのマーク或いは指示シンボルは、好ましくは、夫々のデータに割り当てられている追加情報自体を特徴付けている。
【0006】
この際、第2データベースはその規模において必然的に第1データベースよりも遥かに小さい。地域を限定する追加情報では、例えば、州、区域、地方名称、地方郡、河川、湖、及び/又は、目立った比較的大きな都市が問題となる。これらの追加情報は、好ましくは一義的に区別可能である。即ち、第2データベース内において同音の追加情報は存在しない。これらの追加情報は所謂識別名(識別子)であり、これらの識別名により同音の目的地名称の多義性(例えば“Muenster bei Straubing”(ミュンスター バイ シュトラウビング)“Muenster in Unterfranken”(ミュンスター イン ウンターフランケン))の問題も解決される。識別名は、好ましくは、これらの識別名の数が良好な言語認識のための上記の限界値を超過しないように選択される。
【0007】
本発明によるこのデータベース構造は、好ましくは、言語表現が入力された後にこの言語表現がこの場合に先ずはより小さい第2データベース内に保存されている識別名と比較されるという方式で利用される。識別名が第2データベース内において認識される場合にだけ、目的地名称の言語認識が続行される。この際、入力された言語表現に関して第1データベース全体がくまなく検索されるのではなく、認識された識別名に割り当てられて第1データベースから生成される部分データストックだけが検索されるのである。
【0008】
第3データベース内には前置詞が保存され得て、これらの前置詞は、入力された言語表現における目的地名称と追加情報を分離するために用いられる。
【0009】
最善の場合では、言語表現として、ユーザは、目的地名称と前置詞と追加情報から成るフレーズ入力が行うが、本発明の本質は、開始時の入力ダイアログが、単一語入力も、目的地名称と前置詞と識別名の形式又は目的地名称と識別名の形式のフレーズ入力も、言語入力として可能としているということである。言語表現の入力後、言語認識装置により、言語表現の少なくとも一部が追加情報であるかどうかが検査される。この言語認識装置は、必要に応じ、即ち、特に言語表現のどの部分も追加情報として認識されない場合に、次の経過においてユーザを追加情報の言語入力又は定義されているフレーズ入力へと導き、これらの言語入力又はフレーズ入力により、言語表現の少なくとも一部が追加情報であることを言語認識装置が認識する。
【0010】
ユーザは、ユーザの言語表現の提供においてフレキシブルであり(例えば「大まかな目的入力」のような)手動の操作機能選択が行われる必要はない。更に、学習効果が効力を発揮する。即ち、ユーザは、システムに対し、自ら何度も使用することにより、目的地名称と前置詞と追加情報の形式の最善のフレーズ入力を提供することになる。
【0011】
有利には、入力された言語表現が言語認識装置によって少なくとも2つの入力カテゴリのうちの1つに割り当てられる。この際、第1入力カテゴリはフレーズ入力として定義され、これは言語認識装置が言語表現の一部を追加情報と判断する場合である。第2入力カテゴリは単一語入力として定義され、これは言語認識装置が言語表現のどの部分にも追加情報がないと判断する場合である。
【0012】
言語表現の一部が追加情報として認識される場合、目的地名称を言語認識するために、入力された言語表現に関し、目的地名称が第1データベース全体に渡って検索されることはない。つまり、第1データベースからの指示シンボルを使い、認識された識別名に割り当てられている部分データストックが生成される。この部分データストックは、識別名に割り当てられている周辺地域リストに基づいて生成される。この主の周辺地域リストは、夫々の識別名にとって問題となる全ての目的地名称或いは目的地名称の指示シンボルを内容として含む。これらの周辺地域リストは第2データベース内又は第2データベース外に保管され得る。選択的には、この種の周辺地域リストの存在を伴わずに、第1データベースが、認識された夫々の識別名を特徴付ける指示シンボルに関してくまなく検索され得る。部分データストックは、最終的に、言語認識にとって必要であり識別名に関して問題となる目的地名称のデータを含む。この種の目的地名称・データは、特に、従来技術から周知の方法による言語認識のための基準モデル又は基準モデルを作るための基礎も含んでいる。従って、入力された言語表現は、所望の目的地名称を発見するために、動的に生成されたその都度の部分データストックとだけ比較されればよい。
【0013】
目的地名称が認識されなかった場合には、目的地名称又は追加情報を再度質問するという入力ダイアログが行われるか、目的地名称を選び出すためのリストが提供される(例えば、読み出しと言語制御式の操作による、又は、手動の選択可能性を伴う画面での表示による、又は、画面での表示と言語制御式の選択による)。
【0014】
言語表現のどの部分にも追加情報がないと判断される場合には、全言語表現が第2データベース内で検索される。このプロセスの目的は、同音の追加情報でもあり得る目的地名称を迅速に検索することである。好ましくは第2データベース内の追加情報だけが、目的地名称でもあり得る入力された言語表現と比較される。
【0015】
第2データベース内に追加情報が認識されない場合、ユーザには、他の入力ダイアログで追加情報を言語入力することが要求される。この際、追加情報だけが要求され得るか、又は(追加情報を伴う)フレーズ入力が要求され得る。前に入力された言語表現は、好ましくは目的地名称として解釈され、その後の目的地名称の言語認識のために保存される。
【0016】
言語表現の一部が、前置詞として、又は、言語表現の一部が先行して存在するものである識別名として認識される場合、入力された言語表現はフレーズ入力として分類される。
【0017】
本発明の本質は、言語入力の形式に依存せずに第1データベース内の第1検索が行われるというのではなく、第2データベース内だけで第1検索が行われるということである。第1データベースは、第2データベース内で認識された追加情報に依存する部分データストックを動的に生成するのための基礎として用いられる。目的地名称自体を言語認識するために、第1データベースの全体が使用されるのではなく、第1データベースから取り出された部分データストックだけが使用される。追加情報が認識されたものとして有効でない場合には、言語認識システムの入力ダイアログが、少なくとも、識別名の入力、又は、定義に従って識別名を含むフレーズの入力へとユーザを導く。
【0018】
本発明の実施形態が図面に示されている。
【0019】
図1には、3つのデータベース1、2、3が描かれている。第1データベース1は、例えばドイツにおいて可能な全ての目的地名称を目的地名称・データの形式で含む。目的地名称・データは、例えば、識別名と関連付けられたマーク、及び、言語認識(音声認識)のための基準モデルを含む。第2データベース2は可能な全ての識別名(識別子)を含み、この際、各識別名の後には、識別名に付属する目的地名称の少なくとも1つのリストが、識別名と関連付けられた目的地名称のマークの形式で設けられている。このリストは以下「周辺地域リスト」と称するものとする。第3データベース3内には、フレーズ入力と関連して可能な全ての前置詞が保存されている。ドイツを例とすると、第1データベース1は約60000個の目的地名称を含み、第2データベース2は約500個の識別名を含み、第3データベース3は約70個の前置詞を含む。このドイツの例は、3つのデータベース1、2、3から成るデータベース構造の規模の状況を示すために挙げられたものである。
【0020】
本発明による最善のフレーズ入力は、目的地名称と、目的地名称に続く前置詞と、前置詞に続く識別名とから構成される。同音の識別名は存在しないが、同音となる識別名と目的地名称は存在し得る(例えば“Muenchen”(ミュンヘン))。同音の目的地名称は異なる識別名を有し、それにより目的地名称の多義性が排除される。
【0021】
図1による例において可能なフレーズ入力を以下に記す(ドイツ語表現において、aeはaウムラウトを表し、oeはoウムラウトを表し、ueはuウムラウトを表し、ssはエスツェットを表す):
− “Garching bei Muenchen”(ガルヒング バイ ミュンヘン)
− “Freising bei Muenchen”(フライジング バイ ミュンヘン)
− “Muenchen in Oberbayern”(ミュンヘン イン オーバーバイエルン) 又は“Muenchen an der Isar”(ミュンヘン アン デア イザール) 又は“Muenchen in Bayern”(ミュンヘン イン バイエルン)
− “Muenster bei Straubing”(ミュンスター バイ シュトラウビング) 又は“Muenster am Lech”(ミュンスター アム レッヒ) 又は“Muenster Kreis Peine”(ミュンスター クライス パイネ) 又は“Muenster in Unterfranken”(ミュンスター イン ウンターフランケン)
− “Neuhuetten in Unterfranken”(ノイヒュッテン イン ウンターフランケン)
− “Karbach in Unterfranken”(カールバッハ イン ウンターフランケン)
【0022】
第3データベース3は、例えば、可能な前置詞“in”(〜内の),“bei”(〜の近くの),“an der”(〜に接する),“am”(〜に接する),“Kreis”(地方行政区画)を含む。第2データベース2は、例えば、識別名として、(比較的大きな)都市(Stadt: 例えば“Muenchen”(ミュンヘン),“Straubing”(シュトラウビング))、河川(Fluss: 例えば“Lech”(レッヒ),“Isar”(イザール))、区域(Bezirk: 例えば“Peine”(パイネ))、地方名称及び地方郡(Regionale Bezeichnung, Landkreis: 例えば“Unterfranken”(ウンターフランケン),“Oberbayern”(オーバーバイエルン))を含む。各識別名に対し、例えば、識別名カテゴリである“Stadt”(都市),“Fluss”(河川),“Bezirk”(区域) 或いは“Landkreis”(地方郡) のような追加的な特徴情報、及び、同音の目的地名称に対する指示は、第1データベース1内に保存され得る。
【0023】
ここで記述の例では、言語表現(音声表現)が正しく理解され、その他の場合には問い返しダイアログが必要であるということから出発している。
【0024】
フレーズ入力(例えば“Muenster in Unterfranken”(ミュンスター イン ウンターフランケン))の場合、識別名“Unterfranken”が第2データベース2内で検索され、最も大きな認識確率を有する識別名が選び出される。引き続き、識別名“Unterfranken”後に置かれている「周辺地域リスト」(ここでは、“Muenster”(ミュンスター),“Karbach”(カールバッハ),“Neuhuetten”(ノイヒュッテン) 或いは、これらの目的地名称に割り当てられているプログラム技術的なマークのリスト)に基づき、これらのマークを用い、第1データベース1から、少なくとも言語認識のために必要な目的地名称・データから成る部分データストックが動的に作られる。地域的に限定されたこの部分データストックから入力された目的地名称が検索される。ここでも最も大きな認識確立を有する目的地名称(“Muenster”)が目的地名称として認識されて有効となる。本発明によるデータベース構造を有するこの検索戦略は、従来技術におけるような、目的地名称により第1データベース1全体を言語認識と関連付けてくまなく検索すること、及び、多義性の場合には引き続く問い返しダイアログを必要とすることと比べると、より早く、より確実に認識が行われる。
【0025】
単一語入力(例えば“Muenchen”(ミュンヘン))の場合には、全言語表現が先ず識別名として解釈され、第2データベース2内で検索される。“Muenchen”は、一方では、第2データベース2内の識別名に対応し、他方では、第1データベース1内の少なくとも1つの同音の目的地名称に対応し、このことも情報として識別名“Muenchen”に割り当てられているので、目的地名称として全ての“Muenchen”のリストが作られ、例えば、場所の大きさに従い、夫々の識別名の命名(例えば in“Oberbayern”(オーバーバイエルン内))と共に選択肢として提供される。このリストは、周辺地域リストと同様に、第2データベース2内の夫々の識別名において保存され得る。
【0026】
識別名が同音の所望の目的地に実際に対応する場合、この検索戦略は最も早い可能性を有するものである。従って、少なくともこの場合にはユーザフレンドリが最適化されている。従来技術におけるような、問い返しダイアログも、先行する言語コマンドによる操作機能選択も、必要ではない。
【0027】
所望の目的地名称が第2データベース2内に識別名として存在しない場合、入力ダイアログが次のように実施される。即ち、ユーザがフレーズ入力又は少なくとも識別名の入力へと導かれるようにである。
【0028】
図2aから図2hには、本発明による方法の経過プランを用いて可能である全ての入力ダイアログが示されていて、部分的には、言語認識装置が言語表現を恐らく間違って理解したケースも含まれている。
【0029】
図2aでは、言語制御式の目的地入力のための経過プランが例えば言語コマンドにより又は手動でキーを押すことにより開始する。それに続く変数の定義 ANZ_GESAMTDURCHLAEUFE, ANZ_NACHFRAGE_ZIELORT, ANZ_NACHFRAGE_IDENTIFIKATOR は、以下で詳細に説明されているように、エラー試行の回数を制限するために用いられる。
【0030】
入力ダイアログは、例えば、要求文“Bitte geben Sie den Zielort ein”(目的地を入力して下さい)によって開始する。最善の場合として、その後、目的地が、目的地名称と前置詞と識別名の部分から成るフレーズの形式で入力される。
【0031】
次に、他の経過について、先ず“Muenchen”(ミュンヘン)という言語表現が入力される場合を例にとって説明する。言語入力の後、図2aに従い、先ず、目的地名称と前置詞と識別名を分離することが言語認識システムによって試行され、この際、識別名が第2データベース内で検索され、前置詞が第3データベース内で検索される。先行して存在する言語表現を有する識別名、又は前置詞が認識され、有効であるとされた場合、入力された言語表現はフレーズ入力(接続子2参照)として分類される。言語表現の一部が先行して存在するものである識別名が認識されない場合、又は、前置詞が認識されない場合、入力された言語表現は単一語入力として分類される。つまり“Muenchen”という言語入力の場合には単一語入力が成されたことになる。次のステップ(接続子1参照)において、入力された言語表現“Muenchen”が、第2データベース2内に保存されていて同時に目的地名称でもある識別名と図2bに対応して比較される(接続子1参照)。図1による例において言語入力“Muenchen”の場合には1つの識別名が認識される。
【0032】
その後、認識された識別名、ここでは“Muenchen”が図2d(接続子3参照)に対応して多義性に関してチェックされる。即ち、目的地名称である“Muenchen”がドイツ内で幾度も存在するかどうかである。この情報は、認識された識別名に対し、対応する目的地名称に関する参照指示を用いて保管されている。一義的な目的地名称では目的地が既に正確に認識されていることになる。本実施形態では少なくとも2つの目的地名称“Muenchen”が存在する。例えば、言語認識システムは次に先ず最も大きな目的地を目的地フレーズの形式で出力する:“Moechten Sie nach Muenchen in Oberbayern fahren?”(オーバーバイエルン内のミュンヘンへの走行を希望しますか?)この目的地が正しい目的地として確認されると、目的地入力は成功したものとして終了する。それに対して提供された目的地が拒否されると、例えば全ての同じ名称の目的地、ここでは“Muenchen”が、地理的な位置の命名(“Muenchen in Oberbayern”(ミュンヘン イン オーバーバイエルン),“Muenchen bei Hamburg”(ミュンヘン バイ ハンブルグ), …)を用い、所望の目的地名称をリストから選択するために搭載モニタ上に提供される。
【0033】
所望の目的地がリスト内に含まれない場合、図2h(接続子7参照)に従い、カウンタ ANZ_GESAMTDURCHLAEUFE を用い、何回のエラー試行が既に言語制御式で行われたかがチェックされる。予め設定されている閾値、ここでは ANZ_GESAMTDURCHLAEUFE = 2 に達した場合、手動の目的地入力が提案される。予め設定されたこの閾値に達しない場合には入力ダイアログの開始(接続子8参照)に戻される。
【0034】
次に、経過プランを、図2aにおける言語入力“Muenster”(ミュンスター)を例にして詳細に説明する。再び、言語入力が単一語入力として分類されるが、ここでは、図2bに対応し、認識されて有効なものとして同時に目的地名称である識別名は第2データベース2内に存在しない。この場合には図2e(接続子4参照)に従い、先ずはカウンタ ANZ_NACHFRAGE_IDENTIFIKATOR を用いてエラー試行の頻度が再びチェックされる。予め設定されている閾値、ここでは同様に ANZ_NACHFRAGE_IDENTIFIKATOR = 2 が未だ達成されていない場合、問い返しダイアログが開始される。例えば、より正確な場所の位置を詳述することがユーザに要求される。最善の場合は識別名である言語入力が期待される。目的地名称“Muenster”の例では、経過プランのこの点において、例えば言語入力“Unterfranken”(ウンターフランケン) 又は“in Unterfranken”(イン ウンターフランケン) が続く。言語入力が“in Unterfranken”の場合には“Unterfranken”が識別名として認識される。その理由は、言語表現のこの部分が前置詞“in”の後に続くからである。言語入力が“Unterfranken”の場合には全言語表現が識別名として評価される。
【0035】
図2eに従い、言語表現が、第2データベース2内に保存されている全ての識別名と比較される。先行する言語入力が“in Unterfranken”の場合、識別名が前置詞から分離され、第2データベース2内に保存されている全ての識別名と比較される。
【0036】
識別名が第2データベース2から認識されない場合、図2eに従い(接続子4を介して図2eに向かう)、既述したように、識別名が今一度問い返される。識別名が認識されて選び出される(図2c、接続子2参照)と、動的、即ちリアルタイムで、言語認識に関連付けられた部分データストックが第1データベース1から識別名の「周辺地域リスト」に基づいて生成される。この例では、識別名“Unterfranken”に割り当てられている全ての目的地名称・データが選択される。即ち“Neuhuetten”(ノイヒュッテン),“Karbach”(カールバッハ),“Muenster”(ミュンスター) である。所望の目的地名称、ここでは“Muenster”の言語入力が、経過プランの図2aに従う言語入力の後、その時まで、言語認識システムの一時的なメモリに保存され得る。
【0037】
次に、図2g(接続子6参照)に従い、生成された部分データストック内で、目的地名称として解釈された言語入力が部分データストックからの目的地に対応するかどうかがチェックされる。目的地名称が認識されると、図2d(接続子3参照)に従い、既述したように、経過プランが更に進行する。しかし目的地名称が認識されるものとして有効でない場合、例えば、言語入力“Muenster”が間違って発音された又は不明確に発音された場合には、今一度、識別名が図2e(接続子4を介する)に従って問い返されるか又は目的地名称が図2f(接続子5を介する)に従って問い返される。ここでは、先ず、識別名及び目的地名称の問い返し試行の回数が互いに比較され、より少なく問い返された情報に決定される。しかし、最大で2回の問い返し試行だけが全過程ごとに識別名のためにも目的地名称のためにも許される。引き続き、図2g(接続子6参照)に従い、既述したように、経過プランが更に進行する。
【0038】
最後に、図2aにおける最善のフレーズ入力に基づいて経過プランを説明する。例えば、目的地を入力するための要求後に言語入力“Muenster in Unterfranken”(ミュンスター イン ウンターフランケン) が行われる。この例では、言語入力が十分な明確性で成されたものとする。その後、目的地名称と前置詞と識別名の分離が可能である。前置詞も識別名も存在するので、その種類のものとして認識され得て、言語入力がフレーズ入力として分類される。その後、図2c(接続子2を介する)に従い、既述したように、経過プランが進行する。
【図面の簡単な説明】
【図1】 本発明による装置を、対応的なデータバンク構造の形式で示す図である。
【図2a〜2h】 本発明による方法を、可能な入力ダイアログ・経過プランの形式で示す図である。
Claims (7)
- リアルタイム稼動で、目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための方法にして、
入力されたユーザの言語表現が、言語認識装置により認識され、記憶されている言語表現と比較され、並びに、それらの認識確率に従って分類される、そして、認識確率の最も大きな記憶されている言語表現が、入力された言語表現として認識される、方法において、
目的地に割り当てられ且つ記憶されている言語表現が、目的地名称と、目的地名称を一義的に特定し且つ地域を限定する少なくとも1つの追加情報と、前置詞とから構成されていて、各目的地名称が指示シンボルと共に第1データベース(1)内に保存され、各追加情報が第2データベース(2)内に保存され、且つ、各前置詞が第3データベース(3)内に保存されていること、
言語認識装置が入力された言語表現内の前置詞を認識することにより、言語認識装置が入力された言語表現を目的地名称と追加情報に分離すること、及び
分離された前記追加情報である言語表現の一部が追加情報として第2データベース(2)内で認識される場合、この追加情報に割り当てられている部分データストックが第1データベース(1)から生成され、この部分データストック内で、入力された言語表現に基づいて所望の目的地名称が検索されること
を特徴とする方法。 - 請求項1に記載の方法において、
言語表現の入力後、言語認識装置により、言語表現の少なくとも一部が追加情報であるかどうかが検査され、言語認識装置が、必要に応じ、次の経過においてユーザを追加情報の言語入力又は定義されているフレーズ入力へと導き、これらの言語入力又はフレーズ入力により、言語表現の少なくとも一部が追加情報であることを言語認識装置が認識することを特徴とする方法。 - 請求項1又は2に記載の方法において、
言語表現の入力後、この言語表現が言語認識装置によって少なくとも2つの入力カテゴリのうちの1つに割り当てられること、その際、第1入力カテゴリは、言語認識装置が言語表現の一部を追加情報と判断する場合に、フレーズ入力として定義され、また、第2入力カテゴリは、言語認識装置が言語表現のどの部分にも追加情報がないと判断する場合に、単一語入力として定義されることを特徴とする方法。 - 請求項3に記載の方法において、
言語表現のどの部分も入力された追加情報として判断されない場合、全言語表現が第2データベース(2)内において検索されること、及び、認識確率の最も大きな記憶されている追加情報が、第2データベース(2)から、入力された目的地名称として選び出されることを特徴とする方法。 - 請求項4に記載の方法において、
第2データベース(2)内に追加情報が認識されない場合、ユーザには他の入力ダイアログで追加情報を言語入力することが要求されることを特徴とする方法。 - 請求項3〜5のいずれか一項に記載の方法において、
定義されているフレーズ入力が、少なくとも、目的地名称と追加情報から成ることを特徴とする方法。 - 請求項3〜6のいずれか一項に記載の方法において、
入力された言語表現の一部が、前置詞として、又は、言語表現の一部が先行して存在するものである追加情報として認識される場合に、入力された言語表現がフレーズ入力として分類されることを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10012572A DE10012572C2 (de) | 2000-03-15 | 2000-03-15 | Vorrichtung und Verfahren zur Spracheingabe eines Zielortes mit Hilfe eines definierten Eingabedialogs in ein Zielführungssystem |
DE10012572.7 | 2000-03-15 | ||
PCT/EP2001/002606 WO2001069592A1 (de) | 2000-03-15 | 2001-03-08 | Vorrichtung und verfahren zur spracheingabe eines zielortes mit hilfe eines definierten eingabedialogs in ein zielführungssystem |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003527631A JP2003527631A (ja) | 2003-09-16 |
JP4928701B2 true JP4928701B2 (ja) | 2012-05-09 |
Family
ID=7634786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001567584A Expired - Fee Related JP4928701B2 (ja) | 2000-03-15 | 2001-03-08 | 目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7209884B2 (ja) |
EP (1) | EP1264302B1 (ja) |
JP (1) | JP4928701B2 (ja) |
AT (1) | ATE342566T1 (ja) |
DE (2) | DE10012572C2 (ja) |
ES (1) | ES2270992T3 (ja) |
WO (1) | WO2001069592A1 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10120513C1 (de) | 2001-04-26 | 2003-01-09 | Siemens Ag | Verfahren zur Bestimmung einer Folge von Lautbausteinen zum Synthetisieren eines Sprachsignals einer tonalen Sprache |
DE10125825B4 (de) * | 2001-05-26 | 2014-09-11 | Robert Bosch Gmbh | Verfahren zur Spracheingabe und Datenträger |
US7313525B1 (en) * | 2001-09-26 | 2007-12-25 | Sprint Spectrum L.P. | Method and system for bookmarking navigation points in a voice command title platform |
EP1361740A1 (de) * | 2002-05-08 | 2003-11-12 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachinformationen eines Dialogs |
DE10220521B4 (de) * | 2002-05-08 | 2005-11-24 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen |
DE10220524B4 (de) * | 2002-05-08 | 2006-08-10 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache |
EP1363271A1 (de) * | 2002-05-08 | 2003-11-19 | Sap Ag | Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs |
DE10220522B4 (de) * | 2002-05-08 | 2005-11-17 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten mittels Spracherkennung und Frequenzanalyse |
EP1511972B1 (de) * | 2002-05-24 | 2012-09-12 | Robert Bosch Gmbh | Verfahren zur eingabe von ortsnamen |
DE10227518A1 (de) | 2002-06-20 | 2004-01-08 | Robert Bosch Gmbh | Verfahren zur Zieleingabe an einem Navigationsgerät und Navigationsdatenbasis |
DE102005018174A1 (de) * | 2005-04-19 | 2006-11-02 | Daimlerchrysler Ag | Verfahren zur gezielten Ermittlung eines vollständigen Eingabedatensatzes in einem Sprachdialog 11 |
DE102006006305A1 (de) * | 2006-02-10 | 2007-08-16 | Siemens Ag | Verfahren zur Aufbereitung von Informationen für ein Sprachdialogsystem |
KR100819234B1 (ko) * | 2006-05-25 | 2008-04-02 | 삼성전자주식회사 | 네비게이션 단말의 목적지 설정 방법 및 장치 |
DE102006035780B4 (de) | 2006-08-01 | 2019-04-25 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren zur Unterstützung des Bedieners eines Spracheingabesystems |
DE102006051331A1 (de) * | 2006-10-31 | 2008-05-08 | Robert Bosch Gmbh | Verfahren zur Auswahl eines Fahrziels |
US8909528B2 (en) * | 2007-05-09 | 2014-12-09 | Nuance Communications, Inc. | Method and system for prompt construction for selection from a list of acoustically confusable items in spoken dialog systems |
DE102007033472A1 (de) * | 2007-07-18 | 2009-01-29 | Siemens Ag | Verfahren zur Spracherkennung |
DE102007037567A1 (de) * | 2007-08-09 | 2009-02-12 | Volkswagen Ag | Verfahren zur multimodalen Bedienung mindestens eines Gerätes in einem Kraftfahrzeug |
DE102007052345A1 (de) | 2007-11-02 | 2009-05-07 | Volkswagen Ag | Verfahren und Vorrichtung zum Bedienen einer Einrichtung eines Fahrzeugs mit einer Sprachsteuerung |
DE102008028090A1 (de) * | 2008-02-29 | 2009-09-10 | Navigon Ag | Verfahren zum Betrieb eines Navigationssystems |
GB2470357A (en) * | 2009-05-18 | 2010-11-24 | Denso Corp | Disambiguation of location inputs to a navigation system |
DE102010026708A1 (de) * | 2010-07-10 | 2012-01-12 | Volkswagen Ag | Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem |
DE102011103869A1 (de) * | 2011-06-10 | 2012-12-13 | Volkswagen Aktiengesellschaft | Verfahren und Vorrichtung zum Bereitstellen einer Nutzerschnittstelle |
KR20130123613A (ko) * | 2012-05-03 | 2013-11-13 | 현대엠엔소프트 주식회사 | 음성인식 경로안내장치 및 방법 |
CN103618708A (zh) * | 2013-11-19 | 2014-03-05 | 青岛海尔软件有限公司 | 一种语音验证方法、装置及系统 |
JP2015129672A (ja) * | 2014-01-07 | 2015-07-16 | アルパイン株式会社 | 施設検索装置および方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6057395A (ja) * | 1983-09-08 | 1985-04-03 | 松下電器産業株式会社 | 音声認識方法 |
JPH0225897A (ja) * | 1988-07-14 | 1990-01-29 | Ricoh Co Ltd | 音声ダイヤリング装置 |
JPH11175094A (ja) * | 1997-12-09 | 1999-07-02 | Hitachi Ltd | 音声認識装置 |
JPH11250078A (ja) * | 1998-02-27 | 1999-09-17 | Fujitsu Ten Ltd | 音声認識機能付案内装置 |
JP2000002555A (ja) * | 1999-04-27 | 2000-01-07 | Aisin Aw Co Ltd | ナビゲ―ション装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4866778A (en) | 1986-08-11 | 1989-09-12 | Dragon Systems, Inc. | Interactive speech recognition apparatus |
JPH03203488A (ja) * | 1989-12-29 | 1991-09-05 | Pioneer Electron Corp | 音声リモートコントロール装置 |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
JPH09114489A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
US6567778B1 (en) * | 1995-12-21 | 2003-05-20 | Nuance Communications | Natural language speech recognition using slot semantic confidence scores related to their word recognition confidence scores |
US6023697A (en) * | 1997-02-24 | 2000-02-08 | Gte Internetworking Incorporated | Systems and methods for providing user assistance in retrieving data from a relational database |
DE19709518C5 (de) * | 1997-03-10 | 2006-05-04 | Harman Becker Automotive Systems Gmbh | Verfahren und Vorrichtung zur Spracheingabe einer Zieladresse in ein Zielführungssystem im Echtzeitbetrieb |
DE19742054A1 (de) * | 1997-09-24 | 1999-04-01 | Philips Patentverwaltung | Eingabesystem wenigstens für Orts- und/oder Straßennamen |
WO1999048088A1 (en) * | 1998-03-20 | 1999-09-23 | Inroad, Inc. | Voice controlled web browser |
JP3980791B2 (ja) * | 1999-05-03 | 2007-09-26 | パイオニア株式会社 | 音声認識装置を備えたマンマシンシステム |
JP4283984B2 (ja) * | 2000-10-12 | 2009-06-24 | パイオニア株式会社 | 音声認識装置ならびに方法 |
-
2000
- 2000-03-15 DE DE10012572A patent/DE10012572C2/de not_active Expired - Fee Related
-
2001
- 2001-03-08 US US10/181,292 patent/US7209884B2/en not_active Expired - Lifetime
- 2001-03-08 JP JP2001567584A patent/JP4928701B2/ja not_active Expired - Fee Related
- 2001-03-08 AT AT01921321T patent/ATE342566T1/de not_active IP Right Cessation
- 2001-03-08 DE DE50111198T patent/DE50111198D1/de not_active Expired - Lifetime
- 2001-03-08 EP EP01921321A patent/EP1264302B1/de not_active Expired - Lifetime
- 2001-03-08 WO PCT/EP2001/002606 patent/WO2001069592A1/de active IP Right Grant
- 2001-03-08 ES ES01921321T patent/ES2270992T3/es not_active Expired - Lifetime
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6057395A (ja) * | 1983-09-08 | 1985-04-03 | 松下電器産業株式会社 | 音声認識方法 |
JPH0225897A (ja) * | 1988-07-14 | 1990-01-29 | Ricoh Co Ltd | 音声ダイヤリング装置 |
JPH11175094A (ja) * | 1997-12-09 | 1999-07-02 | Hitachi Ltd | 音声認識装置 |
JPH11250078A (ja) * | 1998-02-27 | 1999-09-17 | Fujitsu Ten Ltd | 音声認識機能付案内装置 |
JP2000002555A (ja) * | 1999-04-27 | 2000-01-07 | Aisin Aw Co Ltd | ナビゲ―ション装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1264302A1 (de) | 2002-12-11 |
DE10012572A1 (de) | 2001-09-27 |
EP1264302B1 (de) | 2006-10-11 |
WO2001069592A1 (de) | 2001-09-20 |
US20030014255A1 (en) | 2003-01-16 |
ATE342566T1 (de) | 2006-11-15 |
ES2270992T3 (es) | 2007-04-16 |
DE10012572C2 (de) | 2003-03-27 |
US7209884B2 (en) | 2007-04-24 |
JP2003527631A (ja) | 2003-09-16 |
DE50111198D1 (de) | 2006-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4928701B2 (ja) | 目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための方法 | |
US6385582B1 (en) | Man-machine system equipped with speech recognition device | |
JP4728905B2 (ja) | 音声対話装置および音声対話プログラム | |
US7949524B2 (en) | Speech recognition correction with standby-word dictionary | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
US6598018B1 (en) | Method for natural dialog interface to car devices | |
JP3990075B2 (ja) | 音声認識支援方法及び音声認識システム | |
EP0840288B1 (en) | Method and system for editing phrases during continuous speech recognition | |
US20050033575A1 (en) | Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer | |
US6961706B2 (en) | Speech recognition method and apparatus | |
US20060173680A1 (en) | Partial spelling in speech recognition | |
JP2008203559A (ja) | 対話装置及び方法 | |
KR19990030040A (ko) | 적어도 위치 및/또는 거리 이름용의 입력 시스템 | |
JPH06282291A (ja) | 混同するほど類似した語句の入力を防止する方法と装置 | |
JP2002123290A (ja) | 音声認識装置ならびに音声認識方法 | |
JP3530109B2 (ja) | 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体 | |
JP2007505365A (ja) | 音声制御ナビゲーションシステムの操作方法 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
US8543405B2 (en) | Method of operating a speech dialogue system | |
US20020184022A1 (en) | Proofreading assistance techniques for a voice recognition system | |
KR101063159B1 (ko) | 명령횟수를 줄일 수 있는 음성 인식을 이용한 주소 검색 방법 | |
JP4736962B2 (ja) | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 | |
JP3581044B2 (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101102 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110201 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110208 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110301 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110308 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110401 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110628 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110927 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111004 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111027 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120117 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120213 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |