JP2001013991A - 音声認識支援方法及び音声認識システム - Google Patents

音声認識支援方法及び音声認識システム

Info

Publication number
JP2001013991A
JP2001013991A JP11185859A JP18585999A JP2001013991A JP 2001013991 A JP2001013991 A JP 2001013991A JP 11185859 A JP11185859 A JP 11185859A JP 18585999 A JP18585999 A JP 18585999A JP 2001013991 A JP2001013991 A JP 2001013991A
Authority
JP
Japan
Prior art keywords
recognition
recognition result
point
distance
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11185859A
Other languages
English (en)
Other versions
JP3990075B2 (ja
Inventor
Mitsuyoshi Tatemori
三慶 舘森
Hiroshi Kanazawa
博史 金澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP18585999A priority Critical patent/JP3990075B2/ja
Priority to US09/606,150 priority patent/US6718304B1/en
Publication of JP2001013991A publication Critical patent/JP2001013991A/ja
Priority to US10/687,707 priority patent/US6978237B2/en
Application granted granted Critical
Publication of JP3990075B2 publication Critical patent/JP3990075B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3667Display of a road map
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】音声で指定可能な検索対象地域の範囲を限定す
ることなく、誤認識による不要な誤動作を回避し、シス
テムの使い勝手の向上を図る。 【解決手段】地図検索のためにユーザが発声した音声に
対する音声認識結果(例えば地名または施設名)の示す
地点と、認識に先立って設定された基準点との距離Dを
算出し(ステップS11)、その距離Dと閾値Tとの大
小比較により、認識結果の示す地点から基準点までの距
離を判定し(ステップS12)、その地点が基準点から
遠いと判定された(D≧Tの)場合には、当該認識結果
の正否の確認をユーザに対して促すための確認メッセー
ジを生成して(ステップS14)、それをユーザに提示
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声による地図検
索が可能なシステムに好適な音声認識支援方法及び音声
認識システムに関する。
【0002】
【従来の技術】カーナビゲーションシステムに代表され
る、音声コマンドによる地図検索が可能なシステムで
は、ユーザは検索対象地域内の場所または施設の名称
(地名または施設名)を発声することが多い。したがっ
て、認識結果の表す地点が検索対象地域から遠く離れた
場所または施設の場合は誤認識である可能性が高い。そ
のため、このような認識結果に対してシステムが無条件
に動作(例えば、認識結果の表す場所の付近の地図を拡
大表示する動作)を行うと、結果的に誤動作となる場合
が多い。
【0003】そこで、現在のカーナビゲーションシステ
ムでは、地図検索を音声コマンドで行う場合には、地域
を階層化して音声入力できる地域を限定し、上位階層か
ら下位階層へ降りるごとに検索対象地域(を指定する語
彙)がより制限されるようになっている。しかし、音声
入力できる地域を限定している状態で、限定範囲外の場
所名を入力するには一旦限定を解除しなくてはならず、
システムの使い勝手が悪くなる。
【0004】
【発明が解決しようとする課題】このように、地図検索
を音声コマンドで行うカーナビゲーションシステムに代
表される従来のシステムでは、誤動作を避けるために、
地域を階層化して、音声入力できる地域を限定すると、
つまり音声入力できる場所(を表す語彙)を限定する
と、限定範囲外の場所名を入力するには一旦限定を解除
しなくてはならず、システムの使い勝手が悪くなるとい
う問題があった。
【0005】本発明は上記事情を考慮してなされたもの
でその目的は、音声で指定可能な地図上の場所等を表す
語彙の範囲を限定することなく、誤認識による不要な誤
動作を回避し、システムの使い勝手を向上することがで
きる音声認識支援方法及び音声認識システムを提供する
ことにある。
【0006】
【課題を解決するための手段】本発明の音声認識支援方
法は、ユーザからの入力音声に対する音声認識結果が地
図上の地点を表す場合に、その認識結果の表す地点から
地図検索の基準位置となる基準点までの距離を判定し、
つまり認識結果の表す地点が基準点から遠いか或いは近
いかの遠近を判定し、遠いと判定された場合、つまり認
識結果の表す地点が基準点から離れた場所にある場合に
は、当該認識結果の正否の確認を促す確認応答(確認メ
ッセージ)をユーザに提示して、ユーザの指示を仰ぐよ
うにしたことを特徴とする。ここで、基準点には、シス
テム(を搭載した物体、例えば車両、或いはシステムを
携帯するユーザ)の現在位置或いは着目地点等を用いる
とよい。この基準点は、ユーザからの要求に応じて、或
いはシステムの自律的な動作により、変更設定可能とす
ることができる。
【0007】このように本発明においては、音声認識結
果で表される場所や施設が現在位置或いは着目地点とい
った基準点から離れた場所にあると判定された場合に
は、ユーザに認識結果の確認を促す確認応答を提示し
て、ユーザの指示を仰ぐようにしているため、音声で指
定可能な地図上の場所等を表す語彙の範囲、つまり検索
対象範囲を限定しなくても、誤認識による不要な誤動作
を回避し、システムの使い勝手を向上することができ
る。
【0008】ここで、音声認識結果として複数の認識候
補が取得されるシステムでは、認識結果中の第1位候補
が地図上の地点を表す場合に、当該認識結果中から地図
上の地点を表す認識候補を抽出し、その抽出した認識候
補の各々の入力音声との照合スコア(類似度或いは距離
を表す評価値)を、当該認識結果の表す地点と基準点と
の距離を加味した新たなスコアに変換する再スコアリン
グを行って、その再スコアリング後の各認識候補の新た
なスコアで決まる第1位候補の表す地点の距離判定を行
い、その第1位候補の表す地点が遠いと判定された場
合、再スコアリング後の所定数を上限とする上位候補に
ついて、その認識結果の正否の確認をユーザに対して促
すための確認応答を生成してユーザに提示するとよい。
この音声認識支援方法においても、語彙(検索対象範
囲)を限定しなくても、誤認識による不要な誤動作を回
避し、システムの使い勝手を向上することができる。
【0009】また本発明は、上記距離判定のための基準
を所定のパラメータに従って変更設定することをも特徴
とする。この判定基準には、認識結果の表す地点の基準
点からの遠近を両地点間の距離から判定する場合には、
上記パラメータで決まる距離の閾値が用いられる。ま
た、距離判定の基準として地図上の限定された範囲を表
す基準範囲を用い、基準点を含む基準範囲を所定のパラ
メータに従って変更設定することにより、認識結果の表
す地点の基準点からの遠近を、当該地点の基準範囲に対
する位置関係から(例えば、当該地点が基準範囲に入っ
ていないか或いは入っているかにより)判定するように
してもよい。ここで、上記パラメータとして、画面表示
される地図の拡大/縮小倍率Mを用いるとよく、Mが大
きくなるほど上記判定基準(距離の閾値)を低くし(小
さくし)、上記基準範囲を狭い地域に変更設定するとよ
い。
【0010】このように、所定のパラメータに従って距
離判定の基準を変更設定することにより、例えば指定さ
れた縮尺(拡大/縮小率)に応じて距離判定を行うこと
ができる。
【0011】また本発明は、距離判定の対象となる認識
結果の信頼度を判定し、信頼できないと判定された場合
のみ距離判定を行うことをも特徴とする。ここで、認識
結果の信頼度を、当該認識結果の照合スコアを対応する
入力音声の長さに基づいて正規化した値で判定するなら
ば、高精度な判定が可能となる。
【0012】このように、認識結果が十分信頼できると
判定される場合には、基準点からの距離(遠近)に無関
係に、確認応答の生成対象外とすることで、ユーザに不
要な確認動作を強いるのを回避できる。
【0013】また本発明は、地図上の地点を表す認識対
象語彙を地図上の所定の区分に応じて階層化して管理
し、上記認識結果が地図上の地点を表す場合には、その
地点から距離判定の基準となる階層の区分を決定し、そ
の区分自体、またはその区分と基準点が属す区分との関
係(例えば、その区分に基準点が属すか否か)に応じて
距離判定を行うことをも特徴とする。このように階層単
位で判定基準を切り替えることで、距離を計算すること
なく距離判定が可能となる。
【0014】この他に、地図上の地点を表す認識語彙ご
とに距離判定の基準を指定する属性を予め付与してお
き、認識結果の表す地点の距離判定を、認識された語彙
の属性で指定される判定基準に従って行うならば、語彙
単位で判定基準を切り替え設定できる。この場合も、距
離を計算することなく距離判定が可能となる。
【0015】なお、方法に係る本発明は装置(音声認識
システム)に係る発明としても成立する。また、本発明
は、コンピュータに当該発明に相当する手順を実行させ
るための(或いはコンピュータを当該発明に相当する手
段として機能させるための、或いはコンピュータに当該
発明に相当する機能を実現させるための)プログラムを
記録したコンピュータ読み取り可能な記録媒体としても
成立する。
【0016】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0017】[第1の実施形態]図1は、本発明の第1
の実施形態に係る音声認識システムを概略的に示すもの
である。ここでは、カーナビゲーションシステムにおい
て、音声入力(音声コマンド)によって地図検索を行う
場合の音声認識に適用される音声認識システムを想定し
ている。説明を簡単にするために、音声認識対象語彙が
地名と施設名に限定されており、それぞれの語彙には、
その地理的位置を表す座標(以下、単に位置座標と呼
ぶ)が付与されているものとする。
【0018】図1の音声認識システムは、全体制御部1
1、基準点設定部12、音声認識部13、及び応答生成
部14を備えている。応答生成部14は、距離判定部1
40を有する。
【0019】全体制御部11は、マイクロホン等の音声
入力手段(図示せず)からの音声入力、表示画面の制御
や種々のパラメータの設定・変更、更には必要な情報の
データベースの制御など、カーナビゲーションシステム
全体の制御を行う。
【0020】基準点設定部12は、地図検索の基準とな
る地点(基準点)の座標情報(位置座標)を設定・保持
する。基準点の初期値には、カーナビゲーションシステ
ムの現在位置、或いは予め設定されている所定の場所
(着目地点)の位置座標が用いられる。この基準点の位
置座標は、ユーザからの要求に応じて、或いはシステム
の自律的な動作により、変更設定可能なようになってい
る。また、基準点の位置座標は、GPS(Global
Positioning System)から得られ
る緯度及び経度、或いはデータベースに登録された位置
座標、地図上の位置などから計算される。
【0021】音声認識部13は、全体制御部11が制御
する音声入力手段(ここではマイクロホンとA/D変換
器により構成される音声入力手段)から入力音声を受け
取って、その入力音声を音響分析してその特徴パターン
系列を求め、当該特徴パターン系列と認識語彙の標準特
徴パターン(標準モデル)との照合演算を行って、認識
結果を出力する。ここで、音声の検出に失敗するなどの
理由で認識結果が得られなかった場合には、音声認識部
13は認識失敗を出力する。
【0022】音声認識部13で適用可能な具体的な照合
方法として既に数多くの方法が知られている。したがっ
て、その中の1つを選択して使用すればよい。音声認識
の具体例は、NTTアドバンステクノロジ株式会社の
『音声認識の基礎(上)(下)』L.Rabiner,
Biign−Hwang Juang共著、古井貞煕監
訳、に詳しい。本実施形態では、説明を簡単にするた
め、音声認識部13での認識結果が1個のみで、地図上
の場所または施設を示す場合について述べる。
【0023】応答生成部14は、音声認識部13から認
識結果を(1個)受け取り、図2に示すフローチャート
に従ってユーザへの応答を次のように生成する。まず応
答生成部14の距離判定部140は、基準点設定部12
により設定・保持されている基準点の位置座標と認識結
果とされた地名または施設名(語彙)の示す場所または
施設(つまり、認識結果の示す地点)の位置座標とか
ら、その2点間のユークリッド距離Dを算出する(ステ
ップS11)。
【0024】次に応答生成部14の距離判定部140
は、算出した2点間の距離Dに基づいて、認識結果の示
す地点から基準点までの距離の判定、つまり認識結果の
示す地点の基準点に対する遠近判定を行うため、当該距
離Dを予め定められた閾値Tと比較する(ステップS1
2)。
【0025】もし、D<Tならば、距離判定部140は
認識結果の示す地点が基準点から近いものと判定し、そ
の判定結果を示す距離判定フラグDFを第1の状態に設
定する。この場合、応答生成部14は、距離判定部14
0による遠近判定結果を表す距離判定フラグDFの第1
の状態に従い、即ち認識結果の示す地点が基準点から近
いとの遠近判定結果に従い、次に述べる応答出力は生成
せずに全体制御部11に認識結果のみを出力する(ステ
ップS13)。
【0026】一方、D<Tでない場合、つまりD≧Tの
場合には、距離判定部140は認識結果の示す地点が基
準点から遠いものと判定し、距離判定フラグDFを第2
の状態に設定する。この場合、応答生成部14は、距離
判定フラグDFの第2の状態に従い、即ち認識結果の示
す地点が基準点から遠いとの遠近判定結果に従い、認識
結果をユーザに確認するためのメッセージ(確認応
答)、例えば「○○ですか」(○○は認識結果)、を生
成し、このメッセージ(確認メッセージ)と認識結果の
対を全体制御部11に出力する(ステップS14)。な
お、認識結果が得られない認識失敗の場合には、その旨
(認識失敗)が応答生成部14から全体制御部11に通
知される。
【0027】全体制御部11は、応答生成部14から
(ステップS14により)確認メッセージと認識結果の
対が通知された場合には、音声出力、或いは画面表示な
どにより、確認メッセージをユーザに提示し、ユーザの
確認(判断)を待つ。ユーザはボタン操作などにより、
認識結果の正否を入力する。
【0028】ユーザの操作により、認識結果が「不正
解」であることが入力された場合、全体制御部11は音
声出力または画面表示により、ユーザに対して再度発声
するように促す。また、「正解」であることが入力され
た場合には、全体制御部11は認識結果に対応した動作
を行う。
【0029】これに対し、応答生成部14からの応答出
力に確認メッセージがない場合、即ち(ステップS13
により)認識結果のみが通知された場合、或いは認識失
敗が通知された場合には、全体制御部11はユーザの確
認を待つことなく、通知内容に対応した動作を行う。
【0030】以上に述べた実施形態では、説明の簡略化
のために音声認識対象語彙が位置座標を持つ場合に限定
した。しかし音声認識対象語彙には、システムの制御コ
マンド名などの位置座標を持たない語彙も含まれるのが
一般的である。
【0031】そこで図1の音声認識システムにおいて、
音声認識部13での認識結果が位置座標を持たない語彙
の場合にも対応可能なように、例えば認識対象となる全
ての語彙に、その語彙の属性として、その語が位置座標
を持つ語か否かを表す位置座標フラグPFを付与してお
き、音声認識部13から応答生成部14には、その位置
座標フラグPFが付された認識結果が渡される構成とす
るとよい。このような構成における応答生成部14の動
作を以下に述べる。
【0032】まず、応答生成部14の距離判定部140
は、音声認識部13から渡された認識結果に付されてい
る位置座標フラグPFを検査して、当該認識結果が位置
情報を持つ語であるか否かを判定する。
【0033】もし、位置情報を持たない語(認識結果)
であるならば、距離判定部140は例えばD≧T(具体
的にはD=T)とみなして距離判定フラグDFを第2の
状態に設定する。この場合、応答生成部14から全体制
御部11には、図2のフローチャートから明らかなよう
に、確認メッセージと認識結果の対が出力されることに
なる。また、上記とは逆に、D<T(具体的にはD=
0)とみなして距離判定フラグDFを第1の状態に設定
してもよい。この場合、応答生成部14から全体制御部
11には、図2のフローチャートから明らかなように、
認識結果のみが出力されることになる。この他、D≧T
(D=T)とみなすか、或いはD<T(D=0)とみな
すかを、カーナビゲーションシステムの内部状態に応じ
て決定するようにしてもよい。
【0034】[第2の実施形態]次に、本発明の第2の
実施形態に係る音声認識システムについて説明する。こ
の第2の実施形態に係る音声認識システムの特徴は、前
記第1の実施形態では、音声認識部が1個の音声認識結
果のみを出力することを前提としていたのに対し、音声
認識部が複数の認識候補を音声認識結果として出力し得
る点と、この音声認識部の複数認識候補出力機能に対応
して応答生成部及び全体制御部に新たな機能を持たせて
いる点にある。但し、便宜的に図1の構成を援用する。
【0035】以下、第2の実施形態に係る音声認識シス
テムの動作について、応答生成部14と全体制御部11
での処理を中心に述べる。まず、応答生成部14の処理
について、図3のフローチャートを参照して説明する。
【0036】今、音声認識部13から応答生成部14に
複数の認識候補が認識結果として渡されたものとする。
また、この認識候補には、入力音声(の特徴パターン系
列)と当該候補(の標準特徴パターン)との類似度また
は距離を表す評価値(パターンマッチング結果)として
の照合スコアSと、当該候補が位置情報を持つ語である
か否かを示す位置情報フラグPFが付されているものと
する。
【0037】応答生成部14の距離判定部140は、ま
ず第1位の認識候補(1位候補)について、位置情報フ
ラグPFから位置座標を持つ語であるか否かを判定する
(ステップS21)。もし、1位候補が位置座標を持た
ない語である場合、応答生成部14は1位候補のみを認
識結果として全体制御部11に出力し(ステップS2
2)、前記第1の実施形態と同様に処理する。
【0038】一方、1位候補が位置座標を持つ場合に
は、応答生成部14の距離判定部140は音声認識部1
3から渡された認識候補の中から位置座標を持つ候補の
みを全て抽出する(ステップS23)。
【0039】続いて距離判定部140は、抽出した候補
のそれぞれについて、(基準点設定部12により設定・
保持されている)基準点と当該候補となった地点との距
離Dを求め、この距離Dと当該候補のスコアSとから、
次式(1) S′=αS+βG(D) …(1) に従って新しいスコアS′を求め、そのスコアS′に基
づいて、スコアの大きい順となるように候補順位の変更
(候補の並べ替え)を行う(ステップS24)。なお、
(1)式中のα、βは実験的に決定される係数、G
(D)はDについての関数であり、単調減少関数、また
は単調非増加関数である。
【0040】上記ステップS24の候補の並べ替えは、
上記(1)式において、例えばα=0、β>0、G
(D)がDの単調減少関数の場合は、候補のスコアSに
無関係に、単純に基準点から近い順に並べ替えることと
同義である。また、α>0、β=0の場合は再スコア計
算を行わないことと同義である。なお、スコアS′を求
めるのに必ずしも(1)式を用いる必要はなく、少なく
とも距離DとスコアSとから算出されるものであればよ
い。
【0041】距離判定部140は、上記したステップS
24での再スコアリングによる候補順位の入れ替えを行
うと、その入れ替えにより第1位となった候補の示す地
点と基準点との距離Dを算出する(ステップS25)。
そして距離判定部140は、算出した距離Dを閾値Tと
比較することで、1位候補の示す地点の基準点からの遠
近判定を行い、その判定結果に応じて距離判定フラグD
Fを第1の状態(D<Tの場合)、または第2の状態
(D≧T)に設定する(ステップS26)。
【0042】応答生成部14は、距離判定部140によ
る遠近判定結果がD<Tの場合、1位候補の認識結果の
みを全体制御部11に通知する(ステップS22)。こ
れに対し、遠近判定結果がD≧Tの場合には、応答生成
部14は上位N位(Nは予め定められた自然数)までの
N個の候補(候補がN個ない場合は全候補)のそれぞれ
について、第1の実施形態と同様の確認メッセージと対
応する認識結果の対を全体制御部11に通知する(ステ
ップS27)。なお、音声認識部13で認識結果が得ら
れずに、音声認識部13から応答生成部14に認識失敗
が通知された場合には、応答生成部14から全体制御部
11にも認識失敗が通知される。
【0043】全体制御部11は、応答生成部14からの
通知内容に応じた処理を、図4のフローチャートに従っ
て次のように実行する。
【0044】まず全体制御部11は、応答生成部14か
らの通知内容に基づいて認識失敗か否かを判定する(ス
テップS31)。認識失敗であるならば、全体制御部1
1は認識失敗に対応した処理(ステップS32)を行
う。なお、認識失敗の場合の処理自体は本発明に直接関
係しないため説明を省略する。
【0045】これに対し、認識失敗でないならば、全体
制御部11は認識候補順位を表す順位番号nを初期値1
に設定する(ステップS33)。この例のように、nの
値が候補数を超えていない場合(ステップS35)、全
体制御部11はn位候補に確認メッセージが付されてい
るか否かを調べる(ステップS36)。もし、n位候補
に確認メッセージがないならば、全体制御部11は認識
失敗の場合と同様の処理を行う(ステップS32)。こ
のような確認メッセージがない候補は、応答生成部14
から(前記ステップS22で)1位候補の認識結果のみ
が通知された場合にだけ存在する。
【0046】一方、n位候補に確認メッセージがあるな
らば、全体制御部11は当該確認メッセージを音声出力
または画面表示によりユーザに提示し、ユーザの確認
(判断)を待つ(ステップS37)。このような確認メ
ッセージのある候補は、応答生成部14から(前記ステ
ップS27で)上位N位までの候補がそれぞれ確認メッ
セージと対にして通知された場合にだけ存在する。
【0047】さて、ユーザへの確認メッセージの提示に
対して、ユーザの操作により、n位候補が「正解」であ
ることが入力された場合、全体制御部11はn位候補
(認識結果)に対応した動作を行う(ステップS38,
S39)。
【0048】これに対し、ユーザの操作により、n位候
補が「不正解」であることが入力された場合、全体制御
部11はnを1インクリメントして(ステップS38,
S34)、そのインクリメント後のnの値が候補数を超
えたか否かを調べる(ステップS35)。もし、インク
リメント後のnの値が候補数を超えていないならば、全
体制御部11は、そのnの値で示される(確認メッセー
ジ付きの)n位候補についてステップS36以降の処理
を行う。
【0049】このように全体制御部11は、応答生成部
14から上位N位までの候補(候補数がNに満たない場
合には全候補)がそれぞれ確認メッセージと対にして通
知された場合には、ユーザに対して上位候補から順に対
応する確認メッセージを提示する動作を、ユーザが「正
解」を入力するまで繰り返す。そしてユーザが正解を入
力した場合は、その際のn位候補を認識結果として、そ
の認識結果に対応した動作を行う。また、すべての候補
についてユーザが承諾しなければ(ステップS35)、
全体制御部11は認識失敗の場合と同様の処理を行う
(ステップS32)。
【0050】[第3の実施形態]次に、本発明の第3の
実施形態に係る音声認識システムについて説明する。一
般にカーナビゲーションシステムでは、画面表示する地
図の縮尺が可変できるようになっている。この種のシス
テムでは、ユーザの指示やカーナビゲーションシステム
による制御によって、指定された地域を拡大、或いは縮
小表示するように地図の縮尺が変更される。ユーザが音
声入力を行う場合、殆どの場合、指定された範囲内にあ
る場所(または施設)の名称(地名、施設名)を発声す
ることが予想される。この場合、地図表示の縮尺が変更
されたにも係わらず、基準点の座標を変更しないなら
ば、正しい遠近判定が困難となる。
【0051】第3の実施形態に係る音声認識システムの
特徴は、地図表示の縮尺が変更された場合にも、正しい
遠近判定を可能とする点にある。この場合、基準点設定
部と応答生成部の機能は前記第1の実施形態に係る音声
認識システムのそれとは一部異なるが、便宜的に図1の
構成を援用する。
【0052】以下、第3の実施形態に係る音声認識シス
テムの動作について、縮尺が可変の地図表示が可能なカ
ーナビゲーションシステムに適用される場合を例に、基
準点設定部12での基準点設定と応答生成部14での遠
近判定を中心に述べる。まず、ユーザの指示やカーナビ
ゲーションシステムによる制御によって、指定された地
域を拡大、或いは縮小表示するように地図の縮尺が変更
されたものとする。この場合、基準点設定部12は、拡
大、或いは縮小表示された地図の中心点を基準点に設定
する。
【0053】すると応答生成部14の距離判定部140
は、地図の拡大/縮小率M(Mが大きいほど狭い地域に
限定される)を全体制御部11から取得し、そのMの値
に基づいて、閾値Tを T=F(M) …(2) のように設定する。ここで、F(M)はMについての単
調非増加関数である。
【0054】さて、このような状態で、ユーザが地図上
の所望の場所(または施設)の名称を発声し、その発声
内容に対する音声認識部13での認識結果が応答生成部
14に渡されたものとする。ここでは、説明を簡単にす
るために、1個の音声認識結果のみが渡されたものとす
る。
【0055】応答生成部14の距離判定部140は、音
声認識部13から渡された認識結果の示す地点と基準点
設定部12により設定されている基準点との距離Dを算
出し、そのDと先に設定した閾値Tとの大小を比較する
ことで、認識結果の示す地点の遠近を判定する。明らか
なように、D>Tならば基準点から遠いと判定される。
【0056】以上は、拡大/縮小率可変な地図表示可能
なカーナビゲーションシステムにおいて、拡大/縮小率
Mに基づいて閾値を変更設定する場合について説明した
が、これに限るものではない。例えば、遠近判定の基準
範囲(確認応答を生成しない無条件検索対象地域)とい
う概念を導入して、拡大/縮小率Mに基づいて当該基準
範囲を変更設定し、認識結果の示す地点が単に当該基準
範囲に入っているか否かにより、その地点が基準点から
近いか否かを判定するようにしても構わない。ここで基
準範囲は基準点を中心に設定するとよい。また拡大/縮
小率Mに代えて、遠近判定の基準(閾値、基準範囲)を
表す所定のパラメータを導入してもよい。
【0057】[第4の実施形態]以上に述べた実施形態
では、基準点と認識結果(以下、認識結果は、第2の実
施形態のように複数の候補がある場合には、再スコアリ
ング後の1位候補を表すものとする)の示す地点との距
離Dは、座標からユークリッド距離によって求めてい
た。しかし、この距離Dは、2点間の遠近の判定に用い
るためのものであることから、ユークリッド距離に限る
ものではなく、2点間の遠近を表す尺度であればよい。
【0058】そこで、基準点と認識結果の示す地点との
間の距離(以下、基準点と認識結果との距離と称する)
Dとして、ユークリッド距離に代えて、2点間の遠近を
表す尺度を用いるようにした本発明の第4の実施形態に
係る音声認識システムについて、日本における状況を例
に、便宜的に図1の構成を援用して説明する。
【0059】まず本実施形態では、位置座標を持つ認識
対象語彙は、上位のものから順に、県、市町村、丁字、
施設に階層化されており、それぞれの語は、市町村名で
あればそれが属す県、丁字名であればそれが属す県およ
び市町村、施設名であればそれが属す県、市町村、丁字
が判定できるものとする。また、現在地のように、GP
Sから送られる情報から位置座標のみしか求められない
場合には、ユークリッド距離で位置座標の最も近い丁字
を求め、その丁字、及びその丁字の属す県、市町村、丁
字を現在地が属すものとする。
【0060】このような例では、応答生成部14の距離
判定部140は、音声認識部13での認識結果と基準点
との距離Dを、基準点と認識結果とが同じ県に属す場合
はD=0、そうでなければD=T(Tは遠近判定の閾
値)とする。
【0061】したがって応答生成部14では、基準点と
認識結果とが同じ県に属さないときはD=Tとされるこ
とから、例えば図2ステップS12,S14から明らか
なように確認メッセージを生成することになる。これに
対し、基準点と認識結果とが同じ県に属すときはD=0
とされることから、応答生成部14では、例えば図2ス
テップS12,S13から明らかなように認識結果のみ
を出力することになる。
【0062】以上に述べた距離Dの計算(決定)手法を
用いた場合、応答生成部14の距離判定部140での遠
近判定、即ち距離Dと閾値Tとの大小比較は、Dを計算
せずに同じ県に属すか否かにより判定を行うことと同義
である。したがって、距離判定部140では、上記の手
法により基準点と認識結果との距離Dを計算(決定)
し、その距離Dを閾値Tと比較することで認識結果(の
示す場所、施設)の遠近を判定する代わりに、Dを計算
せずに基準点と認識結果とが同一県に属すか否かにより
遠近判定を行うようにしても構わない。
【0063】なお、ここでは基準点と認識結果とが同一
県に属すか否かによって距離計算及び遠近判定をした
が、これは県でなくとも、市町村や丁字であってもよ
い。但し、遠近の判定基準に、例えば市町村を用いる場
合には、認識結果が県名であれば、基準点と同一市町村
に属すか否かが判定できなくなること、即ち認識結果が
判定基準よりも上位階層の語となった場合には遠近判定
ができなくなることを考慮する必要がある。そこで、こ
のような場合は、基準点と認識結果とが同一階層の語で
表される地域に属さないものとして扱い、D=Tとし
て、つまり認識結果(の示す場所、施設)は基準点から
遠いものとして、応答生成部14で確認メッセージを生
成すればよい。
【0064】また、県より上位階層として地方−例え
ば、関東地方や東海地方など−という階層、あるいは一
般に知られている地理的区分や行政単位とは異なる階層
を設けて、同様に距離計算、遠近判定を行ってもよい。
【0065】(第4の実施形態の変形例)以上に述べた
第4の実施形態では、遠近判定の基準が予め県などと決
まっていたが、これに限るものではなく、例えば認識結
果によって異なる判定基準を用いるようにしても構わな
い。
【0066】そこで、遠近判定の基準を認識結果に応じ
て切り替え設定するようにした第4の実施形態の変形例
について、再び日本の場合を例に、便宜的に図1の構成
を援用して説明する。
【0067】ここでは、県名より上位階層はないものと
する。応答生成部14の距離判定部140は、音声認識
部13での認識結果が県名であれば、無条件にD=Tと
して、つまり認識結果(の示す場所、施設)は基準点か
ら遠いものとして、応答生成部14で確認メッセージを
生成させる。また距離判定部140は、認識結果が市町
村の場合には、基準点と認識結果(の市町村)が属す県
とが一致するか否かによって遠近を判定する。即ち距離
判定部140は、認識結果より1つ上の階層において、
基準点と一致するか否かによる遠近判定を行う。なお、
認識結果が最上位階層の場合には、上述の県のように、
無条件でD=T或いはD=0にするなどすればよい。
【0068】この他に、階層単位ではなく、例えば「○
○ガソリンスタンド××町店」などは市町村レベル、
「□□遊園地」などは県レベルでというように、認識語
彙やカテゴリごとに、判定基準を切り替えてもよい。更
には、単語によっては無条件にD=Tにする、或いはD
=0にするなどしてもよい。このような判定基準の切り
替えは、例えば認識語彙に判定基準を指定するための属
性を付与しておけば実現可能である。
【0069】[第5の実施形態]以上に述べた実施形態
では、位置座標をもつ認識結果は、無条件に判定結果が
決まっている場合を除き、必ず応答生成部14の距離判
定部140において遠近判定を受けていた。しかし、認
識結果が十分に信頼できる場合には、基準点からの距離
とは無関係にユーザへの確認応答を生成しない方が、ユ
ーザに不要な確認動作を強いることを回避できる。
【0070】そこで、認識結果の信頼度に基づく確認応
答生成制御を行うようにした本発明の第5の実施形態に
係る音声認識システムについて、便宜的に図1の構成を
援用すると共に図5のフローチャートを参照して説明す
る。
【0071】今、音声認識部13から応答生成部14に
複数の認識候補が認識結果として渡されたものとする。
また、この認識候補には、入力音声(の特徴パターン系
列)と当該候補(の標準特徴パターン)との類似度また
は距離を表す評価値である照合スコアSと、当該音声の
長さ(時間)Tと、当該候補が位置情報を持つ語である
か否かを示す位置情報フラグPFとが付されているもの
とする。
【0072】応答生成部14の距離判定部140は、ま
ず1位候補について、位置情報フラグPFから位置座標
を持つ語であるか否かを判定する(ステップS41)。
1位候補が位置座標を持たない語である場合の動作は、
例えば図3のステップS22と同様であり、応答生成部
14から全体制御部11に1位候補のみが認識結果とし
て出力される(ステップS42)。
【0073】一方、1位候補が位置座標を持つ場合に
は、応答生成部14の距離判定部140は前記第2の実
施形態(図3のフローチャート参照)と異なって、当該
1位候補の信頼度Rを算出する(ステップS43)。以
下、この信頼度Rについて述べる。
【0074】まず、音声認識部13で取得される認識結
果の照合スコアSは、単位時間(例えばフレーム周期)
ごとのスコアの累積値である。したがって、認識結果の
信頼度Rは単に照合スコアSの大きさだけからは決まら
ない。そこで本実施形態では、認識結果(1位候補)の
信頼度Rを、例えば R=S/T …(3) によって求める。ここでTは認識対象となった音声の長
さ(時間)であり、上述のようにスコアSと共に音声認
識部13から渡される。この(3)式に従う信頼度Rの
算出は距離判定部140で行うものとするが、音声認識
部13で行うようにしてもよい。
【0075】距離判定部140は、1位候補の信頼度R
を算出すると、当該信頼度Rを予め定められた閾値Aと
比較することで、1位候補が信頼できるものであるか否
かを判定する(ステップS44)。
【0076】もし、RがAより大(R>A)ならば、距
離判定部140は1位候補(認識結果)が十分信頼でき
るものと判定する。この場合、応答生成部14は、認識
結果が位置座標を持たない場合、或いは認識結果と基準
点との距離DがTより小さい場合と同様に、確認応答を
生成せず、1位候補のみを全体制御部11に出力する
(ステップS42)。
【0077】一方、RがA以下(R≦A)ならば、距離
判定部140は1位候補(認識結果)は信頼できないも
のと判定する。この場合、距離判定部140は前記第2
の実施形態(で適用した図3のフローチャートのステッ
プS23〜S26)と同様の処理ステップS45〜S4
8による遠近判定(距離判定)を行い、確認応答生成の
判断を行う。
【0078】以上、本発明の第1乃至第5の実施形態に
ついて説明したが、同実施形態における全体制御部1
1、基準点設定部12、音声認識部13、応答生成部1
4の各機能は、ソフトウェアとしても実現可能である。
【0079】また、本発明は、以上の実施形態に係る音
声認識システムで適用した手順、特に応答生成部14で
の遠近判定及び確認メッセージ(確認応答)生成処理
と、全体制御部11でのユーザに対する確認メッセージ
提示処理とを含む所定の手順をコンピュータに実行させ
るための(或いはコンピュータを音声認識システムの持
つ所定の手段として機能させるための、或いはコンピュ
ータに音声認識システムの持つ所定の機能を実現させる
ための)プログラムを記録したコンピュータ読み取り可
能なCD−ROM等の記録媒体として実施することもで
きる。また、このプログラムが通信媒体を介してダウン
ロードされるものであっても構わない。
【0080】この他、本発明の実現形態には上述の例に
対して種々の変形が可能であり、それらも趣旨に反しな
い限り本発明の実施形態の範囲内である。
【0081】
【発明の効果】以上詳述したように本発明によれば、入
力音声に対する認識結果で表される地点が基準点から離
れた場所にあると判定された場合に、ユーザに認識結果
の確認を促す確認応答を提示して、ユーザの指示を仰ぐ
ようにしたので、音声で指定可能な地図上の場所等を表
す語彙の範囲、つまり検索対象範囲を限定することな
く、誤認識による不要な誤動作を回避し、システムの使
い勝手を向上することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る音声認識システムの
概略構成を示すブロック図。
【図2】図1中の音声認識部13が1個の認識結果のみ
を出力する場合の応答生成部14の処理手順を説明する
ためのフローチャート。
【図3】図1中の音声認識部13が複数個の候補を認識
結果として出力する場合の応答生成部14の処理手順を
説明するためのフローチャート。
【図4】図1中の全体制御部11による(図3のフロー
チャートに従って動作する)応答生成部14からの通知
内容に応じた処理手順を説明するためのフローチャー
ト。
【図5】図1中の音声認識部13が複数個の候補を認識
結果として出力する場合の応答生成部14の処理手順の
変形例を説明するためのフローチャート。
【符号の説明】
11…全体制御部(提示手段) 12…基準点設定部 13…音声認識部 14…応答生成部 140…距離判定部(再スコアリング手段)
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 5/06 D Fターム(参考) 2F029 AA02 AB07 AC02 AC18 AD07 5D015 HH12 HH16 KK02 LL04 LL05 LL10 5H180 AA01 FF05 FF25 FF27

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】音声による地図検索が可能なシステムに適
    用される音声認識支援方法であって、 ユーザからの入力音声を認識してその認識結果を取得
    し、 前記認識結果が地図上の地点を表す場合に、その認識結
    果の表す地点から地図検索の基準位置として設定されて
    いる基準点までの距離を判定し、 前記認識結果の表す地点が前記基準点から遠いと判定さ
    れた場合に、当該認識結果の正否の確認をユーザに対し
    て促すための確認応答を生成して、その確認応答をユー
    ザに提示することを特徴とする音声認識支援方法。
  2. 【請求項2】 音声による地図検索が可能なシステムに
    適用される音声認識支援方法であって、 ユーザからの入力音声を認識して複数の認識候補を認識
    結果として取得し、 前記認識結果中の第1位候補が地図上の地点を表す場合
    に、前記認識結果中から地図上の地点を表す認識候補を
    抽出し、 前記抽出された認識候補の各々の入力音声との類似度或
    いは距離を表す照合スコアを、当該認識結果の表す地点
    と地図検索の基準位置として設定されている基準点との
    距離を加味した新たなスコアに変換する再スコアリング
    を行い、 前記再スコアリング後の各認識候補の新たなスコアで決
    まる第1位候補の表す地点から前記基準点までの距離を
    判定し、 前記再スコアリング後の第1位候補の表す地点が前記基
    準点から遠いと判定された場合、前記再スコアリング後
    の所定数を上限とする上位候補について、その認識結果
    の正否の確認をユーザに対して促すための確認応答を生
    成して、その確認応答をユーザに提示することを特徴と
    する音声認識支援方法。
  3. 【請求項3】 前記認識結果の表す地点から前記基準点
    までの距離を判定するための判定基準を、所定のパラメ
    ータに従って変更設定することを特徴とする請求項1ま
    たは請求項2記載の音声認識支援方法。
  4. 【請求項4】 前記基準点を含む距離判定の基準範囲を
    所定のパラメータに従って変更設定し、前記認識結果の
    表す地点から前記基準点までの距離を当該地点の前記基
    準範囲に対する位置関係から判定することを特徴とする
    請求項1または請求項2記載の音声認識支援方法。
  5. 【請求項5】 前記距離判定の対象となる認識結果の信
    頼度を判定し、 信頼できないと判定された場合のみ前記距離判定を行う
    ことを特徴とする請求項1または請求項2記載の音声認
    識支援方法。
  6. 【請求項6】 地図上の地点を表す認識対象語彙を地図
    上の所定の区分に応じて階層化して管理し、 前記認識結果が地図上の地点を表す場合に、その地点か
    ら距離判定の基準となる階層の区分を決定し、その区分
    自体、またはその区分と前記基準点が属す区分との関係
    に応じて前記距離判定を行うことを特徴とする請求項1
    または請求項2記載の音声認識支援方法。
  7. 【請求項7】 地図上の地点を表す認識語彙ごとに前記
    距離判定の基準を指定する属性を予め付与しておき、 前記認識結果の表す地点の前記距離判定を、当該認識結
    果の認識語彙の属性で指定される判定基準に従って行う
    ことを特徴とする請求項1または請求項2記載の音声認
    識支援方法。
  8. 【請求項8】音声による地図検索が可能なシステムに適
    用される音声認識システムであって、 地図検索の基準位置となる基準点を設定する基準点設定
    部手段と、 ユーザからの入力音声を認識してその認識結果を取得す
    る音声認識手段と、 前記音声認識手段により取得された認識結果が地図上の
    地点を表す場合に、当該認識結果の表す地点から前記基
    準点までの距離を判定する距離判定手段と、 前記距離判定手段により前記認識結果の表す地点が前記
    基準点から遠いと判定された場合に、当該認識結果の正
    否の確認をユーザに対して促すための確認応答を生成す
    る応答生成手段と、 前記応答生成手段により生成された確認応答をユーザに
    提示する提示手段とを具備することを特徴とする音声認
    識システム。
  9. 【請求項9】音声による地図検索が可能なシステムに適
    用される音声認識システムであって、 地図検索の基準位置となる基準点を設定する基準点設定
    部手段と、 ユーザからの入力音声を認識して複数の認識候補を認識
    結果として取得する音声認識手段と、 前記音声認識手段により取得された認識結果中の第1位
    候補が地図上の地点を表す場合に、前記認識結果中から
    地図上の地点を表す認識候補を抽出して、その抽出した
    認識候補の各々の入力音声との類似度或いは距離を表す
    照合スコアを、当該認識結果の表す地点と前記基準点と
    の距離を加味した新たなスコアに変換する再スコアリン
    グを行う再スコアリング手段と、 前記再スコアリング手段による再スコアリング後の各認
    識候補の新たなスコアで決まる第1位候補の表す地点か
    ら前記基準点までの距離を判定する距離判定手段と、 前記距離判定手段により前記再スコアリング後の第1位
    候補の表す地点が前記基準点から遠いと判定された場
    合、前記再スコアリング後の所定数を上限とする上位候
    補について、その認識結果の正否の確認をユーザに対し
    て促すための確認応答を生成する応答生成手段と、 前記応答生成手段により生成された確認応答をユーザに
    提示する提示手段とを具備することを特徴とする音声認
    識システム。
JP18585999A 1999-06-30 1999-06-30 音声認識支援方法及び音声認識システム Expired - Fee Related JP3990075B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP18585999A JP3990075B2 (ja) 1999-06-30 1999-06-30 音声認識支援方法及び音声認識システム
US09/606,150 US6718304B1 (en) 1999-06-30 2000-06-29 Speech recognition support method and apparatus
US10/687,707 US6978237B2 (en) 1999-06-30 2003-10-20 Speech recognition support method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18585999A JP3990075B2 (ja) 1999-06-30 1999-06-30 音声認識支援方法及び音声認識システム

Publications (2)

Publication Number Publication Date
JP2001013991A true JP2001013991A (ja) 2001-01-19
JP3990075B2 JP3990075B2 (ja) 2007-10-10

Family

ID=16178138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18585999A Expired - Fee Related JP3990075B2 (ja) 1999-06-30 1999-06-30 音声認識支援方法及び音声認識システム

Country Status (2)

Country Link
US (2) US6718304B1 (ja)
JP (1) JP3990075B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004048352A (ja) * 2002-07-11 2004-02-12 Denso Corp 通信システムおよび情報通信方法
EP1542207A1 (en) * 2003-12-12 2005-06-15 Canon Kabushiki Kaisha Speech recognition method and apparatus
JP2006251800A (ja) * 2005-03-07 2006-09-21 Samsung Electronics Co Ltd ユーザ適応型の音声認識方法及び音声認識装置
JP2019040522A (ja) * 2017-08-28 2019-03-14 株式会社東芝 移動体運行支援システム

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3990075B2 (ja) * 1999-06-30 2007-10-10 株式会社東芝 音声認識支援方法及び音声認識システム
JP4080680B2 (ja) * 2000-07-13 2008-04-23 パイオニア株式会社 携帯情報端末機および携帯情報端末機による施設内画像情報提供システム
US20020111810A1 (en) * 2001-02-15 2002-08-15 Khan M. Salahuddin Spatially built word list for automatic speech recognition program and method for formation thereof
JP4094335B2 (ja) * 2002-04-26 2008-06-04 松下電器産業株式会社 地図編集表示装置、地図管理システム、地図管理方法および地図記憶媒体
US20070217693A1 (en) * 2004-07-02 2007-09-20 Texttech, Llc Automated evaluation systems & methods
US7630900B1 (en) * 2004-12-01 2009-12-08 Tellme Networks, Inc. Method and system for selecting grammars based on geographic information associated with a caller
TWI269268B (en) * 2005-01-24 2006-12-21 Delta Electronics Inc Speech recognizing method and system
EP1734509A1 (en) * 2005-06-17 2006-12-20 Harman Becker Automotive Systems GmbH Method and system for speech recognition
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
JP2007047412A (ja) * 2005-08-09 2007-02-22 Toshiba Corp 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置
US7590536B2 (en) 2005-10-07 2009-09-15 Nuance Communications, Inc. Voice language model adjustment based on user affinity
KR101063607B1 (ko) * 2005-10-14 2011-09-07 주식회사 현대오토넷 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법
JP2007286356A (ja) * 2006-04-17 2007-11-01 Funai Electric Co Ltd 電子機器
US7831431B2 (en) * 2006-10-31 2010-11-09 Honda Motor Co., Ltd. Voice recognition updates via remote broadcast signal
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
JP5199391B2 (ja) * 2008-11-25 2013-05-15 旭化成株式会社 重み係数生成装置、音声認識装置、ナビゲーション装置、車両、重み係数生成方法、及び重み係数生成プログラム
WO2010085007A1 (ko) * 2009-01-21 2010-07-29 한국과학기술연구원 진동촉각장치 및 이를 이용한 진동 방법
KR101054303B1 (ko) * 2009-05-19 2011-08-08 한국과학기술연구원 진동햅틱 모바일기기 및 그 구동방법
US8239129B2 (en) * 2009-07-27 2012-08-07 Robert Bosch Gmbh Method and system for improving speech recognition accuracy by use of geographic information
US8701074B2 (en) 2010-04-13 2014-04-15 Synopsys, Inc. Automatic reduction of modes of electronic circuits for timing analysis
JP2012043000A (ja) * 2010-08-12 2012-03-01 Sony Corp 検索装置、検索方法、及び、プログラム
EP2503290A1 (en) * 2011-03-22 2012-09-26 Harman Becker Automotive Systems GmbH Curved labeling in digital maps
EP2503292B1 (en) 2011-03-22 2016-01-06 Harman Becker Automotive Systems GmbH Landmark icons in digital maps
JP6221301B2 (ja) * 2013-03-28 2017-11-01 富士通株式会社 音声処理装置、音声処理システムおよび音声処理方法
US20170262051A1 (en) * 2015-03-20 2017-09-14 The Eye Tribe Method for refining control by combining eye tracking and voice recognition
JP6663826B2 (ja) * 2016-09-08 2020-03-13 株式会社日立製作所 計算機及び応答の生成方法
KR102338990B1 (ko) * 2017-01-23 2021-12-14 현대자동차주식회사 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
DE102017216513A1 (de) * 2017-09-19 2018-09-27 Audi Ag Verfahren zum Verarbeiten einer Spracheingabe, über welche ein Benutzer eine Ortsangabe an einem Bedienterminal vorgibt, sowie Bedienvorrichtung und Kraftfahrzeug

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274560A (en) * 1990-12-03 1993-12-28 Audio Navigation Systems, Inc. Sensor free vehicle navigation system utilizing a voice input/output interface for routing a driver from his source point to his destination point
US5566272A (en) * 1993-10-27 1996-10-15 Lucent Technologies Inc. Automatic speech recognition (ASR) processing using confidence measures
US6732077B1 (en) * 1995-05-12 2004-05-04 Trimble Navigation Limited Speech recognizing GIS/GPS/AVL system
JPH09114489A (ja) * 1995-10-16 1997-05-02 Sony Corp 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車
US6067521A (en) * 1995-10-16 2000-05-23 Sony Corporation Interrupt correction of speech recognition for a navigation device
US6680694B1 (en) * 1997-08-19 2004-01-20 Siemens Vdo Automotive Corporation Vehicle information system
US6707421B1 (en) * 1997-08-19 2004-03-16 Siemens Vdo Automotive Corporation Driver information system
DE19813605A1 (de) * 1998-03-27 1999-09-30 Daimlerchrysler Aerospace Ag Erkennungssystem
US6598016B1 (en) * 1998-10-20 2003-07-22 Tele Atlas North America, Inc. System for using speech recognition with map data
US6522875B1 (en) * 1998-11-17 2003-02-18 Eric Morgan Dowling Geographical web browser, methods, apparatus and systems
US6526135B1 (en) * 1998-11-18 2003-02-25 Nortel Networks Limited Automated competitive business call distribution (ACBCD) system
KR100443495B1 (ko) * 1998-11-24 2004-08-09 마쯔시다덴기산교 가부시키가이샤 디지털 지도파일의 데이터구조
JP3990075B2 (ja) * 1999-06-30 2007-10-10 株式会社東芝 音声認識支援方法及び音声認識システム
US6349257B1 (en) * 1999-09-15 2002-02-19 International Business Machines Corporation System for personalized mobile navigation information
US6553310B1 (en) * 2000-11-14 2003-04-22 Hewlett-Packard Company Method of and apparatus for topologically based retrieval of information
US6490521B2 (en) * 2000-12-28 2002-12-03 Intel Corporation Voice-controlled navigation device utilizing wireless data transmission for obtaining maps and real-time overlay information

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004048352A (ja) * 2002-07-11 2004-02-12 Denso Corp 通信システムおよび情報通信方法
EP1542207A1 (en) * 2003-12-12 2005-06-15 Canon Kabushiki Kaisha Speech recognition method and apparatus
US7624011B2 (en) 2003-12-12 2009-11-24 Canon Kabushiki Kaisha Speech recognition method computer readable medium and apparatus for recognizing geographical names using weight information
JP2006251800A (ja) * 2005-03-07 2006-09-21 Samsung Electronics Co Ltd ユーザ適応型の音声認識方法及び音声認識装置
JP4709663B2 (ja) * 2005-03-07 2011-06-22 三星電子株式会社 ユーザ適応型の音声認識方法及び音声認識装置
JP2019040522A (ja) * 2017-08-28 2019-03-14 株式会社東芝 移動体運行支援システム

Also Published As

Publication number Publication date
US6978237B2 (en) 2005-12-20
JP3990075B2 (ja) 2007-10-10
US20040083108A1 (en) 2004-04-29
US6718304B1 (en) 2004-04-06

Similar Documents

Publication Publication Date Title
JP2001013991A (ja) 音声認識支援方法及び音声認識システム
KR100556050B1 (ko) 적어도위치및/또는거리이름들을위한입력시스템
US6385582B1 (en) Man-machine system equipped with speech recognition device
JP5158174B2 (ja) 音声認識装置
JP5334178B2 (ja) 音声認識装置およびデータ更新方法
US6598018B1 (en) Method for natural dialog interface to car devices
JP4040573B2 (ja) 音声認識装置および方法
JP4116233B2 (ja) 音声認識装置ならびにその方法
US6961706B2 (en) Speech recognition method and apparatus
JP3948441B2 (ja) 音声認識方法及び、車載装置
JP2002123290A (ja) 音声認識装置ならびに音声認識方法
JP4930486B2 (ja) 音声認識システム及びナビゲーション装置
US6950797B1 (en) Voice reference apparatus, recording medium recording voice reference control program and voice recognition navigation apparatus
JP2007505365A (ja) 音声制御ナビゲーションシステムの操作方法
JP4639990B2 (ja) 音声対話装置及び音声理解結果生成方法
JP3718088B2 (ja) 音声認識修正方式
JP4268325B2 (ja) 音声操作語句の提示装置及び提示方法
JP2010128144A (ja) 音声認識装置及びプログラム
JP3849283B2 (ja) 音声認識装置
JP3500948B2 (ja) 音声認識装置
JP2007065206A (ja) 施設検索装置
JPWO2006028171A1 (ja) データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体
JP3911835B2 (ja) 音声認識装置及びナビゲーションシステム
JP2003005783A (ja) ナビゲーションシステムおよびその目的地入力方法
JP2005114964A (ja) 音声認識方法および音声認識処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070717

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070719

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100727

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110727

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees