JP6571118B2 - 音声認識処理のための方法、車載システム及び不揮発性記憶媒体 - Google Patents

音声認識処理のための方法、車載システム及び不揮発性記憶媒体 Download PDF

Info

Publication number
JP6571118B2
JP6571118B2 JP2017002835A JP2017002835A JP6571118B2 JP 6571118 B2 JP6571118 B2 JP 6571118B2 JP 2017002835 A JP2017002835 A JP 2017002835A JP 2017002835 A JP2017002835 A JP 2017002835A JP 6571118 B2 JP6571118 B2 JP 6571118B2
Authority
JP
Japan
Prior art keywords
vehicle
voice
voice recognition
input information
recognition system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2017002835A
Other languages
English (en)
Other versions
JP2017097373A (ja
Inventor
ハン,リッチー
バゲフィナザリ,ペドラム
ヤマモト,スチュアート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Publication of JP2017097373A publication Critical patent/JP2017097373A/ja
Application granted granted Critical
Publication of JP6571118B2 publication Critical patent/JP6571118B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/72Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for transmitting results of analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Navigation (AREA)

Description

(関連出願)
本出願は、2010年6月24日付けの米国特許仮出願第61/358,407号に関連しており、当該仮出願を基礎とする優先権を主張して日本国特許庁に出願した特願2013−516786の分割出願であり、当該仮出願はその全体がここに引用される。
当該実施形態は、車両通信システム及び方法の分野に関する。
従来型の車両は、可聴命令、例えば音声を使用して様々な車両特徴を実施する。車両内での処理能力が制限されていることに起因して、車載音声認識システムは、車両外音声認識システムほど確実ではなく、認識結果が不正確になり得る。しかしながら、車両外音声認識システムを使用すると、反応時間がより長くなり得る。
車両内において音声認識が時間的及び文脈的に制約される場合であってもロバストな音声認識を提供する、車両向けの音声認識システム及び方法が必要とされている。
車両内においてコンピュータを使用する方法は、まず、音声入力を受け取り、第1の入力音声に対する音声認識処理が、車載音声認識システムによって実行されるべきであるか、それとも、車両外の音声認識システムを使用して実行されるべきであるかを判断し、車両内において音声認識処理が実行されるべきであると判断された場合は、コンピュータを使用する音声認識処理を車両内で第1の音声入力情報に対して実行し、車両外において音声認識処理が実行されるべきであると判断された場合は、第1の音声入力情報を車両外のシステムに送信する。
本明細書に記述されている特徴及び利点は、限定的なものではなく、図面、明細書及び特許請求の範囲を見れば、当業者には、追加的な特徴及び利点が明らかになる。さらに、本明細書中で使用される用語は、主として意味の取りやすさ及び教示目的から選択されており、本発明の主旨を限定するために選択されているものではないことは当然である。
実施形態が作動し得る環境を示す図である。 ある実施形態に係る携帯通信装置の詳細図である。 ある実施形態に係る車載システムの詳細図である。 ある実施形態に係るサーバ装置の詳細図である。 ある実施形態に係る音声認識システムの処理を示すフローチャートである。 ある実施形態に係るステップ504の処理を示すフローチャートである。 ある実施形態に係るステップ504の処理を示すフローチャートである。 ある実施形態に係るユーザ命令/情報要求に応答するシステムを示す図である。
(詳細な説明)
本発明の好適な一実施形態を、図を参照しつつ説明する。複数の図に跨って同様の参照番号が記される場合、それらは同一の又は機能的に類似した構成要素を意味する。参照番号の最も左の数字は、当該参照番号が初めて使用された図の番号に対応している。
本明細書において、“ある実施形態”又は“一実施形態”と言う場合は、本発明の少なくとも1つの実施形態に、その実施形態に関連して記述される1つの特徴又は構造が含まれていることを意味する。本明細書のあちこちに“ある実施形態においては”という語が出現しても、必ずしも同一の実施形態を指しているわけではない。
後記する詳細説明のいくつかの部分は、アルゴリズム用語や、コンピュータメモリ内のデータビット作業を示す象徴的な表現による。これらのアルゴリズム的な説明や表現は、情報処理分野の当業者が、自らの業績の要旨を、同分野の他の当業者に最も効率的に伝えるために用いる手段である。アルゴリズムとは、ここでは、そして一般的にも、ある所望の結果に至る複数のステップ(指示)の首尾一貫したシーケンスのことを言う。ステップとは、物理量に対する物理的操作を要求するステップのことである。通常、必ずしも必要条件ではないが、それらの数値は、記憶され、転送され、合成され、比較されかつ操作され得る、電子的、磁気的又は光学的信号の形を取る。これらの信号のことを、ビット、値、要素、シンボル、文字、語又は番号等と呼ぶことが主として用語の共通化の理由から便宜である。さらに、物理量に対する物理的操作を要求するステップの配列のうちいくつかのものは、一般性を失うことなく、モジュール又はコードデバイスと呼ぶことが便宜である。
しかしながら、このような用語の全ては適当な物理量と結び付けられており、これらの物理量に付された単なる便宜的なラベルに過ぎない。後記において特段の説明がない限り、明細書本文全体を通じて、“処理”、“計算”、“算出”、“決定”又は“表示”等の用語を用いた説明は、(電子的な)物理量としてのデータを、コンピュータシステムのメモリ、レジスタ又は他の情報ストレージのなかで操作しかつ変形するコンピュータシステムや同様の電子的コンピューティング機器の動作や処理のことを言う。
本実施形態のいくつかの側面は、アルゴリズムの形になったプロセスステップや指示を含む。本実施形態のプロセスステップや指示は、ソフトウエア、ファームウエア又はハードウエアによって実施され、ソフトウエアで実施される場合は、ダウンロードされることが可能であり、多様なオペレーティングシステムが用いる別のプラットフォームから操作されることも可能である。本実施形態は、コンピューティングシステム上で実行され得るコンピュータプログラム製品でもあり得る。
本実施形態は、操作を実行する装置にも関する。この装置は、所与の目的を達成する専用装置であってもよいし、コンピュータに記憶されたコンピュータプログラムによって動作する汎用コンピュータであってもよい。このようなコンピュータプログラムは、コンピュータが読取り可能な媒体に記憶され得る。その媒体とは、コンピュータシステムバスに接続可能な、フロッピーディスク(登録商標)、光ディスク、CD−ROM、電磁光学的ディスク、ROM、RAM、EPROM、EEPROM、電磁的又は光学的カード、ASIC又は電子的命令を記憶し得るあらゆる媒体を含むが、これらに限定されない。さらに、本明細書で言うコンピュータは、単体のプロセッサを含んでもよいし、コンピュータ能力を増加させるために複数のプロセッサを用いた装置であってもよい。
ここでいうアルゴリズムやディスプレイは、もともと特定のコンピュータや他の装置に関係している訳ではない。ここで教示される内容に従って、プログラムとともに多様な一般目的システムが使用され得る。又は、必要とされる方法ステップを実行するためにさらに特化した装置を作成することも便宜である。これらのシステムのそれぞれについてどのような構成が必要となるかは、後記する明細書本文から明らかになる。さらには、本実施形態は特定のプログラム言語を参照して記載されるものではない。本実施形態の教示を実装するために、多様なプログラム言語が使用され得る。後記において特定の言語に言及した場合、それは本実施形態の実施可能性及びベストモードを開示するためである。
さらに、本明細書で使用される言語は、主として意味の取りやすさ及び教示目的から選択されているのであって、本発明の主旨を限定するために選択されているのではない。従って、本実施形態の開示は、例示的なものであって、限定的なものではない。
図1は、様々な実施形態についての動作環境100の例を示す。動作環境100は、車載システム102、オプションである無線携帯通信装置104、車載システム102及びネットワーク108間を通信する、オプションである通信リンク105、車載システム102及び無線携帯通信装置104間を通信する、オプションである短距離通信リンク106、無線携帯通信装置104及びネットワーク108間を通信する、オプションである無線ネットワーク通信リンク107、並びに、ネットワーク108に接続されたサーバ110のような処理装置を含む。ここに記述される通信リンクは、2つの装置を直接的に又は間接的に接続し得る。
車載システム102及び無線携帯通信装置104は、短距離通信リンク106を介して相互に通信し得る。短距離通信リンク106は、例えばブルートゥース(登録商標)技術のような短距離通信技術、又は、例えばユニバーサルシリアルバス(USB)のような他の短距離通信技術を使用する。車載システム102及び無線携帯通信装置104は、短距離通信リンク106を介して相互に接続されて対になり得る。
携帯通信装置(MCD)104の例としては、セルラーフォン、パーソナルデバイスアシスタント(PDA)、スマートフォン、ラップトップ型コンピュータ、又は、例えば演算能力及び通信能力を備え容易に運搬され得る他の装置が存在する。一般的には、MCD104のアプリケーションは、車両と相互作用を行うより広範囲なソフトウエアの一部となり得る。アプリケーションの例としては、カリフォルニア州クパチーノ所在のアップルコンピュータ社から市販されているアイフォン(登録商標)向けアプリケーション、カリフォルニア州マウンテンビュー所在のグーグル社から市販されているアンドロイド(登録商標)オペレーティングシステムを使用する電話向けアプリケーションが存在する。
代替的な実施形態においては、携帯通信装置104は使用されず、その代わりに、車両組み込み電話、無線ネットワークカード又は他の装置(例えば、Wi−Fi適合装置)のような車両に組み込まれた通信装置が使用される。説明を容易にするために、本明細書は、携帯通信装置104を使用する実施形態の操作を記述する。しかしながら、このことは、本実施形態の主旨を限定するものではない。前記したように、他の実施形態は、車載システム102とネットワーク108の間の他の通信システムを使用する。
車載システム102は、無線携帯通信装置104に情報を送信してもよい。無線携帯通信装置104は、短距離通信リンク106を介して車載システム102に情報を送信してもよい。無線携帯通信装置104は、車載システム102から受け取った情報を格納してもよいし、ネットワーク108を介して例えばサーバ110のような遠隔処理装置に対して情報を提供してもよい。
ある実施形態においては、車載システム102は、無線携帯通信装置104に情報を提供してもよい。無線携帯通信装置104は、その情報を使用して、ネットワーク108及び/又はサーバ110から追加情報を入手してもよい。無線携帯通信装置104に対して車載システム102が入力を促す案内を送信し、その案内に応答する情報が提供されると、当該追加情報が入手されることとしてもよい。
ネットワーク108は、無線通信ネットワーク、例えばセルラ電話ネットワークを含んでもよいし、インターネット、公衆電話網(PSTN)、パケット交換ネットワーク、フレームリレーネットワーク、光ファイバーネットワーク、及び/又は、他のタイプのネットワークのような1又は複数の他のネットワークを含んでもよい。
図2は、無線携帯通信装置104の実施例の機能ブロック図である。無線携帯通信装置104は、プロセッサ202、メモリ204、短距離通信モジュール206、無線ネットワーク通信モジュール208、入力装置210、出力装置212及び記憶装置218を含んでもよい。
プロセッサ202は、メモリ204又はメディアカード、フラッシュ(登録商標)RAM又は他の有体媒体であり得る記憶装置218のような有体媒体内に記憶された指示を解釈し実行する1又は複数の従来型のプロセッサを含んでもよい。ここで記述されるように、メモリ204は、プロセッサ202が実行する情報及び指示を記憶するために、ランダムアクセスメモリ(RAM)又は他のタイプの動的記憶装置、及び、読出専用メモリ(RОM)又は他のタイプの静的記憶装置を含んでもよい。RAM又は他のタイプの動的記憶装置は、指示を記憶してもよいし、プロセッサ202が指示を実行する間に使用される一時的変数又は中間情報を記憶してもよい。RОM又は他のタイプの静的記憶装置は、プロセッサ202向けの不変の情報及び不変の指示を記憶してもよい。
短距離通信モジュール206は、例えばブルートゥース(登録商標)又は他の短距離通信技術、例えばユニバーサルシリアルバス(USB)のような無線短距離通信技術を介して情報を送受信する第1の送受信機を含んでもよい。無線ネットワーク通信モジュール208は、セルラ電話ネットワークを含むがそれに限定されない無線通信ネットワークを介して情報を送受信する第2の送受信機を含んでもよい。
入力装置210は、ハードキー、ソフトキー、マイクロフォン、タッチスクリーン、及び/又は、他の入力装置を含んでもよい。出力装置212は、スピーカ及び/又はディスプレイを含んでもよい。
図3は、車載システム102の実施例の機能ブロック図である。車載システム102は、プロセッサ302、メモリ304、短距離通信モジュール306、入力装置310、出力装置312、衛星通信モジュール316、記憶装置318及び音声認識モジュール320を含んでもよい。
プロセッサ302は、メモリ304又はメディアカード、フラッシュ(登録商標)RAM又は他の有体媒体のような有体媒体内に記憶された指示を解釈し実行する1又は複数の従来型のプロセッサを含んでもよい。メモリ304は、プロセッサ302が実行する情報及び指示を記憶するために、ランダムアクセスメモリ(RAM)又は他のタイプの動的記憶装置、及び、読出専用メモリ(RОM)又は他のタイプの静的記憶装置を含んでもよい。RAM又は他のタイプの動的記憶装置は、指示を記憶してもよいし、プロセッサ302が指示を実行する間に使用される一時的変数又は中間情報を記憶してもよい。RОM又は他のタイプの静的記憶装置は、前記したように、プロセッサ302向けの不変の情報及び不変の指示を記憶してもよい。
短距離通信モジュール306は、例えばブルートゥース(登録商標)又は他の短距離通信技術、例えばユニバーサルシリアルバス(USB)、Wi−Fi等のような無線短距離通信技術を介して情報を送受信する送受信機を含んでもよい。
入力装置310は、ハードキー、ソフトキー、マイクロフォン、タッチスクリーン、及び/又は、他の入力装置を含んでもよい。出力装置312は、スピーカ及び/又はディスプレイを含んでもよい。
ある実施形態においては、車載システム102の構成部品は、車載システム102を搭載する車両のユーザを目的地に案内するナビゲーションユニットを含んでもよい。つまり、車載システム102の少なくともいくつかの構成要素が協働してナビゲーションユニットとなってもよい。車載システム102がナビゲーションユニットを含むとき、車載システム102は、全地球測位衛星と通信する衛星通信モジュール316を含むものでもよい。ナビゲーションユニットは、行先地点のデータベースを含んでもよい。当該データベースは、車両のユーザがそこに行くことを希望する様々な場所についての情報を格納する。行先地点は、食事、買い物、緊急サービス等のようなカテゴリごとに並べられてもよい。
音声認識モジュール320は、プロセッサ、メモリ及び/又は記憶装置を自ら備えることもでき、車両内にあるプロッセッサ302、メモリ304及び記憶装置318のうちの1又は複数を共用することもできる。音声認識モジュール320は、1又は複数のユーザの音声プロフィールを記憶し、例えば1又は複数のユーザが話す命令、要求及び/又は質問を認識することができる。
図4は、サーバ110の実施例の機能ブロック図である。サーバ110は、プロセッサ402、メモリ404、ネットワーク通信モジュール408、入力装置410、出力装置412、記憶装置414及び音声認識モジュール420を含んでもよい。
プロセッサ402は、メモリ404又はメディアカード、フラッシュ(登録商標)RAM又は他の有体媒体のような有体媒体内に記憶された指示を解釈し実行する1又は複数の従来型のプロセッサを含んでもよい。ここで記述されるように、メモリ404は、プロセッサ402が実行する情報及び指示を記憶するために、ランダムアクセスメモリ(RAM)又は他のタイプの動的記憶装置、及び、読出専用メモリ(RОM)又は他のタイプの静的記憶装置を含んでもよい。RAM又は他のタイプの動的記憶装置は、指示を記憶するだけではなく、プロセッサ402が指示を実行する間に使用する一時的変数又は中間情報を記憶するものでもよい。RОM又は他のタイプの静的記憶装置は、プロセッサ402向けの不変の情報及び不変の指示を記憶してもよい。
音声認識モジュール420は、プロセッサ、メモリ及び/又は記憶装置を自ら備えることもでき、プロッセッサ402、メモリ404及び記憶装置414のうちの1又は複数を共用することもできる。音声認識モジュール420は、1又は複数のユーザの音声プロフィールを記憶し、例えば1又は複数のユーザが話す命令、要求及び/又は質問を認識することができる。
ネットワーク通信モジュール408は、ネットワーク108又は他のネットワーク、例えば、ワイドエリアネットワーク、ローカルエリアネットワーク、インターネット等のような有線又は無線通信ネットワークを介して情報を送受信する送受信機を含んでもよい。
図5は、ある実施形態に係る音声認識システムの処理を示すフローチャートである。ステップ502において、入力装置310が、音声命令(VC)を受け取る。一例では、ユーザが例えば車両内のハードキー/ソフトキーを押下することによって音声命令を起動する。そして、命令、要求、質問等を発話する。説明を容易にするため、命令、要求、質問等の任意の入力情報を含む概念として命令という語を使用する。音声命令は、デジタル情報に変換されたうえでデジタル情報として記憶され、又は、アナログ情報のまま記憶され得る。説明を容易にするため、ここでは、デジタル情報の例を説明する。車両は、車両自身が車載機により音声認識を実行するか、それとも、例えばサーバ110、820内において、車両外音声認識モジュール420が車外機によりで音声認識を実行するかを決定する。車載音声認識システム320及び車載音声認識システム420の例としては、ニューヨーク州アーモンク所在のIBM社から市販されているバイアボイス、マサチューセッツ州バーリントン所在のニュアンスコミュニケーション社から市販されているニュアンス音声認識、及び、ワシントン州ベルビュ所在のボイスボックステクノロジ社から市販されているMA及びボイスボックス音声認識がある。
プロッセッサ302は、入力装置310から入力信号を受け取り、要求の文脈を識別する。例えば、文脈は、ハードキー/ソフトキーの押下(通話キー又は全地球命令キー)、及び/又は、出力装置312に表示される情報(例えば、ナビゲーション、音声、ビデオ)に基づき得る。ステップ504において、車載システム102は、車載音声認識モジュール320を使用して音声認識を実行するか、それとも、車両外音声認識モジュール420を使用して音声認識を実行するかを判断する。図6及び図7は、どのようにして当該判断がなされ得るかを例示する。
図6は、ある実施形態に係るステップ504の処理を示すフローチャートである。この実施形態においては、ステップ604において、決定された文脈は、車載音声認識モジュール320を使用して音声認識を実行するか、それとも、車両外音声認識モジュール420を使用して音声認識(VR)を実行するかを判断するのに使用される。例えば、音声制御がディスプレイスクリーン上の情報と関係している車両内において、ディスプレイスクリーンが、例えばCD、DVD等の音声ディスクを再生していることを示す場合は、音声命令の文脈が車載音声システムに関するものであるので、音声命令の文脈は車載機で分析されるべきであると車載システムは判断する。なぜならば、分析速度はより速く、分析信頼度はより高くなることが見込まれ、分析正確度も一般的に高いからである。
ステップ604において、最初の判断が、車載機で音声認識を実行するという判断であった場合は、ステップ606において、音声命令(VC)は、車載音声認識モジュール320に入力される。車載音声認識モジュール320は、音声認識技術を使用して、音声命令を分析する。多くの音声認識技術が使用され得る。信頼度値決定の一例は、“Jang,音声認識のための信頼度測定、A Survey.2004 Speech Communication”に公表されており、www.sciencedirect.comにおいても利用可能である。当該例は、その全体が参照によってここに組み込まれるものとする。
ステップ608において、音声認識モジュール320によって決定された信頼度値が、第1の閾値(T1)より大きい場合、処理はステップ510(図5)に進む。ステップ510において、音声認識分析の結果は、車両のユーザ又はドライバに対応する音声プロフィールとして車両内に記憶され得る(分析の結果は、オプションとして、サーバ110に送信されて車両外に位置する音声プロフィールに記憶される)。以降、ステップ534において、命令が実行され得る。または、要求された情報がユーザに提示され得る。
ステップ608において、音声認識モジュール320によって決定された信頼度値が、第1の閾値(T1)を超過しない場合、つまり、車載音声認識モジュールが満足し得る結果を生まなかった場合、この実施形態においては、音声命令は、車両外音声認識モジュール420に送信される。車両外音声認識モジュール420は、より高い処理能力を有し、より高い信頼度値で音声命令の意味を決定することができる。そして、処理は、後記するステップ526に進む。ステップ720を参照して後記するように、追加情報が音声命令とともに送信されてもよい。
第1の閾値は、多くの閾値の候補のうちの1つであってもよく、どの候補を選ぶかによって結果が違ってくる。例えば、信頼度値が低いと、システムは、他の動作をなんら実行することなく、ユーザに対し命令を繰り返し入力することを要求することになり得る。
図7は、ある実施形態に係るステップ504の処理を示すフローチャートである。図7に示されるステップは、そのすべてが要求されるわけではなく、図示されている順序で実行される必要もない。図7に示されるステップは、図6に示されるステップと組み合わされ得る。ステップ504において、車載システム102は、車載音声認識モジュール320を使用して音声認識を実行するか、それとも、車両外音声認識モジュール420を使用して音声認識を実行するかを判断する。ステップ502において、車載システム102は、音声命令を受け取る。車載システム102は、命令の特性、及び/又は、例えば、音声の型、周波数、速度、韻律、明瞭度、諧調、ピッチ、サイズ、方向、量、及び/又は継続時間のような音声の特性を決定する。特性は、例えば、命令は約5秒より短いか、音声は、男声であるかそれとも女声であるか、話者は早口で話しているか、である。図7に示される実施形態においては、サイズが例として使用されており、以降の記述においても使用される。これらの例は、単に代表的なものであり、継続時間又は他の要因が使用され得る。ステップ702において、命令のサイズが大きすぎる場合、例えば、サイズが第1のサイズ閾値S1を超過する場合、車載システム102は、ステップ708に進む。長い継続期間を有する命令の一例は、ユーザが、長いテキストメッセージを送信することを要求したい場合である。ステップ702において、命令のサイズが大きすぎない場合、車載システム102は、車載音声認識モジュール320を使用して信頼度値(CS)を決定する。ステップ704において、信頼度値が第1の閾値(T1)を超過しない場合は、車載システム102は、ステップ708に進む。
信頼度値が第1の閾値(T1)を超過する場合は、命令/要求は、処理に充分な信頼度を有していることがわかる。ステップ706において、車載システムは、決定された命令/要求が車両内で実行されるべきか、それとも、車両外で実行されるべきかを判断する。例えば、いくつかの実施形態においては、音声制御命令、周辺機器制御命令、環境命令(例えば、車両内気温の調整、送風機速度の調整)、不変のデータ、緊急関連要求(例えば、911番通報、最寄病院についての情報要求)、ハンズフリーリンク(登録商標)(HFL)命令及び住所入力のようないくつかの命令/要求は、車両内で解釈されるべきである。車両外で実行されるべき命令/要求の例としては、ニュース若しくは他の動的データの入手、電子メール若しくはテキストメッセージの送信、イベントチケットの購入、予約、行先地点の検索、又は、天気予報若しくはリアルタイム交通情報の入手がある。
ステップ706において、決定された命令/要求が、車両内で実行されるべきものである場合は、処理はステップ510に進む。
ステップ706において、命令が、車載機で実行されるべきものでない場合(例えば、リアルタイム交通情報又はレストラン営業時間の詳細を入手する場合)は、ステップ708において、車載システム102は、車載システム102及びサーバ110の間に、通信リンク105、106、107のうちのいずれかに対する接続問題(connectivity issues)が存在するか否かを判断する。ステップ708において、通信障害がありデータが正確に送受信できない場合は、ステップ710において、車載システム102は、識別された命令が車載機で実行され得るか否かを判断する。実行され得る場合は、処理はステップ510に進む。ステップ710において、識別された命令が車載機で実行され得ない場合、又は、命令が不明である場合(例えば、命令の情報量が多すぎる、命令が信頼度の低い因子を有する場合)、ステップ712において、車載システム102は、ユーザと通信し、音声命令を再入力することを要求する。代替的に、ステップ712において、エラーメッセージが送信され得る。当該エラーメッセージは、接続問題は命令が現時点で実行されることを禁止している旨を記述する。代替的な実施形態においては、接続障害がもはや存在しなくなったとき、車載システム102は、音声命令を記憶し、サーバ110に要求を送信する。
ステップ708において、接続問題が存在しない場合は、ステップ720において、車載システムは、音声命令を送信し、車両外音声認識モジュール420によって使用され得る追加的なユーザプロフィール関連情報及び/又は車両情報を提供する。ステップ720の送信に含まれ得る情報のタイプは、以降で詳細に記述される。
ステップ504において、音声命令がサーバで実行されるべきであると判断された場合は、ステップ526において、車両外音声認識モジュール420は、受け取った命令の音声認識分析を実行する。プロセッサ402は処理能力がより高く、メモリ404及び記憶装置414はより多くの利用可能なデータを記憶し、他のネットワークから追加リソースが使用され得るので、サーバ内の車両外音声認識モジュール420は、処理能力がより高いエンジン/モジュールとなる。さらに、後記するように、車両に関係する複数のユーザプロフィールが使用されて、ユーザの命令/要求を正確に解釈することを支援する。ステップ528において、車両外音声認識モジュール420によって決定された信頼度値が第2の閾値T2(T2はT1とは別の値であってもよい)を超過する場合は、ステップ530において、音声認識の結果がサーバ110に記憶され、ステップ532において、当該結果が車両に送信され得る。すると、ステップ510において、車内で当該結果が記憶され得る。ステップ534において、車両は、識別された命令を実行し得る(又は、要求された情報を送信し得る)。サーバ及び/又は車両に記憶された結果は、将来の性能を向上させるために音声認識モジュール320、420にフィードバックすることもできる。
ステップ528において、車両外音声認識モジュール420によって決定された信頼度値が第2の閾値(T2)を超過しない場合は、ステップ540において、ユーザは音声命令の再入力を要求され、処理はステップ502に戻る。
他の実施形態において、音声命令は、車載音声認識モジュール320及び車両外音声認識モジュール420の両者に送信される。両者の結果は車載システム102によって集められ、ユーザに送信される。両者の音声認識の結果が相違する場合は、両者の信頼度値の値同士が比較され、信頼度値が高い方の結果が採用され得る。代替的に、音声命令を分析するリソースをより多く有するものと予定され、したがってより正確である可能性が高い車両外音声認識モジュール420の結果を、初期値として使用してもよい。車載音声認識モジュール320からの結果がユーザに送信される場合、又は、車載システム102が車載音声認識モジュール320から結果を受け取る前に命令が実行される場合は、車載システムは、遅い方の結果を無視してもよいし、ユーザに送信してもよいし、実行してもよい。
前記したように、ステップ708において、接続問題が存在しない場合、ステップ720において、車載システムは、音声命令を車両外音声認識モジュール420に送信し、車両外音声認識モジュール420が利用する追加的なユーザプロフィール関連情報及び/又は車両情報を提供し得る。音声命令が車両外音声認識モジュール420に送信されるとき、当該実施形態は、車両外音声認識モジュール420によって使用され得る追加情報を提供してユーザを識別し、車両外音声認識モジュール420が当該情報を利用できない場合よりも正確に音声命令を認識する。
ある実施形態においては、車両外音声認識モジュール420は、車両につき1つのユーザプロフィールを含んでもよい。代替的な実施形態においては、車両に関連する複数のユーザプロフィールが存在してもよい。それぞれのユーザプロフィールは、車両外音声認識モジュール420が、音声命令の音声認識を実行するのを支援する。例えば、ユーザプロフィールは、ユーザのアクセント、発音、文構造、会話訓練データ、コーヒーを飲むために、ある車両のユーザはある店によく行く一方、他のユーザは別の店によく行くというようなユーザ傾向のような情報を含んでもよい。
様々な実施形態では、車載システム102は、(a)ステップ720において、正しいユーザプロフィールを識別することを支援するのに使用され得る情報を提供することによって、及び/又は、(b)ステップ720において、音声命令が入力された時点での車両の音響モデルを提供し音声認識の確度を高め得る、車両モデル及び車両状態についての追加情報を提供することによって、車両外音声認識モジュール420を支援する。ステップ720において、車両外音声認識モジュール420が正しいユーザプロフィールを識別するのを支援するために提供される情報は、以下の情報を含む。以下の情報とは、キーフォブ識別子(車両が複数のキーフォブを有するとき)、車両と対になっている場合のセルフォン識別番号又は電話番号、車両/ナビゲーションユニット識別番号、顔面特徴(顔面認識に使用する)及び/又は運転時に座席にかかるドライバの体重(ドライバごとに異なる)、車載GPSからの車両位置情報である。車両位置情報は、車両に関連付けられたプロフィールを有するドライバの習慣を識別するのを支援するために使用され得る。例えば、ドライバ1はカリフォルニア州トランスに勤務しており、ドライバ2はカリフォルニア州アナハイムに勤務しているとする。車両の位置がトランスにある又はトランスの近辺にあるとき、車両外音声認識モジュール420は、当該車両位置情報を使用して、ドライバ1が話者であり、したがって、音声認識に際してドライバ1に関連付けられたプロフィールが使用されるべきであることをより正確に決定できる。含まれ得る追加情報の例としては、発話された場合又はスクリーンを使用して選択された場合のユーザの名前、車両内空調制御情報、速度情報、時刻、ブレーキパターン、任意の他の車両関連/車両生成データ、直前を走っている車両又は他の車両と自車の間の車間距離、車両外音声認識モジュール420が2人のドライバの傾向に差をつけ特定のユーザを識別するのを支援する情報がある。これらの情報は、音声命令に追加して、したがって、音声命令の周波数のような音声命令そのものの特性に追加して送信される。
車両外音声認識モジュール420によって使用され得る追加情報は、車両の音響に関する。ステップ720において提供される情報は、車両のモデル、車両識別番号/ナビゲーション識別番号を含み得る。車両識別番号/ナビゲーション識別番号は、音声命令を認識しようとするとき、その車両に対応する定義済の音響モデルが使用されることを可能にする。さらに、速度、ヨーイング、車両位置(路上騒音)、ファンの状態(高、低、停止)、搭乗者数、窓配置、及び/又は、任意の他の車両関連データ/車両生成データを車両外音声認識モジュール420が使用し、音響モデルを調整して、音声命令が発せられた時点の車両内条件をより正確に反映させる。ステップ720において、この情報は、車両内音声認識モジュール320も使用できる。
図8は、ある実施形態に係るユーザ命令/ユーザ情報要求に応答するシステムを示す図である。この実施形態においては、前記の車両音声認識/制御システム及び方法は、ユーザが要求された実施形態を入手する、又は、要求された命令を実行するのを支援するために使用され得る。図8は、ある実施形態に係るシステムを示す図である。当該システムは、車両802を含む。車両802は、車載音声認識(VR)システム804(車載音声認識モジュール320と同じ)を含む。このようなVRシステムの例は、前記した。
オプションとして、車両802は、通信リンクを介してナビゲーションサーバ810と無線接続されている。ナビゲーションサーバ810は、交通データベース812、行先地点データベース814及び/又は地図データベース816を含み得るし、直接的又は間接的にこれらのデータベースと接続され得る。
車両802及び/又はナビゲーションサーバ810は、音声認識サーバ820と接続されている。音声認識サーバ820は、他のデータベース、インターネット、及び/又は、プログラム/アプリケーションと接続され得る。ある実施形態においては、ユーザは、音声認識サーバ820に使用して欲しいアプリケーション824、ウエブサイト822、データベース826の中での好みを設定し得る。例として、ESPN、Yelp、Flixster、Open Table,Google、CNN、Yahoo等がある。これらの好みは予め設定され得る。又は、音声認識サーバ820を使用して設定/変更することができる。
ある実施形態においては、ユーザは、情報又は動作を要求する。例えば、ユーザは、「午後7時に4名でおいしい日本料理店を予約して下さい」と要求してもよい。ステップ720において、口頭の要求が、追加情報とともに、車両802からナビゲーションサーバ810及び/又は音声認識サーバ820に送信される。ステップ720において送信された追加情報は、ここで記述される実施形態で送信される情報に加えて、ユーザ情報、車両情報、車両速度、車両位置、時刻、及び、計画された経路情報を含み得る。
音声認識サーバ820は、音声情報/音声命令及び追加情報を受け取り、前記したような従来型の音声認識を実行し、情報を収集し、及び/又は、要求された命令を実行する。車両位置、車両速度、時刻及び/又は計画された経路情報を送信することによって、車両は、音声認識サーバ820又は車両802自身が、車両位置の変更及び走行方向の変更を可能にする。
例えば、南向きに走行している車両内のユーザは、わざわざユーターンして行かなければならないレストランではなく、進行方向にあるレストランを好む傾向がある。ある実施形態においては、この好みは、ユーザが設定したものである。ある実施形態においては、音声認識サーバ820又は車両は、例えば選択された経路に基づいて、特定の時刻における車両位置を推定する。例えば前記の例では、ユーザが目的地を選択し、車両が経路を取得すると、車両は、例えば予約時刻午後7時前後における車両位置を推定し、音声認識サーバがレストランを選択するのを支援し得る。他の実施形態においては、音声認識サーバ820及び/又は車両802は、経路情報及び位置情報を使用して、計画された経路に近いレストラン等の情報を選択し得る。
ユーザの口頭要求についての音声認識を実行した後で、音声認識システム820は、1又は複数の情報ソースを識別し、それらの情報ソースに接続する。ある実施形態においては、音声認識システム820は、前記したユーザ選好情報(好み)を使用する。音声認識システムは、インターネットウエブサイト822、アプリケーション824及び/又はデータベース826と接続して、情報を入手し得る。前記の実施形態において、音声認識システムは、Yelpウエブサイト(www.yelp.com)又は同様のウエブサイトに接続すれば、レストランの質、営業時間、必要に応じて予約可能性に関する情報を入手できる。音声認識システム820又はこの例の外部ウエブサイトは、情報を入手するために/車両802内でユーザによって話された命令を実行するために、必要に応じて複数のウエブサイトと接続し得る。前記の例では、適当なレストランを識別した後、車両外音声認識サーバ820は、Open Table(www.opentable.com)のような予約ウエブサイト/予約サービスと接続して、夕食の予約をし得る。
要求された情報を検索した後、音声認識サーバ820が車両802にその情報を戻すと、その情報/命令がユーザに提供される。その情報は、車両802内のスピーカを使用して口頭で提供されてもよいし、車両内のスクリーン上でユーザに表示されてもよい。テキストメッセージが送信されてもよいし、他の通信方法が使用されてもよい。ユーザにその情報を提供する際、ある情報がハイライトされ、及び/又は、灰色表示され、その選択についての情報を提供する。例えば、ユーザがその地域のおいしい日本料理店についての情報を要求する場合、車両は、複数のレストラン候補を表示し、現時点において営業中のレストランをハイライト表示し、現時点において閉店しているレストランを灰色表示し得る。
前記では、特定の実施形態及び適用例を例示及び記述してきたが、実施形態がここで開示された構造及び構成そのものに限定されないこと、並びに、本実施形態の主旨を逸脱せずに、本実施形態の方法及び装置の配置、動作及び細部について様々な修正、変更及び変形例が可能であることは、当然である。
102 車載システム
104 携帯通信端末
105 通信リンク
106 短距離通信リンク
107 無線ネットワーク通信リンク
108 ネットワーク
110 サーバ
202、302、402 プロセッサ
204、304、404 メモリ
206、306 短距離通信モジュール
208 無線ネットワーク通信モジュール
210、310、410 入力装置
212、312、412 出力装置
218、318、414 記憶装置
316 無線/衛星ネットワーク通信モジュール
320、420 音声認識モジュール
408 ネットワーク通信モジュール
802 車両
804 音声認識システム
810 ナビゲーションサーバ
812 交通
814 行先地点
816 地図
820 音声認識サーバ
822 ウエブサイト
824 アプリケーション
826 データベース

Claims (14)

  1. 車両内のコンピュータが、
    第1の音声入力の第1の音声入力情報を受け取り、
    前記第1の音声入力情報に対する音声認識処理を前記車両内の音声認識システムが実行するべきか、それとも、前記第1の音声入力情報に対する音声認識処理を前記車両外の音声認識システムが実行するべきかを判断し、
    前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断した場合は、前記第1の音声入力情報を前記車両外の音声認識システムに送信する方法であって、
    前記コンピュータは、次の第1の処理、第2の処理、第3の処理、第4の処理及び第5の処理を行うものであり、
    前記コンピュータは、
    前記第1の音声入力情報に対する音声認識処理を前記車両内の音声認識システムが実行するべきか、それとも、前記第1の音声入力情報に対する音声認識処理を前記車両外の音声認識システムが実行するべきかの判断を、
    前記第1の音声入力情報に対して前記車両内で音声認識処理を実行して第1の音声認識結果を生成し、
    前記車両内で実行される音声認識処理の信頼度値であって、前記第1の音声認識結果が正しいものである可能性を示す信頼度値を決定し、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在するか否かを判断し、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在しない場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第1の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値以下である場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第2の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値より大きく、かつ、前記第1の音声入力情報が車両外で認識されるべきものとして予め指定されたものである場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第3の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値より大きく、かつ、前記第1の音声入力情報が車両外で認識されるべきではないものとして予め指定されたものである場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両内の音声認識システムが実行するべきであると判断する第4の処理、
    前記少なくとも1つの接続問題が存在する場合は、前記音声認識処理を前記車両内の音声認識システムが実行するべきであると判断する第5の処理、
    のうちの少なくとも1つの処理を実行することによって行うこと、
    を特徴とする方法。
  2. 前記コンピュータは、
    前記第1の音声入力情報の第1の文脈を決定し、
    前記第1の音声入力情報に対する音声認識処理を前記車両内の音声認識システムが実行するべきであるか、それとも、前記第1の音声入力情報に対する音声認識処理を前記車両外の音声認識システムが実行するべきであるかを前記第1の文脈に基づいて判断すること、
    を特徴とする請求項1に記載の方法。
  3. 前記第1の文脈を決定することは、
    前記車両内の第1のユーザによって押下される車両の入力装置上の車両キーのタイプ及び前記車両内の出力装置に表示された情報を決定することに少なくとも部分的に基づくこと、
    を特徴とする請求項2に記載の方法。
  4. 前記車両内の出力装置に表示された情報は、
    前記車両内の音声システムに関する情報、ビデオ情報及びナビゲーション情報のうちの少なくとも1つであること、
    を特徴とする請求項3に記載の方法。
  5. 前記第1の音声入力情報は、
    前記車両の第1のユーザから受け取られ、
    前記コンピュータは、
    前記第1のユーザ及び前記車両のうちの少なくとも1つについてのプロフィールを前記車両外のシステムに送信すること、
    を特徴とする請求項1に記載の方法。
  6. 前記第1の特性は、
    音声の、周波数、速度、韻律、明瞭度、ピッチ、サイズ、ボリューム及び継続時間のうちの少なくとも1つであること、
    を特徴とする請求項1に記載の方法。
  7. 前記コンピュータは、
    室温、車内送風機速度、車内に記憶されている静的データ、緊急関連要求、電話制御命令又は住所入力命令を少なくとも修正するための、音声制御命令、周辺機器制御命令及び環境命令のうちの少なくとも1つに前記第1の音声入力情報が対応しているとの決定に少なくとも部分的に基づき、前記音声認識処理を前記車両内の音声認識システムが実行することを決定すること、
    を特徴とする請求項1に記載の方法。
  8. 第1のユーザから第1の音声入力情報を受け取るマイクロフォンと、
    前記第1の音声入力情報に対する音声認識処理を車両内の音声認識システムが実行するべきであるか、それとも、前記第1の音声入力情報に対する音声認識処理を車両外の音声認識システムが実行するべきであるかを判断する音声認識位置判断ユニットと、
    前記第1の音声入力情報に対する音声認識処理を前記車両内の音声認識システムが実行した結果生成された第1の音声認識結果が正しいものである可能性を示す信頼度値を決定する信頼度値ユニットと、
    前記音声認識処理を前記車両外の音声認識システムが実行するべきであると前記音声認識位置判断ユニットが判断した場合は、前記第1の音声入力情報を前記車両外のシステムに送信する通信ユニットと、
    を備え、
    前記音声認識位置判断ユニットは、次の第1の処理、第2の処理、第3の処理、第4の処理及び第5の処理を行うものであり、
    前記音声認識位置判断ユニットは、
    前記第1の音声入力情報に対する音声認識処理を車両内の音声認識システムが実行するべきであるか、それとも、前記第1の音声入力情報に対する音声認識処理を車両外の音声認識システムが実行するべきであるかの判断を、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在するか否かを判断し、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在しない場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第1の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値以下である場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第2の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値より大きく、かつ、前記第1の音声入力情報が車両外で認識されるべきものとして予め指定されたものである場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第3の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値より大きく、かつ、前記第1の音声入力情報が車両外で認識されるべきではないものとして予め指定されたものである場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両内の音声認識システムが実行するべきであると判断する第4の処理、
    前記少なくとも1つの接続問題が存在する場合は、前記音声認識処理を前記車両内の音声認識システムが実行するべきであると判断する第5の処理、
    のうちの少なくとも1つの処理を実行することによって行うこと、
    を特徴とする車載システム。
  9. 前記車載システムは、
    前記第1の音声入力情報の第1の文脈を決定する文脈ユニットを備え、
    前記音声認識位置判断ユニットは、
    前記第1の音声入力情報に対する音声認識処理を前記車両内の音声認識システムが実行するべきであるか、それとも、前記第1の音声入力情報に対する音声認識処理を前記車両外の音声認識システムが実行するべきであるかを前記第1の文脈に基づいて判断すること、
    を特徴とする請求項8に記載の車載システム。
  10. 前記通信ユニットは、
    前記第1のユーザ及び前記車両のうちの少なくとも1つについてのプロフィールを前記車両外の音声認識システムに送信すること、
    を特徴とする請求項8に記載の車載システム。
  11. 前記音声認識位置判断ユニットは、
    室温、車内送風機速度、車内に記憶されている静的データ、緊急関連要求、電話制御命令又は住所入力命令を少なくとも修正するための、音声制御命令、周辺機器制御命令及び環境命令のうちの少なくとも1つに前記第1の音声入力情報が対応しているとの決定に少なくとも部分的に基づき、前記音声認識処理を前記車両内の音声認識システムが実行するべきであると判断すること、
    を特徴とする請求項8に記載の車載システム。
  12. 車両内の第1のユーザから第1の音声入力情報を受け取るステップと、
    前記第1の音声入力情報に対する音声認識処理を前記車両内の音声認識システムが実行するべきか、それとも、前記第1の音声入力情報に対する音声認識処理を前記車両外の音声認識システムが実行するべきかを判断するステップと、
    前記第1の音声入力情報に対する音声認識処理を前記車両外の音声認識システムが実行するべきであると判断した場合は、前記第1の音声入力情報を前記車両外の音声認識システムに送信するステップと、
    をコンピュータに実行させるためのプログラムを記録している前記コンピュータに読取可能な不揮発性記憶媒体であって、
    前記コンピュータは、次の第1の処理、第2の処理、第3の処理、第4の処理及び第5の処理を行うものであり、
    前記第1の音声入力情報に対する音声認識処理を前記車両内の音声認識システムが実行するべきか、それとも、前記第1の音声入力情報に対する音声認識処理を前記車両外の音声認識システムが実行するべきかの判断を、
    前記コンピュータは、
    前記第1の音声入力情報に対して前記車両内で音声認識処理を実行して第1の音声認識結果を生成し、
    前記車両内で実行される音声認識処理の信頼度値であって、前記第1の音声認識結果が正しいものである可能性を示す信頼度値を決定し、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在するか否かを判断し、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在しない場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第1の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値以下である場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第2の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値より大きく、かつ、前記第1の音声入力情報が車両外で認識されるべきものとして予め指定されたものである場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両外の音声認識システムが実行するべきであると判断する第3の処理、
    前記車両と車両外の音声認識システムとの間に少なくとも1つの接続問題が存在せず、かつ、前記信頼度値が第2の閾値より大きく、かつ、前記第1の音声入力情報が車両外で認識されるべきではないものとして予め指定されたものである場合は、前記第1の音声入力情報の第1の特性と第1の閾値との比較に基づき、前記音声認識処理を前記車両内の音声認識システムが実行するべきであると判断する第4の処理、
    前記少なくとも1つの接続問題が存在する場合は、前記音声認識処理を前記車両内の音声認識システムが実行するべきであると判断する第5の処理、
    のうちの少なくとも1つの処理を実行することによって行うこと、
    を特徴とする不揮発性記憶媒体。
  13. 前記不揮発性記憶媒体は、
    前記第1の音声入力情報の第1の文脈を決定するステップと、
    前記第1の音声入力情報に対する音声認識処理を前記車両内の音声認識システムが実行するべきであるか、それとも、前記第1の音声入力情報に対する音声認識処理を前記車両外の音声認識システムが実行するべきであるかを前記第1の文脈に基づいて判断するステップと、
    を前記コンピュータに実行させるためのプログラムを記録していること、
    を特徴とする請求項12に記載の不揮発性記憶媒体。
  14. 前記不揮発性記憶媒体は、
    前記第1のユーザ及び前記車両のうちの少なくとも1つについてのプロフィールを前記車両外の音声認識システムに送信するステップを前記コンピュータに実行させるためのプログラムを記録していること、
    を特徴とする請求項12に記載の不揮発性記憶媒体。
JP2017002835A 2010-06-24 2017-01-11 音声認識処理のための方法、車載システム及び不揮発性記憶媒体 Expired - Fee Related JP6571118B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US35840710P 2010-06-24 2010-06-24
US61/358,407 2010-06-24

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013516786A Division JP2013529794A (ja) 2010-06-24 2011-06-24 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法

Publications (2)

Publication Number Publication Date
JP2017097373A JP2017097373A (ja) 2017-06-01
JP6571118B2 true JP6571118B2 (ja) 2019-09-04

Family

ID=45371824

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013516786A Pending JP2013529794A (ja) 2010-06-24 2011-06-24 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法
JP2017002835A Expired - Fee Related JP6571118B2 (ja) 2010-06-24 2017-01-11 音声認識処理のための方法、車載システム及び不揮発性記憶媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013516786A Pending JP2013529794A (ja) 2010-06-24 2011-06-24 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法

Country Status (5)

Country Link
US (5) US9263058B2 (ja)
EP (1) EP2586026B1 (ja)
JP (2) JP2013529794A (ja)
CN (1) CN103038818B (ja)
WO (1) WO2011163538A1 (ja)

Families Citing this family (129)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US9554286B2 (en) * 2011-12-02 2017-01-24 Lear Corporation Apparatus and method for detecting a location of a wireless device
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9767828B1 (en) * 2012-06-27 2017-09-19 Amazon Technologies, Inc. Acoustic echo cancellation using visual cues
KR101330671B1 (ko) 2012-09-28 2013-11-15 삼성전자주식회사 전자장치, 서버 및 그 제어방법
CN102945672B (zh) 2012-09-29 2013-10-16 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法
US9466286B1 (en) * 2013-01-16 2016-10-11 Amazong Technologies, Inc. Transitioning an electronic device between device states
US9761247B2 (en) * 2013-01-31 2017-09-12 Microsoft Technology Licensing, Llc Prosodic and lexical addressee detection
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
CN105027198B (zh) * 2013-02-25 2018-11-20 三菱电机株式会社 语音识别系统以及语音识别装置
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9619645B2 (en) * 2013-04-04 2017-04-11 Cypress Semiconductor Corporation Authentication for recognition systems
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3937002A1 (en) 2013-06-09 2022-01-12 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
USRE49014E1 (en) * 2013-06-19 2022-04-05 Panasonic Intellectual Property Corporation Of America Voice interaction method, and device
US9305554B2 (en) * 2013-07-17 2016-04-05 Samsung Electronics Co., Ltd. Multi-level speech recognition
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
JP6171881B2 (ja) * 2013-11-19 2017-08-02 株式会社デンソー 電子制御装置
EP2887348B1 (en) 2013-12-18 2022-05-04 Harman International Industries, Incorporated Voice recognition query response system
KR102210433B1 (ko) 2014-01-21 2021-02-01 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
CN104931059B (zh) * 2014-03-21 2018-09-11 比亚迪股份有限公司 车载救援导航系统和方法
CN103956168A (zh) * 2014-03-29 2014-07-30 深圳创维数字技术股份有限公司 一种语音识别方法、装置及终端
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9632748B2 (en) * 2014-06-24 2017-04-25 Google Inc. Device designation for audio input monitoring
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
KR20160035465A (ko) * 2014-09-23 2016-03-31 현대자동차주식회사 서비스 식별자 비교를 이용한 기기 간 연동 제한 방법
JP6480279B2 (ja) * 2014-10-15 2019-03-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報取得方法、情報取得システム及び情報取得プログラム
KR20160045353A (ko) * 2014-10-17 2016-04-27 현대자동차주식회사 에이브이엔 장치, 차량, 및 에이브이엔 장치의 제어방법
KR102298767B1 (ko) * 2014-11-17 2021-09-06 삼성전자주식회사 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법
JP6114249B2 (ja) * 2014-11-20 2017-04-12 ヤマハ株式会社 情報送信装置および情報送信方法
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9544412B2 (en) 2015-03-09 2017-01-10 Ford Global Technologies, Llc Voice profile-based in-vehicle infotainment identity identification
CN106157955A (zh) 2015-03-30 2016-11-23 阿里巴巴集团控股有限公司 一种语音控制方法及装置
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083697B2 (en) * 2015-05-27 2018-09-25 Google Llc Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device
US9966073B2 (en) 2015-05-27 2018-05-08 Google Llc Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US9844981B2 (en) * 2015-06-02 2017-12-19 Karma Automotive Llc Systems and methods for use in a vehicle for detecting external events
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
JP6621613B2 (ja) * 2015-08-10 2019-12-18 クラリオン株式会社 音声操作システム、サーバー装置、車載機器および音声操作方法
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10209851B2 (en) 2015-09-18 2019-02-19 Google Llc Management of inactive windows
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10891106B2 (en) * 2015-10-13 2021-01-12 Google Llc Automatic batch voice commands
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
WO2017090115A1 (ja) * 2015-11-25 2017-06-01 三菱電機株式会社 音声対話装置および音声対話方法
DE102016200815A1 (de) * 2015-12-15 2017-06-22 Bayerische Motoren Werke Aktiengesellschaft Verfahren und Vorrichtung zur Sprachsteuerung eines Kraftfahrzeugs
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US9992817B2 (en) 2016-04-18 2018-06-05 Honda Motor Co., Ltd. Wireless data processing in a connected vehicle
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10931999B1 (en) 2016-06-27 2021-02-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
US10271093B1 (en) * 2016-06-27 2019-04-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
US9924318B2 (en) * 2016-07-01 2018-03-20 Lear Corporation Passive entry systems employing time of flight distance measurements
US10950229B2 (en) * 2016-08-26 2021-03-16 Harman International Industries, Incorporated Configurable speech interface for vehicle infotainment systems
US10553212B2 (en) * 2016-10-05 2020-02-04 Gentex Corporation Vehicle-based remote control system and method
CN106653031A (zh) * 2016-10-17 2017-05-10 海信集团有限公司 语音唤醒方法及语音交互装置
US10971157B2 (en) 2017-01-11 2021-04-06 Nuance Communications, Inc. Methods and apparatus for hybrid speech recognition processing
US10325592B2 (en) * 2017-02-15 2019-06-18 GM Global Technology Operations LLC Enhanced voice recognition task completion
EP3583498A1 (de) * 2017-02-20 2019-12-25 German Auto Labs Gal GmbH Verfahren und vorrichtung zur unterstützung des fahrers eines kraftfahrzeuges
US11627612B2 (en) * 2017-03-21 2023-04-11 Ford Global Technologies, Llc Method and apparatus for efficient vehicle data reporting
CN107103903B (zh) * 2017-05-05 2020-05-29 百度在线网络技术(北京)有限公司 基于人工智能的声学模型训练方法、装置及存储介质
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
CN107240395B (zh) * 2017-06-16 2020-04-28 百度在线网络技术(北京)有限公司 一种声学模型训练方法和装置、计算机设备、存储介质
KR102426717B1 (ko) * 2017-06-27 2022-07-29 삼성전자주식회사 발화 인식 모델을 선택하는 시스템 및 전자 장치
US10438594B2 (en) * 2017-09-08 2019-10-08 Amazon Technologies, Inc. Administration of privileges by speech for voice assistant system
US20190147855A1 (en) * 2017-11-13 2019-05-16 GM Global Technology Operations LLC Neural network for use in speech recognition arbitration
US20190172453A1 (en) * 2017-12-06 2019-06-06 GM Global Technology Operations LLC Seamless advisor engagement
US10629199B1 (en) 2017-12-12 2020-04-21 Amazon Technologies, Inc. Architectures and topologies for vehicle-based, voice-controlled devices
US10540970B2 (en) * 2017-12-12 2020-01-21 Amazon Technologies, Inc. Architectures and topologies for vehicle-based, voice-controlled devices
JP2019106054A (ja) * 2017-12-13 2019-06-27 株式会社東芝 対話システム
JP2019124881A (ja) * 2018-01-19 2019-07-25 トヨタ自動車株式会社 音声認識装置および音声認識方法
CN108335696A (zh) * 2018-02-09 2018-07-27 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
WO2019220254A1 (en) * 2018-05-14 2019-11-21 Gentex Corporation Vehicle control module for smart home control system
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DE102018208707A1 (de) * 2018-06-04 2019-12-05 Audi Ag Verfahren zum Betreiben einer Schallausgabeeinrichtung eines Kraftfahrzeugs, Sprachanalyse- und Steuereinrichtung, Kraftfahrzeug, und kraftfahrzeugexterne Servereinrichtung
US11037556B2 (en) 2018-07-17 2021-06-15 Ford Global Technologies, Llc Speech recognition for vehicle voice commands
US11119725B2 (en) * 2018-09-27 2021-09-14 Abl Ip Holding Llc Customizable embedded vocal command sets for a lighting and/or other environmental controller
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
FR3088473B1 (fr) * 2018-11-09 2021-05-28 Psa Automobiles Sa Procede et dispositif d’assistance a l’utilisation d’un assistant vocal dans un vehicule
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
CN110113729A (zh) * 2019-04-30 2019-08-09 上海掌门科技有限公司 车载设备的通信方法以及车载设备
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
KR20210042520A (ko) * 2019-10-10 2021-04-20 삼성전자주식회사 전자 장치 및 이의 제어 방법
CN111627435A (zh) * 2020-04-30 2020-09-04 长城汽车股份有限公司 语音识别方法与系统及基于语音指令的控制方法与系统
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US20220122613A1 (en) * 2020-10-20 2022-04-21 Toyota Motor Engineering & Manufacturing North America, Inc. Methods and systems for detecting passenger voice data
KR102494051B1 (ko) * 2021-01-26 2023-01-31 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
US20230035752A1 (en) * 2021-07-30 2023-02-02 Nissan North America, Inc. Systems and methods for responding to audible commands and/or adjusting vehicle components based thereon
CN113890658B (zh) * 2021-10-20 2023-05-05 四川启睿克科技有限公司 基于安卓车机系统的安全广播方法及系统
GB2612079A (en) * 2021-10-21 2023-04-26 Jaguar Land Rover Ltd Voice command processing method and apparatus
US20230182686A1 (en) * 2021-12-09 2023-06-15 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Push button/microphone combo and key fob speech recognition system
CN115050366B (zh) * 2022-07-08 2024-05-17 合众新能源汽车股份有限公司 一种语音识别方法、装置及计算机存储介质
CN116052668B (zh) * 2023-03-28 2023-06-02 北京集度科技有限公司 一种语音识别处理方法、装置、车辆及计算机程序产品

Family Cites Families (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3340768B2 (ja) 1992-09-17 2002-11-05 ティーディーケイ株式会社 押出し塗布方法およびその装置
GB9307611D0 (en) 1993-04-13 1993-06-02 Univ Strathclyde Object recognition
JP2002182896A (ja) * 2000-12-12 2002-06-28 Canon Inc 音声認識システム及び音声認識装置ならびにそれらの方法
US5960399A (en) * 1996-12-24 1999-09-28 Gte Internetworking Incorporated Client/server speech processor/recognizer
US6009355A (en) * 1997-01-28 1999-12-28 American Calcar Inc. Multimedia information and control system for automobiles
US20010020202A1 (en) * 1999-09-21 2001-09-06 American Calcar Inc. Multimedia information and control system for automobiles
US5926790A (en) * 1997-09-05 1999-07-20 Rockwell International Pilot/controller/vehicle or platform correlation system
US7003463B1 (en) * 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
WO2000037114A2 (en) 1998-12-21 2000-06-29 Sequella, Inc. Methods and compositions comprising monitoring devices
JP4085500B2 (ja) * 1999-01-29 2008-05-14 株式会社エクォス・リサーチ 車両状況把握装置、エージェント装置、および、車両制御装置
US6126461A (en) 1999-03-18 2000-10-03 Methode Electronics, Inc. Sound dampening spring fingers to reduce hub/rotor vibration noise
EP1088299A2 (en) 1999-03-26 2001-04-04 Scansoft, Inc. Client-server speech recognition
JP4314680B2 (ja) * 1999-07-27 2009-08-19 ソニー株式会社 音声認識制御システム及び音声認識制御方法
JP2001075594A (ja) * 1999-08-31 2001-03-23 Pioneer Electronic Corp 音声認識システム
US6633846B1 (en) * 1999-11-12 2003-10-14 Phoenix Solutions, Inc. Distributed realtime speech recognition system
US6505161B1 (en) * 2000-05-01 2003-01-07 Sprint Communications Company L.P. Speech recognition that adjusts automatically to input devices
US6587824B1 (en) * 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
US6230138B1 (en) * 2000-06-28 2001-05-08 Visteon Global Technologies, Inc. Method and apparatus for controlling multiple speech engines in an in-vehicle speech recognition system
DE60133902D1 (ja) * 2000-07-28 2008-06-19 Siemens Vdo Automotive Corp
JP2002116796A (ja) * 2000-10-11 2002-04-19 Canon Inc 音声処理装置、音声処理方法及び記憶媒体
US6570495B1 (en) * 2000-10-27 2003-05-27 Audiovox Corporation Voice confirmation system and method for a vehicle
JP2002144982A (ja) * 2000-11-06 2002-05-22 Mazda Motor Corp 車載機器の操作方法、車載機器の操作システム及び車載機器制御装置
US20020067839A1 (en) * 2000-12-04 2002-06-06 Heinrich Timothy K. The wireless voice activated and recogintion car system
JP2002289347A (ja) 2001-03-27 2002-10-04 Sanyo Electric Co Ltd エレクトロルミネッセンス表示装置、その製造方法、被着マスク及びその製造方法
JP2002318132A (ja) * 2001-04-23 2002-10-31 Hitachi Ltd 音声対話型ナビゲーションシステムおよび移動端末装置および音声対話サーバ
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
US7026957B2 (en) * 2001-10-01 2006-04-11 Advanced Public Safety, Inc. Apparatus for communicating with a vehicle during remote vehicle operations, program product, and associated methods
JP3997459B2 (ja) * 2001-10-02 2007-10-24 株式会社日立製作所 音声入力システムおよび音声ポータルサーバおよび音声入力端末
US7295982B1 (en) * 2001-11-19 2007-11-13 At&T Corp. System and method for automatic verification of the understandability of speech
DE10163213A1 (de) * 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren zum Betrieb eines Spracherkennungssystems
JP2003223168A (ja) 2002-01-29 2003-08-08 Matsushita Electric Ind Co Ltd コールサインの音源作成方法およびその装置と記録媒体
JP4086280B2 (ja) * 2002-01-29 2008-05-14 株式会社東芝 音声入力システム、音声入力方法及び音声入力プログラム
JP2003295893A (ja) * 2002-04-01 2003-10-15 Omron Corp 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US6745151B2 (en) * 2002-05-16 2004-06-01 Ford Global Technologies, Llc Remote diagnostics and prognostics methods for complex systems
JP3815388B2 (ja) * 2002-06-25 2006-08-30 株式会社デンソー 音声認識システムおよび端末
JP2004045591A (ja) * 2002-07-10 2004-02-12 Mitsubishi Heavy Ind Ltd 音声認識方法及び特定話者音響辞書の提供方法
US6834265B2 (en) * 2002-12-13 2004-12-21 Motorola, Inc. Method and apparatus for selective speech recognition
US7197331B2 (en) * 2002-12-30 2007-03-27 Motorola, Inc. Method and apparatus for selective distributed speech recognition
JP3920812B2 (ja) * 2003-05-27 2007-05-30 株式会社東芝 コミュニケーション支援装置、支援方法、及び支援プログラム
JP2005017709A (ja) * 2003-06-26 2005-01-20 Xanavi Informatics Corp 車両用音声認識装置、車載ナビゲーション装置
DE602004017024D1 (de) * 2003-08-29 2008-11-20 Johnson Controls Tech Co System und verfahren zum betrieb eines spracherkennungssystems in einem fahrzeug
KR100567248B1 (ko) * 2003-09-06 2006-04-03 현대모비스 주식회사 핸즈프리 내장형 카오디오 시스템의 모드 자동 변환 방법
US7881934B2 (en) 2003-09-12 2011-02-01 Toyota Infotechnology Center Co., Ltd. Method and system for adjusting the voice prompt of an interactive system based upon the user's state
US7516072B2 (en) * 2003-10-21 2009-04-07 Johnson Controls Technology Company System and method for selecting a user speech profile for a device in a vehicle
WO2005052744A2 (en) * 2003-11-19 2005-06-09 Atx Technonlogies Wirelessly delivered owner's manual
WO2005062295A1 (ja) 2003-12-05 2005-07-07 Kabushikikaisha Kenwood 機器制御装置、音声認識装置、エージェント装置及び機器制御方法
US20050137877A1 (en) * 2003-12-17 2005-06-23 General Motors Corporation Method and system for enabling a device function of a vehicle
JPWO2005064592A1 (ja) 2003-12-26 2007-12-20 株式会社ケンウッド 機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラム
JP4791699B2 (ja) * 2004-03-29 2011-10-12 中国電力株式会社 業務支援システム及び方法
US7240010B2 (en) * 2004-06-14 2007-07-03 Papadimitriou Wanda G Voice interaction with and control of inspection equipment
US8589156B2 (en) 2004-07-12 2013-11-19 Hewlett-Packard Development Company, L.P. Allocation of speech recognition tasks and combination of results thereof
US9224394B2 (en) * 2009-03-24 2015-12-29 Sirius Xm Connected Vehicle Services Inc Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
US20120253823A1 (en) * 2004-09-10 2012-10-04 Thomas Barton Schalk Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
US7373248B2 (en) * 2004-09-10 2008-05-13 Atx Group, Inc. Systems and methods for off-board voice-automated vehicle navigation
KR100695127B1 (ko) * 2004-10-08 2007-03-14 삼성전자주식회사 다 단계 음성 인식 장치 및 방법
US7813771B2 (en) * 2005-01-06 2010-10-12 Qnx Software Systems Co. Vehicle-state based parameter adjustment system
EP1891848B1 (en) * 2005-06-13 2015-07-22 Intelligent Mechatronic Systems Inc. Vehicle immersive communication system
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
JP2007041089A (ja) * 2005-08-01 2007-02-15 Hitachi Ltd 情報端末および音声認識プログラム
US20110119062A1 (en) * 2005-09-29 2011-05-19 Dohan Jewel L Voice-recognition/voice-activated vehicle signal system
US20070162282A1 (en) * 2006-01-09 2007-07-12 Gilad Odinak System and method for performing distributed speech recognition
KR100810275B1 (ko) * 2006-08-03 2008-03-06 삼성전자주식회사 차량용 음성인식 장치 및 방법
US7739031B2 (en) 2006-09-05 2010-06-15 Nissan Technical Center North America, Inc. Vehicle on-board unit
US7657433B1 (en) * 2006-09-08 2010-02-02 Tellme Networks, Inc. Speech recognition accuracy with multi-confidence thresholds
JP4188989B2 (ja) * 2006-09-15 2008-12-03 本田技研工業株式会社 音声認識装置、音声認識方法、及び音声認識プログラム
US8880402B2 (en) * 2006-10-28 2014-11-04 General Motors Llc Automatically adapting user guidance in automated speech recognition
US8055502B2 (en) * 2006-11-28 2011-11-08 General Motors Llc Voice dialing using a rejection reference
US8949130B2 (en) * 2007-03-07 2015-02-03 Vlingo Corporation Internal and external speech recognition use with a mobile communication facility
WO2009004750A1 (ja) * 2007-07-02 2009-01-08 Mitsubishi Electric Corporation 音声認識装置
WO2009019783A1 (ja) * 2007-08-09 2009-02-12 Panasonic Corporation 音声認識装置及び音声認識方法
US20090055180A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method for optimizing speech recognition in a vehicle
JP2009075562A (ja) 2007-08-27 2009-04-09 Seiko Epson Corp 画像形成装置、画像形成方法および画像検出方法
JP2009075582A (ja) * 2007-08-29 2009-04-09 Advanced Media Inc 端末装置、言語モデル作成装置、および分散型音声認識システム
WO2009073806A2 (en) * 2007-12-05 2009-06-11 Johnson Controls Technology Company Vehicle user interface systems and methods
WO2009090702A1 (ja) * 2008-01-17 2009-07-23 Mitsubishi Electric Corporation 車載用ガイダンス装置
CN101217584B (zh) 2008-01-18 2011-04-13 同济大学 可用于汽车的语音命令控制系统
US20100042498A1 (en) * 2008-08-15 2010-02-18 Atx Group, Inc. Criteria-Based Audio Messaging in Vehicles
US20090271200A1 (en) * 2008-04-23 2009-10-29 Volkswagen Group Of America, Inc. Speech recognition assembly for acoustically controlling a function of a motor vehicle
JP2009288630A (ja) * 2008-05-30 2009-12-10 Denso Corp 車両用音声認識システム
US7933777B2 (en) * 2008-08-29 2011-04-26 Multimodal Technologies, Inc. Hybrid speech recognition
US20100057465A1 (en) * 2008-09-03 2010-03-04 David Michael Kirsch Variable text-to-speech for automotive application
US8285545B2 (en) * 2008-10-03 2012-10-09 Volkswagen Ag Voice command acquisition system and method
US20100097178A1 (en) * 2008-10-17 2010-04-22 Pisz James T Vehicle biometric systems and methods
US20100127996A1 (en) * 2008-11-27 2010-05-27 Fujitsu Ten Limited In-vehicle device, remote control system, and remote control method
US8515762B2 (en) 2009-01-22 2013-08-20 Microsoft Corporation Markup language-based selection and utilization of recognizers for utterance processing
JP2010185975A (ja) * 2009-02-10 2010-08-26 Denso Corp 車載音声認識装置
US8294683B2 (en) * 2009-09-25 2012-10-23 Mitac International Corp. Method of processing touch commands and voice commands in parallel in an electronic device supporting speech recognition
US8942888B2 (en) * 2009-10-15 2015-01-27 Airbiquity Inc. Extensible scheme for operating vehicle head unit as extended interface for mobile device
FR2986269B1 (fr) 2012-01-30 2015-08-07 Snecma Systeme de detection d'un impact sur une roue aubagee de moteur d'aeronef

Also Published As

Publication number Publication date
JP2017097373A (ja) 2017-06-01
US20130185072A1 (en) 2013-07-18
EP2586026B1 (en) 2016-11-16
US10818286B2 (en) 2020-10-27
US20170169825A1 (en) 2017-06-15
US9620121B2 (en) 2017-04-11
WO2011163538A1 (en) 2011-12-29
US20160012822A1 (en) 2016-01-14
US9263058B2 (en) 2016-02-16
CN103038818A (zh) 2013-04-10
JP2013529794A (ja) 2013-07-22
EP2586026A4 (en) 2014-10-01
US20180096685A1 (en) 2018-04-05
US9564132B2 (en) 2017-02-07
US20160284353A1 (en) 2016-09-29
CN103038818B (zh) 2016-10-12
US10269348B2 (en) 2019-04-23
EP2586026A1 (en) 2013-05-01

Similar Documents

Publication Publication Date Title
JP6571118B2 (ja) 音声認識処理のための方法、車載システム及び不揮発性記憶媒体
KR102426171B1 (ko) 대화 시스템, 이를 포함하는 차량 및 대화 서비스 처리 방법
KR20180086718A (ko) 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
EP2518447A1 (en) System and method for fixing user input mistakes in an in-vehicle electronic device
US20190122661A1 (en) System and method to detect cues in conversational speech
JP6597527B2 (ja) 音声認識装置および音声認識方法
WO2016129276A1 (ja) 情報提供方法、サーバ、情報端末装置、システム及び音声対話システム
US20180052658A1 (en) Information processing device and information processing method
KR20200098079A (ko) 대화 시스템 및 대화 처리 방법
US20200286479A1 (en) Agent device, method for controlling agent device, and storage medium
KR102487669B1 (ko) 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
JP7274404B2 (ja) 情報提供装置、情報提供方法、およびプログラム
US20200319634A1 (en) Agent device, method of controlling agent device, and storage medium
JP5376072B1 (ja) 車載情報システムおよび音声認識適応方法
CN111717142A (zh) 智能体装置、智能体装置的控制方法及存储介质
JP2019159559A (ja) 情報提供装置
JP5160653B2 (ja) 情報提供装置、通信端末、情報提供システム、情報提供方法、情報出力方法、情報提供プログラム、情報出力プログラムおよび記録媒体
KR20190031935A (ko) 대화 시스템과 이를 포함하는 차량 및 모바일 기기와 대화 처리 방법
JP7175221B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7252029B2 (ja) サーバ装置、情報提供方法、およびプログラム
KR20200095636A (ko) 대화 시스템이 구비된 차량 및 그 제어 방법
JP2020160848A (ja) サーバ装置、情報提供システム、情報提供方法、およびプログラム
KR20190036018A (ko) 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
JP2020160108A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190807

R150 Certificate of patent or registration of utility model

Ref document number: 6571118

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees