JP2007011380A - 自動車インターフェース - Google Patents

自動車インターフェース Download PDF

Info

Publication number
JP2007011380A
JP2007011380A JP2006183890A JP2006183890A JP2007011380A JP 2007011380 A JP2007011380 A JP 2007011380A JP 2006183890 A JP2006183890 A JP 2006183890A JP 2006183890 A JP2006183890 A JP 2006183890A JP 2007011380 A JP2007011380 A JP 2007011380A
Authority
JP
Japan
Prior art keywords
user
information
interface
command
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006183890A
Other languages
English (en)
Inventor
You Zhang
ユー・チャン
Jeffery J Faneuff
ジェフリー・ジェイ・ファネフ
William Hidden
ウィリアム・ヒドゥン
James T Hotary
ジェイムス・ティー・ホタリー
Steven C Lee
スティーヴン・シー・リー
Vasu Iyengar
ヴァス・アイエンガー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bose Corp
Original Assignee
Bose Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bose Corp filed Critical Bose Corp
Publication of JP2007011380A publication Critical patent/JP2007011380A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0967Systems involving transmission of highway information, e.g. weather, speed limits
    • G08G1/096733Systems involving transmission of highway information, e.g. weather, speed limits where a selection of the information might take place
    • G08G1/09675Systems involving transmission of highway information, e.g. weather, speed limits where a selection of the information might take place where a selection from the received information takes place in the vehicle
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0967Systems involving transmission of highway information, e.g. weather, speed limits
    • G08G1/096766Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission
    • G08G1/096775Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission where the origin of the information is a central station
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/2753Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
    • H04M1/2757Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content by data transmission, e.g. downloading
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • H04M1/6083Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system
    • H04M1/6091Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system including a wireless interface
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Atmospheric Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Navigation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Steering Controls (AREA)
  • Telephonic Communication Services (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

【課題】自動車システムは、自動車または他のタイプの車両内での制御および通信機能のための統合されたユーザーインターフェースを提供する。
【解決手段】ユーザーインターフェースは、制御盤、例えばダッシュボードまたはステアリングホイールに取り付けられた制御盤を用いて、ボイスイネーブルインタラクションをサポートするだけでなく、インタラクションの他のモード、例えばマニュアルインタラクションもサポートする。システムは、車両内のデバイスに対するインターフェース、例えば車両内に持ち込まれるモバイル機器に対する無線インターフェースも備えている。システムは、例えば、情報にアクセスするための、リモートサーバーのような情報ソースに対するインターフェースも提供する。
【選択図】図1

Description

本発明は、自動車インターフェースに関する。
自動車は、今日、ユーザーとの対話のための様々なインターフェースをサポートしている。このインターフェースは、ユーザーに、情報(例えば、ナビゲーション、車両の状態)、通信(例えば、セルラー電話)、または制御(例えば、環境制御のような車両システムの制御)に対するアクセスを提供する。このようなシステムは、自動車内でホストとして働いてもよいし、自動車から離れてホストとして働いて、通信システムを通じてアクセスされてもよい。音声認識は、自動車内の人と、このようなシステムとの間で、口頭での対話を可能にするために、自動車内で用いられてきた。
自動車は、今日、セルラー電話のような外部デバイスの統合のために、いくつかのインターフェースを提供する。例えば、外部デバイスとのこのようなインターフェースは、外部デバイスと自動車システム間のブルートゥースのような無線リンクを使用することができる。
一態様において、一般に、ボイスイネーブルユーザーインターフェースは、インターフェースに対する一般的な設定情報を記憶するステップと、インターフェースに対するユーザー固有の設定情報を記憶するステップとを備えている。ユーザーからの音声入力の処理は、一般的な設定情報およびユーザー固有の設定情報を用いて可能になる。ユーザー固有の設定情報は、音声入力の処理結果に基づいて、選択的に更新される。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
更新は、入力と関連する得点が、不正確な認識仮説が予め決められた閾値以内の得点を有していることを示すとき、入力の正しい認識の上で、実行される。
更新は、ユーザーからの更なる音声入力を必要とせずに、実行される。
ユーザー固有の設定情報は、辞書項目に対するユーザー固有の発音情報を含んでいて、そのための一般的な発音情報は、一般的な設定情報に含まれている。
ユーザー固有の設定情報の更新は、インターフェースの使用中に、実行される。
更新は、ユーザーからの音声入力の誤認識に基づく。
ユーザー固有の設定情報の更新は、ユーザーからの音声入力の認識結果に基づく。
別の態様において、一般に、ボイスイネーブルユーザーインターフェースは、識別子と関連する、冗長な、または曖昧さをなくす情報と共に、識別子の発声を処理するように設定される。インターフェースは、識別子を前記情報と関連付けているデータベースから、追加の、または曖昧さをなくす情報を検索することができる。例えば、このデータベースは、コンタクトデータベースを含んでいる。冗長な、または曖昧な情報は、識別子と直接連結され得る。一例として、識別子は、名前を含んでいて、冗長な、または曖昧さをなくす情報は、名前の頭文字を含んでいる。
別の態様において、一般に、ボイスイネーブルユーザーインターフェースを提供する方法は、インターフェースのユーザーの組の各々に対する設定情報を提供するステップを有している。インターフェースのユーザーが決定され、このインターフェースは、決定されたユーザーのための設定情報を用いて適合される。ユーザーを決定するステップは、ユーザーからの口頭での入力に対して、話者識別プロセスを適用するステップを有していてもよい。
別の態様において、一般に、通信媒体を通じて第1のデバイスと第2のデバイスを関連付ける方法は、第1のデバイスでデータを生成するステップと、第1のデバイスで生成されたデータをユーザーに提示するステップと、第2のデバイスに関連付け要求を伝送するステップとを有している。第1および第2のデバイスの関連付けを許可するユーザーからの入力時に、第2のデバイス上で、データは受け入れられる。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
第1のデバイスは、車両に基づくデバイスであり、第2のデバイスは、モバイル機器である。例えば、モバイル機器は、携帯電話およびPDAのうちの1つである。
この方法は、第1のデバイス上のボタンを押すことによる開始ステップを更に有している。
第1のデバイスと第2のデバイスの関連付けは、ブルートゥース通信アプローチに従う。
別の態様において、一般に、ボイスイネーブルユーザーインターフェースを設定する方法は、第1のデバイスで、第2のデバイスからコンタクトデータを受け取り、かつデータソースからの追加データを要求して、コンタクトデータを増やすステップを有している。ユーザーインターフェースは、第2のデバイスから受信したコンタクトデータおよびデータソースからの追加データを用いて設定される。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
第1のデバイスは、車両に基づくデバイスであり、第2のデバイスは、モバイル機器である。
データソースは、リモートサーバーに常駐している。
リモートサーバーから要求される追加データは、コンタクトデータ内の項目に関連する情報を含んでいる。例えば、コンタクトデータ内の項目は、名前および関連する電話番号を含んでいて、要求される追加データは、この項目と関連する住所情報を含んでいる。
別の態様において、一般に、車内ボイスイネーブルユーザーインターフェースを提供する方法は、ユーザーから通信コマンドを受け入れるステップを有している。そして、宛先情報が、通信コマンドから決定される。そして、ナビゲーションシステムが、決定された宛先情報に基づいて、コマンドを発せられる。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
通信コマンドは、テレフォンダイヤリングコマンドを含んでいる。
宛先へのルートは、通信コマンドから決定される。
通信コマンドは、口頭でのコマンドを含んでいる。
決定は、通信コマンドと、コンタクトデータベース内の宛先情報との関連に基づく。
別の態様において、一般に、車内ボイスイネーブルユーザーインターフェースを提供する方法は、ナビゲーションシステムからテキストのストリート情報を得るステップと、テキストのストリート情報を、その口頭での等価物に変換するステップとを有している。そして、口頭での等価物が、ユーザーに提示される。
別の態様において、一般に、車内ボイスイネーブルインターフェースを提供する方法は、グラフィックディスプレイ上でユーザーに視覚的なキューを提示するステップを有している。視覚的なキューは、ユーザーが直接ディスプレイを見ることを必要とせずに、ユーザーの周辺視野内でのユーザーによる検出に適している。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
視覚的なキューは、口頭インターフェースの状態に関連している。
視覚的なキューの提示は、口頭インターフェースが、口頭コマンドを受け入れる状態にあることの表示を提供するステップ、例えば、口頭インターフェースが、ユーザーから口頭でのコマンドを受け入れたことの表示を提供するステップを有している。
別の態様において、一般に、車内ボイスイネーブルインターフェースを提供する方法は、口頭での対話の開始時に、音響環境に関する1つ以上の制御設定を調節するステップを有していて、調節の前に、制御設定を記録するステップと、口頭での対話の後に、制御設定を元に戻すステップとを有している。
制御設定は、音量設定を含んでいてもよく、これは、例えば、音声の音量設定またはノイズを発生するデバイスに対する設定を含んでいる。ノイズを発生するデバイスは、ファンを含んでいてもよい。
別の態様において、一般に、マルチモード車内ユーザーインターフェースを提供する方法は、第1の対話モードにおいて、コマンドの第1の部分を受け入れるステップと、このユーザーインターフェースに関する状態を検出するステップと、検出された状態に基づいて、第2の対話モードを決定するステップと、第2の対話モードにおいて、コマンドの第2の部分を受け入れるステップとを有している。第1の対話モードおよび第2の対話モードは、口頭対話モードおよびマニュアル対話モードのそれぞれである。
この態様は、以下の特徴のうちの1つ以上を含んでいてもよい。
この方法は、ユーザーに、第1の対話モードおよび第2の対話モードのうちの1つだけに実質的に関連する情報を提示するステップを更に有している。
ユーザーインターフェースに関する状態を検出するステップは、ユーザーインターフェースの環境内でのノイズレベルを検出するステップを有している。
コマンドの第1の部分の受け入れおよびコマンドの第2の部分の受け入れが実行され、コマンドの第1の部分の反復を必要とせずに、コマンドの連続的な入力を提供する。
別の態様において、一般に、ボイスイネーブルユーザーインターフェースを提供する方法は、語彙項目のテキストの明細を受け入れるステップと、語彙項目に対する発音を決定するステップと、ユーザーからの口頭での入力を受け入れるステップと、決定された発音を用いて、口頭での入力の中で語彙項目を自動的に認識するステップとを有している。もし、認識された語彙項目と関連する得点が、予め決められた範囲内に入るならば、語彙項目のうちの1つ以上の発音が、受け入れられた口頭での入力から決定される。
別の態様において、一般に、デバイス間の関連付けを確立する方法は、第1のデバイスで関連付け手続を開始するステップと、第1のデバイスで1つ以上の候補デバイスを検出するステップと、ユーザーから候補デバイスのうちの第2のデバイスの選択を受け入れるステップと、第1のデバイスからユーザーに関連付け情報を提供するステップと、第1のデバイスから第2のデバイスに要求を伝送するステップと、第2のデバイスでユーザーから関連付け情報を受け入れるステップとを有している。
他の特徴および利点は、以下の説明および請求項から明らかである。
図1は、ブロック図である。
図2は、ブロック図である。
図3は、フローチャートである。
図4は、フローチャートである。
図5は、タイミング図である。
図1を参照すると、自動車システムは、自動車または他のタイプの車両内で、制御および通信機能のための統合されたユーザーインターフェースを提供する。このユーザーインターフェースは、ボイスイネーブルインタラクションをサポートするのに加えて、他のモードのインタラクション、例えば、制御盤を用いるマニュアルインタラクションもサポートする。制御盤とは、例えば、ダッシュボードまたはステアリングホイールに取り付けられた制御盤(例えば、ボタン、ノブ)である。このシステムは、車両内のデバイスに対するインターフェースも備えている。インターフェースとは、例えば、車両内に持ち込まれるモバイル機器に対する無線インターフェースである。このシステムは、情報ソースに対するインターフェースも提供する。情報ソースとは、例えば、情報にアクセスするためのリモートサーバー(すなわち、自動車の中でホストとして働くわけではないシステム、または自動車と共に移動するわけではないシステム)である。
このシステムのヘッドユニット100は、自動車の中で、ユーザー(運転手または他の人)との対話を可能にする他の部品に接続されている。図1に示したシステムの具体例において、グラフィカルディスプレイ110は、ユーザーに対してグラフィカルな出力(または他の視覚的なキュー)を提供する。ユーザーは、入力装置112を用いてマニュアル入力を行うことができる。入力装置112は、(例えば、センターコンソール、ステアリングホイール上に)ボタンを備えていてもよいし、ディスプレイ上に可変(“ソフト”)ボタンを備えていてもよいし、等々。マイクロフォンまたはマイクロフォンアレイ114およびスピーカー116は、それぞれ、このシステムへの音声入力およびこのシステムからの音声出力を可能にする。ヘッドユニット100は、外部デバイスとの通信インターフェースを備えている。外部デバイスとは、例えば、携帯(例えば、セルラー)電話120、および携帯情報端末(PDA)122、組み込み電話123、および携帯用パーソナルコンピュータ124である。このバージョンのシステムにおいて、通信リンクは、無線アプローチを使用し、それは、ブルートゥース規格を使用する。代替案として、他の有線または無線アプローチも、このような通信リンクのために用いられ得る。外部デバイスは、別々のユーザーインターフェースを備えることができ、このユーザーインターフェースを通して、ユーザーは、それらのデバイスと対話することができる。いくつかの外部デバイス、例えば携帯電話120は、無線ネットワークのような外部通信システムとの通信リンクを提供する。このシステムは、リモートデータインターフェース118、例えば無線データトランシーバも備えていて、これは、リモートサーバー140との通信リンクを提供する。
図2を参照すると、ヘッドユニット100は、1人以上のユーザーに対するプロフィールデータ240を有している。プロフィールデータは、システムを、個々のユーザーに適合またはカスタマイズさせることを可能にする。ヘッドユニット100は、ボイスイネーブルサブシステム210も有していて、これは、例えば自動音声認識(ASR)およびテキスト−音声合成(TTS)を用いて、システムとユーザー間での音声に基づく対話を可能にする。ボイスイネーブルサブシステム210は、話者に依存しない(SI)音声設定データ212を使用するが、これは、ユーザーによって発され得る口頭でのコマンドおよび特徴に関する情報を含んでいる。特徴とは、例えば、それらのコマンドに関する単語の発音、および他の構成要素であり、それは、一般に、特定のユーザーに固有というわけではない。ボイスイネーブルサブシステム210およびSI音声設定データ212については、以下でより詳細に述べる。ヘッドユニットは、自然に聞こえる音声出力を達成するために、言語の規則および辞書を用いて、言語の普通のテキスト表現を、その口頭での等価物に変換するための、テキストを音声に変換するサブシステム220も有している。入力テキストは、様々な方法、例えばキーボードまたはダッシュボードもしくはステアリングホイール上の制御盤(ボタン、ノブなど)を介して入力され得る。または、以下のような様々なタイプのファイルから読み出され得る。ワープロファイル、ウェブページ、データベースレコード、電子メールメッセージなど。ヘッドユニットは、ユーザーの口頭での入力に基づいてユーザーを認証するための話者確認サブシステム222も有している。
この具体例としてのシステムにおいては、プロフィールデータ240、ボイスイネーブルサブシステム210、SI音声設定データ212は、全てヘッドユニット100内に設置されていることが示されているが、上記のサブシステムおよびデータ(例えば、プロフィール、音声設定データ)は、代替案として、様々に異なる物理的な構成要素の中に設置され得ることに留意する必要がある。
一例として、ボイスイネーブルサブシステム210は、Burlington, MA 01803に本社があるScanSoft社からのASRおよびTTSソフトウェアを使用する。ScanSoft ASRエンジンは、(1つの単語の不連続な発声を必要とするのと比較して)連続的な入力音声をサポートし、(拘束を受けていない口頭でのテキストの口述と比較して)コマンドおよび制御文法の使用をサポートし、話者に依存しない設定をサポートし、設定をユーザーに適合させる機能、例えば、追加の発声を用いて特定の単語のための設定情報を訓練する機能をサポートする。ScanSoft ASRエンジン上で構築された具体例としてのボイスイネーブルサブシステム210は、以下の構成要素を有している。
・音声入力を一連の音響特性に変換し、それぞれは、限られた時間の範囲内の音声入力の特徴を表す数値ベクトルとして表される特徴抽出器。
・例えば、特定の音に対する音響特性の統計的分布に基づいて、言語内の様々な音声の数学的表現を提供する音響モデル。1つの音響モデルは、1つのクラスの人々にとって一般的であり得る。または、1つまたは小さいグループの人々に固有であり得る。例えば、話者に依存しない(SI)モデルは、多くの人々の声のサンプルから集められたデータに基づく一方で、話者に依存するモデルは、1人の人の声のサンプルから集められたデータに基づく。SIモデルは、例えば、性または年齢に依存している1つのクラスの人々を表し得る(例えば、男性モデル、女性モデル、または子供モデルなど)。この音響モデルで表される音は、(例えば、必ずしも単語の言語構造に基づかなくても)、音節に基づいて、音素に基づいて、または文脈に依存する音素に基づいて、特定の単語と関連付けられ得る。
・話され得る妥当なフレーズを記述する文法、または、どちらの文が話され得るかを決定する規則。例えば、文法は、テキスト表現(例えば、BNF、バッカス−ナウア記法)を用いて表され得る。
・音響モデルで表される音に関して、単語と、それらの単語または全部のフレーズの表現との間のマッピングを提供する辞書。例えば、音素に基づく音響モデルの場合、辞書は、単語またはフレーズの音声の筆写をリストアップしていて、各々は、音素のシーケンスとして、代替シーケンスのリストとして、または(例えば、音素を有するネットワーク内の弧にラベルを付けることによって)各経路が特定のシーケンスを表すネットワークとして表される。辞書は、音響モデルと共にあるので、一般的または固有であり得る。例えば、1つのバージョンのシステムの中で、SI辞書が用いられ、加えて、最初に見つけられなかった単語または辞書の中で適切に表現されていなかった単語のために、SD例外辞書も用いられる。
・書記素−音素(G2P)モジュール。これは、自動化されたシステムであり、書かれたテキストストリングを辞書のような筆写に変換する。
・文法と、1つ以上の辞書(例えば、SI辞書および例外辞書)とを結合して、実行時設定データを計算する実行時設定エンジン。
・実行時設定データに従って、音声入力の特徴を音響モデルと比較して、結果として最適な組み合わせを提供する認識エンジン。
上記の具体例としてのボイスイネーブルサブシステムにおいては、SI音声設定データ212は、辞書および文法を含んでいる。ボイスイネーブルサブシステム210の具体的な実施に応じて、SI音声設定データ212は、より多いか、またはより少ない構成要素を含んでいてもよい。
1人のユーザーのためのプロフィールデータ240は、コンタクトデータ242を含んでいて、例えば、それは、人々の名前(または同等に、場所、企業など)および他の関連する項目、例えば電話番号、住所、関心がある地点(POI)、カレンダーまたはスケジュール、および人またはPOIに関する情報を提供するための任意の項目、例えばPOIのイベントおよび過去の訪問の経験を記述しているメモを含んでいる。プロフィールデータ240は、話者に依存する(SD)音声設定データ244も含んでいて、これは、そのユーザーに特有のものである。以下で更に詳細に述べるが、SD音声設定データ244は、精度を改善することができる情報を含んでいて、これによって、例えば、ユーザーによって話される名前のユーザー固有の発音を含むことによって、ボイスイネーブルサブシステム210は、ユーザーの発声を認識することができる。一般に、SD音声設定データ244は、訓練のために、ASRエンジンからの設定データの修正されたか更新された部分、例えば辞書内のユーザー固有の単語筆写項目および具体例としてのボイスイネーブルサブシステム内の再編集された文法を含んでいる。
ヘッドユニット100は、無線サブシステム230も有していて、これは、外部デバイス、例えば携帯電話120との通信を確立かつ維持するための通信サービスを提供する。無線サブシステム230および携帯電話120は、それぞれペアリングモジュール232および252を有していて、これは、外部デバイス(例えば、電話120、PDA122、またはコンピュータ124)がヘッドユニット100に近接しているとき、通信を確立するための手続を実現する。ペアリング手続の詳細は、この説明の中で後述される。
ヘッドユニット100に接続され得る外部デバイスは、オプションとして、ヘッドユニット100によって用いられるデータを有している。例えば、図2に示したように、携帯電話120は、コンタクトデータ250を有していて、これは、名前および対応する電話番号、およびオプションの追加情報、例えばコンタクト(例えば、そのユーザーに対して知られている人、場所、または実体)のストリートアドレスを含んでいる。1つの動作モードにおいて、携帯電話がヘッドユニット100と通信しているとき、このようなコンタクトデータ250は、無線サブシステム230を通してヘッドユニット100に転送され、ユーザーのプロフィールデータ240のコンタクトデータ242を更新またはポピュレートするために用いられる。
ヘッドユニット100内のコンタクトデータ242は、様々な方法で、例えばCD/DVD、ハードドライブ、リモートサーバー、PDA、セルフォン等から、ユニットに与えられ、タスク、例えばハンズフリーネームダイヤリングのために用いられる。ヘッドユニットは、コンタクトデータの音声登録を受け入れることができるのに加えて、テキストに基づく登録、例えば、外部デバイスから提供されるデータに基づく登録も受け入れることができる。音声登録においては、ユーザーは、自動車内で、名前および番号を話すことができ、ヘッドユニットは、それらの名前および対応する番号を録音して(例えば、処理して、処理された表現を記憶して)、登録する。ヘッドユニットのボイスイネーブルサブシステム210は、それから、タスク、例えば、ユーザーが以前に登録した名前を後に話すボイスイネーブルダイヤリングのために、これらの録音された名前を使用し、システムは、ヘッドユニットに接続されたセルラー電話を通して、対応する番号にダイヤルする。
図3を参照すると、テキストに基づく登録において、名前(例えば、人、場所、実体、または他の項目(例えば、歌のタイトルまたはオーディオディスク))が、入力310として(すなわち、テキスト形式で)ヘッドユニットに提供され、システムは、SI音声設定データ212を増やして、それらの名前を含む口頭での発声を受け入れて認識する。ボイスイネーブルサブシステム210は、それから、SI音声設定データ212を使用して、口頭ユーザー入力330を処理する。ボイスイネーブルサブシステムは、また、口頭ユーザー入力330を使用して、SD音声設定データ244を決定することができる。この一例は、音声登録モードであり、ここで、テキスト入力310の提供よりはむしろ、ユーザーは、システムによって認識されるべきコマンドまたは名前を話す。他の例において、その幾つかは、更に以下で論じられるが、口頭ユーザー入力330は、SD音声設定データ244を更新するために用いられ、それは、SI音声設定データ212と共に用いられる。1つのシナリオにおいて、SI音声設定データ212のみを用いる認識が成功しなかったとき、SD音声設定データ244を更新するために、音声登録が開始される。このように、設定データの選択された部分だけが、SD構成要素を持つ必要があり、テキスト登録によって提供される便宜、および音声登録を用いて得られたSD設定データによって提供される精度を提供する。
システムによって認識され得る名前またはコマンドのテキストに基づく明細の一例として、ヘッドユニット100が外部デバイスと通信するとき、テキストに基づく情報(例えば、名前または他の単語のつづりを略さずに書いた表現)は、例えば携帯電話120内のコンタクトデータ250から、ヘッドユニットにダウンロードされる。ヘッドユニットのボイスイネーブルサブシステムは、それから、テキスト情報の発音(「音声のつづり」)を決定する自動的な方法、例えば、辞書検索320または自動書記素−音素手続322を使用して、システムが、テキスト登録からの名前または他の単語を含む口頭コマンドを受け入れて処理することを可能にする。例えば、従来のSI音声認識技術は、テキスト情報を処理するため、およびテキスト情報に基づく単語(語彙)を含むユーザーの発声を認識するために用いられる。
登録のための音声に基づくアプローチおよびテキストに基づくアプローチに加えて、ヘッドユニット100は、ユーザーが口頭コマンドの中で用いることができる、語彙の登録に対する更なるアプローチを使用する。これらの更なるアプローチのうちのいくつかは、システムによって受け入れられる単語のための音声サブシステムによって用いられる、発音の精度に関する問題に対処することに狙いをつけている。例えば、これらの問題は、予測が難しい標準の発音、または、例えば、外国風のアクセントによる、もしくは、より一般的に、ユーザーの国家的、地域的、文化的、または言語学的バックグラウンドに基づく、ユーザーに固有の発音に関する。
テキスト表現から単語の発音を決定するために、ボイスイネーブルサブシステム210によって用いられる1つのアプローチは、SI辞書にアクセスすることを含んでいる。SI辞書内の単語に対して、発音は、それらの単語を含んでいる発声が話されたかどうかを決定するために、ユーザーからの音声入力を処理するとき、音声認識エンジンによって用いられる。例えば、外部デバイスからのダウンロードの結果として、システムに動的に追加される、全ての名前または新しい単語をカバーするのに十分大きい辞書を有することは、実際的ではないだろう。ボイスイネーブルサブシステム210によって用いられる第2のアプローチは、単語のテキスト表現を受け入れるために、かつ辞書の中で用いられるタイプの表現を出力するために、自動化された書記素−音素(G2P)手続を実行することを含んでいる。G2P手続のための辞書および音声設定データは、SI音声設定データ212の中に含まれていて、それは、一般にいかなる特定のユーザーにも固有ではない。
名前の認識は、名前の発音が必ずしも予め正確に予測されることができないという事実のために、挑戦していてもよい。同様に、G2P手続は、一般に、ユーザーの特徴、例えば彼または彼女の自国語および文化に固有ではない。
ボイスイネーブルサブシステム210は、特定のユーザーのプロフィールデータ240からのSD音声設定データ244と同様に、必ずしも特定のユーザーに固有であるというわけではない、SI音声設定データ212の組み合わせを用いることができる。例えば、2つのタイプの設定データは、同時に用いられて、口頭ユーザー入力を認識する。代替案として、SI設定データ212が最初に用いられて、その使用の中で決定される組み合わせまたは得点に応じて、SDデータ244が次に用いられてもよい。または、SI音声設定データ212およびSD設定データ244に基づく認識の得点が比較され、比較に基づいて1つが選択される。
音声認識に対する1つのアプローチは、2つのステップを用いて、ユーザー固有の発音を決定する。第1に、変化を含む辞書から、または、例えば、ネットワーク表現における、複数の変化を生成するG2P手続から、1つの単語に対する複数の発音の組が決定される。第2のステップにおいて、例えば、ユーザーからの口頭入力に基づいて、一つの最善の(または、より一般的に、複数の最も一致しているサブセットの)一致している発音が選択される。
システムのいくつかのバージョンにおいて、システムが特定のユーザーのためにSD音声設定データ244を使用するとき、それは、SI設定データ212に対するサポートも維持する。このようにすれば、もし、システムがあるユーザーのプロフィールデータを用いていながら、他のユーザーがコマンドを話したとしても、他のユーザーの発声は認識され得る。これは、たとえ、プロフィールデータと関連があるユーザーが、非常に特殊な設定を有していたとしても、可能である。
SD音声設定データ244を生成するための他のアプローチは、ユーザーの口頭での入力に依存する。例えば、ボイスイネーブルサブシステム210は、不正確な、話者に依存しない音声の筆写のいくつかを訂正する機能を提供する。不正確な、話者に依存しない音声の筆写は、話者に依存しない辞書のみを使用することによって起こり得る。この機能は、自動化された音声認識の中で用いる発音を決定する際に、ユーザーの発声を使用する。1つのこのようなアプローチは、認識の中で用いる発音を決定するために、ユーザーが全ての新しい名前を話すことを必要とする。好ましくは、システムは、自動的にユーザーの名前の発音を訓練して、ユーザーの介入を必要とせずに、すなわちプロセスを認識して、SI辞書/規則を用いるか、またはそのユーザーのためのユーザー固有の発音を決定するかどうかに関する決定を下す。
システムの1つのバージョンにおいて、SI辞書およびG2P手続は、認識文法、例えば特別な音声タスクのための文法における全ての単語の発音表記を形成するために用いられる。このようなタスクの例は、音声ダイヤリングであり、この中で、ユーザーは、長いコマンドの文脈の中で名前を言うことができる(例えば、「ジョンスミスに電話をして下さい」)。加えて、システムは、特定のユーザーに固有な例外辞書の使用をサポートする。例外辞書の1つの用途は、特別な単語の追加の表現を含ませることである。例えば、もしユーザーが「スミス」を発音する特別な方法を有するならば、例外辞書は、その単語のための例外項目を含むように、システムによって設定され得る。実行時設定エンジンが、エンジン用に、実行時設定データを計算するときに、認識文法の中で単語「スミス」を表現する際に、実行時設定エンジンは、SI発音および例外発音を含む。代替案として、例外発音だけが、実行時設定データを生成するために用いられる。代替案として、名前のユーザー固有の発音を適応させるために、システムは、例外辞書の中に、例えばスミス−1のような、新しい単語を導入し、かつ文法を修正して、元のスミスという単語に加えて、スミス−1という単語も、両方とも可能にする。従って、たとえ例外辞書がSI辞書より優先されるとしても、単語の両方の形式は、入力発声を処理するとき、認識エンジンによって受け入れられるであろう。以下の説明において、辞書を更新するとは、上記のように、例外辞書の中に項目を追加または更新することに相当し得る。
図4を参照すると、ボイスイネーブルサブシステム210(図2参照)によって実現されるプロセスは、動作中に(すなわち、必ずしも訓練モード中ではない)口頭ユーザー入力330(図3参照)を受け入れるステップを含んでいる。そして、この入力に応じて、おそらくは、発声の中の1つ以上の単語のユーザー固有の発音を含む、ユーザー固有の辞書を更新する。このプロセスにおいて、単語またはフレーズを含む発声、例えばユーザー音声コマンドからの名前は、ボイスイネーブルサブシステムによって認識される(ステップ410)。エンジンは、認識された仮説が発声と一致する程度を示す得点を、仮説と関連する信頼度C1の形(または得点の他の形式)で提供する。もし信頼度が前もってセットされた閾値T1を上回るならば(ステップ412)、システムは、辞書を更新することなく進む(ステップ440への分岐)。もし信頼度が第2のより低い閾値T2の下にあるならば(ステップ414)、システムは、辞書を更新することなく、発声を拒絶する(ステップ430)。しかし、信頼度C1が2つの閾値によって形成される範囲内にあるとき、システムは「未決定」状態420に入る。
「未決定状態」において、システムはユーザーからの正しい答えを確認する(ステップ422)。例えば、ユーザーからの更なるプロンプトおよび口頭または他のモードの入力を用いて、仮説を確かめる。または、暗黙のうちに行う。なぜなら、ユーザーは、認識された答えに基づいて、動作をキャンセルするよりはむしろ受け入れるからである。ユーザーからの応答が、システムが単語/フレーズを正しく認識しなかったことを確認したとき、ユーザーの個人の発音を更新する動作はとられない。ユーザーからの応答が、システムが正しい単語/フレーズを正しく認識したことを確認したが、信頼度が高くなかったとき(ステップ424)、システムは訓練モードに入り、この中でSD設定データが更新される(ステップ426)。この訓練モードの中で、システムは発声を処理し、この発声に基づいてユーザー固有の辞書を更新する。ScanSoft ASRエンジン上で構築された具体例としてのシステムに対して、訓練は、以下のステップを含んでいる。
・ユーザーの発声を集める、または以前に保存された発声を使用する。
・ユーザー単語の筆写を生成する。
・ユーザー単語の筆写を(例外)辞書の中に追加する。
・この単語を使用する文法を再編集する。
・エンジンは、新しい文法を用いて、音声入力を認識する。
いくつかの実施形態において、ユーザーが後に同じ単語またはフレーズを発音するとき、もし更新されたSD辞書C2を用いる信頼度と、SI辞書C1を用いる信頼度との間の差が、予め決められた閾値(T3)より大きいならば、更新されたSD辞書が用いられるだろうし、さもなければ、SI辞書が引き続き用いられるだろう。
音声イネーブルシステム210は、名前の口頭での入力の精度を改善可能な他の機能を提供する。一般に、このアプローチは、名前を話すとき、ユーザーが追加情報を追加することを必要とする。これは、例えば、「ジョンスミスJ.S.」のような名前の発声の後の頭文字のような追加情報を追加することによる。追加情報は、冗長であり得る。例えば、頭文字の場合、名前または名前から一意に決定される他の情報から、直接、導き出される。または、追加情報は、情報の曖昧さをなくし得る。例えば、その名前と関連がある複数の項目を有するコンタクトデータベース内の「ジョンスミス」の特定の例を識別する。入力タスクの中で、ユーザーは、コンタクトデータからコンタクトを選択する。このコンタクトデータは、認識文法を構築するために用いられる。認識文法は、このような追加情報と共に発声を受け入れる。ユーザーは、名前を呼ぶことによって、コンタクトに電話をかける。例えば、「ジョンスミスに電話せよ」。しかし、一般的ではなく、かつ/または混乱しやすい名前に対しては、エンジンは、それを正確に認識しないかもしれない。例えば2つの文字から成る追加情報が、音声認識サブシステムによって用いられ、正しい認識仮説を不正確な誤認識仮説から区別する。
このアプローチに基づく他の例は、以下の通りである。
システム:名前と番号をどうぞ。
ユーザー:ボブスミスの自宅。
システム:申し訳ありませんが、もう一度言って下さい。
ユーザー:ボブスミスの自宅の電話。
システム:申し訳ありませんが、別の方法で試しましょう。人の名前に続けて姓名の頭文字を言って下さい。
ユーザー:ボブスミスBSの自宅。
システム:ボブスミスの自宅に電話します。
上述したアプローチの中で、コンタクトデータは、外部デバイスによって提供されるが、このデータは、不完全でもよい。例えば、電話番号はあるが、住所情報(これはナビゲーションの構成要素が必要とする可能性がある)は、ユーザーのコンタクトデータから見つからないかもしれない。このシステムの特徴は、見つからない情報が、ヘッドユニット内のデータに、自動または手動で追加され得ることである。これは、外部の情報ソース、例えばリモートサーバー140(図1参照)にアクセスすることによって達成される。例えば、「ホワイトページ」ディレクトリは、無線ネットワークシステムを介したインターネットを通じてアクセスされる。追加される見つからない情報は、音声コマンドの中で用いられる可能性がある。例えば、「メープルストリートファーストに住んでいるジョンスミスに電話せよ」または「ジョンスミスに電話せよ。彼の職場の電話番号は508−555−1212だ。」このようなより複雑な口頭での入力は、自動化された認識の中で、より高い精度を達成することができる。難しい認識問題(例えば2人のジョンスミス)に対して、これらの追加情報の使用のおかげで、このシステムは、まだ話者に依存しないモードを提供することができ、冗長な話者に依存するモードに切り替える必要はない。例えば、「オークストリートのジョンスミス」に電話せよに対して「ウォータードライブのジョンスミス」に電話せよ。
見つからない情報は、他のサブシステム、例えばナビゲーションシステムによっても用いられ得る。例えば、ユーザーは、POI(例えばレストラン)の名前を言うことができる。システムは、自動的に、コンタクトデータから住所情報を抽出し、抽出された住所情報を用いて、ナビゲーションサブシステムにコマンドを発する。各コンタクトデータレコードのための複数の項目(セル、自宅、職場の電話番号、好ましいコンタクトリストなど)は、選択するユーザーまたは利用するシステムのために、全てユーザーに提示され得る。いくつかの態様において、例えば音声(例えば口頭での名前または数字の列)によって、またはマニュアル入力によって、ユーザーがテレフォンダイヤリングコマンド(または他のタイプの特定の宛先との通信に関するコマンド)を提供するとき、ナビゲーションシステムは、自動的に、テレフォンダイヤリングコマンドと関連する場所へのナビゲーションルートを決定することができる。または、テレフォンダイヤリングコマンドと関連する場所を示している地図を決定することができる。
システムの他の態様において、話者識別機能が、記憶されたセットのユーザーのうちのどのユーザーがシステムと対話しているかを決定するために用いられる。この話者識別は、ユーザー固有のシステムの基本設定を設定する。この基本設定は、ユーザー固有のコンタクトデータ、ユーザー固有の発音、または他の基本設定を含んでいてもよい。様々な技術が、どのユーザーがシステムと対話しているかを決定するために用いられ得る。例えば、ヘッドユニットとペアを組んでいる特定の外部デバイス(例えば携帯電話)が、ユーザーを識別するために用いられ得る。話者確認サブシステム222もまた、ユーザー識別のために用いられ得る。他の適切な技術、例えばパスワード、指紋、顔の認識などが、代替案として用いられる。
話者識別は、このシステムをよりユーザーフレンドリーにすることができ、かつパーソナライズされたサービスを提供することができる。さらに、音声インターフェースは、制御されているシステムと関連する情報を使用することができる。このように、ユーザーインターフェースは、より「知的」にすることができる。他の例として、音声認識サブシステムが、ユーザーが言った仕事またはフレーズを認識しなかったとき、「もう一度言って下さい」を繰り返す代わりに、サブシステムは、ユーザーの基本設定および履歴に基づいて、可能な選択肢のリストを提供することができる。「ジョンスミスですか、またはジョンスティーヴですか。」ユーザーからの正しい答えは、更に、上記のような話者に依存する文法および辞書を生成するために、エンジンを訓練するのに利用され得る。
口頭でのユーザーインターフェースシステムにおいて、ユーザーにシステムの状態のフィードバックを提供することは望ましい。例えば、システムが「リスニング」状態にあることをフィードバックすることは、役に立ち得る。自動車への応用においては、ユーザーとの対話を実行するために、道から目を離す必要がないこともまた、運転手のために望ましい。1つのアプローチは、例えば、トーンおよびビープ音の形で、または、録音もしくは合成された助言の形で、音声フィードバックを提供することである。他のアプローチは、運転手が道から目を離す必要がない視覚的フィードバックを提供することである。より詳細には、運転手の周辺視野を用いて知覚され得る視覚的インジケーターが、ヘッドユニットによって生成される。このような視覚的インジケーターの一例は、グラフィカルディスプレイの比較的広い領域、例えば、ほぼ全領域を使用する。領域全体の視覚的な色または輝度の変化が、システムの状態を示すために用いられる。例えば、特定の色が、システムのマイクロフォンがユーザーの音声入力を聞く準備ができていることを示すために用いられる。領域および色は、ユーザーにとって十分に目立つものであり、ユーザーはディスプレイを直接見る必要はなく、例えば、彼または彼女の周辺視野を用いる。
システムの他の態様において、ヘッドユニットは、音声認識エンジンが困難に遭遇しそうなノイズ状態を検出したとき、ユーザーに警告する。システムは、ノイズレベルを測定し、音声認識が推奨されないとき、ユーザーに警告する。システムは、キャビン内の音響ノイズレベルを測定し、ユーザーが音声認識入力を用いようとするときに、キャビン内にノイズが多すぎるかどうかをユーザーに知らせる。警報は、音声、映像または上述したような視覚的インジケーターの形であってもよい。システムは、更に、自動切換によって、またはユーザーに選択を勧めることによって、コマンド発行の他のモードに移行することができる。一般に、モード移行は、イベントによって引き起こされ得る。例えば、音声インターフェースから、ディスプレイ上のタッチスクリーンを介するマニュアル入力への移行は、過剰なノイズが車両内で検出されたときに引き起こされ得る。システムの更に他の態様において、移行は、システムが、このシステムとのユーザーの対話の状態を追跡し、かつユーザーによるコマンド発行を続けることができるように、スムーズかつ連続的になされてもよい。例えば、ユーザーは、音声インターフェースを用いて、電話番号を言っていたが、ノイズによって引き起こされたモード移行のために、完了しなかった。音声インターフェースモードからマニュアル入力モードに移行するとき、システムは、完了しなかった口頭での電話番号を移植して、ユーザーのためにディスプレイ上にそれらを示し、コールを続けて完了することができる。
一般に、ユーザーとの対話のためのインターフェースは、複数のモードの入力、例えば音声、タッチ、ディスプレイおよび他のセンサを有している。システムは、ユーザーを、従来技術のように現在使用中のモードにおけるコマンド発行のために必要でない莫大な量の情報に埋没させることを避けるために、使用中のモードに関する情報を、表示または示すことによって、提示するのみである。例えば、音声インターフェースモードにあるとき、ディスプレイ上のソフトキーのようなタッチ入力は表示されない。ハードドライブのようなオーディオソースが選択されているとき、FMもAMもディスプレイ上に表示されない。このようなマルチモードユーザーインターフェースを提供する1つの例は、音声入力モードにおけるコマンドの最初の部分を受け入れることを必要とする。ユーザーインターフェースに関する状態が検出される。例えば、高いノイズレベルが検出される。システムは、このノイズレベルに基づいて、マニュアルモードが用いられるべきであることを決定する。次に、コマンドの2番目の部分が、マニュアルモードにおいて受け入れられる。コマンドの最初および2番目の部分は、例えば、コマンドの最初の口頭での部分がマニュアル入力を用いて繰り返されることを必要とせずに、スムーズかつ連続的な移行を形成することができる。
システムの他の態様において、ヘッドユニットは、「ボイスコマンド」シーケンスの間、変更されていた環境設定を元に戻す。このような環境設定は、ファンの速度、または音楽の音量を含んでいてもよい。例えば、ヘッドユニットは、音声入力の間、音楽の音量またはファンの速度を下げて、口頭での対話が終わったら、それらを元に戻してもよい。
ヘッドユニット100の他の態様は、外部デバイスにインターフェースを提供することに関し、特に、ブルートゥース無線通信規格を用いる。この規格によって規定されるプロトコルによれば、2つのブルートゥースデバイスが「ペアになる」とき、それらは、データを共有し、かつ制御信号をお互いに送信することができる。例えば、車内音声インターフェースユニットは、ブルートゥースを介してPDAまたはセルラー電話と通信して、このデバイスに記憶されたコンタクトリストをダウンロードすることができる。ペアリングプロセスに対する典型的なアプローチは、安全な方法での2つのデバイスのお互いに対する紹介を必要とする。1つのデバイスが他方を「発見」し、共通のコードが2つのデバイス間で渡される。
ヘッドユニットは、ペアリングの効率を改善可能な単純化されたペアリングプロセスを実行する。一般に、知能をデバイスのうちの1つの中に入れることによって、ステップを単純化して、ユーザーへの負担を軽くする。図5を参照すると、このような単純化されたペアリングプロセスの一例は、以下のような対話のシーケンスを有している。この例では、「デバイスA」はヘッドユニットであり、「デバイスB」は、例えば、携帯電話である。
1)ユーザーは、デバイスA上でペアリングを開始する(ステップ510)。ボタンを押すことによって、デバイスAは、ブルートゥースデバイスとの対話を開始する。例えば、ハンズフリー電話への応用においては、ヘッドユニットは、携帯用モバイル電話とペアにされるべきであり、ユーザーは、ヘッドユニットに接続されているトークボタンを押す。ユーザーは、特別なペアリングシーケンスについて知っている必要はない。
2)デバイスAは、ペアリングが必要であることを自動的に検出し(ステップ520)、利用可能なデバイスを探して、その範囲を検索し、かつユーザーに選択肢を提示する。例えば、ヘッドユニットは、車両内でデバイス(例えば携帯電話およびPDA)のリストを表示する。
3)ユーザーは、デバイスAのユーザーインターフェース上で、デバイスBを選択する(ステップ530)。
4)デバイスAは、ランダムコードを自動的に生成し、ユーザーに、このコードを、例えばディスプレイを介して提示する。それは、デバイスAのディスプレイまたは別のディスプレイ、例えばヘッドユニットのディスプレイであってもよい。そして、デバイスBに接続要求を送信する(ステップ540)。
5)デバイスBは、デバイスAから接続要求を受信する。ユーザーは、ランダムコードを用いて、この要求を受け入れる選択肢を有している(ステップ550)。
6)ユーザーは、デバイスB上で、この要求を受け入れる(ステップ560)。
このアプローチは、両方のデバイスをペアリング/発見モードに設定する必要性を避けることができる。
ヘッドユニットは、自動車内の多数のシステムに対するインターフェースを提供する。2つのこのようなシステムは、ナビゲーションシステムおよび携帯電話システムを含んでいる。このシステムの態様は、ダウンロードされたコンタクト情報を、ユーザーインターフェースおよび関連するシステムを設定する際に用いることができることである。この設定は、コンタクト情報に基づいてナビゲーション宛先情報を登録する機能を提供することを含んでいてもよい。例えば、人の名前は、ナビゲーションのための宛先の明細として用いられ得る。いくつかのシナリオにおいて、対応する住所情報は、外部デバイスからダウンロードされた情報の中から利用可能ではなく、むしろ遠隔の情報プロバイダー、例えば電話「ホワイトページ」システムからダウンロードする。コンタクト情報の有効性に関する他の機能は、名前と他の関連する情報の組み合わせに基づく、電話する相手の明細に関する。例えば「メインストリート上のジョンスミス」または「オフィスにいるジョンスミス」。追加の関連情報は、電話する番号の曖昧さをなくすために用いることができ、名前のみに基づいても曖昧さがないときでも、認識精度を改善することができる。
システムの他の態様は、ディスプレイ上に表示されるナビゲーションデータベースからのテキストのような情報である。ストリート名、方向(右、左、直進など)が、テキストから音声への変換を介して、音声で運転手に提供され得る。例えば、ナビゲーションマップ上でストリート名およびそこからの距離を表示することの代わりに、かつ/または、このことの他に、ボイスイネーブルサブシステムが「次の4分の1マイル以内にメインストリートを左へ曲がって下さい」と言うことができる。一実施形態において、強調された「メインストリート」は、TTSを介して得ることができる一方で、他は、予め録音しておくことができる。
上述した態様の1つ以上が、ヘッドユニットの様々なバージョンの中で実現され得る。すなわち、機能の組み合わせが、様々な実施形態の中でなされ得る。このシステムは、様々なタイプの車両および他の車両ではないユーザー環境に適用できる。ヘッドユニットは、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアの組み合わせを用いて実現することができる。ソフトウェアは、インストラクションを有していて、これは、媒体、例えばリードオンリーメモリ内またはディスクドライブ上に記憶され、かつヘッドユニット内に組み込まれたプロセッサ上で実行され得る。
前述の説明は、例示を目的とするものであって、本発明の範囲を限定するためのものではないことは理解されるべきである。本発明の範囲は、添付の請求項の範囲によって定められる。他の実施形態も、この請求項の範囲内である。
ブロック図である。 ブロック図である。 フローチャートである。 フローチャートである。 タイミング図である。
符号の説明
100 ヘッドユニット
110 グラフィカルディスプレイ
112 入力装置
114 マイクロフォンまたはマイクロフォンアレイ
116 スピーカー
118 リモートデータインターフェース
120 携帯電話
122 携帯情報端末(PDA)
123 組み込み電話
124 携帯用パーソナルコンピュータ
140 リモートサーバー

Claims (46)

  1. ボイスイネーブルユーザーインターフェースを提供する方法において、
    インターフェースを設定して、音声入力の発声を処理するステップを有していることを特徴とする方法。
  2. 前記音声入力の発声を処理するステップは、識別子を、識別子と関連する、冗長な、または曖昧さをなくす情報と共に処理するステップを有していることを特徴とする請求項1に記載の方法。
  3. 追加の、または曖昧さをなくす情報を、識別子を前記情報と関連付けているデータベースから検索するステップを更に有していることを特徴とする請求項1に記載の方法。
  4. 前記データベースは、コンタクトデータベースを有していることを特徴とする請求項3に記載の方法。
  5. 前記冗長な、または曖昧な情報は、識別子と直接連結されることを特徴とする請求項2に記載の方法。
  6. 前記識別子は、名前を含んでいて、かつ、前記冗長な、または曖昧さをなくす情報は、名前の頭文字を含んでいることを特徴とする請求項2に記載の方法。
  7. インターフェースのための一般的な設定情報を記憶するステップと、
    インターフェースのためのユーザー固有の設定情報を記憶するステップと、
    一般的な設定情報およびユーザー固有の設定情報を用いて、ユーザーからの音声入力の処理を可能にするステップと、
    音声入力処理の結果に基づいて、ユーザー固有の設定情報を選択的に更新するステップとを更に有していることを特徴とする請求項1に記載の方法。
  8. 前記更新は、入力と関連する得点が、不正確な認識仮説が予め決められた閾値以内の得点を有していることを示すとき、入力の正しい認識の上で、実行されることを特徴とする請求項7に記載の方法。
  9. 前記更新は、ユーザーからの更なる音声入力を必要とせずに、実行されることを特徴とする請求項8に記載の方法。
  10. ユーザー固有の設定情報は、辞書項目に対するユーザー固有の発音情報を含んでいて、そのための一般的な発音情報は、一般的な設定情報の中に含まれていることを特徴とする請求項7に記載の方法。
  11. ユーザー固有の設定情報の更新は、インターフェースの使用中に、実行されることを特徴とする請求項7に記載の方法。
  12. 前記更新は、ユーザーからの音声入力の誤認識に基づくことを特徴とする請求項11に記載の方法。
  13. ユーザー固有の設定情報の更新は、ユーザーからの音声入力の認識結果に基づくことを特徴とする請求項11に記載の方法。

  14. インターフェースの複数のユーザーの各々のための設定情報を提供するステップと、
    インターフェースのユーザーを決定するステップと、
    決定されたユーザーに対する設定情報を用いて、インターフェースを適合させるステップとを更に有していることを特徴とする請求項1に記載の方法。
  15. 前記ユーザーを決定するステップは、ユーザーからの口頭での入力に対して話者識別プロセスを適用するステップを含んでいることを特徴とする請求項14に記載の方法。
  16. 音声入力の発声を処理するためにインターフェースを設定する前に、
    語彙項目のテキストの明細を受け入れるステップと、
    語彙項目に対する発音を決定するステップとを有していて、
    音声入力の発声を処理するためにインターフェースを設定した後に、
    決定された発音を用いて、口頭での入力の中の語彙項目を自動的に認識するステップと、
    もし、認識された語彙項目と関連する得点が、予め決められた範囲内に入るならば、受け入れられた口頭での入力からの1つ以上の語彙項目の発音を決定するステップとを有していることを特徴とする請求項1に記載の方法。
  17. 音声入力は、ユーザーからの通信コマンドを含んでいて、
    更に、通信コマンドから宛先情報を決定するステップと、
    決定された宛先情報に基づいて、ナビゲーションシステムにコマンドを発するステップとを有していることを特徴とする請求項1に記載の方法。
  18. 前記通信コマンドは、テレフォンダイヤリングコマンドを含んでいることを特徴とする請求項17に記載の方法。
  19. 前記通信コマンドから決定される宛先へのルートを決定するステップを更に有していることを特徴とする請求項17に記載の方法。
  20. 前記通信コマンドは、口頭でのコマンドを含んでいることを特徴とする請求項17に記載の方法。
  21. 前記決定するステップは、通信コマンドと、コンタクトデータベース内の宛先情報との関連に基づくことを特徴とする請求項17に記載の方法。
  22. 第1のデバイスで、第2のデバイスからコンタクトデータを受け取るステップと、
    前記第1のデバイスで、データソースからの追加データを要求して、コンタクトデータを増やすステップと、
    第2のデバイスからの受信コンタクトデータおよびデータソースからの追加データを用いて、ユーザーインターフェースを設定するステップとを更に有していることを特徴とする請求項1に記載の方法。
  23. 前記第1のデバイスは、車両に基づくデバイスを含んでいて、第2のデバイスは、モバイル機器を含んでいることを特徴とする請求項22に記載の方法。
  24. 前記データソースは、リモートサーバーに常駐していることを特徴とする請求項22に記載の方法。
  25. リモートサーバーから要求される追加データは、コンタクトデータ内の項目と関連する情報を含んでいることを特徴とする請求項22に記載の方法。
  26. コンタクトデータ内の項目は、名前および関連する電話番号を含んでいて、要求される追加データは、この項目と関連する住所情報を含んでいることを特徴とする請求項25に記載の方法。
  27. ナビゲーションシステムからテキストのストリート情報を得るステップと、
    テキストのストリート情報を、その口頭での等価物に変換するステップと、
    ユーザーに口頭での等価物を提示するステップとを更に有していることを特徴とする請求項1に記載の方法。
  28. グラフィックディスプレイ上でユーザーに視覚的なキューを提示するステップを更に有していて、
    この視覚的なキューは、ユーザーが直接ディスプレイを見る必要がなく、ユーザーの周辺視野内でのユーザーによる検出に適していることを特徴とする請求項1に記載の方法。
  29. 前記視覚的なキューは、口頭インターフェースの状態に関連していることを特徴とする請求項28に記載の方法。
  30. 前記視覚的なキューを提示するステップは、口頭インターフェースが、口頭でのコマンドを受け入れる状態にあることの表示を提供するステップを含んでいることを特徴とする請求項29に記載の方法。
  31. 前記視覚的なキューを提示するステップは、口頭インターフェースが、ユーザーから口頭でのコマンドを受け入れたことの表示を提供するステップを含んでいることを特徴とする請求項29に記載の方法。
  32. 調節の前に制御設定を記録することを含む、音声入力対話の開始で、音響環境と関連する1つ以上の制御設定を調節するステップと、
    口頭での対話の後に、制御設定を元に戻すステップとを更に有していることを特徴とする請求項1に記載の方法。
  33. 前記制御設定は、音量設定を含んでいることを特徴とする請求項32に記載の方法。
  34. 前記音量設定は、音声の音量設定を含んでいることを特徴とする請求項33に記載の方法。
  35. 前記制御設定は、ノイズを発生するデバイスに対する設定を含んでいることを特徴とする請求項32に記載の方法。
  36. ノイズを発生するデバイスに対する設定は、ファンの設定を含んでいることを特徴とする請求項35に記載の方法。
  37. マルチモード車内ユーザーインターフェースを提供する方法において、
    第1の対話モードにおいて、コマンドの第1の部分を受け入れるステップと、
    ユーザーインターフェースに関する状態を検出するステップと、
    検出された状態に基づいて、第2の対話モードを決定するステップと、
    第2の対話モードにおいて、コマンドの第2の部分を受け入れるステップとを有していて、
    前記第1の対話モードおよび第2の対話モードは、口頭対話モードおよびマニュアル対話モードのそれぞれであることを特徴とする方法。
  38. ユーザーに、第1の対話モードおよび第2の対話モードのうちの1つだけに実質的に関連する情報を提示するステップを更に有していることを特徴とする請求項37に記載の方法。
  39. 前記ユーザーインターフェースに関する状態を検出するステップは、ユーザーインターフェースの環境内でのノイズレベルを検出するステップを含んでいることを特徴とする請求項37に記載の方法。
  40. コマンドの第1の部分の受け入れおよびコマンドの第2の部分の受け入れが実行され、コマンドの第1の部分の反復を必要とせずに、コマンドの連続的な入力を提供することを特徴とする請求項37に記載の方法。
  41. 通信媒体を通じて第1のデバイスと第2のデバイスを関連付ける方法において、
    第1のデバイスでデータを生成するステップと、
    第1のデバイスで生成されたデータをユーザーに提示するステップと、
    第2のデバイスに関連付け要求を伝送するステップと、
    第1および第2のデバイスの関連付けを許可するユーザーからの入力時に、第2のデバイス上で、データを受け入れるステップとを有していることを特徴とする方法。
  42. 前記第1のデバイスは、車両に基づくデバイスを含んでいて、第2のデバイスは、モバイル機器を含んでいることを特徴とする請求項41に記載の方法。
  43. 前記モバイル機器は、携帯電話およびPDAのうちの1つを含んでいることを特徴とする請求項42に記載の方法。
  44. 第1のデバイス上でボタンを押すことによる開始ステップを更に有していることを特徴とする請求項41に記載の方法。
  45. ブルートゥース通信アプローチに従って、第1のデバイスと第2のデバイスを関連付けるステップを更に有していることを特徴とする請求項41に記載の方法。
  46. 第1のデバイスで関連付け手続を開始するステップと、
    第1のデバイスで1つ以上の候補デバイスを検出するステップと、
    ユーザーから候補デバイスのうちの第2のデバイスの選択を受け入れるステップと、
    第1のデバイスからユーザーに関連付け情報を提供するステップと、
    第1のデバイスから第2のデバイスに要求を伝送するステップと、
    第2のデバイスでユーザーからの関連付け情報を受け入れるステップとを更に有していることを特徴とする請求項41に記載の方法。
JP2006183890A 2005-07-01 2006-07-03 自動車インターフェース Pending JP2007011380A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/173,736 US7826945B2 (en) 2005-07-01 2005-07-01 Automobile speech-recognition interface

Publications (1)

Publication Number Publication Date
JP2007011380A true JP2007011380A (ja) 2007-01-18

Family

ID=37074976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006183890A Pending JP2007011380A (ja) 2005-07-01 2006-07-03 自動車インターフェース

Country Status (4)

Country Link
US (1) US7826945B2 (ja)
EP (1) EP1739546A3 (ja)
JP (1) JP2007011380A (ja)
CN (1) CN1920946A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008275987A (ja) * 2007-05-01 2008-11-13 Yamaha Corp 音声認識装置および会議システム
JP2009210703A (ja) * 2008-03-03 2009-09-17 Alpine Electronics Inc 音声認識装置
WO2009130840A1 (ja) * 2008-04-23 2009-10-29 三菱電機株式会社 車載情報システム
JP2012529236A (ja) * 2009-06-02 2012-11-15 フォード グローバル テクノロジーズ、リミテッド ライアビリティ カンパニー 車両内において電子カレンダー・アプリケーションのハンズフリー操作を実行するシステム及び方法
KR20160059182A (ko) * 2014-11-18 2016-05-26 현대모비스 주식회사 차량용 avn 시스템의 모바일 단말 등록 제어 장치 및 방법
JP2017512433A (ja) * 2014-02-28 2017-05-18 ボーズ・コーポレーションBose Corporation 音源の直接選択
US10063683B2 (en) 2014-12-24 2018-08-28 Hyundai Motor Company In-vehicle multimedia system connected to external device and control method thereof
JP2020003969A (ja) * 2018-06-27 2020-01-09 富士ゼロックス株式会社 画像出力システム、サーバ装置、端末装置、画像出力装置及びプログラム
CN110800044A (zh) * 2017-09-08 2020-02-14 亚马逊技术股份有限公司 用于语音助手系统的话语权限管理
JP2021182217A (ja) * 2020-05-18 2021-11-25 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム

Families Citing this family (402)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6630800A (en) 1999-08-13 2001-03-13 Pixo, Inc. Methods and apparatuses for display and traversing of links in page character array
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US9224394B2 (en) * 2009-03-24 2015-12-29 Sirius Xm Connected Vehicle Services Inc Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
DE102005030965B4 (de) * 2005-06-30 2007-07-19 Daimlerchrysler Ag Erweiterung des dynamischen Vokabulars eines Spracherkennungssystems um weitere Voiceenrollments
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
WO2007008248A2 (en) * 2005-07-11 2007-01-18 Voicedemand, Inc. Voice control of a media player
JP4899685B2 (ja) * 2005-09-02 2012-03-21 株式会社デンソー 手動操作システム
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
TWI302691B (en) * 2005-10-21 2008-11-01 Delta Electronics Inc Portable electronic device with speech synthesize and music prelude functions
US20070124147A1 (en) * 2005-11-30 2007-05-31 International Business Machines Corporation Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems
US8060821B2 (en) * 2005-12-09 2011-11-15 Apple Inc. Enhanced visual feedback of interactions with user interface
EP1961619B1 (en) * 2005-12-16 2012-03-14 Panasonic Corporation Input device and input method for mobile body
US9976865B2 (en) * 2006-07-28 2018-05-22 Ridetones, Inc. Vehicle communication system with navigation
GB2440766B (en) * 2006-08-10 2011-02-16 Denso Corp Control system
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
US7831431B2 (en) * 2006-10-31 2010-11-09 Honda Motor Co., Ltd. Voice recognition updates via remote broadcast signal
US7873517B2 (en) * 2006-11-09 2011-01-18 Volkswagen Of America, Inc. Motor vehicle with a speech interface
US8386125B2 (en) * 2006-11-22 2013-02-26 General Motors Llc Adaptive communication between a vehicle telematics unit and a call center based on acoustic conditions
US8391775B2 (en) * 2007-03-09 2013-03-05 Airbiquity Inc. Mobile digital radio playlist system
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
JP4225356B2 (ja) * 2007-04-09 2009-02-18 トヨタ自動車株式会社 車両用ナビゲーション装置
DE102007016887B3 (de) * 2007-04-10 2008-07-31 Siemens Ag Verfahren und Vorrichtung zum Betreiben eines Navigationssystems
US9423996B2 (en) * 2007-05-03 2016-08-23 Ian Cummings Vehicle navigation user interface customization methods
DE102007021772B4 (de) * 2007-05-09 2013-01-24 Voicecash Ip Gmbh Digitales Verfahren und Anordnung zur Authentifizierung eines Nutzers einer Datenbasis
JP4942814B2 (ja) * 2007-06-05 2012-05-30 三菱電機株式会社 車両用操作装置
US20090055178A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method of controlling personalized settings in a vehicle
US20090055180A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method for optimizing speech recognition in a vehicle
DE102007043935A1 (de) * 2007-09-12 2009-03-19 Volkswagen Ag Fahrzeugsystem mit Hilfefunktionalität
US20090083035A1 (en) * 2007-09-25 2009-03-26 Ritchie Winson Huang Text pre-processing for text-to-speech generation
EP2045140B1 (en) * 2007-10-01 2010-01-27 Harman/Becker Automotive Systems GmbH Adjustment of vehicular elements by speech control
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8315412B2 (en) * 2007-10-17 2012-11-20 The Chamberlain Group, Inc. Method and apparatus to facilitate use of background noise when providing secure access to equipment
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8117242B1 (en) 2008-01-18 2012-02-14 Boadin Technology, LLC System, method, and computer program product for performing a search in conjunction with use of an online application
US8117225B1 (en) 2008-01-18 2012-02-14 Boadin Technology, LLC Drill-down system, method, and computer program product for focusing a search
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
JP4524763B2 (ja) * 2008-03-25 2010-08-18 株式会社デンソー 自動車用情報提供システム
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8386510B2 (en) 2008-04-15 2013-02-26 International Business Machines Corporation Flexible connector framework for data feed generation
US20090271200A1 (en) 2008-04-23 2009-10-29 Volkswagen Group Of America, Inc. Speech recognition assembly for acoustically controlling a function of a motor vehicle
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP4547721B2 (ja) * 2008-05-21 2010-09-22 株式会社デンソー 自動車用情報提供システム
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US20100036666A1 (en) * 2008-08-08 2010-02-11 Gm Global Technology Operations, Inc. Method and system for providing meta data for a work
JP5653354B2 (ja) * 2008-08-11 2015-01-14 ティーティーアイ インベンションズ ディー エルエルシー 車両において、ネットワーク化された携帯機器を使用するためのシステム及び方法
JPWO2010018796A1 (ja) * 2008-08-11 2012-01-26 旭化成株式会社 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法
US8078397B1 (en) * 2008-08-22 2011-12-13 Boadin Technology, LLC System, method, and computer program product for social networking utilizing a vehicular assembly
US8190692B1 (en) 2008-08-22 2012-05-29 Boadin Technology, LLC Location-based messaging system, method, and computer program product
US8265862B1 (en) * 2008-08-22 2012-09-11 Boadin Technology, LLC System, method, and computer program product for communicating location-related information
US8073590B1 (en) 2008-08-22 2011-12-06 Boadin Technology, LLC System, method, and computer program product for utilizing a communication channel of a mobile device by a vehicular assembly
US8131458B1 (en) 2008-08-22 2012-03-06 Boadin Technology, LLC System, method, and computer program product for instant messaging utilizing a vehicular assembly
US8165881B2 (en) * 2008-08-29 2012-04-24 Honda Motor Co., Ltd. System and method for variable text-to-speech with minimized distraction to operator of an automotive vehicle
US20100057465A1 (en) * 2008-09-03 2010-03-04 David Michael Kirsch Variable text-to-speech for automotive application
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
JP4414470B1 (ja) * 2008-10-10 2010-02-10 本田技研工業株式会社 車両の故障診断のための基準値の生成
KR20110082127A (ko) * 2008-10-28 2011-07-18 에어비퀴티 인코포레이티드. 차량 내 라디오에서 플레이되는 악곡의 구입
US8392190B2 (en) 2008-12-01 2013-03-05 Educational Testing Service Systems and methods for assessment of non-native spontaneous speech
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
KR101057191B1 (ko) * 2008-12-30 2011-08-16 주식회사 하이닉스반도체 반도체 소자의 미세 패턴 형성방법
US9641678B2 (en) * 2009-01-29 2017-05-02 Ford Global Technologies, Llc System and method for interrupting an instructional prompt to signal upcoming input over a wireless communication link
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8788256B2 (en) * 2009-02-17 2014-07-22 Sony Computer Entertainment Inc. Multiple language voice recognition
US20100217482A1 (en) * 2009-02-20 2010-08-26 Ford Global Technologies, Llc Vehicle-based system interface for personal navigation device
US8825222B2 (en) * 2009-02-27 2014-09-02 Toyota Motor Engineering & Manufacturing North America, Inc. Remote management of vehicle settings
US9871916B2 (en) 2009-03-05 2018-01-16 International Business Machines Corporation System and methods for providing voice transcription
US8254993B2 (en) * 2009-03-06 2012-08-28 Apple Inc. Remote messaging for mobile communication device and accessory
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US8380513B2 (en) * 2009-05-19 2013-02-19 International Business Machines Corporation Improving speech capabilities of a multimodal application
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9183834B2 (en) * 2009-07-22 2015-11-10 Cisco Technology, Inc. Speech recognition tuning tool
US9250097B2 (en) * 2009-07-23 2016-02-02 Broadcom Corporation Coupled GPS phone and navigation system
US20110034128A1 (en) * 2009-08-05 2011-02-10 Kirsch David M Mobile Communication Device Linked to In-Vehicle System
US8838332B2 (en) * 2009-10-15 2014-09-16 Airbiquity Inc. Centralized management of motor vehicle software applications and services
US8942888B2 (en) 2009-10-15 2015-01-27 Airbiquity Inc. Extensible scheme for operating vehicle head unit as extended interface for mobile device
US9002574B2 (en) 2009-10-15 2015-04-07 Airbiquity Inc. Mobile integration platform (MIP) integrated handset application proxy (HAP)
US8831823B2 (en) * 2009-10-15 2014-09-09 Airbiquity Inc. Centralized management of motor vehicle software applications and services
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US9045098B2 (en) * 2009-12-01 2015-06-02 Honda Motor Co., Ltd. Vocabulary dictionary recompile for in-vehicle audio system
US20110166862A1 (en) * 2010-01-04 2011-07-07 Eyal Eshed System and method for variable automated response to remote verbal input at a mobile device
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8457839B2 (en) * 2010-01-07 2013-06-04 Ford Global Technologies, Llc Multi-display vehicle information system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) * 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
DE102010019191A1 (de) * 2010-05-04 2011-11-10 Volkswagen Ag Verfahren und Vorrichtung zum Betreiben einer Nutzerschnittstelle
US8868679B2 (en) 2010-05-24 2014-10-21 Nuance Communications, Inc. Systems, methods and articles for providing communications and services via a peer-to-peer network over a data transport link
US9639688B2 (en) 2010-05-27 2017-05-02 Ford Global Technologies, Llc Methods and systems for implementing and enforcing security and resource policies for a vehicle
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
CN103038818B (zh) * 2010-06-24 2016-10-12 本田技研工业株式会社 在车载语音识别系统与车外语音识别系统之间的通信系统和方法
US8731814B2 (en) 2010-07-02 2014-05-20 Ford Global Technologies, Llc Multi-modal navigation system and method
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US9846046B2 (en) 2010-07-30 2017-12-19 Ford Global Technologies, Llc Vehicle navigation method and system
US8732697B2 (en) * 2010-08-04 2014-05-20 Premkumar Jonnala System, method and apparatus for managing applications on a device
US8335643B2 (en) 2010-08-10 2012-12-18 Ford Global Technologies, Llc Point of interest search, identification, and navigation
US20120041633A1 (en) 2010-08-16 2012-02-16 Ford Global Technologies, Llc Systems and methods for regulating control of a vehicle infotainment system
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US8849552B2 (en) 2010-09-29 2014-09-30 Ford Global Technologies, Llc Advanced map information delivery, processing and updating
US8521424B2 (en) 2010-09-29 2013-08-27 Ford Global Technologies, Llc Advanced map information delivery, processing and updating
US20120089392A1 (en) * 2010-10-07 2012-04-12 Microsoft Corporation Speech recognition user interface
CA2814426A1 (en) * 2010-10-15 2012-04-19 Intelligent Mechatronic Systems Inc. Implicit association and polymorphism driven human machine interaction
US8483958B2 (en) 2010-12-20 2013-07-09 Ford Global Technologies, Llc User configurable onboard navigation system crossroad presentation
US8559932B2 (en) 2010-12-20 2013-10-15 Ford Global Technologies, Llc Selective alert processing
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US9452735B2 (en) 2011-02-10 2016-09-27 Ford Global Technologies, Llc System and method for controlling a restricted mode in a vehicle
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120310642A1 (en) 2011-06-03 2012-12-06 Apple Inc. Automatically creating a mapping between text data and audio data
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8788113B2 (en) 2011-06-13 2014-07-22 Ford Global Technologies, Llc Vehicle driver advisory system and method
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
KR101933450B1 (ko) * 2011-07-05 2018-12-31 삼성전자주식회사 차량용 헤드 유닛에 표시되는 컨텐츠를 동적으로 변경하는 방법 및 이를 위한 이동 단말기
US8688321B2 (en) 2011-07-11 2014-04-01 Ford Global Technologies, Llc Traffic density estimation
US8849519B2 (en) 2011-08-09 2014-09-30 Ford Global Technologies, Llc Method and apparatus for vehicle hardware theft prevention
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8948698B2 (en) 2011-09-02 2015-02-03 Toyota Motor Engineering & Manufacturing North America, Inc. Vehicle multimedia head unit with two bluetooth antennas and two receivers
DE102011112626B4 (de) * 2011-09-06 2014-09-04 Daimler Ag Automatisiertes Kopplungsverfahren eines mobilen Kommunikationsendgeräts mit einer zentralen Recheneinheit eines Kraftfahrzeugs
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US8438023B1 (en) * 2011-09-30 2013-05-07 Google Inc. Warning a user when voice input to a device is likely to fail because of background or other noise
CA3023918C (en) * 2011-09-30 2022-11-29 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
CN103917848B (zh) * 2011-11-10 2016-09-28 三菱电机株式会社 导航装置及方法
US8838385B2 (en) 2011-12-20 2014-09-16 Ford Global Technologies, Llc Method and apparatus for vehicle routing
CN104011735B (zh) * 2011-12-26 2018-03-30 英特尔公司 基于车辆的对乘员音频和可视输入的确定
CN103187053B (zh) * 2011-12-31 2016-03-30 联想(北京)有限公司 输入方法和电子设备
DE102012202391A1 (de) * 2012-02-16 2013-08-22 Continental Automotive Gmbh Verfahren und Einrichtung zur Phonetisierung von textenthaltenden Datensätzen
DE102012202407B4 (de) * 2012-02-16 2018-10-11 Continental Automotive Gmbh Verfahren zum Phonetisieren einer Datenliste und sprachgesteuerte Benutzerschnittstelle
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9569403B2 (en) 2012-05-03 2017-02-14 Ford Global Technologies, Llc Methods and systems for authenticating one or more users of a vehicle communications and information system
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9104538B2 (en) 2012-06-08 2015-08-11 Airbiquity Inc. Assessment of electronic sensor data to remotely identify a motor vehicle and monitor driver behavior
WO2013185109A2 (en) 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
KR101972955B1 (ko) * 2012-07-03 2019-04-26 삼성전자 주식회사 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
US8831585B2 (en) 2012-08-31 2014-09-09 Nuance Communications, Inc. Systems, methods and articles for a communications device providing communications and services involving automobile head units
US20140068713A1 (en) * 2012-08-31 2014-03-06 Tweddle Group, Inc. Systems, methods and articles for providing communications and services involving automobile head units and user preferences
US8799360B2 (en) * 2012-08-31 2014-08-05 Tweedle Group, Inc. Systems, methods and articles for a server providing communications and services involving automobile head units
US8909153B2 (en) * 2012-09-05 2014-12-09 GM Global Technology Operations LLC Vehicle communications using a mobile device
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
DE102012019063A1 (de) * 2012-09-28 2014-04-03 Audi Ag Verfahren und System zum Bereitstellen von Daten in einem Kraftwagen
US10381002B2 (en) 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US10373615B2 (en) 2012-10-30 2019-08-06 Google Technology Holdings LLC Voice control user interface during low power mode
US9691377B2 (en) 2013-07-23 2017-06-27 Google Technology Holdings LLC Method and device for voice recognition training
US9584642B2 (en) 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
US10304465B2 (en) 2012-10-30 2019-05-28 Google Technology Holdings LLC Voice control user interface for low power mode
US9601111B2 (en) * 2012-11-13 2017-03-21 GM Global Technology Operations LLC Methods and systems for adapting speech systems
US10041798B2 (en) 2012-12-06 2018-08-07 Qualcomm Incorporated Determination of position, velocity and/or heading by simultaneous use of on-device and on-vehicle information
DE102012223314A1 (de) * 2012-12-17 2014-06-18 Robert Bosch Gmbh Einrichtung und Verfahren zur automatischen Anpassung der Lautstärke von Geräuschen in einem Fahrzeuginnenraum
DE102012223320A1 (de) * 2012-12-17 2014-06-18 Robert Bosch Gmbh Einrichtung und Verfahren zur automatischen Anpassung der Lautstärke von Geräuschen in einem Fahrzeuginnenraum
CN104919833B (zh) * 2012-12-20 2019-11-08 爱尔比奎特公司 高效头单元通信集成
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9713963B2 (en) 2013-02-18 2017-07-25 Ford Global Technologies, Llc Method and apparatus for route completion likelihood display
US9688246B2 (en) 2013-02-25 2017-06-27 Ford Global Technologies, Llc Method and apparatus for in-vehicle alarm activation and response handling
US9863777B2 (en) 2013-02-25 2018-01-09 Ford Global Technologies, Llc Method and apparatus for automatic estimated time of arrival calculation and provision
US8947221B2 (en) 2013-02-26 2015-02-03 Ford Global Technologies, Llc Method and apparatus for tracking device connection and state change
US8977479B2 (en) 2013-03-12 2015-03-10 Ford Global Technologies, Llc Method and apparatus for determining traffic conditions
US9047774B2 (en) 2013-03-12 2015-06-02 Ford Global Technologies, Llc Method and apparatus for crowd-sourced traffic reporting
US9141583B2 (en) 2013-03-13 2015-09-22 Ford Global Technologies, Llc Method and system for supervising information communication based on occupant and vehicle environment
US9874452B2 (en) 2013-03-14 2018-01-23 Ford Global Technologies, Llc Method and apparatus for enhanced driving experience including dynamic POI identification
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US10424292B1 (en) * 2013-03-14 2019-09-24 Amazon Technologies, Inc. System for recognizing and responding to environmental noises
US9002536B2 (en) 2013-03-14 2015-04-07 Ford Global Technologies, Llc Key fob security copy to a mobile phone
US8909212B2 (en) 2013-03-14 2014-12-09 Ford Global Technologies, Llc Method and apparatus for disclaimer presentation and confirmation
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US8862320B2 (en) 2013-03-14 2014-10-14 Ford Global Technologies, Llc Method and apparatus for ambient lighting incoming message alert
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
CN105144133B (zh) 2013-03-15 2020-11-20 苹果公司 对中断进行上下文相关处理
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN110096712B (zh) 2013-03-15 2023-06-20 苹果公司 通过智能数字助理的用户培训
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
US20140289624A1 (en) * 2013-03-22 2014-09-25 Hyundai Mobis Co.,Ltd. Multimedia system and method for interfacing between multimedia unit and audio head unit
CN104078045B (zh) * 2013-03-26 2017-05-24 联想(北京)有限公司 一种识别的方法及电子设备
US9619645B2 (en) * 2013-04-04 2017-04-11 Cypress Semiconductor Corporation Authentication for recognition systems
US20140358538A1 (en) * 2013-05-28 2014-12-04 GM Global Technology Operations LLC Methods and systems for shaping dialog of speech systems
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
DE102013216427B4 (de) * 2013-08-20 2023-02-02 Bayerische Motoren Werke Aktiengesellschaft Vorrichtung und Verfahren zur fortbewegungsmittelbasierten Sprachverarbeitung
US20140149216A1 (en) * 2013-09-24 2014-05-29 Peter McGie Voice Recognizing Digital Messageboard System and Method
US8976009B2 (en) * 2013-09-24 2015-03-10 Peter McGie Voice recognizing digital messageboard system and method
US9524717B2 (en) * 2013-10-15 2016-12-20 Trevo Solutions Group LLC System, method, and computer program for integrating voice-to-text capability into call systems
US8768712B1 (en) 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US10373611B2 (en) 2014-01-03 2019-08-06 Gracenote, Inc. Modification of electronic system operation based on acoustic ambience classification
US9193312B2 (en) * 2014-02-20 2015-11-24 Ford Global Technologies, Llc Occupant communication system and control method
US9911408B2 (en) * 2014-03-03 2018-03-06 General Motors Llc Dynamic speech system tuning
WO2015151157A1 (ja) * 2014-03-31 2015-10-08 三菱電機株式会社 意図理解装置および方法
US9633657B2 (en) * 2014-04-02 2017-04-25 Speakread A/S Systems and methods for supporting hearing impaired users
US20150294639A1 (en) * 2014-04-14 2015-10-15 Sony Corporation Method and system for switching a mode of an electronic device
US20150310851A1 (en) * 2014-04-24 2015-10-29 Ford Global Technologies, Llc Method and Apparatus for Extra-Vehicular Voice Recognition Training Including Vehicular Updating
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10236016B1 (en) * 2014-06-16 2019-03-19 Amazon Technologies, Inc. Peripheral-based selection of audio sources
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
JP2016024212A (ja) * 2014-07-16 2016-02-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US20160171635A1 (en) * 2014-12-15 2016-06-16 Thomas A. Senzee Automated Contract Terms Negotiating System and Method
JP6501217B2 (ja) * 2015-02-16 2019-04-17 アルパイン株式会社 情報端末システム
US9992317B2 (en) * 2015-02-16 2018-06-05 Ford Global Technologies, Llc System and method of facilitating communication between a mobile device and vehicle computer system
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9544412B2 (en) * 2015-03-09 2017-01-10 Ford Global Technologies, Llc Voice profile-based in-vehicle infotainment identity identification
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US10249123B2 (en) 2015-04-09 2019-04-02 Ford Global Technologies, Llc Systems and methods for mobile phone key fob management
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160379640A1 (en) * 2015-06-24 2016-12-29 Honeywell International Inc. System and method for aircraft voice-to-text communication with message validation
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
KR20170033722A (ko) * 2015-09-17 2017-03-27 삼성전자주식회사 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10008201B2 (en) * 2015-09-28 2018-06-26 GM Global Technology Operations LLC Streamlined navigational speech recognition
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10006777B2 (en) * 2015-10-02 2018-06-26 GM Global Technology Operations LLC Recognizing address and point of interest speech received at a vehicle
US10522141B2 (en) * 2015-10-28 2019-12-31 Ford Global Technologies, Llc Vehicle voice recognition including a wearable device
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10140976B2 (en) * 2015-12-14 2018-11-27 International Business Machines Corporation Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10229672B1 (en) 2015-12-31 2019-03-12 Google Llc Training acoustic models using connectionist temporal classification
JP2017138476A (ja) * 2016-02-03 2017-08-10 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
EP3232413B1 (en) * 2016-04-15 2021-11-24 Volvo Car Corporation Method and system for enabling a vehicle occupant to report a hazard associated with the surroundings of the vehicle
US9734744B1 (en) * 2016-04-27 2017-08-15 Joan Mercior Self-reacting message board
US20170337900A1 (en) * 2016-05-17 2017-11-23 Google Inc. Wireless user interface projection for vehicles
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US10163437B1 (en) * 2016-06-02 2018-12-25 Amazon Technologies, Inc. Training models using voice tags
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10283138B2 (en) 2016-10-03 2019-05-07 Google Llc Noise mitigation for a voice interface device
CN210129283U (zh) 2016-10-05 2020-03-06 金泰克斯公司 基于车辆的远程控制系统
US10462567B2 (en) 2016-10-11 2019-10-29 Ford Global Technologies, Llc Responding to HVAC-induced vehicle microphone buffeting
CN108153507A (zh) * 2016-12-02 2018-06-12 上海博泰悦臻电子设备制造有限公司 一种语音交互方法、系统及一种车机
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US20180330725A1 (en) * 2017-05-09 2018-11-15 Microsoft Technology Licensing, Llc Intent based speech recognition priming
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
JP6883471B2 (ja) * 2017-05-11 2021-06-09 オリンパス株式会社 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
EP3577646B1 (en) 2017-05-16 2021-07-21 Google LLC Handling calls on a shared speech-enabled device
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
KR102371313B1 (ko) * 2017-05-29 2022-03-08 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법
KR102332826B1 (ko) * 2017-05-30 2021-11-30 현대자동차주식회사 차량용 음성 인식 장치, 상기 차량용 음성 인식 장치를 포함하는 차량, 차량용 음성 인식 시스템 및 상기 차량용 음성 인식 장치의 제어 방법
US10186260B2 (en) * 2017-05-31 2019-01-22 Ford Global Technologies, Llc Systems and methods for vehicle automatic speech recognition error detection
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
KR102367053B1 (ko) * 2017-07-13 2022-02-24 삼성전자주식회사 외부 전자 장치와 통신을 수행하기 위한 전자 장치
US11205421B2 (en) * 2017-07-28 2021-12-21 Cerence Operating Company Selection system and method
US10525921B2 (en) 2017-08-10 2020-01-07 Ford Global Technologies, Llc Monitoring windshield vibrations for vehicle collision detection
US10706840B2 (en) 2017-08-18 2020-07-07 Google Llc Encoder-decoder models for sequence to sequence mapping
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10562449B2 (en) 2017-09-25 2020-02-18 Ford Global Technologies, Llc Accelerometer-based external sound monitoring during low speed maneuvers
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10479300B2 (en) 2017-10-06 2019-11-19 Ford Global Technologies, Llc Monitoring of vehicle window vibrations for voice-command recognition
KR102552486B1 (ko) * 2017-11-02 2023-07-06 현대자동차주식회사 차량의 음성인식 장치 및 방법
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
CN108132805B (zh) * 2017-12-20 2022-01-04 深圳Tcl新技术有限公司 语音交互方法、装置及计算机可读存储介质
SE541396C2 (en) * 2017-12-27 2019-09-10 Scania Cv Ab Method and control unit for communicating with a vehicle
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
KR102066451B1 (ko) * 2018-02-02 2020-01-15 주식회사 오비고 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
WO2019182865A1 (en) * 2018-03-19 2019-09-26 Geoffrey Langos Voice activated visual communication system
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10831442B2 (en) * 2018-10-19 2020-11-10 International Business Machines Corporation Digital assistant user interface amalgamation
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11455982B2 (en) * 2019-01-07 2022-09-27 Cerence Operating Company Contextual utterance resolution in multimodal systems
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
JP2020160144A (ja) * 2019-03-25 2020-10-01 株式会社Subaru 音声認識装置
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11170765B2 (en) * 2020-01-24 2021-11-09 Intuit Inc. Contextual multi-channel speech to text
US11984123B2 (en) * 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
CN112509585A (zh) * 2020-12-22 2021-03-16 北京百度网讯科技有限公司 车载设备的语音处理方法、装置、设备及存储介质
US20230306965A1 (en) * 2022-02-02 2023-09-28 Google Llc Speech Recognition Using Word or Phoneme Time Markers Based on User Input

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212764A (en) * 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
FI97919C (fi) * 1992-06-05 1997-03-10 Nokia Mobile Phones Ltd Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten
US5452397A (en) * 1992-12-11 1995-09-19 Texas Instruments Incorporated Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
US6073101A (en) * 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
US6707421B1 (en) * 1997-08-19 2004-03-16 Siemens Vdo Automotive Corporation Driver information system
WO1999014928A1 (en) 1997-09-15 1999-03-25 Intellivoice Communications, Inc. Simplified training of voice dialing systems
KR100277105B1 (ko) * 1998-02-27 2001-01-15 윤종용 음성 인식 데이터 결정 장치 및 방법
EP1054387A3 (en) 1999-05-21 2001-11-14 Winbond Electronics Corporation Method and apparatus for activating voice controlled devices
DE60010080T3 (de) * 1999-06-01 2009-10-08 Continental Automotive Systems US, Inc., Auburn Hills Tragbares informationsgerät für fahrer
JP3990075B2 (ja) * 1999-06-30 2007-10-10 株式会社東芝 音声認識支援方法及び音声認識システム
US6594629B1 (en) * 1999-08-06 2003-07-15 International Business Machines Corporation Methods and apparatus for audio-visual speech detection and recognition
US6587824B1 (en) * 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
DE60133902D1 (ja) * 2000-07-28 2008-06-19 Siemens Vdo Automotive Corp
US7203651B2 (en) * 2000-12-07 2007-04-10 Art-Advanced Recognition Technologies, Ltd. Voice control system with multiple voice recognition engines
US20020152264A1 (en) * 2001-02-07 2002-10-17 Zandiant Technologies, Inc. Personal vehicular internet appliance
US6996531B2 (en) 2001-03-30 2006-02-07 Comverse Ltd. Automated database assistance using a telephone for a speech based or text based multimedia communication mode
AU2002314933A1 (en) * 2001-05-30 2002-12-09 Cameronsound, Inc. Language independent and voice operated information management system
GB0113587D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus
GB0113581D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus
JP2003121164A (ja) * 2001-06-29 2003-04-23 Spencer Stephens 位置識別子を受けるナビゲータ並びに関連する装置及び方法
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
CN1599896B (zh) * 2001-12-06 2013-03-20 美国丰田汽车销售公司 选择并播放多媒体文件的方法和多媒体播放器
JP3826032B2 (ja) * 2001-12-28 2006-09-27 株式会社東芝 音声認識装置、音声認識方法及び音声認識プログラム
US20040064306A1 (en) 2002-09-30 2004-04-01 Wolf Peter P. Voice activated music playback system
EP1665092A4 (en) * 2003-08-21 2006-11-22 Idilia Inc INTERNET SEARCH USING SEMANTIC DISAMBIGUING AND EXPANSION
US7801283B2 (en) * 2003-12-22 2010-09-21 Lear Corporation Method of operating vehicular, hands-free telephone system
US7373248B2 (en) * 2004-09-10 2008-05-13 Atx Group, Inc. Systems and methods for off-board voice-automated vehicle navigation
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008275987A (ja) * 2007-05-01 2008-11-13 Yamaha Corp 音声認識装置および会議システム
JP2009210703A (ja) * 2008-03-03 2009-09-17 Alpine Electronics Inc 音声認識装置
WO2009130840A1 (ja) * 2008-04-23 2009-10-29 三菱電機株式会社 車載情報システム
JP2012529236A (ja) * 2009-06-02 2012-11-15 フォード グローバル テクノロジーズ、リミテッド ライアビリティ カンパニー 車両内において電子カレンダー・アプリケーションのハンズフリー操作を実行するシステム及び方法
JP2017512433A (ja) * 2014-02-28 2017-05-18 ボーズ・コーポレーションBose Corporation 音源の直接選択
KR102272080B1 (ko) * 2014-11-18 2021-07-02 현대모비스 주식회사 차량용 avn 시스템의 모바일 단말 등록 제어 장치 및 방법
KR20160059182A (ko) * 2014-11-18 2016-05-26 현대모비스 주식회사 차량용 avn 시스템의 모바일 단말 등록 제어 장치 및 방법
US10063683B2 (en) 2014-12-24 2018-08-28 Hyundai Motor Company In-vehicle multimedia system connected to external device and control method thereof
CN110800044A (zh) * 2017-09-08 2020-02-14 亚马逊技术股份有限公司 用于语音助手系统的话语权限管理
JP2020525903A (ja) * 2017-09-08 2020-08-27 アマゾン テクノロジーズ インコーポレイテッド 音声アシスタントシステムのための発話による特権の管理
CN110800044B (zh) * 2017-09-08 2024-04-05 亚马逊技术股份有限公司 用于语音助手系统的话语权限管理
JP2020003969A (ja) * 2018-06-27 2020-01-09 富士ゼロックス株式会社 画像出力システム、サーバ装置、端末装置、画像出力装置及びプログラム
JP7172176B2 (ja) 2018-06-27 2022-11-16 富士フイルムビジネスイノベーション株式会社 画像出力システム、サーバ装置及びプログラム
JP2021182217A (ja) * 2020-05-18 2021-11-25 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム
JP7310705B2 (ja) 2020-05-18 2023-07-19 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム

Also Published As

Publication number Publication date
EP1739546A2 (en) 2007-01-03
US7826945B2 (en) 2010-11-02
US20070005206A1 (en) 2007-01-04
CN1920946A (zh) 2007-02-28
EP1739546A3 (en) 2008-06-25

Similar Documents

Publication Publication Date Title
US7826945B2 (en) Automobile speech-recognition interface
US9558745B2 (en) Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
US11170776B1 (en) Speech-processing system
JP5334178B2 (ja) 音声認識装置およびデータ更新方法
EP2259252B1 (en) Speech recognition method for selecting a combination of list elements via a speech input
US9805722B2 (en) Interactive speech recognition system
US9640175B2 (en) Pronunciation learning from user correction
JP4292646B2 (ja) ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体
US8438028B2 (en) Nametag confusability determination
US9202465B2 (en) Speech recognition dependent on text message content
US20120253823A1 (en) Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
US20200184967A1 (en) Speech processing system
US20080059188A1 (en) Natural Language Interface Control System
US20050273337A1 (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
US9997155B2 (en) Adapting a speech system to user pronunciation
US9911408B2 (en) Dynamic speech system tuning
WO2008072413A1 (ja) 音声認識装置
US11355112B1 (en) Speech-processing system
CN116964662A (zh) 在对话期间文本转语音中的即时学习
WO2012174515A1 (en) Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
US11735178B1 (en) Speech-processing system
JP7274901B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JPH11125533A (ja) ナビゲーション装置及びナビゲート方法
KR20220129366A (ko) 음성 인식 시스템 및 그 제어 방법
CN112241628A (zh) 智能体装置、智能体装置的控制方法及存储介质