JP2007011380A - 自動車インターフェース - Google Patents
自動車インターフェース Download PDFInfo
- Publication number
- JP2007011380A JP2007011380A JP2006183890A JP2006183890A JP2007011380A JP 2007011380 A JP2007011380 A JP 2007011380A JP 2006183890 A JP2006183890 A JP 2006183890A JP 2006183890 A JP2006183890 A JP 2006183890A JP 2007011380 A JP2007011380 A JP 2007011380A
- Authority
- JP
- Japan
- Prior art keywords
- user
- information
- interface
- command
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 claims abstract description 31
- 230000003993 interaction Effects 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 89
- 230000001755 vocal effect Effects 0.000 claims description 39
- 238000013459 approach Methods 0.000 claims description 19
- 230000002452 interceptive effect Effects 0.000 claims description 17
- 230000000007 visual effect Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 6
- 230000005043 peripheral vision Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000208140 Acer Species 0.000 description 1
- DTAPQAJKAFRNJB-UHFFFAOYSA-N Promecarb Chemical compound CNC(=O)OC1=CC(C)=CC(C(C)C)=C1 DTAPQAJKAFRNJB-UHFFFAOYSA-N 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 231100000870 cognitive problem Toxicity 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/0967—Systems involving transmission of highway information, e.g. weather, speed limits
- G08G1/096733—Systems involving transmission of highway information, e.g. weather, speed limits where a selection of the information might take place
- G08G1/09675—Systems involving transmission of highway information, e.g. weather, speed limits where a selection of the information might take place where a selection from the received information takes place in the vehicle
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/0967—Systems involving transmission of highway information, e.g. weather, speed limits
- G08G1/096766—Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission
- G08G1/096775—Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission where the origin of the information is a central station
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/274—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
- H04M1/2745—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
- H04M1/2753—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
- H04M1/2757—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content by data transmission, e.g. downloading
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/6075—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
- H04M1/6083—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system
- H04M1/6091—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system including a wireless interface
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Atmospheric Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
- Steering Controls (AREA)
- Telephonic Communication Services (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
【課題】自動車システムは、自動車または他のタイプの車両内での制御および通信機能のための統合されたユーザーインターフェースを提供する。
【解決手段】ユーザーインターフェースは、制御盤、例えばダッシュボードまたはステアリングホイールに取り付けられた制御盤を用いて、ボイスイネーブルインタラクションをサポートするだけでなく、インタラクションの他のモード、例えばマニュアルインタラクションもサポートする。システムは、車両内のデバイスに対するインターフェース、例えば車両内に持ち込まれるモバイル機器に対する無線インターフェースも備えている。システムは、例えば、情報にアクセスするための、リモートサーバーのような情報ソースに対するインターフェースも提供する。
【選択図】図1
【解決手段】ユーザーインターフェースは、制御盤、例えばダッシュボードまたはステアリングホイールに取り付けられた制御盤を用いて、ボイスイネーブルインタラクションをサポートするだけでなく、インタラクションの他のモード、例えばマニュアルインタラクションもサポートする。システムは、車両内のデバイスに対するインターフェース、例えば車両内に持ち込まれるモバイル機器に対する無線インターフェースも備えている。システムは、例えば、情報にアクセスするための、リモートサーバーのような情報ソースに対するインターフェースも提供する。
【選択図】図1
Description
本発明は、自動車インターフェースに関する。
自動車は、今日、ユーザーとの対話のための様々なインターフェースをサポートしている。このインターフェースは、ユーザーに、情報(例えば、ナビゲーション、車両の状態)、通信(例えば、セルラー電話)、または制御(例えば、環境制御のような車両システムの制御)に対するアクセスを提供する。このようなシステムは、自動車内でホストとして働いてもよいし、自動車から離れてホストとして働いて、通信システムを通じてアクセスされてもよい。音声認識は、自動車内の人と、このようなシステムとの間で、口頭での対話を可能にするために、自動車内で用いられてきた。
自動車は、今日、セルラー電話のような外部デバイスの統合のために、いくつかのインターフェースを提供する。例えば、外部デバイスとのこのようなインターフェースは、外部デバイスと自動車システム間のブルートゥースのような無線リンクを使用することができる。
一態様において、一般に、ボイスイネーブルユーザーインターフェースは、インターフェースに対する一般的な設定情報を記憶するステップと、インターフェースに対するユーザー固有の設定情報を記憶するステップとを備えている。ユーザーからの音声入力の処理は、一般的な設定情報およびユーザー固有の設定情報を用いて可能になる。ユーザー固有の設定情報は、音声入力の処理結果に基づいて、選択的に更新される。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
更新は、入力と関連する得点が、不正確な認識仮説が予め決められた閾値以内の得点を有していることを示すとき、入力の正しい認識の上で、実行される。
更新は、ユーザーからの更なる音声入力を必要とせずに、実行される。
ユーザー固有の設定情報は、辞書項目に対するユーザー固有の発音情報を含んでいて、そのための一般的な発音情報は、一般的な設定情報に含まれている。
ユーザー固有の設定情報の更新は、インターフェースの使用中に、実行される。
更新は、ユーザーからの音声入力の誤認識に基づく。
ユーザー固有の設定情報の更新は、ユーザーからの音声入力の認識結果に基づく。
別の態様において、一般に、ボイスイネーブルユーザーインターフェースは、識別子と関連する、冗長な、または曖昧さをなくす情報と共に、識別子の発声を処理するように設定される。インターフェースは、識別子を前記情報と関連付けているデータベースから、追加の、または曖昧さをなくす情報を検索することができる。例えば、このデータベースは、コンタクトデータベースを含んでいる。冗長な、または曖昧な情報は、識別子と直接連結され得る。一例として、識別子は、名前を含んでいて、冗長な、または曖昧さをなくす情報は、名前の頭文字を含んでいる。
別の態様において、一般に、ボイスイネーブルユーザーインターフェースを提供する方法は、インターフェースのユーザーの組の各々に対する設定情報を提供するステップを有している。インターフェースのユーザーが決定され、このインターフェースは、決定されたユーザーのための設定情報を用いて適合される。ユーザーを決定するステップは、ユーザーからの口頭での入力に対して、話者識別プロセスを適用するステップを有していてもよい。
別の態様において、一般に、通信媒体を通じて第1のデバイスと第2のデバイスを関連付ける方法は、第1のデバイスでデータを生成するステップと、第1のデバイスで生成されたデータをユーザーに提示するステップと、第2のデバイスに関連付け要求を伝送するステップとを有している。第1および第2のデバイスの関連付けを許可するユーザーからの入力時に、第2のデバイス上で、データは受け入れられる。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
第1のデバイスは、車両に基づくデバイスであり、第2のデバイスは、モバイル機器である。例えば、モバイル機器は、携帯電話およびPDAのうちの1つである。
この方法は、第1のデバイス上のボタンを押すことによる開始ステップを更に有している。
第1のデバイスと第2のデバイスの関連付けは、ブルートゥース通信アプローチに従う。
別の態様において、一般に、ボイスイネーブルユーザーインターフェースを設定する方法は、第1のデバイスで、第2のデバイスからコンタクトデータを受け取り、かつデータソースからの追加データを要求して、コンタクトデータを増やすステップを有している。ユーザーインターフェースは、第2のデバイスから受信したコンタクトデータおよびデータソースからの追加データを用いて設定される。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
第1のデバイスは、車両に基づくデバイスであり、第2のデバイスは、モバイル機器である。
データソースは、リモートサーバーに常駐している。
リモートサーバーから要求される追加データは、コンタクトデータ内の項目に関連する情報を含んでいる。例えば、コンタクトデータ内の項目は、名前および関連する電話番号を含んでいて、要求される追加データは、この項目と関連する住所情報を含んでいる。
別の態様において、一般に、車内ボイスイネーブルユーザーインターフェースを提供する方法は、ユーザーから通信コマンドを受け入れるステップを有している。そして、宛先情報が、通信コマンドから決定される。そして、ナビゲーションシステムが、決定された宛先情報に基づいて、コマンドを発せられる。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
通信コマンドは、テレフォンダイヤリングコマンドを含んでいる。
宛先へのルートは、通信コマンドから決定される。
通信コマンドは、口頭でのコマンドを含んでいる。
決定は、通信コマンドと、コンタクトデータベース内の宛先情報との関連に基づく。
別の態様において、一般に、車内ボイスイネーブルユーザーインターフェースを提供する方法は、ナビゲーションシステムからテキストのストリート情報を得るステップと、テキストのストリート情報を、その口頭での等価物に変換するステップとを有している。そして、口頭での等価物が、ユーザーに提示される。
別の態様において、一般に、車内ボイスイネーブルインターフェースを提供する方法は、グラフィックディスプレイ上でユーザーに視覚的なキューを提示するステップを有している。視覚的なキューは、ユーザーが直接ディスプレイを見ることを必要とせずに、ユーザーの周辺視野内でのユーザーによる検出に適している。
この態様は、以下の特徴のうちの1つ以上を有していてもよい。
視覚的なキューは、口頭インターフェースの状態に関連している。
視覚的なキューの提示は、口頭インターフェースが、口頭コマンドを受け入れる状態にあることの表示を提供するステップ、例えば、口頭インターフェースが、ユーザーから口頭でのコマンドを受け入れたことの表示を提供するステップを有している。
別の態様において、一般に、車内ボイスイネーブルインターフェースを提供する方法は、口頭での対話の開始時に、音響環境に関する1つ以上の制御設定を調節するステップを有していて、調節の前に、制御設定を記録するステップと、口頭での対話の後に、制御設定を元に戻すステップとを有している。
制御設定は、音量設定を含んでいてもよく、これは、例えば、音声の音量設定またはノイズを発生するデバイスに対する設定を含んでいる。ノイズを発生するデバイスは、ファンを含んでいてもよい。
別の態様において、一般に、マルチモード車内ユーザーインターフェースを提供する方法は、第1の対話モードにおいて、コマンドの第1の部分を受け入れるステップと、このユーザーインターフェースに関する状態を検出するステップと、検出された状態に基づいて、第2の対話モードを決定するステップと、第2の対話モードにおいて、コマンドの第2の部分を受け入れるステップとを有している。第1の対話モードおよび第2の対話モードは、口頭対話モードおよびマニュアル対話モードのそれぞれである。
この態様は、以下の特徴のうちの1つ以上を含んでいてもよい。
この方法は、ユーザーに、第1の対話モードおよび第2の対話モードのうちの1つだけに実質的に関連する情報を提示するステップを更に有している。
ユーザーインターフェースに関する状態を検出するステップは、ユーザーインターフェースの環境内でのノイズレベルを検出するステップを有している。
コマンドの第1の部分の受け入れおよびコマンドの第2の部分の受け入れが実行され、コマンドの第1の部分の反復を必要とせずに、コマンドの連続的な入力を提供する。
別の態様において、一般に、ボイスイネーブルユーザーインターフェースを提供する方法は、語彙項目のテキストの明細を受け入れるステップと、語彙項目に対する発音を決定するステップと、ユーザーからの口頭での入力を受け入れるステップと、決定された発音を用いて、口頭での入力の中で語彙項目を自動的に認識するステップとを有している。もし、認識された語彙項目と関連する得点が、予め決められた範囲内に入るならば、語彙項目のうちの1つ以上の発音が、受け入れられた口頭での入力から決定される。
別の態様において、一般に、デバイス間の関連付けを確立する方法は、第1のデバイスで関連付け手続を開始するステップと、第1のデバイスで1つ以上の候補デバイスを検出するステップと、ユーザーから候補デバイスのうちの第2のデバイスの選択を受け入れるステップと、第1のデバイスからユーザーに関連付け情報を提供するステップと、第1のデバイスから第2のデバイスに要求を伝送するステップと、第2のデバイスでユーザーから関連付け情報を受け入れるステップとを有している。
他の特徴および利点は、以下の説明および請求項から明らかである。
図1は、ブロック図である。
図2は、ブロック図である。
図3は、フローチャートである。
図4は、フローチャートである。
図5は、タイミング図である。
図1を参照すると、自動車システムは、自動車または他のタイプの車両内で、制御および通信機能のための統合されたユーザーインターフェースを提供する。このユーザーインターフェースは、ボイスイネーブルインタラクションをサポートするのに加えて、他のモードのインタラクション、例えば、制御盤を用いるマニュアルインタラクションもサポートする。制御盤とは、例えば、ダッシュボードまたはステアリングホイールに取り付けられた制御盤(例えば、ボタン、ノブ)である。このシステムは、車両内のデバイスに対するインターフェースも備えている。インターフェースとは、例えば、車両内に持ち込まれるモバイル機器に対する無線インターフェースである。このシステムは、情報ソースに対するインターフェースも提供する。情報ソースとは、例えば、情報にアクセスするためのリモートサーバー(すなわち、自動車の中でホストとして働くわけではないシステム、または自動車と共に移動するわけではないシステム)である。
このシステムのヘッドユニット100は、自動車の中で、ユーザー(運転手または他の人)との対話を可能にする他の部品に接続されている。図1に示したシステムの具体例において、グラフィカルディスプレイ110は、ユーザーに対してグラフィカルな出力(または他の視覚的なキュー)を提供する。ユーザーは、入力装置112を用いてマニュアル入力を行うことができる。入力装置112は、(例えば、センターコンソール、ステアリングホイール上に)ボタンを備えていてもよいし、ディスプレイ上に可変(“ソフト”)ボタンを備えていてもよいし、等々。マイクロフォンまたはマイクロフォンアレイ114およびスピーカー116は、それぞれ、このシステムへの音声入力およびこのシステムからの音声出力を可能にする。ヘッドユニット100は、外部デバイスとの通信インターフェースを備えている。外部デバイスとは、例えば、携帯(例えば、セルラー)電話120、および携帯情報端末(PDA)122、組み込み電話123、および携帯用パーソナルコンピュータ124である。このバージョンのシステムにおいて、通信リンクは、無線アプローチを使用し、それは、ブルートゥース規格を使用する。代替案として、他の有線または無線アプローチも、このような通信リンクのために用いられ得る。外部デバイスは、別々のユーザーインターフェースを備えることができ、このユーザーインターフェースを通して、ユーザーは、それらのデバイスと対話することができる。いくつかの外部デバイス、例えば携帯電話120は、無線ネットワークのような外部通信システムとの通信リンクを提供する。このシステムは、リモートデータインターフェース118、例えば無線データトランシーバも備えていて、これは、リモートサーバー140との通信リンクを提供する。
図2を参照すると、ヘッドユニット100は、1人以上のユーザーに対するプロフィールデータ240を有している。プロフィールデータは、システムを、個々のユーザーに適合またはカスタマイズさせることを可能にする。ヘッドユニット100は、ボイスイネーブルサブシステム210も有していて、これは、例えば自動音声認識(ASR)およびテキスト−音声合成(TTS)を用いて、システムとユーザー間での音声に基づく対話を可能にする。ボイスイネーブルサブシステム210は、話者に依存しない(SI)音声設定データ212を使用するが、これは、ユーザーによって発され得る口頭でのコマンドおよび特徴に関する情報を含んでいる。特徴とは、例えば、それらのコマンドに関する単語の発音、および他の構成要素であり、それは、一般に、特定のユーザーに固有というわけではない。ボイスイネーブルサブシステム210およびSI音声設定データ212については、以下でより詳細に述べる。ヘッドユニットは、自然に聞こえる音声出力を達成するために、言語の規則および辞書を用いて、言語の普通のテキスト表現を、その口頭での等価物に変換するための、テキストを音声に変換するサブシステム220も有している。入力テキストは、様々な方法、例えばキーボードまたはダッシュボードもしくはステアリングホイール上の制御盤(ボタン、ノブなど)を介して入力され得る。または、以下のような様々なタイプのファイルから読み出され得る。ワープロファイル、ウェブページ、データベースレコード、電子メールメッセージなど。ヘッドユニットは、ユーザーの口頭での入力に基づいてユーザーを認証するための話者確認サブシステム222も有している。
この具体例としてのシステムにおいては、プロフィールデータ240、ボイスイネーブルサブシステム210、SI音声設定データ212は、全てヘッドユニット100内に設置されていることが示されているが、上記のサブシステムおよびデータ(例えば、プロフィール、音声設定データ)は、代替案として、様々に異なる物理的な構成要素の中に設置され得ることに留意する必要がある。
一例として、ボイスイネーブルサブシステム210は、Burlington, MA 01803に本社があるScanSoft社からのASRおよびTTSソフトウェアを使用する。ScanSoft ASRエンジンは、(1つの単語の不連続な発声を必要とするのと比較して)連続的な入力音声をサポートし、(拘束を受けていない口頭でのテキストの口述と比較して)コマンドおよび制御文法の使用をサポートし、話者に依存しない設定をサポートし、設定をユーザーに適合させる機能、例えば、追加の発声を用いて特定の単語のための設定情報を訓練する機能をサポートする。ScanSoft ASRエンジン上で構築された具体例としてのボイスイネーブルサブシステム210は、以下の構成要素を有している。
・音声入力を一連の音響特性に変換し、それぞれは、限られた時間の範囲内の音声入力の特徴を表す数値ベクトルとして表される特徴抽出器。
・例えば、特定の音に対する音響特性の統計的分布に基づいて、言語内の様々な音声の数学的表現を提供する音響モデル。1つの音響モデルは、1つのクラスの人々にとって一般的であり得る。または、1つまたは小さいグループの人々に固有であり得る。例えば、話者に依存しない(SI)モデルは、多くの人々の声のサンプルから集められたデータに基づく一方で、話者に依存するモデルは、1人の人の声のサンプルから集められたデータに基づく。SIモデルは、例えば、性または年齢に依存している1つのクラスの人々を表し得る(例えば、男性モデル、女性モデル、または子供モデルなど)。この音響モデルで表される音は、(例えば、必ずしも単語の言語構造に基づかなくても)、音節に基づいて、音素に基づいて、または文脈に依存する音素に基づいて、特定の単語と関連付けられ得る。
・話され得る妥当なフレーズを記述する文法、または、どちらの文が話され得るかを決定する規則。例えば、文法は、テキスト表現(例えば、BNF、バッカス−ナウア記法)を用いて表され得る。
・音響モデルで表される音に関して、単語と、それらの単語または全部のフレーズの表現との間のマッピングを提供する辞書。例えば、音素に基づく音響モデルの場合、辞書は、単語またはフレーズの音声の筆写をリストアップしていて、各々は、音素のシーケンスとして、代替シーケンスのリストとして、または(例えば、音素を有するネットワーク内の弧にラベルを付けることによって)各経路が特定のシーケンスを表すネットワークとして表される。辞書は、音響モデルと共にあるので、一般的または固有であり得る。例えば、1つのバージョンのシステムの中で、SI辞書が用いられ、加えて、最初に見つけられなかった単語または辞書の中で適切に表現されていなかった単語のために、SD例外辞書も用いられる。
・書記素−音素(G2P)モジュール。これは、自動化されたシステムであり、書かれたテキストストリングを辞書のような筆写に変換する。
・文法と、1つ以上の辞書(例えば、SI辞書および例外辞書)とを結合して、実行時設定データを計算する実行時設定エンジン。
・実行時設定データに従って、音声入力の特徴を音響モデルと比較して、結果として最適な組み合わせを提供する認識エンジン。
・音声入力を一連の音響特性に変換し、それぞれは、限られた時間の範囲内の音声入力の特徴を表す数値ベクトルとして表される特徴抽出器。
・例えば、特定の音に対する音響特性の統計的分布に基づいて、言語内の様々な音声の数学的表現を提供する音響モデル。1つの音響モデルは、1つのクラスの人々にとって一般的であり得る。または、1つまたは小さいグループの人々に固有であり得る。例えば、話者に依存しない(SI)モデルは、多くの人々の声のサンプルから集められたデータに基づく一方で、話者に依存するモデルは、1人の人の声のサンプルから集められたデータに基づく。SIモデルは、例えば、性または年齢に依存している1つのクラスの人々を表し得る(例えば、男性モデル、女性モデル、または子供モデルなど)。この音響モデルで表される音は、(例えば、必ずしも単語の言語構造に基づかなくても)、音節に基づいて、音素に基づいて、または文脈に依存する音素に基づいて、特定の単語と関連付けられ得る。
・話され得る妥当なフレーズを記述する文法、または、どちらの文が話され得るかを決定する規則。例えば、文法は、テキスト表現(例えば、BNF、バッカス−ナウア記法)を用いて表され得る。
・音響モデルで表される音に関して、単語と、それらの単語または全部のフレーズの表現との間のマッピングを提供する辞書。例えば、音素に基づく音響モデルの場合、辞書は、単語またはフレーズの音声の筆写をリストアップしていて、各々は、音素のシーケンスとして、代替シーケンスのリストとして、または(例えば、音素を有するネットワーク内の弧にラベルを付けることによって)各経路が特定のシーケンスを表すネットワークとして表される。辞書は、音響モデルと共にあるので、一般的または固有であり得る。例えば、1つのバージョンのシステムの中で、SI辞書が用いられ、加えて、最初に見つけられなかった単語または辞書の中で適切に表現されていなかった単語のために、SD例外辞書も用いられる。
・書記素−音素(G2P)モジュール。これは、自動化されたシステムであり、書かれたテキストストリングを辞書のような筆写に変換する。
・文法と、1つ以上の辞書(例えば、SI辞書および例外辞書)とを結合して、実行時設定データを計算する実行時設定エンジン。
・実行時設定データに従って、音声入力の特徴を音響モデルと比較して、結果として最適な組み合わせを提供する認識エンジン。
上記の具体例としてのボイスイネーブルサブシステムにおいては、SI音声設定データ212は、辞書および文法を含んでいる。ボイスイネーブルサブシステム210の具体的な実施に応じて、SI音声設定データ212は、より多いか、またはより少ない構成要素を含んでいてもよい。
1人のユーザーのためのプロフィールデータ240は、コンタクトデータ242を含んでいて、例えば、それは、人々の名前(または同等に、場所、企業など)および他の関連する項目、例えば電話番号、住所、関心がある地点(POI)、カレンダーまたはスケジュール、および人またはPOIに関する情報を提供するための任意の項目、例えばPOIのイベントおよび過去の訪問の経験を記述しているメモを含んでいる。プロフィールデータ240は、話者に依存する(SD)音声設定データ244も含んでいて、これは、そのユーザーに特有のものである。以下で更に詳細に述べるが、SD音声設定データ244は、精度を改善することができる情報を含んでいて、これによって、例えば、ユーザーによって話される名前のユーザー固有の発音を含むことによって、ボイスイネーブルサブシステム210は、ユーザーの発声を認識することができる。一般に、SD音声設定データ244は、訓練のために、ASRエンジンからの設定データの修正されたか更新された部分、例えば辞書内のユーザー固有の単語筆写項目および具体例としてのボイスイネーブルサブシステム内の再編集された文法を含んでいる。
ヘッドユニット100は、無線サブシステム230も有していて、これは、外部デバイス、例えば携帯電話120との通信を確立かつ維持するための通信サービスを提供する。無線サブシステム230および携帯電話120は、それぞれペアリングモジュール232および252を有していて、これは、外部デバイス(例えば、電話120、PDA122、またはコンピュータ124)がヘッドユニット100に近接しているとき、通信を確立するための手続を実現する。ペアリング手続の詳細は、この説明の中で後述される。
ヘッドユニット100に接続され得る外部デバイスは、オプションとして、ヘッドユニット100によって用いられるデータを有している。例えば、図2に示したように、携帯電話120は、コンタクトデータ250を有していて、これは、名前および対応する電話番号、およびオプションの追加情報、例えばコンタクト(例えば、そのユーザーに対して知られている人、場所、または実体)のストリートアドレスを含んでいる。1つの動作モードにおいて、携帯電話がヘッドユニット100と通信しているとき、このようなコンタクトデータ250は、無線サブシステム230を通してヘッドユニット100に転送され、ユーザーのプロフィールデータ240のコンタクトデータ242を更新またはポピュレートするために用いられる。
ヘッドユニット100内のコンタクトデータ242は、様々な方法で、例えばCD/DVD、ハードドライブ、リモートサーバー、PDA、セルフォン等から、ユニットに与えられ、タスク、例えばハンズフリーネームダイヤリングのために用いられる。ヘッドユニットは、コンタクトデータの音声登録を受け入れることができるのに加えて、テキストに基づく登録、例えば、外部デバイスから提供されるデータに基づく登録も受け入れることができる。音声登録においては、ユーザーは、自動車内で、名前および番号を話すことができ、ヘッドユニットは、それらの名前および対応する番号を録音して(例えば、処理して、処理された表現を記憶して)、登録する。ヘッドユニットのボイスイネーブルサブシステム210は、それから、タスク、例えば、ユーザーが以前に登録した名前を後に話すボイスイネーブルダイヤリングのために、これらの録音された名前を使用し、システムは、ヘッドユニットに接続されたセルラー電話を通して、対応する番号にダイヤルする。
図3を参照すると、テキストに基づく登録において、名前(例えば、人、場所、実体、または他の項目(例えば、歌のタイトルまたはオーディオディスク))が、入力310として(すなわち、テキスト形式で)ヘッドユニットに提供され、システムは、SI音声設定データ212を増やして、それらの名前を含む口頭での発声を受け入れて認識する。ボイスイネーブルサブシステム210は、それから、SI音声設定データ212を使用して、口頭ユーザー入力330を処理する。ボイスイネーブルサブシステムは、また、口頭ユーザー入力330を使用して、SD音声設定データ244を決定することができる。この一例は、音声登録モードであり、ここで、テキスト入力310の提供よりはむしろ、ユーザーは、システムによって認識されるべきコマンドまたは名前を話す。他の例において、その幾つかは、更に以下で論じられるが、口頭ユーザー入力330は、SD音声設定データ244を更新するために用いられ、それは、SI音声設定データ212と共に用いられる。1つのシナリオにおいて、SI音声設定データ212のみを用いる認識が成功しなかったとき、SD音声設定データ244を更新するために、音声登録が開始される。このように、設定データの選択された部分だけが、SD構成要素を持つ必要があり、テキスト登録によって提供される便宜、および音声登録を用いて得られたSD設定データによって提供される精度を提供する。
システムによって認識され得る名前またはコマンドのテキストに基づく明細の一例として、ヘッドユニット100が外部デバイスと通信するとき、テキストに基づく情報(例えば、名前または他の単語のつづりを略さずに書いた表現)は、例えば携帯電話120内のコンタクトデータ250から、ヘッドユニットにダウンロードされる。ヘッドユニットのボイスイネーブルサブシステムは、それから、テキスト情報の発音(「音声のつづり」)を決定する自動的な方法、例えば、辞書検索320または自動書記素−音素手続322を使用して、システムが、テキスト登録からの名前または他の単語を含む口頭コマンドを受け入れて処理することを可能にする。例えば、従来のSI音声認識技術は、テキスト情報を処理するため、およびテキスト情報に基づく単語(語彙)を含むユーザーの発声を認識するために用いられる。
登録のための音声に基づくアプローチおよびテキストに基づくアプローチに加えて、ヘッドユニット100は、ユーザーが口頭コマンドの中で用いることができる、語彙の登録に対する更なるアプローチを使用する。これらの更なるアプローチのうちのいくつかは、システムによって受け入れられる単語のための音声サブシステムによって用いられる、発音の精度に関する問題に対処することに狙いをつけている。例えば、これらの問題は、予測が難しい標準の発音、または、例えば、外国風のアクセントによる、もしくは、より一般的に、ユーザーの国家的、地域的、文化的、または言語学的バックグラウンドに基づく、ユーザーに固有の発音に関する。
テキスト表現から単語の発音を決定するために、ボイスイネーブルサブシステム210によって用いられる1つのアプローチは、SI辞書にアクセスすることを含んでいる。SI辞書内の単語に対して、発音は、それらの単語を含んでいる発声が話されたかどうかを決定するために、ユーザーからの音声入力を処理するとき、音声認識エンジンによって用いられる。例えば、外部デバイスからのダウンロードの結果として、システムに動的に追加される、全ての名前または新しい単語をカバーするのに十分大きい辞書を有することは、実際的ではないだろう。ボイスイネーブルサブシステム210によって用いられる第2のアプローチは、単語のテキスト表現を受け入れるために、かつ辞書の中で用いられるタイプの表現を出力するために、自動化された書記素−音素(G2P)手続を実行することを含んでいる。G2P手続のための辞書および音声設定データは、SI音声設定データ212の中に含まれていて、それは、一般にいかなる特定のユーザーにも固有ではない。
名前の認識は、名前の発音が必ずしも予め正確に予測されることができないという事実のために、挑戦していてもよい。同様に、G2P手続は、一般に、ユーザーの特徴、例えば彼または彼女の自国語および文化に固有ではない。
ボイスイネーブルサブシステム210は、特定のユーザーのプロフィールデータ240からのSD音声設定データ244と同様に、必ずしも特定のユーザーに固有であるというわけではない、SI音声設定データ212の組み合わせを用いることができる。例えば、2つのタイプの設定データは、同時に用いられて、口頭ユーザー入力を認識する。代替案として、SI設定データ212が最初に用いられて、その使用の中で決定される組み合わせまたは得点に応じて、SDデータ244が次に用いられてもよい。または、SI音声設定データ212およびSD設定データ244に基づく認識の得点が比較され、比較に基づいて1つが選択される。
音声認識に対する1つのアプローチは、2つのステップを用いて、ユーザー固有の発音を決定する。第1に、変化を含む辞書から、または、例えば、ネットワーク表現における、複数の変化を生成するG2P手続から、1つの単語に対する複数の発音の組が決定される。第2のステップにおいて、例えば、ユーザーからの口頭入力に基づいて、一つの最善の(または、より一般的に、複数の最も一致しているサブセットの)一致している発音が選択される。
システムのいくつかのバージョンにおいて、システムが特定のユーザーのためにSD音声設定データ244を使用するとき、それは、SI設定データ212に対するサポートも維持する。このようにすれば、もし、システムがあるユーザーのプロフィールデータを用いていながら、他のユーザーがコマンドを話したとしても、他のユーザーの発声は認識され得る。これは、たとえ、プロフィールデータと関連があるユーザーが、非常に特殊な設定を有していたとしても、可能である。
SD音声設定データ244を生成するための他のアプローチは、ユーザーの口頭での入力に依存する。例えば、ボイスイネーブルサブシステム210は、不正確な、話者に依存しない音声の筆写のいくつかを訂正する機能を提供する。不正確な、話者に依存しない音声の筆写は、話者に依存しない辞書のみを使用することによって起こり得る。この機能は、自動化された音声認識の中で用いる発音を決定する際に、ユーザーの発声を使用する。1つのこのようなアプローチは、認識の中で用いる発音を決定するために、ユーザーが全ての新しい名前を話すことを必要とする。好ましくは、システムは、自動的にユーザーの名前の発音を訓練して、ユーザーの介入を必要とせずに、すなわちプロセスを認識して、SI辞書/規則を用いるか、またはそのユーザーのためのユーザー固有の発音を決定するかどうかに関する決定を下す。
システムの1つのバージョンにおいて、SI辞書およびG2P手続は、認識文法、例えば特別な音声タスクのための文法における全ての単語の発音表記を形成するために用いられる。このようなタスクの例は、音声ダイヤリングであり、この中で、ユーザーは、長いコマンドの文脈の中で名前を言うことができる(例えば、「ジョンスミスに電話をして下さい」)。加えて、システムは、特定のユーザーに固有な例外辞書の使用をサポートする。例外辞書の1つの用途は、特別な単語の追加の表現を含ませることである。例えば、もしユーザーが「スミス」を発音する特別な方法を有するならば、例外辞書は、その単語のための例外項目を含むように、システムによって設定され得る。実行時設定エンジンが、エンジン用に、実行時設定データを計算するときに、認識文法の中で単語「スミス」を表現する際に、実行時設定エンジンは、SI発音および例外発音を含む。代替案として、例外発音だけが、実行時設定データを生成するために用いられる。代替案として、名前のユーザー固有の発音を適応させるために、システムは、例外辞書の中に、例えばスミス−1のような、新しい単語を導入し、かつ文法を修正して、元のスミスという単語に加えて、スミス−1という単語も、両方とも可能にする。従って、たとえ例外辞書がSI辞書より優先されるとしても、単語の両方の形式は、入力発声を処理するとき、認識エンジンによって受け入れられるであろう。以下の説明において、辞書を更新するとは、上記のように、例外辞書の中に項目を追加または更新することに相当し得る。
図4を参照すると、ボイスイネーブルサブシステム210(図2参照)によって実現されるプロセスは、動作中に(すなわち、必ずしも訓練モード中ではない)口頭ユーザー入力330(図3参照)を受け入れるステップを含んでいる。そして、この入力に応じて、おそらくは、発声の中の1つ以上の単語のユーザー固有の発音を含む、ユーザー固有の辞書を更新する。このプロセスにおいて、単語またはフレーズを含む発声、例えばユーザー音声コマンドからの名前は、ボイスイネーブルサブシステムによって認識される(ステップ410)。エンジンは、認識された仮説が発声と一致する程度を示す得点を、仮説と関連する信頼度C1の形(または得点の他の形式)で提供する。もし信頼度が前もってセットされた閾値T1を上回るならば(ステップ412)、システムは、辞書を更新することなく進む(ステップ440への分岐)。もし信頼度が第2のより低い閾値T2の下にあるならば(ステップ414)、システムは、辞書を更新することなく、発声を拒絶する(ステップ430)。しかし、信頼度C1が2つの閾値によって形成される範囲内にあるとき、システムは「未決定」状態420に入る。
「未決定状態」において、システムはユーザーからの正しい答えを確認する(ステップ422)。例えば、ユーザーからの更なるプロンプトおよび口頭または他のモードの入力を用いて、仮説を確かめる。または、暗黙のうちに行う。なぜなら、ユーザーは、認識された答えに基づいて、動作をキャンセルするよりはむしろ受け入れるからである。ユーザーからの応答が、システムが単語/フレーズを正しく認識しなかったことを確認したとき、ユーザーの個人の発音を更新する動作はとられない。ユーザーからの応答が、システムが正しい単語/フレーズを正しく認識したことを確認したが、信頼度が高くなかったとき(ステップ424)、システムは訓練モードに入り、この中でSD設定データが更新される(ステップ426)。この訓練モードの中で、システムは発声を処理し、この発声に基づいてユーザー固有の辞書を更新する。ScanSoft ASRエンジン上で構築された具体例としてのシステムに対して、訓練は、以下のステップを含んでいる。
・ユーザーの発声を集める、または以前に保存された発声を使用する。
・ユーザー単語の筆写を生成する。
・ユーザー単語の筆写を(例外)辞書の中に追加する。
・この単語を使用する文法を再編集する。
・エンジンは、新しい文法を用いて、音声入力を認識する。
・ユーザーの発声を集める、または以前に保存された発声を使用する。
・ユーザー単語の筆写を生成する。
・ユーザー単語の筆写を(例外)辞書の中に追加する。
・この単語を使用する文法を再編集する。
・エンジンは、新しい文法を用いて、音声入力を認識する。
いくつかの実施形態において、ユーザーが後に同じ単語またはフレーズを発音するとき、もし更新されたSD辞書C2を用いる信頼度と、SI辞書C1を用いる信頼度との間の差が、予め決められた閾値(T3)より大きいならば、更新されたSD辞書が用いられるだろうし、さもなければ、SI辞書が引き続き用いられるだろう。
音声イネーブルシステム210は、名前の口頭での入力の精度を改善可能な他の機能を提供する。一般に、このアプローチは、名前を話すとき、ユーザーが追加情報を追加することを必要とする。これは、例えば、「ジョンスミスJ.S.」のような名前の発声の後の頭文字のような追加情報を追加することによる。追加情報は、冗長であり得る。例えば、頭文字の場合、名前または名前から一意に決定される他の情報から、直接、導き出される。または、追加情報は、情報の曖昧さをなくし得る。例えば、その名前と関連がある複数の項目を有するコンタクトデータベース内の「ジョンスミス」の特定の例を識別する。入力タスクの中で、ユーザーは、コンタクトデータからコンタクトを選択する。このコンタクトデータは、認識文法を構築するために用いられる。認識文法は、このような追加情報と共に発声を受け入れる。ユーザーは、名前を呼ぶことによって、コンタクトに電話をかける。例えば、「ジョンスミスに電話せよ」。しかし、一般的ではなく、かつ/または混乱しやすい名前に対しては、エンジンは、それを正確に認識しないかもしれない。例えば2つの文字から成る追加情報が、音声認識サブシステムによって用いられ、正しい認識仮説を不正確な誤認識仮説から区別する。
このアプローチに基づく他の例は、以下の通りである。
システム:名前と番号をどうぞ。
ユーザー:ボブスミスの自宅。
システム:申し訳ありませんが、もう一度言って下さい。
ユーザー:ボブスミスの自宅の電話。
システム:申し訳ありませんが、別の方法で試しましょう。人の名前に続けて姓名の頭文字を言って下さい。
ユーザー:ボブスミスBSの自宅。
システム:ボブスミスの自宅に電話します。
システム:名前と番号をどうぞ。
ユーザー:ボブスミスの自宅。
システム:申し訳ありませんが、もう一度言って下さい。
ユーザー:ボブスミスの自宅の電話。
システム:申し訳ありませんが、別の方法で試しましょう。人の名前に続けて姓名の頭文字を言って下さい。
ユーザー:ボブスミスBSの自宅。
システム:ボブスミスの自宅に電話します。
上述したアプローチの中で、コンタクトデータは、外部デバイスによって提供されるが、このデータは、不完全でもよい。例えば、電話番号はあるが、住所情報(これはナビゲーションの構成要素が必要とする可能性がある)は、ユーザーのコンタクトデータから見つからないかもしれない。このシステムの特徴は、見つからない情報が、ヘッドユニット内のデータに、自動または手動で追加され得ることである。これは、外部の情報ソース、例えばリモートサーバー140(図1参照)にアクセスすることによって達成される。例えば、「ホワイトページ」ディレクトリは、無線ネットワークシステムを介したインターネットを通じてアクセスされる。追加される見つからない情報は、音声コマンドの中で用いられる可能性がある。例えば、「メープルストリートファーストに住んでいるジョンスミスに電話せよ」または「ジョンスミスに電話せよ。彼の職場の電話番号は508−555−1212だ。」このようなより複雑な口頭での入力は、自動化された認識の中で、より高い精度を達成することができる。難しい認識問題(例えば2人のジョンスミス)に対して、これらの追加情報の使用のおかげで、このシステムは、まだ話者に依存しないモードを提供することができ、冗長な話者に依存するモードに切り替える必要はない。例えば、「オークストリートのジョンスミス」に電話せよに対して「ウォータードライブのジョンスミス」に電話せよ。
見つからない情報は、他のサブシステム、例えばナビゲーションシステムによっても用いられ得る。例えば、ユーザーは、POI(例えばレストラン)の名前を言うことができる。システムは、自動的に、コンタクトデータから住所情報を抽出し、抽出された住所情報を用いて、ナビゲーションサブシステムにコマンドを発する。各コンタクトデータレコードのための複数の項目(セル、自宅、職場の電話番号、好ましいコンタクトリストなど)は、選択するユーザーまたは利用するシステムのために、全てユーザーに提示され得る。いくつかの態様において、例えば音声(例えば口頭での名前または数字の列)によって、またはマニュアル入力によって、ユーザーがテレフォンダイヤリングコマンド(または他のタイプの特定の宛先との通信に関するコマンド)を提供するとき、ナビゲーションシステムは、自動的に、テレフォンダイヤリングコマンドと関連する場所へのナビゲーションルートを決定することができる。または、テレフォンダイヤリングコマンドと関連する場所を示している地図を決定することができる。
システムの他の態様において、話者識別機能が、記憶されたセットのユーザーのうちのどのユーザーがシステムと対話しているかを決定するために用いられる。この話者識別は、ユーザー固有のシステムの基本設定を設定する。この基本設定は、ユーザー固有のコンタクトデータ、ユーザー固有の発音、または他の基本設定を含んでいてもよい。様々な技術が、どのユーザーがシステムと対話しているかを決定するために用いられ得る。例えば、ヘッドユニットとペアを組んでいる特定の外部デバイス(例えば携帯電話)が、ユーザーを識別するために用いられ得る。話者確認サブシステム222もまた、ユーザー識別のために用いられ得る。他の適切な技術、例えばパスワード、指紋、顔の認識などが、代替案として用いられる。
話者識別は、このシステムをよりユーザーフレンドリーにすることができ、かつパーソナライズされたサービスを提供することができる。さらに、音声インターフェースは、制御されているシステムと関連する情報を使用することができる。このように、ユーザーインターフェースは、より「知的」にすることができる。他の例として、音声認識サブシステムが、ユーザーが言った仕事またはフレーズを認識しなかったとき、「もう一度言って下さい」を繰り返す代わりに、サブシステムは、ユーザーの基本設定および履歴に基づいて、可能な選択肢のリストを提供することができる。「ジョンスミスですか、またはジョンスティーヴですか。」ユーザーからの正しい答えは、更に、上記のような話者に依存する文法および辞書を生成するために、エンジンを訓練するのに利用され得る。
口頭でのユーザーインターフェースシステムにおいて、ユーザーにシステムの状態のフィードバックを提供することは望ましい。例えば、システムが「リスニング」状態にあることをフィードバックすることは、役に立ち得る。自動車への応用においては、ユーザーとの対話を実行するために、道から目を離す必要がないこともまた、運転手のために望ましい。1つのアプローチは、例えば、トーンおよびビープ音の形で、または、録音もしくは合成された助言の形で、音声フィードバックを提供することである。他のアプローチは、運転手が道から目を離す必要がない視覚的フィードバックを提供することである。より詳細には、運転手の周辺視野を用いて知覚され得る視覚的インジケーターが、ヘッドユニットによって生成される。このような視覚的インジケーターの一例は、グラフィカルディスプレイの比較的広い領域、例えば、ほぼ全領域を使用する。領域全体の視覚的な色または輝度の変化が、システムの状態を示すために用いられる。例えば、特定の色が、システムのマイクロフォンがユーザーの音声入力を聞く準備ができていることを示すために用いられる。領域および色は、ユーザーにとって十分に目立つものであり、ユーザーはディスプレイを直接見る必要はなく、例えば、彼または彼女の周辺視野を用いる。
システムの他の態様において、ヘッドユニットは、音声認識エンジンが困難に遭遇しそうなノイズ状態を検出したとき、ユーザーに警告する。システムは、ノイズレベルを測定し、音声認識が推奨されないとき、ユーザーに警告する。システムは、キャビン内の音響ノイズレベルを測定し、ユーザーが音声認識入力を用いようとするときに、キャビン内にノイズが多すぎるかどうかをユーザーに知らせる。警報は、音声、映像または上述したような視覚的インジケーターの形であってもよい。システムは、更に、自動切換によって、またはユーザーに選択を勧めることによって、コマンド発行の他のモードに移行することができる。一般に、モード移行は、イベントによって引き起こされ得る。例えば、音声インターフェースから、ディスプレイ上のタッチスクリーンを介するマニュアル入力への移行は、過剰なノイズが車両内で検出されたときに引き起こされ得る。システムの更に他の態様において、移行は、システムが、このシステムとのユーザーの対話の状態を追跡し、かつユーザーによるコマンド発行を続けることができるように、スムーズかつ連続的になされてもよい。例えば、ユーザーは、音声インターフェースを用いて、電話番号を言っていたが、ノイズによって引き起こされたモード移行のために、完了しなかった。音声インターフェースモードからマニュアル入力モードに移行するとき、システムは、完了しなかった口頭での電話番号を移植して、ユーザーのためにディスプレイ上にそれらを示し、コールを続けて完了することができる。
一般に、ユーザーとの対話のためのインターフェースは、複数のモードの入力、例えば音声、タッチ、ディスプレイおよび他のセンサを有している。システムは、ユーザーを、従来技術のように現在使用中のモードにおけるコマンド発行のために必要でない莫大な量の情報に埋没させることを避けるために、使用中のモードに関する情報を、表示または示すことによって、提示するのみである。例えば、音声インターフェースモードにあるとき、ディスプレイ上のソフトキーのようなタッチ入力は表示されない。ハードドライブのようなオーディオソースが選択されているとき、FMもAMもディスプレイ上に表示されない。このようなマルチモードユーザーインターフェースを提供する1つの例は、音声入力モードにおけるコマンドの最初の部分を受け入れることを必要とする。ユーザーインターフェースに関する状態が検出される。例えば、高いノイズレベルが検出される。システムは、このノイズレベルに基づいて、マニュアルモードが用いられるべきであることを決定する。次に、コマンドの2番目の部分が、マニュアルモードにおいて受け入れられる。コマンドの最初および2番目の部分は、例えば、コマンドの最初の口頭での部分がマニュアル入力を用いて繰り返されることを必要とせずに、スムーズかつ連続的な移行を形成することができる。
システムの他の態様において、ヘッドユニットは、「ボイスコマンド」シーケンスの間、変更されていた環境設定を元に戻す。このような環境設定は、ファンの速度、または音楽の音量を含んでいてもよい。例えば、ヘッドユニットは、音声入力の間、音楽の音量またはファンの速度を下げて、口頭での対話が終わったら、それらを元に戻してもよい。
ヘッドユニット100の他の態様は、外部デバイスにインターフェースを提供することに関し、特に、ブルートゥース無線通信規格を用いる。この規格によって規定されるプロトコルによれば、2つのブルートゥースデバイスが「ペアになる」とき、それらは、データを共有し、かつ制御信号をお互いに送信することができる。例えば、車内音声インターフェースユニットは、ブルートゥースを介してPDAまたはセルラー電話と通信して、このデバイスに記憶されたコンタクトリストをダウンロードすることができる。ペアリングプロセスに対する典型的なアプローチは、安全な方法での2つのデバイスのお互いに対する紹介を必要とする。1つのデバイスが他方を「発見」し、共通のコードが2つのデバイス間で渡される。
ヘッドユニットは、ペアリングの効率を改善可能な単純化されたペアリングプロセスを実行する。一般に、知能をデバイスのうちの1つの中に入れることによって、ステップを単純化して、ユーザーへの負担を軽くする。図5を参照すると、このような単純化されたペアリングプロセスの一例は、以下のような対話のシーケンスを有している。この例では、「デバイスA」はヘッドユニットであり、「デバイスB」は、例えば、携帯電話である。
1)ユーザーは、デバイスA上でペアリングを開始する(ステップ510)。ボタンを押すことによって、デバイスAは、ブルートゥースデバイスとの対話を開始する。例えば、ハンズフリー電話への応用においては、ヘッドユニットは、携帯用モバイル電話とペアにされるべきであり、ユーザーは、ヘッドユニットに接続されているトークボタンを押す。ユーザーは、特別なペアリングシーケンスについて知っている必要はない。
2)デバイスAは、ペアリングが必要であることを自動的に検出し(ステップ520)、利用可能なデバイスを探して、その範囲を検索し、かつユーザーに選択肢を提示する。例えば、ヘッドユニットは、車両内でデバイス(例えば携帯電話およびPDA)のリストを表示する。
3)ユーザーは、デバイスAのユーザーインターフェース上で、デバイスBを選択する(ステップ530)。
4)デバイスAは、ランダムコードを自動的に生成し、ユーザーに、このコードを、例えばディスプレイを介して提示する。それは、デバイスAのディスプレイまたは別のディスプレイ、例えばヘッドユニットのディスプレイであってもよい。そして、デバイスBに接続要求を送信する(ステップ540)。
5)デバイスBは、デバイスAから接続要求を受信する。ユーザーは、ランダムコードを用いて、この要求を受け入れる選択肢を有している(ステップ550)。
6)ユーザーは、デバイスB上で、この要求を受け入れる(ステップ560)。
1)ユーザーは、デバイスA上でペアリングを開始する(ステップ510)。ボタンを押すことによって、デバイスAは、ブルートゥースデバイスとの対話を開始する。例えば、ハンズフリー電話への応用においては、ヘッドユニットは、携帯用モバイル電話とペアにされるべきであり、ユーザーは、ヘッドユニットに接続されているトークボタンを押す。ユーザーは、特別なペアリングシーケンスについて知っている必要はない。
2)デバイスAは、ペアリングが必要であることを自動的に検出し(ステップ520)、利用可能なデバイスを探して、その範囲を検索し、かつユーザーに選択肢を提示する。例えば、ヘッドユニットは、車両内でデバイス(例えば携帯電話およびPDA)のリストを表示する。
3)ユーザーは、デバイスAのユーザーインターフェース上で、デバイスBを選択する(ステップ530)。
4)デバイスAは、ランダムコードを自動的に生成し、ユーザーに、このコードを、例えばディスプレイを介して提示する。それは、デバイスAのディスプレイまたは別のディスプレイ、例えばヘッドユニットのディスプレイであってもよい。そして、デバイスBに接続要求を送信する(ステップ540)。
5)デバイスBは、デバイスAから接続要求を受信する。ユーザーは、ランダムコードを用いて、この要求を受け入れる選択肢を有している(ステップ550)。
6)ユーザーは、デバイスB上で、この要求を受け入れる(ステップ560)。
このアプローチは、両方のデバイスをペアリング/発見モードに設定する必要性を避けることができる。
ヘッドユニットは、自動車内の多数のシステムに対するインターフェースを提供する。2つのこのようなシステムは、ナビゲーションシステムおよび携帯電話システムを含んでいる。このシステムの態様は、ダウンロードされたコンタクト情報を、ユーザーインターフェースおよび関連するシステムを設定する際に用いることができることである。この設定は、コンタクト情報に基づいてナビゲーション宛先情報を登録する機能を提供することを含んでいてもよい。例えば、人の名前は、ナビゲーションのための宛先の明細として用いられ得る。いくつかのシナリオにおいて、対応する住所情報は、外部デバイスからダウンロードされた情報の中から利用可能ではなく、むしろ遠隔の情報プロバイダー、例えば電話「ホワイトページ」システムからダウンロードする。コンタクト情報の有効性に関する他の機能は、名前と他の関連する情報の組み合わせに基づく、電話する相手の明細に関する。例えば「メインストリート上のジョンスミス」または「オフィスにいるジョンスミス」。追加の関連情報は、電話する番号の曖昧さをなくすために用いることができ、名前のみに基づいても曖昧さがないときでも、認識精度を改善することができる。
システムの他の態様は、ディスプレイ上に表示されるナビゲーションデータベースからのテキストのような情報である。ストリート名、方向(右、左、直進など)が、テキストから音声への変換を介して、音声で運転手に提供され得る。例えば、ナビゲーションマップ上でストリート名およびそこからの距離を表示することの代わりに、かつ/または、このことの他に、ボイスイネーブルサブシステムが「次の4分の1マイル以内にメインストリートを左へ曲がって下さい」と言うことができる。一実施形態において、強調された「メインストリート」は、TTSを介して得ることができる一方で、他は、予め録音しておくことができる。
上述した態様の1つ以上が、ヘッドユニットの様々なバージョンの中で実現され得る。すなわち、機能の組み合わせが、様々な実施形態の中でなされ得る。このシステムは、様々なタイプの車両および他の車両ではないユーザー環境に適用できる。ヘッドユニットは、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアの組み合わせを用いて実現することができる。ソフトウェアは、インストラクションを有していて、これは、媒体、例えばリードオンリーメモリ内またはディスクドライブ上に記憶され、かつヘッドユニット内に組み込まれたプロセッサ上で実行され得る。
前述の説明は、例示を目的とするものであって、本発明の範囲を限定するためのものではないことは理解されるべきである。本発明の範囲は、添付の請求項の範囲によって定められる。他の実施形態も、この請求項の範囲内である。
100 ヘッドユニット
110 グラフィカルディスプレイ
112 入力装置
114 マイクロフォンまたはマイクロフォンアレイ
116 スピーカー
118 リモートデータインターフェース
120 携帯電話
122 携帯情報端末(PDA)
123 組み込み電話
124 携帯用パーソナルコンピュータ
140 リモートサーバー
110 グラフィカルディスプレイ
112 入力装置
114 マイクロフォンまたはマイクロフォンアレイ
116 スピーカー
118 リモートデータインターフェース
120 携帯電話
122 携帯情報端末(PDA)
123 組み込み電話
124 携帯用パーソナルコンピュータ
140 リモートサーバー
Claims (46)
- ボイスイネーブルユーザーインターフェースを提供する方法において、
インターフェースを設定して、音声入力の発声を処理するステップを有していることを特徴とする方法。 - 前記音声入力の発声を処理するステップは、識別子を、識別子と関連する、冗長な、または曖昧さをなくす情報と共に処理するステップを有していることを特徴とする請求項1に記載の方法。
- 追加の、または曖昧さをなくす情報を、識別子を前記情報と関連付けているデータベースから検索するステップを更に有していることを特徴とする請求項1に記載の方法。
- 前記データベースは、コンタクトデータベースを有していることを特徴とする請求項3に記載の方法。
- 前記冗長な、または曖昧な情報は、識別子と直接連結されることを特徴とする請求項2に記載の方法。
- 前記識別子は、名前を含んでいて、かつ、前記冗長な、または曖昧さをなくす情報は、名前の頭文字を含んでいることを特徴とする請求項2に記載の方法。
- インターフェースのための一般的な設定情報を記憶するステップと、
インターフェースのためのユーザー固有の設定情報を記憶するステップと、
一般的な設定情報およびユーザー固有の設定情報を用いて、ユーザーからの音声入力の処理を可能にするステップと、
音声入力処理の結果に基づいて、ユーザー固有の設定情報を選択的に更新するステップとを更に有していることを特徴とする請求項1に記載の方法。 - 前記更新は、入力と関連する得点が、不正確な認識仮説が予め決められた閾値以内の得点を有していることを示すとき、入力の正しい認識の上で、実行されることを特徴とする請求項7に記載の方法。
- 前記更新は、ユーザーからの更なる音声入力を必要とせずに、実行されることを特徴とする請求項8に記載の方法。
- ユーザー固有の設定情報は、辞書項目に対するユーザー固有の発音情報を含んでいて、そのための一般的な発音情報は、一般的な設定情報の中に含まれていることを特徴とする請求項7に記載の方法。
- ユーザー固有の設定情報の更新は、インターフェースの使用中に、実行されることを特徴とする請求項7に記載の方法。
- 前記更新は、ユーザーからの音声入力の誤認識に基づくことを特徴とする請求項11に記載の方法。
- ユーザー固有の設定情報の更新は、ユーザーからの音声入力の認識結果に基づくことを特徴とする請求項11に記載の方法。
-
インターフェースの複数のユーザーの各々のための設定情報を提供するステップと、
インターフェースのユーザーを決定するステップと、
決定されたユーザーに対する設定情報を用いて、インターフェースを適合させるステップとを更に有していることを特徴とする請求項1に記載の方法。 - 前記ユーザーを決定するステップは、ユーザーからの口頭での入力に対して話者識別プロセスを適用するステップを含んでいることを特徴とする請求項14に記載の方法。
- 音声入力の発声を処理するためにインターフェースを設定する前に、
語彙項目のテキストの明細を受け入れるステップと、
語彙項目に対する発音を決定するステップとを有していて、
音声入力の発声を処理するためにインターフェースを設定した後に、
決定された発音を用いて、口頭での入力の中の語彙項目を自動的に認識するステップと、
もし、認識された語彙項目と関連する得点が、予め決められた範囲内に入るならば、受け入れられた口頭での入力からの1つ以上の語彙項目の発音を決定するステップとを有していることを特徴とする請求項1に記載の方法。 - 音声入力は、ユーザーからの通信コマンドを含んでいて、
更に、通信コマンドから宛先情報を決定するステップと、
決定された宛先情報に基づいて、ナビゲーションシステムにコマンドを発するステップとを有していることを特徴とする請求項1に記載の方法。 - 前記通信コマンドは、テレフォンダイヤリングコマンドを含んでいることを特徴とする請求項17に記載の方法。
- 前記通信コマンドから決定される宛先へのルートを決定するステップを更に有していることを特徴とする請求項17に記載の方法。
- 前記通信コマンドは、口頭でのコマンドを含んでいることを特徴とする請求項17に記載の方法。
- 前記決定するステップは、通信コマンドと、コンタクトデータベース内の宛先情報との関連に基づくことを特徴とする請求項17に記載の方法。
- 第1のデバイスで、第2のデバイスからコンタクトデータを受け取るステップと、
前記第1のデバイスで、データソースからの追加データを要求して、コンタクトデータを増やすステップと、
第2のデバイスからの受信コンタクトデータおよびデータソースからの追加データを用いて、ユーザーインターフェースを設定するステップとを更に有していることを特徴とする請求項1に記載の方法。 - 前記第1のデバイスは、車両に基づくデバイスを含んでいて、第2のデバイスは、モバイル機器を含んでいることを特徴とする請求項22に記載の方法。
- 前記データソースは、リモートサーバーに常駐していることを特徴とする請求項22に記載の方法。
- リモートサーバーから要求される追加データは、コンタクトデータ内の項目と関連する情報を含んでいることを特徴とする請求項22に記載の方法。
- コンタクトデータ内の項目は、名前および関連する電話番号を含んでいて、要求される追加データは、この項目と関連する住所情報を含んでいることを特徴とする請求項25に記載の方法。
- ナビゲーションシステムからテキストのストリート情報を得るステップと、
テキストのストリート情報を、その口頭での等価物に変換するステップと、
ユーザーに口頭での等価物を提示するステップとを更に有していることを特徴とする請求項1に記載の方法。 - グラフィックディスプレイ上でユーザーに視覚的なキューを提示するステップを更に有していて、
この視覚的なキューは、ユーザーが直接ディスプレイを見る必要がなく、ユーザーの周辺視野内でのユーザーによる検出に適していることを特徴とする請求項1に記載の方法。 - 前記視覚的なキューは、口頭インターフェースの状態に関連していることを特徴とする請求項28に記載の方法。
- 前記視覚的なキューを提示するステップは、口頭インターフェースが、口頭でのコマンドを受け入れる状態にあることの表示を提供するステップを含んでいることを特徴とする請求項29に記載の方法。
- 前記視覚的なキューを提示するステップは、口頭インターフェースが、ユーザーから口頭でのコマンドを受け入れたことの表示を提供するステップを含んでいることを特徴とする請求項29に記載の方法。
- 調節の前に制御設定を記録することを含む、音声入力対話の開始で、音響環境と関連する1つ以上の制御設定を調節するステップと、
口頭での対話の後に、制御設定を元に戻すステップとを更に有していることを特徴とする請求項1に記載の方法。 - 前記制御設定は、音量設定を含んでいることを特徴とする請求項32に記載の方法。
- 前記音量設定は、音声の音量設定を含んでいることを特徴とする請求項33に記載の方法。
- 前記制御設定は、ノイズを発生するデバイスに対する設定を含んでいることを特徴とする請求項32に記載の方法。
- ノイズを発生するデバイスに対する設定は、ファンの設定を含んでいることを特徴とする請求項35に記載の方法。
- マルチモード車内ユーザーインターフェースを提供する方法において、
第1の対話モードにおいて、コマンドの第1の部分を受け入れるステップと、
ユーザーインターフェースに関する状態を検出するステップと、
検出された状態に基づいて、第2の対話モードを決定するステップと、
第2の対話モードにおいて、コマンドの第2の部分を受け入れるステップとを有していて、
前記第1の対話モードおよび第2の対話モードは、口頭対話モードおよびマニュアル対話モードのそれぞれであることを特徴とする方法。 - ユーザーに、第1の対話モードおよび第2の対話モードのうちの1つだけに実質的に関連する情報を提示するステップを更に有していることを特徴とする請求項37に記載の方法。
- 前記ユーザーインターフェースに関する状態を検出するステップは、ユーザーインターフェースの環境内でのノイズレベルを検出するステップを含んでいることを特徴とする請求項37に記載の方法。
- コマンドの第1の部分の受け入れおよびコマンドの第2の部分の受け入れが実行され、コマンドの第1の部分の反復を必要とせずに、コマンドの連続的な入力を提供することを特徴とする請求項37に記載の方法。
- 通信媒体を通じて第1のデバイスと第2のデバイスを関連付ける方法において、
第1のデバイスでデータを生成するステップと、
第1のデバイスで生成されたデータをユーザーに提示するステップと、
第2のデバイスに関連付け要求を伝送するステップと、
第1および第2のデバイスの関連付けを許可するユーザーからの入力時に、第2のデバイス上で、データを受け入れるステップとを有していることを特徴とする方法。 - 前記第1のデバイスは、車両に基づくデバイスを含んでいて、第2のデバイスは、モバイル機器を含んでいることを特徴とする請求項41に記載の方法。
- 前記モバイル機器は、携帯電話およびPDAのうちの1つを含んでいることを特徴とする請求項42に記載の方法。
- 第1のデバイス上でボタンを押すことによる開始ステップを更に有していることを特徴とする請求項41に記載の方法。
- ブルートゥース通信アプローチに従って、第1のデバイスと第2のデバイスを関連付けるステップを更に有していることを特徴とする請求項41に記載の方法。
- 第1のデバイスで関連付け手続を開始するステップと、
第1のデバイスで1つ以上の候補デバイスを検出するステップと、
ユーザーから候補デバイスのうちの第2のデバイスの選択を受け入れるステップと、
第1のデバイスからユーザーに関連付け情報を提供するステップと、
第1のデバイスから第2のデバイスに要求を伝送するステップと、
第2のデバイスでユーザーからの関連付け情報を受け入れるステップとを更に有していることを特徴とする請求項41に記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/173,736 US7826945B2 (en) | 2005-07-01 | 2005-07-01 | Automobile speech-recognition interface |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007011380A true JP2007011380A (ja) | 2007-01-18 |
Family
ID=37074976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006183890A Pending JP2007011380A (ja) | 2005-07-01 | 2006-07-03 | 自動車インターフェース |
Country Status (4)
Country | Link |
---|---|
US (1) | US7826945B2 (ja) |
EP (1) | EP1739546A3 (ja) |
JP (1) | JP2007011380A (ja) |
CN (1) | CN1920946A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008275987A (ja) * | 2007-05-01 | 2008-11-13 | Yamaha Corp | 音声認識装置および会議システム |
JP2009210703A (ja) * | 2008-03-03 | 2009-09-17 | Alpine Electronics Inc | 音声認識装置 |
WO2009130840A1 (ja) * | 2008-04-23 | 2009-10-29 | 三菱電機株式会社 | 車載情報システム |
JP2012529236A (ja) * | 2009-06-02 | 2012-11-15 | フォード グローバル テクノロジーズ、リミテッド ライアビリティ カンパニー | 車両内において電子カレンダー・アプリケーションのハンズフリー操作を実行するシステム及び方法 |
KR20160059182A (ko) * | 2014-11-18 | 2016-05-26 | 현대모비스 주식회사 | 차량용 avn 시스템의 모바일 단말 등록 제어 장치 및 방법 |
JP2017512433A (ja) * | 2014-02-28 | 2017-05-18 | ボーズ・コーポレーションBose Corporation | 音源の直接選択 |
US10063683B2 (en) | 2014-12-24 | 2018-08-28 | Hyundai Motor Company | In-vehicle multimedia system connected to external device and control method thereof |
JP2020003969A (ja) * | 2018-06-27 | 2020-01-09 | 富士ゼロックス株式会社 | 画像出力システム、サーバ装置、端末装置、画像出力装置及びプログラム |
CN110800044A (zh) * | 2017-09-08 | 2020-02-14 | 亚马逊技术股份有限公司 | 用于语音助手系统的话语权限管理 |
JP2021182217A (ja) * | 2020-05-18 | 2021-11-25 | トヨタ自動車株式会社 | エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム |
Families Citing this family (402)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6630800A (en) | 1999-08-13 | 2001-03-13 | Pixo, Inc. | Methods and apparatuses for display and traversing of links in page character array |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US9224394B2 (en) * | 2009-03-24 | 2015-12-29 | Sirius Xm Connected Vehicle Services Inc | Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same |
DE102005030965B4 (de) * | 2005-06-30 | 2007-07-19 | Daimlerchrysler Ag | Erweiterung des dynamischen Vokabulars eines Spracherkennungssystems um weitere Voiceenrollments |
US7826945B2 (en) * | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
WO2007008248A2 (en) * | 2005-07-11 | 2007-01-18 | Voicedemand, Inc. | Voice control of a media player |
JP4899685B2 (ja) * | 2005-09-02 | 2012-03-21 | 株式会社デンソー | 手動操作システム |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
TWI302691B (en) * | 2005-10-21 | 2008-11-01 | Delta Electronics Inc | Portable electronic device with speech synthesize and music prelude functions |
US20070124147A1 (en) * | 2005-11-30 | 2007-05-31 | International Business Machines Corporation | Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems |
US8060821B2 (en) * | 2005-12-09 | 2011-11-15 | Apple Inc. | Enhanced visual feedback of interactions with user interface |
EP1961619B1 (en) * | 2005-12-16 | 2012-03-14 | Panasonic Corporation | Input device and input method for mobile body |
US9976865B2 (en) * | 2006-07-28 | 2018-05-22 | Ridetones, Inc. | Vehicle communication system with navigation |
GB2440766B (en) * | 2006-08-10 | 2011-02-16 | Denso Corp | Control system |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8214219B2 (en) * | 2006-09-15 | 2012-07-03 | Volkswagen Of America, Inc. | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
US7831431B2 (en) * | 2006-10-31 | 2010-11-09 | Honda Motor Co., Ltd. | Voice recognition updates via remote broadcast signal |
US7873517B2 (en) * | 2006-11-09 | 2011-01-18 | Volkswagen Of America, Inc. | Motor vehicle with a speech interface |
US8386125B2 (en) * | 2006-11-22 | 2013-02-26 | General Motors Llc | Adaptive communication between a vehicle telematics unit and a call center based on acoustic conditions |
US8391775B2 (en) * | 2007-03-09 | 2013-03-05 | Airbiquity Inc. | Mobile digital radio playlist system |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
JP4225356B2 (ja) * | 2007-04-09 | 2009-02-18 | トヨタ自動車株式会社 | 車両用ナビゲーション装置 |
DE102007016887B3 (de) * | 2007-04-10 | 2008-07-31 | Siemens Ag | Verfahren und Vorrichtung zum Betreiben eines Navigationssystems |
US9423996B2 (en) * | 2007-05-03 | 2016-08-23 | Ian Cummings | Vehicle navigation user interface customization methods |
DE102007021772B4 (de) * | 2007-05-09 | 2013-01-24 | Voicecash Ip Gmbh | Digitales Verfahren und Anordnung zur Authentifizierung eines Nutzers einer Datenbasis |
JP4942814B2 (ja) * | 2007-06-05 | 2012-05-30 | 三菱電機株式会社 | 車両用操作装置 |
US20090055178A1 (en) * | 2007-08-23 | 2009-02-26 | Coon Bradley S | System and method of controlling personalized settings in a vehicle |
US20090055180A1 (en) * | 2007-08-23 | 2009-02-26 | Coon Bradley S | System and method for optimizing speech recognition in a vehicle |
DE102007043935A1 (de) * | 2007-09-12 | 2009-03-19 | Volkswagen Ag | Fahrzeugsystem mit Hilfefunktionalität |
US20090083035A1 (en) * | 2007-09-25 | 2009-03-26 | Ritchie Winson Huang | Text pre-processing for text-to-speech generation |
EP2045140B1 (en) * | 2007-10-01 | 2010-01-27 | Harman/Becker Automotive Systems GmbH | Adjustment of vehicular elements by speech control |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8315412B2 (en) * | 2007-10-17 | 2012-11-20 | The Chamberlain Group, Inc. | Method and apparatus to facilitate use of background noise when providing secure access to equipment |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8117242B1 (en) | 2008-01-18 | 2012-02-14 | Boadin Technology, LLC | System, method, and computer program product for performing a search in conjunction with use of an online application |
US8117225B1 (en) | 2008-01-18 | 2012-02-14 | Boadin Technology, LLC | Drill-down system, method, and computer program product for focusing a search |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
JP4524763B2 (ja) * | 2008-03-25 | 2010-08-18 | 株式会社デンソー | 自動車用情報提供システム |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US8386510B2 (en) | 2008-04-15 | 2013-02-26 | International Business Machines Corporation | Flexible connector framework for data feed generation |
US20090271200A1 (en) | 2008-04-23 | 2009-10-29 | Volkswagen Group Of America, Inc. | Speech recognition assembly for acoustically controlling a function of a motor vehicle |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
JP4547721B2 (ja) * | 2008-05-21 | 2010-09-22 | 株式会社デンソー | 自動車用情報提供システム |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US20100036666A1 (en) * | 2008-08-08 | 2010-02-11 | Gm Global Technology Operations, Inc. | Method and system for providing meta data for a work |
JP5653354B2 (ja) * | 2008-08-11 | 2015-01-14 | ティーティーアイ インベンションズ ディー エルエルシー | 車両において、ネットワーク化された携帯機器を使用するためのシステム及び方法 |
JPWO2010018796A1 (ja) * | 2008-08-11 | 2012-01-26 | 旭化成株式会社 | 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法 |
US8078397B1 (en) * | 2008-08-22 | 2011-12-13 | Boadin Technology, LLC | System, method, and computer program product for social networking utilizing a vehicular assembly |
US8190692B1 (en) | 2008-08-22 | 2012-05-29 | Boadin Technology, LLC | Location-based messaging system, method, and computer program product |
US8265862B1 (en) * | 2008-08-22 | 2012-09-11 | Boadin Technology, LLC | System, method, and computer program product for communicating location-related information |
US8073590B1 (en) | 2008-08-22 | 2011-12-06 | Boadin Technology, LLC | System, method, and computer program product for utilizing a communication channel of a mobile device by a vehicular assembly |
US8131458B1 (en) | 2008-08-22 | 2012-03-06 | Boadin Technology, LLC | System, method, and computer program product for instant messaging utilizing a vehicular assembly |
US8165881B2 (en) * | 2008-08-29 | 2012-04-24 | Honda Motor Co., Ltd. | System and method for variable text-to-speech with minimized distraction to operator of an automotive vehicle |
US20100057465A1 (en) * | 2008-09-03 | 2010-03-04 | David Michael Kirsch | Variable text-to-speech for automotive application |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
JP4414470B1 (ja) * | 2008-10-10 | 2010-02-10 | 本田技研工業株式会社 | 車両の故障診断のための基準値の生成 |
KR20110082127A (ko) * | 2008-10-28 | 2011-07-18 | 에어비퀴티 인코포레이티드. | 차량 내 라디오에서 플레이되는 악곡의 구입 |
US8392190B2 (en) | 2008-12-01 | 2013-03-05 | Educational Testing Service | Systems and methods for assessment of non-native spontaneous speech |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
KR101057191B1 (ko) * | 2008-12-30 | 2011-08-16 | 주식회사 하이닉스반도체 | 반도체 소자의 미세 패턴 형성방법 |
US9641678B2 (en) * | 2009-01-29 | 2017-05-02 | Ford Global Technologies, Llc | System and method for interrupting an instructional prompt to signal upcoming input over a wireless communication link |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8788256B2 (en) * | 2009-02-17 | 2014-07-22 | Sony Computer Entertainment Inc. | Multiple language voice recognition |
US20100217482A1 (en) * | 2009-02-20 | 2010-08-26 | Ford Global Technologies, Llc | Vehicle-based system interface for personal navigation device |
US8825222B2 (en) * | 2009-02-27 | 2014-09-02 | Toyota Motor Engineering & Manufacturing North America, Inc. | Remote management of vehicle settings |
US9871916B2 (en) | 2009-03-05 | 2018-01-16 | International Business Machines Corporation | System and methods for providing voice transcription |
US8254993B2 (en) * | 2009-03-06 | 2012-08-28 | Apple Inc. | Remote messaging for mobile communication device and accessory |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US8380513B2 (en) * | 2009-05-19 | 2013-02-19 | International Business Machines Corporation | Improving speech capabilities of a multimodal application |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9183834B2 (en) * | 2009-07-22 | 2015-11-10 | Cisco Technology, Inc. | Speech recognition tuning tool |
US9250097B2 (en) * | 2009-07-23 | 2016-02-02 | Broadcom Corporation | Coupled GPS phone and navigation system |
US20110034128A1 (en) * | 2009-08-05 | 2011-02-10 | Kirsch David M | Mobile Communication Device Linked to In-Vehicle System |
US8838332B2 (en) * | 2009-10-15 | 2014-09-16 | Airbiquity Inc. | Centralized management of motor vehicle software applications and services |
US8942888B2 (en) | 2009-10-15 | 2015-01-27 | Airbiquity Inc. | Extensible scheme for operating vehicle head unit as extended interface for mobile device |
US9002574B2 (en) | 2009-10-15 | 2015-04-07 | Airbiquity Inc. | Mobile integration platform (MIP) integrated handset application proxy (HAP) |
US8831823B2 (en) * | 2009-10-15 | 2014-09-09 | Airbiquity Inc. | Centralized management of motor vehicle software applications and services |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US9045098B2 (en) * | 2009-12-01 | 2015-06-02 | Honda Motor Co., Ltd. | Vocabulary dictionary recompile for in-vehicle audio system |
US20110166862A1 (en) * | 2010-01-04 | 2011-07-07 | Eyal Eshed | System and method for variable automated response to remote verbal input at a mobile device |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8457839B2 (en) * | 2010-01-07 | 2013-06-04 | Ford Global Technologies, Llc | Multi-display vehicle information system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) * | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
DE102010019191A1 (de) * | 2010-05-04 | 2011-11-10 | Volkswagen Ag | Verfahren und Vorrichtung zum Betreiben einer Nutzerschnittstelle |
US8868679B2 (en) | 2010-05-24 | 2014-10-21 | Nuance Communications, Inc. | Systems, methods and articles for providing communications and services via a peer-to-peer network over a data transport link |
US9639688B2 (en) | 2010-05-27 | 2017-05-02 | Ford Global Technologies, Llc | Methods and systems for implementing and enforcing security and resource policies for a vehicle |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
CN103038818B (zh) * | 2010-06-24 | 2016-10-12 | 本田技研工业株式会社 | 在车载语音识别系统与车外语音识别系统之间的通信系统和方法 |
US8731814B2 (en) | 2010-07-02 | 2014-05-20 | Ford Global Technologies, Llc | Multi-modal navigation system and method |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US9846046B2 (en) | 2010-07-30 | 2017-12-19 | Ford Global Technologies, Llc | Vehicle navigation method and system |
US8732697B2 (en) * | 2010-08-04 | 2014-05-20 | Premkumar Jonnala | System, method and apparatus for managing applications on a device |
US8335643B2 (en) | 2010-08-10 | 2012-12-18 | Ford Global Technologies, Llc | Point of interest search, identification, and navigation |
US20120041633A1 (en) | 2010-08-16 | 2012-02-16 | Ford Global Technologies, Llc | Systems and methods for regulating control of a vehicle infotainment system |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US8849552B2 (en) | 2010-09-29 | 2014-09-30 | Ford Global Technologies, Llc | Advanced map information delivery, processing and updating |
US8521424B2 (en) | 2010-09-29 | 2013-08-27 | Ford Global Technologies, Llc | Advanced map information delivery, processing and updating |
US20120089392A1 (en) * | 2010-10-07 | 2012-04-12 | Microsoft Corporation | Speech recognition user interface |
CA2814426A1 (en) * | 2010-10-15 | 2012-04-19 | Intelligent Mechatronic Systems Inc. | Implicit association and polymorphism driven human machine interaction |
US8483958B2 (en) | 2010-12-20 | 2013-07-09 | Ford Global Technologies, Llc | User configurable onboard navigation system crossroad presentation |
US8559932B2 (en) | 2010-12-20 | 2013-10-15 | Ford Global Technologies, Llc | Selective alert processing |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US9452735B2 (en) | 2011-02-10 | 2016-09-27 | Ford Global Technologies, Llc | System and method for controlling a restricted mode in a vehicle |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US20120310642A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8788113B2 (en) | 2011-06-13 | 2014-07-22 | Ford Global Technologies, Llc | Vehicle driver advisory system and method |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
KR101933450B1 (ko) * | 2011-07-05 | 2018-12-31 | 삼성전자주식회사 | 차량용 헤드 유닛에 표시되는 컨텐츠를 동적으로 변경하는 방법 및 이를 위한 이동 단말기 |
US8688321B2 (en) | 2011-07-11 | 2014-04-01 | Ford Global Technologies, Llc | Traffic density estimation |
US8849519B2 (en) | 2011-08-09 | 2014-09-30 | Ford Global Technologies, Llc | Method and apparatus for vehicle hardware theft prevention |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8948698B2 (en) | 2011-09-02 | 2015-02-03 | Toyota Motor Engineering & Manufacturing North America, Inc. | Vehicle multimedia head unit with two bluetooth antennas and two receivers |
DE102011112626B4 (de) * | 2011-09-06 | 2014-09-04 | Daimler Ag | Automatisiertes Kopplungsverfahren eines mobilen Kommunikationsendgeräts mit einer zentralen Recheneinheit eines Kraftfahrzeugs |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US8438023B1 (en) * | 2011-09-30 | 2013-05-07 | Google Inc. | Warning a user when voice input to a device is likely to fail because of background or other noise |
CA3023918C (en) * | 2011-09-30 | 2022-11-29 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
CN103917848B (zh) * | 2011-11-10 | 2016-09-28 | 三菱电机株式会社 | 导航装置及方法 |
US8838385B2 (en) | 2011-12-20 | 2014-09-16 | Ford Global Technologies, Llc | Method and apparatus for vehicle routing |
CN104011735B (zh) * | 2011-12-26 | 2018-03-30 | 英特尔公司 | 基于车辆的对乘员音频和可视输入的确定 |
CN103187053B (zh) * | 2011-12-31 | 2016-03-30 | 联想(北京)有限公司 | 输入方法和电子设备 |
DE102012202391A1 (de) * | 2012-02-16 | 2013-08-22 | Continental Automotive Gmbh | Verfahren und Einrichtung zur Phonetisierung von textenthaltenden Datensätzen |
DE102012202407B4 (de) * | 2012-02-16 | 2018-10-11 | Continental Automotive Gmbh | Verfahren zum Phonetisieren einer Datenliste und sprachgesteuerte Benutzerschnittstelle |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9569403B2 (en) | 2012-05-03 | 2017-02-14 | Ford Global Technologies, Llc | Methods and systems for authenticating one or more users of a vehicle communications and information system |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9104538B2 (en) | 2012-06-08 | 2015-08-11 | Airbiquity Inc. | Assessment of electronic sensor data to remotely identify a motor vehicle and monitor driver behavior |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
KR101972955B1 (ko) * | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US8831585B2 (en) | 2012-08-31 | 2014-09-09 | Nuance Communications, Inc. | Systems, methods and articles for a communications device providing communications and services involving automobile head units |
US20140068713A1 (en) * | 2012-08-31 | 2014-03-06 | Tweddle Group, Inc. | Systems, methods and articles for providing communications and services involving automobile head units and user preferences |
US8799360B2 (en) * | 2012-08-31 | 2014-08-05 | Tweedle Group, Inc. | Systems, methods and articles for a server providing communications and services involving automobile head units |
US8909153B2 (en) * | 2012-09-05 | 2014-12-09 | GM Global Technology Operations LLC | Vehicle communications using a mobile device |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
DE102012019063A1 (de) * | 2012-09-28 | 2014-04-03 | Audi Ag | Verfahren und System zum Bereitstellen von Daten in einem Kraftwagen |
US10381002B2 (en) | 2012-10-30 | 2019-08-13 | Google Technology Holdings LLC | Voice control user interface during low-power mode |
US10373615B2 (en) | 2012-10-30 | 2019-08-06 | Google Technology Holdings LLC | Voice control user interface during low power mode |
US9691377B2 (en) | 2013-07-23 | 2017-06-27 | Google Technology Holdings LLC | Method and device for voice recognition training |
US9584642B2 (en) | 2013-03-12 | 2017-02-28 | Google Technology Holdings LLC | Apparatus with adaptive acoustic echo control for speakerphone mode |
US10304465B2 (en) | 2012-10-30 | 2019-05-28 | Google Technology Holdings LLC | Voice control user interface for low power mode |
US9601111B2 (en) * | 2012-11-13 | 2017-03-21 | GM Global Technology Operations LLC | Methods and systems for adapting speech systems |
US10041798B2 (en) | 2012-12-06 | 2018-08-07 | Qualcomm Incorporated | Determination of position, velocity and/or heading by simultaneous use of on-device and on-vehicle information |
DE102012223314A1 (de) * | 2012-12-17 | 2014-06-18 | Robert Bosch Gmbh | Einrichtung und Verfahren zur automatischen Anpassung der Lautstärke von Geräuschen in einem Fahrzeuginnenraum |
DE102012223320A1 (de) * | 2012-12-17 | 2014-06-18 | Robert Bosch Gmbh | Einrichtung und Verfahren zur automatischen Anpassung der Lautstärke von Geräuschen in einem Fahrzeuginnenraum |
CN104919833B (zh) * | 2012-12-20 | 2019-11-08 | 爱尔比奎特公司 | 高效头单元通信集成 |
KR102112742B1 (ko) * | 2013-01-22 | 2020-05-19 | 삼성전자주식회사 | 전자장치 및 그 음성 처리 방법 |
KR20150104615A (ko) | 2013-02-07 | 2015-09-15 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9713963B2 (en) | 2013-02-18 | 2017-07-25 | Ford Global Technologies, Llc | Method and apparatus for route completion likelihood display |
US9688246B2 (en) | 2013-02-25 | 2017-06-27 | Ford Global Technologies, Llc | Method and apparatus for in-vehicle alarm activation and response handling |
US9863777B2 (en) | 2013-02-25 | 2018-01-09 | Ford Global Technologies, Llc | Method and apparatus for automatic estimated time of arrival calculation and provision |
US8947221B2 (en) | 2013-02-26 | 2015-02-03 | Ford Global Technologies, Llc | Method and apparatus for tracking device connection and state change |
US8977479B2 (en) | 2013-03-12 | 2015-03-10 | Ford Global Technologies, Llc | Method and apparatus for determining traffic conditions |
US9047774B2 (en) | 2013-03-12 | 2015-06-02 | Ford Global Technologies, Llc | Method and apparatus for crowd-sourced traffic reporting |
US9141583B2 (en) | 2013-03-13 | 2015-09-22 | Ford Global Technologies, Llc | Method and system for supervising information communication based on occupant and vehicle environment |
US9874452B2 (en) | 2013-03-14 | 2018-01-23 | Ford Global Technologies, Llc | Method and apparatus for enhanced driving experience including dynamic POI identification |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US10424292B1 (en) * | 2013-03-14 | 2019-09-24 | Amazon Technologies, Inc. | System for recognizing and responding to environmental noises |
US9002536B2 (en) | 2013-03-14 | 2015-04-07 | Ford Global Technologies, Llc | Key fob security copy to a mobile phone |
US8909212B2 (en) | 2013-03-14 | 2014-12-09 | Ford Global Technologies, Llc | Method and apparatus for disclaimer presentation and confirmation |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US8862320B2 (en) | 2013-03-14 | 2014-10-14 | Ford Global Technologies, Llc | Method and apparatus for ambient lighting incoming message alert |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
CN105144133B (zh) | 2013-03-15 | 2020-11-20 | 苹果公司 | 对中断进行上下文相关处理 |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
CN110096712B (zh) | 2013-03-15 | 2023-06-20 | 苹果公司 | 通过智能数字助理的用户培训 |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
CN105027197B (zh) | 2013-03-15 | 2018-12-14 | 苹果公司 | 训练至少部分语音命令系统 |
US20140289624A1 (en) * | 2013-03-22 | 2014-09-25 | Hyundai Mobis Co.,Ltd. | Multimedia system and method for interfacing between multimedia unit and audio head unit |
CN104078045B (zh) * | 2013-03-26 | 2017-05-24 | 联想(北京)有限公司 | 一种识别的方法及电子设备 |
US9619645B2 (en) * | 2013-04-04 | 2017-04-11 | Cypress Semiconductor Corporation | Authentication for recognition systems |
US20140358538A1 (en) * | 2013-05-28 | 2014-12-04 | GM Global Technology Operations LLC | Methods and systems for shaping dialog of speech systems |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
DE102013216427B4 (de) * | 2013-08-20 | 2023-02-02 | Bayerische Motoren Werke Aktiengesellschaft | Vorrichtung und Verfahren zur fortbewegungsmittelbasierten Sprachverarbeitung |
US20140149216A1 (en) * | 2013-09-24 | 2014-05-29 | Peter McGie | Voice Recognizing Digital Messageboard System and Method |
US8976009B2 (en) * | 2013-09-24 | 2015-03-10 | Peter McGie | Voice recognizing digital messageboard system and method |
US9524717B2 (en) * | 2013-10-15 | 2016-12-20 | Trevo Solutions Group LLC | System, method, and computer program for integrating voice-to-text capability into call systems |
US8768712B1 (en) | 2013-12-04 | 2014-07-01 | Google Inc. | Initiating actions based on partial hotwords |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US10373611B2 (en) | 2014-01-03 | 2019-08-06 | Gracenote, Inc. | Modification of electronic system operation based on acoustic ambience classification |
US9193312B2 (en) * | 2014-02-20 | 2015-11-24 | Ford Global Technologies, Llc | Occupant communication system and control method |
US9911408B2 (en) * | 2014-03-03 | 2018-03-06 | General Motors Llc | Dynamic speech system tuning |
WO2015151157A1 (ja) * | 2014-03-31 | 2015-10-08 | 三菱電機株式会社 | 意図理解装置および方法 |
US9633657B2 (en) * | 2014-04-02 | 2017-04-25 | Speakread A/S | Systems and methods for supporting hearing impaired users |
US20150294639A1 (en) * | 2014-04-14 | 2015-10-15 | Sony Corporation | Method and system for switching a mode of an electronic device |
US20150310851A1 (en) * | 2014-04-24 | 2015-10-29 | Ford Global Technologies, Llc | Method and Apparatus for Extra-Vehicular Voice Recognition Training Including Vehicular Updating |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10236016B1 (en) * | 2014-06-16 | 2019-03-19 | Amazon Technologies, Inc. | Peripheral-based selection of audio sources |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
JP2016024212A (ja) * | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US20160171635A1 (en) * | 2014-12-15 | 2016-06-16 | Thomas A. Senzee | Automated Contract Terms Negotiating System and Method |
JP6501217B2 (ja) * | 2015-02-16 | 2019-04-17 | アルパイン株式会社 | 情報端末システム |
US9992317B2 (en) * | 2015-02-16 | 2018-06-05 | Ford Global Technologies, Llc | System and method of facilitating communication between a mobile device and vehicle computer system |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9544412B2 (en) * | 2015-03-09 | 2017-01-10 | Ford Global Technologies, Llc | Voice profile-based in-vehicle infotainment identity identification |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US10249123B2 (en) | 2015-04-09 | 2019-04-02 | Ford Global Technologies, Llc | Systems and methods for mobile phone key fob management |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160379640A1 (en) * | 2015-06-24 | 2016-12-29 | Honeywell International Inc. | System and method for aircraft voice-to-text communication with message validation |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
KR20170033722A (ko) * | 2015-09-17 | 2017-03-27 | 삼성전자주식회사 | 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치 |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10008201B2 (en) * | 2015-09-28 | 2018-06-26 | GM Global Technology Operations LLC | Streamlined navigational speech recognition |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10006777B2 (en) * | 2015-10-02 | 2018-06-26 | GM Global Technology Operations LLC | Recognizing address and point of interest speech received at a vehicle |
US10522141B2 (en) * | 2015-10-28 | 2019-12-31 | Ford Global Technologies, Llc | Vehicle voice recognition including a wearable device |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10140976B2 (en) * | 2015-12-14 | 2018-11-27 | International Business Machines Corporation | Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10229672B1 (en) | 2015-12-31 | 2019-03-12 | Google Llc | Training acoustic models using connectionist temporal classification |
JP2017138476A (ja) * | 2016-02-03 | 2017-08-10 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
EP3232413B1 (en) * | 2016-04-15 | 2021-11-24 | Volvo Car Corporation | Method and system for enabling a vehicle occupant to report a hazard associated with the surroundings of the vehicle |
US9734744B1 (en) * | 2016-04-27 | 2017-08-15 | Joan Mercior | Self-reacting message board |
US20170337900A1 (en) * | 2016-05-17 | 2017-11-23 | Google Inc. | Wireless user interface projection for vehicles |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US10163437B1 (en) * | 2016-06-02 | 2018-12-25 | Amazon Technologies, Inc. | Training models using voice tags |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10283138B2 (en) | 2016-10-03 | 2019-05-07 | Google Llc | Noise mitigation for a voice interface device |
CN210129283U (zh) | 2016-10-05 | 2020-03-06 | 金泰克斯公司 | 基于车辆的远程控制系统 |
US10462567B2 (en) | 2016-10-11 | 2019-10-29 | Ford Global Technologies, Llc | Responding to HVAC-induced vehicle microphone buffeting |
CN108153507A (zh) * | 2016-12-02 | 2018-06-12 | 上海博泰悦臻电子设备制造有限公司 | 一种语音交互方法、系统及一种车机 |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US20180330725A1 (en) * | 2017-05-09 | 2018-11-15 | Microsoft Technology Licensing, Llc | Intent based speech recognition priming |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
JP6883471B2 (ja) * | 2017-05-11 | 2021-06-09 | オリンパス株式会社 | 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置 |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
EP3577646B1 (en) | 2017-05-16 | 2021-07-21 | Google LLC | Handling calls on a shared speech-enabled device |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
KR102371313B1 (ko) * | 2017-05-29 | 2022-03-08 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법 |
KR102332826B1 (ko) * | 2017-05-30 | 2021-11-30 | 현대자동차주식회사 | 차량용 음성 인식 장치, 상기 차량용 음성 인식 장치를 포함하는 차량, 차량용 음성 인식 시스템 및 상기 차량용 음성 인식 장치의 제어 방법 |
US10186260B2 (en) * | 2017-05-31 | 2019-01-22 | Ford Global Technologies, Llc | Systems and methods for vehicle automatic speech recognition error detection |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
KR102367053B1 (ko) * | 2017-07-13 | 2022-02-24 | 삼성전자주식회사 | 외부 전자 장치와 통신을 수행하기 위한 전자 장치 |
US11205421B2 (en) * | 2017-07-28 | 2021-12-21 | Cerence Operating Company | Selection system and method |
US10525921B2 (en) | 2017-08-10 | 2020-01-07 | Ford Global Technologies, Llc | Monitoring windshield vibrations for vehicle collision detection |
US10706840B2 (en) | 2017-08-18 | 2020-07-07 | Google Llc | Encoder-decoder models for sequence to sequence mapping |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10562449B2 (en) | 2017-09-25 | 2020-02-18 | Ford Global Technologies, Llc | Accelerometer-based external sound monitoring during low speed maneuvers |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10479300B2 (en) | 2017-10-06 | 2019-11-19 | Ford Global Technologies, Llc | Monitoring of vehicle window vibrations for voice-command recognition |
KR102552486B1 (ko) * | 2017-11-02 | 2023-07-06 | 현대자동차주식회사 | 차량의 음성인식 장치 및 방법 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
CN108132805B (zh) * | 2017-12-20 | 2022-01-04 | 深圳Tcl新技术有限公司 | 语音交互方法、装置及计算机可读存储介质 |
SE541396C2 (en) * | 2017-12-27 | 2019-09-10 | Scania Cv Ab | Method and control unit for communicating with a vehicle |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
KR102066451B1 (ko) * | 2018-02-02 | 2020-01-15 | 주식회사 오비고 | 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치 |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
WO2019182865A1 (en) * | 2018-03-19 | 2019-09-26 | Geoffrey Langos | Voice activated visual communication system |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10831442B2 (en) * | 2018-10-19 | 2020-11-10 | International Business Machines Corporation | Digital assistant user interface amalgamation |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11455982B2 (en) * | 2019-01-07 | 2022-09-27 | Cerence Operating Company | Contextual utterance resolution in multimodal systems |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
JP2020160144A (ja) * | 2019-03-25 | 2020-10-01 | 株式会社Subaru | 音声認識装置 |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11438452B1 (en) | 2019-08-09 | 2022-09-06 | Apple Inc. | Propagating context information in a privacy preserving manner |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11170765B2 (en) * | 2020-01-24 | 2021-11-09 | Intuit Inc. | Contextual multi-channel speech to text |
US11984123B2 (en) * | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
CN112509585A (zh) * | 2020-12-22 | 2021-03-16 | 北京百度网讯科技有限公司 | 车载设备的语音处理方法、装置、设备及存储介质 |
US20230306965A1 (en) * | 2022-02-02 | 2023-09-28 | Google Llc | Speech Recognition Using Word or Phoneme Time Markers Based on User Input |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5212764A (en) * | 1989-04-19 | 1993-05-18 | Ricoh Company, Ltd. | Noise eliminating apparatus and speech recognition apparatus using the same |
FI97919C (fi) * | 1992-06-05 | 1997-03-10 | Nokia Mobile Phones Ltd | Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten |
US5452397A (en) * | 1992-12-11 | 1995-09-19 | Texas Instruments Incorporated | Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list |
IN184794B (ja) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
US6073101A (en) * | 1996-02-02 | 2000-06-06 | International Business Machines Corporation | Text independent speaker recognition for transparent command ambiguity resolution and continuous access control |
US6707421B1 (en) * | 1997-08-19 | 2004-03-16 | Siemens Vdo Automotive Corporation | Driver information system |
WO1999014928A1 (en) | 1997-09-15 | 1999-03-25 | Intellivoice Communications, Inc. | Simplified training of voice dialing systems |
KR100277105B1 (ko) * | 1998-02-27 | 2001-01-15 | 윤종용 | 음성 인식 데이터 결정 장치 및 방법 |
EP1054387A3 (en) | 1999-05-21 | 2001-11-14 | Winbond Electronics Corporation | Method and apparatus for activating voice controlled devices |
DE60010080T3 (de) * | 1999-06-01 | 2009-10-08 | Continental Automotive Systems US, Inc., Auburn Hills | Tragbares informationsgerät für fahrer |
JP3990075B2 (ja) * | 1999-06-30 | 2007-10-10 | 株式会社東芝 | 音声認識支援方法及び音声認識システム |
US6594629B1 (en) * | 1999-08-06 | 2003-07-15 | International Business Machines Corporation | Methods and apparatus for audio-visual speech detection and recognition |
US6587824B1 (en) * | 2000-05-04 | 2003-07-01 | Visteon Global Technologies, Inc. | Selective speaker adaptation for an in-vehicle speech recognition system |
DE60133902D1 (ja) * | 2000-07-28 | 2008-06-19 | Siemens Vdo Automotive Corp | |
US7203651B2 (en) * | 2000-12-07 | 2007-04-10 | Art-Advanced Recognition Technologies, Ltd. | Voice control system with multiple voice recognition engines |
US20020152264A1 (en) * | 2001-02-07 | 2002-10-17 | Zandiant Technologies, Inc. | Personal vehicular internet appliance |
US6996531B2 (en) | 2001-03-30 | 2006-02-07 | Comverse Ltd. | Automated database assistance using a telephone for a speech based or text based multimedia communication mode |
AU2002314933A1 (en) * | 2001-05-30 | 2002-12-09 | Cameronsound, Inc. | Language independent and voice operated information management system |
GB0113587D0 (en) * | 2001-06-04 | 2001-07-25 | Hewlett Packard Co | Speech synthesis apparatus |
GB0113581D0 (en) * | 2001-06-04 | 2001-07-25 | Hewlett Packard Co | Speech synthesis apparatus |
JP2003121164A (ja) * | 2001-06-29 | 2003-04-23 | Spencer Stephens | 位置識別子を受けるナビゲータ並びに関連する装置及び方法 |
US7324947B2 (en) | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
CN1599896B (zh) * | 2001-12-06 | 2013-03-20 | 美国丰田汽车销售公司 | 选择并播放多媒体文件的方法和多媒体播放器 |
JP3826032B2 (ja) * | 2001-12-28 | 2006-09-27 | 株式会社東芝 | 音声認識装置、音声認識方法及び音声認識プログラム |
US20040064306A1 (en) | 2002-09-30 | 2004-04-01 | Wolf Peter P. | Voice activated music playback system |
EP1665092A4 (en) * | 2003-08-21 | 2006-11-22 | Idilia Inc | INTERNET SEARCH USING SEMANTIC DISAMBIGUING AND EXPANSION |
US7801283B2 (en) * | 2003-12-22 | 2010-09-21 | Lear Corporation | Method of operating vehicular, hands-free telephone system |
US7373248B2 (en) * | 2004-09-10 | 2008-05-13 | Atx Group, Inc. | Systems and methods for off-board voice-automated vehicle navigation |
US7826945B2 (en) * | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
-
2005
- 2005-07-01 US US11/173,736 patent/US7826945B2/en not_active Expired - Fee Related
-
2006
- 2006-06-26 EP EP06116015A patent/EP1739546A3/en not_active Withdrawn
- 2006-07-03 CN CNA2006101031106A patent/CN1920946A/zh active Pending
- 2006-07-03 JP JP2006183890A patent/JP2007011380A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008275987A (ja) * | 2007-05-01 | 2008-11-13 | Yamaha Corp | 音声認識装置および会議システム |
JP2009210703A (ja) * | 2008-03-03 | 2009-09-17 | Alpine Electronics Inc | 音声認識装置 |
WO2009130840A1 (ja) * | 2008-04-23 | 2009-10-29 | 三菱電機株式会社 | 車載情報システム |
JP2012529236A (ja) * | 2009-06-02 | 2012-11-15 | フォード グローバル テクノロジーズ、リミテッド ライアビリティ カンパニー | 車両内において電子カレンダー・アプリケーションのハンズフリー操作を実行するシステム及び方法 |
JP2017512433A (ja) * | 2014-02-28 | 2017-05-18 | ボーズ・コーポレーションBose Corporation | 音源の直接選択 |
KR102272080B1 (ko) * | 2014-11-18 | 2021-07-02 | 현대모비스 주식회사 | 차량용 avn 시스템의 모바일 단말 등록 제어 장치 및 방법 |
KR20160059182A (ko) * | 2014-11-18 | 2016-05-26 | 현대모비스 주식회사 | 차량용 avn 시스템의 모바일 단말 등록 제어 장치 및 방법 |
US10063683B2 (en) | 2014-12-24 | 2018-08-28 | Hyundai Motor Company | In-vehicle multimedia system connected to external device and control method thereof |
CN110800044A (zh) * | 2017-09-08 | 2020-02-14 | 亚马逊技术股份有限公司 | 用于语音助手系统的话语权限管理 |
JP2020525903A (ja) * | 2017-09-08 | 2020-08-27 | アマゾン テクノロジーズ インコーポレイテッド | 音声アシスタントシステムのための発話による特権の管理 |
CN110800044B (zh) * | 2017-09-08 | 2024-04-05 | 亚马逊技术股份有限公司 | 用于语音助手系统的话语权限管理 |
JP2020003969A (ja) * | 2018-06-27 | 2020-01-09 | 富士ゼロックス株式会社 | 画像出力システム、サーバ装置、端末装置、画像出力装置及びプログラム |
JP7172176B2 (ja) | 2018-06-27 | 2022-11-16 | 富士フイルムビジネスイノベーション株式会社 | 画像出力システム、サーバ装置及びプログラム |
JP2021182217A (ja) * | 2020-05-18 | 2021-11-25 | トヨタ自動車株式会社 | エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム |
JP7310705B2 (ja) | 2020-05-18 | 2023-07-19 | トヨタ自動車株式会社 | エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1739546A2 (en) | 2007-01-03 |
US7826945B2 (en) | 2010-11-02 |
US20070005206A1 (en) | 2007-01-04 |
CN1920946A (zh) | 2007-02-28 |
EP1739546A3 (en) | 2008-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7826945B2 (en) | Automobile speech-recognition interface | |
US9558745B2 (en) | Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same | |
US11170776B1 (en) | Speech-processing system | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
EP2259252B1 (en) | Speech recognition method for selecting a combination of list elements via a speech input | |
US9805722B2 (en) | Interactive speech recognition system | |
US9640175B2 (en) | Pronunciation learning from user correction | |
JP4292646B2 (ja) | ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体 | |
US8438028B2 (en) | Nametag confusability determination | |
US9202465B2 (en) | Speech recognition dependent on text message content | |
US20120253823A1 (en) | Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing | |
US20200184967A1 (en) | Speech processing system | |
US20080059188A1 (en) | Natural Language Interface Control System | |
US20050273337A1 (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
US9997155B2 (en) | Adapting a speech system to user pronunciation | |
US9911408B2 (en) | Dynamic speech system tuning | |
WO2008072413A1 (ja) | 音声認識装置 | |
US11355112B1 (en) | Speech-processing system | |
CN116964662A (zh) | 在对话期间文本转语音中的即时学习 | |
WO2012174515A1 (en) | Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same | |
US11735178B1 (en) | Speech-processing system | |
JP7274901B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JPH11125533A (ja) | ナビゲーション装置及びナビゲート方法 | |
KR20220129366A (ko) | 음성 인식 시스템 및 그 제어 방법 | |
CN112241628A (zh) | 智能体装置、智能体装置的控制方法及存储介质 |