JP2004355629A - 高度対話型インターフェースに対する理解同期意味オブジェクト - Google Patents
高度対話型インターフェースに対する理解同期意味オブジェクト Download PDFInfo
- Publication number
- JP2004355629A JP2004355629A JP2004158359A JP2004158359A JP2004355629A JP 2004355629 A JP2004355629 A JP 2004355629A JP 2004158359 A JP2004158359 A JP 2004158359A JP 2004158359 A JP2004158359 A JP 2004158359A JP 2004355629 A JP2004355629 A JP 2004355629A
- Authority
- JP
- Japan
- Prior art keywords
- computer
- input
- user
- implemented method
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001360 synchronised effect Effects 0.000 title claims description 3
- 230000002452 interceptive effect Effects 0.000 title description 6
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000012545 processing Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 15
- 230000000007 visual effect Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 7
- 238000004883 computer application Methods 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 3
- 150000003839 salts Chemical class 0.000 claims 2
- 238000004891 communication Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 230000003993 interaction Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 7
- 238000013515 script Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 238000013523 data management Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000005055 memory storage Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 241001422033 Thestylus Species 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/197—Probabilistic grammars, e.g. word n-grams
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】 意味構文解析は、ユーザに即座に折り返し報告される結果により評価することができる。従来はシステムの番に実行されるタスクが、今度は、ユーザの番の最中に実行され、会話が有する交代の特質から大幅に離脱することができる。
【選択図】 図1
Description
LCFG <dictation max="inf"/> RCFG
のように、XML<dictation>タグとともに前終端記号を使用して表すことができ、LCFGおよびRCFGは、それぞれ、埋め込まれているNグラムの左および右コンテキストを表す。探索プロセスは、<dictation>タグをトークンとして扱い、正規非終端記号を入力したかのようにNグラムに展開する。タグの最大属性は、Nグラムにより消費可能な単語の最大個数を指定する。Nグラムの内側の単語列の確率を、バックオフNグラム(backoff N−gram)をPCFGで補間することにより計算する、つまり、
<prompt ...> 音声合成の構成およびプロンプト再生用
<listen ...> 音声認識器の構成、認識実行および後処理、および録音用
<dtmf ...> DTMFの構成および制御用
<smex ...> プラットフォームのコンポーネントとの汎用通信用 リッスン およびdtmfオブジェクトはさらに、文法およびバインディングコントロール(binding controls)も含む。
<grammar ...> 入力文法リソースを指定する
<bind ...> 認識結果の処理用
リッスン要素は、3つの認識モードを区別する「mode」属性を備えることができ、これにより、認識サーバ(例えば、204)に結果の返却方法および返却時期を指令することができる。結果を返すということは、適宜「onReco」イベントを供給するか、または「bind」要素をアクティブにすることを意味する。
12 音声インターフェースモジュール
14 音声認識および理解モジュール
16 データ表現モジュール
18 データストア
20 出力
29 マイク
30 データ管理モバイル装置
32 筐体
33 ペン
34 表示装置
37 アナログデジタル(A/D)コンバータ
50 中央処理装置(CPU)
52 無線トランシーバ
54 不揮発性読み書きランダムアクセスメモリストア
58 読み取り専用メモリ(ROM)
60 通信インターフェース
80 電話
82 表示装置
84 キーパッド
120 コンピュータ
140 処理ユニット
141 システムバス
150 システムメモリ
151 ROM
153 基本入出力システム
154 オペレーティングシステム
155 アプリケーションプログラム
156 その他のプログラムモジュール
157 プログラムデータ
161 ハードディスクドライブ
164 オペレーティングシステム
165 アプリケーションプログラム
166 その他のプログラムモジュール
167 プログラムデータ
171 磁気ディスクドライブ
172 取り外し可能な不揮発性磁気ディスク
175 光ディスクドライブ
176 取り外し可能な不揮発性光ディスク
180 ユーザ入力インターフェース
181 ポインティング装置
182 キーボード
183 マイク
184 モニタ
185 ビデオインターフェース
186 プリンタ
187 スピーカ
188 出力周辺インターフェース
191 ローカルエリアネットワーク(LAN)
192 モデム
193 ワイドエリアネットワーク(WAN)
194 リモートコンピュータ
200 アーキテクチャ
202 Webサーバ
204 リモート認識サーバ
207 専用回線
208 有線または無線電話ネットワーク
210 第三者ゲートウェイ
211 認識器
212 電話音声ブラウザ
214 メディアサーバ
216 音声ブラウザ
306 認識エンジン
310 言語モデル
Claims (24)
- コンピュータシステムと相互作用するコンピュータ実行方法であって、
ユーザから入力を受け取り、処理のため前記入力を捕捉するステップと、
前記入力に基づいて認識を実行し、前記入力の第1の部分に関係する情報を確認し、コンピュータアプリケーションにより処理される形式のデータを備え、認識済みの入力および前記第1の部分に対する意味情報にしたがった意味オブジェクトを出力することを含み、認識の実行および前記意味オブジェクトの出力は、前記入力の後続の部分について捕捉が続いている間に実行されるステップと
を含むことを特徴とするコンピュータ実行方法。 - 言語モデルを確立し、認識および理解を実行し、前記言語モデルは、コンピュータアプリケーションにより処理される形式で、受信した入力にしたがって、データを供給し、前記受信した入力の意味情報を供給するように適合されるステップをさらに含むことを特徴とする請求項1に記載のコンピュータ実行方法。
- 前記言語モデルは、Nグラム言語モデルおよび文脈自由文法言語モデルの組合せを含むことを特徴とする請求項2に記載のコンピュータ実行方法。
- 言語モデルを確立することは、認識に使用される複数の文法を定義することを含むことを特徴とする請求項3に記載のコンピュータ実行方法。
- 言語モデルを確立することは、アプリケーションプログラムインターフェースを使用して認識に使用される前記複数の文法を定義することを含むことを特徴とする請求項4に記載のコンピュータにより実行方法。
- 言語モデルを確立することは、SALTを使用することを含むことを特徴とする請求項5に記載のコンピュータ実行方法。
- 前記入力を処理することは、複数のモードでSALTのリッスンオブジェクトを実行することを含むことを特徴とする請求項6に記載のコンピュータ実行方法。
- 前記意味オブジェクトを出力することは、テキスト形式でデータを出力することを含むことを特徴とする請求項1または2に記載のコンピュータ実行方法。
- 入力を受け取り、捕捉することは、前記ユーザから可聴音入力を受け取り、捕捉することを含むことを特徴とする請求項8に記載のコンピュータ実行方法。
- 入力を受け取り、捕捉することは、前記ユーザから音声入力を受け取り、捕捉することを含むことを特徴とする請求項9に記載のコンピュータ実行方法。
- 入力を受け取り、捕捉することは、前記ユーザから手書き入力を受け取り、捕捉することを含むことを特徴とする請求項1または2に記載のコンピュータ実行方法。
- 入力を受け取り、捕捉することは、前記ユーザから視覚的入力を受け取り、捕捉することを含むことを特徴とする請求項1または2に記載のコンピュータ実行方法。
- 前記ユーザが前記入力を供給している間に前記ユーザへの情報を表現し、前記情報は、前記受け取った意味オブジェクトの関数であるステップをさらに含むことを特徴とする請求項1または2に記載のコンピュータ実行方法。
- 情報を表現することは、前記意味オブジェクトの前記意味情報の関数として情報を表現することにより、受け取った内容を確認することを含むことを特徴とする請求項13に記載のコンピュータ実行方法。
- 情報を表現することは、認識された前記入力にしたがって、前記データの関数として情報を表現することを含むことを特徴とする請求項14に記載のコンピュータ実行方法。
- 情報を表現することは、受け取った前記入力にしたがって、前記データの関数として前記ユーザに対してオプションを表現することを含むことを特徴とする請求項15に記載のコンピュータ実行方法。
- 情報を表現することは、受け取った前記入力にしたがって、前記データの関数として前記ユーザに対して複数のオプションを表現することを含むことを特徴とする請求項16に記載のコンピュータ実行方法。
- 情報を表現することは、前記ユーザに可聴音プロンプトを与えることを含むことを特徴とする請求項13に記載のコンピュータ実行方法。
- 情報を表現することは、前記ユーザに視覚的指示を与えることを含むことを特徴とする請求項18に記載のコンピュータ実行方法。
- 情報を表現することは、前記ユーザに同期した可聴音および視覚的指示を与えることを含むことを特徴とする請求項19に記載のコンピュータ実行方法。
- コンピュータにより読み取ることができる命令を含むコンピュータ可読媒体であって、命令が実行されるとこの命令によりコンピュータは請求項1から20のいずれか1に記載の方法を実行することを特徴とするコンピュータ可読媒体。
- 請求項1から21のいずれか1に記載の方法を実行するように適合されていることを特徴とするシステム。
- コンピューティング装置により読み取ることが可能な命令を含むコンピュータ可読媒体であって、
ユーザから入力を受け取り、処理のため前記入力を捕捉するように適合され、前記入力の認識を実行し、前記入力の第1の部分に関係する意味情報を確認するように適合され、コンピュータアプリケーションにより処理される形式のデータを備え、認識済みの前記入力および前記第1の部分に対する意味情報にしたがった意味オブジェクトを出力するように適合されたモジュールを含み、認識の実行および前記意味オブジェクトの出力は、前記入力の後続の部分について捕捉が続いている間に実行されることを特徴とするコンピュータ可読媒体。 - コンピューティング装置により読み取ることが可能な命令を含むコンピュータ可読媒体であって、
選択されたタスクを実行にするように構成され、ユーザの入力に応じて同期して意味オブジェクトを受け取るように適合されたモジュールを含み、各意味オブジェクトはコンピュータアプリケーションにより、前記ユーザからの入力の一部と前記ユーザからの入力の前記一部に関係する意味情報に応じて処理される形式のデータを含み、前記モジュールは前記意味オブジェクトを同期して処理することに応じてアクションを実行するように適合されていることを特徴とするコンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/447,399 US8301436B2 (en) | 2003-05-29 | 2003-05-29 | Semantic object synchronous understanding for highly interactive interface |
US10/447,399 | 2003-05-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004355629A true JP2004355629A (ja) | 2004-12-16 |
JP4768969B2 JP4768969B2 (ja) | 2011-09-07 |
Family
ID=33131588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004158359A Expired - Lifetime JP4768969B2 (ja) | 2003-05-29 | 2004-05-27 | 高度対話型インターフェースに対する理解同期意味オブジェクト |
Country Status (13)
Country | Link |
---|---|
US (1) | US8301436B2 (ja) |
EP (1) | EP1482479B1 (ja) |
JP (1) | JP4768969B2 (ja) |
KR (1) | KR101066741B1 (ja) |
CN (1) | CN100424632C (ja) |
AU (1) | AU2004201993A1 (ja) |
BR (1) | BRPI0401847A (ja) |
CA (1) | CA2467134C (ja) |
HK (1) | HK1070730A1 (ja) |
MX (1) | MXPA04005121A (ja) |
RU (1) | RU2352979C2 (ja) |
TW (1) | TW200513884A (ja) |
ZA (1) | ZA200403493B (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011046127A1 (ja) * | 2009-10-14 | 2011-04-21 | 日本電気株式会社 | データ収集システム、携帯端末、シール及びデータ収集方法 |
WO2012017525A1 (ja) * | 2010-08-04 | 2012-02-09 | パイオニア株式会社 | 処理装置及びコマンド入力支援方法 |
JP2018523143A (ja) * | 2015-05-27 | 2018-08-16 | グーグル エルエルシー | 音声対応電子デバイスにおける選択的オフライン対応の音声アクションのためのデータのローカル維持 |
US10482883B2 (en) | 2015-05-27 | 2019-11-19 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
Families Citing this family (182)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US20080313282A1 (en) | 2002-09-10 | 2008-12-18 | Warila Bruce W | User interface, operating system and architecture |
US8301436B2 (en) | 2003-05-29 | 2012-10-30 | Microsoft Corporation | Semantic object synchronous understanding for highly interactive interface |
US7555533B2 (en) * | 2003-10-15 | 2009-06-30 | Harman Becker Automotive Systems Gmbh | System for communicating information from a server via a mobile communication device |
DE602004010054T2 (de) * | 2004-01-19 | 2008-03-06 | Harman Becker Automotive Systems Gmbh | Betätigung eines Sprachdialogsystems |
DE602004014893D1 (de) | 2004-01-29 | 2008-08-21 | Daimler Ag | Multimodale Dateneingabe |
EP1560200B8 (en) * | 2004-01-29 | 2009-08-05 | Harman Becker Automotive Systems GmbH | Method and system for spoken dialogue interface |
JP4309829B2 (ja) * | 2004-10-28 | 2009-08-05 | ソフトバンクモバイル株式会社 | 情報端末装置 |
US20060170956A1 (en) | 2005-01-31 | 2006-08-03 | Jung Edward K | Shared image devices |
US9910341B2 (en) | 2005-01-31 | 2018-03-06 | The Invention Science Fund I, Llc | Shared image device designation |
US9325781B2 (en) | 2005-01-31 | 2016-04-26 | Invention Science Fund I, Llc | Audio sharing |
US9082456B2 (en) | 2005-01-31 | 2015-07-14 | The Invention Science Fund I Llc | Shared image device designation |
US9124729B2 (en) | 2005-01-31 | 2015-09-01 | The Invention Science Fund I, Llc | Shared image device synchronization or designation |
US9489717B2 (en) | 2005-01-31 | 2016-11-08 | Invention Science Fund I, Llc | Shared image device |
CN101111885A (zh) * | 2005-02-04 | 2008-01-23 | 株式会社查纳位资讯情报 | 使用抽出的声音数据生成应答声音的声音识别系统 |
US9076208B2 (en) | 2006-02-28 | 2015-07-07 | The Invention Science Fund I, Llc | Imagery processing |
US9621749B2 (en) | 2005-06-02 | 2017-04-11 | Invention Science Fund I, Llc | Capturing selected image objects |
US9093121B2 (en) | 2006-02-28 | 2015-07-28 | The Invention Science Fund I, Llc | Data management of an audio data stream |
US20070222865A1 (en) | 2006-03-15 | 2007-09-27 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Enhanced video/still image correlation |
US9451200B2 (en) | 2005-06-02 | 2016-09-20 | Invention Science Fund I, Llc | Storage access technique for captured data |
US9942511B2 (en) | 2005-10-31 | 2018-04-10 | Invention Science Fund I, Llc | Preservation/degradation of video/audio aspects of a data stream |
US9167195B2 (en) | 2005-10-31 | 2015-10-20 | Invention Science Fund I, Llc | Preservation/degradation of video/audio aspects of a data stream |
US9191611B2 (en) | 2005-06-02 | 2015-11-17 | Invention Science Fund I, Llc | Conditional alteration of a saved image |
US9819490B2 (en) | 2005-05-04 | 2017-11-14 | Invention Science Fund I, Llc | Regional proximity for shared image device(s) |
US8964054B2 (en) | 2006-08-18 | 2015-02-24 | The Invention Science Fund I, Llc | Capturing selected image objects |
US9001215B2 (en) | 2005-06-02 | 2015-04-07 | The Invention Science Fund I, Llc | Estimating shared image device operational capabilities or resources |
US10003762B2 (en) | 2005-04-26 | 2018-06-19 | Invention Science Fund I, Llc | Shared image devices |
US20070098348A1 (en) * | 2005-10-31 | 2007-05-03 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Degradation/preservation management of captured data |
US9967424B2 (en) | 2005-06-02 | 2018-05-08 | Invention Science Fund I, Llc | Data storage usage protocol |
US20060253272A1 (en) * | 2005-05-06 | 2006-11-09 | International Business Machines Corporation | Voice prompts for use in speech-to-speech translation system |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070120980A1 (en) | 2005-10-31 | 2007-05-31 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Preservation/degradation of video/audio aspects of a data stream |
US8244545B2 (en) * | 2006-03-30 | 2012-08-14 | Microsoft Corporation | Dialog repair based on discrepancies between user model predictions and speech recognition results |
US7861159B2 (en) * | 2006-04-07 | 2010-12-28 | Pp Associates, Lp | Report generation with integrated quality management |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
KR20090110242A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 신호를 처리하는 방법 및 장치 |
KR101599875B1 (ko) * | 2008-04-17 | 2016-03-14 | 삼성전자주식회사 | 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치 |
KR20090110244A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치 |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8600761B2 (en) * | 2008-09-09 | 2013-12-03 | The Boeing Company | Hands-free and non-visually occluding object information interaction system |
EP2196989B1 (en) | 2008-12-10 | 2012-06-27 | Nuance Communications, Inc. | Grammar and template-based speech recognition of spoken utterances |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
KR20110036385A (ko) * | 2009-10-01 | 2011-04-07 | 삼성전자주식회사 | 사용자 의도 분석 장치 및 방법 |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9600135B2 (en) * | 2010-09-10 | 2017-03-21 | Vocollect, Inc. | Multimodal user notification system to assist in data capture |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
CN102645970B (zh) * | 2011-02-22 | 2015-10-28 | 鸿富锦精密工业(深圳)有限公司 | 移动向量触发控制方法及使用其的电子装置 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8782601B2 (en) * | 2011-09-30 | 2014-07-15 | Bmc Software, Inc. | Systems and methods for applying dynamic relational typing to a strongly-typed object-oriented API |
US9753528B2 (en) | 2011-12-21 | 2017-09-05 | Intel Corporation | Mechanism for facilitating power extension service at computing devices |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9224386B1 (en) | 2012-06-22 | 2015-12-29 | Amazon Technologies, Inc. | Discriminative language model training using a confusion matrix |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9292487B1 (en) * | 2012-08-16 | 2016-03-22 | Amazon Technologies, Inc. | Discriminative language model pruning |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9230560B2 (en) | 2012-10-08 | 2016-01-05 | Nant Holdings Ip, Llc | Smart home automation systems and methods |
RU2530267C2 (ru) * | 2012-11-28 | 2014-10-10 | Общество с ограниченной ответственностью "Спиктуит" | Способ коммуникации пользователя с информационной диалоговой системой |
KR101732137B1 (ko) * | 2013-01-07 | 2017-05-02 | 삼성전자주식회사 | 원격 제어 장치 및 전력 제어 방법 |
DE212014000045U1 (de) | 2013-02-07 | 2015-09-24 | Apple Inc. | Sprach-Trigger für einen digitalen Assistenten |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US9135243B1 (en) * | 2013-03-15 | 2015-09-15 | NetBase Solutions, Inc. | Methods and apparatus for identification and analysis of temporally differing corpora |
WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
CN105264655B (zh) | 2013-06-25 | 2018-08-03 | 英特尔公司 | 具有局部层间互连的单片三维(3d)ic |
RU2637874C2 (ru) * | 2013-06-27 | 2017-12-07 | Гугл Инк. | Генерирование диалоговых рекомендаций для чатовых информационных систем |
AU2014306221B2 (en) | 2013-08-06 | 2017-04-06 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10747880B2 (en) * | 2013-12-30 | 2020-08-18 | University Of Louisiana At Lafayette | System and method for identifying and comparing code by semantic abstractions |
RU2571373C2 (ru) * | 2014-03-31 | 2015-12-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Метод анализа тональности текстовых данных |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
CN107113222B (zh) | 2014-06-06 | 2020-09-01 | 谷歌有限责任公司 | 基于环境的主动聊天信息系统 |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US10074009B2 (en) | 2014-12-22 | 2018-09-11 | International Business Machines Corporation | Object popularity detection |
US9836452B2 (en) | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
CN104679472A (zh) * | 2015-02-13 | 2015-06-03 | 百度在线网络技术(北京)有限公司 | 人机语音交互方法和装置 |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
JP6669073B2 (ja) * | 2015-03-31 | 2020-03-18 | ソニー株式会社 | 情報処理装置、制御方法、およびプログラム |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
CN105161097A (zh) * | 2015-07-23 | 2015-12-16 | 百度在线网络技术(北京)有限公司 | 语音交互方法及装置 |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US9996517B2 (en) * | 2015-11-05 | 2018-06-12 | Lenovo (Singapore) Pte. Ltd. | Audio input of field entries |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
CN109643742A (zh) | 2016-08-26 | 2019-04-16 | 英特尔公司 | 集成电路器件结构和双侧制造技术 |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10347247B2 (en) * | 2016-12-30 | 2019-07-09 | Google Llc | Modulation of packetized audio signals |
CN107146623B (zh) * | 2017-04-07 | 2021-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音识别方法、装置和系统 |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US20190354557A1 (en) * | 2017-06-20 | 2019-11-21 | Tom Kornblit | System and Method For Providing Intelligent Customer Service |
EP3486900A1 (en) * | 2017-11-16 | 2019-05-22 | Softbank Robotics Europe | System and method for dialog session management |
US10845937B2 (en) | 2018-01-11 | 2020-11-24 | International Business Machines Corporation | Semantic representation and realization for conversational systems |
US20190213284A1 (en) | 2018-01-11 | 2019-07-11 | International Business Machines Corporation | Semantic representation and realization for conversational systems |
CN108446459B (zh) * | 2018-03-01 | 2022-03-22 | 云南师范大学 | 基于模糊语义推理的炼焦过程耗热量影响因素优化方法 |
CN114582314B (zh) * | 2022-02-28 | 2023-06-23 | 江苏楷文电信技术有限公司 | 基于asr的人机音视频交互逻辑模型设计方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06110835A (ja) * | 1992-09-30 | 1994-04-22 | Hitachi Ltd | 音声対話システムおよびその対話進行制御方法 |
JPH09114488A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JPH1097280A (ja) * | 1996-09-19 | 1998-04-14 | Hitachi Ltd | 音声画像認識翻訳装置 |
JP2002287787A (ja) * | 2001-01-31 | 2002-10-04 | Microsoft Corp | 明確化言語モデル |
JP2002342323A (ja) * | 2001-05-15 | 2002-11-29 | Mitsubishi Electric Corp | 言語モデル学習装置およびそれを用いた音声認識装置ならびに言語モデル学習方法およびそれを用いた音声認識方法ならびにそれらの方法を記憶した記憶媒体 |
JP2003140690A (ja) * | 2001-11-06 | 2003-05-16 | Denso Corp | 情報システム、電子機器、プログラム |
JP2003535410A (ja) * | 2000-06-01 | 2003-11-25 | マイクロソフト コーポレイション | 情報検索手法による統一化されたタスク依存の言語モデルの生成 |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4831550A (en) * | 1986-03-27 | 1989-05-16 | International Business Machines Corporation | Apparatus and method for estimating, from sparse data, the probability that a particular one of a set of events is the next event in a string of events |
DE3723078A1 (de) * | 1987-07-11 | 1989-01-19 | Philips Patentverwaltung | Verfahren zur erkennung von zusammenhaengend gesprochenen woertern |
DE3739681A1 (de) * | 1987-11-24 | 1989-06-08 | Philips Patentverwaltung | Verfahren zum bestimmen von anfangs- und endpunkt isoliert gesprochener woerter in einem sprachsignal und anordnung zur durchfuehrung des verfahrens |
US5263117A (en) * | 1989-10-26 | 1993-11-16 | International Business Machines Corporation | Method and apparatus for finding the best splits in a decision tree for a language model for a speech recognizer |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
US5502774A (en) * | 1992-06-09 | 1996-03-26 | International Business Machines Corporation | Automatic recognition of a consistent message using multiple complimentary sources of information |
CA2141221A1 (en) | 1992-09-04 | 1994-03-17 | Jaime G. Carbonell | Integrated authoring and translation system |
US5384892A (en) * | 1992-12-31 | 1995-01-24 | Apple Computer, Inc. | Dynamic language model for speech recognition |
EP0645757B1 (en) | 1993-09-23 | 2000-04-05 | Xerox Corporation | Semantic co-occurrence filtering for speech recognition and signal transcription applications |
US5615296A (en) * | 1993-11-12 | 1997-03-25 | International Business Machines Corporation | Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors |
US5675819A (en) | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
US5752052A (en) * | 1994-06-24 | 1998-05-12 | Microsoft Corporation | Method and system for bootstrapping statistical processing into a rule-based natural language parser |
US5689617A (en) * | 1995-03-14 | 1997-11-18 | Apple Computer, Inc. | Speech recognition system which returns recognition results as a reconstructed language model with attached data values |
IT1279171B1 (it) * | 1995-03-17 | 1997-12-04 | Ist Trentino Di Cultura | Sistema di riconoscimento di parlato continuo |
US5710866A (en) * | 1995-05-26 | 1998-01-20 | Microsoft Corporation | System and method for speech recognition using dynamically adjusted confidence measure |
US5680511A (en) | 1995-06-07 | 1997-10-21 | Dragon Systems, Inc. | Systems and methods for word recognition |
EP0801786B1 (en) * | 1995-11-04 | 2000-06-28 | International Business Machines Corporation | Method and apparatus for adapting the language model's size in a speech recognition system |
US6567778B1 (en) * | 1995-12-21 | 2003-05-20 | Nuance Communications | Natural language speech recognition using slot semantic confidence scores related to their word recognition confidence scores |
US5913193A (en) * | 1996-04-30 | 1999-06-15 | Microsoft Corporation | Method and system of runtime acoustic unit selection for speech synthesis |
US5937384A (en) * | 1996-05-01 | 1999-08-10 | Microsoft Corporation | Method and system for speech recognition using continuous density hidden Markov models |
US5835888A (en) * | 1996-06-10 | 1998-11-10 | International Business Machines Corporation | Statistical language model for inflected languages |
US5963903A (en) * | 1996-06-28 | 1999-10-05 | Microsoft Corporation | Method and system for dynamically adjusted training for speech recognition |
US5819220A (en) * | 1996-09-30 | 1998-10-06 | Hewlett-Packard Company | Web triggered word set boosting for speech interfaces to the world wide web |
US5905972A (en) * | 1996-09-30 | 1999-05-18 | Microsoft Corporation | Prosodic databases holding fundamental frequency templates for use in speech synthesis |
US5829000A (en) * | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
GB9701866D0 (en) | 1997-01-30 | 1997-03-19 | British Telecomm | Information retrieval |
DE19708183A1 (de) * | 1997-02-28 | 1998-09-03 | Philips Patentverwaltung | Verfahren zur Spracherkennung mit Sprachmodellanpassung |
US6073091A (en) * | 1997-08-06 | 2000-06-06 | International Business Machines Corporation | Apparatus and method for forming a filtered inflected language model for automatic speech recognition |
WO1999021106A1 (en) | 1997-10-20 | 1999-04-29 | Microsoft Corporation | Automatically recognizing the discourse structure of a body of text |
RU2119196C1 (ru) | 1997-10-27 | 1998-09-20 | Яков Юноевич Изилов | Способ лексической интерпретации слитной речи и система для его реализации |
US6154722A (en) * | 1997-12-18 | 2000-11-28 | Apple Computer, Inc. | Method and apparatus for a speech recognition system language model that integrates a finite state grammar probability and an N-gram probability |
US6182039B1 (en) * | 1998-03-24 | 2001-01-30 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus using probabilistic language model based on confusable sets for speech recognition |
US6141641A (en) * | 1998-04-15 | 2000-10-31 | Microsoft Corporation | Dynamically configurable acoustic model for speech recognition system |
US6188976B1 (en) * | 1998-10-23 | 2001-02-13 | International Business Machines Corporation | Apparatus and method for building domain-specific language models |
US6415256B1 (en) * | 1998-12-21 | 2002-07-02 | Richard Joseph Ditzik | Integrated handwriting and speed recognition systems |
US6314402B1 (en) | 1999-04-23 | 2001-11-06 | Nuance Communications | Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system |
US6081799A (en) * | 1999-05-05 | 2000-06-27 | International Business Machines Corporation | Executing complex SQL queries using index screening for conjunct or disjunct index operations |
US6553345B1 (en) * | 1999-08-26 | 2003-04-22 | Matsushita Electric Industrial Co., Ltd. | Universal remote control allowing natural language modality for television and multimedia searches and requests |
US6434529B1 (en) | 2000-02-16 | 2002-08-13 | Sun Microsystems, Inc. | System and method for referencing object instances and invoking methods on those object instances from within a speech recognition grammar |
US6865528B1 (en) * | 2000-06-01 | 2005-03-08 | Microsoft Corporation | Use of a unified language model |
TW472232B (en) | 2000-08-11 | 2002-01-11 | Ind Tech Res Inst | Probability-base fault-tolerance natural language understanding method |
US6785651B1 (en) | 2000-09-14 | 2004-08-31 | Microsoft Corporation | Method and apparatus for performing plan-based dialog |
US20020152075A1 (en) * | 2001-04-16 | 2002-10-17 | Shao-Tsu Kung | Composite input method |
EP1410381A4 (en) | 2001-05-04 | 2005-10-19 | Unisys Corp | DYNAMIC GENERATION OF VOICE APPLICATION INFORMATION FROM A WEB SERVER |
CN1279465C (zh) * | 2001-05-04 | 2006-10-11 | 微软公司 | Web启用的识别体系结构 |
JP4094255B2 (ja) | 2001-07-27 | 2008-06-04 | 日本電気株式会社 | コマンド入力機能つきディクテーション装置 |
US7200559B2 (en) * | 2003-05-29 | 2007-04-03 | Microsoft Corporation | Semantic object synchronous understanding implemented with speech application language tags |
US8301436B2 (en) | 2003-05-29 | 2012-10-30 | Microsoft Corporation | Semantic object synchronous understanding for highly interactive interface |
-
2003
- 2003-05-29 US US10/447,399 patent/US8301436B2/en active Active
-
2004
- 2004-05-07 ZA ZA200403493A patent/ZA200403493B/en unknown
- 2004-05-11 AU AU2004201993A patent/AU2004201993A1/en not_active Abandoned
- 2004-05-11 EP EP04102035.5A patent/EP1482479B1/en not_active Expired - Lifetime
- 2004-05-13 CA CA2467134A patent/CA2467134C/en not_active Expired - Lifetime
- 2004-05-20 TW TW093114295A patent/TW200513884A/zh unknown
- 2004-05-27 BR BR0401847-8A patent/BRPI0401847A/pt not_active IP Right Cessation
- 2004-05-27 JP JP2004158359A patent/JP4768969B2/ja not_active Expired - Lifetime
- 2004-05-28 RU RU2004116303/09A patent/RU2352979C2/ru not_active IP Right Cessation
- 2004-05-28 KR KR1020040038493A patent/KR101066741B1/ko active IP Right Grant
- 2004-05-28 MX MXPA04005121A patent/MXPA04005121A/es not_active Application Discontinuation
- 2004-05-31 CN CNB2004100856494A patent/CN100424632C/zh not_active Expired - Lifetime
-
2005
- 2005-04-19 HK HK05103321.9A patent/HK1070730A1/zh not_active IP Right Cessation
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06110835A (ja) * | 1992-09-30 | 1994-04-22 | Hitachi Ltd | 音声対話システムおよびその対話進行制御方法 |
JPH09114488A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JPH1097280A (ja) * | 1996-09-19 | 1998-04-14 | Hitachi Ltd | 音声画像認識翻訳装置 |
JP2003535410A (ja) * | 2000-06-01 | 2003-11-25 | マイクロソフト コーポレイション | 情報検索手法による統一化されたタスク依存の言語モデルの生成 |
JP2002287787A (ja) * | 2001-01-31 | 2002-10-04 | Microsoft Corp | 明確化言語モデル |
JP2002342323A (ja) * | 2001-05-15 | 2002-11-29 | Mitsubishi Electric Corp | 言語モデル学習装置およびそれを用いた音声認識装置ならびに言語モデル学習方法およびそれを用いた音声認識方法ならびにそれらの方法を記憶した記憶媒体 |
JP2003140690A (ja) * | 2001-11-06 | 2003-05-16 | Denso Corp | 情報システム、電子機器、プログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011046127A1 (ja) * | 2009-10-14 | 2011-04-21 | 日本電気株式会社 | データ収集システム、携帯端末、シール及びデータ収集方法 |
WO2012017525A1 (ja) * | 2010-08-04 | 2012-02-09 | パイオニア株式会社 | 処理装置及びコマンド入力支援方法 |
JP2018523143A (ja) * | 2015-05-27 | 2018-08-16 | グーグル エルエルシー | 音声対応電子デバイスにおける選択的オフライン対応の音声アクションのためのデータのローカル維持 |
US10334080B2 (en) | 2015-05-27 | 2019-06-25 | Google Llc | Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device |
US10482883B2 (en) | 2015-05-27 | 2019-11-19 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
US10986214B2 (en) | 2015-05-27 | 2021-04-20 | Google Llc | Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device |
US11087762B2 (en) | 2015-05-27 | 2021-08-10 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
US11676606B2 (en) | 2015-05-27 | 2023-06-13 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
Also Published As
Publication number | Publication date |
---|---|
KR20040103443A (ko) | 2004-12-08 |
AU2004201993A1 (en) | 2004-12-16 |
US8301436B2 (en) | 2012-10-30 |
RU2004116303A (ru) | 2005-11-10 |
RU2352979C2 (ru) | 2009-04-20 |
CA2467134A1 (en) | 2004-11-29 |
HK1070730A1 (zh) | 2005-06-24 |
US20040243419A1 (en) | 2004-12-02 |
CN100424632C (zh) | 2008-10-08 |
CN1591315A (zh) | 2005-03-09 |
EP1482479A1 (en) | 2004-12-01 |
MXPA04005121A (es) | 2005-06-10 |
EP1482479B1 (en) | 2016-09-28 |
JP4768969B2 (ja) | 2011-09-07 |
BRPI0401847A (pt) | 2005-03-08 |
CA2467134C (en) | 2013-03-05 |
TW200513884A (en) | 2005-04-16 |
ZA200403493B (en) | 2006-04-26 |
KR101066741B1 (ko) | 2011-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4768969B2 (ja) | 高度対話型インターフェースに対する理解同期意味オブジェクト | |
JP4768970B2 (ja) | 音声アプリケーション言語タグとともに実装される理解同期意味オブジェクト | |
US8170866B2 (en) | System and method for increasing accuracy of searches based on communication network | |
US11093110B1 (en) | Messaging feedback mechanism | |
JP2009059378A (ja) | ダイアログを目的とするアプリケーション抽象化のための記録媒体及び方法 | |
JP2006146193A (ja) | 汎用スペリングニーモニック | |
JP2009187349A (ja) | 文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム | |
Hämäläinen et al. | Multilingual speech recognition for the elderly: The AALFred personal life assistant | |
KR100917552B1 (ko) | 대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 | |
JP2007328283A (ja) | 対話装置、プログラム、及び対話方法 | |
Rouillard | Web services and speech-based applications around VoiceXML. | |
McTear | Rule-Based Dialogue Systems: Architecture, Methods, and Tools | |
Deng et al. | Speech and language processing for multimodal human-computer interaction | |
Milhorat | An open-source framework for supporting the design and implementation of natural-language spoken dialog systems | |
Wang | Semantic object synchronous understanding in SALT for highly interactive user interface. | |
Deng et al. | A speech-centric perspective for human-computer interface | |
Hassaan et al. | Dhivehi automatic speech recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110610 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110617 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4768969 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140624 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |