JP5542156B2 - 発話処理のための認識器のマークアップ言語ベースの選択及び利用 - Google Patents
発話処理のための認識器のマークアップ言語ベースの選択及び利用 Download PDFInfo
- Publication number
- JP5542156B2 JP5542156B2 JP2011547931A JP2011547931A JP5542156B2 JP 5542156 B2 JP5542156 B2 JP 5542156B2 JP 2011547931 A JP2011547931 A JP 2011547931A JP 2011547931 A JP2011547931 A JP 2011547931A JP 5542156 B2 JP5542156 B2 JP 5542156B2
- Authority
- JP
- Japan
- Prior art keywords
- markup language
- computing device
- recognizers
- utterance
- client computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 15
- 238000000034 method Methods 0.000 claims description 33
- 230000004044 response Effects 0.000 claims description 13
- 230000009471 action Effects 0.000 claims description 9
- 238000003672 processing method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 19
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
本願明細書の内容の一部は著作権保護に従う要素を含む。著作権者は、特許文献又は特許開示の如何なる者による複製が米国特許商標局内で公的に入手可能なファイル又は記録を生じる場合、これに異議を申し立てないが、その他の場合の全ての著作権は如何なる場合にも保護される。
図2を参照して、以下の説明は、様々な例示的実施形態が実装され得る好適なコンピューティング環境について簡潔で且つ一般的な説明を提供することを目的としている。種々の実施形態は、コンピューティングデバイス上のオペレーティングシステムで駆動するプログラムモジュールと連結して実行するプログラムモジュールに関する一般的な内容で記載されるであろうが、当業者であれば、様々な実施形態が他のタイプのコンピュータシステム及びプログラムモジュールと組み合わせて実装され得ると認識するであろう。
Claims (13)
- 複数の認識器を利用してマークアップ言語ドキュメントに基づいて発話を処理するコンピュータ実行方法であって、
クライアントコンピューティングデバイスが、前記マークアップ言語ドキュメントを受信するステップと、
前記クライアントコンピューティングデバイスが、前記発話を受信するステップと、
前記クライアントコンピューティングデバイスが、前記マークアップ言語ドキュメントに基づいて前記発話に対する結果セットを戻す前記複数の認識器のうちの少なくとも1つを選択するステップであって、前記選択するステップは、
前記発話に使用される文法を認識するステップと、
前記文法に基づいて前記発話に対する前記結果セットを戻す前記複数の認識器のうちの少なくとも1つを特定させる少なくとも1つのマークアップ言語タグについて前記マークアップ言語ドキュメントを解析するステップと、
前記少なくとも1つのマークアップ言語タグによって特定された前記複数の認識器のうちの前記少なくとも1つを選択するステップであって、前記複数の認識器のうちの前記選択された少なくとも1つは、前記文法が前記クライアントコンピューティングデバイス上に記憶されたデータを含む場合、前記クライアントコンピューティングデバイス上に組み込まれたローカル認識器であり、前記文法がネットワークサーバからリモートサーチエンジンへのクエリを介して取得されたデータを含む場合、前記ネットワークサーバ上のネットワーク認識器である、選択するステップと
を含む、選択するステップと、
前記クライアントコンピューティングデバイスが、前記結果セットを、前記マークアップ言語ドキュメントにおいて指定された処理方法によって決定されたフォーマットにおける前記複数の認識器のうちの前記選択された少なくとも1つから受信するステップと、
前記クライアントコンピューティングデバイスが、前記結果セットを受信することに応答してイベントを実行するステップと
を含むコンピュータ実行方法。 - 前記クライアントコンピューティングデバイスが、前記複数の認識器のうちの前記少なくとも1つに対するバージョンデータを、第1のコンピューティングデバイスへ送信するステップと、
前記クライアントコンピューティングデバイスが、前記バージョンデータが前記複数の認識器のうちの前記少なくとも1つに対する更新後のバージョンを特定する場合、更新されたマークアップ言語ドキュメントを、前記第1のコンピューティングデバイスから受信するステップと
をさらに含み、前記更新されたマークアップ言語ドキュメントは、前記更新後のバージョンにおいて新たに付加された特徴を利用するための命令に関する記述を含むことを特徴とする請求項1に記載の方法。 - 前記イベントは、前記結果セットを受信することに応答して、前記発話に対する音声認識の精度を示す信頼スコアに少なくとも基づいて、実行すべき動作を判定することを含み、前記動作は、前記結果セットが前記発話に対する未処理の結果を含み、かつ前記信頼スコアが、所定の閾値より低い場合、前記結果セットを無視し、前記結果セットを前記クライアントコンピューティングデバイスに表示することを防止することを含むことを特徴とする請求項1に記載の方法。
- 前記結果セットを、前記マークアップ言語ドキュメントにおいて指定された処理方法によって決定されたフォーマットの前記複数の認識器のうちの前記選択された少なくとも1つから受信する前記ステップは、未処理の結果フォーマット及び処理された結果フォーマットのうちの少なくとも1つにおける前記結果セットを受信するステップを含み、前記未処理の結果フォーマットは、前記発話の音声認識を含む1つ以上の用語を含み、前記処理された結果フォーマットは、前記発話に関連付けられた1つ以上の用語の音声認識を含むことを特徴とする請求項1に記載の方法。
- マークアップ言語ドキュメントに基づいて複数の認識器を利用して発話を処理するシステムであって、前記システムは、クライアントコンピューティングデバイスを含み、前記クライアントコンピューティングデバイスは、
実行可能なプログラムコードを記憶するメモリと、
前記メモリに機能的に接続されたプロセッサと
を含み、前記プロセッサは、前記プログラムコードに含まれたコンピュータ実行可能命令に応答し、かつ
前記マークアップ言語ドキュメントを受信し、
前記発話を受信し、
前記マークアップ言語ドキュメントにおけるマークアップ言語に基づいて前記発話に対する結果セットを戻す前記複数の認識器のうちの少なくとも1つを選択し、前記マークアップ言語に基づいて選択することは、
前記発話に使用される文法を認識し、
前記文法に基づいて前記発話に対する前記結果セットを戻す前記複数の認識器のうちの少なくとも1つを特定させる少なくとも1つのマークアップ言語タグについて前記マークアップ言語ドキュメントを解析し、
前記少なくとも1つのマークアップ言語タグによって特定された前記複数の認識器のうちの前記少なくとも1つを選択し、前記複数の認識器のうちの前記選択された少なくとも1つは、前記文法が前記クライアントコンピューティングデバイス上に記憶されたデータを含む場合、前記クライアントコンピューティングデバイス上に組み込まれたローカル認識器であり、前記文法がネットワークサーバからリモートサーチエンジンへのクエリを介して取得されたデータを含む場合、前記ネットワークサーバ上のネットワーク認識器であり、
前記結果セットを、前記マークアップ言語ドキュメントにおいて指定された処理方法によって決定されたフォーマットにおける前記複数の認識器のうちの前記選択された少なくとも1つから受信し、および、
前記結果セットを受信することに応答して、イベントを実行するよう動作する
ことを特徴とするシステム。 - 前記プロセッサは、
更新後のバージョンが前記複数の認識器のうちの少なくとも1つに対して利用可能であるかどうかを決定し、
更新後のバージョンが前記複数の認識器のうちの前記少なくとも1つに対して利用可能である場合、前記更新後のバージョンにおいて新たに付加された特徴を操作するための命令に関する記述を含む更新されたマークアップ言語ドキュメントを受信する
ようにさらに動作することを特徴とする請求項5に記載のシステム。 - 前記イベントは、前記結果セットを受信することに応答して、前記発話に対する音声認識の精度を示す信頼スコアに少なくとも基づいて、実行すべき動作を判定することを含み、前記動作は、前記結果セットが前記発話に対する未処理の結果を含み、かつ前記信頼スコアが、所定の閾値より低い場合、前記結果セットを無視し、前記結果セットを前記クライアントコンピューティングデバイスに表示することを防止することを含むことを特徴とする請求項5に記載のシステム。
- 前記プロセッサは、前記発話を前記複数の認識器のうちの前記選択された少なくとも1つに送信するようさらに動作することを特徴とする請求項5に記載のシステム。
- 前記複数の認識器のうちの前記選択された少なくとも1つからの前記結果セットは、前記マークアップ言語ドキュメントにおいて指定された処理方法によって決定されたフォーマットにおいて、受信され、前記フォーマットは、未処理の結果フォーマット及び処理された結果フォーマットのうちの少なくとも1つを含み、前記未処理の結果フォーマットは、前記発話の音声認識を含む1つ以上の用語を含み、前記処理された結果フォーマットは、前記発話の音声認識と関連付けられた1つ以上の用語を含むことを特徴とする請求項5に記載のシステム。
- コンピュータ実行可能命令を含むコンピュータ可読記憶媒体であって、前記コンピュータ実行可能命令がクライアントコンピューティングデバイス上で実行されると、前記クライアントコンピューティングデバイスに、マークアップ言語ドキュメントに基づいて複数の認識器を利用して発話を処理する方法を実行させ、前記方法は、
前記クライアントコンピューティングデバイスが、前記マークアップ言語ドキュメントを受信するステップと、
前記クライアントコンピューティングデバイスが、前記発話を受信するステップと、
前記クライアントコンピューティングデバイスが、前記マークアップ言語ドキュメントにおけるマークアップ言語に基づいて前記発話に対する結果セットを戻す前記複数の認識器のうちの少なくとも1つを選択するステップと、
前記クライアントコンピューティングデバイスが、前記発話を、前記複数の認識器のうちの前記選択された少なくとも1つに流すステップと、
前記クライアントコンピューティングデバイスが、前記結果セットを、前記マークアップ言語ドキュメントにおいて指定された処理方法によって決定されたフォーマットにおける前記複数の認識器のうちの前記選択された少なくとも1つから受信するステップと、
前記クライアントコンピューティングデバイスが、前記結果セットを受信することに応答してイベントを実行するステップと
を備え、前記マークアップ言語ドキュメントを受信する前記ステップは、
前記クライアントコンピューティングデバイス上のローカルに記憶されたマークアップ言語ドキュメントを受信するステップ、及び、
遠隔的に記憶されたマークアップ言語ドキュメントをネットワークサーバから受信するステップ、のうち少なくとも1つを含み、
前記マークアップ言語ドキュメントにおけるマークアップ言語に基づいて前記発話に対する結果セットを戻す前記複数の認識器のうちの少なくとも1つを選択する前記ステップは、
前記発話に使用される文法を認識するステップと、
少なくとも1つのマークアップ言語タグについて前記マークアップ言語ドキュメントを解析するステップと、
前記文法に基づいて前記発話に対する結果セットを戻す前記複数の認識器のうちの少なくとも1つを特定するステップと、
少なくとも1つのマークアップ言語タグによって特定された前記複数の認識器のうちの少なくとも1つを選択するステップと
を含み、前記複数の認識器のうちの前記選択された少なくとも1つは、前記文法が前記クライアントコンピューティングデバイス上に記憶されたデータを含む場合、前記クライアントコンピューティングデバイス上に組み込まれたローカル認識器であり、前記文法がネットワークサーバからリモートサーチエンジンへのクエリを介して取得されたデータを含む場合、前記ネットワークサーバ上のネットワーク認識器である
ことを特徴とするコンピュータ可読記憶媒体。 - 前記方法は、
前記クライアントコンピューティングデバイスが、更新後のバージョンが前記複数の認識器のうちの少なくとも1つに対して利用可能であるかどうかを決定するステップと、
前記クライアントコンピューティングデバイスが、更新後のバージョンが前記複数の認識器のうちの前記少なくとも1つに対して利用可能である場合、前記更新後のバージョンにおいて新たに付加された特徴を操作する付加的マークアップ言語を含む更新されたマークアップ言語ドキュメントを受信するステップと
をさらに含む請求項10に記載のコンピュータ可読記憶媒体。 - 前記結果セットを、前記マークアップ言語ドキュメントにおいて指定された処理方法によって決定されたフォーマットの前記複数の認識器のうちの前記選択された少なくとも1つから受信する前記ステップは、未処理の結果フォーマット及び処理された結果フォーマットのうち少なくとも1つにおける前記結果セットを受信するステップを含み、前記未処理の結果フォーマットは、前記発話の音声認識を含む1つ以上の用語を含み、前記処理された結果フォーマットは、前記発話に関連付けられた1つ以上の用語の音声認識を含むことを特徴とする請求項10に記載のコンピュータ可読記憶媒体。
- 前記イベントは、前記結果セットを受信することに応答して、前記発話に対する音声認識の精度を示す信頼スコアに少なくとも基づいて、実行すべき動作を判定することを含み、前記動作は、前記結果セットが前記発話に対する未処理の結果を含み、かつ前記信頼スコアが、所定の閾値より低い場合、前記結果セットを無視し、前記結果セットを前記クライアントコンピューティングデバイスに表示することを防止することを含むことを特徴とする請求項10に記載のコンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/357,773 US8515762B2 (en) | 2009-01-22 | 2009-01-22 | Markup language-based selection and utilization of recognizers for utterance processing |
US12/357,773 | 2009-01-22 | ||
PCT/US2009/067788 WO2010090679A1 (en) | 2009-01-22 | 2009-12-11 | Markup language-based selection and utilization of recognizers for utterance processing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012515946A JP2012515946A (ja) | 2012-07-12 |
JP5542156B2 true JP5542156B2 (ja) | 2014-07-09 |
Family
ID=42337638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011547931A Expired - Fee Related JP5542156B2 (ja) | 2009-01-22 | 2009-12-11 | 発話処理のための認識器のマークアップ言語ベースの選択及び利用 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8515762B2 (ja) |
EP (1) | EP2380166B1 (ja) |
JP (1) | JP5542156B2 (ja) |
KR (1) | KR101649771B1 (ja) |
CN (1) | CN102292765B (ja) |
AU (1) | AU2009339294B2 (ja) |
BR (1) | BRPI0922906A8 (ja) |
CA (1) | CA2747791C (ja) |
RU (1) | RU2525440C2 (ja) |
WO (1) | WO2010090679A1 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103038818B (zh) | 2010-06-24 | 2016-10-12 | 本田技研工业株式会社 | 在车载语音识别系统与车外语音识别系统之间的通信系统和方法 |
KR101961139B1 (ko) * | 2012-06-28 | 2019-03-25 | 엘지전자 주식회사 | 이동 단말기 및 그것의 음성 인식 방법 |
US9953630B1 (en) * | 2013-05-31 | 2018-04-24 | Amazon Technologies, Inc. | Language recognition for device settings |
DE102014109122A1 (de) * | 2013-07-12 | 2015-01-15 | Gm Global Technology Operations, Llc | Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen |
US9715878B2 (en) | 2013-07-12 | 2017-07-25 | GM Global Technology Operations LLC | Systems and methods for result arbitration in spoken dialog systems |
CN103475712B (zh) * | 2013-09-10 | 2016-05-11 | 北京思特奇信息技术股份有限公司 | 基于云计算实现多企业多通讯录自动关联的方法及系统 |
CN103474069B (zh) * | 2013-09-12 | 2016-03-30 | 中国科学院计算技术研究所 | 用于融合多个语音识别系统的识别结果的方法及系统 |
US9530416B2 (en) | 2013-10-28 | 2016-12-27 | At&T Intellectual Property I, L.P. | System and method for managing models for embedded speech and language processing |
US9666188B2 (en) | 2013-10-29 | 2017-05-30 | Nuance Communications, Inc. | System and method of performing automatic speech recognition using local private data |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US10445356B1 (en) * | 2016-06-24 | 2019-10-15 | Pulselight Holdings, Inc. | Method and system for analyzing entities |
US11087766B2 (en) * | 2018-01-05 | 2021-08-10 | Uniphore Software Systems | System and method for dynamic speech recognition selection based on speech rate or business domain |
US10147428B1 (en) * | 2018-05-30 | 2018-12-04 | Green Key Technologies Llc | Computer systems exhibiting improved computer speed and transcription accuracy of automatic speech transcription (AST) based on a multiple speech-to-text engines and methods of use thereof |
CN108846069B (zh) * | 2018-06-07 | 2022-07-19 | 创新先进技术有限公司 | 一种基于标记语言的文档执行方法及装置 |
US11423215B2 (en) | 2018-12-13 | 2022-08-23 | Zebra Technologies Corporation | Method and apparatus for providing multimodal input data to client applications |
US11551681B1 (en) * | 2019-12-13 | 2023-01-10 | Amazon Technologies, Inc. | Natural language processing routing |
CN113763943A (zh) * | 2020-06-04 | 2021-12-07 | 微软技术许可有限责任公司 | 在语音识别结果中实时地提供提示 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5251131A (en) * | 1991-07-31 | 1993-10-05 | Thinking Machines Corporation | Classification of data records by comparison of records to a training database using probability weights |
US5819220A (en) * | 1996-09-30 | 1998-10-06 | Hewlett-Packard Company | Web triggered word set boosting for speech interfaces to the world wide web |
DE19910236A1 (de) | 1999-03-09 | 2000-09-21 | Philips Corp Intellectual Pty | Verfahren zur Spracherkennung |
FI20001918A (fi) * | 2000-08-30 | 2002-03-01 | Nokia Corp | Monimodaalinen sisältö ja automaattinen puheen tunnistus langattomassa tietoliikennejärjestelmässä |
US7409349B2 (en) * | 2001-05-04 | 2008-08-05 | Microsoft Corporation | Servers for web enabled speech recognition |
US20050234727A1 (en) | 2001-07-03 | 2005-10-20 | Leo Chiu | Method and apparatus for adapting a voice extensible markup language-enabled voice system for natural speech recognition and system response |
US6999930B1 (en) * | 2002-03-27 | 2006-02-14 | Extended Systems, Inc. | Voice dialog server method and system |
US7032169B2 (en) * | 2002-05-22 | 2006-04-18 | International Business Machines Corporation | Method and system for distributed coordination of multiple modalities of computer-user interaction |
KR100636909B1 (ko) | 2002-11-14 | 2006-10-19 | 엘지전자 주식회사 | 확장성 표기 언어 기반의 전자문서 버전 매김 및 버전을이용한 갱신 문서 제공 방법 |
US7571100B2 (en) | 2002-12-03 | 2009-08-04 | Speechworks International, Inc. | Speech recognition and speaker verification using distributed speech processing |
US6834265B2 (en) | 2002-12-13 | 2004-12-21 | Motorola, Inc. | Method and apparatus for selective speech recognition |
US7076428B2 (en) | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
US7197331B2 (en) * | 2002-12-30 | 2007-03-27 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
KR100504841B1 (ko) | 2003-07-11 | 2005-07-29 | 엘지전자 주식회사 | 이동 통신 단말기의 메시지 관리 방법 |
US7158779B2 (en) * | 2003-11-11 | 2007-01-02 | Microsoft Corporation | Sequential multimodal input |
US20050131872A1 (en) * | 2003-12-16 | 2005-06-16 | Microsoft Corporation | Query recognizer |
KR100989500B1 (ko) * | 2004-01-28 | 2010-10-22 | 주식회사 케이티 | 음성인식 파라미터 공유 방법 |
KR100695127B1 (ko) * | 2004-10-08 | 2007-03-14 | 삼성전자주식회사 | 다 단계 음성 인식 장치 및 방법 |
US7865362B2 (en) * | 2005-02-04 | 2011-01-04 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
EP1846850A2 (en) * | 2005-02-09 | 2007-10-24 | Pixalert | Memory based content display interception |
US20060235694A1 (en) | 2005-04-14 | 2006-10-19 | International Business Machines Corporation | Integrating conversational speech into Web browsers |
CA2620931A1 (en) | 2005-09-01 | 2007-03-08 | Vishal Dhawan | Voice application network platform |
US8073700B2 (en) | 2005-09-12 | 2011-12-06 | Nuance Communications, Inc. | Retrieval and presentation of network service results for mobile device using a multimodal browser |
US8326629B2 (en) * | 2005-11-22 | 2012-12-04 | Nuance Communications, Inc. | Dynamically changing voice attributes during speech synthesis based upon parameter differentiation for dialog contexts |
US20070239453A1 (en) | 2006-04-06 | 2007-10-11 | Microsoft Corporation | Augmenting context-free grammars with back-off grammars for processing out-of-grammar utterances |
US7840409B2 (en) | 2007-02-27 | 2010-11-23 | Nuance Communications, Inc. | Ordering recognition results produced by an automatic speech recognition engine for a multimodal application |
US8374983B1 (en) * | 2009-11-23 | 2013-02-12 | Google Inc. | Distributed object classification |
US8755610B2 (en) * | 2011-06-10 | 2014-06-17 | Apple Inc. | Auto-recognition for noteworthy objects |
-
2009
- 2009-01-22 US US12/357,773 patent/US8515762B2/en not_active Expired - Fee Related
- 2009-12-11 EP EP09839827.4A patent/EP2380166B1/en not_active Not-in-force
- 2009-12-11 JP JP2011547931A patent/JP5542156B2/ja not_active Expired - Fee Related
- 2009-12-11 CA CA2747791A patent/CA2747791C/en not_active Expired - Fee Related
- 2009-12-11 WO PCT/US2009/067788 patent/WO2010090679A1/en active Application Filing
- 2009-12-11 CN CN2009801553606A patent/CN102292765B/zh not_active Expired - Fee Related
- 2009-12-11 RU RU2011130550/08A patent/RU2525440C2/ru not_active IP Right Cessation
- 2009-12-11 KR KR1020117016517A patent/KR101649771B1/ko active IP Right Grant
- 2009-12-11 BR BRPI0922906A patent/BRPI0922906A8/pt not_active Application Discontinuation
- 2009-12-11 AU AU2009339294A patent/AU2009339294B2/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
RU2525440C2 (ru) | 2014-08-10 |
EP2380166A4 (en) | 2013-09-18 |
AU2009339294B2 (en) | 2014-04-24 |
CA2747791C (en) | 2016-11-08 |
RU2011130550A (ru) | 2013-01-27 |
AU2009339294A1 (en) | 2011-07-14 |
WO2010090679A1 (en) | 2010-08-12 |
CN102292765B (zh) | 2013-08-14 |
CN102292765A (zh) | 2011-12-21 |
BRPI0922906A2 (pt) | 2017-10-31 |
CA2747791A1 (en) | 2010-08-12 |
EP2380166A1 (en) | 2011-10-26 |
US8515762B2 (en) | 2013-08-20 |
KR20110117086A (ko) | 2011-10-26 |
BRPI0922906A8 (pt) | 2017-12-12 |
KR101649771B1 (ko) | 2016-08-19 |
EP2380166B1 (en) | 2018-07-04 |
US20100185447A1 (en) | 2010-07-22 |
JP2012515946A (ja) | 2012-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5542156B2 (ja) | 発話処理のための認識器のマークアップ言語ベースの選択及び利用 | |
US20220262365A1 (en) | Mixed model speech recognition | |
US10249301B2 (en) | Method and system for speech recognition processing | |
US9530415B2 (en) | System and method of providing speech processing in user interface | |
KR101418163B1 (ko) | 컨텍스트 정보를 이용한 음성 인식 복구 | |
JP6373985B2 (ja) | 音声動作式機能にキーワードモデルを割り当てるための方法および装置 | |
US8868428B2 (en) | Integration of embedded and network speech recognizers | |
AU2017425675B2 (en) | Extracting domain-specific actions and entities in natural language commands | |
US8224644B2 (en) | Utterance processing for network-based speech recognition utilizing a client-side cache | |
CN110085222B (zh) | 用于支持语音对话服务的交互装置和方法 | |
TW201440037A (zh) | 語音操控方法、行動終端裝置及語音操控系統 | |
KR102364401B1 (ko) | 문맥형 음성-구동 딥 북마킹 | |
US20190027134A1 (en) | Extracting domain-specific actions and entities in natural language commands | |
JP2014513828A (ja) | 自動会話支援 | |
KR102536944B1 (ko) | 음성 신호 처리 방법 및 장치 | |
US7197494B2 (en) | Method and architecture for consolidated database search for input recognition systems | |
US9495965B2 (en) | Synthesis and display of speech commands method and system | |
KR20230075386A (ko) | 음성 신호 처리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130404 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130709 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140313 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140502 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5542156 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |