JP2018523143A - 音声対応電子デバイスにおける選択的オフライン対応の音声アクションのためのデータのローカル維持 - Google Patents
音声対応電子デバイスにおける選択的オフライン対応の音声アクションのためのデータのローカル維持 Download PDFInfo
- Publication number
- JP2018523143A JP2018523143A JP2017550865A JP2017550865A JP2018523143A JP 2018523143 A JP2018523143 A JP 2018523143A JP 2017550865 A JP2017550865 A JP 2017550865A JP 2017550865 A JP2017550865 A JP 2017550865A JP 2018523143 A JP2018523143 A JP 2018523143A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- offline
- enabled
- electronic device
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009471 action Effects 0.000 title claims abstract description 266
- 238000012423 maintenance Methods 0.000 title description 3
- 238000012545 processing Methods 0.000 claims description 65
- 238000000034 method Methods 0.000 claims description 41
- 230000004044 response Effects 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 14
- 230000001419 dependent effect Effects 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 22
- 238000009877 rendering Methods 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 7
- 230000000007 visual effect Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 5
- 239000008267 milk Substances 0.000 description 5
- 210000004080 milk Anatomy 0.000 description 5
- 235000013336 milk Nutrition 0.000 description 5
- 235000008429 bread Nutrition 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000009118 appropriate response Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
- Stereophonic System (AREA)
- Telephone Function (AREA)
Abstract
Description
次に図面について、同様の番号は、複数の図面にわたって同様の部分を表し、図1は、例示的なコンピュータシステム10における電子的構成要素のブロック図である。システム10は、一般にバスサブシステム14を介して複数の周辺デバイスと通信する少なくとも1つのプロセッサ12を含む。これらの周辺デバイスは、例えば、メモリサブシステム18およびファイルストレージサブシステム20を含むストレージサブシステム16、ユーザインターフェース入力デバイス22、ユーザインターフェース出力デバイス24、およびネットワークインターフェースサブシステム26を含み得る。入出力デバイスにより、システム10とのユーザ対話が可能である。ネットワークインターフェースサブシステム26は、外部ネットワークへのインターフェースを提供するとともに、他のコンピュータシステムにおける対応するインタフェースデバイスに接続される。
図2は、例えば、オンライン検索サービス54などのオンラインサービスと通信する音声対応デバイス52とともに使用するための、例示的な分散化された音声入力処理環境50を示す。以降で議論される実施形態では、例えば、音声対応デバイス52(音声対応電子デバイスとして本明細書では呼ばれることもある)は、セルラフォンまたはタブレットコンピュータなどのモバイルデバイスとして記載される。他の実施形態は、多種多様な他の音声対応デバイスを利用できるが、モバイルデバイスへの以降の参照は、単に以降の議論を簡潔にすることを目的とする。無数の他の種類の音声対応デバイスは、例えば、ラップトップコンピュータ、腕時計、ヘッドマウントデバイス、仮想または拡張現実デバイス、他のウェアラブルデバイス、オーディオ/ビデオシステム、ナビゲーションシステム、自動車用および他の車両用システムなどを含む、以降に記載の機能を使用できる。その上、そのような音声対応デバイスの多くは、リソース制約的であると考えられ、そのようなデバイスのメモリ容量および/または処理容量は、特に、オンラインサービス、または、事実上無制限のコンピューティングリソースを個々のタスクに提供できるクラウドベースのサービスの容量と比べると、技術的な、経済的な、または他の理由に基づいて制約され得る。そのようなデバイスのいくつかは、そのようなデバイスが、「オフライン」で動作でき、かつ、例えば、そのようなデバイスが通常の使用で時々一時的なネットワーク接続の停止を経験するかもしれないという予想に基づいて、少なくとも一部の時間にオンラインサービスに接続しないことがあるという範囲内で、オフラインデバイスと考えられ得る。
音声対応電子デバイスは、音声ベースのユーザインターフェースを実施するためのオンライン機能およびオフライン機能上の異なる範囲を利用できる。いくつかのデバイスでは、例えば、オンラインサービスの使用を優先させて、音声入力を処理することに関連する多くの動作を実行するが、一つの理由としては、オンラインの音声ベースのクエリプロセッサが、一般に、比較的より大きい処理リソースを充てて、音声ベースのクエリを扱うことができるからである。オンラインサービスによって実行され得る機能の1つは、セマンティック処理であり、デジタルオーディオデータから生成されたテキスト要素(またはトークンとも呼ばれる)を処理して、音声ベースのクエリを介してユーザによって要求されているアクションを決定することを試みる。いくつかの例では、デジタルオーディオ信号は、オンラインサービスに提供されることさえ可能であり、その結果、セマンティック処理と音声-テキスト変換の両方がデバイスから遠隔で実行される。
12 プロセッサ
14 バスサブシステム
16 ストレージサブシステム
18 メモリサブシステム
20 ファイルストレージサブシステム
22 ユーザインターフェース入力デバイス
24 ユーザインターフェース出力デバイス
26 ネットワークインターフェースサブシステム
28 主ランダムアクセスメモリ
30 読み取り専用メモリ
52 音声対応デバイス
54 オンライン検索サービス
56 アプリケーション
58 音声アクションモジュール
60 オンラインインターフェースモジュール
62 レンダリング/同期モジュール
64 ストリーミング音声-テキストモジュール
66 セマンティックプロセッサモジュール
68 構文解析モジュール
70 ダイアログマネージャモジュール
72 アクションビルダモジュール
74 オフライン音響および/または言語モデル
76 オフライン文法モデル
78 オフラインアクションモデル
80 クエリプロセッサ
82 アクションモデル
Claims (20)
- 音声対応電子デバイスを用いて音声入力を受け取るステップと、
前記音声対応電子デバイスにおいて、前記音声入力の少なくとも一部を受け取ることに応答して:
前記音声入力の前記少なくとも一部のローカル処理を実行して、選択的オフライン対応の音声アクションの少なくとも一部をビルドするステップであって、前記選択的オフライン対応の音声アクションのタイプは、少なくとも1つの場合にオフラインで完了されることができ、少なくとも1つの他の場合にオンラインサービスへの接続を使用してのみ完了されることができる、ステップと、
前記ローカル処理の間および前記音声対応電子デバイスがオフラインのときに、前記選択的オフライン対応の音声アクションがオフラインで完了され得るか否かを判定するステップと、
前記選択的オフライン対応の音声アクションがオフラインで完了され得るという判定に応答して、前記ローカル処理を用いて前記選択的オフライン対応の音声アクションを完了するステップと、
前記選択的オフライン対応の音声アクションがオフラインで完了され得ないと判定することに応答して:
前記選択的オフライン対応の音声アクションのための前記ローカル処理によって生成されたデータをローカルに維持するステップと、
前記音声対応電子デバイスが前記オンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了するステップと
を含むことを特徴とする方法。 - 前記音声対応電子デバイスが、ワイヤレスネットワークと通信するとき、前記オンラインサービスと通信するように構成されたモバイルデバイスを具備することを特徴とする請求項1に記載の方法。
- 前記ローカル処理を実行することが、前記音声対応電子デバイスで前記音声入力を完全に受け取る前に、オフライン対応の音声アクションの前記少なくとも一部を動的にビルドし、前記ローカル処理の間および前記音声対応電子デバイスがオフラインのときに、前記選択的オフライン対応の音声アクションがオフラインで完了され得るか否かを判定するステップが、前記音声対応電子デバイスで前記音声入力を完全に受け取る前に実行される、ことを特徴とする請求項1に記載の方法。
- 前記音声対応電子デバイスがオンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了するステップが、前記オンラインサービスから文脈依存データを取り出すステップと、前記文脈依存データを使用して前記選択的オフライン対応の音声アクションを完了するステップとを含む、ことを特徴とする請求項1に記載の方法。
- 前記音声対応電子デバイスがオンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了するステップが、前記文脈依存データのために前記オンラインサービスにクエリを発行するステップを含む、ことを特徴とする請求項4に記載の方法。
- オフライン対応の音声アクションが、少なくとも1つの場所依存のパラメータを含み、前記クエリが、前記音声対応電子デバイスの現在の場所を含み、前記文脈依存データが場所依存データを含む、ことを特徴とする請求項5に記載の方法。
- オフライン対応の音声アクションが前記音声入力に基づいて解決されないままの少なくとも1つのパラメータを含み、前記オンラインサービスから前記文脈依存データを取り出すステップが、前記オンラインサービスから前記少なくとも1つのパラメータのための値を取り出すステップを含む、ことを特徴とする請求項4に記載の方法。
- 前記音声対応電子デバイスがオンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了するステップが、前記オンラインサービスに前記音声対応電子デバイスを同期するステップを含む、ことを特徴とする請求項1に記載の方法。
- 前記音声対応電子デバイスがオンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了するステップが、前記音声対応電子デバイスのユーザに関連付けられた少なくとも1つの他の電子デバイスに、前記音声対応電子デバイスを同期するステップを含む、ことを特徴とする請求項1に記載の方法。
- 前記選択的オフライン対応の音声アクションのための前記ローカル処理によって生成されたデータをローカルに維持するステップが、前記選択的オフライン対応の音声アクションに関連付けられた診断データをローカルに維持するステップを含み、前記音声対応電子デバイスがオンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了するステップが、前記選択的オフライン対応の音声アクションに関連付けられた前記診断データをアップロードするステップを含む、ことを特徴とする請求項1に記載の方法。
- 前記選択的オフライン対応の音声アクションがオフラインで完了できないと判定することに応答して、前記音声対応電子デバイス上で前記選択的オフライン対応の音声アクションのローカルな完了を実行するステップをさらに含み、前記音声対応電子デバイスがオンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了するステップが、前記オンラインサービスを用いて前記選択的オフライン対応の音声アクションのリモート完了を実行するステップを含む、ことを特徴とする請求項1に記載の方法。
- 前記選択的オフライン対応の音声アクションがオフラインで完了され得ないと判定することに応答して、前記音声対応電子デバイスが前記オンラインサービスに接続された後に前記選択的オフライン対応の音声アクションが完了されることを前記音声対応電子デバイスのユーザに通知するステップをさらに含む、ことを特徴とする請求項1に記載の方法。
- 前記選択的オフライン対応の音声アクションがオフラインで完了され得ないと判定することに応答して、前記音声対応電子デバイスが前記オンラインサービスに接続された後に前記選択的オフライン対応の音声アクションが完了されたことを前記音声対応電子デバイスの前記ユーザに通知するステップをさらに含む、ことを特徴とする請求項12に記載の方法。
- 前記選択的オフライン対応の音声アクションの前記タイプが、リマインダタイプ、通信タイプ、イベントタイプ、デバイス設定タイプ、媒体制御タイプ、およびナビゲーションタイプからなるグループから選択される、ことを特徴とする請求項1に記載の方法。
- メモリと、前記メモリ内に格納された命令を実行するように動作可能な1つまたは複数のプロセッサとを具備する装置であって、
音声対応電子デバイスを用いて音声入力を受け取り、
前記音声対応電子デバイスにおいて、前記音声入力の少なくとも一部を受け取ることに応答して:
前記音声入力の前記少なくとも一部のローカル処理を実行して、選択的オフライン対応の音声アクションの少なくとも一部をビルドし、前記選択的オフライン対応の音声アクションのタイプは、少なくとも1つの場合にオフラインで完了されることができ、少なくとも1つの他の場合にオンラインサービスへの接続を使用してのみ完了されることができ、
前記ローカル処理の間および前記音声対応電子デバイスがオフラインのときに、前記選択的オフライン対応の音声アクションがオフラインで完了され得るか否かを判定し、
前記選択的オフライン対応の音声アクションがオフラインで完了され得るという判定に応答して、前記ローカル処理を用いて前記選択的オフライン対応の音声アクションを完了し、
前記選択的オフライン対応の音声アクションがオフラインで完了され得ないと判定することに応答して:
前記選択的オフライン対応の音声アクションのための前記ローカル処理によって生成されたデータをローカルに維持し、
前記音声対応電子デバイスが前記オンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了する
命令を含むことを特徴とする装置。 - 前記命令は、前記音声入力のデジタルオーディオ信号をテキストに変換するストリーミング音声-テキストモジュールを実施する第1の命令であって、前記第1の命令は、前記デジタルオーディオ信号から複数のテキストトークンを動的に生成する、第1の命令と、前記複数のテキストトークンの少なくとも一部から前記選択的オフライン対応の音声アクションの前記一部を動的にビルドするストリーミングセマンティクプロセッサを実施する第2の命令とを含む、ことを特徴とする請求項15に記載の装置。
- 前記音声対応電子デバイスが前記オンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了する前記命令が、前記オンラインサービスから文脈依存データを取り出し、前記文脈依存データを使用して前記選択的オフライン対応の音声アクションを完了する命令を含む、ことを特徴とする請求項15に記載の装置。
- 前記音声対応電子デバイスが前記オンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了する前記命令が、オンラインサービス、または前記音声対応電子デバイスのユーザに関連付けられた少なくとも1つの他の電子デバイスに、前記音声対応電子デバイスを同期する命令を含む、ことを特徴とする請求項15に記載の装置。
- 前記選択的オフライン対応の音声アクションがオフラインで完了され得ないと判定することに応答して、前記音声対応電子デバイス上で前記選択的オフライン対応の音声アクションのローカルな完了を実行する命令をさらに含み、前記音声対応電子デバイスが前記オンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了する前記命令が、前記オンラインサービスを用いた前記選択的オフライン対応の音声アクションのリモート完了を実行する命令を含む、ことを特徴とする請求項15に記載の装置。
- 音声対応電子デバイスを用いて音声入力を受け取るステップと、
前記音声対応電子デバイスにおいて、前記音声入力の少なくとも一部を受け取ることに応答して:
前記音声入力の前記少なくとも一部のローカル処理を実行して、選択的オフライン対応の音声アクションの少なくとも一部をビルドするステップであって、前記選択的オフライン対応の音声アクションのタイプは、少なくとも1つの場合にオフラインで完了されることができ、少なくとも1つの他の場合にオンラインサービスへの接続を使用してのみ完了されることができる、ステップと、
前記ローカル処理の間および前記音声対応電子デバイスがオフラインのときに、前記選択的オフライン対応の音声アクションがオフラインで完了され得るか否かを判定するステップと、
前記選択的オフライン対応の音声アクションがオフラインで完了され得るという判定に応答して、前記ローカル処理を用いて前記選択的オフライン対応の音声アクションを完了するステップと、
前記選択的オフライン対応の音声アクションがオフラインで完了され得ないと判定することに応答して:
前記選択的オフライン対応の音声アクションのための前記ローカル処理によって生成されたデータをローカルに維持するステップと、
前記音声対応電子デバイスが前記オンラインサービスに接続された後、前記ローカルに維持されたデータを使用して前記選択的オフライン対応の音声アクションを完了するステップを含む方法を実行する、1つまたは複数のプロセッサによって実行可能なコンピュータ命令を格納する非一時的コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/723,279 US10083697B2 (en) | 2015-05-27 | 2015-05-27 | Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device |
US14/723,279 | 2015-05-27 | ||
PCT/US2016/033658 WO2016191319A1 (en) | 2015-05-27 | 2016-05-20 | Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018523143A true JP2018523143A (ja) | 2018-08-16 |
JP6553736B2 JP6553736B2 (ja) | 2019-07-31 |
Family
ID=56116557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017550865A Active JP6553736B2 (ja) | 2015-05-27 | 2016-05-20 | 音声対応電子デバイスにおける選択的オフライン対応の音声アクションのためのデータのローカル維持 |
Country Status (8)
Country | Link |
---|---|
US (3) | US10083697B2 (ja) |
EP (2) | EP3584789B1 (ja) |
JP (1) | JP6553736B2 (ja) |
KR (1) | KR102043365B1 (ja) |
CN (2) | CN112291203B (ja) |
DE (1) | DE112016002370T5 (ja) |
GB (1) | GB2553940A (ja) |
WO (1) | WO2016191319A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110238842A (zh) * | 2019-04-30 | 2019-09-17 | 北京云迹科技有限公司 | 用于机器人的远程播放方法及装置 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10922894B2 (en) * | 2016-06-06 | 2021-02-16 | Biodigital, Inc. | Methodology and system for mapping a virtual human body |
US10095529B2 (en) * | 2016-06-07 | 2018-10-09 | Microsoft Technology Licensing, Llc | Font download on application boot |
US10726056B2 (en) * | 2017-04-10 | 2020-07-28 | Sap Se | Speech-based database access |
US10607606B2 (en) * | 2017-06-19 | 2020-03-31 | Lenovo (Singapore) Pte. Ltd. | Systems and methods for execution of digital assistant |
US11170762B2 (en) * | 2018-01-04 | 2021-11-09 | Google Llc | Learning offline voice commands based on usage of online voice commands |
CN112088361A (zh) * | 2018-03-16 | 2020-12-15 | 索尼公司 | 信息处理装置、信息处理方法及程序 |
CN109919607A (zh) * | 2018-11-23 | 2019-06-21 | 阿里巴巴集团控股有限公司 | 基于离线乘车码的换乘优惠方法及装置和电子设备 |
US11544706B2 (en) * | 2019-04-26 | 2023-01-03 | Discover Financial Services | Multi-token provisioning, online purchase transaction processing, and card life cycle management systems and methods |
KR20210061091A (ko) | 2019-11-19 | 2021-05-27 | 삼성전자주식회사 | 인텔리전트 어시스턴스 서비스를 제공하기 위한 전자 장치 및 그의 동작 방법 |
KR102208387B1 (ko) * | 2020-03-10 | 2021-01-28 | 주식회사 엘솔루 | 음성 대화 재구성 방법 및 장치 |
US11853381B2 (en) | 2020-11-13 | 2023-12-26 | Google Llc | Hybrid fetching using a on-device cache |
KR102602513B1 (ko) * | 2021-05-28 | 2023-11-16 | 주식회사 피앤씨솔루션 | 오프라인 환경에서 음성 명령어 번역 기능을 갖는 증강현실 글라스 장치 |
CN115273818B (zh) * | 2022-09-27 | 2022-12-13 | 小米汽车科技有限公司 | 语音处理方法、处理装置、处理设备、车辆和介质 |
CN115662430B (zh) * | 2022-10-28 | 2024-03-29 | 阿波罗智联(北京)科技有限公司 | 输入数据解析方法、装置、电子设备和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259090A (ja) * | 1993-03-09 | 1994-09-16 | Nec Corp | 音声対話システム |
JP2004355629A (ja) * | 2003-05-29 | 2004-12-16 | Microsoft Corp | 高度対話型インターフェースに対する理解同期意味オブジェクト |
US20100088100A1 (en) * | 2008-10-02 | 2010-04-08 | Lindahl Aram M | Electronic devices with voice command and contextual data processing capabilities |
JP2011124629A (ja) * | 2009-12-08 | 2011-06-23 | Nec Corp | スケジュール情報共有システム、スケジュール情報共有方法、通信端末、及びプログラム |
JP2013021691A (ja) * | 2011-07-06 | 2013-01-31 | Samsung Electronics Co Ltd | 通信システムにおけるユーザ端末の情報取得方法および装置 |
JP2013510341A (ja) * | 2009-11-10 | 2013-03-21 | ボイスボックス テクノロジーズ,インク. | 自然言語音声サービス環境におけるハイブリッド処理のシステム及び方法 |
JP2013140269A (ja) * | 2012-01-05 | 2013-07-18 | Denso Corp | 音声認識装置 |
JP2013529794A (ja) * | 2010-06-24 | 2013-07-22 | 本田技研工業株式会社 | 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法 |
Family Cites Families (129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MC1154A1 (fr) | 1976-08-04 | 1978-04-17 | Ile De France | Nouveaux 2,3-alkylene bis(oxy)benzamides substitues,leurs derives et leurs procedes de preparation |
US5092919A (en) | 1991-01-15 | 1992-03-03 | Imperial Chemical Industries Plc | Certain 2-(2'-methyl-3',4'-trisubstituted benzoyl)-1,3-cyclohexanediones |
EP0938077B1 (en) | 1992-12-31 | 2001-06-13 | Apple Computer, Inc. | A speech recognition system |
US6092919A (en) | 1995-08-01 | 2000-07-25 | Guided Systems Technologies, Inc. | System and method for adaptive control of uncertain nonlinear processes |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
US5857099A (en) | 1996-09-27 | 1999-01-05 | Allvoice Computing Plc | Speech-to-text dictation system with audio message capability |
US6856960B1 (en) * | 1997-04-14 | 2005-02-15 | At & T Corp. | System and method for providing remote automatic speech recognition and text-to-speech services via a packet network |
US8209184B1 (en) * | 1997-04-14 | 2012-06-26 | At&T Intellectual Property Ii, L.P. | System and method of providing generated speech via a network |
US6779030B1 (en) * | 1997-10-06 | 2004-08-17 | Worldcom, Inc. | Intelligent network |
US6215879B1 (en) | 1997-11-19 | 2001-04-10 | Philips Semiconductors, Inc. | Method for introducing harmonics into an audio stream for improving three dimensional audio positioning |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US6963759B1 (en) * | 1999-10-05 | 2005-11-08 | Fastmobile, Inc. | Speech recognition technique based on local interrupt detection |
US6442520B1 (en) | 1999-11-08 | 2002-08-27 | Agere Systems Guardian Corp. | Method and apparatus for continuous speech recognition using a layered, self-adjusting decoded network |
US6678415B1 (en) | 2000-05-12 | 2004-01-13 | Xerox Corporation | Document image decoding using an integrated stochastic language model |
US20020042707A1 (en) * | 2000-06-19 | 2002-04-11 | Gang Zhao | Grammar-packaged parsing |
US7464033B2 (en) | 2000-07-31 | 2008-12-09 | Texas Instruments Incorporated | Decoding multiple HMM sets using a single sentence grammar |
US6421607B1 (en) * | 2000-09-22 | 2002-07-16 | Motorola, Inc. | System and method for distributed navigation service |
US6751595B2 (en) * | 2001-05-09 | 2004-06-15 | Bellsouth Intellectual Property Corporation | Multi-stage large vocabulary speech recognition system and method |
DE10147341B4 (de) * | 2001-09-26 | 2005-05-19 | Voiceobjects Ag | Verfahren und Vorrichtung zum Aufbau einer in einem Computersystem implementierten Dialogsteuerung aus Dialogobjekten sowie zugehöriges Computersystem zur Durchführung einer Dialogsteuerung |
US20030120493A1 (en) | 2001-12-21 | 2003-06-26 | Gupta Sunil K. | Method and system for updating and customizing recognition vocabulary |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7233786B1 (en) * | 2002-08-06 | 2007-06-19 | Captaris, Inc. | Providing access to information of multiple types via coordination of distinct information services |
US7197331B2 (en) * | 2002-12-30 | 2007-03-27 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
US7729913B1 (en) * | 2003-03-18 | 2010-06-01 | A9.Com, Inc. | Generation and selection of voice recognition grammars for conducting database searches |
US8292433B2 (en) * | 2003-03-21 | 2012-10-23 | Queen's University At Kingston | Method and apparatus for communication between humans and devices |
US7653191B1 (en) * | 2003-06-26 | 2010-01-26 | Microsoft Corporation | Voice call routing by dynamic personal profile |
US7392188B2 (en) * | 2003-07-31 | 2008-06-24 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method enabling acoustic barge-in |
JP2005284880A (ja) * | 2004-03-30 | 2005-10-13 | Nec Corp | 音声認識サービスシステム |
EP2317508B1 (en) | 2004-10-05 | 2012-06-27 | Inago Corporation | Grammar rule generation for speech recognition |
KR100695127B1 (ko) * | 2004-10-08 | 2007-03-14 | 삼성전자주식회사 | 다 단계 음성 인식 장치 및 방법 |
US20060129931A1 (en) * | 2004-12-10 | 2006-06-15 | Microsoft Corporation | Integrated client help viewer for internet-based and local help content |
KR100718147B1 (ko) * | 2005-02-01 | 2007-05-14 | 삼성전자주식회사 | 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법 |
US20060177011A1 (en) * | 2005-02-07 | 2006-08-10 | Jens Skakkebaek | System and method for providing code on voicemail appliance |
US7697509B2 (en) | 2005-06-03 | 2010-04-13 | Alcatel-Lucent Usa Inc. | Dynamic E911 updating in a VoIP telephony system |
US7949529B2 (en) * | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US11153425B2 (en) * | 2005-09-01 | 2021-10-19 | Xtone, Inc. | System and method for providing interactive services |
WO2007034478A2 (en) | 2005-09-20 | 2007-03-29 | Gadi Rechlis | System and method for correcting speech |
US7929941B2 (en) * | 2005-12-16 | 2011-04-19 | Alcatel-Lucent Usa Inc. | System for providing emergency voice mail service |
US7689420B2 (en) * | 2006-04-06 | 2010-03-30 | Microsoft Corporation | Personalizing a context-free grammar using a dictation language model |
US20070276651A1 (en) | 2006-05-23 | 2007-11-29 | Motorola, Inc. | Grammar adaptation through cooperative client and server based speech recognition |
US7664530B2 (en) * | 2006-06-09 | 2010-02-16 | AT&I Intellectual Property I, L.P | Method and system for automated planning using geographical data |
US20090030697A1 (en) | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Using contextual information for delivering results generated from a speech recognition facility using an unstructured language model |
US8949130B2 (en) * | 2007-03-07 | 2015-02-03 | Vlingo Corporation | Internal and external speech recognition use with a mobile communication facility |
TWI375933B (en) * | 2007-08-07 | 2012-11-01 | Triforce Co Ltd | Language learning method and system thereof |
US9569806B2 (en) | 2007-09-04 | 2017-02-14 | Apple Inc. | Dynamic presentation of location-specific information |
US8166126B2 (en) * | 2007-09-18 | 2012-04-24 | Cassidian Communications, Inc. | System and method for distributing notifications to a group of recipients |
US20100172287A1 (en) * | 2007-10-25 | 2010-07-08 | Krieter Marcus | Temporal network server connected devices with off-line ad hoc update and interaction capability |
US8463424B2 (en) * | 2007-11-07 | 2013-06-11 | Research In Motion Limited | System and method for displaying address information on a map |
US8150689B2 (en) | 2007-12-21 | 2012-04-03 | Nvoq Incorporated | Distributed dictation/transcription system |
US9177551B2 (en) | 2008-01-22 | 2015-11-03 | At&T Intellectual Property I, L.P. | System and method of providing speech processing in user interface |
US8700310B2 (en) * | 2008-02-05 | 2014-04-15 | Madhavi Jayanthi | Mobile device and server for facilitating GPS based services |
WO2009123880A1 (en) * | 2008-03-31 | 2009-10-08 | Echostar Technologies Llc | Systems, methods and apparatus for transmitting data over a voice channel of a wireless telephone network |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US20100153335A1 (en) * | 2008-12-12 | 2010-06-17 | Microsoft Corporation | Synchronizing multiple classes with disparate schemas in the same collection |
US8695058B2 (en) * | 2009-05-20 | 2014-04-08 | Mobile Iron, Inc. | Selective management of mobile device data in an enterprise environment |
CN101604204B (zh) | 2009-07-09 | 2011-01-05 | 北京科技大学 | 智能情感机器人分布式认知系统 |
US8892439B2 (en) | 2009-07-15 | 2014-11-18 | Microsoft Corporation | Combination and federation of local and remote speech recognition |
US8391320B2 (en) | 2009-07-28 | 2013-03-05 | Avaya Inc. | State-based management of messaging system jitter buffers |
US9172803B2 (en) * | 2009-08-23 | 2015-10-27 | Aspect Software, Inc. | System and method for integrating runtime usage statistics with developing environment |
US10264029B2 (en) * | 2009-10-30 | 2019-04-16 | Time Warner Cable Enterprises Llc | Methods and apparatus for packetized content delivery over a content delivery network |
WO2011059997A1 (en) * | 2009-11-10 | 2011-05-19 | Voicebox Technologies, Inc. | System and method for providing a natural language content dedication service |
WO2011133824A1 (en) * | 2010-04-21 | 2011-10-27 | Michael Jerry Saylor | Multimodal interactive voice response system |
US8412163B2 (en) * | 2010-04-29 | 2013-04-02 | Microsoft Corporation | Local voicemail for mobile devices |
CN101938522A (zh) * | 2010-08-31 | 2011-01-05 | 中华电信股份有限公司 | 语音微博客服务的方法 |
US8954291B2 (en) * | 2010-09-30 | 2015-02-10 | Fitbit, Inc. | Alarm setting and interfacing with gesture contact interfacing controls |
US8719368B2 (en) * | 2010-10-07 | 2014-05-06 | Facebook, Inc. | Preferred contact channel for user communications |
US8869307B2 (en) * | 2010-11-19 | 2014-10-21 | Mobile Iron, Inc. | Mobile posture-based policy, remediation and access control for enterprise resources |
US9183843B2 (en) | 2011-01-07 | 2015-11-10 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
US10049669B2 (en) | 2011-01-07 | 2018-08-14 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
JP6317111B2 (ja) | 2011-02-22 | 2018-04-25 | スピーク・ウィズ・ミー・インコーポレイテッドSpeak With Me,Inc. | ハイブリッド型クライアントサーバ音声認識 |
US9202465B2 (en) | 2011-03-25 | 2015-12-01 | General Motors Llc | Speech recognition dependent on text message content |
US9679561B2 (en) * | 2011-03-28 | 2017-06-13 | Nuance Communications, Inc. | System and method for rapid customization of speech recognition models |
CN102215233A (zh) | 2011-06-07 | 2011-10-12 | 盛乐信息技术(上海)有限公司 | 信息系统客户端及信息发布与获取方法 |
GB2493413B (en) * | 2011-07-25 | 2013-12-25 | Ibm | Maintaining and supplying speech models |
US20130085753A1 (en) | 2011-09-30 | 2013-04-04 | Google Inc. | Hybrid Client/Server Speech Recognition In A Mobile Device |
US8972263B2 (en) | 2011-11-18 | 2015-03-03 | Soundhound, Inc. | System and method for performing dual mode speech recognition |
CN102496364A (zh) * | 2011-11-30 | 2012-06-13 | 苏州奇可思信息科技有限公司 | 基于云端网络的交互式语音识别方法 |
US9620122B2 (en) | 2011-12-08 | 2017-04-11 | Lenovo (Singapore) Pte. Ltd | Hybrid speech recognition |
CN104094287A (zh) | 2011-12-21 | 2014-10-08 | 诺基亚公司 | 用于情境识别的方法、装置以及计算机软件 |
EP2817938B1 (en) | 2012-02-24 | 2019-04-03 | Wyse Technology L.L.C. | Information sharing using token received using visual tag |
CN102694788B (zh) * | 2012-03-07 | 2014-08-13 | 张春晓 | 一种服务器端提供客户端远程服务的方法和系统 |
US20130246392A1 (en) | 2012-03-14 | 2013-09-19 | Inago Inc. | Conversational System and Method of Searching for Information |
US10431235B2 (en) * | 2012-05-31 | 2019-10-01 | Elwha Llc | Methods and systems for speech adaptation data |
US20140036023A1 (en) * | 2012-05-31 | 2014-02-06 | Volio, Inc. | Conversational video experience |
WO2013185109A2 (en) * | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
EP2864982B1 (en) | 2012-06-22 | 2018-10-17 | Visteon Global Technologies, Inc. | Multi-pass vehicle voice recognition systems and methods |
US9053708B2 (en) | 2012-07-18 | 2015-06-09 | International Business Machines Corporation | System, method and program product for providing automatic speech recognition (ASR) in a shared resource environment |
US20140039893A1 (en) | 2012-07-31 | 2014-02-06 | Sri International | Personalized Voice-Driven User Interfaces for Remote Multi-User Services |
US9497515B2 (en) | 2012-08-16 | 2016-11-15 | Nuance Communications, Inc. | User interface for entertainment systems |
US8799959B2 (en) | 2012-08-16 | 2014-08-05 | Hoi L. Young | User interface for entertainment systems |
US9106957B2 (en) | 2012-08-16 | 2015-08-11 | Nuance Communications, Inc. | Method and apparatus for searching data sources for entertainment systems |
US9384736B2 (en) * | 2012-08-21 | 2016-07-05 | Nuance Communications, Inc. | Method to provide incremental UI response based on multiple asynchronous evidence about user input |
US9583100B2 (en) | 2012-09-05 | 2017-02-28 | GM Global Technology Operations LLC | Centralized speech logger analysis |
US9507329B2 (en) * | 2012-09-21 | 2016-11-29 | Apple Inc. | Apparatus and methods for controlled switching of electronic access clients without requiring network access |
KR20150063423A (ko) | 2012-10-04 | 2015-06-09 | 뉘앙스 커뮤니케이션즈, 인코포레이티드 | Asr을 위한 개선된 하이브리드 컨트롤러 |
CN104737226B (zh) | 2012-10-16 | 2017-06-06 | 奥迪股份公司 | 机动车中的语音识别 |
WO2014065808A1 (en) * | 2012-10-26 | 2014-05-01 | Blackberry Limited | Text and context recognition through images and video |
US9093069B2 (en) * | 2012-11-05 | 2015-07-28 | Nuance Communications, Inc. | Privacy-sensitive speech model creation via aggregation of multiple user models |
US9190057B2 (en) * | 2012-12-12 | 2015-11-17 | Amazon Technologies, Inc. | Speech model retrieval in distributed speech recognition systems |
US9185227B2 (en) * | 2012-12-14 | 2015-11-10 | Kirusa, Inc. | Sender driven call completion system |
US8977555B2 (en) | 2012-12-20 | 2015-03-10 | Amazon Technologies, Inc. | Identification of utterance subjects |
US8494853B1 (en) | 2013-01-04 | 2013-07-23 | Google Inc. | Methods and systems for providing speech recognition systems based on speech recordings logs |
WO2014137341A1 (en) | 2013-03-07 | 2014-09-12 | Nuance Communications, Inc. | Method for training an automatic speech recognition system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
KR102073102B1 (ko) * | 2013-03-21 | 2020-02-04 | 삼성전자 주식회사 | 언어인식을 위한 언어모델 db, 언어인식장치와 언어인식방법, 및 언어인식시스템 |
US9430465B2 (en) | 2013-05-13 | 2016-08-30 | Facebook, Inc. | Hybrid, offline/online speech translation system |
US9449599B2 (en) | 2013-05-30 | 2016-09-20 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
CN103400576B (zh) | 2013-07-18 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 基于用户行为日志的语音模型更新方法及装置 |
DE102013215136A1 (de) | 2013-08-01 | 2015-02-05 | Dywidag-Systems International Gmbh | Korrosionsgeschütztes Zugglied und plastisch verformbare Scheibe aus Korrosionsschutzmaterial für ein derartiges Zugglied |
US9412362B2 (en) | 2013-08-28 | 2016-08-09 | Verint Systems Ltd. | System and method for determining the compliance of agent scripts |
US9904720B2 (en) * | 2013-09-18 | 2018-02-27 | Facebook, Inc. | Generating offline content |
JP2016531375A (ja) | 2013-09-20 | 2016-10-06 | アマゾン テクノロジーズ インコーポレイテッド | ローカルとリモートのスピーチ処理 |
US9530416B2 (en) * | 2013-10-28 | 2016-12-27 | At&T Intellectual Property I, L.P. | System and method for managing models for embedded speech and language processing |
US9666188B2 (en) * | 2013-10-29 | 2017-05-30 | Nuance Communications, Inc. | System and method of performing automatic speech recognition using local private data |
US20150120296A1 (en) * | 2013-10-29 | 2015-04-30 | At&T Intellectual Property I, L.P. | System and method for selecting network-based versus embedded speech processing |
DE102013224581A1 (de) | 2013-11-29 | 2015-06-03 | Osram Opto Semiconductors Gmbh | Optoelektronisches Bauelement und Verfahren zu seiner Herstellung |
CN104751843A (zh) * | 2013-12-25 | 2015-07-01 | 上海博泰悦臻网络技术服务有限公司 | 一种语音服务切换方法和系统 |
US20150186892A1 (en) * | 2013-12-30 | 2015-07-02 | Tencent Technology (Shenzhen) Company Limited | Methods and systems for verifying a transaction |
US8868409B1 (en) | 2014-01-16 | 2014-10-21 | Google Inc. | Evaluating transcriptions with a semantic parser |
US20150255068A1 (en) * | 2014-03-10 | 2015-09-10 | Microsoft Corporation | Speaker recognition including proactive voice model retrieval and sharing features |
US20150293509A1 (en) * | 2014-04-15 | 2015-10-15 | Ford Global Technologies, Llc | In-vehicle home automation integration |
US20150370787A1 (en) | 2014-06-18 | 2015-12-24 | Microsoft Corporation | Session Context Modeling For Conversational Understanding Systems |
US9462112B2 (en) * | 2014-06-19 | 2016-10-04 | Microsoft Technology Licensing, Llc | Use of a digital assistant in communications |
US20150371628A1 (en) | 2014-06-23 | 2015-12-24 | Harman International Industries, Inc. | User-adapted speech recognition |
US9548066B2 (en) | 2014-08-11 | 2017-01-17 | Amazon Technologies, Inc. | Voice application architecture |
CN104462262B (zh) * | 2014-11-21 | 2017-10-31 | 北京奇虎科技有限公司 | 一种实现语音搜索的方法、装置和浏览器客户端 |
US9460713B1 (en) | 2015-03-30 | 2016-10-04 | Google Inc. | Language model biasing modulation |
US10114676B2 (en) | 2015-05-05 | 2018-10-30 | Microsoft Technology Licensing, Llc | Building multimodal collaborative dialogs with task frames |
US9922138B2 (en) | 2015-05-27 | 2018-03-20 | Google Llc | Dynamically updatable offline grammar model for resource-constrained offline device |
-
2015
- 2015-05-27 US US14/723,279 patent/US10083697B2/en active Active
-
2016
- 2016-05-20 EP EP19188888.2A patent/EP3584789B1/en active Active
- 2016-05-20 JP JP2017550865A patent/JP6553736B2/ja active Active
- 2016-05-20 KR KR1020177027560A patent/KR102043365B1/ko active IP Right Grant
- 2016-05-20 EP EP16728170.8A patent/EP3262637B1/en active Active
- 2016-05-20 GB GB1715766.0A patent/GB2553940A/en not_active Withdrawn
- 2016-05-20 DE DE112016002370.7T patent/DE112016002370T5/de not_active Withdrawn
- 2016-05-20 CN CN202011084350.2A patent/CN112291203B/zh active Active
- 2016-05-20 WO PCT/US2016/033658 patent/WO2016191319A1/en active Application Filing
- 2016-05-20 CN CN201680020179.4A patent/CN107430853B/zh active Active
-
2018
- 2018-08-28 US US16/115,219 patent/US10334080B2/en active Active
-
2019
- 2019-06-24 US US16/450,296 patent/US10986214B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259090A (ja) * | 1993-03-09 | 1994-09-16 | Nec Corp | 音声対話システム |
JP2004355629A (ja) * | 2003-05-29 | 2004-12-16 | Microsoft Corp | 高度対話型インターフェースに対する理解同期意味オブジェクト |
US20100088100A1 (en) * | 2008-10-02 | 2010-04-08 | Lindahl Aram M | Electronic devices with voice command and contextual data processing capabilities |
JP2013510341A (ja) * | 2009-11-10 | 2013-03-21 | ボイスボックス テクノロジーズ,インク. | 自然言語音声サービス環境におけるハイブリッド処理のシステム及び方法 |
JP2011124629A (ja) * | 2009-12-08 | 2011-06-23 | Nec Corp | スケジュール情報共有システム、スケジュール情報共有方法、通信端末、及びプログラム |
JP2013529794A (ja) * | 2010-06-24 | 2013-07-22 | 本田技研工業株式会社 | 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法 |
JP2013021691A (ja) * | 2011-07-06 | 2013-01-31 | Samsung Electronics Co Ltd | 通信システムにおけるユーザ端末の情報取得方法および装置 |
JP2013140269A (ja) * | 2012-01-05 | 2013-07-18 | Denso Corp | 音声認識装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110238842A (zh) * | 2019-04-30 | 2019-09-17 | 北京云迹科技有限公司 | 用于机器人的远程播放方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20160351200A1 (en) | 2016-12-01 |
US10083697B2 (en) | 2018-09-25 |
EP3584789B1 (en) | 2022-03-16 |
CN107430853A (zh) | 2017-12-01 |
US20190387076A1 (en) | 2019-12-19 |
CN107430853B (zh) | 2020-11-03 |
US20180366129A1 (en) | 2018-12-20 |
US10986214B2 (en) | 2021-04-20 |
GB2553940A (en) | 2018-03-21 |
WO2016191319A1 (en) | 2016-12-01 |
EP3584789A1 (en) | 2019-12-25 |
EP3262637A1 (en) | 2018-01-03 |
JP6553736B2 (ja) | 2019-07-31 |
KR20170125901A (ko) | 2017-11-15 |
EP3262637B1 (en) | 2019-08-28 |
CN112291203A (zh) | 2021-01-29 |
US10334080B2 (en) | 2019-06-25 |
CN112291203B (zh) | 2023-04-18 |
DE112016002370T5 (de) | 2018-02-15 |
KR102043365B1 (ko) | 2019-11-11 |
GB201715766D0 (en) | 2017-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6553736B2 (ja) | 音声対応電子デバイスにおける選択的オフライン対応の音声アクションのためのデータのローカル維持 | |
US11676606B2 (en) | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device | |
EP3389044B1 (en) | Management layer for multiple intelligent personal assistant services | |
EP3385946B1 (en) | Dynamically updatable offline grammar model for resource-constrained offline device | |
EP3304546B1 (en) | Selective aborting of online processing of voice inputs in a voice-enabled electronic device | |
JP2024019405A (ja) | 2パスエンドツーエンド音声認識 | |
US20240169989A1 (en) | Multimodal responses | |
US11990124B2 (en) | Language model prediction of API call invocations and verbal responses |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190610 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6553736 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |