JP6535349B2 - 以前の対話行為を使用する自然言語処理における文脈解釈 - Google Patents
以前の対話行為を使用する自然言語処理における文脈解釈 Download PDFInfo
- Publication number
- JP6535349B2 JP6535349B2 JP2016567966A JP2016567966A JP6535349B2 JP 6535349 B2 JP6535349 B2 JP 6535349B2 JP 2016567966 A JP2016567966 A JP 2016567966A JP 2016567966 A JP2016567966 A JP 2016567966A JP 6535349 B2 JP6535349 B2 JP 6535349B2
- Authority
- JP
- Japan
- Prior art keywords
- natural language
- language input
- semantic representation
- user
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Description
本開示は、ユーザとのマルチターン対話インタラクション(例えば、いくつかのタスクを達成するための、複数のユーザ発話及び/または複数のシステム応答を含む、口語の対話セッション)を自然に行い、かつ正確に管理する音声処理システムの能力を向上することに関する。概して記載すると、マルチターン対話インタラクションの音声処理結果の正確性は、少なくとも一部は、以前にユーザが開始した及び/またはシステムが開始した対話インタラクションの文脈におけるユーザ発話により伝えられる意図または情報を判定できることに依存する。音声処理システムがマルチターン対話インタラクションの適切な文脈保持に失敗した場合、またはユーザが脱線したり、予測外の意図に関する発話を行ったり、文の断片を発話したりするなどの場合、音声処理システムはユーザ発話に正確に応答できない場合がある。いくつかのシステムは、特定の応答のみを可能にする制限的な文法または高度に構造化された対話を使用する(例えば、特定の情報を導出するプロンプトは導出された情報のみに応答し、他の全ての応答は拒否される)。しかしながら、係るシステムは、多くのユーザ及びアプリケーション開発者が望む、自然な口語インタラクションを実現しない。他のシステムは、将来のユーザ発話の予測される主題に関する内部「ヒント」または他の情報(例えば、予測される意図または意図に関連する情報)を使用する。次のユーザ発話は予測される主題に対する先入観を伴って処理される可能性があるが、それでも予測外の主題に関する発話を適切に受容し処理することが可能である。しかしながら、係るシステムは、処理中のマルチターン対話インタラクションからの脱線、及びマルチターン対話インタラクションへの復帰を適切に処理できないことがあり、あるいは、マルチターン対話インタラクションの現在の文脈をあまりに頻繁に、またはあまりに急速に失うことがある。
文脈インタープリタによる音声処理システムの例
文脈インタープリタを使用して処理されるマルチターンインタラクションの例
マルチターンインタラクション文脈を使用する発話の解釈プロセス
追加の実施形態
実施形態により、本明細書に記載した任意のプロセスまたはアルゴリズムの特定の動作、事象、または機能は、異なる順序で行うこと、追加すること、マージすること、または完全に省略すること(例えば、記載した全ての操作または事象がアルゴリズムの実施に必要という訳ではない)ができる。さらに、特定の実施形態では、操作または事象は、例えば、マルチスレッド処理、割り込み処理、複数のプロセッサもしくはプロセッサコアを通して、または他の並列アーキテクチャ上で、連続的ではなく同時に行うことができる。
1.実行可能命令を記憶するコンピュータ可読メモリと、
前記コンピュータ可読メモリと通信する1つ以上のプロセッサであり、前記1つ以上のプロセッサは前記実行可能命令により、少なくとも
ユーザの第1発話に関する第1オーディオデータを取得することと、
前記第1オーディオデータに少なくとも部分的に基づいて、第1音声処理結果を生成することであり、前記第1音声処理結果が前記第1発話の意味論的表現を備え、
前記第1音声処理結果に少なくとも部分的に基づいて、前記ユーザへの提示に対する第1応答を生成することと、
前記第1発話の前記意味論的表現と、前記第1応答の意味論的表現とを備える文脈情報を記憶することと、
前記ユーザの第2発話に関する第2オーディオデータを取得することと、
前記第2オーディオデータ、前記文脈情報、及び文脈解釈ルールを使用して第2音声処理結果を生成することであり、前記文脈解釈ルールは前記第1発話の前記意味論的表現のスロット値または意図のうち少なくとも1つを前記第2発話の意味論的表現のスロット値または意図のうち少なくとも1つに置き換えることに関し、前記文脈ルールは前記第1応答の前記意味論的表現に少なくとも部分的に基づき、
前記第2音声処理結果に少なくとも部分的に基づいて、前記ユーザへの提示に対する第2応答を生成することと、
をプログラムされる前記1つ以上のプロセッサと、
を備えるシステム。
第1自然言語入力及び前記第1自然言語入力への第1応答に関連する文脈情報を記憶することであり、前記文脈情報は前記第1自然言語入力の意味論的表現と、前記自然言語入力への前記第1応答の意味論的表現とを備え、
前記文脈情報に少なくとも部分的に基づいて、第2自然言語入力に対する自然言語処理結果を生成することであり、前記自然言語処理結果は前記第1自然言語入力の意味論的表現にマージされる前記第2自然言語入力の意味論的表現の少なくとも1部を備え、
前記自然言語処理結果に少なくとも部分的に基づいて、前記第2自然言語入力への第2応答を生成することと、
を備えるコンピュータ実装方法。
第1自然言語入力及び前記第1自然言語入力への第1応答に関連する文脈情報を記憶することであり、前記文脈情報は前記第1自然言語入力の意味論的表現と、前記自然言語入力への前記第1応答の意味論的表現とを備え、
前記文脈情報に少なくとも部分的に基づいて、第2自然言語入力に対する自然言語処理結果を生成することであり、前記自然言語処理結果は前記第1自然言語入力の前記意味論的表現にマージされる前記第2自然言語入力の意味論的表現の少なくともの1部を備え、
前記自然言語処理結果に少なくとも部分的に基づいて、前記第2自然言語入力への第2応答を生成することと
を備えるプロセスを行わせる実行可能コードを備える、非一時的なコンピュータ可読記憶装置。
Claims (12)
- 実行可能命令を記憶するコンピュータ可読メモリと、
前記コンピュータ可読メモリと通信する1つ以上のプロセッサであり、前記1つ以上のプロセッサは前記実行可能命令により、少なくとも
ユーザの第1発話に関する第1オーディオデータを取得することと、
前記第1オーディオデータに少なくとも部分的に基づき、第1の意図及び前記第1の意図に関連する1または複数のスロット値を含む前記第1発話の意味論的表現を有する、第1音声処理結果を生成することと、
前記第1音声処理結果に基づいて、前記ユーザへの提示に対する第1応答を生成することと、
前記第1発話の意味論的表現と、前記第1応答の意味論的表現とを有する文脈情報を記憶することと、
前記ユーザの第2発話に関する第2オーディオデータを取得することと、
前記第2オーディオデータを使用し、第2の意図を含む前記第2発話の意味論的表現を有する、第2音声処理結果を生成することと、
前記第2オーディオデータの取得に続いて、ユーザの第3発話に関する第3オーディオデータを取得することと、
前記第3オーディオデータに基づき、前記第1の意図に関する前記第3発話の意味論的表現を有する第3音声処理結果を生成することと、
前記第1発話の前記意味論的表現のスロット値または意図のうち少なくとも1つを前記第3発話の意味論的表現のスロット値または意図のうち少なくとも1つに置き換えることに関する前記文脈情報、および前記第3オーディオデータ及び前記第1応答の前記意味論的表現に基づく文脈解釈ルールを使用し、マージされた音声処理結果を生成することと、
前記マージされた音声処理結果に基づいて、前記ユーザへの提示に対する第2応答を生成することと、
を備えるシステム。 - 特定のコンピュータ実行可能命令で構成される1つ以上のコンピューティングデバイスの制御下において、
第1の意図に関連する第1自然言語入力の意味論的表現と、前記自然言語入力に対する第1応答の意味論的表現とを含み、第1自然言語入力及び前記第1自然言語入力への前記第1応答に関連する文脈情報を記憶することと、
前記第1自然言語入力を受け取った後、第2自然言語入力を受けとることと、
第2の意図に関連する第2自然言語入力の意味論的表現を生成することと、
前記第2自然言語入力を受け取った後、第3自然言語入力を受けとることと、
前記第1の意図に関連する第3自然言語入力の意味論的表現を生成することと、
前記文脈情報と、第1自然言語入力の意味論的表現と、第3自然言語入力の意味論的表現とを使用し、前記第1自然言語入力の前記意味論的表現のコンテンツのスロット値を前記第3自然言語入力の前記意味論的表現のコンテンツのスロット値に置き換える自然言語処理結果を生成することと、
前記自然言語処理結果に基づいて、前記第3自然言語入力への第2応答を生成することと、
を備えるコンピュータ実装方法。
- 前記自然言語入力はテキスト入力または音声入力を含む、請求項2に記載のコンピュータ実装方法。
- 前記第1自然言語入力の意味論的繰り返しの意図を前記第3自然言語入力の前記意味論的表現の意図に置き換えることをさらに備える、請求項2に記載のコンピュータ実装方法。
- 前記自然言語処理結果は文脈解釈ルールに基づいて生成される、請求項2に記載のコンピュータ実装方法。
- 前記文脈解釈ルールは、前記第1自然言語入力の前記意味論的表現のドメインが前記第2自然言語入力の前記意味論的表現のドメインに等しいかどうかを判定することに関する、請求項5に記載のコンピュータ実装方法。
- 前記文脈解釈ルールは、前記第1自然言語入力の前記意味論的表現に関連する意図またはスロットの少なくとも1つが前記第2自然言語入力の前記意味論的表現に関連する意図またはスロットの少なくとも1つに等しいかどうかを判定することに関する、請求項5に記載のコンピュータ実装方法。
- 前記文脈解釈ルールは、前記第1自然言語入力への前記第1応答の前記意味論的表現に関する、請求項5に記載のコンピュータ実装方法。
- 前記文脈解釈ルールはさらに、前記第1自然言語入力への前記第1応答の前記意味論的表現が前記第1自然言語入力の前記意味論的表現に関連する情報の導出に対応するかどうかを判定することに関する、請求項8に記載のコンピュータ実装方法。
- 前記文脈解釈ルールは、さらに、前記第1自然言語入力への前記第1応答の前記意味論的表現が前記第1自然言語入力の前記意味論的表現に関連する情報の確認に対応するかどうかを判定することに関する、請求項8に記載のコンピュータ実装方法。
- 前記自然言語処理結果の少なくとも一部を再ランク付けすることをさらに備える、請求項2に記載のコンピュータ実装方法。
- 前記自然言語処理結果の少なくとも一部をフィルタリングすることをさらに備える、請求項2に記載のコンピュータ実装方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/283,017 US10726831B2 (en) | 2014-05-20 | 2014-05-20 | Context interpretation in natural language processing using previous dialog acts |
US14/283,017 | 2014-05-20 | ||
PCT/US2015/031765 WO2015179510A1 (en) | 2014-05-20 | 2015-05-20 | Context interpretation in natural language processing using previous dialog acts |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017516153A JP2017516153A (ja) | 2017-06-15 |
JP6535349B2 true JP6535349B2 (ja) | 2019-06-26 |
Family
ID=53284602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016567966A Active JP6535349B2 (ja) | 2014-05-20 | 2015-05-20 | 以前の対話行為を使用する自然言語処理における文脈解釈 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10726831B2 (ja) |
EP (1) | EP3146523B1 (ja) |
JP (1) | JP6535349B2 (ja) |
CN (1) | CN106796787B (ja) |
WO (1) | WO2015179510A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11756533B2 (en) | 2020-05-15 | 2023-09-12 | Google Llc | Hot-word free pre-emption of automated assistant response presentation |
Families Citing this family (214)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10956485B2 (en) | 2011-08-31 | 2021-03-23 | Google Llc | Retargeting in a search environment |
US10630751B2 (en) * | 2016-12-30 | 2020-04-21 | Google Llc | Sequence dependent data message consolidation in a voice activated computer network environment |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
JP2016508007A (ja) | 2013-02-07 | 2016-03-10 | アップル インコーポレイテッド | デジタルアシスタントのためのボイストリガ |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US10614153B2 (en) | 2013-09-30 | 2020-04-07 | Google Llc | Resource size-based content item selection |
US9703757B2 (en) | 2013-09-30 | 2017-07-11 | Google Inc. | Automatically determining a size for a content item for a web page |
US10431209B2 (en) | 2016-12-30 | 2019-10-01 | Google Llc | Feedback controller for data transmissions |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
JP6448950B2 (ja) * | 2014-08-20 | 2019-01-09 | シャープ株式会社 | 音声対話装置及び電子機器 |
US20160092159A1 (en) * | 2014-09-30 | 2016-03-31 | Google Inc. | Conversational music agent |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9678947B2 (en) * | 2014-11-21 | 2017-06-13 | International Business Machines Corporation | Pattern identification and correction of document misinterpretations in a natural language processing system |
US9690776B2 (en) * | 2014-12-01 | 2017-06-27 | Microsoft Technology Licensing, Llc | Contextual language understanding for multi-turn language tasks |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
US20200143115A1 (en) * | 2015-01-23 | 2020-05-07 | Conversica, Inc. | Systems and methods for improved automated conversations |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10418032B1 (en) * | 2015-04-10 | 2019-09-17 | Soundhound, Inc. | System and methods for a virtual assistant to manage and use context in a natural language dialog |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10249297B2 (en) | 2015-07-13 | 2019-04-02 | Microsoft Technology Licensing, Llc | Propagating conversational alternatives using delayed hypothesis binding |
US20170017419A1 (en) * | 2015-07-15 | 2017-01-19 | Innovium, Inc. | System And Method For Enabling High Read Rates To Data Element Lists |
US20170017420A1 (en) | 2015-07-15 | 2017-01-19 | Innovium, Inc. | System And Method For Enabling High Read Rates To Data Element Lists |
US20170017414A1 (en) | 2015-07-15 | 2017-01-19 | Innovium, Inc. | System And Method For Implementing Hierarchical Distributed-Linked Lists For Network Devices |
US20170017567A1 (en) | 2015-07-15 | 2017-01-19 | Innovium, Inc. | System And Method For Implementing Distributed-Linked Lists For Network Devices |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10331464B2 (en) * | 2015-09-17 | 2019-06-25 | Dropbox, Inc. | Method and system for an adaptive contextual instruction tool |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10796693B2 (en) * | 2015-12-09 | 2020-10-06 | Lenovo (Singapore) Pte. Ltd. | Modifying input based on determined characteristics |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
EP3414758B1 (en) * | 2016-02-12 | 2020-09-23 | Samsung Electronics Co., Ltd. | Method and electronic device for performing voice based actions |
JP6481643B2 (ja) * | 2016-03-08 | 2019-03-13 | トヨタ自動車株式会社 | 音声処理システムおよび音声処理方法 |
WO2017168246A1 (en) * | 2016-03-29 | 2017-10-05 | Maluuba Inc. | Hierarchical attention for spoken dialogue state tracking |
WO2017200078A1 (ja) * | 2016-05-20 | 2017-11-23 | 日本電信電話株式会社 | 対話方法、対話システム、対話装置、およびプログラム |
EP3465463A1 (en) * | 2016-06-03 | 2019-04-10 | Maluuba Inc. | Natural language generation in a spoken dialogue system |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10490187B2 (en) * | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US9996532B2 (en) | 2016-06-17 | 2018-06-12 | Microsoft Technology Licensing, Llc | Systems and methods for building state specific multi-turn contextual language understanding systems |
CN106057200A (zh) * | 2016-06-23 | 2016-10-26 | 广州亿程交通信息有限公司 | 基于语义的交互系统及交互方法 |
US10606952B2 (en) | 2016-06-24 | 2020-03-31 | Elemental Cognition Llc | Architecture and processes for computer learning and understanding |
CN108140383A (zh) * | 2016-07-19 | 2018-06-08 | 门箱股份有限公司 | 影像显示设备、话题选择方法、话题选择程序、影像显示方法及影像显示程序 |
US10446137B2 (en) | 2016-09-07 | 2019-10-15 | Microsoft Technology Licensing, Llc | Ambiguity resolving conversational understanding system |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
JP2018054790A (ja) * | 2016-09-28 | 2018-04-05 | トヨタ自動車株式会社 | 音声対話システムおよび音声対話方法 |
US20180090141A1 (en) * | 2016-09-29 | 2018-03-29 | Microsoft Technology Licensing, Llc | Conversational interactions using superbots |
US10860898B2 (en) | 2016-10-16 | 2020-12-08 | Ebay Inc. | Image analysis and prediction based visual search |
US11004131B2 (en) | 2016-10-16 | 2021-05-11 | Ebay Inc. | Intelligent online personal assistant with multi-turn dialog based on visual search |
US11748978B2 (en) | 2016-10-16 | 2023-09-05 | Ebay Inc. | Intelligent online personal assistant with offline visual search database |
US20180114527A1 (en) * | 2016-10-25 | 2018-04-26 | IPsoft Incorporated | Methods and systems for virtual agents |
US20180114528A1 (en) * | 2016-10-26 | 2018-04-26 | IPsoft Incorporated | Systems and methods for generic flexible dialogue management |
US10970768B2 (en) | 2016-11-11 | 2021-04-06 | Ebay Inc. | Method, medium, and system for image text localization and comparison |
US10600418B2 (en) | 2016-12-07 | 2020-03-24 | Google Llc | Voice to text conversion based on third-party agent content |
US10296586B2 (en) * | 2016-12-23 | 2019-05-21 | Soundhound, Inc. | Predicting human behavior by machine learning of natural language interpretations |
US10229680B1 (en) * | 2016-12-29 | 2019-03-12 | Amazon Technologies, Inc. | Contextual entity resolution |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US10467510B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Intelligent assistant |
US11010601B2 (en) | 2017-02-14 | 2021-05-18 | Microsoft Technology Licensing, Llc | Intelligent assistant device communicating non-verbal cues |
JP6842095B2 (ja) * | 2017-03-10 | 2021-03-17 | 日本電信電話株式会社 | 対話方法、対話システム、対話装置、およびプログラム |
US10229683B2 (en) | 2017-03-10 | 2019-03-12 | Soundhound, Inc. | Speech-enabled system with domain disambiguation |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN107239450B (zh) * | 2017-06-02 | 2021-11-23 | 上海对岸信息科技有限公司 | 基于交互上下文处理自然语言方法 |
US10873545B2 (en) * | 2017-06-12 | 2020-12-22 | Microsoft Technology Licensing, Llc | Automatic action responses |
CN107291867B (zh) | 2017-06-13 | 2021-07-20 | 北京百度网讯科技有限公司 | 基于人工智能的对话处理方法、装置、设备及计算机可读存储介质 |
CN107195303B (zh) * | 2017-06-16 | 2021-08-20 | 云知声智能科技股份有限公司 | 语音处理方法及装置 |
US10446147B1 (en) * | 2017-06-27 | 2019-10-15 | Amazon Technologies, Inc. | Contextual voice user interface |
WO2019011356A1 (de) * | 2017-07-14 | 2019-01-17 | Cognigy Gmbh | Verfahren zur dialogführung zwischen mensch und computer |
US11556548B2 (en) | 2017-08-08 | 2023-01-17 | Microsoft Technology Licensing, Llc | Intelligent query system for attachments |
US10497370B2 (en) * | 2017-08-18 | 2019-12-03 | 2236008 Ontario Inc. | Recognition module affinity |
US10964318B2 (en) | 2017-08-18 | 2021-03-30 | Blackberry Limited | Dialogue management |
US10984788B2 (en) * | 2017-08-18 | 2021-04-20 | Blackberry Limited | User-guided arbitration of speech processing results |
US20190066669A1 (en) * | 2017-08-29 | 2019-02-28 | Google Inc. | Graphical data selection and presentation of digital content |
US10796687B2 (en) | 2017-09-06 | 2020-10-06 | Amazon Technologies, Inc. | Voice-activated selective memory for voice-capturing devices |
US10854191B1 (en) * | 2017-09-20 | 2020-12-01 | Amazon Technologies, Inc. | Machine learning models for data driven dialog management |
CN107680591A (zh) * | 2017-09-21 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 基于车载终端的语音交互方法、装置及其设备 |
WO2019067878A1 (en) * | 2017-09-28 | 2019-04-04 | Oracle International Corporation | ACTIVATION OF AUTONOMOUS AGENTS TO DISTINGUISH QUESTIONS AND DEMANDS |
WO2019074509A1 (en) * | 2017-10-12 | 2019-04-18 | Google Llc | DETERMINING THE DIALOGUE STATUS OF AN AUTOMATED ASSISTANT |
KR101932263B1 (ko) * | 2017-11-03 | 2018-12-26 | 주식회사 머니브레인 | 적시에 실질적 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 |
US10636424B2 (en) * | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
CN108182943B (zh) * | 2017-12-29 | 2021-03-26 | 北京奇艺世纪科技有限公司 | 一种智能设备控制方法、装置及智能设备 |
EP3598437A4 (en) * | 2018-01-16 | 2020-05-13 | SONY Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING PROCESS AND PROGRAM |
CN110085219A (zh) * | 2018-01-26 | 2019-08-02 | 博西华电器(江苏)有限公司 | 家用电器及通过语音控制该家用电器的方法和系统 |
US20210065708A1 (en) * | 2018-02-08 | 2021-03-04 | Sony Corporation | Information processing apparatus, information processing system, information processing method, and program |
US11354521B2 (en) | 2018-03-07 | 2022-06-07 | Google Llc | Facilitating communications with automated assistants in multiple languages |
JP6678764B1 (ja) | 2018-03-07 | 2020-04-08 | グーグル エルエルシー | 多言語での自動化されたアシスタントを用いたエンドツーエンドコミュニケーションの促進 |
US11264021B2 (en) * | 2018-03-08 | 2022-03-01 | Samsung Electronics Co., Ltd. | Method for intent-based interactive response and electronic device thereof |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
CN108694942A (zh) * | 2018-04-02 | 2018-10-23 | 浙江大学 | 一种基于家居智能服务机器人的智能家居交互问答系统 |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
KR20190131741A (ko) * | 2018-05-17 | 2019-11-27 | 현대자동차주식회사 | 대화 시스템 및 대화 처리 방법 |
CN110503947A (zh) * | 2018-05-17 | 2019-11-26 | 现代自动车株式会社 | 对话系统、包括其的车辆和对话处理方法 |
EP3576084B1 (de) * | 2018-05-29 | 2020-09-30 | Christoph Neumann | Effiziente dialoggestaltung |
JP7151181B2 (ja) * | 2018-05-31 | 2022-10-12 | トヨタ自動車株式会社 | 音声対話システム、その処理方法及びプログラム |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
CN110619870B (zh) * | 2018-06-04 | 2022-05-06 | 佛山市顺德区美的电热电器制造有限公司 | 一种人机对话方法、装置、家用电器和计算机存储介质 |
JP2021156907A (ja) * | 2018-06-15 | 2021-10-07 | ソニーグループ株式会社 | 情報処理装置および情報処理方法 |
WO2019244455A1 (ja) * | 2018-06-21 | 2019-12-26 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
CN108881466B (zh) * | 2018-07-04 | 2020-06-26 | 百度在线网络技术(北京)有限公司 | 交互方法和装置 |
US10950223B2 (en) | 2018-08-20 | 2021-03-16 | Accenture Global Solutions Limited | System and method for analyzing partial utterances |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11409961B2 (en) * | 2018-10-10 | 2022-08-09 | Verint Americas Inc. | System for minimizing repetition in intelligent virtual assistant conversations |
KR20200040625A (ko) * | 2018-10-10 | 2020-04-20 | 삼성전자주식회사 | 사용자의 발화를 처리하는 사용자 단말 및 그 제어 방법 |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11183176B2 (en) | 2018-10-31 | 2021-11-23 | Walmart Apollo, Llc | Systems and methods for server-less voice applications |
US11404058B2 (en) * | 2018-10-31 | 2022-08-02 | Walmart Apollo, Llc | System and method for handling multi-turn conversations and context management for voice enabled ecommerce transactions |
US11195524B2 (en) | 2018-10-31 | 2021-12-07 | Walmart Apollo, Llc | System and method for contextual search query revision |
US11238850B2 (en) | 2018-10-31 | 2022-02-01 | Walmart Apollo, Llc | Systems and methods for e-commerce API orchestration using natural language interfaces |
KR20200052612A (ko) * | 2018-11-07 | 2020-05-15 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치, 및 그 전자 장치의 제어 방법 |
US11043214B1 (en) * | 2018-11-29 | 2021-06-22 | Amazon Technologies, Inc. | Speech recognition using dialog history |
CN109671427B (zh) * | 2018-12-10 | 2021-02-02 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
US11204594B2 (en) * | 2018-12-13 | 2021-12-21 | Fisher-Rosemount Systems, Inc. | Systems, methods, and apparatus to augment process control with virtual assistant |
US11875883B1 (en) | 2018-12-21 | 2024-01-16 | Cerner Innovation, Inc. | De-duplication and contextually-intelligent recommendations based on natural language understanding of conversational sources |
US11062704B1 (en) | 2018-12-21 | 2021-07-13 | Cerner Innovation, Inc. | Processing multi-party conversations |
US11398232B1 (en) | 2018-12-21 | 2022-07-26 | Cerner Innovation, Inc. | Natural language understanding of conversational sources |
WO2020139865A1 (en) * | 2018-12-24 | 2020-07-02 | Conversica, Inc. | Systems and methods for improved automated conversations |
US11410650B1 (en) | 2018-12-26 | 2022-08-09 | Cerner Innovation, Inc. | Semantically augmented clinical speech processing |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
KR20210013607A (ko) * | 2019-02-27 | 2021-02-04 | 구글 엘엘씨 | 컴퓨팅 장치를 사용한 지속적인 대화 감지 |
US11676582B2 (en) | 2019-02-27 | 2023-06-13 | Google Llc | Detecting conversations with computing devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN111831795B (zh) * | 2019-04-11 | 2023-10-27 | 北京猎户星空科技有限公司 | 多轮对话处理方法、装置、电子设备及存储介质 |
US10997968B2 (en) * | 2019-04-30 | 2021-05-04 | Microsofttechnology Licensing, Llc | Using dialog context to improve language understanding |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11256868B2 (en) * | 2019-06-03 | 2022-02-22 | Microsoft Technology Licensing, Llc | Architecture for resolving ambiguous user utterance |
US11348601B1 (en) * | 2019-06-06 | 2022-05-31 | Amazon Technologies, Inc. | Natural language understanding using voice characteristics |
CN110472029B (zh) * | 2019-08-01 | 2024-03-19 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及计算机可读存储介质 |
CN112445902A (zh) * | 2019-09-04 | 2021-03-05 | 深圳Tcl数字技术有限公司 | 一种多轮对话中用户意图的识别方法及相关设备 |
US11551665B2 (en) * | 2019-09-12 | 2023-01-10 | Oracle International Corporation | Dynamic contextual dialog session extension |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
KR20210036169A (ko) * | 2019-09-25 | 2021-04-02 | 현대자동차주식회사 | 대화 시스템, 대화 처리 방법, 번역 장치 및 번역 방법 |
US11861674B1 (en) | 2019-10-18 | 2024-01-02 | Meta Platforms Technologies, Llc | Method, one or more computer-readable non-transitory storage media, and a system for generating comprehensive information for products of interest by assistant systems |
US11567788B1 (en) | 2019-10-18 | 2023-01-31 | Meta Platforms, Inc. | Generating proactive reminders for assistant systems |
CN111177338B (zh) * | 2019-12-03 | 2023-07-21 | 北京博瑞彤芸科技股份有限公司 | 一种基于上下文的多轮对话方法 |
CN111128121B (zh) * | 2019-12-20 | 2021-04-30 | 贝壳找房(北京)科技有限公司 | 语音信息生成方法和装置、电子设备和存储介质 |
US11250128B2 (en) | 2020-02-18 | 2022-02-15 | Bank Of America Corporation | System and method for detecting source code anomalies |
US11176329B2 (en) | 2020-02-18 | 2021-11-16 | Bank Of America Corporation | Source code compiler using natural language input |
CN113362828B (zh) * | 2020-03-04 | 2022-07-05 | 阿波罗智联(北京)科技有限公司 | 用于识别语音的方法和装置 |
US11568153B2 (en) | 2020-03-05 | 2023-01-31 | Bank Of America Corporation | Narrative evaluator |
CN111475616B (zh) * | 2020-03-13 | 2023-08-22 | 平安科技(深圳)有限公司 | 基于对话状态预测的多轮对话方法、装置和计算机设备 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11410186B2 (en) * | 2020-05-14 | 2022-08-09 | Sap Se | Automated support for interpretation of terms |
US11610065B2 (en) | 2020-06-12 | 2023-03-21 | Apple Inc. | Providing personalized responses based on semantic context |
US20220012075A1 (en) * | 2020-07-08 | 2022-01-13 | International Business Machines Corporation | Virtual assistant interaction enhancement |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11906317B2 (en) * | 2020-10-17 | 2024-02-20 | Chian Chiu Li | Presenting location related information and implementing a task based on gaze, gesture, and voice detection |
US11748576B2 (en) | 2021-01-21 | 2023-09-05 | International Business Machines Corporation | Interpretation of deep neural model based dialogue agents |
CN112995419B (zh) * | 2021-02-05 | 2022-05-24 | 支付宝(杭州)信息技术有限公司 | 一种语音对话的处理方法和系统 |
KR20220116949A (ko) * | 2021-02-16 | 2022-08-23 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 인식 처리 방법 |
US11756575B2 (en) | 2021-02-16 | 2023-09-12 | Samsung Electronics Co., Ltd. | Electronic device and method for speech recognition processing of electronic device |
US11955137B2 (en) | 2021-03-11 | 2024-04-09 | Apple Inc. | Continuous dialog with a digital assistant |
US11948566B2 (en) * | 2021-03-24 | 2024-04-02 | Adobe Inc. | Extensible search, content, and dialog management system with human-in-the-loop curation |
US11875798B2 (en) | 2021-05-03 | 2024-01-16 | International Business Machines Corporation | Profiles for enhanced speech recognition training |
US11935529B2 (en) * | 2021-06-15 | 2024-03-19 | Motorola Solutions, Inc. | System and method for virtual assistant execution of ambiguous command |
US20220415311A1 (en) * | 2021-06-24 | 2022-12-29 | Amazon Technologies, Inc. | Early invocation for contextual data processing |
US11776068B1 (en) * | 2022-07-29 | 2023-10-03 | Intuit, Inc. | Voice enabled content tracker |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07239694A (ja) * | 1994-03-02 | 1995-09-12 | Oki Electric Ind Co Ltd | 音声対話装置 |
JPH07282081A (ja) * | 1994-04-12 | 1995-10-27 | Matsushita Electric Ind Co Ltd | 音声対話型情報検索装置 |
US5774860A (en) * | 1994-06-27 | 1998-06-30 | U S West Technologies, Inc. | Adaptive knowledge base of complex information through interactive voice dialogue |
US5777614A (en) * | 1994-10-14 | 1998-07-07 | Hitachi, Ltd. | Editing support system including an interactive interface |
US6154465A (en) * | 1998-10-06 | 2000-11-28 | Vertical Networks, Inc. | Systems and methods for multiple mode voice and data communications using intelligenty bridged TDM and packet buses and methods for performing telephony and data functions using the same |
US6496567B1 (en) * | 1998-05-07 | 2002-12-17 | Mci Communications Corporation | Interactive voice response service node with advanced resource management |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
US6246981B1 (en) * | 1998-11-25 | 2001-06-12 | International Business Machines Corporation | Natural language task-oriented dialog manager and method |
US6233561B1 (en) | 1999-04-12 | 2001-05-15 | Matsushita Electric Industrial Co., Ltd. | Method for goal-oriented speech translation in hand-held devices using meaning extraction and dialogue |
US6356869B1 (en) * | 1999-04-30 | 2002-03-12 | Nortel Networks Limited | Method and apparatus for discourse management |
US8374875B2 (en) | 2000-01-31 | 2013-02-12 | Intel Corporation | Providing programming information in response to spoken requests |
US20040085162A1 (en) * | 2000-11-29 | 2004-05-06 | Rajeev Agarwal | Method and apparatus for providing a mixed-initiative dialog between a user and a machine |
US6937983B2 (en) * | 2000-12-20 | 2005-08-30 | International Business Machines Corporation | Method and system for semantic speech recognition |
US6751591B1 (en) * | 2001-01-22 | 2004-06-15 | At&T Corp. | Method and system for predicting understanding errors in a task classification system |
US20030061029A1 (en) * | 2001-08-29 | 2003-03-27 | Efraim Shaket | Device for conducting expectation based mixed initiative natural language dialogs |
US7610556B2 (en) * | 2001-12-28 | 2009-10-27 | Microsoft Corporation | Dialog manager for interactive dialog with computer user |
US7386449B2 (en) * | 2002-12-11 | 2008-06-10 | Voice Enabling Systems Technology Inc. | Knowledge-based flexible natural speech dialogue system |
JP4246548B2 (ja) * | 2003-05-30 | 2009-04-02 | 日本電信電話株式会社 | 統計情報を用いた対話方法及びその装置と、対話プログラム及びそのプログラムを記録した記録媒体 |
US7430510B1 (en) * | 2004-03-01 | 2008-09-30 | At&T Corp. | System and method of using modular spoken-dialog components |
US7412393B1 (en) | 2004-03-01 | 2008-08-12 | At&T Corp. | Method for developing a dialog manager using modular spoken-dialog components |
US7228278B2 (en) * | 2004-07-06 | 2007-06-05 | Voxify, Inc. | Multi-slot dialog systems and methods |
US20060036430A1 (en) * | 2004-08-12 | 2006-02-16 | Junling Hu | System and method for domain-based natural language consultation |
US7716056B2 (en) * | 2004-09-27 | 2010-05-11 | Robert Bosch Corporation | Method and system for interactive conversational dialogue for cognitively overloaded device users |
EP1800294B1 (en) | 2004-10-05 | 2010-06-02 | Inago Corporation | System and methods for improving accuracy of speech recognition |
JP4405370B2 (ja) * | 2004-11-15 | 2010-01-27 | 本田技研工業株式会社 | 車両用機器制御装置 |
US9318108B2 (en) * | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
JP2008083100A (ja) * | 2006-09-25 | 2008-04-10 | Toshiba Corp | 音声対話装置及びその方法 |
US8073681B2 (en) * | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
CN101075435B (zh) * | 2007-04-19 | 2011-05-18 | 深圳先进技术研究院 | 一种智能聊天系统及其实现方法 |
US20090055163A1 (en) * | 2007-08-20 | 2009-02-26 | Sandeep Jindal | Dynamic Mixed-Initiative Dialog Generation in Speech Recognition |
US8140335B2 (en) * | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
PL2346030T3 (pl) * | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
US8798983B2 (en) * | 2009-03-30 | 2014-08-05 | Microsoft Corporation | Adaptation for statistical language model |
US9858925B2 (en) * | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
JP2011033680A (ja) * | 2009-07-30 | 2011-02-17 | Sony Corp | 音声処理装置及び方法、並びにプログラム |
KR101211796B1 (ko) * | 2009-12-16 | 2012-12-13 | 포항공과대학교 산학협력단 | 외국어 학습 장치 및 그 제공 방법 |
US10276170B2 (en) * | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US9202465B2 (en) * | 2011-03-25 | 2015-12-01 | General Motors Llc | Speech recognition dependent on text message content |
EP2575128A3 (en) | 2011-09-30 | 2013-08-14 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10417037B2 (en) * | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
CN104380374A (zh) | 2012-06-19 | 2015-02-25 | 株式会社Ntt都科摩 | 功能执行指示系统、功能执行指示方法及功能执行指示程序 |
US10031968B2 (en) * | 2012-10-11 | 2018-07-24 | Veveo, Inc. | Method for adaptive conversation state management with filtering operators applied dynamically as part of a conversational interface |
US9269354B2 (en) * | 2013-03-11 | 2016-02-23 | Nuance Communications, Inc. | Semantic re-ranking of NLU results in conversational dialogue applications |
US9875494B2 (en) * | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
CN103474069B (zh) * | 2013-09-12 | 2016-03-30 | 中国科学院计算技术研究所 | 用于融合多个语音识别系统的识别结果的方法及系统 |
US10181322B2 (en) * | 2013-12-20 | 2019-01-15 | Microsoft Technology Licensing, Llc | Multi-user, multi-domain dialog system |
US20150179170A1 (en) * | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Discriminative Policy Training for Dialog Systems |
-
2014
- 2014-05-20 US US14/283,017 patent/US10726831B2/en active Active
-
2015
- 2015-05-20 EP EP15727199.0A patent/EP3146523B1/en active Active
- 2015-05-20 WO PCT/US2015/031765 patent/WO2015179510A1/en active Application Filing
- 2015-05-20 CN CN201580027417.XA patent/CN106796787B/zh active Active
- 2015-05-20 JP JP2016567966A patent/JP6535349B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11756533B2 (en) | 2020-05-15 | 2023-09-12 | Google Llc | Hot-word free pre-emption of automated assistant response presentation |
Also Published As
Publication number | Publication date |
---|---|
EP3146523B1 (en) | 2019-10-30 |
JP2017516153A (ja) | 2017-06-15 |
WO2015179510A1 (en) | 2015-11-26 |
EP3146523A1 (en) | 2017-03-29 |
CN106796787A (zh) | 2017-05-31 |
CN106796787B (zh) | 2020-12-22 |
US20150340033A1 (en) | 2015-11-26 |
US10726831B2 (en) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6535349B2 (ja) | 以前の対話行為を使用する自然言語処理における文脈解釈 | |
US11727219B2 (en) | System and method for inferring user intent from speech inputs | |
US11321116B2 (en) | Systems and methods for integrating third party services with a digital assistant | |
AU2022221387B2 (en) | Facilitating end-to-end communications with automated assistants in multiple languages | |
US10490186B2 (en) | Parameter collection and automatic dialog generation in dialog systems | |
EP3032532B1 (en) | Disambiguating heteronyms in speech synthesis | |
ES2751484T3 (es) | Interfaz de entrada de voz incremental con retroalimentación en tiempo real | |
US9589563B2 (en) | Speech recognition of partial proper names by natural language processing | |
US20110153322A1 (en) | Dialog management system and method for processing information-seeking dialogue | |
US20230135179A1 (en) | Systems and Methods for Implementing Smart Assistant Systems | |
US11016968B1 (en) | Mutation architecture for contextual data aggregator | |
US10482876B2 (en) | Hierarchical speech recognition decoder | |
US11817093B2 (en) | Method and system for processing user spoken utterance | |
Basu et al. | Commodity price retrieval system in bangla: An ivr based application | |
US11804225B1 (en) | Dialog management system | |
Thymé-Gobbel et al. | Keeping Voice in Mind |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180502 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190508 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190531 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6535349 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |