JP6305588B2 - 拡張された会話理解アーキテクチャ - Google Patents
拡張された会話理解アーキテクチャ Download PDFInfo
- Publication number
- JP6305588B2 JP6305588B2 JP2017038097A JP2017038097A JP6305588B2 JP 6305588 B2 JP6305588 B2 JP 6305588B2 JP 2017038097 A JP2017038097 A JP 2017038097A JP 2017038097 A JP2017038097 A JP 2017038097A JP 6305588 B2 JP6305588 B2 JP 6305588B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- apis
- user
- application programming
- programming interfaces
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009471 action Effects 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 38
- 230000005055 memory storage Effects 0.000 claims description 14
- 238000003860 storage Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000004044 response Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 235000012054 meals Nutrition 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
- Stored Programmes (AREA)
- Telephonic Communication Services (AREA)
Description
語理解を円滑にするための機構を提供することが可能である。一部の状況において、パーソナルアシスタントプログラムおよび/または検索エンジンは、しばしば、特殊化されたフォーマット、および特殊化されたシンタックスを要求する。例えば、「I want to go see ‘Inception’ around 7(私は、7時頃に「インセプション」を観に行きたい)」というユーザのクエリが、会話システムに提供された際にユーザの真の意図を伝えることに効果がない場合がある。そのようなシステムは、一般に、ユーザが或る映画に言及している、かつユーザが、7:00頃にその映画を上映する近くの映画館についてユーザに知らせる結果を所望する、というコンテキストを導き出すことができない可能性がある。
る概念の選定を、簡略化された形態で紹介するように与えられる。この「発明の概要」は、主張される主題の重要な特徴、または不可欠な特徴を特定することは意図していない。また、この「発明の概要」は、主張される主題の範囲を限定するのに使用されることも意図していない。
を受け取ると、その語句は、検索語句に変換可能であり、さらにその検索語句に対して検索アクションが実行され得る。
的であるに過ぎない。したがって、以上の一般的な説明、および以下の詳細な説明は、限定するものと考慮されるべきではない。さらに、本明細書に記載される特徴に加えて、いくつかの特徴または変形形態が与えられ得る。例えば、いくつかの実施形態が、詳細な説明で説明される様々な特徴の組合せおよび部分的組合せを対象とし得る。
施形態を例示する。
び以下の説明において同一の要素、または同様の要素を指すのに同一の参照符号が使用さ
れる。本発明のいくつかの実施形態が説明され得るが、変形形態、適合形態、および他の実装形態が可能である。例えば、図面に例示される要素に置換、追加、または変形が行われ得るとともに、本明細書で説明される方法が、開示される方法の段階を置換すること、並べ替えること、または追加することによって変形され得る。したがって、以下の詳細な説明は、本発明を限定しない。代わりに、本発明の適切な範囲は、添付の特許請求の範囲によって規定される。
語理解を円滑にすることが可能である。このアーキテクチャは、クエリのコンテキストを判定すること、およびユーザの意図を推測することを可能にすることができる。このアーキテクチャは、自然言語クエリの語を使用して、その会話のコンテキストを判定すること、ユーザの意図を推定すること、および適切な検索エージェントを使用してさらなる適切なクエリを形成することができる。
能にする。SDSを駆動する主要な構成要素は、ダイアログマネージャを備え、すなわち、この構成要素が、ユーザとのダイアログベースの会話を管理する。ダイアログマネージャは、音声認識および自然言語理解構成要素の出力、以前の回のダイアログからのコンテキスト、ユーザコンテキスト、および/または知識ベース(例えば、検索エンジン)から戻される結果などの、複数の入力ソースの組合せを介してユーザの意図を判定することが可能である。意図を判定した後、ダイアログマネージャは、最終結果をユーザに表示すること、および/またはユーザの意図を満足させるようにユーザとの対話を続けることなどの、アクションをとることができる。
5は、ダイアログマネージャ111を備えた音声対話システム(SDS)110、パーソナルアシスタントプログラム112、コンテキストデータベース116、および/または検索エージェント118などの様々なコンピューティングリソースおよび/またはソフトウェアモジュールを備え得る。SDS110は、ネットワーク120を介してユーザからクエリおよび/またはアクション要求を受信することが可能である。そのようなクエリは、例えば、コンピュータおよび/またはセルラ電話機などのユーザデバイス130から送信され得る。ネットワーク120は、例えば、プライベートネットワーク、セルラデータネットワーク、および/またはインターネットなどの公共ネットワークを備え得る。
ス200のブロック図である。インターフェース200は、ユーザ入力パネル210と、パーソナルアシスタントパネル220とを備え得る。ユーザ入力パネル210は、ユーザステートメント230などの、変換されたユーザクエリおよび/またはアクション要求を表示することが可能である。ユーザステートメント230は、例えば、ユーザデバイス130のユーザから受け取られた音声−テキスト変換からの結果を備え得る。パーソナルアシスタントパネル220は、ユーザおよびユーザステートメント230に関連するコンテキスト状態から導き出された複数のアクション示唆240(A)〜(C)を備え得る。
後の更新された表示を備えたインターフェース200のさらなる例示である。例えば、複数のアクション示唆240(A)〜(C)は、ユーザが表現した「go out tonight(今夜、出かける)」意図に応答した示唆される活動を備え得る。この例においてユーザの食事に出かける意図を示すアクション示唆240(A)が選択されると、パーソナルアシスタントパネル220が、ユーザの意図をさらに定義することに関連する第2の複数のアクション示唆250(A)〜(C)で更新され得る。例えば、第2の複数のア
クション示唆250(A)〜(C)は、ユーザが食べることを所望し得る、示唆される様々な料理を備え得る。本発明の実施形態に合致して、ユーザに関連するコンテキスト状態が、第2の複数のアクション示唆250(A)〜(C)をもたらし、さらに/または順序付けるのに使用され得る。例えば、コンテキスト状態は、ユーザが訪れた、さらに/または気に入ったそれまでのレストランの履歴を備えることが可能であり、さらに料理のタイプが、それらの選好に応じて順序付けられることが可能である。
示するインターフェース200のブロック図である。ユーザは、ユーザステートメント230のすべて、および/または一部分を、変更されたユーザステートメント310に変えることができる。例えば、ユーザは、マウス、スタイラス、キーボード、音声コマンド、および/または他の入力機構を使用して、それまでに変換されている語、「out(出)」を選択し、さらにその語を「outside(外に)」に変更することが可能である。次に、パーソナルアシスタントパネル220が、変更されたユーザステートメント310に応じて、更新された複数の示唆されるアクション320(A)〜(B)で更新され得る。
形態に合致する方法400に関与する一般的な段階を示す流れ図である。方法400は、図4に関連して後段でより詳細に説明されるとおり、コンピューティングデバイス400を使用して実施され得る。方法400の段階を実施する様態は、後段でさらに詳細に説明される。方法400は、開始ブロック405で始まって、段階410に進むことが可能であり、コンピューティングデバイス500が、アクション要求を受け取ることが可能である。例えば、SDS110が、「find a place to eat(食事する所を見つける)」ユーザの音声クエリを備えた要求をユーザデバイス130から受け取ることが可能である。
デバイス500が、ユーザに関連するコンテキスト状態を収集することが可能である。コンテキスト状態は、例えば、ユーザに関連する役割、少なくとも1つのこれまでのユーザの目的、少なくとも1つのこれまでのユーザアクション要求、ユーザのロケーション、時刻、日付、ユーザからの第1のアクション要求に関連するカテゴリ、ユーザからの第1のアクション要求に関連するデータタイプ、および/またはこれまでのユーザアクションに関連するデータカテゴリを備え得る。そのような情報は、SDS110のコンテキストデータベース116の中に格納され得る。
デバイス500が、コンテキスト状態に応じて複数の目的を作成することが可能である。例えば、SDSが、「find a place to eat」というクエリに関連するドメインを「食事」と識別することが可能である。このため、ユーザのロケーションに応じて近くのレストランを見つけること、および/または会話に関与するユーザの数に応じて予約を作成することなどの目的が、生成され得る。
デバイス500が、コンテキスト状態に応じて、要求されるアクションを実行することが可能である。例えば、「find a place to eat」というユーザクエリに応答して、トランスレータモジュール114が、ユーザに対して近くのレストランを検索するよう検索エージェント118に命令することが可能である。この検索の結果が、パーソナルアシスタントプログラム112によってユーザデバイス130に送り返されて、例えば、インターフェース200のパーソナルアシスタントパネル220内に表示され得
る。
デバイス500が、コンテキスト状態を更新することが可能である。例えば、複数のアクション示唆240(A)〜(C)を備えた選択肢の現在の選択がそれぞれ、ユーザのコンテキスト状態における或る予測される確率に関連付けられ得る。ユーザの次のアクションが、将来のクエリに適用されるように、これらの予測される確率を調整するのに使用され得る。
デバイス500が、次の要求されるアクションが現在の目的を達成することに関連するかどうかを判定することが可能である。例えば、SDS110が、ユーザのコンテキスト状態を、現在の目的にそれぞれが関連する複数のユーザコンテキスト状態と比較することが可能である。同一のアクション/クエリ要求を発行しているこれまでのユーザらが、類似した次のアクションを行っている可能性があり、さらにこの段階におけるユーザによる異なるアクションが、誤った目的が予測されていることを示すことが可能である。ユーザの次のアクションが予測される目的と合わない場合、方法400は、段階420に戻ることが可能であり、新たな目的セットが生成され得る。
0に進むことが可能であり、コンピューティングデバイス500が、予測される目的が完了したかどうかを判定することが可能である。例えば、SDS110が、食事の予約を確定して、タクシーを手配する要求されるアクションを受け取った場合、食事の計画を立てる目的が完了したと判定され得、さらに方法400は、段階442で終わることが可能である。アクションが、予約を行うべきレストランを選択することを備えるが、時刻が選択されていない場合、予測される目的は、完了していないと判定され得る。
45に進むことが可能であり、コンピューティングデバイス500が、次の示唆されるアクションを提供することが可能である。例えば、或るレストランが選択されているが、時刻は選択されていない場合、パーソナルアシスタントプログラム112が、ユーザに予約時刻を要求することが可能である。
デバイス500が、ユーザから次のアクションを受け取ることが可能である。例えば、ユーザが、予約時刻として7時00分の選択を入力して、この選択をSDS110に送信することが可能である。次に、方法400は、前述したとおり、段階425に戻り、次の要求されるアクションを実行することが可能である。
のシステムを備え得る。このシステムは、メモリストレージと、このメモリストレージに結合された処理装置とを備え得る。処理装置は、ユーザから自然言語の語句を受け取り、この自然言語の語句を検索語句に変換し、この検索語句に応じて検索アクションを行うように動作することが可能である。この自然言語の語句は、例えば、複数のテキスト語として、さらに/またはオーディオストリームとして受け取られ得る。この検索語句は、自然言語の語句に含まれない少なくとも1つのコンテキスト上の意味概念を備え得る。処理装置は、検索アクションに応じて複数の検索結果を受け取り、さらにこの複数の検索結果をユーザに提供するようにさらに動作することが可能である。処理装置は、この複数の結果を複数のユーザに提供するようにさらに動作することが可能である。この自然言語の語句は、例えば、複数のユーザの間の会話から導き出され得る。処理装置は、複数のアプリケ
ーションプログラミングインターフェース(API)を解析して、その複数のAPIのそれぞれに関して少なくとも1つの要求されるパラメータを識別するようにさらに動作することが可能である。複数のAPIのそれぞれが、ウェブサイト検索機能に関連付けられることが可能である。自然言語の語句を検索語句に変換するように動作することは、処理装置が、自然言語の語句に関連するコンテキストを識別し、複数のAPIのうちの少なくとも1つが、識別されたコンテキストに関連するかどうかを判定し、さらに、関連する場合、自然言語の語句のうちの少なくとも1つの語を、複数のAPIのうちの少なくとも1つに関連する少なくとも1つの要求されるパラメータに変換するように動作することを備え得る。検索アクションを行うように動作することは、処理装置が、その少なくとも1つの要求されるパラメータで複数のAPIのうちのその少なくとも1つを呼び出すように動作することを備え得る。
のシステムを備え得る。このシステムは、メモリストレージと、このメモリストレージに結合された処理装置とを備え得る。処理装置は、ユーザから自然言語の語句を受け取り、この自然言語の語句に関連するコンテキスト状態を作成し、この自然言語の語句を実行可能なアクションに変換し、識別されたコンテキストに応じて、この実行可能なアクションに関連するドメインを識別し、さらに識別されたドメイン内でこの実行可能なアクションを行うように動作することが可能である。実行可能なアクションは、例えば、検索アクション、データ作成アクション、データ変更アクション、および通信アクションを備え得る。処理装置は、少なくとも1つの示唆される次のアクションをユーザに提供するようにさらに動作することが可能である。処理装置は、ユーザから第2の自然言語の語句を受け取り、第2の自然言語の語句が少なくとも1つの示唆される次のアクションに関連するかどうかを判定し、さらに関連する場合、その少なくとも1つの示唆される次のアクションを行うようにさらに動作することが可能である。第2の自然言語の語句が少なくとも1つの示唆される次のアクションに関連しないと判定したことに応答して、処理装置は、少なくとも1つの第2の示唆される次のアクションをユーザに提供するように動作することが可能である。処理装置は、第2の自然言語の語句に応じてコンテキスト状態を更新するようにさらに動作することが可能である。
るためのシステムを備え得る。このシステムは、メモリストレージと、このメモリストレージに結合された処理装置とを備え得る。処理装置は、複数の目的を作成し、ユーザに関連するコンテキスト状態を収集し、コンテキスト状態に応じて、複数の目的のうちの少なくとも1つに関連する示唆されるアクションをもたらし、ユーザからアクション要求を受け取り、コンテキスト状態に応じて、要求されるアクションを実行し、さらにこのアクションが複数の目的のうちのその少なくとも1つを達成することに関連するかどうかを判定するように動作することが可能である。このアクションが複数の目的のうちのその少なくとも1つを達成することに関連すると判定したことに応答して、処理装置は、コンテキスト状態を更新し、示唆されるアクションに関連する確率を更新し、さらにコンテキスト状態が複数の目的のうちの完了された目的を備えるかどうかを判定するように動作することが可能である。コンテキスト状態が完了された目的を備えないと判定したことに応答して、処理装置は、少なくとも1つの第2の示唆されるアクションを実現するように動作することが可能である。
でのユーザの目的、少なくとも1つのこれまでのユーザアクション要求、ユーザのロケーション、時刻、日付、ユーザからの第1のアクション要求に関連するカテゴリ、ユーザからの第1のアクション要求に関連するデータタイプ、およびこれまでのユーザアクション要求に関連するデータカテゴリを備え得る。コンテキスト状態が少なくとも1つの予測さ
れる目的を達成することに関連するかどうかを判定するように動作することは、処理装置が、コンテキスト状態を、複数の目的のうちの少なくとも1つにそれぞれが関連する複数のユーザコンテキスト状態と比較するように動作することを備え得る。
。本発明の或る実施形態に合致して、前述したメモリストレージおよび処理装置が、図5のコンピューティングデバイス500などのコンピューティングデバイスにおいて実施され得る。ハードウェア、ソフトウェア、またはファームウェアの任意の適切な組合せが、メモリストレージおよび処理装置を実施するのに使用され得る。例えば、メモリストレージおよび処理装置は、コンピューティングデバイス500で、またはコンピューティングデバイス500と組み合わされた他のコンピューティングデバイス518のうちの任意のコンピューティングデバイス518で実施され得る。前述したシステム、デバイス、およびプロセッサは、例であり、他のシステム、デバイス、およびプロセッサが、本発明の実施形態に合致して、前述したメモリストレージおよび処理装置を備えることが可能である。さらに、コンピューティングデバイス500は、前述したとおり、システム100のための動作環境を備え得る。システム100は、他の環境において動作してもよく、コンピューティングデバイス500に限定されない。
ィングデバイス500のようなコンピューティングデバイスを含み得る。基本的な構成において、コンピューティングデバイス500は、少なくとも1つの処理装置502と、システムメモリ504とを含み得る。コンピューティングデバイスの構成およびタイプに依存して、システムメモリ504は、揮発性メモリ(例えば、ランダムアクセスメモリ(RAM))、不揮発性メモリ(例えば、読取り専用メモリ(ROM))、フラッシュメモリ、または任意の組合せを含み得るが、これらに限定されない。システムメモリ504は、オペレーティングシステム505、および1つまたは複数のプログラミングモジュール506を含むことが可能であり、さらにパーソナルアシスタントプログラム112を含み得る。オペレーティングシステム505は、例えば、コンピューティングデバイス400の動作を制御することに適することが可能である。さらに、本発明のいくつかの実施形態は、グラフィックスライブラリ、他のオペレーティングシステム、または他の任意のアプリケーションプログラムと連携して実施されてもよく、いずれの特定のアプリケーションにも、いずれの特定のシステムにも限定されない。この基本的な構成が、図5に破線508内の構成要素で例示される。
可能である。例えば、コンピューティングデバイス500は、例えば、磁気ディスク、光ディスク、またはテープなどのさらなるデータストレージデバイス(リムーバブルおよび/または非リムーバブルの)を含むことも可能である。そのようなさらなるストレージが、図5にリムーバブルストレージ509および非リムーバブルストレージ510で例示される。コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を格納するために任意の方法または技術で実施された揮発性媒体および不揮発性媒体、リムーバブルの媒体および非リムーバブルの媒体を含み得る。システムメモリ504、リムーバブルストレージ509、および非リムーバブルストレージ510はすべて、コンピュータ記憶媒体の例(すなわち、メモリストレージ)である。コンピュータ記憶媒体には、RAM、ROM、電気的に消去可能な読取り専用メモリ(EEPROM)、フラッシュメモリもしくは他のメモリ技術、CD−ROM、デジタルバーサタイルディスク(DVD)もしくは他の光ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、または情報を格納するのに使用され得るとともに、コンピューティングデバイス500によってアクセスされ得る他の任意の媒体が含まれることが可能であるが、これらに限定されない。任意のその
ようなコンピュータ記憶媒体が、デバイス500の一部であり得る。また、コンピューティングデバイス500は、キーボード、マウス、ペン、サウンド入力デバイス、タッチ入力デバイスなどの入力デバイス512(複数可)を有することも可能である。また、ディスプレイ、スピーカ、プリンタなどの出力デバイス514(複数可)が含められることも可能である。前述したデバイスは、例であり、他のデバイスが使用されてもよい。
ーティング環境においてネットワーク、例えば、イントラネットまたはインターネットを介するなどして、他のコンピューティングデバイス518と通信できるようにすることが可能な通信接続部516を含むことも可能である。通信接続部516は、通信媒体の一例である。通信媒体は、典型的には、搬送波などの変調されたデータ信号、または他のトランスポート機構におけるコンピュータ可読命令、データ構造、プログラムモジュール、または他のデータによって具現化可能であり、さらに任意の情報配信媒体を含む。「変調されたデータ信号」という用語は、信号内に情報を符号化するように1つまたは複数の特性が設定されている、または変更されている信号を表すことが可能である。例として、限定としてではなく、通信媒体には、有線ネットワークまたは直接配線接続などの有線媒体、ならびに音響媒体、無線周波数(RF)媒体、赤外線媒体、または他のワイヤレス媒体などのワイヤレス媒体が含まれ得る。本明細書で使用されるコンピュータ可読媒体という用語には、記憶媒体と通信媒体がともに含まれ得る。
ムモジュールおよびデータファイルが、システムメモリ504の中に格納され得る。処理装置502において実行される間、プログラミングモジュール506(例えば、パーソナルアシスタントプログラム112)は、例えば、前述した方法500の段階のうちの1つまたは複数を含めたプロセスを行うことが可能である。前述したプロセスは、例であり、さらに処理装置502は、他のプロセスを行うことが可能である。本発明の実施形態に従って使用され得る他のプログラミングモジュールには、電子メールアプリケーションおよび電子コンタクトアプリケーション、ワードプロセッシングアプリケーション、スプレッドシートアプリケーション、データベースアプリケーション、スライドプレゼンテーションアプリケーション、描画アプリケーションプログラムもしくはコンピュータ支援アプリケーションプログラムなどが含まれ得る。
クを行うことが可能な、または特定の抽象データ型を実施することが可能なルーチン、プログラム、構成要素、データ構造、および他のタイプの構造が含まれ得る。さらに、本発明の実施形態は、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースの家庭用電子機器もしくはプログラマブル家庭用電子機器、ミニコンピュータ、メインフレームコンピュータなどを含む他のコンピュータシステム構成で実施され得る。また、本発明の実施形態は、通信ネットワークを介して結び付けられた複数の遠隔処理デバイスによってタスクが行われる分散コンピューティング環境において実施されることも可能である。分散コンピューティング環境において、プログラムモジュールは、ローカルメモリストレージデバイスと遠隔メモリストレージデバイスの両方の中に配置され得る。
理ゲートを含むパッケージ化された、もしくは集積された電子チップ、またはマイクロプロセッサを利用する回路において、あるいは電子素子もしくはマイクプロセッサを含む単一のチップ上で実施され得る。また、本発明の実施形態は、機械技術、光学技術、流体技術、および量子技術を含むが、これらに限定されない、例えば、論理積、論理和、および否定などの論理演算を行うことができる他の技術を使用して実施されることも可能である。さらに、本発明の実施形態は、汎用コンピュータ内で、または他の任意の回路もしくは
システムにおいて実施されてもよい。
ピューティングシステムとして、あるいはコンピュータプログラム製品またはコンピュータ可読媒体などの製造品として実施され得る。コンピュータプログラム製品は、コンピュータシステムによって可読であるとともに、コンピュータプロセスを実行するための命令のコンピュータプログラムを符号化したコンピュータ記憶媒体であり得る。また、このコンピュータプログラム製品は、コンピューティングシステムによって可読な、かつコンピュータプロセスを実行するための命令のコンピュータプログラムを符号化した、搬送波において伝搬される信号であることも可能である。したがって、本発明は、ハードウェアで、かつ/またはソフトウェア(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)で実施され得る。つまり、本発明の実施形態は、命令実行システムによって、または命令実行システムに関連して使用されるように、コンピュータによって使用可能な、または可読のプログラムコードが具現化されているコンピュータによって使用可能な、または可読の記憶媒体上のコンピュータプログラム製品の形態をとり得る。コンピュータによって使用可能な、または可読の媒体は、命令実行システム、命令実行装置、もしくは命令実行デバイスによって、または命令実行システム、命令実行装置、もしくは命令実行デバイスに関連して使用されるようにプログラムを含む、格納する、通信する、伝搬する、またはトランスポートすることが可能な任意の媒体であり得る。
光、電磁、赤外線、または半導体のシステム、装置、デバイス、または伝搬媒体であり得るが、これらに限定されない。より特定のコンピュータ可読媒体の例(網羅的でないリスト)として、コンピュータ可読媒体には、以下、すなわち、1つまたは複数の配線を有する電子接続、ポータブルコンピュータディスケット、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、消去可能なプログラマブル読取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、およびポータブルコンパクトディスク読取り専用メモリ(CD−ROM)が含まれる。コンピュータによって使用可能な、または可読の媒体は、プログラムが、例えば、紙または他の媒体の光学スキャンを介して電子的にキャプチャされ、その後、必要な場合、コンパイルされ、解釈され、またはそれ以外で適切に処理され、さらにその後、コンピュータメモリの中に格納され得るので、プログラムが印刷される紙または別の適切な媒体でさえあり得ることに留意されたい。
コンピュータプログラム製品のブロック図および/または動作上の例示を参照して前段で説明される。それらのブロックに記載される機能/動作は、いずれの流れ図に示される順序も外れて生じる場合がある。例えば、関与する機能/動作に依存して、連続して示される2つのブロックが、実際には、実質的に同時に実行可能であり、またはそれらのブロックが、ときとして、逆の順序で実行可能である。
も可能である。さらに、本発明の実施形態は、メモリおよび他の記憶媒体の中に格納されたデータに関連するものとして説明されてきたものの、データは、ハードディスク、フロッピー(登録商標)ディスク、もしくはCD−ROMのような二次ストレージデバイス、インターネットからの搬送波、または他の形態のRAMもしくはROMなどの、他のタイプのコンピュータ可読媒体上に格納されること、またはそのようなコンピュータ可読媒体から読み取られることも可能である。さらに、開示される方法の段階は、本発明を逸脱することなく、段階を並べ替えることによること、ならびに/または段階を挿入すること、および/もしくは削除することによることを含め、任意の様態で変形され得る。
、本出願人の所有権である。本出願人は、本明細書に含められたコードに対するすべての権利を保有するとともに、留保し、さらに許可された特許の再現に関連してのみ本資料を再現する許可を与え、それ以外の目的では許可を与えない。
れる。さらに、本明細書は、構造上の特徴、および/または方法上の動作に特有の言語で説明されてきたが、特許請求の範囲は、前述した特徴または動作に限定されない。むしろ、前述した特有の特徴および動作は、本発明の実施形態の例として開示される。
Claims (7)
- 拡張された会話理解アーキテクチャを実現するためのコンピュータで実行される方法であって、
ユーザから自然言語の語句を受け取るステップと、
前記自然言語の語句を検索語句に変換するステップと、
前記検索語句に応じて検索アクションを行うステップと、
複数のアプリケーションプログラミングインターフェース(API)を解析し、前記複数のアプリケーションプログラミングインターフェース(API)のそれぞれに関して少なくとも1つの要求されるパラメータを識別するステップであって、前記複数のアプリケーションプログラミングインターフェース(API)のそれぞれは、ウェブサイト検索機能に関連するステップと、
前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つを、前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つによって要求される少なくとも1つのパラメータを用いて呼び出すことによって、検索アクションを行うステップと、
前記検索アクションに基づく複数の検索結果を受け取るステップと、
前記複数の検索結果をユーザに提供するステップと、
を含む、コンピュータで実行される方法において、
前記自然言語の語句を検索語句に変換するステップは、
前記自然言語の語句に関連するコンテキストを識別するステップと、
前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つが、識別されたコンテキストに関連するかどうかを判定するステップと、
前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つが、識別されたコンテキストに関連するかどうかを判定することに応じて、前記自然言語の語句を検索語句に含まれる少なくとも一つの語を、前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つによって要求される少なくとも1つのパラメータに変換するステップと、
を含む、コンピュータで実行される方法。 - 前記検索語句は、少なくとも1つの意味概念を含む請求項1に記載のコンピュータで実行される方法。
- 前記少なくとも1つの意味概念は、前記自然言語の語句に含まれない語を含む請求項2に記載のコンピュータで実行される方法。
- 前記複数の検索結果をユーザに提供するステップは、前記複数の検索結果を複数のユーザに提供する、請求項1〜3のいずれか一項に記載の方法。
- 請求項1〜4のいずれか一項に記載の方法を実行するためのプログラム。
- 請求項1〜4のいずれか一項に記載の方法を実行するためのプログラムを記録した記録媒体。
- 拡張された会話理解アーキテクチャを実現するためのシステムであって、
メモリストレージと、
前記メモリストレージに結合された処理装置とを備え、前記処理装置は、
ユーザから自然言語の語句を受け取るステップと、
前記自然言語の語句を検索語句に変換するステップと、
前記検索語句に応じて検索アクションを行うステップと、
複数のアプリケーションプログラミングインターフェース(API)を解析し、前記複数のアプリケーションプログラミングインターフェース(API)のそれぞれに関して少なくとも1つの要求されるパラメータを識別するステップであって、前記複数のアプリケーションプログラミングインターフェース(API)のそれぞれは、ウェブサイト検索機能に関連するステップと、
前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つを、前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つによって要求される少なくとも1つのパラメータを用いて呼び出すことによって、検索アクションを行うステップと、
前記検索アクションに基づく複数の検索結果を受け取るステップと、
前記複数の検索結果をユーザに提供するステップと、
を実行するように構成され、
前記自然言語の語句を検索語句に変換するステップは、
前記自然言語の語句に関連するコンテキストを識別するステップと、
前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つが、識別されたコンテキストに関連するかどうかを判定するステップと、
前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つが、識別されたコンテキストに関連するかどうかを判定することに応じて、前記自然言語の語句を検索語句に含まれる少なくとも一つの語を、前記複数のアプリケーションプログラミングインターフェース(API)のうちの少なくとも1つによって要求される少なくとも1つのパラメータに変換するステップと、を含む
システム。
Applications Claiming Priority (14)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/077,368 US9298287B2 (en) | 2011-03-31 | 2011-03-31 | Combined activation for natural user interface systems |
US13/077,303 US9858343B2 (en) | 2011-03-31 | 2011-03-31 | Personalization of queries, conversations, and searches |
US13/077,455 | 2011-03-31 | ||
US13/077,396 US9842168B2 (en) | 2011-03-31 | 2011-03-31 | Task driven user intents |
US13/077,396 | 2011-03-31 | ||
US13/077,455 US9244984B2 (en) | 2011-03-31 | 2011-03-31 | Location based conversational understanding |
US13/077,431 | 2011-03-31 | ||
US13/077,303 | 2011-03-31 | ||
US13/076,862 | 2011-03-31 | ||
US13/077,431 US10642934B2 (en) | 2011-03-31 | 2011-03-31 | Augmented conversational understanding architecture |
US13/077,233 US20120253789A1 (en) | 2011-03-31 | 2011-03-31 | Conversational Dialog Learning and Correction |
US13/077,368 | 2011-03-31 | ||
US13/077,233 | 2011-03-31 | ||
US13/076,862 US9760566B2 (en) | 2011-03-31 | 2011-03-31 | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014502721A Division JP2014512046A (ja) | 2011-03-31 | 2012-03-27 | 拡張された会話理解アーキテクチャ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017123187A JP2017123187A (ja) | 2017-07-13 |
JP6305588B2 true JP6305588B2 (ja) | 2018-04-04 |
Family
ID=46931884
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014502721A Pending JP2014512046A (ja) | 2011-03-31 | 2012-03-27 | 拡張された会話理解アーキテクチャ |
JP2014502718A Active JP6105552B2 (ja) | 2011-03-31 | 2012-03-27 | ロケーションベースの会話理解 |
JP2014502723A Expired - Fee Related JP6087899B2 (ja) | 2011-03-31 | 2012-03-27 | 会話ダイアログ学習および会話ダイアログ訂正 |
JP2017038097A Active JP6305588B2 (ja) | 2011-03-31 | 2017-03-01 | 拡張された会話理解アーキテクチャ |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014502721A Pending JP2014512046A (ja) | 2011-03-31 | 2012-03-27 | 拡張された会話理解アーキテクチャ |
JP2014502718A Active JP6105552B2 (ja) | 2011-03-31 | 2012-03-27 | ロケーションベースの会話理解 |
JP2014502723A Expired - Fee Related JP6087899B2 (ja) | 2011-03-31 | 2012-03-27 | 会話ダイアログ学習および会話ダイアログ訂正 |
Country Status (5)
Country | Link |
---|---|
EP (6) | EP2691949A4 (ja) |
JP (4) | JP2014512046A (ja) |
KR (3) | KR101922744B1 (ja) |
CN (8) | CN106383866B (ja) |
WO (7) | WO2012135226A1 (ja) |
Families Citing this family (205)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10032127B2 (en) | 2011-02-18 | 2018-07-24 | Nuance Communications, Inc. | Methods and apparatus for determining a clinician's intent to order an item |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
EP2883204B1 (en) | 2012-08-10 | 2020-10-07 | Nuance Communications, Inc. | Virtual agent communication for electronic devices |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
DE212014000045U1 (de) | 2013-02-07 | 2015-09-24 | Apple Inc. | Sprach-Trigger für einen digitalen Assistenten |
CN105190628B (zh) * | 2013-03-01 | 2019-10-11 | 纽昂斯通讯公司 | 确定临床医生的预订项目的意图的方法和设备 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9436287B2 (en) * | 2013-03-15 | 2016-09-06 | Qualcomm Incorporated | Systems and methods for switching processing modes using gestures |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
US9728184B2 (en) | 2013-06-18 | 2017-08-08 | Microsoft Technology Licensing, Llc | Restructuring deep neural network acoustic models |
US9589565B2 (en) | 2013-06-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US20150170053A1 (en) * | 2013-12-13 | 2015-06-18 | Microsoft Corporation | Personalized machine learning models |
CN104714954A (zh) * | 2013-12-13 | 2015-06-17 | 中国电信股份有限公司 | 基于上下文理解的信息搜索方法和系统 |
US10534623B2 (en) | 2013-12-16 | 2020-01-14 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US10015770B2 (en) | 2014-03-24 | 2018-07-03 | International Business Machines Corporation | Social proximity networks for mobile phones |
US9529794B2 (en) | 2014-03-27 | 2016-12-27 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
US20150278370A1 (en) * | 2014-04-01 | 2015-10-01 | Microsoft Corporation | Task completion for natural language input |
US10111099B2 (en) | 2014-05-12 | 2018-10-23 | Microsoft Technology Licensing, Llc | Distributing content in managed wireless distribution networks |
US9874914B2 (en) | 2014-05-19 | 2018-01-23 | Microsoft Technology Licensing, Llc | Power management contracts for accessory devices |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9355640B2 (en) * | 2014-06-04 | 2016-05-31 | Google Inc. | Invoking action responsive to co-presence determination |
US9717006B2 (en) | 2014-06-23 | 2017-07-25 | Microsoft Technology Licensing, Llc | Device quarantine in a wireless network |
JP6275569B2 (ja) * | 2014-06-27 | 2018-02-07 | 株式会社東芝 | 対話装置、方法およびプログラム |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9824079B1 (en) | 2014-07-11 | 2017-11-21 | Google Llc | Providing actions for mobile onscreen content |
US10146409B2 (en) * | 2014-08-29 | 2018-12-04 | Microsoft Technology Licensing, Llc | Computerized dynamic splitting of interaction across multiple content |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
KR102188268B1 (ko) * | 2014-10-08 | 2020-12-08 | 엘지전자 주식회사 | 이동단말기 및 그 제어방법 |
CN107003723A (zh) * | 2014-10-21 | 2017-08-01 | 罗伯特·博世有限公司 | 用于会话系统中的响应选择和组成的自动化的方法和系统 |
KR102329333B1 (ko) * | 2014-11-12 | 2021-11-23 | 삼성전자주식회사 | 질의를 처리하는 장치 및 방법 |
US9836452B2 (en) | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
WO2016112005A1 (en) | 2015-01-05 | 2016-07-14 | Google Inc. | Multimodal state circulation |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
WO2016129767A1 (ko) * | 2015-02-13 | 2016-08-18 | 주식회사 팔락성 | 온라인 사이트 링크방법 |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) * | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US9792281B2 (en) * | 2015-06-15 | 2017-10-17 | Microsoft Technology Licensing, Llc | Contextual language generation by leveraging language understanding |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10249297B2 (en) | 2015-07-13 | 2019-04-02 | Microsoft Technology Licensing, Llc | Propagating conversational alternatives using delayed hypothesis binding |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
KR20170033722A (ko) * | 2015-09-17 | 2017-03-27 | 삼성전자주식회사 | 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치 |
US10262654B2 (en) * | 2015-09-24 | 2019-04-16 | Microsoft Technology Licensing, Llc | Detecting actionable items in a conversation among participants |
US10970646B2 (en) | 2015-10-01 | 2021-04-06 | Google Llc | Action suggestions for user-selected content |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
KR102393928B1 (ko) * | 2015-11-10 | 2022-05-04 | 삼성전자주식회사 | 응답 메시지를 추천하는 사용자 단말 장치 및 그 방법 |
CN108351890B (zh) * | 2015-11-24 | 2022-04-12 | 三星电子株式会社 | 电子装置及其操作方法 |
KR102502569B1 (ko) | 2015-12-02 | 2023-02-23 | 삼성전자주식회사 | 시스템 리소스 관리를 위한 방법 및 장치 |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9905248B2 (en) | 2016-02-29 | 2018-02-27 | International Business Machines Corporation | Inferring user intentions based on user conversation data and spatio-temporal data |
US9978396B2 (en) | 2016-03-16 | 2018-05-22 | International Business Machines Corporation | Graphical display of phone conversations |
US10587708B2 (en) * | 2016-03-28 | 2020-03-10 | Microsoft Technology Licensing, Llc | Multi-modal conversational intercom |
US11487512B2 (en) | 2016-03-29 | 2022-11-01 | Microsoft Technology Licensing, Llc | Generating a services application |
US10158593B2 (en) * | 2016-04-08 | 2018-12-18 | Microsoft Technology Licensing, Llc | Proactive intelligent personal assistant |
US10945129B2 (en) * | 2016-04-29 | 2021-03-09 | Microsoft Technology Licensing, Llc | Facilitating interaction among digital personal assistants |
US10409876B2 (en) * | 2016-05-26 | 2019-09-10 | Microsoft Technology Licensing, Llc. | Intelligent capture, storage, and retrieval of information for task completion |
US10242667B2 (en) * | 2016-06-03 | 2019-03-26 | Maluuba Inc. | Natural language generation in a spoken dialogue system |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10282218B2 (en) * | 2016-06-07 | 2019-05-07 | Google Llc | Nondeterministic task initiation by a personal assistant module |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10216269B2 (en) * | 2016-06-21 | 2019-02-26 | GM Global Technology Operations LLC | Apparatus and method for determining intent of user based on gaze information |
CA3033724A1 (en) * | 2016-08-23 | 2018-03-01 | Illumina, Inc. | Semantic distance systems and methods for determining related ontological data |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10446137B2 (en) * | 2016-09-07 | 2019-10-15 | Microsoft Technology Licensing, Llc | Ambiguity resolving conversational understanding system |
US10503767B2 (en) * | 2016-09-13 | 2019-12-10 | Microsoft Technology Licensing, Llc | Computerized natural language query intent dispatching |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US9940390B1 (en) * | 2016-09-27 | 2018-04-10 | Microsoft Technology Licensing, Llc | Control system using scoped search and conversational interface |
CN115858730A (zh) * | 2016-09-29 | 2023-03-28 | 微软技术许可有限责任公司 | 对话式的数据分析 |
US10535005B1 (en) | 2016-10-26 | 2020-01-14 | Google Llc | Providing contextual actions for mobile onscreen content |
JP6697373B2 (ja) | 2016-12-06 | 2020-05-20 | カシオ計算機株式会社 | 文生成装置、文生成方法及びプログラム |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
EP3552114A4 (en) * | 2017-02-08 | 2020-05-20 | Semantic Machines, Inc. | NATURAL LANGUAGE CONTENT GENERATOR |
US10643601B2 (en) * | 2017-02-09 | 2020-05-05 | Semantic Machines, Inc. | Detection mechanism for automated dialog systems |
CN110301004B (zh) * | 2017-02-23 | 2023-08-08 | 微软技术许可有限责任公司 | 可扩展对话系统 |
WO2018156978A1 (en) | 2017-02-23 | 2018-08-30 | Semantic Machines, Inc. | Expandable dialogue system |
US10798027B2 (en) * | 2017-03-05 | 2020-10-06 | Microsoft Technology Licensing, Llc | Personalized communications using semantic memory |
US10237209B2 (en) * | 2017-05-08 | 2019-03-19 | Google Llc | Initializing a conversation with an automated agent via selectable graphical element |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10664533B2 (en) * | 2017-05-24 | 2020-05-26 | Lenovo (Singapore) Pte. Ltd. | Systems and methods to determine response cue for digital assistant based on context |
US10679192B2 (en) * | 2017-05-25 | 2020-06-09 | Microsoft Technology Licensing, Llc | Assigning tasks and monitoring task performance based on context extracted from a shared contextual graph |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10742435B2 (en) * | 2017-06-29 | 2020-08-11 | Google Llc | Proactive provision of new content to group chat participants |
US11132499B2 (en) | 2017-08-28 | 2021-09-28 | Microsoft Technology Licensing, Llc | Robust expandable dialogue system |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10546023B2 (en) | 2017-10-03 | 2020-01-28 | Google Llc | Providing command bundle suggestions for an automated assistant |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
CN110019718B (zh) * | 2017-12-15 | 2021-04-09 | 上海智臻智能网络科技股份有限公司 | 修改多轮问答系统的方法、终端设备以及存储介质 |
US11341422B2 (en) | 2017-12-15 | 2022-05-24 | SHANGHAI XIAOl ROBOT TECHNOLOGY CO., LTD. | Multi-round questioning and answering methods, methods for generating a multi-round questioning and answering system, and methods for modifying the system |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10839160B2 (en) * | 2018-01-19 | 2020-11-17 | International Business Machines Corporation | Ontology-based automatic bootstrapping of state-based dialog systems |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
KR102635811B1 (ko) * | 2018-03-19 | 2024-02-13 | 삼성전자 주식회사 | 사운드 데이터를 처리하는 시스템 및 시스템의 제어 방법 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10685075B2 (en) * | 2018-04-11 | 2020-06-16 | Motorola Solutions, Inc. | System and method for tailoring an electronic digital assistant query as a function of captured multi-party voice dialog and an electronically stored multi-party voice-interaction template |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
JP7018589B2 (ja) | 2018-08-29 | 2022-02-14 | パナソニックIpマネジメント株式会社 | 電力変換システム及び蓄電システム |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
CN111428721A (zh) * | 2019-01-10 | 2020-07-17 | 北京字节跳动网络技术有限公司 | 词语释义的确定方法、装置、设备及存储介质 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11783827B2 (en) | 2020-11-06 | 2023-10-10 | Apple Inc. | Determining suggested subsequent user actions during digital assistant interaction |
EP4174848A1 (en) * | 2021-10-29 | 2023-05-03 | Televic Rail NV | Improved speech to text method and system |
CN116644810B (zh) * | 2023-05-06 | 2024-04-05 | 国网冀北电力有限公司信息通信分公司 | 一种基于知识图谱实现的电网故障风险处置方法及装置 |
Family Cites Families (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265014A (en) * | 1990-04-10 | 1993-11-23 | Hewlett-Packard Company | Multi-modal user interface |
US5748974A (en) * | 1994-12-13 | 1998-05-05 | International Business Machines Corporation | Multimodal natural language interface for cross-application tasks |
US5970446A (en) * | 1997-11-25 | 1999-10-19 | At&T Corp | Selective noise/channel/coding models and recognizers for automatic speech recognition |
JP2002523828A (ja) * | 1998-08-24 | 2002-07-30 | ビーシーエル コンピューターズ, インコーポレイテッド | 適応型自然言語インターフェース |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
US6332120B1 (en) * | 1999-04-20 | 2001-12-18 | Solana Technology Development Corporation | Broadcast speech recognition system for keyword monitoring |
JP3530109B2 (ja) * | 1999-05-31 | 2004-05-24 | 日本電信電話株式会社 | 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体 |
EP1236096A1 (en) * | 1999-06-01 | 2002-09-04 | Geoffrey M. Jacquez | Help system for a computer related application |
US6598039B1 (en) * | 1999-06-08 | 2003-07-22 | Albert-Inc. S.A. | Natural language interface for searching database |
JP3765202B2 (ja) * | 1999-07-09 | 2006-04-12 | 日産自動車株式会社 | 対話型情報検索装置、コンピュータを用いた対話型情報検索方法及び対話型情報検索処理を行うプログラムを記録したコンピュータ読取り可能な媒体 |
JP2001125896A (ja) * | 1999-10-26 | 2001-05-11 | Victor Co Of Japan Ltd | 自然言語対話システム |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
JP2002024285A (ja) * | 2000-06-30 | 2002-01-25 | Sanyo Electric Co Ltd | ユーザ支援方法およびユーザ支援装置 |
JP2002082748A (ja) * | 2000-09-06 | 2002-03-22 | Sanyo Electric Co Ltd | ユーザ支援装置 |
US7197120B2 (en) * | 2000-12-22 | 2007-03-27 | Openwave Systems Inc. | Method and system for facilitating mediated communication |
GB2372864B (en) * | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
JP2003115951A (ja) * | 2001-10-09 | 2003-04-18 | Casio Comput Co Ltd | 話題情報提供システムおよび話題情報提供方法 |
US7224981B2 (en) * | 2002-06-20 | 2007-05-29 | Intel Corporation | Speech recognition of mobile devices |
US7693720B2 (en) * | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
EP1411443A1 (en) * | 2002-10-18 | 2004-04-21 | Hewlett Packard Company, a Delaware Corporation | Context filter |
JP2004212641A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 音声入力システム及び音声入力システムを備えた端末装置 |
JP2004328181A (ja) * | 2003-04-23 | 2004-11-18 | Sharp Corp | 電話機及び電話網システム |
JP4441782B2 (ja) * | 2003-05-14 | 2010-03-31 | 日本電信電話株式会社 | 情報提示方法及び情報提示装置 |
JP2005043461A (ja) * | 2003-07-23 | 2005-02-17 | Canon Inc | 音声認識方法及び音声認識装置 |
KR20050032649A (ko) * | 2003-10-02 | 2005-04-08 | (주)이즈메이커 | 인공생명을 학습시키는 방법 및 시스템 |
US7747601B2 (en) * | 2006-08-14 | 2010-06-29 | Inquira, Inc. | Method and apparatus for identifying and classifying query intent |
US7720674B2 (en) * | 2004-06-29 | 2010-05-18 | Sap Ag | Systems and methods for processing natural language queries |
JP4434972B2 (ja) * | 2005-01-21 | 2010-03-17 | 日本電気株式会社 | 情報提供システム、情報提供方法及びそのプログラム |
EP1686495B1 (en) | 2005-01-31 | 2011-05-18 | Ontoprise GmbH | Mapping web services to ontologies |
GB0502259D0 (en) * | 2005-02-03 | 2005-03-09 | British Telecomm | Document searching tool and method |
CN101120341A (zh) * | 2005-02-06 | 2008-02-06 | 凌圭特股份有限公司 | 以自然语言进行移动式信息访问的方法和设备 |
US20060206333A1 (en) * | 2005-03-08 | 2006-09-14 | Microsoft Corporation | Speaker-dependent dialog adaptation |
US7409344B2 (en) * | 2005-03-08 | 2008-08-05 | Sap Aktiengesellschaft | XML based architecture for controlling user interfaces with contextual voice commands |
WO2006108061A2 (en) * | 2005-04-05 | 2006-10-12 | The Board Of Trustees Of Leland Stanford Junior University | Methods, software, and systems for knowledge base coordination |
US7991607B2 (en) * | 2005-06-27 | 2011-08-02 | Microsoft Corporation | Translation and capture architecture for output of conversational utterances |
US7640160B2 (en) * | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7627466B2 (en) * | 2005-11-09 | 2009-12-01 | Microsoft Corporation | Natural language interface for driving adaptive scenarios |
US7822699B2 (en) | 2005-11-30 | 2010-10-26 | Microsoft Corporation | Adaptive semantic reasoning engine |
US20070136222A1 (en) * | 2005-12-09 | 2007-06-14 | Microsoft Corporation | Question and answer architecture for reasoning and clarifying intentions, goals, and needs from contextual clues and content |
US20070143410A1 (en) * | 2005-12-16 | 2007-06-21 | International Business Machines Corporation | System and method for defining and translating chat abbreviations |
CN100373313C (zh) * | 2006-01-12 | 2008-03-05 | 广东威创视讯科技股份有限公司 | 一种用于交互式输入设备的智能识别编码方法 |
US8209407B2 (en) * | 2006-02-10 | 2012-06-26 | The United States Of America, As Represented By The Secretary Of The Navy | System and method for web service discovery and access |
JP4810609B2 (ja) * | 2006-06-13 | 2011-11-09 | マイクロソフト コーポレーション | サーチエンジンダッシュボード |
US20080005068A1 (en) * | 2006-06-28 | 2008-01-03 | Microsoft Corporation | Context-based search, retrieval, and awareness |
CN1963752A (zh) * | 2006-11-28 | 2007-05-16 | 李博航 | 基于自然语言的电子设备人机交互操作界面技术 |
EP2122542B1 (en) * | 2006-12-08 | 2017-11-01 | Medhat Moussa | Architecture, system and method for artificial neural network implementation |
US20080172359A1 (en) * | 2007-01-11 | 2008-07-17 | Motorola, Inc. | Method and apparatus for providing contextual support to a monitored communication |
US20080172659A1 (en) | 2007-01-17 | 2008-07-17 | Microsoft Corporation | Harmonizing a test file and test configuration in a revision control system |
US20080201434A1 (en) * | 2007-02-16 | 2008-08-21 | Microsoft Corporation | Context-Sensitive Searches and Functionality for Instant Messaging Applications |
US20090076917A1 (en) * | 2007-08-22 | 2009-03-19 | Victor Roditis Jablokov | Facilitating presentation of ads relating to words of a message |
US7720856B2 (en) * | 2007-04-09 | 2010-05-18 | Sap Ag | Cross-language searching |
US8762143B2 (en) * | 2007-05-29 | 2014-06-24 | At&T Intellectual Property Ii, L.P. | Method and apparatus for identifying acoustic background environments based on time and speed to enhance automatic speech recognition |
US7788276B2 (en) * | 2007-08-22 | 2010-08-31 | Yahoo! Inc. | Predictive stemming for web search with statistical machine translation models |
AU2008292781B2 (en) * | 2007-08-31 | 2012-08-09 | Microsoft Technology Licensing, Llc | Identification of semantic relationships within reported speech |
US8165886B1 (en) * | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8504621B2 (en) * | 2007-10-26 | 2013-08-06 | Microsoft Corporation | Facilitating a decision-making process |
JP2009116733A (ja) * | 2007-11-08 | 2009-05-28 | Nec Corp | アプリケーション検索システム、アプリケーション検索方法、モニタ端末、検索サーバおよびプログラム |
JP5158635B2 (ja) * | 2008-02-28 | 2013-03-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | パーソナル・サービス支援のための方法、システム、および装置 |
US20090234655A1 (en) * | 2008-03-13 | 2009-09-17 | Jason Kwon | Mobile electronic device with active speech recognition |
WO2009129315A1 (en) * | 2008-04-15 | 2009-10-22 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
CN101499277B (zh) * | 2008-07-25 | 2011-05-04 | 中国科学院计算技术研究所 | 一种服务智能导航方法和系统 |
US8874443B2 (en) * | 2008-08-27 | 2014-10-28 | Robert Bosch Gmbh | System and method for generating natural language phrases from user utterances in dialog systems |
JP2010128665A (ja) * | 2008-11-26 | 2010-06-10 | Kyocera Corp | 情報端末及び会話補助プログラム |
JP2010145262A (ja) * | 2008-12-19 | 2010-07-01 | Pioneer Electronic Corp | ナビゲーション装置 |
US8326637B2 (en) * | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
JP2010230918A (ja) * | 2009-03-26 | 2010-10-14 | Fujitsu Ten Ltd | 検索装置 |
US8700665B2 (en) * | 2009-04-27 | 2014-04-15 | Avaya Inc. | Intelligent conference call information agents |
US20100281435A1 (en) * | 2009-04-30 | 2010-11-04 | At&T Intellectual Property I, L.P. | System and method for multimodal interaction using robust gesture processing |
KR101622111B1 (ko) * | 2009-12-11 | 2016-05-18 | 삼성전자 주식회사 | 대화 시스템 및 그의 대화 방법 |
KR101007336B1 (ko) * | 2010-06-25 | 2011-01-13 | 한국과학기술정보연구원 | 온톨로지 기반 개인화 서비스 시스템 및 방법 |
US20120253789A1 (en) | 2011-03-31 | 2012-10-04 | Microsoft Corporation | Conversational Dialog Learning and Correction |
-
2012
- 2012-03-27 WO PCT/US2012/030751 patent/WO2012135226A1/en unknown
- 2012-03-27 WO PCT/US2012/030730 patent/WO2012135210A2/en unknown
- 2012-03-27 WO PCT/US2012/030757 patent/WO2012135229A2/en active Application Filing
- 2012-03-27 KR KR1020137025540A patent/KR101922744B1/ko active IP Right Grant
- 2012-03-27 WO PCT/US2012/030740 patent/WO2012135218A2/en active Application Filing
- 2012-03-27 KR KR1020137025586A patent/KR101963915B1/ko active IP Right Grant
- 2012-03-27 EP EP12763866.6A patent/EP2691949A4/en not_active Ceased
- 2012-03-27 WO PCT/US2012/030636 patent/WO2012135157A2/en unknown
- 2012-03-27 EP EP12763913.6A patent/EP2691885A4/en not_active Ceased
- 2012-03-27 JP JP2014502721A patent/JP2014512046A/ja active Pending
- 2012-03-27 JP JP2014502718A patent/JP6105552B2/ja active Active
- 2012-03-27 KR KR20137025578A patent/KR20140014200A/ko not_active Application Discontinuation
- 2012-03-27 JP JP2014502723A patent/JP6087899B2/ja not_active Expired - Fee Related
- 2012-03-27 EP EP12765896.1A patent/EP2691877A4/en not_active Withdrawn
- 2012-03-27 EP EP12764494.6A patent/EP2691870A4/en not_active Ceased
- 2012-03-29 CN CN201610801496.1A patent/CN106383866B/zh active Active
- 2012-03-29 CN CN201210087420.9A patent/CN102737096B/zh active Active
- 2012-03-30 CN CN201210090634.1A patent/CN102750311B/zh active Active
- 2012-03-30 EP EP12765100.8A patent/EP2691876A4/en not_active Ceased
- 2012-03-30 CN CN201210090349.XA patent/CN102737099B/zh active Active
- 2012-03-30 WO PCT/US2012/031722 patent/WO2012135783A2/en unknown
- 2012-03-30 CN CN201210091176.3A patent/CN102737101B/zh active Active
- 2012-03-30 EP EP12764853.3A patent/EP2691875A4/en not_active Ceased
- 2012-03-30 WO PCT/US2012/031736 patent/WO2012135791A2/en unknown
- 2012-03-31 CN CN201210093414.4A patent/CN102737104B/zh active Active
- 2012-03-31 CN CN201210092263.0A patent/CN102750270B/zh active Active
- 2012-03-31 CN CN201210101485.4A patent/CN102750271B/zh not_active Expired - Fee Related
-
2017
- 2017-03-01 JP JP2017038097A patent/JP6305588B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6305588B2 (ja) | 拡張された会話理解アーキテクチャ | |
US10642934B2 (en) | Augmented conversational understanding architecture | |
US10585957B2 (en) | Task driven user intents | |
US9299342B2 (en) | User query history expansion for improving language model adaptation | |
US10296587B2 (en) | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof | |
US9858343B2 (en) | Personalization of queries, conversations, and searches | |
US10049667B2 (en) | Location-based conversational understanding | |
CN110178151B (zh) | 任务主视图 | |
US20120253789A1 (en) | Conversational Dialog Learning and Correction | |
JP2015511746A (ja) | 会話式情報検索システムおよび方法 | |
JP2015511746A5 (ja) | ||
KR20150036643A (ko) | 내추럴 동작 입력을 사용한 문맥 관련 쿼리 조정 | |
JP5120975B2 (ja) | 対話装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180306 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6305588 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |