JP6912579B2 - 文脈を意識した人間−コンピュータ間対話 - Google Patents
文脈を意識した人間−コンピュータ間対話 Download PDFInfo
- Publication number
- JP6912579B2 JP6912579B2 JP2019535863A JP2019535863A JP6912579B2 JP 6912579 B2 JP6912579 B2 JP 6912579B2 JP 2019535863 A JP2019535863 A JP 2019535863A JP 2019535863 A JP2019535863 A JP 2019535863A JP 6912579 B2 JP6912579 B2 JP 6912579B2
- Authority
- JP
- Japan
- Prior art keywords
- topic
- topics
- user
- natural language
- data structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 131
- 230000004044 response Effects 0.000 claims description 94
- 230000008569 process Effects 0.000 claims description 90
- 230000003993 interaction Effects 0.000 claims description 49
- 230000015654 memory Effects 0.000 claims description 23
- 230000002452 interceptive effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 9
- 230000000717 retained effect Effects 0.000 description 6
- 241000282412 Homo Species 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- XIWFQDBQMCDYJT-UHFFFAOYSA-M benzyl-dimethyl-tridecylazanium;chloride Chemical compound [Cl-].CCCCCCCCCCCCC[N+](C)(C)CC1=CC=CC=C1 XIWFQDBQMCDYJT-UHFFFAOYSA-M 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 239000011800 void material Substances 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 235000004789 Rosa xanthina Nutrition 0.000 description 2
- 241000109329 Rosa xanthina Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Description
(allow_if (軽いゲーム))
(ルール $restart_game (ゲームを再開してください)
(=(event_name restart_game)))
(allow_if (高いgame_restart_confirmation))
(ルール $common_yes ($PT_Yes)
(=(event_name yes)))
こうした文法ルールは、ユーザがゲームを再開するために様々な形式の自然言語入力を使用することができる環境を規定してもよい。一番上のルールは、「ゲーム」の話題がわずかでも適切なことのみを必要とする。たとえば、一番上のルールは、「ゲーム」の話題が、いくつかの最低限の閾値(たとえば、>0)を満たす適合性の尺度を有する限り、効力を持ち続けてもよい。このことは、ユーザがゲームをしている間のどの時点においても当てはまってよく、同時にゲームはバックグラウンド等においてアクティブである。一番上の文法を満たす自然言語入力、即ち「ゲームを再開してください」が非常に注目される明白な表現であるので、一番上の文法が広く適用可能なことは当然である。
(allow_if (高い pizza_order_confirmation))
(allow_if (高い quiz_quit_game_question))
(allow_if (高い quiz_add_player_question))
(allow_if (高い phone_call_retry_question))
(ルール $common_yes ($PT_Yes)
(=(event_name yes)))
こうした文法ルールに関して、"pizza_order_confirmation"、"quiz_quit_game_question"、"quiz_add_player_question"、または"phone_call_retry_question"といった任意の話題が、高い適合性の尺度を有するときはいつでも、ユーザは単純な肯定的な応答(たとえば、「はい」、「承知しました」、「イエイ(yeah)」「もちろん」等)を与えることができる。この文法では、適用可能となるためには話題が非常に集中される(すなわち、比較的高い適合性の尺度)ことが必要となる。これは、個々の話題は、自動化アシスタント120が単純なyesまたはnoの応答を求める質問をするときにのみ、提起されるからである。こうした話題の2つ以上が、任意の所与のシナリオにおいて適用可能となる十分に高い適合性の尺度を有することはありそうにはない。たとえ、こうした話題の2つ以上が、現在のところ文脈的データ構造152に保持されているであっても、ごく最近に提起された話題のみが、厳しい適合性の要件を満たす可能性が高い。
(allow_if (中程度の人間)(中程度の人間))
(ルール $were_married (今まで結婚したことはあるか)
(=(event_name were_married)))
このルールは、多数の様々な人々が、少なくとも中程度の適合性の尺度を有するときに適用可能である。したがって、たとえば以下の人間−コンピュータ間対話が可能である。
ユーザ: Iron Maidenのリードボーカリストは誰?
AA: Bruce Dickinsonです。
ユーザ: Paparazzi songを歌ったのは誰?
AA: Lady Gagaでした
ユーザ: 彼らは今まで結婚したことがある?
AA: いいえ、ありません。
「人間」という話題の2つの明確な例が提起された。1つの例は"Bruce Dickinson"で、別の例は"Lady Gaga"であった。したがって、ユーザが、「彼らは今まで結婚したことがある?」と質問したとき、自動化アシスタント120は、上の文法ルールを適用して、2人は実際に結婚していないということを示す情報を取得することができる。
(allow_if ((point_of_interest))
(ルール $who_built (google 誰がそれを建設したか)
(=(event_name who_built)))
この文法ルールは、どのくらい適合性の尺度が高かろうと低かろうと、どのような関心ごとでも現在文脈的データ構造152に保持されている場合に適用可能である。"point_of_interest"の話題が、ユーザまたは自動化アシスタント120によって追加されるかもしれない場合、それはまた位置座標センサ(全地球測位システム、すなわち"Global Positioning System:GPS")などのコンポーネントにより、ユーザによって携行されるコンピューティングデバイスに追加される場合がある。ユーザがエッフェル塔の前に立って("point_of_interest"の話題が文脈的データ構造152に追加される)、「誰がこれを建設したか?」と質問すると仮定する。自動化アシスタント120は、上の文法ルールを適用してユーザの自然言語入力を構文解析し、「エッフェル塔はGustave Eiffelによって建設された」と応答することができる。
(allow_always)
(ルール $play_game (私は3人のプレーヤとゲームAを行いたい)
(=(event_name play_game_A)(プレーヤ 3))
(allow_if (中程度のgame_A))
(ルール $player_choice (3人のプレーヤが欲しい)
(=(event_name player_choice)(数 3))
(allow_if (高いplayer_question))
(ルール $number ($PT_Number)
(=(event_name number)(値 3))
これらの文法ルールから、開始に際して、ユーザは常に、3人のプレーヤとGAME Aを行いたいと特に述べることができることが明らかである。こうした声明は、ゲームプレーを開始するためにGAME Aによって必要とされるすべてのパラメータを含む。"game_A"という話題が、少なくとも中位の適合性の尺度を有する場合(たとえば、プレーヤは「GAME Aを行いたい」と言ったが、追加の情報は提供しなかった)、プレーヤはゲームプレーを開始するために「私は<非ゼロ整数>プレーヤが欲しい」と言うことができる。自動化アシスタント120が「プレーヤは何人ですか?」とだけ尋ねた場合、"player_question"という話題は十分に高い適合性の尺度を有すると言ってよく、ユーザは数字の応答をするだけでよい。
ユーザ: 私はGAME Aを行いたい。
AA: 承知いたしました。プレーヤは何人ですか?
ユーザ: 最初に時間を教えてください。
AA: 午後7時15分です。
ユーザ: Game of Rosesは今日いつ放映されますか?
AA: 午後8時に45分間です。
ユーザ: 承知しました。3人のプレーヤが欲しいです。
AA: 承知いたしました。プレーしましょう。最初の質問・・・
上記のように、ユーザの最初の声明(「私はGAME Aを行いたい」)は、文脈的データ構造にまだ何も話題がないので、ルートノードによって解釈される。図7Aに示すように、ユーザの要求により、子ノードプロセスGAME A、およびいくつかの場合には、MULTIPLAYER LOOPノードを開始させてもよい。いくつかの実装形態において、自動化アシスタントの応答(「承知いたしました。プレーヤは何人ですか?」)により、PLAYERSといった1つまたは複数の追加の子ノードプロセスをノードGAME Aの下に追加させてもよい。
void SomeChildClass::set_difficulty(int level);
他方、二重通信においては、受信側は、結果を呼び出し元に返報できなければならない。したがって、両者ともインタフェースを公開してもよい。
void SomeChildClass::ask_for_game_settings();
void ParentClass::game_settings_callback(const GameSettings& settings);
テンプレートプログラミング(たとえば、C++で)が使用される場合、たとえば二重通信を可能とするために、子によって必要とされるインタフェースを、親プロセスが実装することを保証することが可能であってよい。その結果、呼び出し元と呼び出し先の間の通信プロトコルの不一致によっておこるバグは、コンパイル時に検出されてもよい。
1061 クライアントデバイス
106N クライアントデバイス
1061-N クライアントコンピューティングデバイス
107 メッセージ交換クライアント
1071-N メッセージ交換クライアント
120 自動化アシスタント
130 パーササブシステム
132 文法エンジン
134 文法データベース
140 応答サブシステム
142 対話エンジン
144 対話ツリー
150 対話文脈エンジン
152 文脈的データ構造
160 アプリケーションエンジン
162 アプリケーションライブラリ
270 文法
272 人間−コンピュータ間対話
364 無向グラフ
464 無向グラフ
644 対話ツリー
670 人間−コンピュータ間対話
672 人間−コンピュータ間対話
744 対話ツリー
800 方法
910 コンピューティングデバイス
912 バスサブシステム
914 プロセッサ
916 ネットワークインタフェースサブシステム
920 ユーザインタフェース出力デバイス
922 ユーザインタフェース入力デバイス
924 記憶装置サブシステム
925 メモリ、メモリサブシステム
926 ファイル記憶装置サブシステム
930 主ランダムアクセスメモリ(RAM)
932 リードオンリメモリ(ROM)
Claims (8)
- ユーザと1つまたは複数のプロセッサによって動作する自動化アシスタントとの間の進行中の人間−コンピュータ間対話の一部として、前記ユーザからの自然言語入力を受信するステップと、
前記自然言語入力を構文解析するための1つまたは複数の文法を選択するステップであって、前記進行中の人間−コンピュータ間対話と関連付けられた文脈的データ構造の一部としてメモリに記憶された1つまたは複数の話題に基づき、前記文脈的データ構造の一部として前記メモリに記憶された各話題が、前記進行中の人間−コンピュータ間対話に対する前記話題の適合性の尺度と関連付けられ、前記文脈的データ構造が、複数のノードおよび前記複数のノードを接続する複数のエッジを含む無向グラフを含み、前記無向グラフの各ノードが、前記文脈的データ構造の一部として記憶された前記1つまたは複数の話題のうちの所与の話題、および前記所与の話題が最後に提起された以降の前記進行中の人間−コンピュータ間対話のやり取りの回数を表し、2つのノードを接続する各エッジが、前記2つのノードによってそれぞれ表される2つの話題間の関連性の尺度を表し、各話題と関連付けられた適合性の尺度が、前記やり取りの回数と前記関連性の尺度に少なくとも部分的に基づいて判定される、ステップと、
1つまたは複数の構文解析を生成するために、前記選択された1つまたは複数の文法に基づいて前記自然言語入力を構文解析するステップと、
前記構文解析の1つまたは複数に基づいて、自然言語応答を生成するステップと、
1つまたは複数の出力デバイスを使用して、前記自然言語応答を前記ユーザに出力するステップと、
前記構文解析の1つまたは複数あるいは前記自然言語応答によって提起された1つまたは複数の話題を識別するステップと、
前記識別された1つまたは複数の話題を前記文脈的データ構造に追加するステップと
を含む、コンピュータ実施方法。 - 前記1つまたは複数の文法が複数の文法から選択され、前記複数の文法のそれぞれが1つまたは複数の適用可能な話題と関連して記憶される、請求項1に記載のコンピュータ実施方法。
- 前記進行中の人間−コンピュータ間対話中にもたらされた1つまたは複数のインタラクティブ音声プロセスを表す1つまたは複数のノードを有する対話ツリーを生成するステップであって、前記ノードの1つまたは複数が1つまたは複数の話題と関連付けられ、前記対話ツリーの前記ノードの1つまたは複数が、前記1つまたは複数の話題との関連性に基づいて生成される、ステップをさらに含む、請求項1または2に記載のコンピュータ実施方法。
- 前記選択するステップが、前記1つまたは複数の話題と関連付けられた1つまたは複数の文法から前記1つまたは複数の文法を選択するステップを含む、請求項3に記載のコンピュータ実施方法。
- 1つまたは複数のプロセッサ、および前記1つまたは複数のプロセッサと動作可能に結合されたメモリを備えるシステムであって、前記メモリが、1つまたは複数のプロセッサによる前記命令の実行に応答して、前記1つまたは複数のプロセッサに、
ユーザと1つまたは複数のプロセッサによって動作する自動化アシスタントとの間の進行中の人間−コンピュータ間対話の一部として、前記ユーザからの自然言語入力を受信することと、
前記自然言語入力を構文解析するための1つまたは複数の文法を選択することであって、前記進行中の人間−コンピュータ間対話と関連付けられた文脈的データ構造の一部としてメモリに記憶された1つまたは複数の話題に基づき、前記文脈的データ構造の一部として前記メモリに記憶された各話題が、前記進行中の人間−コンピュータ間対話に対する前記話題の適合性の尺度と関連付けられ、前記文脈的データ構造が、複数のノードおよび前記複数のノードを接続する複数のエッジを含む無向グラフを含み、前記無向グラフの各ノードが、前記文脈的データ構造の一部として記憶された前記1つまたは複数の話題のうちの所与の話題、および前記所与の話題が最後に提起された以降の前記進行中の人間−コンピュータ間対話のやり取りの回数を表し、2つのノードを接続する各エッジが、前記2つのノードによってそれぞれ表される2つの話題間の関連性の尺度を表し、各話題と関連付けられた適合性の尺度が、前記やり取りの回数と前記関連性の尺度に少なくとも部分的に基づいて判定される、選択することと、
1つまたは複数の構文解析を生成するために、前記選択された1つまたは複数の文法に基づいて前記自然言語入力を構文解析することと、
前記構文解析の1つまたは複数に基づいて、自然言語応答を生成することと、
1つまたは複数の出力デバイスを使用して、前記自然言語応答を前記ユーザに出力することと、
前記構文解析の1つまたは複数あるいは前記自然言語応答によって提起された1つまたは複数の話題を識別することと、
前記識別された1つまたは複数の話題を前記文脈的データ構造に追加することと
を行わせる命令を記憶する、システム。 - 前記1つまたは複数の文法が複数の文法から選択され、前記複数の文法のそれぞれが1つまたは複数の適用可能な話題と関連して記憶される、請求項5に記載のシステム。
- 1つまたは複数のプロセッサによる命令の実行に応答して、前記1つまたは複数のプロセッサに、
ユーザと1つまたは複数のプロセッサによって動作する自動化アシスタントとの間の進行中の人間−コンピュータ間対話の一部として、前記ユーザからの自然言語入力を受信することと、
前記自然言語入力を構文解析するための1つまたは複数の文法を選択することであって、前記進行中の人間−コンピュータ間対話と関連付けられた文脈的データ構造の一部としてメモリに記憶された1つまたは複数の話題に基づき、前記文脈的データ構造の一部として前記メモリに記憶された各話題が、前記進行中の人間−コンピュータ間対話に対する前記話題の適合性の尺度と関連付けられ、前記文脈的データ構造が、複数のノードおよび前記複数のノードを接続する複数のエッジを含む無向グラフを含み、前記無向グラフの各ノードが、前記文脈的データ構造の一部として記憶された前記1つまたは複数の話題のうちの所与の話題、および前記所与の話題が最後に提起された以降の前記進行中の人間−コンピュータ間対話のやり取りの回数を表し、2つのノードを接続する各エッジが、前記2つのノードによってそれぞれ表される2つの話題間の関連性の尺度を表し、各話題と関連付けられた適合性の尺度が、前記やり取りの回数と前記関連性の尺度に少なくとも部分的に基づいて判定される、選択することと、
1つまたは複数の構文解析を生成するために、前記選択された1つまたは複数の文法に基づいて前記自然言語入力を構文解析することと、
前記構文解析の1つまたは複数に基づいて、自然言語応答を生成することと、
1つまたは複数の出力デバイスを使用して、前記自然言語応答を前記ユーザに出力することと、
前記構文解析の1つまたは複数あるいは前記自然言語応答によって提起された1つまたは複数の話題を識別することと、
前記識別された1つまたは複数の話題を前記文脈的データ構造に追加することと
を含む動作を実行させる前記命令を含む、少なくとも1つの非一時的コンピュータ可読記憶媒体。 - コンピューティング機器によって実行されると、前記コンピューティング機器に請求項1から4のいずれか一項の方法を実行させる命令を含む、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662440856P | 2016-12-30 | 2016-12-30 | |
US62/440,856 | 2016-12-30 | ||
US15/446,908 | 2017-03-01 | ||
US15/446,908 US10268680B2 (en) | 2016-12-30 | 2017-03-01 | Context-aware human-to-computer dialog |
PCT/US2017/052721 WO2018125332A1 (en) | 2016-12-30 | 2017-09-21 | Context-aware human-to-computer dialog |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020503620A JP2020503620A (ja) | 2020-01-30 |
JP6912579B2 true JP6912579B2 (ja) | 2021-08-04 |
Family
ID=60270219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019535863A Active JP6912579B2 (ja) | 2016-12-30 | 2017-09-21 | 文脈を意識した人間−コンピュータ間対話 |
Country Status (8)
Country | Link |
---|---|
US (2) | US10268680B2 (ja) |
EP (3) | EP4152314B1 (ja) |
JP (1) | JP6912579B2 (ja) |
KR (2) | KR102355988B1 (ja) |
CN (2) | CN108268587B (ja) |
DE (2) | DE102017122357B4 (ja) |
GB (1) | GB2558352A (ja) |
WO (1) | WO2018125332A1 (ja) |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
WO2014182820A2 (en) * | 2013-05-07 | 2014-11-13 | Haley Paul V | System for knowledge acquisition |
US20190129941A2 (en) * | 2013-05-21 | 2019-05-02 | Happify, Inc. | Systems and methods for dynamic user interaction for improving happiness |
EP3937002A1 (en) | 2013-06-09 | 2022-01-12 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10872289B2 (en) * | 2017-04-08 | 2020-12-22 | Geun Il Kim | Method and system for facilitating context based information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10176808B1 (en) * | 2017-06-20 | 2019-01-08 | Microsoft Technology Licensing, Llc | Utilizing spoken cues to influence response rendering for virtual assistants |
US10387463B2 (en) * | 2017-07-06 | 2019-08-20 | International Business Machines Corporation | Dialog agent for conducting task-oriented computer-based communications |
US11436469B2 (en) * | 2017-07-31 | 2022-09-06 | Microsoft Technology Licensing, Llc | Knowledge graph for conversational semantic search |
US11514903B2 (en) * | 2017-08-04 | 2022-11-29 | Sony Corporation | Information processing device and information processing method |
WO2019155716A1 (ja) * | 2018-02-08 | 2019-08-15 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
WO2019161207A1 (en) * | 2018-02-15 | 2019-08-22 | DMAI, Inc. | System and method for conversational agent via adaptive caching of dialogue tree |
US11308312B2 (en) | 2018-02-15 | 2022-04-19 | DMAI, Inc. | System and method for reconstructing unoccupied 3D space |
US11018997B2 (en) * | 2018-04-12 | 2021-05-25 | Disney Enterprises, Inc. | Systems and methods for maintaining a conversation |
US10699708B2 (en) * | 2018-04-24 | 2020-06-30 | Accenture Global Solutions Limited | Robotic agent conversation escalation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US10891950B2 (en) * | 2018-09-27 | 2021-01-12 | International Business Machines Corporation | Graph based prediction for next action in conversation flow |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
EP3859568A4 (en) * | 2018-09-28 | 2021-09-29 | Fujitsu Limited | DIALOGUE DEVICE, DIALOGUE PROCEDURE AND DIALOGUE PROGRAM |
US11714965B2 (en) * | 2018-11-09 | 2023-08-01 | Genesys Telecommunications Laboratories, Inc. | System and method for model derivation for entity prediction |
CN111223477B (zh) * | 2018-11-23 | 2023-01-24 | 珠海格力电器股份有限公司 | 一种人机交互时话题上移的方法及设备 |
JP7160116B2 (ja) * | 2018-12-25 | 2022-10-25 | 富士通株式会社 | 対話装置、対話方法及び対話プログラム |
US11295213B2 (en) * | 2019-01-08 | 2022-04-05 | International Business Machines Corporation | Conversational system management |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11790176B2 (en) | 2019-03-19 | 2023-10-17 | Servicenow, Inc. | Systems and methods for a virtual agent in a cloud computing environment |
US11423910B2 (en) * | 2019-03-19 | 2022-08-23 | Servicenow, Inc. | Systems and method for third party natural language understanding service integration |
US11544475B2 (en) | 2019-03-22 | 2023-01-03 | Predictika Inc. | System and method for providing a model-based intelligent conversational agent |
CN110188190B (zh) * | 2019-04-03 | 2023-07-14 | 创新先进技术有限公司 | 对话解析方法、装置、服务器及可读存储介质 |
US10964324B2 (en) | 2019-04-26 | 2021-03-30 | Rovi Guides, Inc. | Systems and methods for enabling topic-based verbal interaction with a virtual assistant |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
CN112017662B (zh) * | 2019-05-31 | 2023-07-07 | 阿里巴巴集团控股有限公司 | 控制指令确定方法、装置、电子设备和存储介质 |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11256868B2 (en) | 2019-06-03 | 2022-02-22 | Microsoft Technology Licensing, Llc | Architecture for resolving ambiguous user utterance |
CN110704595B (zh) * | 2019-09-27 | 2022-08-23 | 百度在线网络技术(北京)有限公司 | 对话的处理方法、装置、电子设备及可读存储介质 |
CN111177310B (zh) * | 2019-12-06 | 2023-08-18 | 广西电网有限责任公司 | 电力服务机器人智能场景会话方法及装置 |
WO2021183156A1 (en) * | 2020-03-13 | 2021-09-16 | Google Llc | Natural language dialog system for video game interaction |
US11195534B1 (en) * | 2020-03-30 | 2021-12-07 | Amazon Technologies, Inc. | Permissioning for natural language processing systems |
CN111506292B (zh) * | 2020-04-15 | 2021-06-15 | 思必驰科技股份有限公司 | 用于人机对话的语音技能跳转方法、电子设备及存储介质 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
DE102021109265A1 (de) | 2020-08-31 | 2022-03-03 | Cognigy Gmbh | Verfahren zur Optimierung |
US11790173B2 (en) * | 2020-10-22 | 2023-10-17 | Google Llc | Recommending action(s) based on entity or entity type |
CN112667795B (zh) * | 2021-01-04 | 2023-07-28 | 北京百度网讯科技有限公司 | 对话树构建方法和装置、对话树运行方法、装置以及系统 |
US20220351741A1 (en) * | 2021-04-29 | 2022-11-03 | Rovi Guides, Inc. | Systems and methods to alter voice interactions |
US11984112B2 (en) | 2021-04-29 | 2024-05-14 | Rovi Guides, Inc. | Systems and methods to alter voice interactions |
US12039471B2 (en) | 2021-11-29 | 2024-07-16 | T-Mobile Usa, Inc. | Tracking issues and resolution of same in a wireless communication network |
US11962455B2 (en) | 2021-11-29 | 2024-04-16 | T-Mobile Usa, Inc. | Prioritizing multiple issues associated with a wireless telecommunication network |
US11855831B1 (en) | 2022-06-10 | 2023-12-26 | T-Mobile Usa, Inc. | Enabling an operator to resolve an issue associated with a 5G wireless telecommunication network using AR glasses |
WO2024020065A1 (en) * | 2022-07-20 | 2024-01-25 | Cerence Operating Company | Collaboration between a recommendation engine and a voice assistant |
KR20240141101A (ko) | 2023-03-18 | 2024-09-25 | 김만돌 | 모범적 공감형 인공지능의 대화 방법 및 시스템 |
KR20240145239A (ko) | 2023-03-27 | 2024-10-07 | 김만돌 | 공감형 챗gpt 인공지능의 대화 방법 및 시스템 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
JP2001188784A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 会話処理装置および方法、並びに記録媒体 |
US6985852B2 (en) * | 2001-08-21 | 2006-01-10 | Microsoft Corporation | Method and apparatus for dynamic grammars and focused semantic parsing |
US20030061029A1 (en) | 2001-08-29 | 2003-03-27 | Efraim Shaket | Device for conducting expectation based mixed initiative natural language dialogs |
US7197460B1 (en) * | 2002-04-23 | 2007-03-27 | At&T Corp. | System for handling frequently asked questions in a natural language dialog service |
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7542902B2 (en) * | 2002-07-29 | 2009-06-02 | British Telecommunications Plc | Information provision for call centres |
KR101032176B1 (ko) | 2002-12-02 | 2011-05-02 | 소니 주식회사 | 대화 제어 장치 및 방법 및 로봇 장치 |
US8645122B1 (en) * | 2002-12-19 | 2014-02-04 | At&T Intellectual Property Ii, L.P. | Method of handling frequently asked questions in a natural language dialog service |
WO2005122145A1 (en) * | 2004-06-08 | 2005-12-22 | Metaphor Solutions, Inc. | Speech recognition dialog management |
TWI237991B (en) | 2004-06-28 | 2005-08-11 | Delta Electronics Inc | Integrated dialogue system and method thereof |
US7716056B2 (en) * | 2004-09-27 | 2010-05-11 | Robert Bosch Corporation | Method and system for interactive conversational dialogue for cognitively overloaded device users |
US7925506B2 (en) * | 2004-10-05 | 2011-04-12 | Inago Corporation | Speech recognition accuracy via concept to keyword mapping |
CA2483805C (en) * | 2004-10-05 | 2015-04-21 | Inago Corporation | System and methods for improving accuracy of speech recognition |
KR100755677B1 (ko) | 2005-11-02 | 2007-09-05 | 삼성전자주식회사 | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 |
JP2008009552A (ja) * | 2006-06-27 | 2008-01-17 | Nippon Telegr & Teleph Corp <Ntt> | インデクス生成装置、インデクス生成方法およびインデクス生成プログラム |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8073681B2 (en) * | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US20080221892A1 (en) * | 2007-03-06 | 2008-09-11 | Paco Xander Nathan | Systems and methods for an autonomous avatar driver |
US20090030697A1 (en) | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Using contextual information for delivering results generated from a speech recognition facility using an unstructured language model |
US9348816B2 (en) * | 2008-10-14 | 2016-05-24 | Honda Motor Co., Ltd. | Dialog coherence using semantic features |
US8326637B2 (en) * | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US20120245925A1 (en) * | 2011-03-25 | 2012-09-27 | Aloke Guha | Methods and devices for analyzing text |
US8880406B2 (en) * | 2011-03-28 | 2014-11-04 | Epic Systems Corporation | Automatic determination of and response to a topic of a conversation |
WO2013042117A1 (en) | 2011-09-19 | 2013-03-28 | Personetics Technologies Ltd. | System and method for evaluating intent of a human partner to a dialogue between human user and computerized system |
US9214157B2 (en) * | 2011-12-06 | 2015-12-15 | At&T Intellectual Property I, L.P. | System and method for machine-mediated human-human conversation |
US8458197B1 (en) * | 2012-01-31 | 2013-06-04 | Google Inc. | System and method for determining similar topics |
US8346563B1 (en) * | 2012-04-10 | 2013-01-01 | Artificial Solutions Ltd. | System and methods for delivering advanced natural language interaction applications |
US20140278427A1 (en) | 2013-03-13 | 2014-09-18 | Samsung Electronics Co., Ltd. | Dynamic dialog system agent integration |
US9189742B2 (en) * | 2013-11-20 | 2015-11-17 | Justin London | Adaptive virtual intelligent agent |
US10079013B2 (en) * | 2013-11-27 | 2018-09-18 | Sri International | Sharing intents to provide virtual assistance in a multi-person dialog |
RU2014111971A (ru) * | 2014-03-28 | 2015-10-10 | Юрий Михайлович Буров | Способ и система голосового интерфейса |
EP3164806A1 (en) * | 2014-07-04 | 2017-05-10 | Intelligent Digital Avatars, Inc. | Systems and methods for assessing, verifying and adjusting the affective state of a user |
US9842102B2 (en) * | 2014-11-10 | 2017-12-12 | Oracle International Corporation | Automatic ontology generation for natural-language processing applications |
US9466297B2 (en) * | 2014-12-09 | 2016-10-11 | Microsoft Technology Licensing, Llc | Communication system |
US10061867B2 (en) * | 2014-12-30 | 2018-08-28 | Genesys Telecommunications Laboratories, Inc. | System and method for interactive multi-resolution topic detection and tracking |
CN104573028B (zh) | 2015-01-14 | 2019-01-25 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和系统 |
US10418032B1 (en) * | 2015-04-10 | 2019-09-17 | Soundhound, Inc. | System and methods for a virtual assistant to manage and use context in a natural language dialog |
US10599644B2 (en) * | 2016-09-14 | 2020-03-24 | International Business Machines Corporation | System and method for managing artificial conversational entities enhanced by social knowledge |
US9953650B1 (en) * | 2016-12-08 | 2018-04-24 | Louise M Falevsky | Systems, apparatus and methods for using biofeedback for altering speech |
-
2017
- 2017-03-01 US US15/446,908 patent/US10268680B2/en active Active
- 2017-09-21 WO PCT/US2017/052721 patent/WO2018125332A1/en unknown
- 2017-09-21 EP EP22204713.6A patent/EP4152314B1/en active Active
- 2017-09-21 EP EP17886881.6A patent/EP3563258B1/en active Active
- 2017-09-21 KR KR1020197022334A patent/KR102355988B1/ko active IP Right Grant
- 2017-09-21 JP JP2019535863A patent/JP6912579B2/ja active Active
- 2017-09-21 EP EP21202764.3A patent/EP3958254B1/en active Active
- 2017-09-21 KR KR1020227002256A patent/KR102394289B1/ko active IP Right Grant
- 2017-09-26 DE DE102017122357.6A patent/DE102017122357B4/de active Active
- 2017-09-26 DE DE202017105864.6U patent/DE202017105864U1/de active Active
- 2017-09-27 CN CN201710891157.1A patent/CN108268587B/zh active Active
- 2017-09-27 CN CN202210018083.1A patent/CN114490977A/zh active Pending
- 2017-09-28 GB GB1715746.2A patent/GB2558352A/en not_active Withdrawn
-
2019
- 2019-03-07 US US16/295,302 patent/US11227124B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
KR102355988B1 (ko) | 2022-01-26 |
KR102394289B1 (ko) | 2022-05-04 |
EP3563258B1 (en) | 2021-11-03 |
US20190205379A1 (en) | 2019-07-04 |
GB201715746D0 (en) | 2017-11-15 |
EP3958254B1 (en) | 2023-05-10 |
US10268680B2 (en) | 2019-04-23 |
JP2020503620A (ja) | 2020-01-30 |
DE102017122357B4 (de) | 2022-10-20 |
EP4152314B1 (en) | 2024-06-12 |
CN108268587A (zh) | 2018-07-10 |
EP3563258A1 (en) | 2019-11-06 |
KR20190099061A (ko) | 2019-08-23 |
DE102017122357A1 (de) | 2018-07-05 |
EP3563258A4 (en) | 2020-05-20 |
GB2558352A (en) | 2018-07-11 |
WO2018125332A1 (en) | 2018-07-05 |
US11227124B2 (en) | 2022-01-18 |
CN114490977A (zh) | 2022-05-13 |
US20180189267A1 (en) | 2018-07-05 |
CN108268587B (zh) | 2022-01-28 |
KR20220016286A (ko) | 2022-02-08 |
DE202017105864U1 (de) | 2018-01-10 |
EP4152314A1 (en) | 2023-03-22 |
EP3958254A1 (en) | 2022-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6912579B2 (ja) | 文脈を意識した人間−コンピュータ間対話 | |
KR102418511B1 (ko) | 서드 파티 에이전트를 사용하기 위한 호출 요청 생성 및 전송 | |
JP7263376B2 (ja) | 自動化されたアシスタントによる以前の対話コンテキスト間の遷移 | |
US11113481B2 (en) | Adapting automated assistants for use with multiple languages | |
US20240118910A1 (en) | Adapting client application of feature phone based on experiment parameters | |
KR102429407B1 (ko) | 사용자 구성의 맞춤형 인터렉티브 대화 애플리케이션 | |
US20230230578A1 (en) | Personalized speech query endpointing based on prior interaction(s) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190827 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6912579 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |