JP2002259372A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2002259372A5 JP2002259372A5 JP2001279145A JP2001279145A JP2002259372A5 JP 2002259372 A5 JP2002259372 A5 JP 2002259372A5 JP 2001279145 A JP2001279145 A JP 2001279145A JP 2001279145 A JP2001279145 A JP 2001279145A JP 2002259372 A5 JP2002259372 A5 JP 2002259372A5
- Authority
- JP
- Japan
- Prior art keywords
- discourse
- language
- model
- meaning
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009877 rendering Methods 0.000 description 11
- 230000001131 transforming Effects 0.000 description 4
- 230000003542 behavioural Effects 0.000 description 2
- 238000005352 clarification Methods 0.000 description 1
- 230000000875 corresponding Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001755 vocal Effects 0.000 description 1
Description
【特許請求の範囲】
【請求項1】 コンピュータ・システムにおいてダイアログ・インターフェースを提供する方法であって、
ユーザ入力を受け取るステップと、
前記ユーザ入力を言語モデルに適用するステップであって、前記ユーザ入力の内容を記述する少なくとも1つの表面的意味を生成し、かつ該少なくとも1つの表面的意味の各々に対するスコアを決定し、各前記少なくとも1つの表面的意味が、少なくとも1つの表面的意味トークンを含む、ステップと、
各前記少なくとも1つの表面的意味を談話モデルに適用するステップであって、ユーザとのダイアログの現状態を記述する少なくとも1つの談話意味を生成し、かつ各該少なくとも1つの談話意味に対するスコアを決定し、各前記少なくとも1つの談話意味が、少なくとも1つの談話意味トークンを含む、ステップと、
各前記少なくとも1つの談話意味を挙動モデルに適用するステップであって、前記コンピュータ・システムがとる少なくとも1つのアクションを定め、かつ各該少なくとも1つのアクションに対するスコアを決定する、ステップと、
前記談話モデルが与える前記スコアに部分的に基づき、かつ前記挙動モデルが与える前記スコアに部分的に基づいて、前記少なくとも1つのアクションのうちの1つを選択して行なうステップと、
を備えた方法。
【請求項2】 請求項1記載の方法であって、更に、
前記ユーザ入力を受け取るステップは、複数のモードのユーザ入力を受け取るステップを含み、
前記ユーザ入力を言語モデルに適用するステップは、
各前記モードのユーザ入力を、当該各モードのユーザ入力に対して用意された言語モデルに適用するステップであって、受け取った各前記モードのユーザ入力に対し、少なくとも1つの表面的意味を生成し、かつ各該少なくとも1つの表面的意味に対してスコアを決定する、ステップ、
を含む、方法。
【請求項3】 請求項1記載の方法において、各前記少なくとも1つの表面的意味を談話モデルに適用するステップは、更に、
談話意味が含む談話意味トークンに対する可能な置換物として、前記談話意味トークンに関連する属性と同じ属性をもつ複数のエンティティをデータベースから検索するステップと、
前記談話意味トークンの前記属性を表す子談話意味トークンとして、前記複数のエンティティを追加して、各前記エンティティに対し別個の談話意味構造を形成するステップと、
各エンティティに関連する各前記談話意味構造に対し、スコアを決定するステップと、を含む、方法。
【請求項4】 請求項1記載の方法において、各前記少なくとも1つの談話意味を挙動モデルに適用するステップは、更に、使用可能なユーザ・インターフェースの識別を前記挙動モデルに適用し、前記使用可能なユーザ・インターフェースと適合するアクションが、前記ユーザ・インターフェースと適合しないアクションよりも総合的に高いスコアを受けるようにするステップを含む、方法。
【請求項5】 請求項1記載の方法であって、
各前記少なくとも1つの談話意味を挙動モデルに適用するステップは、拡張可能スタイルシート言語を用いて設計された挙動モデルを使うことによって、マークアップ言語を用いて記述されるアクションに、マークアップ言語を用いて記述される各前記少なくとも1つの談話意味を変換するステップを含み、使用可能なユーザ・インターフェースに基づいて、前記アクションに対する前記マークアップ言語が選択される、
方法。
【請求項6】 請求項5記載の方法において、各前記少なくとも1つの談話意味の前記マークアップ言語は、拡張可能マークアップ言語であり、マークアップ言語を用いて記述されるアクションに各前記少なくとも1つの談話意味を変換することは、各前記少なくとも1つの談話意味を拡張可能スタイルシート言語変換に適用することを含む、方法。
【請求項7】 請求項6記載の方法であって、更に、
前記使用可能なユーザ・インターフェースを変更する命令をユーザから受け取るステップと、
各前記少なくとも1つの談話意味を第2の拡張可能スタイルシート言語変換に適用して、各前記少なくとも1つの談話意味を、第2マークアップ言語を用いて記述したアクションに変換するステップと、
を含む、方法。
【請求項8】 コンピュータに基づく談話インターフェースをユーザに提供するシステムであって、
ユーザから入力を受け取り、少なくとも1つのモデルを用いて、少なくとも1つの現ダイアログ状態に対する少なくとも1つのスコアを生成するダイアログ状態エンジンであって、各前記少なくとも1つの現ダイアログ状態が、談話意味構造によって表され、該談話意味構造が、特定のエンティティの一般的な表現を与える意味トークンを含み、前記スコアが、前記ユーザからの入力と以前のダイアログ状態とに基づき、前記ダイアログ状態エンジンが、
モデルを用いて、前記ユーザ入力に基づいて少なくとも1つの表面的意味に対するスコアを決定する認識エンジンと、
モデルを用いて、前記認識エンジンからの少なくとも1つの表面的意味および以前のダイアログ状態に基づいて、少なくとも1つの現ダイアログ状態に対するスコアを決定する談話エンジンと、
を含む、ダイアログ状態エンジンと、
モデルを用いて、前記少なくとも1つの現ダイアログ状態に基づいて少なくとも1つのアクションに対するスコアを特定するレンダリング・エンジンであって、前記少なくとも1つのアクションに対するスコアが、前記少なくとも1つのアクションのうちから1つを選択するために使用される、レンダリング・エンジンと、
を備えたシステム。
【請求項9】 請求項8記載のシステムにおいて、前記ダイアログ状態エンジンは、マークアップ言語を用いることによって、前記レンダリング・エンジンに対する前記現ダイアログ状態を記述し、前記レンダリング・エンジンは、前記現ダイアログ状態を記述する前記マークアップ言語を、アクションを記述する第2マークアップ言語に変換する、システム。
【請求項10】 請求項9記載のシステムにおいて、前記現ダイアログ状態は、拡張可能マークアップ言語を用いて記述され、前記レンダリング・エンジンは、拡張可能スタイルシート言語変換を利用して、前記拡張可能マークアップ言語を前記第2マークアップ言語に変換する、システム。
【請求項11】 請求項10記載のシステムにおいて、前記ダイアログ状態エンジンは、更に、ユーザから、前記出力インターフェースを変更したいという指示を受け取り、前記レンダリング・エンジンは、前記出力インターフェースの変更に基づいて、前記拡張可能スタイルシート言語変換を変更して、前記現ダイアログ状態の同じ拡張可能マークアップ言語記述を、前記第2マークアップ言語とは異なる第3マークアップ言語に変換するようにした、システム。
【請求項1】 コンピュータ・システムにおいてダイアログ・インターフェースを提供する方法であって、
ユーザ入力を受け取るステップと、
前記ユーザ入力を言語モデルに適用するステップであって、前記ユーザ入力の内容を記述する少なくとも1つの表面的意味を生成し、かつ該少なくとも1つの表面的意味の各々に対するスコアを決定し、各前記少なくとも1つの表面的意味が、少なくとも1つの表面的意味トークンを含む、ステップと、
各前記少なくとも1つの表面的意味を談話モデルに適用するステップであって、ユーザとのダイアログの現状態を記述する少なくとも1つの談話意味を生成し、かつ各該少なくとも1つの談話意味に対するスコアを決定し、各前記少なくとも1つの談話意味が、少なくとも1つの談話意味トークンを含む、ステップと、
各前記少なくとも1つの談話意味を挙動モデルに適用するステップであって、前記コンピュータ・システムがとる少なくとも1つのアクションを定め、かつ各該少なくとも1つのアクションに対するスコアを決定する、ステップと、
前記談話モデルが与える前記スコアに部分的に基づき、かつ前記挙動モデルが与える前記スコアに部分的に基づいて、前記少なくとも1つのアクションのうちの1つを選択して行なうステップと、
を備えた方法。
【請求項2】 請求項1記載の方法であって、更に、
前記ユーザ入力を受け取るステップは、複数のモードのユーザ入力を受け取るステップを含み、
前記ユーザ入力を言語モデルに適用するステップは、
各前記モードのユーザ入力を、当該各モードのユーザ入力に対して用意された言語モデルに適用するステップであって、受け取った各前記モードのユーザ入力に対し、少なくとも1つの表面的意味を生成し、かつ各該少なくとも1つの表面的意味に対してスコアを決定する、ステップ、
を含む、方法。
【請求項3】 請求項1記載の方法において、各前記少なくとも1つの表面的意味を談話モデルに適用するステップは、更に、
談話意味が含む談話意味トークンに対する可能な置換物として、前記談話意味トークンに関連する属性と同じ属性をもつ複数のエンティティをデータベースから検索するステップと、
前記談話意味トークンの前記属性を表す子談話意味トークンとして、前記複数のエンティティを追加して、各前記エンティティに対し別個の談話意味構造を形成するステップと、
各エンティティに関連する各前記談話意味構造に対し、スコアを決定するステップと、を含む、方法。
【請求項4】 請求項1記載の方法において、各前記少なくとも1つの談話意味を挙動モデルに適用するステップは、更に、使用可能なユーザ・インターフェースの識別を前記挙動モデルに適用し、前記使用可能なユーザ・インターフェースと適合するアクションが、前記ユーザ・インターフェースと適合しないアクションよりも総合的に高いスコアを受けるようにするステップを含む、方法。
【請求項5】 請求項1記載の方法であって、
各前記少なくとも1つの談話意味を挙動モデルに適用するステップは、拡張可能スタイルシート言語を用いて設計された挙動モデルを使うことによって、マークアップ言語を用いて記述されるアクションに、マークアップ言語を用いて記述される各前記少なくとも1つの談話意味を変換するステップを含み、使用可能なユーザ・インターフェースに基づいて、前記アクションに対する前記マークアップ言語が選択される、
方法。
【請求項6】 請求項5記載の方法において、各前記少なくとも1つの談話意味の前記マークアップ言語は、拡張可能マークアップ言語であり、マークアップ言語を用いて記述されるアクションに各前記少なくとも1つの談話意味を変換することは、各前記少なくとも1つの談話意味を拡張可能スタイルシート言語変換に適用することを含む、方法。
【請求項7】 請求項6記載の方法であって、更に、
前記使用可能なユーザ・インターフェースを変更する命令をユーザから受け取るステップと、
各前記少なくとも1つの談話意味を第2の拡張可能スタイルシート言語変換に適用して、各前記少なくとも1つの談話意味を、第2マークアップ言語を用いて記述したアクションに変換するステップと、
を含む、方法。
【請求項8】 コンピュータに基づく談話インターフェースをユーザに提供するシステムであって、
ユーザから入力を受け取り、少なくとも1つのモデルを用いて、少なくとも1つの現ダイアログ状態に対する少なくとも1つのスコアを生成するダイアログ状態エンジンであって、各前記少なくとも1つの現ダイアログ状態が、談話意味構造によって表され、該談話意味構造が、特定のエンティティの一般的な表現を与える意味トークンを含み、前記スコアが、前記ユーザからの入力と以前のダイアログ状態とに基づき、前記ダイアログ状態エンジンが、
モデルを用いて、前記ユーザ入力に基づいて少なくとも1つの表面的意味に対するスコアを決定する認識エンジンと、
モデルを用いて、前記認識エンジンからの少なくとも1つの表面的意味および以前のダイアログ状態に基づいて、少なくとも1つの現ダイアログ状態に対するスコアを決定する談話エンジンと、
を含む、ダイアログ状態エンジンと、
モデルを用いて、前記少なくとも1つの現ダイアログ状態に基づいて少なくとも1つのアクションに対するスコアを特定するレンダリング・エンジンであって、前記少なくとも1つのアクションに対するスコアが、前記少なくとも1つのアクションのうちから1つを選択するために使用される、レンダリング・エンジンと、
を備えたシステム。
【請求項9】 請求項8記載のシステムにおいて、前記ダイアログ状態エンジンは、マークアップ言語を用いることによって、前記レンダリング・エンジンに対する前記現ダイアログ状態を記述し、前記レンダリング・エンジンは、前記現ダイアログ状態を記述する前記マークアップ言語を、アクションを記述する第2マークアップ言語に変換する、システム。
【請求項10】 請求項9記載のシステムにおいて、前記現ダイアログ状態は、拡張可能マークアップ言語を用いて記述され、前記レンダリング・エンジンは、拡張可能スタイルシート言語変換を利用して、前記拡張可能マークアップ言語を前記第2マークアップ言語に変換する、システム。
【請求項11】 請求項10記載のシステムにおいて、前記ダイアログ状態エンジンは、更に、ユーザから、前記出力インターフェースを変更したいという指示を受け取り、前記レンダリング・エンジンは、前記出力インターフェースの変更に基づいて、前記拡張可能スタイルシート言語変換を変更して、前記現ダイアログ状態の同じ拡張可能マークアップ言語記述を、前記第2マークアップ言語とは異なる第3マークアップ言語に変換するようにした、システム。
各ユーザ入力インターフェースは、関連する言語モデル210,212を有する、それ自体の認識エンジン206,208に設けられている。認識エンジン206および208は、それぞれ、言語モデル210および212を用いて、可能な表面的意味構造を識別し、評点を付けてそれぞれの入力を表わす。各認識エンジン206,208は、少なくとも1つの表面的意味出力と、この意味出力の確率を表わすスコアとを与える。実施形態によっては、認識エンジン206,208の少なくとも1つが、1つよりも多い代わりの表面的意味構造に、代わりの構造毎に、関連するスコアを与えることができるようにする場合もある。意味構造および対応するスコアの各々を談話エンジン214に供給する。表面的意味を生成するステップは、図3においてステップ300として示してある。
スピーチおよび手書き文字のような、言語系ユーザ入力では、認識エンジンが用いる言語モデルは、多数の公知の確率モデルのいずれでも可能である。例えば、入力にN個の連続する単語から成る1群が与えられた場合、言語モデルは、ある言語における単語の確率をモデル化するN−グラム・モデルとすることができる。また、言語モデルは、意味情報および/または構文情報を特定の単語および句と関連付ける自由コンテクスト文法(context free grammar)とすることも可能である。本発明の一実施形態では、N−グラム言語モデルを自由コンテクスト文法と組み合わせた統一言語モデルを用いる。この統一モデルでは、意味トークンおよび/または構文トークンは、単語に対するプレース値(place value)として扱われ、N−グラム確率は、仮説的な単語およびトークン結合毎に計算する。
いくつかの実施形態では、言語モデルは、階層状の表面的意味構造を生成可能である。これは、談話モデル216において定義され、談話エンジン214によって用いられる談話意味構造と同様である。双方のモデルにおいて同様の階層構造を用いることによって、認識した入力値を表面的意味構造から談話意味構造に変換することが一層容易になる。尚、多くの実施形態では、ポインティング・デバイスのような非言語入力と関連する言語モデルでも、意味トークンをポインティング・デバイスの入力に結び付けることができる。殆どの実施形態では、意味トークンは、談話意味構造において発見した1組の意味トークンから取り込まれる。したがって、ユーザがマウスを用いてあるファイル・アイコン上でクリックすると、マウスの認識エンジンは、入力として示されたファイルのIDを指し示しつつ、FileNameトークンをその行為と関連付けることができる。
談話意味構造にツリー構造を用いる実施形態では、意味トークンは、ツリー上のノードとして現れ、そのトークンの属性はそのノードの子として現れる。このような実施形態では、談話エンジン214は、下から上に談話ツリーを押し潰そうとすることにより、最初に子ノードを押し潰して、ノードの解明を「沸き上げる」(bubble up)。
アクションのコストを判定するとき、レンダリング・エンジン224および挙動モデル226は、レンダリング・エンジンが単に談話意味構造に関連するアクションを行なうことによって高い成功の尤度を有する程、意味構造が十分高いスコアを有するか否か検討する。例えば、先に記した例におけるように、ユーザが"Send this message to John"(このメッセージをジョンに送れ)と言った場合、そして、John Aに対するスコアがJohn BおよびJohn Cに対するスコアよりもはるかに高かった場合、レンダリング・エンジンは、ユーザから更なる明確化を要求することなく、単にメッセージをJohn Aに送る。このような場合、電子メールをJohn Aに送る際にエラーを起こすことのコストは、どのJohnに電子メール・メッセージを送りたいのか明確にするためにユーザに尋ねる場合のコストよりも少ない。一方、電子メールをJohn Aに送る際にエラーを起こすことのコストが高い場合、適正なアクションは、ユーザに確認の問い合わせを生成することであろう。多くの実施形態では、コストおよびスレシホルドは、挙動モデル226において明示的に表現することができる。
レンダリング・エンジン224がアクションを選択した後、実施形態によっては、1つ以上の言語モデル210および212を修正して、ユーザのそのアクションに対する応答を適正に解釈するために言語モデルを使用できるようにする場合もある。例えば、レンダリング・エンジンが3つの代替案をユーザに提示した場合、言語モデルを更新して、「最初のもの」、「2番目のもの」、のような句を特定のエンティティと関連付けるようにすることができる。これによって、認識エンジンは、その特定した句を特定のエンティティと置換することが可能となり、談話エンジン214は、談話意味構造の適正なスロットにそれらエンティティを挿入することが一層容易となる。
尚、図4の意味ツリー構造と関連する認識エンジンは、システム上で動作することができる唯一の認識システムであることを注記しておく。図5は、スピーチ認識エンジンと並行して動作する認識エンジンが生成する表面的意味構造を示す。即ち、図5の表面的意味構造は、ポインティング・デバイスと関連する認識エンジンによって生成する。この例では、ポインティング・デバイスは、ユーザが、"Send it to those in the meeting on Wednesday"と言いながら、特定のメッセージ上でクリックしたことを示す信号を発生する。このクリック・ジェスチャに基づいて、ポインティング・デバイスと関連する認識エンジンは、ユーザがクリックしたメッセージのメッセージIDと関連がある<Message>意味トークンを収容する単一のノード構造500を生成する。
属性が満たされていなくても、図6の各意味トークンに対して全ての属性が示しているが、他の実施形態では、これらの属性がより大きな談話ツリーに追加されるべきことを表面的意味が示すまで、これらの属性は談話構造のノードとしては含まれない。
この小さな展開の後、談話エンジン214は、送信メール談話構造のノードをできるだけ多く押し潰そうとする。押し潰す最初のノードは、<Meeting ID>トークンである。これを行なうには、単に、展開の間これと関連のあったミーティングIDで、そのトークンを置換すればよい。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/662,242 US6785651B1 (en) | 2000-09-14 | 2000-09-14 | Method and apparatus for performing plan-based dialog |
US09/662242 | 2000-09-14 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002259372A JP2002259372A (ja) | 2002-09-13 |
JP2002259372A5 true JP2002259372A5 (ja) | 2012-05-10 |
JP5166661B2 JP5166661B2 (ja) | 2013-03-21 |
Family
ID=24656958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001279145A Expired - Lifetime JP5166661B2 (ja) | 2000-09-14 | 2001-09-14 | 計画に基づくダイアログを実行する方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US6785651B1 (ja) |
EP (2) | EP1199630A3 (ja) |
JP (1) | JP5166661B2 (ja) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590224B1 (en) * | 1995-09-15 | 2009-09-15 | At&T Intellectual Property, Ii, L.P. | Automated task classification system |
US7664313B1 (en) | 2000-10-23 | 2010-02-16 | At&T Intellectual Property Ii, L.P. | Text-to scene conversion |
US7016828B1 (en) * | 2000-10-23 | 2006-03-21 | At&T Corp. | Text-to-scene conversion |
US20020133347A1 (en) * | 2000-12-29 | 2002-09-19 | Eberhard Schoneburg | Method and apparatus for natural language dialog interface |
US7711570B2 (en) | 2001-10-21 | 2010-05-04 | Microsoft Corporation | Application abstraction with dialog purpose |
US8229753B2 (en) | 2001-10-21 | 2012-07-24 | Microsoft Corporation | Web server controls for web enabled recognition and/or audible prompting |
US7302394B1 (en) * | 2001-12-20 | 2007-11-27 | Ianywhere Solutions, Inc. | Front-end device independence for natural interaction platform |
US20040203629A1 (en) * | 2002-03-04 | 2004-10-14 | Dezonno Anthony J. | Intelligent interactive voice response unit |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
KR100580619B1 (ko) * | 2002-12-11 | 2006-05-16 | 삼성전자주식회사 | 사용자와 에이전트 간의 대화 관리방법 및 장치 |
US8301436B2 (en) | 2003-05-29 | 2012-10-30 | Microsoft Corporation | Semantic object synchronous understanding for highly interactive interface |
US7200559B2 (en) | 2003-05-29 | 2007-04-03 | Microsoft Corporation | Semantic object synchronous understanding implemented with speech application language tags |
US20070169035A1 (en) * | 2003-09-30 | 2007-07-19 | Siemens Ag | Method and system for configuring the language of a computer program |
US7003758B2 (en) * | 2003-10-07 | 2006-02-21 | Brion Technologies, Inc. | System and method for lithography simulation |
US7552221B2 (en) | 2003-10-15 | 2009-06-23 | Harman Becker Automotive Systems Gmbh | System for communicating with a server through a mobile communication device |
US7295981B1 (en) * | 2004-01-09 | 2007-11-13 | At&T Corp. | Method for building a natural language understanding model for a spoken dialog system |
US8160883B2 (en) | 2004-01-10 | 2012-04-17 | Microsoft Corporation | Focus tracking in dialogs |
EP1555652B1 (en) * | 2004-01-19 | 2007-11-14 | Harman Becker Automotive Systems GmbH | Activation of a speech dialogue system |
ATE415684T1 (de) * | 2004-01-29 | 2008-12-15 | Harman Becker Automotive Sys | Verfahren und system zur sprachdialogschnittstelle |
EP1560199B1 (en) | 2004-01-29 | 2008-07-09 | Harman Becker Automotive Systems GmbH | Multimodal data input |
EP1562180B1 (en) * | 2004-02-06 | 2015-04-01 | Nuance Communications, Inc. | Speech dialogue system and method for controlling an electronic device |
US7584103B2 (en) * | 2004-08-20 | 2009-09-01 | Multimodal Technologies, Inc. | Automated extraction of semantic content and generation of a structured document from speech |
US20130304453A9 (en) * | 2004-08-20 | 2013-11-14 | Juergen Fritsch | Automated Extraction of Semantic Content and Generation of a Structured Document from Speech |
US8713025B2 (en) | 2005-03-31 | 2014-04-29 | Square Halt Solutions, Limited Liability Company | Complete context search system |
US7584099B2 (en) * | 2005-04-06 | 2009-09-01 | Motorola, Inc. | Method and system for interpreting verbal inputs in multimodal dialog system |
US8265939B2 (en) | 2005-08-31 | 2012-09-11 | Nuance Communications, Inc. | Hierarchical methods and apparatus for extracting user intent from spoken utterances |
US8731954B2 (en) | 2006-03-27 | 2014-05-20 | A-Life Medical, Llc | Auditing the coding and abstracting of documents |
US7493293B2 (en) * | 2006-05-31 | 2009-02-17 | International Business Machines Corporation | System and method for extracting entities of interest from text using n-gram models |
US7716040B2 (en) | 2006-06-22 | 2010-05-11 | Multimodal Technologies, Inc. | Verification of extracted data |
US8553854B1 (en) | 2006-06-27 | 2013-10-08 | Sprint Spectrum L.P. | Using voiceprint technology in CALEA surveillance |
US8059790B1 (en) * | 2006-06-27 | 2011-11-15 | Sprint Spectrum L.P. | Natural-language surveillance of packet-based communications |
US8140267B2 (en) * | 2006-06-30 | 2012-03-20 | International Business Machines Corporation | System and method for identifying similar molecules |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US9396185B2 (en) * | 2006-10-31 | 2016-07-19 | Scenera Mobile Technologies, Llc | Method and apparatus for providing a contextual description of an object |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US7908552B2 (en) | 2007-04-13 | 2011-03-15 | A-Life Medical Inc. | Mere-parsing with boundary and semantic driven scoping |
US8682823B2 (en) | 2007-04-13 | 2014-03-25 | A-Life Medical, Llc | Multi-magnitudinal vectors with resolution based on source vector features |
US7818271B2 (en) * | 2007-06-13 | 2010-10-19 | Motorola Mobility, Inc. | Parameterized statistical interaction policies |
US8799285B1 (en) * | 2007-08-02 | 2014-08-05 | Google Inc. | Automatic advertising campaign structure suggestion |
US9946846B2 (en) | 2007-08-03 | 2018-04-17 | A-Life Medical, Llc | Visualizing the documentation and coding of surgical procedures |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8296144B2 (en) * | 2008-06-04 | 2012-10-23 | Robert Bosch Gmbh | System and method for automated testing of complicated dialog systems |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
US8959102B2 (en) | 2010-10-08 | 2015-02-17 | Mmodal Ip Llc | Structured searching of dynamic structured document corpuses |
WO2012148904A1 (en) * | 2011-04-25 | 2012-11-01 | Veveo, Inc. | System and method for an intelligent personal timeline assistant |
CA2747153A1 (en) * | 2011-07-19 | 2013-01-19 | Suleman Kaheer | Natural language processing dialog system for obtaining goods, services or information |
US9336776B2 (en) * | 2013-05-01 | 2016-05-10 | Sap Se | Enhancing speech recognition with domain-specific knowledge to detect topic-related content |
US10541053B2 (en) | 2013-09-05 | 2020-01-21 | Optum360, LLCq | Automated clinical indicator recognition with natural language processing |
US10133727B2 (en) | 2013-10-01 | 2018-11-20 | A-Life Medical, Llc | Ontologically driven procedure coding |
US9721570B1 (en) | 2013-12-17 | 2017-08-01 | Amazon Technologies, Inc. | Outcome-oriented dialogs on a speech recognition platform |
EP3195145A4 (en) | 2014-09-16 | 2018-01-24 | VoiceBox Technologies Corporation | Voice commerce |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
WO2016061309A1 (en) | 2014-10-15 | 2016-04-21 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10572810B2 (en) * | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
US10353905B2 (en) * | 2015-04-24 | 2019-07-16 | Salesforce.Com, Inc. | Identifying entities in semi-structured content |
US9792281B2 (en) | 2015-06-15 | 2017-10-17 | Microsoft Technology Licensing, Llc | Contextual language generation by leveraging language understanding |
US10249297B2 (en) | 2015-07-13 | 2019-04-02 | Microsoft Technology Licensing, Llc | Propagating conversational alternatives using delayed hypothesis binding |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
US20180068012A1 (en) * | 2016-09-07 | 2018-03-08 | International Business Machines Corporation | Chat flow tree structure adjustment based on sentiment and flow history |
US10546586B2 (en) | 2016-09-07 | 2020-01-28 | International Business Machines Corporation | Conversation path rerouting in a dialog system based on user sentiment |
US10446137B2 (en) | 2016-09-07 | 2019-10-15 | Microsoft Technology Licensing, Llc | Ambiguity resolving conversational understanding system |
US10621166B2 (en) | 2017-03-23 | 2020-04-14 | International Business Machines Corporation | Interactive dialog in natural language using an ontology |
WO2018217820A1 (en) | 2017-05-22 | 2018-11-29 | Genesys Telecommunications Laboratories, Inc. | System and method for dynamic dialog control for contact center systems |
US10600419B1 (en) | 2017-09-22 | 2020-03-24 | Amazon Technologies, Inc. | System command processing |
US10957313B1 (en) * | 2017-09-22 | 2021-03-23 | Amazon Technologies, Inc. | System command processing |
JP6973157B2 (ja) * | 2018-02-16 | 2021-11-24 | 日本電信電話株式会社 | 議論構造拡張装置、議論構造拡張方法、及びプログラム |
US11222283B2 (en) | 2018-10-23 | 2022-01-11 | International Business Machines Corporation | Hierarchical conversational policy learning for sales strategy planning |
US11238850B2 (en) | 2018-10-31 | 2022-02-01 | Walmart Apollo, Llc | Systems and methods for e-commerce API orchestration using natural language interfaces |
US11183176B2 (en) | 2018-10-31 | 2021-11-23 | Walmart Apollo, Llc | Systems and methods for server-less voice applications |
US11195524B2 (en) * | 2018-10-31 | 2021-12-07 | Walmart Apollo, Llc | System and method for contextual search query revision |
US11404058B2 (en) | 2018-10-31 | 2022-08-02 | Walmart Apollo, Llc | System and method for handling multi-turn conversations and context management for voice enabled ecommerce transactions |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5355444A (en) | 1990-01-23 | 1994-10-11 | International Business Machines Corporation | Expert system wtih a plurality of independent knowledge bases |
JP2804403B2 (ja) | 1991-05-16 | 1998-09-24 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 質問回答システム |
DE69232407T2 (de) * | 1991-11-18 | 2002-09-12 | Toshiba Kawasaki Kk | Sprach-Dialog-System zur Erleichterung von Rechner-Mensch-Wechselwirkung |
DE69323196T2 (de) | 1993-09-14 | 1999-09-09 | Ibm | Rechnersystem und Verfahren zur Ausführung von mehreren Aufgaben |
US5748974A (en) | 1994-12-13 | 1998-05-05 | International Business Machines Corporation | Multimodal natural language interface for cross-application tasks |
US5710918A (en) | 1995-06-07 | 1998-01-20 | International Business Machines Corporation | Method for distributed task fulfillment of web browser requests |
US6192110B1 (en) * | 1995-09-15 | 2001-02-20 | At&T Corp. | Method and apparatus for generating sematically consistent inputs to a dialog manager |
US5995921A (en) | 1996-04-23 | 1999-11-30 | International Business Machines Corporation | Natural language help interface |
US5999896A (en) * | 1996-06-25 | 1999-12-07 | Microsoft Corporation | Method and system for identifying and resolving commonly confused words in a natural language parser |
US5872568A (en) | 1996-08-14 | 1999-02-16 | International Business Machines Corporation | Application and method for creating a list from pre-defined and user values |
US5892813A (en) * | 1996-09-30 | 1999-04-06 | Matsushita Electric Industrial Co., Ltd. | Multimodal voice dialing digital key telephone with dialog manager |
US6192354B1 (en) | 1997-03-21 | 2001-02-20 | International Business Machines Corporation | Apparatus and method for optimizing the performance of computer tasks using multiple intelligent agents having varied degrees of domain knowledge |
EP1021804A4 (en) * | 1997-05-06 | 2002-03-20 | Speechworks Int Inc | SYSTEM AND METHOD FOR DEVELOPING INTERACTIVE LANGUAGE APPLICATIONS |
EP0895396A3 (en) * | 1997-07-03 | 2004-01-14 | Texas Instruments Incorporated | Spoken dialogue system for information access |
US6044347A (en) * | 1997-08-05 | 2000-03-28 | Lucent Technologies Inc. | Methods and apparatus object-oriented rule-based dialogue management |
WO1999021106A1 (en) * | 1997-10-20 | 1999-04-29 | Microsoft Corporation | Automatically recognizing the discourse structure of a body of text |
US6269336B1 (en) * | 1998-07-24 | 2001-07-31 | Motorola, Inc. | Voice browser for interactive services and methods thereof |
WO2000011571A1 (en) * | 1998-08-24 | 2000-03-02 | Bcl Computers, Inc. | Adaptive natural language interface |
CN1151488C (zh) * | 1998-10-02 | 2004-05-26 | 国际商业机器公司 | 通过一般分层对象进行有效语音导航的结构框架 |
CA2346145A1 (en) * | 1998-10-05 | 2000-04-13 | Lernout & Hauspie Speech Products N.V. | Speech controlled computer user interface |
US6246981B1 (en) * | 1998-11-25 | 2001-06-12 | International Business Machines Corporation | Natural language task-oriented dialog manager and method |
US6356869B1 (en) * | 1999-04-30 | 2002-03-12 | Nortel Networks Limited | Method and apparatus for discourse management |
US6421655B1 (en) * | 1999-06-04 | 2002-07-16 | Microsoft Corporation | Computer-based representations and reasoning methods for engaging users in goal-oriented conversations |
TW501046B (en) * | 1999-06-11 | 2002-09-01 | Ind Tech Res Inst | A portable dialogue manager |
US6490560B1 (en) * | 2000-03-01 | 2002-12-03 | International Business Machines Corporation | Method and system for non-intrusive speaker verification using behavior models |
US6567805B1 (en) * | 2000-05-15 | 2003-05-20 | International Business Machines Corporation | Interactive automated response system |
-
2000
- 2000-09-14 US US09/662,242 patent/US6785651B1/en not_active Expired - Lifetime
-
2001
- 2001-09-11 EP EP20010121845 patent/EP1199630A3/en not_active Ceased
- 2001-09-11 EP EP06014950A patent/EP1710695A3/en not_active Ceased
- 2001-09-14 JP JP2001279145A patent/JP5166661B2/ja not_active Expired - Lifetime
-
2004
- 2004-04-16 US US10/826,858 patent/US7398211B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002259372A5 (ja) | ||
US6785651B1 (en) | Method and apparatus for performing plan-based dialog | |
CN112136124B (zh) | 用于与计算机实现的自动助理进行人机对话会话的依赖图谈话建模 | |
US7555426B2 (en) | Method and apparatus for dynamic grammars and focused semantic parsing | |
US6243670B1 (en) | Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames | |
US11016968B1 (en) | Mutation architecture for contextual data aggregator | |
KR20200007882A (ko) | 자동 비서를 위한 명령 번들 제안 제공 | |
US20020087315A1 (en) | Computer-implemented multi-scanning language method and system | |
US20020077823A1 (en) | Software development systems and methods | |
US20030212545A1 (en) | Method for generating natural language in computer-based dialog systems | |
US7502730B2 (en) | Method and apparatus for federated understanding | |
US20020087310A1 (en) | Computer-implemented intelligent dialogue control method and system | |
WO2002049253A2 (en) | Method and interface for intelligent user-machine interaction | |
JP2008514983A (ja) | デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話 | |
CN111680144A (zh) | 多轮对话语音交互的方法及系统、存储介质、电子设备 | |
JP2001357053A (ja) | 対話装置 | |
Dethlefs et al. | Conditional random fields for responsive surface realisation using global features | |
JP2002236681A (ja) | 日常言語コンピューティングシステムおよびその方法 | |
Srivastava et al. | A reference architecture for applications with conversational components | |
JP4881903B2 (ja) | 自然言語対話エージェントのためのスクリプト作成支援方法及びプログラム | |
WO2019160098A1 (ja) | 議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造 | |
JP2005284209A (ja) | 音声認識方式 | |
US20030214523A1 (en) | Method and apparatus for decoding ambiguous input using anti-entities | |
JP3581044B2 (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 | |
Solon et al. | Mobile multimodal presentation |