JP7095000B2

JP7095000B2 - 会話型インターフェースの一部として動的に適用されるフィルタリングオペレータを伴う適応会話状態管理のための方法

Info

Publication number: JP7095000B2
Application number: JP2020021304A
Authority: JP
Inventors: ベンカタラマンシャシクマール; ニザムモハイディーンパスルディーンアフマド; チナシュリーニバスルレディーケー; ダッタトライプジャリマンゲシュ; マジュムデールソウミャディプ; バルベラケシュ; アラバムダンムラリ
Original assignee: ベベオ，インコーポレイテッド
Priority date: 2012-10-11
Filing date: 2020-02-12
Publication date: 2022-07-04
Anticipated expiration: 2033-10-11
Also published as: JP6333831B2; EP4220432A1; WO2014059342A3; US20210200798A1; EP2907022A4; EP2907022A2; CN104969173B; CN111858889A; US20230161799A1; JP2016502696A; JP6722225B2; US10949453B2; JP2018147506A; EP3657317A1; CN104969173A; US20140108453A1; US10031968B2; US11544310B2; US20180365320A1; WO2014059342A2

Description

（関連出願の引用）
本願は、以下の出願の利益を主張し、これらの出願の内容は、参照により本明細書に引用される：
米国仮特許出願第６１／７１２，７２０号（２０１２年１０月１１日出願、名称「ＭｅｔｈｏｄＦｏｒＡｄａｐｔｉｖｅＣｏｎｖｅｒｓａｔｉｏｎＳｔａｔｅＭａｎａｇｅｍｅｎｔＦｉｌｔｅｒｉｎｇＯｐｅｒａｔｏｒｓＡｐｐｌｉｅｄＤｙｎａｍｉｃａｌｌｙＡｓＰａｒｔＯｆＡＣｏｎｖｅｒｓａｔｉｏｎｌｎｔｅｒｆａｃｅ」）；および
米国特許出願第１３／８０１，９５８号（２０１３年３月１３日出願、名称「ＭｅｔｈｏｄＦｏｒＡｄａｐｔｉｖｅＣｏｎｖｅｒｓａｔｉｏｎＳｔａｔｅＭａｎａｇｅｍｅｎｔＷｉｔｈＦｉｌｔｅｒｉｎｇＯｐｅｒａｔｏｒｓＡｐｐｌｉｅｄＤｙｎａｒｎｉｃａｌｌｙＡｓＰａｒｔＯｆＡＣｏｎｖｅｒｓａｔｉｏｎａｌｌｎｔｅｒｆａｃｅ」）。

（発明の分野）
フィルタリングオペレータが会話状態を修正するように動的に適用され得る、情報読み出しのための会話型インターフェースにおける適応会話状態管理のための方法が、開示される。

（関連技術および発明の背景）
フィルタリングオペレータ自体は、会話のやりとりの一部であり、やりとりから推測される。会話状態空間は、フィルタリングオペレータを動的に適応し、状態を拡張または剪定し、オペレータに基づいて、会話空間内のアイテムの重みを調節する。本開示に説明される方法の１つはまた、会話スレッド境界を検出すると、状態空間を暗示的にフラッシュし、全ての適用されたフィルタを無効にする。本開示に説明される方法の１つは、会話のやりとりが人の相互作用に対して本質的により近いことを可能にし、意志表示は、複数のやりとりにわたり、会話スレッドは、多くの場合、連続フローにシームレスに作り上げられる。さらに、本発明の実施形態は、音声認識におけるエラー等のユーザ入力エラーのための自然補正方法を可能にする。これらの入力エラーは、情報読み出しシステムとの会話のやりとりの一部として、ユーザ音声化フィルタリング動作によって補正されることができる。

非会話型インターフェースにおける情報読み出しプロセスは、多くの場合、ユーザの意図がクリアかつ非曖昧であるときでも、マルチステップである。これは、複数の要因に起因し得、そのうちの１つは、ユーザの意図に対する潜在的な組の一致が大きい場合があることである。そのような場合、ユーザは、典型的には、制約またはフィルタを規定することによって、一致空間を選別する（例えば、既存の検索クエリに対して、Ｇｏｏｇｌｅ検索バーにより多くのキーワードを追加し、ウェブサイト上の５つ星ランクの製品のみを示すためのフィルタをオンにする）。マルチステップ情報読み出しを要求するこのさまざまな要因の対極にあるのは、選択肢の視点から一致が少なすぎる場合である。この場合、ユーザは、広幅フィルタを規定することによって、意図を広げるであろう（例えば、商取引サイトに関する検索結果に第三者ベンダ製品も含むフィルタをオンにする）。

非会話型インターフェースにおける情報読み出しは、ユーザの意図が明確でないとき、本質的にマルチステップである。読み出しプロセスは、探索的である。すなわち、ユーザは、選別および拡張フィルタを適用するだけではなく、また、ユーザの関心を引くコンテンツに関連するパスも検討する（例えば、ａｍａｚｏｎ．ｃｏｍのような商取引サイトにおいて関連アイテムを検討する）。

全てのこれらの非会話型インターフェースでは、ユーザは、コンテンツ発見プロセスにおいて、漸次的にフィルタを適用する。ユーザは、発見プロセスの各ステップに適用されるべきフィルタを明示的に管理する。セッションベースの情報読み出しシステムは、各セッション境界でフィルタをリセットし、セッションは、例えば、新しい検索入力として定義され得る。セッションベースではない情報読み出しシステムでは、ユーザは、会話スレッドにわたって適用可能でないフィルタを選択的にリセットする必要があることによって、さらに負担をかけられる。

人々は、典型的には、互に会話を行うとき、フィルタを適用するが、フィルタの管理は、非会話インターフェースと相互作用するときよりはるかに容易と感じる。これは、おそらく、フィルタの適用が、それを会話の一部と言えるくらい単純であるためである。さらにより重要なこととして、論じられている話題の状態空間は、やりとりにスムーズに適応し、同時に、会話に従事する参加者の心中で進化し、反復すること、または思い出すことによって、会話の状態空間を明示的に管理し、同期させる必要性から解放する。加えて、人々が会話を行うとき、会話スレッド境界は、フィルタの意識的リセットを要求しない。また、人々は、適用不能であるフィルタが、新しいスレッドに移行されていることに緊張することもない。これらは、おそらく、従事している会話に寄与する不可欠な要因であり、多くの場合、「Ｘと私が話をするとき、私達は同期している」という参加者の言葉で要約される。言うまでもなく、人の場合、それは、参加者間で会話状態空間を同期させることからの解放だけではなく、参加者はまた、同時に、その個人的経験および知識の背景において、状態空間から概念をくみとり、アイディア、意見、反論等、会話内で文脈上関連する思考を表明することができる事実である。状態空間の同期からの解放は、体系的である。思考のやりとりは、この体系上の構築物に依拠し、その周囲をとりまく。

フィルタが会話内のユーザによって動的に適用されるように会話の状態を適応的に維持し、会話スレッド境界を暗示的に認識し、これらのフィルタをリセットすることによって、人の会話の体系を模倣する適度な目標を模索する会話型システムは、ユーザ経験を改善するのに大いに役立つであろう。

音声認識は、最終的に、少なくとも、限られた使用事例シナリオにおいては、会話型システムが主流となる可能性を広げる閾値に到達している。しかしながら、音声認識は、依然として、アクセント変動およびモバイル環境において脆弱である。フィルタリング動作は、音声認識が部分的に成功する場合、特にモバイル環境において不可欠であり、したがって、ユーザは、表明された意図を始めから繰り返す必要なく、フィルタを適用することができる。

要するに、本開示は、情報読み出しシステムにおける会話の状態を管理し、会話の一部として、フィルタの適用を可能にする方法を説明する。本方法はさらに、会話スレッド境界を認識し、明示的ユーザ介入を伴わずに、フィルタを自動的に無効にする。本開示に説明される方法はまた、音声認識エラーがユーザの意図を部分的に満たす応答をもたらすときにも適用可能である。すなわち、ユーザは、元の意図を始めから繰り返す必要なく、フィルタリング動作を発話することができる。

本発明のある実施形態では、ユーザから受信される検索要求を処理する方法が提供され、検索要求は、アイテムのセットから所望のアイテムを識別することを対象とし、識別は、検索要求の話題と以前のユーザ入力との比較に基づく。本方法は、コンテンツアイテムのセットへのアクセスを提供することを含む。コンテンツアイテムの各々は、対応するコンテンツアイテムを記述するメタデータに関連付けられる。本方法はまた、ユーザから以前に受信された少なくとも１つの検索に関する情報を提供することと、ユーザからの現在の入力を受信することとを含む。現在の入力は、所望のコンテンツアイテムを識別するようにユーザによって意図される。本方法はさらに、少なくとも１つの以前の検索に関する情報と現在の入力の要素との間の関連性の尺度を決定することを含む。本方法は、関連性尺度が閾値を超えていないという条件に応じて、現在の入力をコンテンツアイテムのサブセットを記述するメタデータと比較することに基づいて、コンテンツアイテムのサブセットを選択することを含む。本方法はさらに、関連性尺度が閾値を超えているという条件に応じて、現在の入力および少なくとも１つの以前の検索に関する情報をコンテンツアイテムのサブセットを記述するメタデータと比較することに基づいて、コンテンツアイテムのサブセットを選択することを含む。

別の実施形態では、本方法は、関連性尺度が閾値を超えていないという条件に応じて、会話状態空間を現在の入力の要素としてリセットすることと、関連性尺度が閾値を超えているという条件に応じて、会話状態空間を現在の入力の要素で増補することを含む。会話状態空間は、以前の検索入力のうちの少なくとも１つを記憶することができる。

さらに別の実施形態では、会話状態空間を増補することは、現在の入力の要素のうちの少なくとも１つを会話状態空間に追加すること、および会話状態空間の要素のうちの少なくとも１つを除去することのうちの少なくとも１つに基づく。

さらなる実施形態では、本方法はまた、コンテンツアイテムの関係距離を含む関係データベースへのアクセスを提供することを含む。関連性尺度は、関係距離のうちの１つに基づくことができる。

別の実施形態では、関係データベースは、ノードおよびエッジを伴う関係グラフを提示する。各ノードは、コンテンツアイテムを表すことができ、各エッジは、任意の２つのコンテンツアイテム間の直接的関係を表すことができる。

さらに別の実施形態では、２つのコンテンツアイテムの関係距離は、２つのコンテンツアイテムに対応する２つのノード間のホップの数で測定される。

別の実施形態では、２つのコンテンツアイテムの関係距離は、２つのコンテンツアイテムに対応する２つのノード間のホップの最小数で測定される。

異なる実施形態では、各エッジは、重みを有し、２つのコンテンツアイテムの関係距離は、２つのコンテンツアイテムに対応する２つのノードを接続するエッジの重みの和である。

さらに別の実施形態では、関係距離は、経時的に取得されるユーザ選好によって修正される。

さらなる実施形態では、本方法は、履歴入力を含むデータベースへのアクセスを提供することを含む。コンテンツアイテムの関係距離は、コンテンツアイテムが一緒に使用された頻度に基づいて決定されることができる。

別の実施形態では、本方法は、経時的に取得されたユーザ選好を含むデータベースへのアクセスを提供することと、ユーザ選好に基づいて決定された関連性尺度を修正することとを含む。

さらに別の実施形態では、現在の入力の要素を決定することは、予め定義されたルールを適用することに基づく。予め定義されたルールは、ベイズ分類器を使用することができる。

別の実施形態では、閾値は、ユーザからのフィードバックに基づいて調節される。

ユーザから受信される検索要求を処理するためのシステムが提供され、検索要求は、アイテムのセットから所望のアイテムを識別することを対象とし、識別は、検索要求の話題と以前のユーザ入力との比較に基づく。本システムは、非一過性コンピュータ読み取り可能な媒体上にエンコードされたコンピュータ読み取り可能な命令を含む。コンピュータ読み取り可能な命令は、コンピュータシステムに、コンテンツアイテムのセットへのアクセスを提供させる。コンテンツアイテムの各々は、対応するコンテンツアイテムを記述するメタデータに関連付けられる。コンピュータ読み取り可能な命令はまた、コンピュータシステムに、ユーザから以前に受信された少なくとも１つの検索に関する情報を提供させ、所望のコンテンツアイテムを識別するように意図されるユーザからの現在の入力を受信させ、少なくとも１つの以前の検索に関する情報と現在の入力の要素との間の関連性の尺度を決定させる。コンピュータ読み取り可能な命令は、コンピュータシステムに、関連性尺度が閾値を超えていないという条件に応じて、現在の入力をコンテンツアイテムのサブセットを記述するメタデータと比較することに基づいて、コンテンツアイテムのサブセットを選択させる。コンピュータ読み取り可能な命令はまた、コンピュータシステムに、関連性尺度が閾値を超えているという条件に応じて、現在の入力および少なくとも１つの以前の検索に関する情報をコンテンツアイテムのサブセットを記述するメタデータと比較することに基づいて、コンテンツアイテムのサブセットを選択させる。
本願明細書は、例えば、以下の項目も提供する。
（項目１）
ユーザから受信される検索要求を処理する方法であって、前記検索要求は、アイテムのセットから所望のアイテムを識別することを対象とし、前記識別は、前記検索要求の話題を以前のユーザ入力と比較することに基づき、前記方法は、
コンテンツアイテムのセットへのアクセスを提供することであって、前記コンテンツアイテムの各々は、対応するコンテンツアイテムを記述するメタデータに関連付けられている、ことと、
ユーザから以前に受信された少なくとも１つの検索に関する情報を提供することと、
ユーザから現在の入力を受信することであって、前記現在の入力は、所望のコンテンツアイテムを識別するように前記ユーザによって意図されている、ことと、
前記少なくとも１つの以前の検索に関する情報と前記現在の入力の要素との間の関連性の尺度を決定することと、
前記関連性尺度が閾値を超えていないという条件に応じて、前記現在の入力をコンテンツアイテムのサブセットを記述する前記メタデータと比較することに基づいて、コンテンツアイテムの前記サブセットを選択することと、
前記関連性尺度が閾値を超えているという条件に応じて、前記現在の入力および前記少なくとも１つの以前の検索に関する情報をコンテンツアイテムのサブセットを記述する前記メタデータと比較することに基づいて、コンテンツアイテムの前記サブセットを選択することと
を含む、方法。
（項目２）
前記関連性尺度が前記閾値を超えていないという条件に応じて、会話状態空間を前記現在の入力の前記要素としてリセットすることと、
前記関連性尺度が前記閾値を超えているという条件に応じて、前記会話状態空間を前記現在の入力の前記要素で増補することと
をさらに含み、
前記会話状態空間は、以前の検索入力のうちの前記少なくとも１つを記憶している、項目１に記載の方法。
（項目３）
前記会話状態空間を増補することは、前記現在の入力の前記要素のうちの少なくとも１つを前記会話状態空間に追加すること、および前記会話状態空間の前記要素のうちの少なくとも１つを除去することのうちの少なくとも１つに基づく、項目２に記載の方法。
（項目４）
コンテンツアイテムの関係距離を含む関係データベースへのアクセスを提供することをさらに含み、前記関連性尺度は、前記関係距離のうちの１つに基づく、項目１に記載の方法。
（項目５）
前記関係データベースは、ノードおよびエッジを伴う関係グラフを提示し、各ノードは、コンテンツアイテムを表し、各エッジは、任意の２つのコンテンツアイテム間の直接的関係を表す、項目４に記載の方法。
（項目６）
２つのコンテンツアイテムの関係距離は、前記２つのコンテンツアイテムに対応する２つのノード間のホップの数で測定される、項目５に記載の方法。
（項目７）
２つのコンテンツアイテムの関係距離は、前記２つのコンテンツアイテムに対応する２つのノード間のホップの最小数で測定される、項目５に記載の方法。
（項目８）
各エッジは、重みを有し、２つのコンテンツアイテムの関係距離は、前記２つのコンテンツアイテムに対応する２つのノードを接続するエッジの重みの和である、項目５に記載の方法。
（項目９）
前記関係距離は、経時的に取得されるユーザ選好によって修正される、項目４に記載の方法。
（項目１０）
履歴入力を含むデータベースへのアクセスを提供することをさらに含み、コンテンツアイテムの前記関係距離は、前記コンテンツアイテムが一緒に使用された頻度に基づいて決定される、項目４に記載の方法。
（項目１１）
経時的に取得されたユーザ選好を含むデータベースへのアクセスを提供することと、前記ユーザ選好に基づいて前記決定された関連性尺度を修正することとをさらに含む、項目１に記載の方法。
（項目１２）
前記現在の入力の前記要素を決定することは、予め定義されたルールを適用することに基づく、項目１に記載の方法。
（項目１３）
前記予め定義されたルールは、ベイズ分類器を使用する、項目１２に記載の方法。
（項目１４）
前記閾値は、前記ユーザからのフィードバックに基づいて調節される、項目１に記載の方法。
（項目１５）
前記少なくとも１つの以前の検索が有する関係の数を決定することをさらに含み、前記閾値は、前記関係の数に基づいて決定される、項目１に記載の方法。
（項目１６）
前記ユーザに前記現在の入力に関して尋ねることをさらに含む、項目１に記載の方法。
（項目１７）
ユーザから受信される検索要求を処理するためのシステムであって、前記検索要求は、アイテムのセットから所望のアイテムを識別することを対象とし、前記識別は、前記検索要求の話題を以前のユーザ入力と比較することに基づき、前記システムは、
前記システムは、非一過性コンピュータ読み取り可能な媒体上にエンコードされているコンピュータ読み取り可能な命令を備え、
前記コンピュータ読み取り可能な命令は、
コンテンツアイテムのセットへのアクセスを提供することであって、前記コンテンツアイテムの各々は、対応するコンテンツアイテムを記述するメタデータに関連付けられている、ことと、
ユーザから以前に受信された少なくとも１つの検索に関する情報を提供することと、
前記ユーザから現在の入力を受信することであって、前記現在の入力は、所望のコンテンツアイテムを識別するように前記ユーザによって意図されている、ことと、
前記少なくとも１つの以前の検索に関する情報と前記現在の入力の要素との間の関連性の尺度を決定することと、
前記関連性尺度が閾値を超えていないという条件に応じて、前記現在の入力をコンテンツアイテムのサブセットを記述する前記メタデータと比較することに基づいて、コンテンツアイテムの前記サブセットを選択することと、
前記関連性尺度が前記閾値を超えているという条件に応じて、前記現在の入力および前記少なくとも１つの以前の検索に関する情報をコンテンツアイテムのサブセットを記述する前記メタデータと比較することに基づいて、コンテンツアイテムの前記サブセットを選択することと
をコンピュータシステムに行わせる、システム。
（項目１８）
前記コンピュータ読み取り可能な命令は、
前記関連性尺度が前記閾値を超えていないという条件に応じて、会話状態空間を前記現在の入力の前記要素としてリセットすることと、
前記関連性尺度が閾値を超えているという条件に応じて、前記会話状態空間を前記現在の入力の前記要素で増補することと
を前記コンピュータシステムにさらに行わせ、
前記会話状態空間は、以前の検索入力のうちの前記少なくとも１つを記憶している、項目１７に記載のシステム。
（項目１９）
前記会話状態空間を増補することは、前記現在の入力の前記要素のうちの少なくとも１つを前記会話状態空間に追加すること、および前記会話状態空間の前記要素のうちの少なくとも１つを除去することのうちの少なくとも１つに基づく、項目１８に記載のシステム。
（項目２０）
前記コンピュータ読み取り可能な命令は、コンテンツアイテムの関係距離を含む関係データベースへのアクセスを提供することを前記コンピュータシステムにさらに行わせ、前記関連性尺度は、前記関係距離のうちの１つに基づく、項目１７に記載のシステム。
（項目２１）
前記関係データベースは、ノードおよびエッジを伴う関係グラフを提示し、各ノードは、コンテンツアイテムを表し、各エッジは、任意の２つのコンテンツアイテム間の直接的関係を表す、項目２０に記載のシステム。
（項目２２）
２つのコンテンツアイテムの関係距離は、前記２つのコンテンツアイテムに対応する２つのノード間のホップの数で測定される、項目２１に記載のシステム。
（項目２３）
２つのコンテンツアイテムの関係距離は、前記２つのコンテンツアイテムに対応する２つのノード間のホップの最小数で測定される、項目２１に記載のシステム。
（項目２４）
各エッジは、重みを有し、２つのコンテンツアイテムの関係距離は、前記２つのコンテンツアイテムに対応する２つのノードを接続するエッジの重みの和である、項目２１に記載のシステム。
（項目２５）
前記関係距離は、経時的に取得されるユーザ選好によって修正される、項目２０に記載のシステム。
（項目２６）
前記コンピュータ読み取り可能な命令は、履歴入力を含むデータベースへのアクセスを提供することを前記コンピュータシステムにさらに行わせ、コンテンツアイテムの前記関係距離は、コンテンツアイテムが一緒に使用された頻度に基づいて決定される、項目２０に記載のシステム。
（項目２７）
前記コンピュータ読み取り可能な命令は、経時的に取得されたユーザ選好を含むデータベースへのアクセスを提供することと、前記ユーザ選好に基づいて、前記決定された関連性尺度を修正することとを前記コンピュータシステムにさらに行わせる、項目１７に記載のシステム。
（項目２８）
前記現在の入力の前記要素を決定することは、予め定義されたルールを適用することに基づく、項目１７に記載のシステム。
（項目２９）
前記予め定義されたルールは、ベイズ分類器を使用する、項目２８に記載のシステム。
（項目３０）
前記閾値は、前記ユーザからのフィードバックに基づいて調節される、項目１７に記載のシステム。
（項目３１）
前記コンピュータ読み取り可能な命令は、前記少なくとも１つの以前の検索が有する関係の数を決定することを前記コンピュータシステムにさらに行わせ、前記閾値は、前記関係の数に基づいて決定される、項目１７に記載のシステム。
（項目３２）
前記コンピュータ読み取り可能な命令は、前記ユーザに現在の入力に関して尋ねすることを前記コンピュータシステムにさらに行わせる、項目１７に記載のシステム。

本発明の種々の実施形態のより完全な理解のために、ここで、付随の図面と併せて検討される、以下の説明を参照する。
図１は、本発明の実施形態である、アーキテクチャを図示する。図２は、明確化目的のために本明細書に組み込まれる、ユーザインターフェースアプローチを図示する。図３は、明確化目的のために本明細書に組み込まれる、ユーザインターフェースアプローチを図示する。図４は、エンティティおよびエンティティ間の関係を表す、グラフの実施例を図示する。図５は、エンティティおよびエンティティ間の関係を表す、グラフの実施例を図示する。図６は、エンティティおよびエンティティ間の関係を表す、グラフの実施例を図示する。図７は、エンティティおよびエンティティ間の関係を表す、グラフの実施例を図示する。図８は、ユーザがシステムと相互作用する度の会話状態空間の修正のプロセスを図示する。

本発明の好ましい実施形態およびその利点は、類似参照番号が類似要素を指す、図１－８を参照して理解され得る。

（会話型システムアーキテクチャ）
図１は、音声入力を使用した情報読み出しのための本発明の実施形態の全体的システムアーキテクチャを表す。本明細書に説明される本発明の実施形態は、随意に、２０１２年１１月２日出願の米国特許出願第１３／６６７，３８８号「ＭｅｔｈｏｄｏｆａｎｄＳｙｓｔｅｍｓｆｏｒＵｓｉｎｇＣｏｎｖｅｒｓａｔｉｏｎＳｔａｔｅＩｎｆｏｒｍａｔｉｏｎｉｎａＣｏｎｖｅｒｓａｔｉｏｎａｌＩｎｔｅｒａｃｔｉｏｎＳｙｓｔｅｍ」および２０１２年１１月２日出願の米国特許出願第１３／６６７，４００号「ＭｅｔｈｏｄｏｆａｎｄＳｙｓｔｅｍｓｆｏｒＩｎｆｅｒｒｉｎｇ
ＵｓｅｒＩｎｔｅｎｔｉｎＳｅａｒｃｈＩｎｐｕｔｉｎａＣｏｎｖｅｒｓａｔｉｏｎａｌＩｎｔｅｒａｃｔｉｏｎＳｙｓｔｅｍ」（それぞれ、参照することによって本明細書に組み込まれる）に記載の技法およびシステムと協働することができる。ユーザ１０１が、ユーザの質問を発話し、質問は、音声／テキストエンジン１０２にフィードされる。音声／テキストエンジンは、認識された単語および休止を基準形式（例えば、当技術分野において公知の技法を使用する、解析ツリーの形態）で出力する。ユーザ入力のテキスト形態は、セッション対話コンテンツモジュール１０３にフィードされる。本モジュールは、会話にわたって状態を維持する役割を果たし、その重要な用途は、以下に説明されるように、会話の間、ユーザの意図を理解するのに役立つことである。

セッション対話は、言語分析器（または、音声タガーの一部）１０６および以下に説明される他のエンティティ認識器モジュールと連動して、（１）意図－映画を見つける、曲を再生する、チャネルに合わせる、電子メールに応答する等のユーザの実際の意図、（２）エンティティ－意図を記述する名詞または代名詞語句、（３）フィルタ－「最新」映画、「あまり」暴力的ではない等のエンティティに対する限定子に大きく分類され得る、その成分部品に文を分割する。フィルタは、意図およびエンティティの両方に動作することができる。会話状態は、それらへのフィルタの適用を伴うエンティティおよび意図から構成される。

知的かつおよび有意義な会話を提供する目標に照らすと、意図は、おそらく、全３つのカテゴリのうちでキーである。いずれの優れた検索エンジンも、文法または意図を理解せずに、文からエンティティを抽出することだけによって、情報読み出しタスクを非常に良好に行うことができる。ユーザ質問「娘とｐｕｌｐｆｉｃｔｉｏｎを見ることができるかな？」を考慮すると、ほとんどの検索エンジンは、ｐｕｌｐｆｉｃｔｉｏｎのリンクを示し、これは、評価を見つけるために十分であり得るが、それは、そのリンクを検討することからは利用可能である場合もあり、またはそうでない場合もある。しかし、会話型インターフェースにおいて、期待は、明らかに、より高いものであり、システムは、理想的には、映画の評価および適切な年齢層の期待される応答に対応する（映画、評価）意図を理解しなければならない。検索エンジンのものに成り下がった会話型インターフェースの応答は、ユーザの視点からは、システムの故障も同然である。意図決定と、さらに重要なこととして、意図が不明または明確に判別不能であるとき、人の応答により近いようなユーザの質問への応答とが、検索エンジンより人の相互作用により近似させようとする会話型インターフェースのためのキーである。意図分析器１０８は、あるドメインに関する意図を分析および分類するドメイン特有モジュールであり、他のモジュール、すなわち、ドメイン特有エンティティ認識器１０７、ユーザの個人的選好に基づいて意図を分類する、個人化ベースの意図分析器１０９、およびドメイン特有グラフエンジン１１０と協働する。

エンティティ認識器１０７は、ユーザ入力内のエンティティを認識する。エンティティ認識は、随意に、以下により詳細に説明される、ユーザ入力内のエラーに対するエラー補正または補償を伴い得る。いくつかの実施形態では、エンティティとしてのユーザ入力のサブセットの分類は、重み付けである。入力が、構成要素部品への入力の分析および分解中、エンティティおよび属性の両方としてスコア化され得るシナリオが存在し得る。これらの曖昧性は、多くの場合、文の意味論がユーザ入力の後続処理とともにより明確になるにつれて解決される。いくつかの実施形態では、分解のために使用される重要な構成要素の１つは、以下により詳細に説明される、エンティティ関係グラフである。エンティティ認識器の出力は、入力のサブセットがエンティティであることに対する確率スコアである。

意図分析器は、本発明のある実施形態では、ルール駆動型意図認識器、および／または監督訓練を伴う単純ベイズ分類器である。それは、入力として、解析ツリー、エンティティ認識器出力、および属性特有検索エンジン出力（上記および以下に論じられる）を取り込む。いくつかの実装では、ユーザ入力は、入力が完全に解決されるまで、複数のエンティティ認識、属性認識、および意図認識ステップを通過し得る。意図認識器は、文の意図を解読し、また、意図の意味合いの差異を解読する。例えば、「映画ＴｏｐＧｕｎを見たい」対「ＴｏｐＧｕｎのような映画を見たい」を検討すると、解析ツリーは、異なるであろう。この差異は、意図認識器が、「ような」の意味を区別することを支援する。ルールベースの認識は、まさにその名が暗示するように、予め定義されたルールに基づいて、文を認識する。予め定義されたルールは、ドメイン空間、例えば、エンターテイメントに特有である。しかしながら、単純ベイズ分類器構成要素は、意図を認識するための訓練データセットをまさに要求する。

エンティティ関係グラフ（または、同等のデータ構造）を使用する実施形態では、結果情報は、技法が所望の結果を見つけるために使用する情報とともに、グラフ内に組み込まれる。したがって、意図分析器１０８、エンティティ認識器１０７、および属性特有検索エンジン１１１の反復からの出力は、ユーザが求めている結果であり得る。結果が見つからないか、または発見された結果が十分な信頼性を欠いている場合、ユーザに渡されるべき明確化質問を形成するために、中間ノード／エンティティが使用されることができる。

属性特有検索エンジン１１１は、フィルタを認識することにおいて補助し、フィルタは、それらが限定するエンティティおよび意図の、重みおよび特性に影響を及ぼす。図１は、具体的ドメインに対するモジュールを示す会話アーキテクチャであるが、本発明の実施形態は、ユーザ入力を取り上げ、ユーザの意図が複数のドメインに及び得る対話に従事することができる、会話型インターフェースを含む。本発明のある実施形態では、これは、図１に示されるドメイン特有アーキテクチャの複数のインスタンスを有することと、ドメインにわたる意図の重みをスコア化し、ユーザ入力が特定のドメインに一致する程度に基づいて、ユーザの意図を決定することとによって達成される。結果に到達すると、本発明のある実施形態は、ユーザが打ち込んだ情報に加え、結果の一部を使用して、会話状態空間を作成および保存することができる。

（本発明の実施形態に適用可能な情報リポジトリ）
いくつかの実施形態では、本発明は、情報読み出しの際、情報リポジトリを使用し得る。情報リポジトリは、類似タイプの情報および／またはあるタイプのコンテンツアイテムのグループである、ドメインに関連付けられている。あるタイプの情報リポジトリは、エンティティおよびエンティティ間の関係を含む。各エンティティ／関係は、それぞれ、タイプのセットからのタイプを有する。さらに、各エンティティ／関係に関連付けられるのは、いくつかの実施形態では、名前－値フィールドの定義された有限セットとして捕捉されることができる、属性のセットである。エンティティ／関係マッピングもまた、エンティティ／関係マッピングが種々のコンテンツアイテムを記述する情報を提供するので、コンテンツアイテムに関連付けられたメタデータのセットとしての役割を果たす。言い換えると、特定のエンティティは、他のエンティティと関係を有し、これらの「他のエンティティ」は、「特定のエンティティ」に対するメタデータとしての役割を果たす。加えて、マッピング内の各エンティティは、それに、または、そのエンティティをマッピング内の他のエンティティに結び付ける関係に割り当てられる属性を有することができる。集合的に、これは、エンティティ／コンテンツアイテムに関連付けられたメタデータを構成する。一般に、そのような情報リポジトリは、構造化情報リポジトリと呼ばれる。ドメインに関連付けられる情報リポジトリの実施例は、以下に続く。

メディアエンターテイメントドメインは、映画、ＴＶ番組、エピソード、クルー、役／登場人物、俳優／パーソナリティ、運動選手、試合、チーム、リーグおよびトーナメント、スポーツ選手、音楽アーティストおよび演奏者、作曲家、アルバム、曲、ニュースパーソナリティ、および／またはコンテンツ配信業者等のエンティティを含む。これらのエンティティは、情報リポジトリ内に捕捉される関係を有する。例えば、映画エンティティは、「出演」関係を介して、１つ以上の俳優／パーソナリティエンティティに関連する。同様に、映画エンティティは、「オリジナルサウンドトラック」関係を介して、音楽アルバムエンティティに関連し得、ひいては、「アルバム中のトラック」関係を介して、曲エンティティに関連し得る。一方、名前、説明、スケジュール情報、レビュー、評価、コスト、ビデオまたはオーディオへのＵＲＬ、アプリケーションまたはコンテンツストアのハンドル、評点等は、属性フィールドと見なされ得る。

個人用電子メール（電子メール）ドメインは、電子メール、電子メールスレッド、連絡者、送信者、受信者、会社名、企業内の部署／事業部門、電子メールフォルダ、オフィスの場所、および／またはオフィスの場所に対応する都市ならびに国等のエンティティを含む。関係の例証的例は、その送信者エンティティに関連する電子メールエンティティ（ならびに宛先、ｃｃ先、ｂｃｃ先、受信機、および電子メールスレッドエンティティ）を含む。一方、連絡者とその会社、部署、オフィスの場所との間の関係も、存在し得る。このリポジトリでは、エンティティに関連付けられた属性フィールドのインスタンスは、連絡者の名前、称号、電子メールハンドル、他の連絡者情報、電子メール送信／受信タイムスタンプ、件名、本文、添付、優先度レベル、オフィスの場所情報、および／または部署の名前ならびに説明を含む。

旅行関連／ホテルおよび観光ドメインは、都市、ホテル、ホテルブランド、個々の着目点、着目点のカテゴリ、消費者が対面する小売店チェーン、レンタカーサイト、および／またはレンタカー会社等のエンティティを含む。そのようなエンティティ間の関係は、場所、チェーンのメンバーシップ、および／またはカテゴリを含む。さらに、名前、説明、キーワード、コスト、サービスのタイプ、評価、レビュー等も全て、属性フィールドになる。

電子商取引ドメインは、製品アイテム、製品カテゴリおよびサブカテゴリ、ブランド、店舗等のエンティティを含む。そのようなエンティティ間の関係は、製品アイテム間の適合性情報、店舗によって「販売された」製品等を含むことができる。属性フィールドは、説明、キーワード、レビュー、評価、コスト、および／または可用性情報を含む。

アドレスブックドメインは、連絡者名、電子メールアドレス、電話番号、物理的アドレス、および雇用者等のエンティティおよび情報を含む。

本明細書にリスト化されたエンティティ、関係、および属性は、例証にすぎず、包括的リストであると意図されるものではない。

本発明の実施形態はまた、前述のように、構造化情報リポジトリではないリポジトリを使用し得る。例えば、ネットワークベースの文献（例えば、インターネット／Ｗｏｒｌｄ
ＷｉｄｅＷｅｂ）に対応する情報リポジトリは、リンクされた文献（エンティティ）の関係ウェブと見なされることができる。しかしながら、一般に、いずれの直接適用可能なタイプの構造も、自明でない方法において、前述の構造化情報リポジトリという意味では、インターネットの要素に関連付けられたあらゆる種類のエンティティならびに関係および属性を有意義に記述することができない。しかしながら、ドメイン名、インターネットメディアタイプ、ファイル名、ファイル名拡張子等の要素が、エンティティまたは属性として、そのような情報とともに使用されることができる。

例えば、一式の非構造化テキスト文献から成るコーパスを検討すると、この場合、いずれの直接適用可能であるタイプの構造も、エンティティおよび文献コンテンツのセットを有意義に記述する関係を列挙することができない。しかしながら、事前処理ステップとしての意味論的情報抽出処理技法の適用は、そのようなコーパスから構造を部分的に明らかにすることができるエンティティおよび関係をもたらし得る。

（本発明のある実施形態下における情報リポジトリへのアクセスの例証的例）
以下の説明は、前述のように、構造化および非構造化情報リポジトリに照らして情報読み出しタスクの例を図示する。

ある場合には、ユーザは、概して本明細書では意図タイプと呼ばれるあるタイプの１つ以上のエンティティに関心を示し、ユーザは、エンティティが満たさなければならない属性フィールド制約のみを指定することによってそれを明らかにすることを所望する。時として、意図は、ユーザがあるタイプのエンティティのある属性を所望するとき、（タイプ、属性）対であり得ることに留意されたい。例えば、ユーザが、映画の評価を所望する場合、意図は、（タイプ、属性）＝（映画、評価）と見なされ得る。そのようなクエリ制約は、概して、本明細書では、属性専用制約と呼ばれる。

ユーザが、エンティティの名前を挙げる、または直接所望の意図タイプエンティティの属性に直接的に一致するために十分な情報を指定する場合は常に、それは、属性専用制約である。例えば、ユーザが、名前といくつかの追加の属性と（例えば、６０年代に作製された「ＣａｐｅＦｅａｒ」）によって映画を識別するとき、または見つけ出したい電子メールの件名一致を指定するとき、または値段範囲に基づいて、ホテルを要求するとき、または３２ＧＢ、黒色ｉＰｏｄ（登録商標）タッチを所望することを指定するとき。

しかしながら、ある場合には、ユーザは、意図タイプエンティティの属性フィールド制約を指定するだけではなく、また、意図タイプエンティティがある明確な方法で関係を介して接続される他のエンティティの属性フィールド制約を指定する、または名前を挙げることによって、１つ以上の意図タイプのエンティティに関心を示す。そのようなクエリ制約は、概して、本明細書では、コネクション指向型制約と呼ばれる。

コネクション指向型制約の実施例は、ユーザが、映画の２人以上の俳優を指定することに基づいて、または、映画俳優とその映画が受賞したと賞に基づいて、映画（意図タイプ）を所望するときである。別の実施例は、電子メールに照らすと、ユーザが、過去７日間に特定の会社のある送信者から受信した電子メール（意図タイプ）を所望する場合である。同様に、さらなる例は、ユーザが、鉄道の駅およびＳｔａｒｂｕｃｋｓ店舗が近いホテルの部屋（意図タイプ）の予約を所望する場合である。さらに別の実施例は、ユーザが、ＮｉｎｔｅｎｄｏＷｉｉとも適合性があるＳａｍｓｕｎｇ製のテレビセット（意図タイプ）を所望する場合である。これらは全て、コネクション指向型制約クエリのインスタンスである。

前述のコネクション指向型制約例では、ユーザは、意図エンティティに接続される他のエンティティを明示的に説明または指定する。そのような制約は、概して、本明細書では、明示的コネクション指向型制約と呼ばれ、そのようなエンティティは、明示的エンティティと呼ばれる。

一方、他のクエリは、制約仕様の一部として、非指定または暗示的エンティティを含む、コネクション指向型制約を含む。そのような状況では、ユーザは不明なアイテムとユーザが現在既知のアイテムとの間の関係を通して、不明な一連の情報、エンティティ、属性等の識別を試みる。そのような制約は、概して、本明細書では、暗示的コネクション指向型制約と呼ばれ、非指定エンティティは、概して、本明細書では、制約の暗示的エンティティと呼ばれる。

例えば、ユーザは、映画中の２人の登場人物の名前を挙げることを介して、探している映画の識別を所望し得る。しかしながら、ユーザは、登場人物のうちの１人の名前を思い出せないが、特定の俳優がその登場人物を演じたことを思い出す。したがって、そのクエリでは、一方の登場人物を名前で述べ、特定の俳優によって演じられた登場人物を述べることによって、不明な登場人物を識別する。しかしながら、具体的情報読み出し目標に対する以下のユーザ制約を考える。すなわち、ユーザが、指定された役（例えば、登場人物「ＴｏｎｙＭｏｎｔａｎａ」）に関する指定されていない映画で指定された俳優（例えば、「ＭｉｃｈｅｌｌｅＰｆｅｉｆｆｅｒ」）によって演じられた役（意図）を所望する。この場合、ユーザの制約は、映画「Ｓｃａｒｆａｃｅ」に対応する、指定されていないまたは暗示的エンティティを含む。同様に、ユーザが、指定された俳優「ＳｃａｒｌｅｔｔＪｏｈａｎｎｓｅｎ」が主演の映画（意図）および指定された映画「ＳｔａｒＷａｒｓ」で「ＯｂｅＷａｎＫａｎｏｂｉ」の指定された役を演じた指定されていない俳優を所望すると仮定する。この場合、暗示的エンティティは、俳優「ＥｗａｎＭｃＧｒｅｇｏｒ」であり、意図エンティティは、「ＳｃａｒｌｅｔｔＪｏｈａｎｎｓｅｎ」および「ＥｗａｎＭｃＧｒｅｇｏｒ」が主演の映画「ＴｈｅＩｓｌａｎｄ」である。

電子メールリポジトリに照らすと、実施例として、先週、電子メール（属性指定子）を介して紹介された、指定された会社「Ｉｎｔｅｌ」からの非指定男性からの最後の電子メール（意図）を見つけることを所望するユーザが挙げられる。この場合、暗示的エンティティは、先週、ユーザとの初めての一般電子メール受信者となった従業員／会社関係を介して、「Ｉｎｔｅｌ」からの連絡者を調べることによって発見されることができる、連絡者である。

前述の３つの実施例は、コネクション指向型制約であるが、制約指定の一部として、指定されていない、または暗示的エンティティを含む。そのような制約を暗示的コネクション指向型制約と呼び、指定されていないエンティティを制約の暗示的エンティティと呼ぶ。

（関係およびエンティティ関係グラフ）
関係またはコネクションエンジン１０１０は、ユーザ入力を理解し、方向性のある応答をもたらす役割を果たす、モジュールのうちの１つである。関係エンジンは、多くの方法で実装され得、グラフデータ構造は、名前グラフエンジンによって関係エンジンを呼び出し得るような１つのインスタンスである。グラフエンジンは、エンティティ間の既知の重み付きコネクションの背景において、ユーザ入力を評価する。

グラフデータ構造では、エンティティは、ノードで表され、関係は、エンティティ関係グラフ内のエッジで表される。各エッジは、直接、関連する（すなわち、互いに頻繁に関連付けられる）２つのノードを接続する。例えば、ＢｏｓｔｏｎとＲｅｄＳｏｘとは、スポーツチームと呼ばれる関係によって、直接、関連し得る。また、ＮｅｗＹｏｒｋと金融街とは、近隣関係によって、直接、関連し得る。グラフモデルを具体的に採用する動機は、自然な言語会話における関連性、近接性、および同系性が、リンク距離、ある場合には最短経路および最小重みツリー等の概念によって、簡単にモデル化されることができるという観察によるものである。

会話の間、ユーザ対話が、実際に求められるエンティティに関連する他のエンティティを伴う場合、単純グラフ検索問題として情報読み出しに対処するサブルーチンは、文構造の深い明確な理解への依存を減らすために効果的に役立つ。そのようなアプローチは、システム実装利点をもたらす。ユーザの意図計算が、曖昧または不確定である場合でも、エンティティがユーザの発話内で認識される限り、グラフ解釈ベースの問題の処理は、システムが、それ以外の可能なものよりはるかに知的な様式において応答することを可能にする。

暗示的および明示的意味論の関係およびリンクは、名前付きエンティティに対する利用可能なメタコンテンツに、統計的テキスト処理、リンク分析、および他の信号の分析（例えば、場所情報等のため）を行うことによって、情報リポジトリ自体の要素間で作成される。これらの関係は、常時進化し、経時的であり、総合的使用状況分析、協調フィルタリング、および他の技法によって強化される。

情報リポジトリ内の各名前付きエンティティは、テキスト情報読み出し作業が、重み付きテキスト語句のベクトルとして文書を表す方法と同様の様式において、重み付きテキスト語句（用語）のベクトルとして表される。単純「ｔｆ－ｉｄｆ」（用語頻度／逆文書頻度）ベースのアプローチのみでは、多くの重要な場合において、本発明の実装の目的に適正ではない。名前付きエンティティのベクトル表現における重み計算は、テキスト語句が表示される方法、種々の種類のテキスト記述内のテキスト語句の位置、および、テキスト語句に関連付けられたハイパーリンクの構造および位置特性中に存在するより多くの情報信号を利用するように設計される。重み計算は、したがって、テキスト、ハイパーリンク、ならびに情報リポジトリ内のメタコンテンツから抽出される他の特性および関係のより豊富な統計および構造分析に基づく。

例えば、互いにより頻繁に関連付けられる２つのエンティティは、２つの他のエンティティより強い関係を有し得る。人々は、その発話において、エンティティＢｏｓｔｏｎおよびＲｅｄＳｏｘを、ＢｏｓｔｏｎおよびＣｏｍｍｏｎより頻繁に一緒に使用するので、ＢｏｓｔｏｎおよびＲｅｄＳｏｘは、ＢｏｓｔｏｎおよびＣｏｍｍｏｎより強い関係を有し得る。重み付け関係は、エンティティ関係グラフに表されることができる。いくつかの実施形態では、エッジは、重みを表すためにより長いまたはより短い長さを有する。代替として、エッジは、重みに対応する異なる幅を有し得る。他の実施形態では、関係値が、エッジに割り当てられることができる。より強い関係は、より小さい関係値で表され得る。

（明示的コネクション指向型制約）
以下は、情報読み出しシステムにおいて採用される明示的コネクション指向型制約の例である。ノードおよびエッジのグラフモデル専門用語もまた、エンティティおよび関係の専門用語と同様に、コネクション指向型制約を説明するために使用され得る。

属性専用制約インターフェースを使用する場合、ユーザは、意図エンティティに関するタイプおよび属性制約のみを指定する。一方、明示的に接続されたノード制約インターフェースを使用する場合、ユーザは、加えて、指定された種類のエッジコネクションを介して、意図ノードに接続された他のノードに関するタイプおよび属性制約も指定することができる。情報読み出しの間、明示的に接続されたノード制約を採用する、当技術分野において公知のインターフェースの一実施例は、図２に示される映画／ＴＶ情報検索エンジン４００である。

全映画およびＴＶパーソナリティにわたる可能な死亡場所および出生地４０５の数が、膨大な数であることを考慮して、出生地および死亡場所は、映画情報リポジトリグラフ内の属性ではなく、ノードとして取り扱われる。したがって、グラフィカルユーザインターフェース４００内の出生地および死亡場所細目は、意図されるパーソナリティノードに接続されたノードに対する細目である。グラフィカルユーザインターフェース４００内の映画作品目録フィルタ４１０は、ユーザが、再び、意図されるパーソナリティノードに接続された別のノードである、映画またはＴＶ番組ノード等の名前を指定することを可能にする。グラフィカルユーザインターフェースの図３に示される他のフィルタ５００は、意図されるノードの属性の指定子である。

グラフィカルユーザインターフェース４００の第１の部分では、ユーザは、その意図が、これらのノードの両方において共演したパーソナリティを得ることであるとき、２つの映画またはＴＶ番組ノードを指定し得る。前述のグラフィカルＵＩの第２の部分では、ユーザは、その意図が、その共演に対応する映画またはＴＶ番組ノードを得ることであるとき、２人のパーソナリティノードを指定し得る。両方の場合において、ユーザは、その意図されるノード以外の接続されたノードを指定し、それによって、これを明示的接続ノード制約にする。しかしながら、当技術分野において公知のインターフェースは、以下に説明されるように、あるタイプの明示的接続ノード制約（明示的コネクション指向型制約）をサポートしない。

図４は、ユーザが、ＳｅａｎＣｏｎｎｅｒｙ主演の架空の登場人物ＪａｃｋＲｙａｎに基づく映画を探しているとき、所望の結果に到達するために、本明細書に開示される本発明の技法によって分析される、ノード（エンティティ）およびエッジ（関係）のグラフ６００を図示する。ユーザは、クエリ「ＪａｃｋＲｙａｎが登場人物のＳｅａｎＣｏｎｎｅｒｙが主演した映画は？」を提供し得る。本明細書における技法は、以下のように、構造化情報リポジトリに照らして、クエリを解釈する。すなわち、エッジ６０５によって、「ＪａｃｋＲｙａｎ」６１０と名付けられた役のタイプの明示的ノードに接続され、また、「出演」エッジ６１５を介して、「ＳｅａｎＣｏｎｎｅｒｙ」６２０と名付けられたパーソナリティのタイプの明示的ノードに接続された映画のタイプ（意図）のノードを得る。本明細書に説明される技法は、映画「ＴｈｅＨｕｎｔｆｏｒｔｈｅＲｅｄＯｃｔｏｂｅｒ」６２５をその結果として返す。

再び、図４を参照すると、ユーザが、「ＪａｃｋＲｙａｎの登場人物を演じた全ての俳優は？」と尋ねたと仮定すると、開示される技法は、以下のように、クエリを解釈するであろう。
「出演」エッジ６３０によって、「ＪａｃｋＲｙａｎ」６１０と名付けられた役のタイプの明示的ノードに接続されたパーソナリティのタイプ（意図）のノードを得る。本明細書に開示される本発明のシステムの実施形態は、俳優「ＡｌｅｃＢａｌｄｗｉｎ」６３５、「ＨａｒｒｉｓｏｎＦｏｒｄ」６４０、および「ＢｅｎＡｆｆｌｅｃｋ」６４５を返すであろう。

さらなる実施例は、ユーザが、ＪｏｈｎＧｒｉｓｈａｍの書籍に基づく、ＴｏｍＣｒｕｉｓｅ主演の映画の名前を尋ねる場合である。したがって、クエリは、以下となる。すなわち、「出演」エッジによって、「ＴｏｍＣｒｕｉｓｅ」と名付けられたパーソナリティのタイプの明示的ノードに接続され、「作者」エッジによって、「ＪｏｈｎＧｒｉｓｈａｍ」と名付けられたパーソナリティのタイプの明示的ノードに接続された映画のタイプ（意図）のノードを得る。本明細書に開示される本発明のシステムの実施形態は、映画「ＴｈｅＦｉｒｍ」を返すであろう。

（暗示的コネクション指向型制約）
以下の実施例は、具体的情報読み出し目標のために使用される暗示的コネクション指向型制約および暗示的エンティティを例証する。最初の２つの実施例は、エンティティおよび関係の専門用語を使用した。

一実施例では、ユーザは、指定役（例えば、登場人物ＴｏｎｙＭｏｎｔａｎａ）に関する非指定映画において、指定俳優／パーソナリティ（例えば、ＭｉｃｈｅｌｌｅＰｆｅｉｆｆｅｒ）によって演じられた役（意図）を所望する。この場合、ユーザの制約は、非指定または暗示的エンティティを含む。暗示的エンティティは、映画「Ｓｃａｒｆａｃｅ」である。図５は、所望の結果に到達するために、本明細書に開示される技法によって分析される、エンティティおよび関係のグラフ７００を図示する。グラフ７００は、構造化情報リポジトリの例証的視覚表現である。具体的には、暗示的映画エンティティ「Ｓｃａｒｆａｃｅ」７０５は、映画エンティティ「Ｓｃａｒｆａｃｅ」７０５と俳優エンティティ「ＭｉｃｈｅｌｌｅＰｆｅｉｆｆｅｒ」７１５との間の「出演」関係７１０および登場人物エンティティ「ＴｏｎｙＭｏｎｔａｎａ」７２５と映画エンティティ「Ｓｃａｒｆａｃｅ」７０５との間の「登場人物」関係７２０を介して到達される。「ＭｉｃｈｅｌｌｅＰｆｅｉｆｆｅｒ」によって演じられた役エンティティ「ＥｌｖｉｒａＨａｎｃｏｃｋ」７３０が、次いで、「ＭｉｃｈｅｌｌｅＰｆｅｉｆｆｅｒ」に対する「出演」関係７３５および映画エンティティ「Ｓｃａｒｆａｃｅ」７０５に対する「登場人物」関係７４０によって、発見される。

さらなる実施例では、ユーザが、指定俳優エンティティＳｃａｒｌｅｔｔＪｏｈａｎｓｓｏｎと、指定映画エンティティＳｔａｒＷａｒｓにおけるＯｂｉＷａｎＫｅｎｏｂｉの指定役を演じた非指定俳優エンティティとが主演の映画（意図）を所望すると仮定する。この場合、暗示的エンティティは、俳優エンティティ「ＥｗａｎＭｃＧｒｅｇｏｒ」であり、結果として生じるエンティティは、「ＳｃａｒｌｅｔｔＪｏｈａｎｓｓｏｎ」および「ＥｗａｎＭｃＧｒｅｇｏｒ」主演の映画「ＴｈｅＩｓｌａｎｄ」である。図６は、所望の結果に到達するために、本明細書に開示される技法によって分析されるエンティティおよび関係のグラフ８００を図示する。具体的には、暗示的俳優エンティティＥｗａｎＭｃＧｒｅｇｏｒ８０５は、少なくとも１つの映画エンティティＳｔａｒ
Ｗａｒｓ８１５との出演関係８１０を介して、かつ登場人物エンティティＯｂｉＷａｎＫｅｎｏｂｉＯｂｉ８２５に対する登場人物関係８２０を介して、到達され、順に、登場人物関係８３０を介して、映画エンティティＳｔａｒＷａｒｓ８１５に関連する。一方、結果エンティティＴｈｅＩｓｌａｎｄ８３５は、俳優／パーソナリティエンティティＳｃａｒｌｅｔｔＪｏｈａｎｓｓｏｎ８４５と映画エンティティＴｈｅＩｓｌａｎｄ８３５との間の出演関係８４０、および暗示的俳優エンティティＥｗａｎＭｃＧｒｅｇｏｒ８０５と映画エンティティＴｈｅＩｓｌａｎｄとの間の出演関係８５０を介して到達される。

図７は、所望の結果に到達するために、本明細書に開示される技法によって分析されるエンティティおよび関係のグラフ９００を図示する。本実施例は、ノードおよびエッジの専門用語を使用する。ユーザは、ＤａｎｉｅｌＣｒａｉｇ主演の新しい映画のＬｅｄＺｅｐｐｅｌｉｎの曲をカバーしたバンドが存在することを知っている。ユーザは、カバーされた曲の名前も、映画の名前も思い出せないが、そのＬｅｄＺｅｐｐｅｌｉｎのカバーを行ったバンドの他の音楽（すなわち、曲）の探索を所望する。したがって、Ｌｅｄ
Ｚｅｐｐｅｌｉｎ（曲の作曲家として）およびＤａｎｉｅｌＣｒａｉｇ（映画内の俳優として）の既知のエンティティを指定することによって、介在する暗示されるノードが、ユーザの所望の結果を満たすために発見される。したがって、本明細書の本発明の技法の実施形態は、以下のようにクエリ制約を構成し、「作曲家」エッジ９０５によってバンドのタイプの暗示的ノード９１０（ＴｒｅｎｔＲｅｚｎｏｒ）に接続された曲のタイプ（意図）のノードを返す。なぜなら、このバンドノードは、曲のタイプの暗示的ノード９２０（ＩｍｍｉｇｒａｎｔＳｏｎｇ）との「カバー演奏者」エッジ９１５を有し、暗示的ノード９２０は、順に、「ＬｅｄＺｅｐｐｅｌｉｎ」と名付けられたバンドのタイプの明示的ノード９３０との「作曲家」エッジ９２５と、アルバムのタイプの暗示的ノード９４０（ＧｉｒｌｗｉｔｈｔｈｅＤｒａｇｏｎＴａｔｔｏｏＯｒｉｇｉｎａｌ
ＳｏｕｎｄＴｒａｃｋ）との「アルバム内のトラック」エッジ９３５とを有し、暗示的ノード９４０が、映画のタイプの暗示的ノード９５０（ＧｉｒｌｗｉｔｈｔｈｅＤｒａｇｏｎＴａｔｔｏｏＯｒｉｇｉｎａｌＳｏｕｎｄＴｒａｃｋ）との「オリジナルサウンドトラック（ＯＳＴ）」エッジ９４５を有し、暗示的ノード９５０は、「ＤａｎｉｅｌＣｒａｉｇ」と名付けられたパーソナリティのタイプの明示的ノード９６０との「出演」エッジ９５５を有するからである。

前述のように、情報読み出しのための公知の技法およびシステムは、種々の問題に悩まされる。本明細書に説明されるのは、本発明の会話型相互作用インターフェースの実施形態である。これらの実施形態は、ユーザが、それに話し掛けることにより、随意に、物理的相互作用（例えば、インターフェース、キーパッド、キーボード、および／またはマウスに触れること）によって選択肢を選択することにより、クエリおよび／または命令を投げ掛けることによって、情報読み出しシステムと相互作用することを可能にする。ユーザクエリに対する応答は、発話するための機械生成音声テキストによって行われ、ユーザ画面上に表示される情報によって補完され得る。会話相互作用インターフェースの実施形態は、一般に、ユーザが先行クエリに対する情報読み出しシステムの応答に反応してその次の情報読み出しクエリまたは命令を投げ掛けることを可能にし、その結果、情報読み出しセッションは、一連の動作であり、動作の各々は、ユーザが最初にクエリまたは命令を投げ掛け、システムがユーザに応答を提示する。

本発明の実施形態は、本明細書で論じられるクエリ制約のためのグラフィカルユーザインターフェースより有力かつ表現的な理論的枠組みである。多くの状況では、特に、多数の可能な属性または明示的および暗示的に接続されたノードの存在の中から柔軟に選択を行うとすると、グラフィカルユーザインターフェースアプローチは、良好に機能しないか、または全く機能しない。そのような場合、本発明の会話型相互作用インターフェースの実施形態は、はるかに自然に調和する。さらに、本発明の実施形態は、グラフィカルユーザインターフェースと比較して、ユーザが指定し得る異なる属性の数ならびに明示的に接続されたノード制約の数および暗示的ノード制約の数の視点からより好適である。

（会話状態空間）
図８は、ユーザがシステムと相互作用する度の会話状態空間の修正のプロセスを表す。会話状態空間は、フィルタが適用されるエンティティおよび意図から構成される。音声／テキストエンジン２０１の出力は、前述のように、エンティティ、意図、およびフィルタ２０２に分割される。保存された会話状態空間２０６内のエンティティからの現在発話されているエンティティのセットの関係距離閾値が、グラフエンジン１１０を利用して評価される２０３。エンティティ関係グラフを使用する実施形態の場合、関係距離は、接続されるノード間の「ホップ」の観点から測定されることができる。エンティティ関係グラフのエッジが、関係に関連付けられた重みを有する場合、関係距離は、重みを考慮することができる。例えば、ＲｅｄＳｏｘとＳａｎＦｒａｎｃｉｓｃｏとの間に、２つのホップが存在し、Ｂｏｓｔｏｎの中間ノードを有し得る。ＲｅｄＳｏｘとＢｏｓｔｏｎとの間の関係値は、０．８であり得、ＢｏｓｔｏｎとＳａｎＦｒａｎｃｉｓｃｏとの間の関係値は、０．５であり得る。そして、ＲｅｄＳｏｘとＳａｎＦｒａｎｃｉｓｃｏとの間の関係距離は、１．３であり得る。

現在の音声入力内のエンティティが、ある関係距離を越えて会話状態空間内のエンティティからかけ離れているとき、会話状態空間の全部または一部が、リセットされる２０４。現在の入力エンティティの一致のドメインは、後続会話スレッドのためのアクティブドメイン特有エンジンを決定する。状態空間の全部または一部は、後続会話スレッドのためのドメイン特有エンジンが同一のままである場合でも（ユーザが、依然として、映画を所望するが、後続要求は、以前の要求に関連しない）、リセットされる。現在の音声入力内のエンティティが、会話状態空間内のエンティティから閾値関係距離内にある場合、会話状態空間は、現在のエンティティで増補され２０５、現在の入力内のフィルタもまた、それらが動作するエンティティおよび／または意図に適用される。

１つ以上の新しいエンティティが、保存された状態におけるものからあまりにかけ離れているかどうかは、ドメインの性質に基づいて決定される静的数であることができる。例えば、ノード間に比較的に少ない分岐を有するドメインの場合、ノード間のより少ないホップの数が、閾値として使用されるであろう。一方、広範な分岐を伴うドメイン空間の場合、より多いホップの数が、リセット閾値に到達する前に要求されるであろう。閾値数は、静的値であることができるか、またはユーザからのフィードの監視に基づいて調節されることができる。例えば、閾値は、比較的に高値に設定され得、システムが、新しい入力情報と古い入力情報を不適切に組み合わせているというユーザからのフィードバックを検出する場合、減少させられることができる。

さらに、個人化が、保存された会話状態間の関係距離を決定するとき、考慮されることができる。したがって、エンティティ関係グラフ内で比較的にかけ離れた２つのノード（すなわち、エンティティ）は、個人化オーバーレイを前提として、より密接なコネクションを有し得る。例えば、ユーザが、Ｃｈｉｃａｇｏを検索する場合は常時、Ｃｈｉｃａｇｏまでの航空運賃を検索し得る。この場合、個人化は、２つのエンティティ、すなわち、Ｃｈｉｃａｇｏと航空運賃との間の関係距離を短縮し得る。したがって、個人化は、システムがユーザの選好から経時的に学んだものを前提として、グラフ空間内に「ショートカット」を導入する。逆に言えば、会話状態内の値は、アイテムの「年齢」を監視することによってリセットされることができる。すなわち、時間的により遡るアイテムは、定義された期間がその使用以降に経過した後、自動的にリセットされることができる。

個人化は、そのようなユーザ選好情報を発見および記憶するための既知の技法を使用して、システムによって提供されることができる、ユーザ選好シグネチャに基づく。例えば、２０１０年８月１０日発行の米国特許第７，７７４，２９４号「ＭｅｔｈｏｄｓａｎｄＳｙｓｔｅｍｓｆｏｒＳｅｌｅｃｔｉｎｇａｎｄＰｒｅｓｅｎｔｉｎｇＣｏｎｔｅｎｔＢａｓｅｄｏｎＬｅａｒｎｅｄＰｅｒｉｏｄｉｃｉｔｙｏｆＵｓｅｒＣｏｎｔｅｎｔＳｅｌｅｃｔｉｏｎｓ」、２０１０年１１月１６日発行の米国特許第７，８３５，９９８号「ＭｅｔｈｏｄｓａｎｄＳｙｓｔｅｍｓｆｏｒＳｅｌｅｃｔｉｎｇａｎｄＰｒｅｓｅｎｔｉｎｇＣｏｎｔｅｎｔｏｎａＦｉｒｓｔＳｙｓｔｅｍＢａｓｅｄｏｎＵｓｅｒＰｒｅｆｅｒｅｎｃｅｓＬｅａｒｎｅｄｏｎａＳｅｃｏｎｄＳｙｓｔｅｍ」、２００８年１２月２日発行の米国特許第７，４６１，０６１号「ＵｓｅｒＩｎｔｅｒｆａｃｅＭｅｔｈｏｄｓａｎｄＳｙｓｔｅｍｓｆｏｒＳｅｌｅｃｔｉｎｇａｎｄＰｒｅｓｅｎｔｉｎｇＣｏｎｔｅｎｔＢａｓｅｄｏｎＵｓｅｒＮａｖｉｇａｔｉｏｎａｎｄＳｅｌｅｃｔｉｏｎＡｃｔｉｏｎｓＡｓｓｏｃｉａｔｅｄｗｉｔｈｔｈｅＣｏｎｔｅｎｔ」、および２０１２年２月７日発行の米国特許第８，１１２，４５４号「ＭｅｔｈｏｄｓａｎｄＳｙｓｔｅｍｓｆｏｒＯｒｄｅｒｉｎｇＣｏｎｔｅｎｔＩｔｅｍｓＡｃｃｏｒｄｉｎｇｔｏＬｅａｒｎｅｄＵｓｅｒＰｒｅｆｅｒｅｎｃｅｓ」（それぞれ、参照することによって本明細書に組み込まれる）に記載のシステムおよび方法は、本明細書に開示される技法とともに使用されることができる。しかしながら、個人化、ユーザの選好シグネチャ、および／または情報の使用は、組み込まれた出願に記載の技法に限定されない。

会話の間、エンティティ内の曖昧性を解決する必要性が存在し得る。複数の結果が存在するとき、ユーザは、どの結果に関心があるかを指定することを所望し得る。これら両方の場合、ユーザは、エンティティ内の曖昧性を解決するために役立てるためにフィルタまたはキーワードを指定するか、または特定の関心結果を指定し得る。ユーザがグラフィカルインターフェース内のメニュー選択肢から選択する必要があるシステムとは著しく対照的に、真の会話の一部としてこれらのフィルタおよびキーワードを指定する能力は、会話のフローを非常に自然にし、人の相互作用により近いものにする。さらに、前述のように、フィルタの適用は、エンティティの重みの修正に加え、会話状態空間を動的に拡張および縮小し、会話のやりとりの過程を通して、ユーザの意図の段階的前進を追跡し得る。

（実施例）
以下の実施例は、種々の実施形態を例証する。

１）以下の実施例は、会話状態空間内へのエンティティの追加および置換を例証する。ユーザ：「保険詐欺に関する９０年代のＢａｌｄｗｉｎの映画」。
応答：システムは、いくつかの結果を挙げるが、正しい回答ではない可こともある。
ユーザ（暗示的にフィルタを追加する）：「殺人関連」。
応答：システムは、依然として、所望の結果が得られない。
ユーザ（暗示的にフィルタを追加する）：「おそらく、ＫｅｖｉｎＫｌｉｎｅ」。
応答：システムは、ＢａｌｄｗｉｎをＫｅｌｖｉｎＫｌｉｎｅと置換し、保険詐欺に関するＫｌｉｎｅの映画を返す。
システムは、「９０年代の映画」、「Ｂａｌｄｗｉｎ」、および「保険詐欺」を会話状態空間に追加する。システムは、いくつかの結果を返すが、ユーザが探している映画を含むことも、含まないこともある。ユーザから追加の入力を受信することによって、システムは、ユーザ供給フィルタを追加する。追加の入力「殺人関連」の受信に応じて、システムは、この追加の入力を会話状態空間に投入する。システムは、所望の映画を返さない場合がある。システムは、別の入力「おそらく、ＫｅｌｖｉｎＫｌｉｎｅ」を待つ。例えば、システムは、ここで、追加のフィルタとして、ＫｅｖｉｎＫｌｉｎｅを追加する。例えば、ＫｅｖｉｎＫｌｉｎｅとＢａｌｄｗｉｎとの間にコネクション／関係／エッジが存在しない（直接または他のノードを通してのいずれかにおいて）ため、いかなる結果も得られない。言い換えると、それらの間の関係距離は、かけ離れている。したがって、システムは、自動的に、制約としてのＢａｌｄｗｉｎを除去し、それによって、ユーザが、映画内の俳優に関する新しい手掛かりとして「ＫｅｖｉｎＫｌｉｎｅ」を提供していると推測する。したがって、いくつかの実施形態では、より最新の制約は、より重要性が与えられる一方、より以前の制約は、除去されるか、または重要視されない。さらに、システムは、「Ｂａｌｄｗｉｎ」が俳優のタイプのエンティティであり、「ＫｅｖｉｎＫｌｉｎｅ」が俳優のタイプのエンティティであることを認識することができる。この認識を前提として、システムは、俳優に対する保存された状態エンティティを新しい俳優エンティティと置換する。さらになお、新しい俳優エンティティの周囲の単語の言語学的分析は、ユーザの意図を推測する。具体的には、単語「おそらく」は、不確実性を表し、したがって、これは、初期俳優エンティティが正しくないであろうという推測を強調する。

２）以下の実施例は、会話状態空間内へのエンティティの追加および置換を例証する。ユーザ：「ＴｏｍＣｒｕｉｓｅの映画」
応答：システムは、一式を挙げ、ユーザに選定すべき種類を尋ね得る。
ユーザ（暗示的フィルタ）：「アクションもの」。
応答：システムは、ＴｏｍＣｒｕｉｓｅのアクション映画を挙げる。
ユーザ（暗示的フィルタ）：「コメディは？」
応答：ジャンル「コメディ」の指定は、同一のタイプのエンティティとの関連で前述されたものと同様の様式において、ジャンルフィルタ「アクション」を除去する。したがって、システムは、ＴｏｍＣｒｕｉｓｅのコメディを提示する。
ユーザ（暗示的フィルタ）：「ＤｕｓｔｉｎＨｏｆｆｍａｎと共演したもの」。
応答：システムは、ＲａｉｎＭａｎを提示する。
システムは、「ＴｏｍＣｒｕｉｓｅ」および「映画」を会話状態空間に記憶する。システムが、「アクションもの」を受信すると、システムは、「アクション」を「ＴｏｍＣｒｕｉｓｅ」および「映画」と比較し、関係距離が閾値を超えないことを決定する。したがって、システムは、「アクション」を会話状態空間に追加する。システムは、「コメディ」を受信すると、システムは、「コメディ」と「アクション」との間の関係距離が閾値を超えることを決定し、会話状態空間内で「アクション」を「コメディ」と置換する。ユーザがさらに、「ＤｕｓｔｉｎＨｏｆｆｍａｎと共演したもの」を入力することによって、その意図を指定すると、システムは、最初に、「ＴｏｍＣｒｕｉｓｅ」、「ＤｕｓｔｉｎＨｏｆｆｍａｎ」、および「コメディ」が密接に関連しているかどうか決定する。システムは、ＤｕｓｔｉｎＨｏｆｆｍａｎと共演のＴｏｍＣｒｕｉｓｅのコメディの検索を試み得る。存在しないため、システムは、「コメディ」が適用されないと推定し、それを除去する。システムは、ＤｕｓｔｉｎＨｏｆｆｍａｎとの共演のＴｏｍＣｒｕｉｓｅの映画を試し、ＲａｉｎＭａｎを提示する。本実施例では、システムは、後続の会話に含まれる単語のため、同様に俳優タイプである新しいエンティティが提示されているにもかかわらず、ＴｏｍＣｒｕｉｓｅ（俳優タイプのエンティティ）の保存状態値を保っている。具体的には、単語「共演」は、フィルタまたはエンティティの連結を暗示する。したがって、システムは、ユーザがＴｏｍＣｒｕｉｓｅおよびＤｕｓｔｉｎＨｏｆｆｍａｎの両方を使用することを所望していると推測する。

３）フィルタを指定する順序は、問題ではないこともある。以下の実施例は、やりとりの順序が異なる、前述の会話スレッドの単なる変形例である。
ユーザ：アクション映画
応答：システムは、アクション映画を返す。
ユーザ：ＴｏｍＣｒｕｉｓｅ
応答：システムは、ＴｏｍＣｒｕｉｓｅが主演のアクション映画を返す。
ユーザ：コメディ
応答：システムは、アクションおよびコメディの両方のＴｏｍＣｒｕｉｓｅの映画を返す。
ユーザ：ＤｕｓｔｉｎＨｏｆｆｍａｎ
応答：システムは、ＲａｉｎＭａｎを返す。
システムは、「アクション映画」を会話状態空間内に記憶し、アクション映画を返す。ユーザは、俳優を指定し、検索の範囲を狭める。システムは、「ＴｏｍＣｒｕｉｓｅ」を会話状態空間に打ち込み、ＴｏｍＣｒｕｉｓｅが主演のアクション映画を返す。ユーザが、追加の入力「コメディ」を打ち込むと、システムは、アクションおよびコメディの両方のＴｏｍＣｒｕｉｓｅの映画を返す。そのような映画が存在しない場合、システムは、「アクション」を「コメディ」と置換する。システムが、「ＤｕｓｔｉｎＨｏｆｆｍａｎ」と述べる入力を受信すると、システムは、「アクション映画」、「コメディ」、「ＴｏｍＣｒｕｉｓｅ」、および「ＤｕｓｔｉｎＨｏｆｆｍａｎ」を使用して、映画を見つける。４つのエンティティに関連付けられたメタデータを有する映画な存在しない場合、システムは、「コメディ」、「ＴｏｍＣｒｕｉｓｅ」、および「ＤｕｓｔｉｎＨｏｆｆｍａｎ」に基づいて、映画を検索する。システムが、ＲａｉｎＭａｎがこれらのキーワードに一致する映画であることを見つけると、システムは、ＲａｉｎＭａｎをユーザに提示する。

４）以下の実施例は、会話状態空間内へのエンティティの追加を例証する。
ユーザ：ＴｏｍＣｒｕｉｓｅ
応答：システムは、ＴｏｍＣｒｕｉｓｅの映画を返答する。
ユーザ（暗示的フィルタ）：侍
応答：システムは、ＬａｓｔＳａｍｕｒａｉを返す。
システムは、「ＴｏｍＣｒｕｉｓｅ」を会話状態空間内に記憶し、ＴｏｍＣｒｕｉｓｅが主演の映画のリストを提示する。システムが、「侍」を受信すると、システムは、「侍」と「ＴｏｍＣｒｕｉｓｅ」とが密接な関係を有するかどうか決定する。この関連性の尺度は、グラフに関する関係データベースを照会することによって決定されることができる。システムが、密接な関係が存在すると決定すると、システムは、侍を追加のエンティティとして取り扱い、「ＴｏｍＣｒｕｉｓｅ」を「Ｓａｍｕｒａｉ」と置換するのではなく、それを会話状態空間内に打ち込む。次いで、システムは、ＴｏｍＣｒｕｉｓｅが主演の侍映画を検索し、ＬａｓｔＳａｍｕｒａｉを提示する。

５）以下の実施例は、会話状態空間内へのフィルタの追加および置換を例証する。
ユーザ：ＳｔａｒＷａｒｓ
応答：システムは、全てのＳｔａｒＷａｒｓ映画を列挙する。
ユーザ（フィルタ）：最新。
応答：システムは、最新のＳｔａｒＷａｒｓ映画を提示する。
ユーザ（フィルタ）：２作目。
応答：システムは、２作目のＳｔａｒＷａｒｓ映画を提示する。
システムは、「ＳｔａｒＷａｒｓ」を会話状態空間内に記憶する。別の入力「最新」を受信すると、システムは、その入力を会話状態空間内に投入し、最新のＳｔａｒＷａｒｓ映画をユーザに提示する。さらなる入力「２作目」を受信すると、会話状態空間は、その入力を会話状態空間内に投入する。しかしながら、連続して２つの映画のみが存在する場合を除き、「２作目」および「最新」は、互に排他的であるため、システムは、「最新」を状態空間から除去し、２作目のＳｔａｒＷａｒｓ映画を返す。

６）以下の実施例は、会話状態空間内へのフィルタの追加を例証する。
ユーザ：Ｓｅｉｎｆｅｌｄ
応答：システムは、Ｓｅｉｎｆｅｌｄ番組を返答する。
ユーザ（選択フィルタ）：シーズン２
応答：システムは、シーズン２エピソードを返答する。
ユーザ（選択）：最後のエピソード
応答：システムは、シーズン２の最後のエピソードを返答する。
システムは、「Ｓｅｉｎｆｅｌｄ」を会話状態空間内に記憶し、Ｓｅｉｎｆｅｌｄ番組をユーザに提示する。システムが、別の入力「シーズン２」を受信すると、システムは、その入力を会話状態空間内に記憶し、Ｓｅｉｎｆｅｌｄのシーズン２を返す。ユーザが、追加の入力「最後のエピソード」を提供すると、システムは、フィルタ「最後のエピソード」と「シーズン２」とが互に排他的であるかどうかを決定する。これらの２つのフィルタは、互に排他的ではないため、システムは、「最後のエピソード」を会話状態空間内に記憶する。全３つのキーワード（「Ｓｅｉｎｆｅｌｄ」、「シーズン２」、および「最後のエピソード」）を使用して、システムは、Ｓｅｉｎｆｅｌｄ番組のシーズン２の最後のエピソードを提示する。

７）以下の実施例は、会話状態空間内へのフィルタの追加を例証する。
ユーザ：ＳｔａｒＷａｒｓ
応答：システムは、ＳｔａｒＷａｒｓ映画を返答する。
ユーザ（選択）：最後の作品応答：システムは、ＳｔａｒＷａｒｓシリーズの最後の映画を返答する。
システムは、「ＳｔａｒＷａｒｓ」を会話状態空間内に記憶し、ＳｔａｒＷａｒｓ映画を提示する。ユーザが、入力「最後の作品」を提供すると、システムは、それを会話状態空間内に記憶する。利用可能なエンティティ「ＳｔａｒＷａｒｓ」およびフィルタ「最後の作品」を使用して、システムは、ＳｔａｒＷａｒｓシリーズの最後の映画を提示する。

８）以下の実施例は、個人化によって作成されたショートカットを例証する。
ユーザ：Ｐａｔｒｉｏｔｇａｍｅｓ
応答：システムは、ＮｅｗＥｎｇｌａｎｄのＰａｔｒｉｏｔの試合を返す。
ユーザ：いいえ、映画のこと。
応答：システムは、映画「Ｐａｔｒｉｏｔｇａｍｅｓ」を返す。
システムは、「Ｐａｔｒｉｏｔｇａｍｅｓ」を会話状態空間内に記憶する。ＮｅｗＥｎｇｌａｎｄのＰａｔｒｉｏｔの試合を提示するシステムの応答は、ＮｅｗＥｎｇｌａｎｄのＰａｔｒｉｏｔの試合に対する好みを反映するユーザの選好シグネチャによって影響される。これは、個人化に基づいて、Ｐａｔｒｉｏｔエンティティを試合エンティティまたは概念にリンクするショートカットを例証する。個人化がなければ、「Ｐａｔｒｉｏｔ」と「試合」とは、ＮｅｗＥｎｇｌａｎｄのＰａｔｒｉｏｔｓを結果として提供するにはかけ離れていると考えられ得る。ユーザがＰａｔｒｉｏｔの試合を検索しているのではない場合、ユーザは、追加の入力を提供し得る。システムが追加の入力「いいえ、映画のこと」を受信すると、システムは、「映画」を会話状態空間に追加する。システムが、「映画」および「Ｐａｔｒｉｏｔｇａｍｅｓ」に関連付けられたメタデータを有するコンテンツアイテムを見つけると、その結果をユーザに提示する。本実施例では、システムは、映画Ｐａｔｒｉｏｔｇａｍｅｓを表示する。

９）以下の実施例は、さらなる限定質問および回答に基づく、会話状態空間内へのエンティティの追加を例証する。
ユーザ：ＳｔａｒＴｒｅｋ
応答：システムは、「映画ですか、ＴＶシリーズですか？」と尋ねる。
ユーザ：映画
応答：システムは、ＳｔａｒＴｒｅｋ映画を返す。
システムは、「ＳｔａｒＴｒｅｋ」をその会話状態空間内に記憶する。単語「Ｓｔａｒ
Ｔｒｅｋ」に曖昧性が存在するため、システムは、会話状態空間の範囲を狭める追加の質問を尋ねる。ユーザが、次の入力「映画」を提供すると、システムは、「映画」と「ＳｔａｒＴｒｅｋ」との間の関係距離を確認する。２つのキーワードが密接な関係を有するため、システムは、新しい入力および会話状態空間を使用して、ＳｔａｒＴｒｅｋ映画を見つける。その結果、システムは、ＳｔａｒＴｒｅｋ映画をユーザに提示する。

１０）以下の実施例は、ユーザに提示される結果をさらに限定するための会話状態空間内へのフィルタの追加を例証する。
ユーザ：ＳｔａｒＷａｒｓでＯｂｉＷａｎＫｅｎｏｂｉを演じたのは？
応答：システムは、単一結果ＡｌｅｃＧｕｉｎｎｅｓｓまたは結果のリストのいずれかを応答し得る。
ユーザ：新しい方。
応答：システムは、ＥｗａｎＭｃＧｒｅｇｏｒを返答する。
システムは、俳優のエンティティを見つけるユーザの意図を決定する。システムはまた、「ＯｂｉＷａｎＫｅｎｏｂｉ」および「ＳｔａｒＷａｒｓ」をその会話状態空間内に投入する。ユーザが検索している登場人物を演じた複数の俳優が存在し得る。本実施例では、ＡｌｅｃＧｕｉｎｎｅｓｓおよびＥｗａｎＭｃＧｒｅｇｏｒの両方がＯｂｉＷａｎＫｅｎｏｂｉＯｂｉＷａｎＫｅｎｏｂｉとして演じている。システムは、結果の完全リストまたは部分的リストのいずれかを返し得る。ユーザが、フィルタ「新しい方」を提供すると、システムは、「ＯｂｉＷａｎＫｅｎｏｂｉ」、「ＳｔａｒＷａｒｓ」、および新しいフィルタを含む会話状態空間を使用して、ユーザが検索しているエンティティがＥｗａｎＭｃＧｒｅｇｏｒであると決定する。システムは、ＥｗａｎＭｃＧｒｅｇｏｒを返す。

１１）以下の実施例は、所望のコンテンツアイテムを見つけることに基づく、システムのフォローアップアクションを例証する。
ユーザ：ＴｏｍＣｒｕｉｓｅおよびＤｕｓｔｉｎＨｏｆｆｍａｎの映画
応答：システムは、「ＲａｉｎＭａｎを見たいですか？」と返答する。
ユーザ：はい、Ｎｅｔｆｌｉｘで利用可能か調べて。
これは、曖昧性を解決するための質問ではないが、回答に関連付けられた非常に高い信頼性値を前提として、会話のフローに適合する応答スタイルである。システムは、「ＴｏｍＣｒｕｉｓｅ」、「ＤｕｓｔｉｎＨｏｆｆｍａｎ」、および「映画」を会話状態空間内に記憶する。「ＲａｉｎＭａｎ」が唯一の結果または非常に高い信頼性を伴う結果である場合、システムは、結果が映画であるという事実に基づいて行われ得る、可能なアクションを返す。次いで、システムは、会話状態空間を使用して、Ｎｅｔｆｌｉｘでの映画の可用性を見つける。システムは、他のオンラインストリーミングまたはレンタルウェブサイトを検索し得る。他のサイトを検索するかどうかは、ユーザ選好シグネチャに基づき得る。

１２）以下の実施例は、会話状態空間内のエンティティの音声／テキストエラーおよび置換が存在するときのシステムのアクションを例証する。
ユーザ：ＳｔａｒＷａｒｓでＯｂｉＷａｎｏｂｅを演じたのは誰？
応答：システムは、ＳｔａｒＷａｒｓにおける全登場人物を列挙し、また、その登場人物を演じた俳優を列挙し得る。
ユーザ：（ユーザは、訂正する）ＯｂｉＷａｎＫｅｎｏｂｉを演じたのは？
応答：システムは、他の登場人物および俳優を除去し、ＡｌｅｃＧｕｉｎｎｅｓｓおよび／またはＥｗａｎＭｃＧｒｅｇｏｒの一方あるいは両方を返す。
システムは、最初に、「演じる」、「ＯｂｉＷａｎｏｂｅ」、および「ＳｔａｒＷａｒｓ」を会話状態空間に追加する。この場合、ユーザが正しい登場人物名を挙げなかったか、またはシステムがユーザの単語を正しく検出しなかったかのいずれかである。システムは、ユーザの意図が「ＳｔａｒＷａｒｓ」における俳優名のエンティティを見つけることであることを理解する。システムは、最初に、「ＯｂｉＷａｎｏｂｅ」という名前の登場人物を見つけようとするが、そのような登場人物が存在しないため、見つけることができない。次いで、システムは、「ＳｔａｒＷａｒｓ」内の全登場人物を提供し、また、それらの登場人物を演じた俳優を提供し得る。全登場人物および俳優を列挙するとき、システムは、「ＯｂｉＷａｎｏｂｅ」の発音が登場人物とどれだけ近いかに基づいてリストを順序付け得る。システムは、「ＯｂｉＷａｎｏｂｅ」を「ＯｂｉＷａｎＫｅｎｏｂｉ」と置換する。「ＯｂｉＷａｎｏｂｅ」の記録が存在しないため、２つのキーワード間の関係距離は、存在しないか、またはかけ離れている。ユーザが、「ＯｂｉＷａｎＫｅｎｏｂｉのこと」と訂正すると、システムは、「ＳｔａｒＷａｒｓ」で「ＯｂｉＷａｎＫｅｎｏｂｉ」を演じた俳優を検索し、「ＳｔａｒＷａｒｓ」で「ＯｂｉＷａｎＫｅｎｏｂｉ」を演じたＡｌｅｃＧｕｉｎｎｅｓｓおよびＥｗａｎＭｃＧｒｅｇｏｒを返す。「ＳｔａｒＷａｒｓ」は、会話状態に保存されているため、繰り返される必要はない。システムは、ＧｕｉｎｎｅｓｓおよびＭｃＧｒｅｇｏｒの一方のみ返し得る。代替として、システムが「ＯｂｉＷａｎｏｂｅ」を見つけることができないとき、システムは、「ＯｂｉＷａｎｏｂｅ」に最も音声が類似する登場人物を決定し、「ＯｂｉＷａｎＫｅｎｏｂｉ」およびその登場人物を演じた俳優を返し得る。

１３）別の音声／テキストエラーの場合の実施例は、以下である。
ユーザ：ＴｏｍＣｒｕｉｓｅおよびＰａｕｌＭａｎｎｉｎｇの映画。
応答：システムは、「ＴｏｍＣｒｕｉｓｅおよびＰｅｙｔｏｎＭａｎｎｉｎｇの映画は見つかりません」と返す。
ユーザ：ＰｅｙｔｏｎＭａｎｎｉｎｇではなく、ＰａｕｌＮｅｕｍａｎｎ。
応答：システムは、ＣｏｌｏｒｏｆＭｏｎｅｙを提示する。
本実施例では、語彙エンジンおよび／または音声／テキストエンジンが、入力のある部分が、意図、エンティティ、および／または属性に関連するかどうかの検討から独立して、ユーザ入力に補正を行う。実施例では、名前「Ｍａｎｎｉｎｇ」が名前「Ｐａｕｌ」より一般的ではなく、したがって、入力を解決しようとするとき、語彙エンジンによってより高い重みが与えられるため、「ＰａｕｌＮｅｕｍａｎｎ」は、「ＰａｕｌＭａｎｎｉｎｇ」と誤変換されている。代替として、ユーザは、単に、その名前を「ＰａｕｌＭａｎｎｉｎｇ」と誤って発話し得る。さらになお、ユーザ入力における潜在的エラーをスクリーニングする場合にエンティティ関係グラフが考慮されるある実施形態では、ＡｍｅｒｉｃａｎＦｏｏｔｂａｌｌのユーザの選好が、考慮され、ユーザが本事例において意図していないとういう事実にもかかわらず、「ＰｅｙｔｏｎＭａｎｎｉｎｇ」を可能性のある入力エンティティとして提供し得る。システムは、「映画」、「ＴｏｍＣｒｕｉｓｅ」、および「ＰａｕｌＭａｎｎｉｎｇ」を会話状態空間内に記憶し、結果が存在しないことを提示する。ユーザは、システムが、「ＰａｕｌＮｅｕｍａｎｎ」ではなく、「ＰｅｙｔｏｎＭａｎｎｉｎｇ」を検索したことを認識し、追加の入力を与え、システムを補正する。システムは、誤ったエンティティ「ＰｅｙｔｏｎＭａｎｎｉｎｇ」のユーザの表明識別を認識し、そのエンティティを「ＰａｕｌＮｅｕｍａｎｎ」と置換する。システムは、会話状態空間内で「ＰａｙｔｏｎＭａｎｎｉｎｇ」を「ＰａｕｌＮｅｕｍａｎｎ」と置換する。会話状態空間内の「ＴｏｍＣｒｕｉｓｅ」、「映画」、および「ＰａｕｌＮｅｕｍａｎｎ」を使用して、システムは、ＣｏｌｏｒｏｆＭｏｎｅｙを提示する。

いくつかの実施形態では、前述の実施例の多くに提示されるように、システムは、音声入力を分析し、関連キーワードを会話状態空間内に投入する。次いで、システムは、所望のコンテンツを見つける。しかしながら、代替実施形態では、システムは、最初に、所望のコンテンツを分析および検索し得る。システムがユーザの意図を満たすことに失敗すると、システムは、キーワードを会話状態空間内に記録し、追加の入力を求める。

本明細書に開示される技法およびシステムは、コンピュータシステムまたはコンピュータ化電子デバイスと併用するためのコンピュータプログラム製品として実装され得る。そのような実装は、コンピュータ読み取り可能な媒体（例えば、ディスケット、ＣＤ－ＲＯＭ、ＲＯＭ、フラッシュメモリまたは他のメモリ、あるいは固定ディスク）等の有形メディア上に固定されるか、あるいは媒体を経由してネットワークに接続された通信アダプタ等のモデムまたは他のインターフェースデバイスを介して、コンピュータシステムまたはデバイスに伝送可能であるかのいずれかである、一連のコンピュータ命令または論理を含み得る。

媒体は、有形媒体（例えば、光学またはアナログ通信ライン）または無線技法（例えば、Ｗｉ－Ｆｉ、セルラー、マイクロ波、赤外線、または他の伝送技法）を用いて実装される媒体のいずれかであり得る。一連のコンピュータ命令は、システムに関して本明細書に前述の機能性の少なくとも一部を具現化する。当業者は、そのようなコンピュータ命令が、多くのコンピュータアーキテクチャまたはオペレーティングシステムと併用するために、いくつかのプログラミング言語で書かれることができることを理解するはずである。

さらに、そのような命令は、半導体、磁気、光学、または他のメモリデバイス等の任意の有形メモリデバイス内に記憶され得、光学、赤外線、マイクロ波、または他の伝送技術等の任意の通信技術を使用して伝送され得る。

そのようなコンピュータプログラム製品は、付随の印刷または電子説明書（例えば、市販のソフトウェア）を伴う取り外し可能な媒体として配信される、コンピュータシステムに予め搭載される（例えば、システムＲＯＭまたは固定ディスク上）、あるいはネットワーク（例えば、インターネットまたはＷｏｒｌｄＷｉｄｅＷｅｂ）を経由して、サーバまたは電子掲示板から配信され得ることが予想される。当然ながら、本発明のいくつかの実施形態は、ソフトウェア（例えば、コンピュータプログラム製品）およびハードウェアの両方の組み合わせとして実装され得る。本発明のさらに他の実施形態は、全体的にハードウェアまたは全体的にソフトウェア（例えば、コンピュータプログラム製品）として実装される。

さらに、本明細書に開示される技法およびシステムは、種々のモバイルデバイスとともに使用されることができる。例えば、本明細書で論じられる信号を受信可能な携帯電話、スマートフォン、携帯情報端末、および／またはモバイルコンピューティングデバイスが、本発明の実装において使用されることができる。

本開示の熟読から当業者に明白となるであろうように、本開示は、前述で具体的に開示されたもの以外の形態で具現化されることができる。前述の特定の実施形態は、したがって、制限ではなく、例証と見なされるべきである。当業者は、本明細書に説明される具体的実施形態の多数の均等物を認識する、またはルーチンにすぎない実験を使用して、それらを究明するであろう。本発明の範囲は、前述の説明に含有される実施例に限定されるのではなく、添付の請求項およびその均等物に記載される。

Claims

ユーザから受信される検索要求を処理するためのシステムを動作させる方法であって、前記システムは、入力回路と制御回路とを備え、前記方法は、
前記制御回路が、前記入力回路を用いて、第１のフィルタによって定義されている会話状態空間において、第１の音声入力を受信することであって、前記第１のフィルタは、第１の属性の第１の用語を含む、ことと、
前記制御回路が、前記第１の音声入力において、第２の属性の第１の用語を含む第２のフィルタを識別することと、
前記制御回路が、前記第１のフィルタおよび前記第２のフィルタに基づいて、第１の組のコンテンツアイテムを選択することと、
前記制御回路が、前記第１の組のコンテンツアイテムを表示のために生成することと、
前記制御回路が、前記入力回路を用いて、第２の音声入力を受信することと、
前記制御回路が、前記第２の音声入力において、前記第２の属性の第２の用語を含む第３のフィルタを識別することと、
前記制御回路が、前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタに一致するコンテンツアイテムが存在するかどうかを決定することと、
前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタに一致するコンテンツアイテムが存在することを決定することに応答して、
前記制御回路が、前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタに基づいて、第２の組のコンテンツアイテムを選択することと、
前記制御回路が、前記第２の組のコンテンツアイテムを表示のために生成することと、
前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタに一致するコンテンツアイテムが存在しないことを決定することに応答して、
前記制御回路が、前記第２のフィルタを前記第３のフィルタに置換することであって、前記第２のフィルタを前記第３のフィルタに置換することは、
前記制御回路が、複数のフィルタ間の関係距離を含む関係データベースにアクセスすることと、
前記制御回路が、前記第２のフィルタと前記第３のフィルタとの間の関係距離が閾値を超えることを決定することと
に基づいている、ことと、
前記制御回路が、前記第１のフィルタおよび前記第３のフィルタに基づいて、第３の組のコンテンツアイテムを選択することと、
前記制御回路が、前記第３の組のコンテンツアイテムを表示のために生成することと
を含む、方法。
前記関係データベースは、複数のノードおよび複数のエッジを有する関係グラフを含み、各ノードは、フィルタを表し、各エッジは、２つのフィルタ間の直接的な関係を表す、請求項１に記載の方法。
２つのフィルタ間の関係距離は、前記２つのフィルタに対応する２つのノード間のホップの最小数で測定される、請求項１に記載の方法。
各エッジは、重みを有し、２つのフィルタ間の関係距離は、前記２つのフィルタに対応する２つのノードを接続するエッジの重みの和として測定される、請求項１に記載の方法。
前記関係データベースにおける前記関係距離は、経時的に取得されたユーザの選好によって修正される、請求項１に記載の方法。
前記方法は、前記制御回路が、履歴入力を含むデータベースへのアクセスを提供することをさらに含み、複数のフィルタ間の関係距離は、前記複数のフィルタが一緒に使用された頻度に基づいて決定される、請求項１に記載の方法。
前記第１の組のコンテンツアイテムを選択することは、前記制御回路が、一組のコンテンツアイテムの中から、前記会話状態空間内の前記第１のフィルタおよび前記第２のフィルタに一致するメタデータに関連付けられているコンテンツアイテムを検索することに基づいて、前記会話状態空間内の前記第１のフィルタおよび前記第２のフィルタが閾値を超える関連性尺度を有することを決定することをさらに含む、請求項１に記載の方法。
前記第２の組のコンテンツアイテムを選択することは、前記制御回路が、一組のコンテンツアイテムの中から、前記会話状態空間内の前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタのすべてに一致するメタデータに関連付けられているコンテンツアイテムを検索することに基づいて、前記会話状態空間内の前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタが閾値を超える関連性尺度を有することを決定することをさらに含む、請求項１に記載の方法。
前記第３の組のコンテンツアイテムを選択することは、前記制御回路が、一組のコンテンツアイテムの中から、前記会話状態空間内の前記第１のフィルタおよび前記第３のフィルタに一致するメタデータに関連付けられているコンテンツアイテムを検索することに基づいて、前記会話状態空間内の前記第１のフィルタおよび前記第３のフィルタが閾値を超える関連性尺度を有することを決定することをさらに含む、請求項１に記載の方法。
ユーザから受信される検索要求を処理するためのシステムであって、前記システムは、
音声入力を受信するように構成されている入力回路と、
制御回路と
を備え、
前記制御回路は、
前記入力回路を用いて、第１のフィルタによって定義されている会話状態空間において、第１の音声入力を受信することであって、前記第１のフィルタは、第１の属性の第１の用語を含む、ことと、
前記第１の音声入力において、第２の属性の第１の用語を含む第２のフィルタを識別することと、
前記第１のフィルタおよび前記第２のフィルタに基づいて、第１の組のコンテンツアイテムを選択することと、
前記第１の組のコンテンツアイテムを表示のために生成することと、
前記入力回路を用いて、第２の音声入力を受信することと、
前記第２の音声入力において、前記第２の属性の第２の用語を含む第３のフィルタを識別することと、
前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタに一致するコンテンツアイテムが存在するかどうかを決定することと、
前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタに一致するコンテンツアイテムが存在することを決定することに応答して、
前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタに基づいて、第２の組のコンテンツアイテムを選択することと、
前記第２の組のコンテンツアイテムを表示のために生成することと、
前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタに一致するコンテンツアイテムが存在しないことを決定することに応答して、
前記第２のフィルタを前記第３のフィルタに置換することであって、前記制御回路は、
複数のフィルタ間の関係距離を含む関係データベースにアクセスすることと、
前記第２のフィルタと前記第３のフィルタとの間の関係距離が閾値を超えることを決定することと
に基づいて、前記第２のフィルタを前記第３のフィルタに置換することと
を行うように構成されている、ことと、
前記第１のフィルタおよび前記第３のフィルタに基づいて、第３の組のコンテンツアイテムを選択することと、
前記第３の組のコンテンツアイテムを表示のために生成することと
を行うように構成されている、システム。
前記関係データベースは、複数のノードおよび複数のエッジを有する関係グラフを含み、各ノードは、フィルタを表し、各エッジは、２つのフィルタ間の直接的な関係を表す、請求項１０に記載のシステム。
２つのフィルタ間の関係距離は、前記２つのフィルタに対応する２つのノード間のホップの最小数で測定される、請求項１０に記載のシステム。
各エッジは、重みを有し、２つのフィルタ間の関係距離は、前記２つのフィルタに対応する２つのノードを接続するエッジの重みの和として測定される、請求項１０に記載のシステム。
前記関係データベースにおける前記関係距離は、経時的に取得されたユーザの選好によって修正される、請求項１０に記載のシステム。
前記制御回路は、履歴入力を含むデータベースへのアクセスを提供するようにさらに構成されており、複数のフィルタ間の関係距離は、前記複数のフィルタが一緒に使用された頻度に基づいて決定される、請求項１０に記載のシステム。
前記第１の組のコンテンツアイテムを選択するように構成されている前記制御回路は、一組のコンテンツアイテムの中から、前記会話状態空間内の前記第１のフィルタおよび前記第２のフィルタに一致するメタデータに関連付けられているコンテンツアイテムを検索することに基づいて、前記会話状態空間内の前記第１のフィルタおよび前記第２のフィルタが閾値を超える関連性尺度を有することを決定するようにさらに構成されている、請求項１０に記載のシステム。
前記第２の組のコンテンツアイテムを選択するように構成されている前記制御回路は、一組のコンテンツアイテムの中から、前記会話状態空間内の前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタのすべてに一致するメタデータに関連付けられているコンテンツアイテムを検索することに基づいて、前記会話状態空間内の前記第１のフィルタおよび前記第２のフィルタおよび前記第３のフィルタが閾値を超える関連性尺度を有することを決定するようにさらに構成されている、請求項１０に記載のシステム。
前記第３の組のコンテンツアイテムを選択するように構成されている前記制御回路は、一組のコンテンツアイテムの中から、前記会話状態空間内の前記第１のフィルタおよび前記第３のフィルタに一致するメタデータに関連付けられているコンテンツアイテムを検索することに基づいて、前記会話状態空間内の前記第１のフィルタおよび前記第３のフィルタが閾値を超える関連性尺度を有することを決定するようにさらに構成されている、請求項１０に記載のシステム。