JP2023089059A

JP2023089059A - 収束質問に対する回答を改善するための仮想談話ツリーの構築

Info

Publication number: JP2023089059A
Application number: JP2023060794A
Authority: JP
Inventors: ガリツキー，ボリス; Galitsky Boris
Original assignee: Oracle International Corp
Current assignee: Oracle International Corp
Priority date: 2018-05-09
Filing date: 2023-04-04
Publication date: 2023-06-27
Also published as: US20190347297A1; WO2019217722A1; JP7258047B2; US20220245200A1; CN112106056A; EP3791292A1; US11782985B2; JP2021523464A; US11328016B2

Abstract

【課題】複雑で複数センテンスの収束質問に対する質問回答再現率を改善する方法及びシステムを提供する。【解決手段】コミュニケーション用談話ツリー１００において、自律型エージェントは、ユーザデバイスから受信された質問に部分的に回答する初期回答にアクセスし、質問および初期回答を談話ツリーとして表し、談話ツリーから、初期回答によって対処されない質問内のエンティティを識別し、テキストコーパスのような追加のリソースから追加の談話ツリーを形成する。追加の談話ツリーは、対処されていないエンティティを初期回答に修辞的に接続する。エージェントは、この談話ツリーを仮想談話ツリーとして指定する。仮想談話ツリーは、初期回答談話ツリーと組み合わされると、既存の解に対して改善された回答を生成するよう使用される。【選択図】図１

Description

関連出願への相互参照
本出願は２０１８年９月１０日に提出された米国仮出願６２／７２９，３３５号および２０１８年５月９日に提出された米国仮出願６２／６６８，９６３号の利益を主張し、その両方の全体をここに引用により援用する。

背景
言語学は言語に関する科学的研究である。言語学の一局面は、英語などの人の自然言語に対してコンピュータサイエンスを適用することである。プロセッサ速度の大幅な上昇およびメモリ容量の大幅な増大により、言語学にコンピュータを適用することが増えてきている。たとえば、言語談話をコンピュータで分析できれば、ユーザからの質問に回答することができる自動化エージェントなどの多数の用途が促進される。質問に回答し、議論を促進し、ダイアログを管理し、社会的振興をもたらすために自律型エージェントまたはチャットボットを用いることが次第に普及してきている。

自律型エージェントは、データベースなどの特定のリソースで発見された情報に基づいて回答を生成することによって、または検索エンジンに問い合わせることによって、ユーザデバイスから受信されたクエリを処理することができる。しかし、単一のリソースまたは検索エンジンの結果は、複雑なユーザクエリまたは収束質問に充分には対処しないときがある。収束質問とは、高い度合いの正解率で回答を必要とする質問である。

したがって、回答が複数のリソースにおいて提供される場合、既存のシステムでは、質問に対する完全かつ正確な回答を形成することができない。したがって、新たな解決策が必要である。

概要
本明細書で記載される局面は、複雑で複数センテンスの収束質問に対する質問回答再現率を改善するために、仮想談話ツリーを使用する。より具体的には、改善された自律型エージェントが、ユーザデバイスから受信された質問に対する初期回答にアクセスする。初期回答は、質問に部分的に対処するが、完全には対処しない。エージェントは質問および初期回答を談話ツリーとして表し、回答において対処されていない質問内のエンティティを識別する。エージェントは、テキストコーパスのような追加のリソースにアクセスして、欠けているエンティティと回答内の別のエンティティとを修辞的に接続する回答を判断する。エージェントは、この追加のリソースを選択し、それによって、回答の談話ツリーと組み合わされたときに既存の解決策よりも改善された回答を生成するために使用することができる仮想談話ツリーを形成する。

一局面では、ある方法は、コンピューティングデバイスが、質問から、質問エンティティを含む質問談話ツリーを構築することを含む。質問談話ツリーは、質問の基本談話単位間の修辞関係を表す。本方法は、コンピューティングデバイスがテキストコーパスから初期回答にアクセスすることをさらに含む。本方法は、コンピューティングデバイスが、初期回答から、回答エンティティを含む回答談話ツリーを構築することをさらに含む。回答談話ツリーは、初期回答の基本談話単位間の修辞関係を表す。本方法は、コンピューティングデバイスが、質問エンティティに対する回答エンティティの関連性を示すスコアが閾
値未満であると判断することをさらに含む。本方法は、仮想談話ツリーを生成することをさらに含む。仮想談話ツリーを生成することは、テキストコーパスから追加の談話ツリーを生成することを含む。仮想談話ツリーを生成することは、追加の談話ツリーが質問エンティティを回答エンティティと接続する修辞関係を含む、と判断することを含む。仮想談話ツリーを生成することは、質問エンティティ、回答エンティティ、および修辞関係を含む追加談話ツリーのサブツリーを抽出し、それによって仮想談話ツリーを生成することを含む。仮想談話ツリーを生成することは、回答談話ツリーと仮想談話ツリーとの組み合わせによって表される回答を出力することを含む。

一例では、初期回答にアクセスすることは、テキストの一部分について回答関連性スコアを判断することと、回答関連性スコアが閾値より大きいと判断することに応答して、テキストの一部分を初期回答として選択することとを含む。

一例では、仮想談話ツリーは、修辞関係を表すノードを含む。本方法は、ノードを回答エンティティに接続することによって仮想談話ツリーを回答談話ツリーに統合することをさらに含む。

一例では、追加の談話ツリーを作成することは、追加の談話ツリーの各々について、それぞれの追加の談話ツリーにおいて１つ以上の回答エンティティへのマッピングを含む質問エンティティの数を示すスコアを計算することを含む。追加の談話ツリーを作成することは、追加の談話ツリーから、最も高いスコアを有する追加の談話ツリーを選択することとを含む。

一例では、追加の談話ツリーを作成することは、追加の談話ツリーの各々について、トレーニングされた分類モデルを（ａ）質問談話ツリーおよび（ｂ）それぞれの追加の回答談話ツリーの１つ以上に適用することによってスコアを計算することと、追加の談話ツリーから、最も高いスコアを有する追加の談話ツリーを選択することとを含む。

一例では、質問は、複数のキーワードを含み、初期回答にアクセスすることは、電子文書の検索を行うことにより、キーワードを含む検索クエリに基づいて回答を取得することを含む。初期回答にアクセスすることは、回答の各々について、質問とそれぞれの回答との間の一致のレベルを示す回答スコアを判断することを含む。初期回答にアクセスすることは、回答の中から、最も高いスコアを有する回答を初期回答として選択することを含む。

一例では、スコアを計算することは、トレーニングされた分類モデルを、（ａ）質問談話ツリーおよび（ｂ）回答談話ツリーのうちの１つ以上に適用することと、分類モデルからスコアを受け取ることとを含む。

一例では、談話ツリーを構築することは、フラグメントを含むセンテンスにアクセスすることを含む。少なくとも１つのフラグメントは動詞および単語を含み、各単語はフラグメント内において単語の役割を含む。各フラグメントは基本談話単位である。談話ツリーを構築することはさらに、フラグメント間の修辞関係を表す談話ツリーを生成することを含む。談話ツリーはノードを含み、各非終端ノードはフラグメントのうちの２つのフラグメント間の修辞関係を表し、談話ツリーのノードの各終端ノードはフラグメントのうちの１つに関連付けられる。

一例では、この方法は、さらに、質問談話ツリーから、質問ルートノードを含む質問コミュニケーション用談話ツリーを判断することを含む。コミュニケーション用談話ツリーは、コミュニケーション行動を含む談話ツリーである。生成することは、さらに、仮想談
話ツリーから回答コミュニケーション用談話ツリーを判断することを含む。回答コミュニケーション用談話ツリーは回答ルートノードを含む。生成することは、質問ルートノードと回答ルートノードとが同一であると識別することによって、コミュニケーション用談話ツリーをマージすることを含む。生成することは、予測モデルをマージされたコミュニケーション用談話ツリーに適用することによって、質問コミュニケーション用談話ツリーと回答コミュニケーション用談話ツリーとの間の相補性のレベルを計算することを含む。生成することは、相補性のレベルが閾値を超えると判断することに応答して、仮想談話ツリーに対応する最終回答を出力することを含む。

一例では、談話ツリーはテキストのフラグメント間の修辞関係を表す。談話ツリーは複数のノードを含む。各非終端ノードはフラグメントのうちの２つのフラグメント間の修辞関係を表し、談話ツリーのノードの各終端ノードはフラグメントのうちの１つに関連付けられる。コミュニケーション用談話ツリーを構築することは、動詞を有する各フラグメントを動詞シグネチャにマッチングすることを含む。マッチングすることは、動詞シグネチャにアクセスすることを含む。動詞シグネチャは、フラグメントの動詞と、主題役割のシーケンスとを含む。主題役割は動詞と関連する単語との間の関係を記述する。マッチングすることは、さらに、動詞シグネチャの各動詞シグネチャについて、フラグメント内の単語の役割に一致する、それぞれのシグネチャの主題役割を判断することを含む。マッチングすることは、さらに、動詞シグネチャから、特定の動詞シグネチャが最大数の一致を含むことに基づいて、当該特定の動詞シグネチャを選択することを含む。マッチングすることは、さらに、特定の動詞シグネチャをフラグメントに関連付けることを含む。

一例では、ある方法は、ある質問について、質問エンティティを含む質問談話ツリーを構築することを含む。本方法は、さらに、初期回答から、回答エンティティを含む回答談話ツリーを構築することを含む。本方法はさらに、質問エンティティのうちの第１の質問エンティティと回答エンティティのうちのある回答エンティティとの間において、第１の質問エンティティに対するある回答エンティティの関連性を確立するマッピングを確立することを含む。本方法はさらに、質問エンティティのうちの第２の質問エンティティが回答エンティティのいずれによっても対処されないと判断することに応答して、追加の回答に対応する追加の談話ツリーを回答談話ツリーと組み合わせることによって仮想談話ツリーを生成することを含む。本方法はさらに、質問談話ツリーから質問コミュニケーション用談話ツリーを判断することを含む。本方法はさらに、仮想談話ツリーから回答コミュニケーション用談話ツリーを判断することを含む。本方法はさらに、予測モデル、質問コミュニケーション用談話ツリーおよび回答コミュニケーション用談話ツリーを適用することによって質問コミュニケーション用談話ツリーと回答コミュニケーション用談話ツリーとの間の相補性のレベルを計算することを含む。本方法はさらに、相補性のレベルが閾値を超える、と判断することに応答して、仮想談話ツリーに対応する最終回答を出力することを含む。

上記方法は、１つ以上の処理装置および／または１つ以上のプロセッサに上記方法に関して説明した動作を実行させることができるプログラム命令を格納することができる非一時的コンピュータ読取可能媒体を備えるシステムとして実現することができる。

以下、本発明の例示的局面を図面に基づいて詳細に説明する。

一局面に従った例示的な修辞学的分類環境を示す図である。一局面に従った談話ツリーの一例を示す図である。一局面に従った談話ツリーのさらに別の例を示す図である。一局面に従った例示的なスキーマを示す図である。一局面に従った階層型バイナリツリーのノードリンク表現を示す図である。一局面に従った、図５における表現についての例示的なインデントされたテキストエンコーディングを示す図である。一局面に従った、財産税に関する要求例についての例示的なＤＴを示す図である。図７に表わされる質問についての例示的な応答を示す図である。一局面に従った公式の回答についての談話ツリーを示す図である。一局面に従った未処理の回答についての談話ツリーを示す図である。一局面に従った、第１のエージェントの請求についてのコミュニケーション用談話ツリーを示す図である。一局面に従った、第２のエージェントの請求についてのコミュニケーション用談話ツリーを示す図である。一局面に従った、第３のエージェントの請求についてのコミュニケーション用談話ツリーを示す図である。一局面に従ったパース交錯を示す図である。一局面に従った、コミュニケーション用談話ツリーを構築するための例示的なプロセスを示す図である。一局面による、仮想談話ツリーを構築するための例示的なプロセスを示す。一局面による質問、回答、および２つの仮想談話ツリーの例示的な談話ツリーを示す図である。局面のうちの１つを実現するための分散型システムの簡略図を示す。一局面による、局面システムの構成要素によって提供されるサービスがクラウドサービスとして提供され得る、システム環境の構成要素の簡略ブロック図である。本発明のさまざまな局面が実現され得る例示的なコンピュータシステムを示す図である。

詳細な説明
上記で考察したように、自律型エージェントのための既存のシステムは欠点を有する。例えば、そのようなシステムは、複雑なクエリ、複数センテンスのクエリ、または収束クエリに回答することができない。これらのシステムはまた、構築が困難で費用のかかるオントロジー、またはドメイン内の異なる概念間の関係に依存し得る。さらに、いくつかの既存の解決策は、表現性およびカバレージを制限し得る知識グラフに基づくアプローチを採用する。

対照的に、本明細書で説明される局面は、ドメイン独立談話分析を使用することによって、複雑なユーザクエリに回答することができる。本明細書で説明される局面は、仮想談話ツリーを使用して、質問と回答との間の完全な修辞学的リンクを検証し、場合によってはそれを完成させ、それによって、複雑な、複数センテンスの収束質問に対する質問回答再現率を改善する。仮想談話ツリーは、質問への初期回答とそれを補足する追加の回答との組み合わせを表す談話ツリーである。このようにして、仮想談話ツリーは、ユーザクエリに対する完全な回答を表す。

所与の回答が所与の質問に関係するためには、回答のエンティティは質問のエンティティを網羅すべきである。「エンティティ」は、独立かつ明確な存在を有する。例は、物体、場所、および人を含む。エンティティは、「電気自動車」、「ブレーキ」、「フランス」などの主題またはトピックとすることもできる。

しかしながら、場合によっては、質問内の１つ以上のエンティティは、初期回答におい
て対処されない。例えば、ユーザは、自分の車の「エンジン」について尋ねるかもしれないが、初期回答は、「エンジン」について全く論じない場合がある。他の場合では、代わりに、より具体的なエンティティが回答において発生するが、質問エンティティに対するそれらの繋がりは直ちに明白ではない。前の例を続けると、初期回答は、エンティティ「スパークプラグ」または「変速機」を、「エンジン」に繋げることなく、含むかもしれない。他の場合では、いくつかの回答エンティティは、質問において明示的に言及されないかもしれず、質問において仮定されているかもしれない。完全な回答を提供するために、欠けているエンティティが斟酌され、適切な場合には、説明されるべきである。

このギャップを橋渡しするために、本開示のいくつかの局面は、仮想談話ツリーを使用する。例えば、自律型エージェントアプリケーションは、質問に存在し回答に欠けているエンティティ間のリンクを提供する回答を識別することができる。このアプリケーションは、仮想回答談話ツリーの関連フラグメントを、質問に対する完全な回答を表す仮想談話ツリーに組み合わせる。従って、仮想談話ツリーは、回答を検証し、場合によっては回答を拡張するのに使用することができる修辞学的リンクを提供する。次いで、このアプリケーションは、完全な回答をユーザデバイスに提示することができる。

異なるソースからのデマンドでマイニングされた文書から得られたツリーフラグメントで拡張された仮想談話ツリーを作成することによって、開示される解決策はオントロジーの必要性を排除する。例えば、自動車のドメインを考えると、あるオントロジーは、ブレーキと車輪または変速機とエンジンとの関係を表すことがある。対照的に、さまざまな局面は、所与の著者の思考構造とは無関係な回答のカノニカルな談話表現を得る。

別の例では、開示される解決策は、テキストの２つの部分の間の修辞学的合致を検証するために、コミュニケーション用談話ツリーを使用することができる。例えば、自律型エージェントアプリケーションと連動して動作する修辞学的合致アプリケーションは、質問と回答との間、質問と回答の一部との間、または初期回答と仮想談話ツリーによって表される回答との間の修辞学的合致、例えばスタイルを検証することができる。

「コミュニケーション用談話ツリー」または「ＣＤＴ」は、コミュニケーション行動で補われる談話ツリーを含む。コミュニケーション行動は、個人相互の熟慮および立論に基づいて個人によって、またはそうでなければ当該技術分野において公知のように行われる協調的行動である。コミュニケーション行動を識別するラベルを組込むことにより、コミュニケーション用談話ツリーの学習が、基本談話単位（ＥＤＵ）の単純に修辞学的な関係および構文よりも豊富な特徴セットにわたって生じ得る。そのような特徴セットを用いると、分類などの追加の技法を使用して、質問と回答との間または要求・応答ペア間の修辞学的合致のレベルを判断することができ、それによって、改善された自動化されたエージェントを可能にする。そうする際に、コンピューティングシステムは、質問および他のメッセージに知的に回答することができる自律型エージェントを可能にする。

特定の定義
「修辞構造理論（rhetorical structure theory）」は、この明細書中において用いら
れる場合、談話の一貫性の分析を可能にし得る論理基礎を提供した調査および研究の分野である。

「談話ツリー」または「ＤＴ（discourse tree）」は、この明細書中において用いられる場合、センテンスの一部をなすセンテンスについての修辞関係を表現する構造を指している。

「修辞関係」、「修辞関係性」、「一貫性関係」または「談話関係」は、この明細書中
において用いられる場合、談話のうち２つのセグメントが互いに如何に論理的に接続されているかを述べている。修辞関係の例は詳述、対比および属性を含む。

「センテンスフラグメント」または「フラグメント」は、この明細書中において用いられる場合、センテンスの残りから分割することができるセンテンスの一部である。フラグメントは基本談話単位である。たとえば、「Dutch accident investigators say that evidence points to pro-Russian rebels as being responsible for shooting down the plane（オランダの事故調査員は、証拠が、飛行機の撃墜をロシア支持派の反乱分子によるものであると示唆していると述べている）」というセンテンスの場合、２つのフラグメントは、「Dutch accident investigators say that evidence points to pro-Russian rebels」および「as being responsible for shooting down the plane」である。フラグメ
ントは動詞を含み得るが、必ずしも動詞を含んでいる必要はない。

「シグネチャ」または「フレーム」は、この明細書中において用いられる場合、フラグメントにおける動詞の特性を指している。各々のシグネチャは１つ以上の主題役割を含み得る。たとえば、「Dutch accident investigators say that evidence points to pro-Russian rebels」というフラグメントの場合、動詞は「say」であり、動詞「say」をこの
ように特別に使用している場合のシグネチャは「エージェント動詞トピック」であり得る。この場合、「investigators」はエージェントであり、「evidence」はトピックである
。

「主題役割」は、この明細書中において用いられる場合、１つ以上の単語の役割を記述するのに用いられるシグネチャの構成要素を指している。上述の例に続いて、「エージェント」および「トピック」は主題役割である。

「核性（nuclearity）」は、この明細書中において用いられる場合、どのテキストセグメント、フラグメントまたはスパンが書き手の目的の中心により近いかを指している。核はより中心的なスパンであり、衛星はそれほど中心的ではない。

「一貫性（coherency）」は、この明細書中において用いられる場合、２つの修辞関係
をともにリンクするものを指している。

「コミュニケーション動詞（communicative verb）」は、この明細書中において用いられる場合、コミュニケーションを示す動詞である。たとえば、「否定する（deny）」という動詞はコミュニケーション動詞である。

「コミュニケーション行動」は、この明細書中において用いられる場合、１以上のエージェントによって実行される行動、およびエージェントの主題を記述するものである。

図１は、一局面による例示的な修辞学的分類環境を示す。図１は、自律型エージェント１０１、入力質問１３０、出力回答１５０、データネットワーク１０４、およびサーバ１６０を示す。自律型エージェント１０１は、自律型エージェントアプリケーション１０２、データベース１１５、修辞学的合致アプリケーション１１２、修辞学的合致分類器１２０、またはトレーニングデータ１２５の１つ以上を含むことができる。サーバ１６０は、ユーザの質問および回答の公衆データベースなどの公衆または個人のインターネットサーバとすることができる。サーバ１６０によって提供される機能の例は、検索エンジンおよびデータベースを含む。データネットワーク１０４は、任意の公衆もしくは個人ネットワーク、有線もしくは無線ネットワーク、ワイドエリアネットワーク、ローカルエリアネットワーク、またはインターネットとすることができる。自律型エージェントアプリケーション１０２および修辞学的合致アプリケーション１１２は、図１８に関してさらに論じる
ように、分散型システム１８００内で実行することができる。

自律型エージェントアプリケーション１０２は、入力質問１３０にアクセスし、出力回答１５０を生成することができる。入力質問１３０は、単一の質問またはチャットのような質問のストリームとすることができる。図示するように、入力質問１３０は、「電気自動車の利点は何ですか？」である。自律エージェントアプリケーション１０２は、例えば、１つ以上の仮想談話ツリー１１０を作成することによって、入力質問１３０を受信し、入力質問１３０を分析することができる。

例えば、自律型エージェントアプリケーション１０２は、入力質問１３０から質問談話ツリーを作成し、データベースなどのリソースから取得した初期回答から回答談話ツリーを作成する。場合によっては、自律型エージェントアプリケーション１０２は、候補回答のセットを取得し、最良の一致を初期回答として選択することができる。質問談話ツリー内のエンティティと回答談話ツリー内のエンティティとを分析および比較することによって、自律型エージェントアプリケーション１０２は、回答において対処されていない質問内の１つ以上のエンティティを判断する。

例を続けると、自律型エージェントアプリケーション１０２は、テキストコーパスなどの追加のリソースにアクセスし、テキストから１つ以上の追加の回答談話ツリーを判断する。自律型エージェントアプリケーション１０２は、追加の回答談話ツリーのうちの１つが、欠けている質問エンティティと質問または回答内の別のエンティティとの間に修辞学的リンクを確立する、と判断し、それによって、特定の追加の回答談話ツリーを仮想談話ツリーとして指定する。次いで、自律型エージェントアプリケーション１０２は、初期回答談話ツリーおよび仮想談話ツリーによって表されるテキストから完全な回答を形成することができる。自律型エージェントアプリケーション１０２は、その回答を出力回答１５０として提供する。例えば、自律型エージェントアプリケーション１０２は「ガソリンを必要としない」というテキストを出力する。

場合によっては、修辞学的合致アプリケーション１１２は、入力質問１３０と出力回答１５０との間の改善された修辞学的合致を容易にするために、自律型エージェントアプリケーション１０２と協働することができる。例えば、修辞学的合致アプリケーション１１２は、１つ以上のコミュニケーション用談話ツリー１１４を使用することによって、１つ以上の談話ツリー間またはそれらの部分間の修辞学的合致のレベルを検証することができる。コミュニケーション用談話ツリーを使用することによって、質問と回答との間の修辞学的合致およびコミュニケーション行動を正確にモデル化することができる。例えば、修辞学的合致アプリケーション１１２は、入力質問および出力回答が修辞学的合致を維持することを検証することができ、それによって、完全な応答回答だけでなく、スタイルに関して質問と合致する回答も保証する。

例えば、修辞学的合致アプリケーション１１２は、入力質問１３０を表す質問コミュニケーション用談話ツリーと、各候補回答についての追加のコミュニケーション用談話ツリーとを作成することができる。候補回答から、修辞学的合致アプリケーション１１２は、最も好適な回答を判断する。異なる方法を用いることができる。一局面では、修辞学的合致アプリケーション１１２は、各候補回答について候補回答コミュニケーション用談話ツリーを作成し、質問コミュニケーション用談話ツリーを各候補談話ツリーと比較することができる。次いで、修辞学的合致アプリケーション１１２は、質問コミュニケーション用談話ツリーと候補回答コミュニケーション用談話ツリーとの間の最良の一致を識別することができる。

別の例では、修辞学的合致アプリケーション１１２は、各候補回答について、質問１３
０および候補回答を含む質問・回答ペアを作成する。修辞学的合致アプリケーション１１２は、質問・回答ペアを、修辞学的合致分類器１２０などの予測モデルに提供する。トレーニングされた修辞学的合致分類器１２０を使用して、修辞学的合致アプリケーション１１２は、質問・回答ペアが、例えば、回答が質問に対処するかどうかを示す、一致の閾値レベルを超えるかどうかを判断する。そうでなければ、修辞学的合致アプリケーション１１２は、好適な回答が見つかるまで、質問および異なる回答を含む追加のペアを分析し続ける。場合によっては、修辞学的合致アプリケーション１１２は、トレーニングデータ１２５を用いて修辞学的合致分類器１２０をトレーニングすることができる。

修辞学構造理論および談話ツリー
言語学は言語についての科学的研究である。たとえば、言語学は、センテンス（構文）の構造、たとえば、主語－動詞－目的語、センテンス（セマンティックス）の意味、たとえば、「dog bites man（犬が人を噛む）」に対して「man bites dog（人が犬を噛む）」、さらに、話し手が会話中に行うこと、すなわち、談話分析またはセンテンスの範囲を超えた言語の分析、を含み得る。

談話の理論上の基礎（修辞構造理論（Rhetoric Structure Theory：ＲＳＴ））は、Mann、WilliamおよびThompson、Sandraによる「Rhetorical structure theory: A Theory of
Text organization」（Text-Interdisciplinary Journal for the Study of Discourse
）8(3):243-281: 1988）によるものであり得る。プログラミング言語理論の構文およびセマンティックスが現代のソフトウェアコンパイラの可能化に如何に役立ったのかと同様に、ＲＳＴは談話の分析の可能化に役立った。より具体的には、ＲＳＴは、構造ブロックを少なくとも２つのレベルで想定している。２つのレベルは、核性および修辞関係などの第１のレベルと、構造またはスキーマの第２のレベルとを含む。談話パーサーまたは他のコンピュータソフトウェアは、テキストを談話ツリーにパース（構文解析）することができる。

修辞構造理論は、テキストの部分間の関係に依存して、テキストの論理的構成（書き手によって用いられる構造）をモデル化する。ＲＳＴは、談話ツリーを介してテキストの階層型の接続された構造を形成することによって、テキスト一貫性をシミュレートする。修辞関係は、同等のクラスおよび下位のクラスに分割される。これらの関係は、２つ以上のテキストスパンにわたって維持されるので、一貫性を実現する。これらのテキストスパンを基本談話単位（ＥＤＵ）と称する。センテンス中の節およびテキスト中のセンテンスは、著者によって論理的に接続される。所与のセンテンスの意味は前のセンテンスおよび次のセンテンスの意味と関係がある。節同士の間のこの論理関係はテキストの一貫性構造と称される。ＲＳＴは、ツリー状の談話構造、談話ツリー（discourse tree：ＤＴ）に基づいた、談話について最も普及している理論のうちの１つである。ＤＴの葉部は、ＥＤＵ（連続する原子的なテキストスパン）に対応する。隣接するＥＤＵは、より高いレベルの談話単位を形成する一貫性関係（たとえば、属性、シーケンス）によって接続されている。これらの単位は、さらに、この関係リンクにも従属する。関係によってリンクされたＥＤＵは、さらに、それぞれの相対的重要性に基づいて区別される。核は関係の核心部分であり、衛星は周辺部分である。上述したように、正確な要求・応答ペアを判断するために、トピックおよび修辞学的合致がともに分析される。話し手がフレーズまたはセンテンスなどの質問に回答するとき、話し手の回答はこの質問のトピックに対処していなければならない。質問が暗示的に形成されている場合、メッセージのシードテキストを介することで、トピックを維持するだけでなくこのシードについての一般化された認識状態とも一致するような適切な回答が期待される。

修辞関係
論じられるように、本明細書に記載される局面は、仮想談話ツリーを使用する。修辞関
係は、異なる態様で記述することができる。例えば、MannおよびThompsonは、２３の可能な関係について記載している。William C. Mann, William & Thompson, Sandra. (1987) (“Mann and Thompson”). Maite “Rhetorical structure theory: A Theory of Text organization,” Text-Interdisciplinary Journal for the Study of Discourse, 8(3):243-281, 1988を参照されたい。他の数の関係も可能である。

いくつかの経験的研究は、大多数のテキストが核－衛星関係を用いて構築されていることを前提としている。MannおよびThompson 1988を参照されたい。しかしながら、他の関
係は、核の有限選択を伴わない。このような関係の例を以下に示す。

図２は、一局面に従った談話ツリーの例を示す。図２は談話ツリー２００を含む。談話ツリーは、テキストスパン２０１、テキストスパン２０２、テキストスパン２０３、関係２１０、および関係２２８を含む。図２における数は３つのテキストスパンに対応する。図３は、１、２、３と番号付けられた３つのテキストスパン付きの以下のテキスト例に相当する。

１．ホノルル（ハワイ）はハワイの歴史に関する２０１７年の会議の開催地になるだろう（Honolulu, Hawaii will be site of the 2017 Conference on Hawaiian History）。

２．米国およびアジアから２００人の歴史家が参加することが期待される（It is expected that 200 historians from the U.S. and Asia will attend）。

３．会議はポリネシア人がハワイまでどのように航海したかに関する（The conference
will be concerned with how the Polynesians sailed to Hawaii）。

たとえば、関係２１０または詳述は、テキストスパン２０１とテキストスパン２０２との間の関係を記載する。関係２２８は、テキストスパン２０３とテキストスパン２０４との間の関係（詳述）を示す。示されるように、テキストスパン２０２および２０３はテキストスパン２０１をさらに詳述している。上述の例においては、読み手に会議を通知することが目的であると想定すると、テキストスパン１が核である。テキストスパン２および３は、会議に関するより多くの詳細を提供する。図２において、水平方向に並んだ数（たとえば１－３、１、２、３）は、（場合によってはさらに別のスパンで構成された）テキストのスパンをカバーしており、垂直な線は核または複数の核を示している。曲線は修辞関係（詳述）を表わしており、矢印の方向は衛星から核を指している。テキストスパンのみが、核としてではなく衛星として機能する場合、衛星を削除しても依然としてテキストには一貫性が残るだろう。図２から核を削除する場合、テキストスパン２および３を理解することが困難になる。

図３は、一局面に従った談話ツリーのさらなる例を示す。図３は、構成要素３０１および３０２、テキストスパン３０５～３０７、関係３１０、および関係３２８を含む。関係３１０は、構成要素３０６と構成要素３０５との間、および構成要素３０７と構成要素３０５との間の関係３１０（可能化）を示す。図３は以下のテキストスパンを指している：
１．新しい技術報告の要約は、現在、簡略版辞典付近の蔵書の雑誌領域にあります（The new Tech Report abstracts are now in the journal area of the library near the abridged dictionary）。

２．閲覧に興味のある方はご署名ください（Please sign your name by any means that you would be interested in seeing）。

３．登録の最終日は５月３１日です（Last day for sign-ups is 31 May）。
図から分かるように、関係３２８は、エンティティ３０７とエンティティ３０６との関係、すなわち可能化、を示している。図３は、複数の核を入れ子状にすることができるが、最も核性のある１つのテキストスパンだけが存在することを例示している。

談話ツリーの構築
談話ツリーはさまざまな方法を用いて生成することができる。ＤＴボトムアップ（DT bottom up）を構築するための方法の単純な例は以下のとおりである：
（１）以下の（ａ）および（ｂ）によって談話テキストを複数単位に分割する。

（ａ）単位サイズが分析の目的に応じて変わる可能性がある。
（ｂ）典型的には単位は節である。

（２）各々の単位およびそれぞれの隣接単位を検査する。それらの間に関係が保たれているか？
（３）関係が保たれている場合、その関係に印を付ける。

（４）関係が保たれていない場合、その単位はより高いレベルの関係の境界にある可能性がある。より大きな単位（スパン）同士の間に保たれている関係に注目する。

（５）テキスト中のすべての単位が把握されるまで続ける。
MannおよびThompsonはまた、スキーマ・アプリケーションと呼ばれるブロック構造の構築の第２のレベルを記載している。ＲＳＴにおいては、修辞関係が、テキスト上に直接マッピングされず、それらはスキーマ・アプリケーションと呼ばれる構造上に適合され、これらはさらにテキストに適合される。スキーマ・アプリケーションは、（図４によって示されるような）スキーマと呼ばれる、より単純な構造に由来している。各々のスキーマは、テキストの特定の単位が如何にしてより小さなテキスト単位に分解されるかを示している。修辞構造ツリーまたはＤＴは、スキーマ・アプリケーションの階層システムである。スキーマ・アプリケーションは、いくつかの連続するテキストスパンをリンクさせ、複雑なテキストスパンを作成する。複雑なテキストスパンはさらに、より高レベルのスキーマ・アプリケーションによってリンクされ得る。ＲＳＴの主張によれば、すべての一貫した談話の構造を単一の修辞構造ツリーによって記述することができ、その最上位のスキーマによって談話全体を包含するスパンが作成される。

図４は、一局面に従った例示的なスキーマを示す。図４は、ジョイントスキーマが、核から成るが衛星を含まないアイテムのリストであることを示す。図４はスキーマ４０１～４０６を示す。スキーマ４０１は、テキストスパン４１０とテキストスパン４２８との状況関係を示す。スキーム４０２は、テキストスパン４２０とテキストスパン４２１とのシーケンス関係、およびテキストスパン４２１とテキストスパン４２２とのシーケンス関係を示す。スキーマ４０３は、テキストスパン４３０とテキストスパン４３１との対比関係を示す。スキーマ４０４は、テキストスパン４４０とテキストスパン４４１とのジョイント関係を示す。スキーマ４０５は、４５０と４５１との動機づけ関係、および４５２と４５１との可能化関係を示す。スキーマ４０６は、テキストスパン４６０とテキストスパン４６２とのジョイント関係を示す。ジョイント方式の一例が、以下の３つのテキストスパンに関して図４に示される。

１．本日、ニューヨーク首都圏における天候は部分的に晴天となるでしょう（Skies wi
ll be partly sunny in the New York metropolitan area today）。

２．温度は華氏８０度半ばで湿度はより高くなるでしょう（It will be more humid, with temperatures in the middle 80's）。

３．今晩、おおむね曇りとなり、華氏６５度から７０度と低温になるでしょう（Tonight will be mostly cloudy, with the low temperature between 65 and 70）。

図２～図４は、談話ツリーをいくつかのグラフで表示しているが、他の表現も可能である。

図５は、一局面に従った階層型バイナリツリーのノードリンク表現を示す。図６から分かるように、ＤＴの葉部は基本談話単位（ＥＤＵ）と呼ばれる、連続するが重複しないテキストスパンに相当する。隣接するＥＤＵ同士は、関係（たとえば詳述、属性…）によって接続されており、関係によって接続されるより大きな談話単位を形成している。「ＲＳＴにおける談話分析は２つのサブタスクを含む。談話セグメンテーションはＥＤＵを識別するタスクであり、談話構文解析は、談話単位をラベル付けされたツリーにリンクするタスクである。」
図５は、ツリー上の葉部または終端ノードであるテキストスパンを示しており、図６に示されるテキスト全体に現われる順序で番号付けされている。図５はツリー５００を含む。ツリー５００は、たとえばノード５０１～５０７を含む。ノードは関係性を示す。ノードは、ノード５０１などの非終端ノードまたはノード５０２～５０７などの終端ノードである。図から分かるように、ノード５０３および５０４はジョイントの関係性によって関連づけられている。ノード５０２、５０５、５０６および５０８は核である。点線は、ブランチまたはテキストスパンが衛星であることを示している。これらの関係は灰色のボックスにおけるノードである。図６は、一局面に従った、図５における表現についての例示的なインデントされたテキストエンコーディングを示す。図６はコンピュータプログラミングにより適用し易いテキスト６００を含む。「Ｎ」は核であり、「Ｓ」は衛星である。

談話パーサの例
自動的な談話セグメンテーションはさまざまな方法で実行することができる。たとえば、或るセンテンスを想定すると、セグメンテーションモデルは、センテンスにおける各々の特定のトークンの前に境界が挿入されるべきであるかどうかを予測することによって、複合的な基本談話単位の境界を識別する。たとえば、１つのフレームワークは、センテンス内の各トークンを連続的に独立して考慮に入れる。このフレームワークにおいては、セグメンテーションモデルは、トークンによってセンテンストークンをスキャンし、サポートベクトルマシンまたはロジスティック回帰などの二進法分類を用いて、検査されているトークンの前に境界を挿入することが適切であるかどうかを予測する。別の例においては、タスクは連続的にラベル付けする際の問題である。テキストが基本談話単位にセグメント化されると、センテンスレベルの談話構文解析を実行して談話ツリーを構築することができる。機械学習技術を用いることができる。

本発明の一局面においては、構成要素の構文に依拠するCoreNLPProcessorおよび依存性構文を用いるFastNLPProcessorという２つの修辞構造理論（ＲＳＴ）談話パーサが用いられる。それらは、Mihai Surdeanu, Thomas Hicks, and Marco A. Valenzuela-Escarcega."Two Practical Rhetorical Structure Theory Parsers," Proceedings of the Conference of the North American Chapter of the Association for Computational Linguistics - Human Language Technologies: Software Demonstrations (NAACL HLT), 2015に記載されている。

加えて、上述の２つの談話パーサ、すなわち、CoreNLPProcessorおよびFastNLPProcessorは、自然言語処理（Natural Language Processing：ＮＬＰ）を構文解析に用いる。た
とえば、Stanford CoreNLPは、会社、人々などの名前であろうとなかろうとスピーチの部分である複数単語の基本形状を提示し、日付、時間および数値量を標準化し、フレーズおよび構文依存の点からセンテンスの構造に印を付け、どの名詞句が同じエンティティを指しているかを示す。実際には、ＲＳＴは依然として、談話の多くの場合に機能し得る理論であるが、場合によっては機能しない可能性もある。どんなＥＤＵが一貫したテキスト中にあるか、すなわち、どんな談話セグメンタが用いられているか、どんな関係のインベントリが用いられているか、ＥＤＵのためにどんな関係が選択されているか、トレーニングおよびテストのために用いられるドキュメントのコーパス、さらには、どんなパーサが用いられているか、を含むがこれらに限定されない多くの変数が存在している。このため、たとえば、Surdeanu他による上述の論文「Two Practical Rhetorical Structure Theory Parsers」においては、どのパーサがよりよい性能を与えるかを判断するために、特化さ
れたメトリクスを用いて特定のコーパス上でテストを実行しなければならない。このため、予測可能な結果をもたらすコンピュータ言語パーサとは異なり、談話パーサ（およびセグメンタ）は、トレーニングおよび／またはテストのテキストコーパスに応じて、予測不可能な結果をもたらす可能性がある。したがって、談話ツリーは、予測可能な技術（たとえば、コンパイラ）と（たとえば、どの組合わせが所望の結果をもたらし得るかを判断するのに実験が必要となる化学のような）予測不可能な技術とを混合したものとなる。

談話分析が如何に優れているかを客観的に判断するために、たとえば、Daniel Marcuの「The Theory and Practice of Discourse Parsing and Summarization」MIT Press, November 2000, ISBN: 9780262123722によるPrecision/Recall/F1（精度／再現度／Ｆ１）測定基準などの一連のメトリクスが用いられている。精度または肯定的な予測値は検索されたインスタンス中の関連するインスタンスのごく一部であるとともに、（感度としても公知である）再現度は、関連するインスタンスの総量にわたって検索された関連するインスタンスのごく一部である。したがって、精度および再現度はともに、関連性についての理解および基準に基づいている。写真中の犬を認識するためのコンピュータプログラムが１２匹の犬および何匹かの猫を含む写真中に８匹の犬を識別すると想定する。識別された８匹の犬のうち、５匹は実際に犬（真陽性）であるが残りは猫（擬陽性）である。プログラムの精度は５／８であり、その再現度は５／１２である。検索エンジンが３０ページを戻すがそのうち２０ページしか関連しておらず、追加の関連する４０ページを戻してこなかった場合、その精度は２０／３０＝２／３であり、その再現度は２０／６０＝１／３である。したがって、この場合、精度は「検索結果がどれくらい有用であるか」であり、再現度は、「結果はどれくらい完全であるか」である。Ｆ１スコア（Ｆ－スコアまたはＦ－基準）はテストの精度の基準である。それは、スコアを計算するためにテストの精度および再現度の両方を考慮に入れる。Ｆ１＝２ｘ（精度ｘ再現度）／（精度＋再現度））であり、精度と再現度との調和平均である。Ｆ１スコアは、１（完全な精度および再現度）でその最適値に達し、０で最悪値に達する。

自律型エージェントまたはチャットボット
人Ａと人Ｂとの間の会話は談話の一形式である。たとえば、FaceBook（登録商標）メッセンジャ、WhatsApp（登録商標）、Slack（登録商標）、ＳＭＳなどのアプリケーション
が存在し、ＡとＢとの間の会話は、典型的には、より従来型の電子メールおよび音声会話に加えて、メッセージを介するものであってもよい。（知的なボットまたは仮想アシスタントなどと称されることもある）チャットボットは、「知的な」マシンであって、たとえば、人Ｂと置き換わって、２人の人同士の間の会話をさまざまな程度に模倣する。究極の目的の一例としては、人Ａは、Ｂが人であるかまたはマシンであるかどうか区別できないようにすることである（１９５０年にAlan Turingによって開発されたチューリング（Turning）テスト）。談話分析、機械学習を含む人工知能および自然言語処理は、チューリン
グテストに合格するという長期目標に向かって大きく発展してきた。当然ながら、コンピュータにより、莫大なデータのリポジトリを検索および処理して、予測的分析を含めるようにデータに対して複雑な分析を行うことも次第に可能になってきており、長期目標は、人のようなチャットボットとコンピュータとを組合わせることである。

たとえば、ユーザは、会話のやり取りによってインテリジェント・ボット・プラットホームと対話することができる。会話型ユーザインターフェイス（user interface：ＵＩ）と呼ばれるこの対話は、ちょうど２人の人の間で交わされるようなエンドユーザとチャットボットとの間のダイアログである。これは、エンドユーザがチャットボットに「Hello
（こんにちは）」と発言し、チャットボットが「Hi（やあ）」と返答し、さらにチャットボットが用件が何かをユーザに尋ねる、という程度に単純であり得るか、または、１つの口座から別の口座に送金するなどの銀行業務チャットボットによる業務処理上の対話であり得るか、または、休暇バランスをチェックするなどのＨＲチャットボットでの情報のやり取り、もしくは、返品を如何に処理するかなどの小売りチャットボットでのＦＡＱへの質問であり得る。他のアプローチと組み合わされた自然言語処理（ＮＬＰ）および機械学習（machine learning：ＭＬ）アルゴリズムを用いて、エンドユーザの意図を分類することができる。高レベルの意図はエンドユーザが達成したいこと（たとえば、勘定残高を得て購入する）である。意図は、本質的には、バックエンドが実行すべき作業の単位に入力された顧客のマッピングである。したがって、チャットボットでユーザによって発せられたフレーズに基づいて、これらは、たとえば、残高照会、送金および支出の追跡のための特定の別個の使用事例または作業単位に対してマッピングされるものであり、エンドユーザが自然言語で入力する自由なテキストエントリからどの作業単位がトリガされなければならないかをチャットボットがサポートして解決することができるはずであるすべての「使用事例」である。

ＡＩチャットボットに人のように応答させるための根本的な原理は、人の脳が要求を策定して理解することができるとともに、さらに、マシンよりもはるかに優れた人の要求に対して優れた応答を返すことができる点にある。したがって、人Ｂが模倣される場合、チャットボットの要求／応答は著しく改善されていなければならない。そうすると、この問題の最初の部分は、人の脳が要求を如何に策定して理解するかである。模倣のためにモデルが用いられる。ＲＳＴおよびＤＴは、これを実行する形式的かつ反復可能な方法を可能にする。

高レベルでは、典型的には、２つのタイプの要求がある。具体的には、（１）何らかの行動を実行するようにとの要求、および（２）情報についての要求（たとえば質問）である。第１のタイプは、作業単位が作成される応答を有する。第２のタイプは、質問に対する応答（すなわち、たとえば、優れた回答）を有する。回答は、たとえばいくつかの局面において、広範囲な知識ベースから、または、インターネットもしくはイントラネットまたは他の公的または私的に利用可能なデータソースを探索することによって最適な既存の回答に一致させることから、回答を構築するＡＩの形を取り得る。

要求および応答のペアの分析
図７は、一局面に従った、財産税に関する要求例についての例示的なＤＴを示す。ノードラベルは関係であり、矢印付きの線は衛星を指している。核は実線である。図７は以下のテキストを示す。

要求：「My husbands' grandmother gave him his grandfather's truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck. By the time it came to sending
off the title and getting the tag, I didn't have the money to do so. Now, due to
circumstances, I am not going to be able to afford the truck. I went to the insurance place and was refused a refund. I am just wondering that since I am not going to have a tag on this truck, is it possible to get the property tax refunded？（私の夫の祖母が彼に彼の祖父のトラックを与えました。彼女は所有権を譲渡しまし
たが、私の夫には自身の免許に対する未払いの罰金があったため、彼はトラックを自身の名義に入れることができませんでした。私は自分の名義に入れたかったので、財産税を納付し、トラック用の保険に入りました。所有権を取り寄せて識別票を得るときには、私はそうするだけのお金を持っていませんでした。現在、状況によっては、私はトラックを所有するだけの余裕がなくなるでしょう。私は保険代理店を訪れましたが、払い戻しは拒否されました。私は、このトラックに識別票を付けることができないのであれば、財産税を払い戻してもらうことができるのではないかと考えています）」。

応答：「The property tax is assessed on property that you own. Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax. If you apply late, there will be penalties on top of the normal taxes and fees. You don't need to register it at the same time, but you absolutely need to title it within the period of time stipulated in state law（財産税は、あなたが所有する財
産に課されるものです。あなたがそれを登録しないことを選択しただけですので、これは、あなたがそれを所有していないことを意味するものではありません。したがいまして、税を払い戻すことはできません。あなたがまだ乗物の権利を得ていないとしても、あなたは依然として課税区画の境界内に当該乗物を所有していますので、税金を払わなくてはなりません。なお、いずれの州においても、所有権の譲渡および利用税の納付のためにあなたに与えられている時間には制限があることに留意してください。あなたの申請が遅れた場合には、普通税および通常料金に加えて罰金が課されることになるでしょう。あなたは、乗物を同時に登録する必要はありませんが、州の法律で規定された期間内に確実にその権利を得る必要があります）」
上述のテキストを分析することにより、以下が得られる。「My husbands' grandmother
gave him his grandfather's truck」は、「I wanted to put in my name」、「and paid the property tax」、および「and got insurance for the truck」という表現によっ
て詳述される「having unpaid fines on his license, he was not able to get the truck put in his name」によって詳述される「She signed the title over but due to my husband」という表現によって詳述される。

「My husbands' grandmother gave him his grandfather's truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck.」は、「it came to sending off the title」および「and getting the tag」によって詳述される「By the time」と対比される「to do so」によって詳述される「I didn't have the money」によって詳述される。

「My husbands' grandmother gave him his grandfather's truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck. By the time it came to sending off the title and getting the tag, I didn't have the money to do so」は、「I went to the insurance place」および「and was refused a refund」によって詳述される「I am n
ot going to be able to afford the truck」によって詳述される「Now, due to circumstances,」と対比される。

「My husbands' grandmother gave him his grandfather's truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck. By the time it came to sending off the title and getting the tag, I didn't have the money to do so. Now, due to circumstances, I am not going to be able to afford the truck. I went to the insurance
place and was refused a refund.」は、「I am just wondering that since I am not going to have a tag on this truck, is it possible to get the property tax refunded？」で詳述されている。

「I am just wondering」は、「since I am not going to have a tag on this truck
」という条件を有する「is it possible to get the property tax refunded？」と同じ
単位である「that」に属している。

以上のように、トピックの主な主題は「自動車に対する財産税」である。質問は、一方では、すべての所有物は課税可能であるというのに対して、他方では、所有権がいくらか不完全であるという矛盾を含んでいる。好適な応答により、質問のトピックに対処するとともに矛盾を明確にしなければならない。このために、応答者は、登録状態に関係なく所有されるものすべてに関して税金を納付する必要性についてさらに強い請求を行なっている。この例は、Ｙａｈｏｏ（登録商標）！Ａｎｓｗｅｒｓの評価ドメインから得られる肯定的なトレーニングセットの一要素である。トピックの主な主題は「自動車に対する財産税」である。質問は、一方では、所有物はすべて課税可能であるのに対して、他方では、所有権はいくらか不完全であるという矛盾を含んでいる。好適な回答／応答により、質問のトピックに対処するとともに矛盾を明確にしなければならない。読み手は、質問が対比の修辞関係を含んでいるので、納得させるために同様の関係で回答をこの質問と一致させなければならないことに気付き得る。他の場合には、この回答はその分野のエキスパートでない人々にとっても不完全に見えるだろう。

図８は、本発明の特定の局面に従った、図７に表わされた質問についての例示的な応答を示す。中心核は、「that you own」によって詳述される「The property tax is assessed on property」である。「The property tax is assessed on property that you own
」はまた、「Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle
yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax」によって詳述される核である。

核である「The property tax is assessed on property that you own. Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax.」
は、「If you apply late,」という条件付きの「there will be penalties on top of the normal taxes and fees」によって詳述される。これは、さらに、「but you absolutely need to title it within the period of time stipulated in state law」および「You don't need to register it at the same time」という対比によって詳述される。

図７のＤＴと図８のＤＴとを比較することで、応答（図８）を要求（図７）と如何に適切に一致させるかを判断することが可能となる。本発明のいくつかの局面においては、上述のフレームワークは、ＤＴ間の要求／応答および修辞学的合致についてＤＴを判断するために、少なくとも部分的に用いられる。

図９は、一局面に従った公式の回答についての談話ツリーを示す。図９に示されるように、公式回答または声明は、「The Investigative Committee of the Russian Federation is the main federal investigating authority which operates as Russia's Anti-corruption agency and has statutory responsibility for inspecting the police forces, combating police corruption and police misconduct, is responsible for conducting investigations into local authorities and federal governmental bodies.（ロシア連邦の調査委員会は主たる連邦捜査機関であって、ロシアの汚職防止機関として機能するとともに、警察を監査して警察の汚職および警察の違法行動を根絶するための法定上の責任を有しており、地方自治体および連邦行政体の調査を行なう責任を負っている）」と述べている。

図１０は、一局面に従った未処理の回答についての談話ツリーを示す。図１０に示されるように、別の、場合によってはより正直な回答は以下のとおりである。「Investigative Committee of the Russian Federation is supposed to fight corruption. However, top-rank officers of the Investigative Committee of the Russian Federation are charged with creation of a criminal community. Not only that, but their involvement in large bribes, money laundering, obstruction of justice, abuse of power, extortion, and racketeering has been reported. Due to the activities of these officers, dozens of high-profile cases including the ones against criminal lords had
been ultimately ruined.（ロシア連邦の調査委員会は汚職と戦うよう想定されている。しかしながら、ロシア連邦の調査委員会のトップランクの高官は、犯罪集団の設立の役割を担っている。それだけでなく、これらの高官らが大規模な賄賂、マネーロンダリング、司法妨害、職権乱用、恐喝およびゆすりに関与していることが報告されてきた。これらの職員の活動により、犯罪の大物に関する事例を含むとともに注目を集めた数十の事例は最終的に台無しにされた。」
回答の選択は文脈に依存する。修辞構造は、「公式の（official）」、「政治的に正しい（politically correct）」テンプレートベースの回答と、「実際の（actual）」、「
未処理の（raw）」、「現場からの報告（reports from the field）」または「論争の的
となる（controversial）」回答とを区別することを可能にする（図９および図１０を参
照されたい）。時として、質問自体は、どのカテゴリの回答が期待されているかについてのヒントを与えることができる。質問が、第２の意味を持たない類事実または定義的性質をもつ質問として策定されている場合、第１のカテゴリーの回答が適している。他の場合には、質問が、「それが実際に何であるかを私に伝える」という意味を有する場合、第２のカテゴリが適している。一般に、質問から修辞構造を抽出した後、同様の修辞構造、一致した修辞構造、または補足的な修辞構造を有するであろう適切な回答を選択することはより容易である。

公式の回答は、テキストが含む可能性のある議論の点から見て中立的である詳述およびジョイントに基づいている（図９を参照）。同時に、未処理の回答は対比関係を含んでいる。エージェントが行うと予想されるものについてのフレーズと、このエージェントが行ったと判明したことについてのフレーズとのこの関係が抽出される。

要求・応答ペアの分類
修辞学的合致アプリケーション１１２は、回答データベース１０５または公衆データベースから取得された回答などの所与の回答または応答が所与の質問または要求に応答する
かどうかを判断することができる。より具体的には、修辞学的合致アプリケーション１１２は、（ｉ）要求と応答との間の関連性または（ｉｉ）要求と応答との間の修辞学的合致の一方または両方を判断することによって、要求および応答のペアが正しいか、または正しくないかを分析する。修辞学的合致は、関連性を考慮することなく分析することができ、それは直交的に扱うことができる。

修辞学的合致アプリケーション１１２は、異なる方法を使用して質問・回答ペア間の類似性を判断することができる。例えば、修辞学的合致アプリケーション１１２は、個々の質問と個々の回答との間の類似性のレベルを判断することができる。代替的に、修辞学的合致アプリケーション１１２は、質問および回答を含む第１のペアと、質問および回答を含む第２のペアとの間の類似性の尺度を判断することができる。

例えば、修辞学的合致アプリケーション１１２は、一致または不一致の回答を予測するようにトレーニングされた修辞学的合致分類器１２０を使用する。修辞学的合致アプリケーション１１２は、一度に２つのペア、例えば＜ｑ１，ａ１＞および＜ｑ２，ａ２＞を処理することができる。修辞学的合致アプリケーション１１２は、ｑ１をｑ２と比較し、ａ１をａ１と比較し、組み合わされた類似性スコアを生成する。このような比較は、既知のラベルを有する別の質問／回答ペアからの距離を評価することによって、未知の質問／回答ペアが正しい回答を含むかどうかの判断を可能にする。特に、ラベル付けされていないペア＜ｑ２，ａ２＞は、ｑ２およびａ２によって共有される単語または構造に基づく正しさを「推測する」のではなく、ｑ２およびａ２の両方が、そのような単語または構造の理由で、ラベル付けされたペア＜ｑ２，ａ２＞のそれらの対応する成分ｑ１およびａ２と比較されることができるように、処理することができる。このアプローチは、回答の、ドメインに依存しない分類を対象とするので、回答の意味ではなく、質問と回答との間の構造的結合性だけを活用することができる。

一局面では、修辞学的合致アプリケーション１１２は、トレーニングデータ１２５を使用して、修辞学的合致分類器１２０をトレーニングする。このようにして、修辞学的合致分類器１２０は質問と回答とのペア間の類似性を判断するようにトレーニングされる。これは分類問題である。トレーニングデータ１２５は、肯定的なトレーニングセットおよび否定的なトレーニングセットを含むことができる。トレーニングデータ１２５は、肯定的なデータセットにおける一致する要求・応答ペアと、否定的なデータセットにおける任意もしくはより低い関連性または適切性要求・応答ペアとを含む。肯定的なデータセットについては、回答または応答が質問に適しているかどうかを示す別個の受容基準を有する様々なドメインが選択される。

各トレーニングデータセットは、トレーニングペアのセットを含む。各トレーニングセットは、質問を表す質問コミュニケーション用談話ツリーと、回答および質問と回答との間の予想される相補性のレベルを表す回答コミュニケーション用談話ツリーとを含む。反復プロセスを使用することによって、修辞学的合致アプリケーション１１２は、トレーニングペアを修辞学的合致分類器１２０に提供し、モデルから相補性のレベルを受け取る。修辞学的合致アプリケーション１１２は、特定のトレーニングペアについて、判断された相補性のレベルと予想される相補性のレベルとの差を判断することによって、損失関数を計算する。損失関数に基づいて、修辞学的合致アプリケーション１１２は、損失関数を最小化するように分類モデルの内部パラメータを調整する。

受容基準は、用途によって異なり得る。例えば、コミュニティ質問回答、自動質問回答、自動および手動顧客サポートシステム、ソーシャルネットワーク通信、ならびにレビューおよびクレームなど、消費者などの個人による、製品を用いた体験に関する書込みについては、受容基準は低くてもよい。ＲＲ受容基準は、科学文献、専門的ジャーナリズム、
ＦＡＱ形式の健康文書および法的文書、「stackoverflow」のような専門的なソーシャル
ネットワークにおいては、高くてもよい。

コミュニケーション用談話ツリー（ＣＤＴ）
修辞学的合致アプリケーション１１２は、コミュニケーション用談話ツリーを作成し、分析し、比較することができる。コミュニケーション用談話ツリーは、修辞情報を発話動作構造と組合わせるように設計されている。ＣＤＴは、コミュニケーション行動についての表現でラベル付けされた円弧を含む。コミュニケーション行動を組合わせることにより、ＣＤＴは、ＲＳＴ関係およびコミュニケーション行動のモデリングを可能にする。ＣＤＴはパース交錯の縮図である。Galitsky、B. Ilvovsky、D. Kuznetsov SOによる「Rhetoric Map of an Answer to Compound Queries Knowledge Trail Inc. ACL 2015，681-686（Galitsky（２０１５））を参照されたい。パース交錯は、センテンスについてのパースツリーを１つのグラフにおけるセンテンスの単語と部分との談話レベル関係と組合わせたものである。発話動作を識別するラベルを組込むことにより、コミュニケーション用談話ツリーの学習が、基本談話単位（ＥＤＵ）の構文および適正な修辞関係よりもより豊富な特徴セットにわたって実行可能となる。

一例においては、民間航空機であるマレーシア航空会社１７便の撃墜の原因に関して３つの当事者間でなされた議論が分析される。やり取りされている議論のＲＳＴ表現が構築される。この例においては、３つの相争っているエージェントであるオランダの調査員、ロシア連邦の調査委員会および自称ドニエツク人民共和国が問題に関する彼らの意見を交換している。この例が示している論争の的になっている対立においては、各々の当事者が皆それぞれの相手方を非難する恐れがある。より説得力があるように思わせるために、各々の当事者は自身の請求を行うだけではなく、相手方の請求を拒絶するように応答を策定している。この目的を達成するために、各々の当事者は、相手方の請求のスタイルおよび談話と一致させるよう試みる。

図１１は、一局面に従った、第１のエージェントの請求についてのコミュニケーション用談話ツリーを示す。図１１は、以下のテキストを表わすコミュニケーション用談話ツリー１００を示す。「Dutch accident investigators say that evidence points to pro-Russian rebels as being responsible for shooting down plane. The report indicates
where the missile was fired from and identifies who was in control of the territory and pins the downing of MH17 on the pro-Russian rebels.（オランダの事故調査員は、証拠が、飛行機の撃墜をロシア支持派の反乱分子によるものであると示唆していると述べている。この報告書は、ミサイルが発射された場所を示しており、誰が領域を制圧していたかを識別し、ＭＨ１７の撃墜の責任をロシア支持派の反乱分子に負わせている。）」
図１１から分かるように、ＣＤＴの非終端ノードは修辞関係であり、終端ノードは、これらの関係の主題である基本談話単位（フレーズ、センテンスフラグメント）である。ＣＤＴのいくつかの円弧は、行動者であるエージェント、およびこれらの行動の主題（やり取りされていること）を含むコミュニケーション行動についての表現でラベル付けされている。たとえば、（左側の）詳細関係についての核ノードは、say（Dutch, evidence）でラベル付けされており、衛星は、responsible（rebels, shooting down）でラベル付けされている。これらのラベルは、ＥＤＵの主題がevidence（証拠）およびshooting down（
撃墜）であることを表すように意図されたものではなく、このＣＤＴと他のものとの間の類似性を見出す目的でこのＣＤＴを他のものと一致させるように意図されている。この場合、コミュニケーション用談話の情報を提供するのではなく修辞関係によってこれらのコミュニケーション行動を単にリンクさせることは、あまりに制限され過ぎていて、やり取りされている物およびその方法についての構造を表わすことができない。同じ修辞関係または調整された修辞関係を有するべきというＲＲペアについての要件は弱すぎるため、ノ
ード同士を一致させることに加えて円弧に関するＣＤＴラベル同士を合致させることが必要となる。

このグラフの真っ直ぐなエッジは構文関係であり、湾曲した円弧は、前方照応、同じエンティティ、サブエンティティ、修辞関係およびコミュニケーション行動などの談話関係である。このグラフは、単なる個々のセンテンスについてのパースツリーの組合わせよりもはるかに豊富な情報を含んでいる。ＣＤＴに加えて、パース交錯は、単語、関係、フレーズおよびセンテンスのレベルで一般化することができる。発話行動は、それぞれの発話動作およびそれらの主題に関与するエージェントを表わす論理述語である。論理述語の議論は、ＶｅｒｂＮｅｔなどのフレームワークによって提案されるように、それぞれの意味役割に従って形成される。Karin Kipper、Anna Korhonen、Neville Ryant、Martha Palmerによる「A Large-scale Classification of English Verbs」（Language Resources and
Evaluation Journal, 42(1), 21-40,Springer Netherland, 2008）を参照されたい。お
よび／または、Karin Kipper Schuler、Anna Korhonen、Susan W. Brownによる「ＶerbNet overview, extensions, mappings and apps」（Tutorial, NAACL-HLT: 2009, Boulder,
Colorado）を参照されたい。

図１２は、一局面に従った、第２のエージェントの請求についてのコミュニケーション用談話ツリーを示す。図１２は、以下のテキストを表わすコミュニケーション用談話ツリー１２００を示す。「The Investigative Committee of the Russian Federation believes that the plane was hit by a missile, which was not produced in Russia. The committee cites an investigation that established the type of the missile.（ロシア連邦の調査委員会は、飛行機がロシアで生産されたものではないミサイルによって攻撃されたと信じている。委員会は、ミサイルの種類を立証した調査を引用している。）」
図１３は、一局面に従った、第３のエージェントの請求についてのコミュニケーション用談話ツリーを示す。図１３は、以下のテキストを表わすコミュニケーション用談話ツリー１３００を示す。「Rebels, the self-proclaimed Donetsk People's Republic, deny that they controlled the territory from which the missile was allegedly fired. It became possible only after three months after the tragedy to say if rebels controlled one or another town.（反乱分子である自称ドニエツク人民共和国は、彼らが、ミサイルが発射されたと主張されている領域を制圧していたことを否定している。反乱分子が或る町または別の町を制圧していたかどうかは、悲劇の後に３か月経った後にしか発表することができなかった。）」
コミュニケーション用談話ツリー１１００～１３００から分かるように、応答は任意ではない。応答は、元のテキストと同じエンティティについて述べている。たとえば、コミュニケーション用談話ツリー１２００および１３００はコミュニケーション用談話ツリー１１００に関係している。応答は、これらのエンティティについての、かつこれらのエンティティの行動についての、推定および感情との不合致を裏づけしている。

より具体的には、関与するエージェントの返答は、第１のシードメッセージのコミュニケーション用談話を反映させる必要がある。単純な観察結果として、第１のエージェントが自身の請求を伝えるための属性を用いるので、他のエージェントは、その一式に従って、彼ら自身の属性を提供するかもしくは支持者の属性の有効性を攻撃するかまたはこれらの両方を行う。シードメッセージのコミュニケーション構造を如何にして連続メッセージに保持する必要があるかについて、広くさまざまな特徴を捕らえるために、それぞれのＣＤＴのペアを学習することができる。

要求・応答の合致を検証するためには、談話関係または発話動作（コミュニケーション行動）だけではしばしば不十分である。図１１～図１３に示される例からから分かるように、エージェント間の対話の談話構造および対話の種類は有用である。しかしながら、対
話のドメイン（たとえば、軍事衝突もしくは政治）またはこれらの対話の主題（つまりエンティティ）を分析する必要はない。

修辞関係およびコミュニケーション行動の表現
抽象的な構造同士の間の類似性を演算するために、２つのアプローチがしばしば用いられる。（１）これらの構造を数値空間で表わすとともに類似性を数として表す（統計学習アプローチ）；または、（２）数値空間ではなくツリーおよびグラフなどの構造表現を用いて、最大の共通サブ構造として類似性を表現する。最大の共通サブ構造として類似性を表わすことは一般化と称される。

コミュニケーション行動を学習することは、議論の表現および理解を助ける。計算用動詞レキシコンは、行動についてのエンティティの取得をサポートするとともに、それらの意味を示すためにルールベースの形式を提供するのを助ける。動詞は、記載されているイベントのセマンティックスとともに、そのイベントにおける関与者間の関係情報を表わして、その情報をエンコードする構文構造を投影している。動詞、特にコミュニケーション行動動詞は極めて変動し易く、豊富な範囲の意味論的挙動を表示することができる。これに応じて、動詞分類は、学習システムが、コアの意味論的特性を共有している動詞をグループごとに組織化することによって、この複雑さに対処することを助ける。

ＶｅｒｂＮｅｔはこのような１レキシコンであって、各々のクラス内における動詞の意味論的役割および構文的パターン特徴を識別するとともに、構文的パターンとクラスのうちすべてのメンバについて推論することができる基礎をなす意味論的関係との間のつながりを明確にする。Karin Kipper、Anna Korhonen、Neville RyantおよびMartha Palmerに
よる「Language Resources and Evaluation」（Vol.42, No. 1 (March 2008） 21）を参
照されたい。クラスについての各々の構文フレームまたは動詞シグネチャは、イベントのコースにわたるイベント関与者間の意味論的関係を詳しく述べる、対応する意味論的表現を有する。

たとえば、「楽しませる（amuse）」という動詞は、驚かせる（amaze）、怒らせる（anger）、何らかの感情を喚起する（arouse）、邪魔する（disturb）、いらいらさせる（irritate）などの議論（意味論的役割）の同様の構造を有する同様の動詞のクラスタの一部である。これらのコミュニケーション行動の議論の役割は、Experiencer（経験者）（通
常、生きている実体）、Stimulus（刺激）およびResult（結果）である。各々の動詞は、この動詞が如何にセンテンスまたはフレーム内に現れているかについての構文特徴によって区別される意味のクラスを有し得る。たとえば、「amuse」のためのフレームは、以下
のとおり、以下の主要な名詞句（ＮＰ）、名詞（Ｎ）、コミュニケーション行動（Ｖ）、動詞句（ＶＰ）、副詞（ＡＤＶ）を用いている。

ＮＰＶＮＰ。例：「教師は子供たちを楽しませた（The teacher amused the children）」。構文：Stimulus V Experiencer。節：amuse(Stimulus, E, Emotion, Experiencer), cause(Stimulus, E), emotional_state(Result(E), Emotion, Experiencer)。

ＮＰＶＡＤＶ-Middle：例：「Small children amuse quickly（小さな子供たちは
直ちに楽しむ）」。構文：Experiencer V ADV。節：amuse(Experiencer, Prop):-, property(Experiencer, Prop), adv(Prop)。

ＮＰＶＮＰ－ＰＲＯ－ＡＲＢ。例「The teacher amused（教師は楽しんだ）」。構文：Stimulus V. amuse(Stimulus, E, Emotion, Experiencer): cause(Stimulus, E), emotional_state(Result(E), Emotion, Experiencer)。

ＮＰcause ＶＮＰ。例「The teacher's dolls amused the children（教師の人形は子供を楽しませた）」。構文：Stimulus <+genitive>('s) V Experiencer。 amuse(Stimulus, E, Emotion, Experiencer): cause(Stimulus, E), emotional_state(during(E), Emotion, Experiencer)。

ＮＰＶＮＰＡＤＪ。例「This performance bored me totally（この性能は私を
完全にうんざりさせた）」。構文：Stimulus V Experiencer Result。amuse(Stimulus, E, Emotion, Experiencer)。cause(Stimulus,E), emotional_state(result(E), Emotion, Experiencer), Pred(result(E), Experiencer)。

コミュニケーション行動は複数のクラスタに特徴付けることができる。たとえば、述語的な補足語を備えた動詞（appoint（指定する）、characterize（特徴付ける）、dub（名称を付ける）、declare（宣言する）、conjecture（推測する）、masquerade（変装する
）、orphan（孤児にする）、captain（キャプテンを務める）、consider（考慮する）、classify（分類する））；知覚動詞（see（見る）、sight（観測する）、peer（凝視する
））；精神状態の動詞（amuse（楽しませる）、admire（賞賛する）、marvel（驚嘆する
）、appeal（アピールする））；要望の動詞（want（欲する）、long（切望する））；判断動詞（judgment（判断））；評価の動詞（assess（評価する）、estimate（推定する））；探索の動詞（hunt（狩る）、search（探索する）、stalk（忍び寄る）、investigate（調査する）、rummage（くまなく探す）、ferret（狩り出す））；社会的対話の動詞（correspond（応答する）、marry（結婚する）、meet（会う）、battle（戦う））；コミュニケーションの動詞（transfer(message)（（メッセージを）伝達する）、inquire（照会する）、interrogate（尋問する）、tell（伝える）、態様（speaking：発話）、talk（
話す）、chat（閑談する）、say（言う）、complain（苦情を訴える）、advise（助言す
る）、confess（告白する）、lecture（講義する）、overstate（誇張する）、promise（約束する））；回避動詞（avoid（回避する））；測定動詞（register（記録する）、cost（費用がかかる）、fit（適合させる）、price（値をつける）、bill（請求する））；
相動詞（begin（開始する）、complete（完成する）、continue（継続する）、stop（止
まる）、establish（確立する）、sustain（維持する））がある。

この明細書中に記載される局面は、統計学習モデルに勝る利点を備えている。統計的な解決策とは対照的に、分類システムを用いる局面は、（修辞学的合致などの）目的の特徴をもたらすと判断される動詞または動詞状構造を提供することができる。たとえば、統計機械学習モデルは、解釈を困難にする可能性のある類似性を数として表わす。

要求・応答ペアの表現
要求・応答ペアを表現することは、或るペアに基づいた分類ベースの動作を促進する。一例においては、要求・応答ペアはパース交錯として表わすことができる。パース交錯は、１つのグラフにおけるセンテンスの単語と部分との間の談話・レベル関係を用いて、２つ以上のセンテンスについてのパースツリーを表わしたものである。Galitsky（２０１５）を参照されたい。質問と回答との間の話題の類似性は、パース交錯の共通のサブグラフとして表わすことができる。共通のグラフノードの数が多ければ多いほど、類似性は高くなる。

図１４は、一局面に従ったパース交錯を示す。図１４は、パースツリー１４０１と対応する応答１４０２についてのパースツリーとを含むパース交錯１４００を示す。

パースツリー１４０１が表している質問は以下のとおりである。「I just had a baby and it looks more like the husband I had my baby with. However it does not look like me at all and I am scared that he was cheating on me with another lady and
I had her kid. This child is the best thing that has ever happened to me and I cannot imagine giving my baby to the real mom.（私は赤ん坊を出産したところで、夫
との間にできたこの赤ん坊が夫により似ているように思えます。でも、赤ん坊は私に全く似ておらず、彼が私を裏切って別の女性と浮気してできた彼女の子供を世話しているのではないかと脅えています。この子供はこれまでに私の身に起こったことのうち最良のことなので、私は本当の母親に赤ん坊を譲り渡すことは想像できません。）」
応答１４０２が表わす応答は以下のとおりである。「Marital therapists advise on dealing with a child being born from an affair as follows. One option is for the husband to avoid contact but just have the basic legal and financial commitments. Another option is to have the wife fully involved and have the baby fully integrated into the family just like a child from a previous marriage.（結婚に関するセラピストは、ある情事から生まれてきた子供への対処について以下のように助言しています。１つのオプションは、夫との接触を避けて、基本的な法的および財政的義務だけを果たさせることです。別のオプションは、妻に十分に関与させて、赤ん坊を前の結婚からできた子供のように家族に完全に溶け込ませることです）」。

図１４は、テキストのパラグラフについての言語情報を表わすための貪欲なアプローチを表わす。このグラフの真っ直ぐなエッジは構文関係であり、湾曲した円弧は、前方照応、同じエンティティ、サブエンティティ、修辞関係およびコミュニケーション行動などの談話関係である。実線の円弧は、同じエンティティ／サブエンティティ／前方照応関係についてのものであり、点線の円弧は修辞関係およびコミュニケーション行動についてのものである。真っ直ぐなエッジにある楕円形のラベルは構文関係を示している。補題はノードのための箱内に書かれており、補題形式はノードの右側に書かれている。

パース交錯１４００は単なる個々のセンテンスについてのパースツリーの組合わせよりはるかに豊富な情報を含んでいる。構文関係についてのエッジおよび談話関係についての円弧に沿ったこのグラフによるナビゲーションは、他のパース交錯と一致させてテキスト類似性評価タスクを実行するために所与のパース交錯を意味論的に等価な形式に変換することを可能にする。パラグラフの完全な形式上の表現を形成するために、可能な限り多くのリンクが表わされる。談話円弧の各々は、潜在的な一致になり得るパースフレーズのペアを生成する。

シード（要求）と応答との間のトピックの類似性はパース交錯の共通のサブグラフとして表わされる。これらは接続されたクラウドとして視覚化される。共通のグラフノードの数が多ければ多いほど、類似性は高くなる。修辞学的合致については、共通のサブグラフは、所与のテキストにある場合には、大きくする必要がない。しかしながら、シードおよび応答の修辞関係およびコミュニケーション行動が相互に関連付けられて、対応関係が必要となる。

コミュニケーション行動についての一般化
２つのコミュニケーション行動Ａ_１とＡ_２との間の類似性は、Ａ_１とＡ_２との間で共通である特徴を所有する抽象動詞として規定される。２つの動詞の類似性を抽象動詞のような構造として定義することにより、修辞学的合致の評価などの帰納的学習タスクがサポートされる。一例においては、agree（合致する）およびdisagree（合致しない）という共
通の２つの動詞間の類似性を以下のように一般化することができる。agree ^ disagree =
verb(Interlocutor, Proposed_action, Speaker）。この場合、Interlocutor（対話）は、Proposed_actionをSpeaker（話し手）に提案した人であって、この人に対してSpeaker
が自身の応答を伝えている。さらに、proposed_actionは、要求または提案を受諾するか
または拒絶する場合にSpeakerが実行するであろう行動であり、Speakerは、特定の行動が提案された対象の人であって、なされた要求または提案に応える人である。

さらに別の例においては、agree（合致する）とexplain（説明する）という動詞間の類似性は以下のとおりとなる：agree ^ explain = verb(Interlocutor, *, Speaker）。コ
ミュニケーション行動の主題はコミュニケーション行動の文脈において一般化されているが、他の「物理的な」行動では一般化されない。したがって、局面は、対応する主題とともにコミュニケーション行動の個々の発生を一般化する。

加えて、ダイアログを表わすコミュニケーション行動のシーケンスは、同様のダイアログの他のこのようなシーケンスと比較することができる。このような態様で、ダイアログの動的な談話構造と同様に個々のコミュニケーション行動の意味も（修辞関係によって反映されるその静的構造とは対照的に）表現される。一般化は各レベルで起こる複合的な構造的表現である。コミュニケーション行動の補題は、補題で一般化されており、その意味的役割はそれぞれの意味的役割で一般化されている。

コミュニケーション行動は、ダイアログまたは対立の構造を示すために、テキストの著者によって用いられる。Searle, J. R.（１９６９）による「Speech acts: an essay in the philosophy of language」（Cambridge University Press）を参照されたい。主題は、これらの行動の文脈において一般化されており、他の「物理的な」行動では一般化されない。したがって、コミュニケーション行動の個々の出現は、それらの主題およびそれらのペアでも談話「ステップ」として一般化される。

ＶｅｒｂＮｅｔなどの動詞フレームと一致させる観点からも、コミュニケーション行動の一般化について考察することができる。コミュニケーション用リンクは、テキストにおける単一のエージェントよりも、参加（または言及）により関連付けられた談話構造を反映している。リンクは、コミュニケーション行動についての単語（人の伝達意図を暗示的に示す動詞または多数の単語）を接続するシーケンスを形成する。

コミュニケーション行動は、行動者と、それら行動者に対して働きかける１つ以上のエージェントと、この行動の特徴を記述するフレーズとを含む。コミュニケーション行動は、形式の機能として記載することができる：動詞（エージェント、主題、原因）。この場合、動詞は、関与するエージェント同士の間における何らかのタイプの対話（たとえば、explain（説明する）、confirm（確認する）、remind（思い出させる）、disagree（合致しない）、deny（否定する）など）を特徴付ける。主題は、伝えられた情報または記載された目的語を指す。原因は、主題についての動機づけまたは説明を指す。

シナリオ（ラベル付きの有向グラフ）は、パース交錯Ｇ＝（Ｖ，Ａ）のサブグラフである。この場合、Ｖ＝｛ａｃｔｉｏｎ_１、ａｃｔｉｏｎ_２、…ａｃｔｉｏｎ_ｎ｝は、コミュニケーション行動に対応する頂点の有限集合であり、Ａは、以下のように分類されるラベル付きの円弧（順序付けされた頂点のペア）の有限集合である。

各々の円弧ａｃｔｉｏｎ_ｉ、ａｃｔｉｏｎ_ｊ∈Ａ_{ｓｅｑｕｅｎｃｅ}は、同じ主題（たとえばｓ_ｊ＝ｓ_ｉまたはさまざまな主題）を参照する２つの行動ｖ_ｉ、ａｇ_ｉ、ｓ_ｉ、ｃ_ｉおよびｖ_ｊ、ａｇ_ｊ、ｓ_ｊ、ｃ_ｊに対応している。各々の円弧ａｃｔｉｏｎ_ｉ、ａｃｔｉｏｎ_ｊ∈Ａ_{ｃａｕｓｅ}は、ａｃｔｉｏｎ_ｉの原因がａｃｔｉｏｎ_ｊの主題または原因と対立していることを示すａｃｔｉｏｎ_ｉとａｃｔｉｏｎ_ｊとの攻撃関係に対応している。

エージェント同士の間の対話のシナリオに関連付けられたパース交錯のサブグラフはいくつかの顕著な特徴を有する。たとえば、（１）すべての頂点は時間で順序づけられており、このため、（最初の頂点および終端の頂点を除いた）すべての頂点には１つの入来する円弧および１つの外向き円弧が存在する。（２）Ａ_{ｓｅｑｕｅｎｃｅ}の円弧の場合、最
大でも１つの入来する円弧および１つの外向き円弧だけが許容される。（３）Ａ_{ｃａｕｓｅ}円弧の場合、入来する多くの円弧だけでなく、所与の頂点からの多くの外向き円弧も存在し得る。関与する頂点は、異なるエージェントまたは同じエージェント（つまりこのエージェントが自分自身と矛盾している場合）に関連付けられてもよい。パース交錯とそれらのコミュニケーション行動との間の類似性を演算するために、誘導されたサブグラフ、円弧の同様のラベルと同じ構成を有するサブグラフおよび頂点の厳密な対応関係が分析される。

以下の類似性は、パース交錯のコミュニケーション行動の円弧を分析することによって存在する。（１）Ｔ２からの主題付き別のコミュニケーション行動に対する、Ｔ１からの主題付き１つのコミュニケーション行動（コミュニケーション行動の円弧は用いられない）、および、（２）Ｔ２からの別のペアのコミュニケーション行動と比較される、Ｔ１からの主題付きの１ペアのコミュニケーション行動（コミュニケーション行動の円弧が用いられる）。

２つの異なるコミュニケーション行動の一般化はそれらの属性に基づいている。Galitsky他（２０１３）を参照されたい。図１４に関連付けて説明した例から分かるように、Ｔ１からの１つのコミュニケーション行動、すなわちcheating(husband, wife, another lady)は、Ｔ２からの第２のコミュニケーション行動、すなわちavoid(husband, contact(husband, another lady)と比較することができる。一般化の結果、communicative_action(husband,*)となり、これにより、所与のエージェント（＝ husband）がＱにおいてＣＡの
主題として言及される場合に、彼（彼女）がＡにおける（場合によっては別の）ＣＡの主題でもあるべきという形式の制約がＡに対して導入される。２つのコミュニケーション行動は常に一般化することができるが、これはそれらの主題の場合には該当しない。それらの一般化の結果が空である場合、これらの主題を備えたコミュニケーション行動の一般化の結果も空となる。

ＲＳＴ関係の一般化
談話ツリー同士の間のいくつかの関係は一般化することができ、同じタイプの関係（対照などの表示関係、条件などの主題関係、およびリストなどの多核の関係）を表わす円弧などは一般化することができる。核または核によって示される状況は、「Ｎ」によって示される。衛星または衛星によって示される状況は、「Ｓ」によって示される。「Ｗ」は書き手を示す。「Ｒ」は読み手（聞き手）を示す。状況は、提案、完了した行動または進行中の行動、ならびにコミュニケーション行動および状態（beliefs（信念）、desires（要望）、approve（承認する）、explain（説明する）、reconcile（和解させる）などを含
む）である。上述のパラメータによる２つのＲＳＴ関係の一般化は以下のように表わされる：
rst1(N1,S1,W1,R1) ^ rst2(N2,S2,W2,R2)=
(rst1 ^ rst2)(N1 ^ N2,S1 ^ S2,W1 ^ W2,R1 ^ R2).
Ｎ１、Ｓ１、Ｗ１、Ｒ１におけるテキストはフレーズとして一般化される。たとえば、rst1 ^ rst2は以下のように一般化することができる。（１）relation_type(rst1)!= relation_type(rst2)である場合、一般化は空である。（２）その他の場合には、修辞関係のシグネチャがセンテンスとして一般化される。

sentence(N1,S1,W1,R1) ^ sentence(N2,S2,W2,R2)
Iruskieta、Mikel、Iria da CunhaおよびMaite Taboadaによる「A qualitative comparison method for rhetorical structures: identifying different discourse structures in multilingual corpora」（Lang Resources & Evaluation. June 2015, Volume 49, Issue 2）を参照されたい。

たとえば、the meaning of rst-background ^ rst-enablement= (S increases the ability of R to comprehend an element in N) ^ (R comprehending S increases the ability of R to perform the action in N) = increase-VB the-DT ability-NN of-IN R-NN to-IN。

また、rst-background ^ rst-enablementの関係はさまざまであるので、ＲＳＴ関係部
分は空である。次いで、それぞれのＲＳＴ関係の動詞的定義である表現が一般化される。たとえば、各々の単語ごとに、またはエージェントなどの単語についてのプレースホルダに関して、この単語（そのＰＯＳを備える）は、その単語が各々の入力されたフレーズにおいて同じであれば保持され、その単語がこれらのフレーズ間で異なっていればその単語を除外する。結果として生ずる表現は、形式的に取得される２つの異なるＲＳＴ関係の定義間で共通の意味として解釈することができる。

図１４に示される質問と回答との間の２つの円弧が、ＲＳＴ関係「ＲＳＴ－対比」に基づいた一般化インスタンスを示す。たとえば、「I just had a baby」は、「it does not
look like me」とのＲＳＴ－対比であり、さらには、「have the basic legal and financial commitments」とのＲＳＴ－対比である「husband to avoid contact」に関連して
いる。上記から分かるように、回答は、質問の動詞句に類似している必要はないが、質問および回答の修辞構造は類似している。回答内のすべてのフレーズが必ずしも質問におけるフレーズと一致するとは限らない。たとえば、一致しないフレーズは、質問におけるフレーズに関連する回答内のフレーズとの特定の修辞関係を有している。

コミュニケーション用談話ツリーの構築
図１５は、一局面に従った、コミュニケーション用談話ツリーを構築するための例示的なプロセスを示す。修辞学的合致アプリケーション１１２はプロセス１５００を実現することができる。上述のように、コミュニケーション用談話ツリーは改善された検索エンジン結果を可能にする。

ブロック１５０１において、プロセス１５００は、フラグメントを含むセンテンスにアクセスすることを伴う。少なくとも１つのフラグメントは、動詞および単語を含み、各単語は、フラグメント内において単語の役割を含み、各フラグメントは、基本談話単位である。例えば、修辞学的合致アプリケーション１１２は、図１３に関して記載されるように「Rebels, the self-proclaimed Donetsk People's Republic, deny that they controlled the territory from which the missile was allegedly fired」のようなセンテンス
にアクセスする。

上述の例に続けて、修辞学的合致アプリケーション１１２は、センテンスがいくつかのフラグメントを含んでいると判断する。たとえば、第１のフラグメントは、「Rebels, …, deny」である。第２のフラグメントは「that they controlled the territory」である。第３のフラグメントは、「from which the missile was allegedly fired」である。各々のフラグメントは、動詞（たとえば、第１のフラグメントについての「deny」および第２のフラグメントについての「controlled」）を含んでいる。ただし、フラグメントは動詞を含んでいる必要はない。

ブロック１５０２では、プロセス１５００は、センテンスフラグメント間の修辞関係を表わす談話ツリーを生成するステップを含む。談話ツリーは複数ノードを含む。各々の非終端ノードは、センテンスフラグメントのうちの２つのセンテンスフラグメント間の修辞関係を表わし、談話ツリーの複数ノードのうちの各終端ノードはセンテンスフラグメントのうちの１つに関連付けられている。

上述の例に続けて、修辞学的合致アプリケーション１１２は図１３に示されるような談話ツリーを生成する。たとえば、第３のフラグメントである「from which the missile was allegedly fired」は、「that they controlled the territory」を詳述している。第２のフラグメントおよび第３のフラグメントはともに、起こった（すなわち、反乱分子が領域を制圧していないのでその攻撃は反乱分子ではあり得なかった）ことの属性に関係している。

ブロック１５０３においては、プロセス１５００は多数の動詞シグネチャにアクセスするステップを含む。たとえば、修辞学的合致アプリケーション１１２は、たとえばＶｅｒｂＮｅｔからの動詞のリストにアクセスする。各々の動詞は、フラグメントの動詞と一致するかまたはフラグメントの動詞と関係がある。たとえば、第１のフラグメントの場合、動詞は「deny」である。したがって、修辞学的合致アプリケーション１１２は、動詞「deny」に関係のある動詞シグネチャのリストにアクセスする。

上述のとおり、各々の動詞シグネチャは、フラグメントの動詞および主題役割の１つ以上を含んでいる。たとえば、シグネチャは、名詞句（ＮＰ）、名詞（Ｎ）、コミュニケーション行動（Ｖ）、動詞句（ＶＰ）または副詞（ＡＤＶ）のうち１つ以上を含む。主題役割は、動詞と関連する単語との関係を記述している。たとえば、「The teacher amused the children」は、「small children amuse quickly」とは異なるシグネチャを有する。
第１のフラグメントである動詞「deny」の場合、修辞学的合致アプリケーション１１２は、フレームのリスト、または、「deny」に一致する動詞についての動詞シグネチャにアクセスする。リストは「NP V NP to be NP」、「NP V that S」、および「NP V NP」である。

各々の動詞シグネチャは主題役割を含む。主題役割は、センテンスフラグメントにおける動詞の役割を指している。修辞学的合致アプリケーション１１２は、各々の動詞シグネチャにおける主題役割を判断する。例示的な主題役割は、「actor」（行動者）、「agent」（エージェント）、「asset」（アセット）、「attribute」（属性）、「beneficiary
」（受益者）、「cause」（原因）、「location destination source」（位置宛先送信元）、「destination」（宛先）、「source」（源）、「location」（位置）、「experiencer」（経験者）、「extent」（程度）、「instrument」（器具）、「material and product」（材料および製品）、「material」（材料）、「product」（製品）、「patient」（患者）、「predicate」（述語）、「recipient」（受取側）、「stimulus」（刺激）、「theme」（テーマ）、「time」（時間）または「topic」（トピック）を含む。

ブロック１５０４において、プロセス１５００は、動詞シグネチャのうちの各動詞シグネチャごとに、フラグメントにおける単語の役割と一致するそれぞれのシグネチャの主題役割の数を判断するステップを含む。第１のフラグメントの場合、修辞学的合致アプリケーション１１２は、動詞「deny」が「agent」、「verb」および「theme」という３つの役割しか持たないと判断する。

ブロック１５０５において、プロセス１５００は、最多数の一致を有する特定の動詞シグネチャに基づいて動詞シグネチャから特定の動詞シグネチャを選択するステップを含む。たとえば、図１３を再び参照すると、第１のフラグメントである「the rebels deny that they controlled the territory」における「deny」は、動詞シグネチャdeny「NP V NP」に一致しており、「control」はcontrol（rebels, territory）に一致している。動詞シグネチャは入れ子状にされており、結果として、「deny(rebel, control(rebel, territory)）」という入れ子状にされたシグネチャが得られる。

仮想談話ツリー
本明細書で説明されるいくつかの局面は、複雑で複数センテンスの収束質問に対する質問回答（Ｑ／Ａ）再現率を改善するために、仮想談話ツリーを使用する。オントロジーから得られたツリーフラグメントで回答の談話ツリーを拡張することによって、様々な局面は、所与の著者の思考構造から独立している、回答のカノニカルな談話ツリー表現を得る。

論じられるように、談話ツリー（ＤＴ）は、テキストが、特にテキストの段落でどのように編成されるかを表すことができる。言語構造を学習することが必須となり得る多数の自然言語処理タスクにおいて、談話レベルの分析を使用することができる。ＤＴは、エンティティ間の関係を概説する。エンティティおよび関連付けられる属性がテキスト内において導入される様々な方法がある。これらのエンティティ間に存在するすべての修辞関係が所与の段落のＤＴにおいて生じるわけではない。例えば、２つのエンティティ間の修辞関係は、所与の段落のＤＴの外側の、別の本文にあり得る。

したがって、質問と回答とを互いと完全に関係付けるためには、回答ついてのより完全な談話ツリーが望まれる。そのような談話ツリーは、関与するエンティティ間のすべての修辞関係を含むであろう。これを達成するために、質問に少なくとも部分的に対処する回答の最初の、すなわち最良一致の談話ツリーは、回答に欠けていると識別される特定の修辞関係で拡張される。

これらの欠けている修辞関係は、テキストコーパスから、またはインターネットなどの外部データベースを検索することから取得することができる。したがって、候補回答において欠けているエンティティの定義を有するであろうオントロジーに依存するかわりに、様々な局面では、これらのエンティティ間の修辞関係をオンラインで採掘する。この手順はオントロジーを構築する必要を回避し、従来の検索エンジンの上に実現することができる。

より具体的には、回答Ａが質問Ｑに関連するベースライン要件は、Ａのエンティティ（Ｅｎ）がＱのエンティティをカバーする、つまりＥ－Ｑ⊆Ｅ－Ａであることである。当然ながら、いくつかの回答エンティティＥ－Ａは、Ｑにおいて明示的に言及されないが、完全な回答を提供するために必要とされる。したがって、ＡによるＱの論理フローを分析することができる。しかしながら、Ｅｎ間の関係を確立することは困難であり得るため、ＱおよびＡの近似論理フローがモデル化され、ドメイン独立項

で表現可能であり、後で検証および／または拡張され得る。
質問に回答するために使用される初期回答には異なる欠点が存在し得る。例えば、あるケースは、いくつかのエンティティＥがＱにおいて明示的に言及されず、代わりに仮定されるケースである。別のケースは、Ｑに回答するために使用されるＡ内のいくつかのエンティティがＡ内に発生せず、代わりに、より具体的なエンティティまたはより一般的なエンティティがＡにおいて発生するケースである。いくつかのより具体的なエンティティがＱからの問題に実際に対処していると判断するために、本明細書では仮想ＥｎＤＴ－Ａと呼ばれる、なんらかの外部または追加のソースを使用して、これらの関係を確立することができる。このソースは、Ｑおよび／またはＡでは省略されるが、ピアによって知られていると仮定されるＥｎ間の相互関係に関する情報を含む。したがって、コンピュータにより実現されるシステムの場合、

という知識が談話レベルで望まれる。

議論の目的のために、以下の実施例を導入する。第１の例は、「What is an advantage
of electric car?（電気自動車の利点は何ですか？）」という質問と、対応する答え「No need to for gas（ガソリンの必要がありません）」である。特定の回答が特定の質問
に適していることを確立するために、一般的な意味のエンティティ advantageと通常名詞
のエンティティ car が使用される。より具体的には、Ａにおける明示的なエンティティ
{need, gas} がリンクされる。考えられ得る仮想ＥｎＤＴ－Ａのフラグメント[… No need… - 詳述する－ Advantage] … [gas - 詳述 - engine]…[engine - 詳述－ car]
を示す。これらの修辞学的リンクが存在するという証拠のみが必要とされる。

第２の例では、検索を改善するために、仮想談話ツリーが使用される。ユーザは、「a faulty brake switch can affect the automatic transmission Munro.（故障したブレーキスイッチが自動変速機Munroに影響を及ぼし得る。）」に関する情報を自律型エージェ
ントに要求する。既存の検索エンジンは、所与の検索結果において見つけられなかった特定のキーワードを識別するかもしれない。しかしながら、これらの未識別のキーワードがクエリにおいて発生するキーワードと修辞学的に接続されるドキュメントを見つけ出すことによって、特定のキーワードが検索結果にどのように関連しているかを示すことが考えられる。この特徴は、一方では回答の関連性を自然に改善し、ユーザのキーワードが回答においてどのように対処されるかに関する説明可能性をユーザに提供するだろう。

仮想談話ツリーは、検索エンジンが検索結果において欠けているキーワードを説明することを可能にすることができる。デフォルト検索では、munro が欠けている。しかし、munro をこの質問のエンティティに修辞学的に接続することを試みることにより、自律型エージェントアプリケーション１０２は、Munro が自動変速機の発明者である人であることを学習する。図１６は、自律型エージェントアプリケーション１０２によって使用され得る例示的なプロセスを示す。

図１６は、一局面による、仮想談話ツリーを構築するための例示的なプロセス１６００を示す。自律型エージェントアプリケーション１０２は、プロセス１６００を実現することができる。プロセス１６００は、質問と回答との間の改善された一致が、どのように談話ツリー（ＤＴ）によって容易にされるかを説明する。例えば、回答Ａ（または初期回答）が所与の質問Ｑに適切であることを検証するために、自律型エージェントアプリケーション１０２は、ＤＴ－ＡおよびＤＴ－Ｑが一致することを検証し、次いで、任意選択で、ＤＴ－Ａを他のＤＴのフラグメントで拡張して、Ｑ内のすべてのエンティティが拡張されたＤＴ－Ａで対処されることを保証する。議論の目的のために、プロセス１６００は、図１７に関して論じられる。

図１７は、一局面による質問、回答、および２つの仮想談話ツリーの例示的な談話ツリーを示す図である。図１７は、質問談話ツリー１７１０、回答談話ツリー１７２０、追加回答談話ツリー１７３０、追加回答談話ツリー１７４０、リンク１７５０～１７５４、およびノード１１７０～１７７４を示す。

質問談話ツリー１７１０は、「[When driving the cruise control][the engine will turn off][when I want to accelerate ,][although the check engine light was off .] [I have turned on the ignition][and listen for the engine pump running][to see
][if it is building up vacuum .] [Could there be a problem with the brake sensor
under the dash ?] [Looks like there could be a little play in the plug .]（［経済速度走行制御の駆動時、］［エンジンはオフになる］［私が加速したいとき］［チェックエンジンライトはオフだったが。］［私はイグニッションをオンし］［そしてエンジンポンプが動作しているのを聞いて］［確認した］［真空が形成されつつあるかどうかを。］［ダッシュ下のブレーキセンサに問題があり得るか？］［プラグには少しの遊びがあるようだ。］）」という質問から形成される。議論の目的のため、角括弧[]は、基本談話単位を示す。

図１６に戻ると、ブロック１６０１において、プロセス１６００は、質問から質問談話ツリー（ＤＴ－Ｑ）を構築することを伴う。質問は、フラグメント（または基本談話単位）を含むことができる。各単語は、フラグメント内でそれぞれの役割を示す。

自律型エージェントアプリケーション１０２は、質問談話ツリーを生成する。質問談話ツリーは、フラグメント間の修辞関係を表し、ノードを含む。各非終端ノードは、フラグメントのうちの２つフラグメントの間の修辞関係を表す。談話ツリーのノードの各終端ノードは、フラグメントのうちの１つに関連付けられる。

質問談話ツリーは、１つ以上の質問エンティティを含むことができる。自律型エージェントアプリケーション１０２は、これらのエンティティを識別することができる。図１７に見られるように、質問は、「CRUISE CONTROL」、「CHECK ENGINE LIGHT」、「ENGINE PUMP」、「VACUUM」、「BRAKE SENSOR」などのエンティティを含む。後述するように、こ
れらのエンティティのいくつかは回答によって対処され、いくつかは対処されない。

ブロック１６０２において、プロセス１６００は、テキストコーパスから初期回答にアクセスする。ファイルまたはデータベースなどの既存のドキュメントから初期回答を得ることができる。初期回答は、ローカルシステムまたは外部システムを検索することによって取得することもできる。例えば、自律型エージェントアプリケーション１０２は、検索クエリを提出することによって、追加の回答のセットを得ることができる。検索クエリは、例えば、質問において識別される１つ以上のキーワードによって策定された質問から導出することができる。自律型エージェントアプリケーション１０２は、複数の回答の各々に対する関連性スコアを判断することができる。回答スコアまたはランクは、質問とそれぞれの回答との間の一致のレベルを示す。自律型エージェントアプリケーション１０２は、閾値を超えるスコアを有する回答を初期回答として選択する。

例を続けると、自律型エージェントアプリケーション１０２は、以下の初期回答「[A faulty brake switch can affect the cruise control .] [If it is ,][there should be
a code][stored in the engine control module .] [Since it is not an emissions fault ,][the check engine light will not illuminate .] [First of all , watch the tachometer][to see][if engine speed increases 200 rpm][when this happens .] [If it does ,][the torque converter is unlocking transmission .]（［故障したブレーキ
スイッチは経済速度走行制御に影響を与え得る。］［もしそうである場合には、］［エンジン制御モジュールに格納されている］［コードがあるはずである。］［それは排気障害ではないので、］［チェックエンジンライトは点灯しないことになる。］［これが起こった時には、］［まず、タコメータを見て］［エンジン回転速度が２００ｒｐｍに増大するかどうかを］［見る。］［そうであれば、］［トルクコンバータは変速機をロック解除している。］）」にアクセスする。

ステップ１６０３において、ステップ１６００は、初期回答から、回答エンティティを含む回答談話ツリーを構築することを伴う。自律型エージェントアプリケーション１０２
は、初期回答のための談話ツリーを形成する。ブロック１６０３において、自律型エージェントアプリケーション１０２は、ブロック１６０１に関して説明したのと同様のステップを実行する。

例を続けると、自律型エージェントアプリケーション１０２は、質問に対する初期回答であるテキストを表す回答談話ツリー１７２０を生成する。回答談話ツリー１７２０は、質問エンティティの一部、具体的には「CRUISE CONTROL」、「CHECK ENGINE LIGHT」、および「TORQUE CONVERTER」を含む。

ブロック１６０４において、プロセス１６００は、コンピューティングデバイスが、質問エンティティに対する回答エンティティの関連性を示すスコアが閾値を下回る、と判断することを伴う。質問Ｑ内のエンティティは、（例えば、回答における１つ以上のエンティティによって）対処されるかもしれず、または対処されないかもしれず、すなわち、回答Ａ内のエンティティは、特定のエンティティに対処しない。質問における対処されていないエンティティはＥ_０によって示される。

異なる方法を使用して、特定の回答エンティティが特定の質問エンティティにどのように関連するかを判断することができる。例えば、一局面では、自律型エージェントアプリケーション１０２は、質問エンティティの正確なテキスト一致が回答エンティティに現れるかどうかを判断することができる。他の場合では、自律型エージェントアプリケーション１０２は、質問エンティティのキーワードが回答エンティティ内に出現する割合を示すスコアを判断することができる。

エンティティが対処されないことには、異なる理由が存在し得る。図示されているように、Ｅ_０－Ｑは、{ENGINE PUMP, BRAKE SENSOR, および VACUUM}を含む。例えば、回答Ａは、それがエンティティＥ_０のうちのあるものを省略するという点において、回答Ｑと完全には関係がない。あるいは、回答は、かわりに、異なるエンティティを用いる。Ｅ_０－Ｑはおそらくは回答Ａにおいて無視される。後者の可能性を検証するために、背景知識を用いて、Ｅ_０－ＱおよびＥ－Ａの両方にリンクされるエンティティＥ_ｉｍｇを見つけ出す。

例えば、Ｅ－Ａ＝TORQUE CONVERTER がＱにどのように接続されるかは不明である場合
がある。この接続を検証するために、トルクコンバータについてのウィキペディアからのからのテキストのフラグメントが取得され、ＤＴ－Ａ_ｉｍｇ１（１７３０）が構築される。様々な局面において、トルクコンバータは、詳述の修辞関係を介してエンジンと接続される、と判断することができる。

したがって、Ｅ－Ａ＝ Torque Convertor は、縦の青色色弧によって示されるように、実際に質問に関連する。このような判断は、エンティティをリンクするオフラインオントロジーを構築してエンティティ間の関係を学習することなく行うことができる。代わりに、Ａが関連するエンティティを含むことを確認するために、談話レベルコンテキストが使用される。

例を続けると、自律型エージェントアプリケーション１０２は、質問談話ツリー１７１０の他のエンティティ、具体的には「ENGINE PUMP」「VACUUM」、「BRAKE SENSOR」、お
よび「TORQUE CONVERTER」に言及するエンティティが回答談話ツリー１７２０において対処されない、と判断する。したがって、Ｅ－ＱとＥ－Ａとの間のこれらの対応は、それぞれリンク１７５０およびリンク１７５１によって示される。

ブロック１６０５において、プロセス１６００は、テキストコーパスから追加の談話ツ
リーを作成することを伴う。追加の談話ツリーはテキストから作成される。場合によっては、自律型エージェントアプリケーション１０２は、スコアリングメカニズムに従って１つ以上のテキストから適切なテキストを選択する。

例えば、自律型エージェントアプリケーション１０２は、追加の回答のセットにアクセスすることができる。自律型エージェントアプリケーション１０２は、追加の仮想談話ツリーのセットを生成することができる。追加の談話ツリーの各々は、それぞれの追加の回答に対応する。自律型エージェントアプリケーション１０２は、追加の談話ツリーの各々について、それぞれの追加の談話ツリー内の１つ以上の回答エンティティへのマッピングを含む質問エンティティの数を示すスコアを計算する。自律型エージェントアプリケーション１０２は、追加の談話ツリーのセットから最も高いスコアを有する追加の談話ツリーを選択する。次いで、ＤＴ－Ａが仮想ＤＴ－Ａ_ｉｍｇで拡張されると、検索関連性が、対処されていないＥ_０－Ｑの逆数として、測定される。

例えば、自律型エージェントアプリケーション１０２は、候補Ａ_ｓのセットを取得する。そして、Ａ_ｓにおける各候補Ａ_ｃについて、自律型エージェントアプリケーション１０２は以下の動作を行う：
（ａ）ＤＴ－Ａ_ｃを構築する；
（ｂ）マッピングＥ－Ｑ--＞Ｅ－Ａ_ｃを確立する；
（ｃ）Ｅ_０－Ｑを識別する；
（ｄ）Ｅ_０－ＱおよびＥ_０－Ａ_ｃ（Ｅ_０－Ｑにないエンティティ）からクエリを形成する；
（ｅ）クエリｄ）についてＢから検索結果を取得し、仮想ＤＴｓ－Ａ_ｃを構築する；そして
（ｆ）残りのスコア｜Ｅ_０｜を算出する。

次いで、自律型エージェントアプリケーション１０２は、最良のスコアを有するＡを選択することができる。

場合によっては、機械学習アプローチを使用して、＜ＥＤＴ－Ｑ，ＥＤＴ－Ａ＞ペアを正しいまたは正しくないとして分類することができる。例示的なトレーニングセットは、良い（肯定的）Ｑ／Ａペアおよび悪い（否定的）Ｑ／Ａペアを含む。したがって、ＤＴカーネル学習アプローチ（SVM TK, Joty and Moschitti 2014, Galitsky 2017）が選択され、それは、ＳＶＭ学習を、Ｑ／ＡペアについてのＤＴのすべてのサブＤＴのセットに適用する。アプローチのツリーカーネルファミリーは、解析（構文的および修辞学的）におけるエラーに対してあまり敏感ではなく、なぜならば、誤ったサブツリーは大部分ランダムであり、トレーニングセットの異なる要素間で共通である可能性が低いからである。

ＤＴは、各サブツリータイプの（その先祖を考慮することなく）整数カウントのベクトルＶによって表すことができる。

Ｖ（Ｔ）＝（タイプ１のサブツリーの数、...）。
２つのツリーセグメントＤＴ_１およびＤＴ_２が与えられると、ツリーカーネル関数Ｋ（ＥＤＴ_１，ＥＤＴ_２）≦Ｖ（ＥＤＴ_１）およびＶ（ＥＤＴ_２）＝Σ_ｉＶ（ＥＤＴ_１）［ｉ］，Ｖ（ＥＤＴ_２）［ｉ］＝Σ_ｎ１Σ_ｎ２Σ_ｉｌ_ｉ（ｎ_１）＊ｌ_ｉ（ｎ_２）であり、式中、ｎ１∈Ｎ_１およびｎ_２∈Ｎ_２であり、Ｎ_１およびＮ_２は、それぞれ、ＤＴ_１およびＤＴ_２におけるすべてのノードのセットである。

Ｉ_１（ｎ）はインジケータ関数である。
Ｉ_１（ｎ）＝｛タイプｉのサブツリーがノードにおけるルートで起こる場合には１であ
り、他の場合には０である｝。

例を続けると、質問からのＥ－Ｑ「ENGINE PUMP」が初期回答においてどのように対処
されるかは不明である。したがって、自律型エージェントアプリケーション１０２は、ENGINE PUMPエンティティに対処することができる追加のリソースを判断することができる
。

ブロック１６０６において、プロセス１６００は、追加の談話ツリーが質問エンティティを回答エンティティに接続する修辞関係を含む、と判断することを伴う。例を続けると、図１７に示されるように、ノード１７７０はエンティティ「VACUUM」を識別し、ノード１１７１はエンティティ「ENGINE」を識別する。したがって、ノード１１７２および１１７３は、それらの両方が「詳述」の修辞関係を表し、ノード１１７０および１１７１を関係付ける。このようにして、ノード１１７２および１７７３は、質問にある「ENGINE」と、質問にあるが以前に対処されていない「VACUUM」との間の欠けているリンクを提供する。

自律型エージェントアプリケーション１０２は、追加の談話ツリーをＥ－Ａに接続する。示されるように、ＤＴ－Ａ_ｉｍｇ２は、VACUUMおよびENGINEを、詳述を介して接続する。したがって、組み合わされたＤＴ－Ａは、実ＤＴ－Ａ＋ＤＴ－Ａ_ｉｍｇ１およびＤＴ－Ａ_ｉｍｇ２を含む。背景知識をドメイン独立態様で用いることによって回答が関連性があることを実証するために、実ＤＴおよび仮想ＤＴの両方が必要である。

ブロック１６０７において、プロセス１６００は、質問エンティティ、回答エンティティ、および修辞関係を含む追加の談話ツリーのサブツリーを抽出し、それによって仮想談話ツリーを生成することを伴う。場合によっては、自律型エージェントアプリケーション１０２は、サブツリー、または質問エンティティを回答エンティティに関連付ける追加の談話ツリーの一部分を抽出することができる。サブツリーは、少なくとも１つのノードを含む。場合によっては、自律型エージェントアプリケーション１０２は、ノードを回答エンティティまたは別のエンティティに接続することによって、仮想回答ツリーからのサブツリーを回答談話ツリーに統合することができる。

ブロック１６０８において、プロセス１６００は、回答談話ツリーと仮想談話ツリーとの組み合わせによって表される回答を出力することを伴う。自律型エージェントアプリケーション１０２は、ブロック１６０７で識別されたサブツリーを回答談話ツリーと組み合わせることができる。次いで、自律型エージェントアプリケーション１０２は、組み合わされたツリーに対応する回答を出力することができる。

実験結果
類事実の質問および非類事実の質問についての従来のＱ／Ａデータセット、ならびにＳｅｍＥｖａｌおよびニューラルＱ／Ａ評価は、質問が分類され、談話レベルの分析の潜在的な寄与を観察するようそれほど複雑ではないので、適していない。評価のために、２つの収束Ｑ／Ａセットが形成される：
１．広範なトピックを有する質問・応答ペアYahoo! Answer (Webscope 2017) のセット。１４０ｋのセットから、３～５個のセンテンスを含むユーザ質問３３００が選択される。ほとんどの質問に対する回答はかなり詳細であり、センテンス長によるフィルタリングは回答に適用されなかった。

２．車両の問題の記述対それらをどのように修正するかに関する推奨の９３００のＱ／Ａペアを含む車両修理の会話。

これらのセットの各々について、我々は、実際のＱ／Ａペアから肯定的なセットと、Ｑ／Ａ_{simiiar-entities}から否定的なセットとを形成した。Ｑ／Ａ_{simiiar-entities}はＥ－Ａと強い重なりを有するが、Ｑ／Ａ_{simiiar-entities}は、実際に、正しく、包括的で、正確な回答であるというわけではない。したがって、Ｑ／Ａは、Ｑ／Ａペアを正しいペアのクラスに関係させることの適合率および再現率を介して測定される分類タスクに換算される。

表１の上の２つの行は、Ｑ／Ａのベースライン性能を示し、複雑なドメインにおいて、キーワードからマッチングされたエンティティへの遷移が、１２％を超える性能上昇をもたらすことを示している。下の３行は、談話分析を適用した場合のＱ／Ａ正解率を示す。ＤＴ－ＡとＤＴ－Ｑとの間のルールベースの対応を保証することにより、ベースラインよりも１２％増加し、仮想ＤＴを使用すると、さらに１０％増加する。最後に、ルールベースから機械学習Ｑ／Ａ対応（ＳＶＭＴＫ）に進むと、約７％の性能利得が与えられる。

仮想談話ツリーの修辞学的合致分類器による補足
コミュニケーション用談話ツリーを使用することによって、修辞学的合致アプリケーション１１２は、２つのセンテンス間の相補性を判断することができる。例えば、修辞学的合致アプリケーション１１２は、質問に対する談話ツリーと初期回答に対する談話ツリーとの間、質問に対する談話ツリーと追加の回答もしくは候補回答に対する談話ツリーとの間、または回答の談話ツリーと追加の回答の談話ツリーとの間の相補性のレベルを判断することができる。このようにして、自律型エージェントアプリケーション１０２は、複雑な質問が、修辞学的合致またはスタイルにある完全な回答によって対処されることを保証する。

一例では、修辞学的合致アプリケーション１１２は、質問から質問コミュニケーション用談話ツリーを構築し、初期回答から回答コミュニケーション用談話ツリーを構築する。修辞学的合致アプリケーション１１２は、質問文に対して、質問コミュニケーション用談
話ツリーを判断する。質問談話ツリーはルートノードを含むことができる。例えば、図１３および図１５に戻って参照すると、質問文の例は、「are rebels responsible for the
downing of the flight.」である。修辞学的分類アプリケーション１０２は、図１５に
関して説明したプロセス１５００を使用することができる。例示的な質問は、「詳述する」のルートノードを有する。

修辞学的合致アプリケーション１１２は、回答文に対して、第２のコミュニケーション用談話ツリーを判断する。回答コミュニケーション用談話ツリーは、ルートノードを含むことができる。上記の例を続けると、修辞学的合致アプリケーションは、図１３に示されるように、コミュニケーション用談話ツリーを作成し、それも、「詳述する」とラベル付けされたルートノードを有する。

修辞学的合致アプリケーション１１２は、質問ルートノードと回答ルートノードとが同一であると識別することによって、コミュニケーション用談話ツリーを関連付ける。修辞学的合致アプリケーション１１２は、質問コミュニケーション用談話ツリーおよび回答コミュニケーション用談話ツリーが同一のルートノードを有すると判断する。結果として得られる関連付けられたコミュニケーション用談話ツリーは、図１７に示されており、「要求・応答ペア」とラベル付けすることができる。

修辞学的合致アプリケーション１１２は、マージされた談話ツリーに予測モデルを適用することによって、質問コミュニケーション用談話ツリーと回答コミュニケーション用談話ツリーとの間の相補性のレベルを計算する。異なる機械学習技術を使用することができる。一局面では、修辞学的合致アプリケーション１１２は、修辞学的合致分類器１２０をトレーニングし、使用する。例えば、修辞学的合致アプリケーション１１２は、要求・応答ペアの肯定的なクラスおよび否定的なクラスを定義することができる。肯定的なクラスは、修辞学的に正しい要求・応答ペアを含み、否定的なクラスは、関連性はあるが修辞学的に関係のない要求・応答ペアを含む。各要求・応答ペアについて、修辞学的合致アプリケーション１１２は、各センテンスを解析し、センテンスフラグメントの動詞シグネチャを取得することによって、ＣＤＴを構築することができる。修辞学的合致アプリケーション１１２は、関連付けられたコミュニケーション用談話ツリーペアを修辞学的合致分類器１２０に与え、修辞学的合致分類器１２０は、相補性のレベルを出力する。

修辞学的合致アプリケーション１１２は、相補性のレベルが閾値を超えると判断し、次いで、質問文および回答文を相補的として識別する。修辞学的合致アプリケーション１１２は、閾値レベルの相補性を使用して、質問・回答ペアが十分に相補的であるかどうかを判断することができる。例えば、分類スコアが閾値よりも大きい場合、修辞学的合致アプリケーション１１２はその回答を使用することができる。代替的に、修辞学的合致アプリケーション１１２は、回答を破棄し、別の候補回答を求めて回答データベース１０５または公衆データベースにアクセスし、必要に応じて繰り返すことができる。

別の局面では、修辞学的合致アプリケーション１１２は、表現に交錯カーネル学習を適用する。交錯カーネル学習は、上述の分類ベースの学習の代わりに行うことができる。修辞学的合致アプリケーション１１２は、要求・応答ペアのパースツリーのためにパース交錯ペアを構築する。修辞学的合致アプリケーション１１２は、要求・応答ペアに対する談話ツリーペアを得るために談話解析を適用する。修辞学的合致アプリケーション１１２は、談話ツリー要求・応答およびパースツリー要求・応答の基本談話単位を整列させる。修辞学的合致アプリケーション１１２は、談話ツリー要求・応答およびパースツリー要求・応答の基本談話単位をマージする。

関連ワーク
談話のいずれの点においても、あるエンティティは、（ＤＴの核部分に存在する）他のエンティティよりも顕著であると考えられ、その結果、異なる特性を示すことが期待される。Centering Theory (Grosz et al., 1995; Poesio et al., 2004)では、エンティティ重要度は、それらの間の代名詞化された関係を含む発話において、それらがどのように実現されるかを判断する。他の談話理論では、エンティティ重要度は、時事性 (Prince 1978)および認知アクセシビリティ(Gundel et al. 1993)を介して定義することができる。

BarzilayおよびLapata（２００８）は、テキストをエンティティ遷移シーケンスのセットに自動的に抽象化し、談話エンティティに関する分布情報、構文情報、および参照情報を記録する。著者は、一貫性評価を学習タスクとして策定し、それらのエンティティベースの表現がランキングベースの生成およびテキスト分類タスクによく適していることを示す。

(Nguyen および Joty 2017) は、テキストのグリッド表現におけるエンティティ遷移の分散表現上で動作する畳み込みニューラルネットワークに基づくローカル一貫性モデルを提示した。ローカル一貫性モデルは、十分に長いエンティティ遷移をモデル化することができ、一般化パワーを失うことなくエンティティ固有の特徴を組み込むことができる。Kuytenら２０１５は、情報検索におけるバッグ・オブ・ワードドキュメント表現に関連付けられる制限を克服するために、ドキュメントにおける談話構造を活用する検索エンジンを開発した。このシステムは、ＱとＡとの間の修辞学的協調の問題に対処しないが、Ｑを与えられると、この検索エンジンは、関連性のあるＡ、およびクエリに対する何らかの修辞関係を記述するＡからの個別のステートメントの両方を検索することができる。

本研究の領域において質問に回答することは、１つまたは２つのエンティティおよびそれらのパラメータを含むだけでよいスタンフォードＱＡデータベース(Rajpurkar et al.,
2016)のような類事実のＱＡよりも非常に複雑なタスクである。「問題の解決方法」質問に回答するためには、質問内のエンティティを接続する論理フローを維持する必要がある。Ｑからのエンティティの一部は省略されることが避けられないため、これらは、これらの省略されたエンティティおよびＱに提示されるエンティティに関する何らかの背景知識テキストから復元される必要がある。さらに、ある論理フローが、Ｑのそれを補う必要がある。

自動車の機械的問題に関連するもののようなドメインに特定的なオントロジーは、構築するのが非常に困難で費用がかかる。この研究では、ドメイン非依存性談話レベル分析を介した代用物が提案されている。より具体的には、対処されていないＤＴ－Ａの部分が、例えばウィキペディアなどの背景知識コーパスにおいてテキストフラグメントを見つけることによって、対処される。したがって、関与するエンティティ間の関係を維持する必要があるオントロジーは必要とされない。

提案されるＱ／Ａシステムの仮想ＤＴ特徴は、複雑な収束質問に回答する正解率の実質的な増加をもたらす。回答スタイルマッチングＤＴに関して使用すると、関連性に集中したベースラインと比較して、Ｑ／Ａ正解率が１０％超改善されるが、仮想ＤＴに頼ると、更に１０％改善される。

本明細書で説明される局面は、ＤＴ－ＡとＤＴ－Ｑとの間の相補性関係を分析し、それによって、学習特徴空間を実質的に低減し、それによって、車両修理のリストなど限られたサイズの利用可能なデータセットからの学習を信頼できそうなものにする。

図１８は、上記局面のうちの１つを実現するための分散型システム１８００を示す簡略図である。例示された局面においては、分散型システム１８００は、１つ以上のネットワ
ーク１８１０を介して、ウェブブラウザ、プロプライエタリクライアント（たとえばオラクルフォーム）などのクライアントアプリケーションを実行して動作させるように構成される１つ以上のクライアントコンピューティングデバイス１８０２、１８０４、１８０６および１８０８を含む。サーバ１８１２は、ネットワーク１８１０を介してリモートクライアントコンピューティングデバイス１８０２、１８０４、１８０６および１８０８と通信可能に結合されてもよい。

さまざまな局面においては、サーバ８１１は、システムの構成要素のうち１つ以上によって提供される１つ以上のサービスまたはソフトウェアアプリケーションを実行するように適合されてもよい。サービスまたはソフトウェアアプリケーションは非仮想環境および仮想環境を含み得る。仮想環境は、２次元または３次元（three-dimensional：３Ｄ）表
現、ページベースの論理的環境などであろうとなかろうと、仮想イベント、トレードショー、シミュレータ、クラスルーム、購買商品取引および企業活動のために用いられるものを含み得る。いくつかの局面においては、これらのサービスは、ウェブベースのサービスもしくはクラウドサービスとして、またはソフトウェア・アズ・ア・サービス（Software
as a Service：ＳａａＳ）モデルのもとで、クライアントコンピューティングデバイス
１８０２，１８０４，１８０６および／または１８０８のユーザに供給されてもよい。そして、クライアントコンピューティングデバイス１８０２，１８０４，１８０６および／または１８０８を動作させるユーザは、１つ以上のクライアントアプリケーションを利用して、サーバ１８１２と相互作用して、これらの構成要素によって提供されるサービスを利用し得る。

図に示されている構成では、システム１８００のソフトウェアコンポーネント１８１８，１８２０および１８２２は、サーバ１８１２上に実装されるように示されている。また、他の局面においては、分散システム１８００の構成要素のうちの１つ以上および／またはこれらの構成要素によって提供されるサービスは、クライアントコンピューティングデバイス１８０２，１８０４，１８０６および／または１８０８のうちの１つ以上によって実現されてもよい。その場合、クライアントコンピューティングデバイスを動作させるユーザは、１つ以上のクライアントアプリケーションを利用して、これらの構成要素によって提供されるサービスを使用し得る。これらの構成要素は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの組合せで実現されてもよい。分散型システム１８００とは異なり得るさまざまな異なるシステム構成が可能であることが理解されるべきである。したがって、図に示されている局面は、局面のシステムを実現するための分散型システムの一例であり、限定的であるよう意図されたものではない。

クライアントコンピューティングデバイス１８０２，１８０４，１８０６および／または１８０８は、手持ち式携帯機器（たとえばｉＰｈｏｎｅ（登録商標）、携帯電話、ｉＰａｄ（登録商標）、計算タブレット、パーソナルデジタルアシスタント（personal digital assistant：ＰＤＡ））またはウェアラブル装置（たとえばグーグルグラス（登録商標）ヘッドマウントディスプレイ）であってもよく、当該装置は、マイクロソフト・ウィンドウズ（登録商標）・モバイル（登録商標）などのソフトウェアを実行し、および／または、ｉＯＳ、ウィンドウズ・フォン、アンドロイド（登録商標）、ブラックベリー１８、パームＯＳなどのさまざまなモバイルオペレーティングシステムを実行し、インターネット、ｅメール、ショート・メッセージ・サービス（short message service：ＳＭＳ）、
ブラックベリー（登録商標）、または使用可能な他の通信プロトコルである。クライアントコンピューティングデバイスは、汎用パーソナルコンピュータであってもよく、当該汎用パーソナルコンピュータは、一例として、マイクロソフトウィンドウズ（登録商標）、アップルマッキントッシュ（登録商標）および／またはリナックス（登録商標）オペレーティングシステムのさまざまなバージョンを実行するパーソナルコンピュータおよび／またはラップトップコンピュータを含む。クライアントコンピューティングデバイスは、ワ
ークステーションコンピュータであってもよく、当該ワークステーションコンピュータは、たとえばＧｏｏｇｌｅＣｈｒｏｍｅＯＳなどのさまざまなＧＮＵ／リナックスオペレーティングシステムを含むがこれらに限定されるものではないさまざまな市販のＵＮＩＸ（登録商標）またはＵＮＩＸライクオペレーティングシステムのうちのいずれかを実行する。代替的には、または付加的には、クライアントコンピューティングデバイス１８０２，１８０４，１８０６および１８０８は、シン・クライアントコンピュータ、インターネットにより可能なゲーミングシステム（たとえばキネクト（登録商標）ジェスチャ入力装置を備えるかまたは備えないマイクロソフトＸボックスゲーム機）、および／または、ネットワーク１８１０を介して通信が可能なパーソナルメッセージング装置などのその他の電子装置であってもよい。

例示的な分散型システム１８００は、４個のクライアントコンピューティングデバイスを有するように示されているが、任意の数のクライアントコンピューティングデバイスがサポートされてもよい。センサを有する装置などの他の装置が、サーバ１８１２と相互作用してもよい。

分散型システム１８００におけるネットワーク１８１０は、さまざまな市販のプロトコルのうちのいずれかを用いてデータ通信をサポートすることができる、当業者になじみのある任意のタイプのネットワークであってもよく、当該プロトコルは、ＴＣＰ／ＩＰ（伝送制御プロトコル／インターネットプロトコル）、ＳＮＡ（システムネットワークアーキテクチャ）、ＩＰＸ（インターネットパケット交換）、アップルトークなどを含むが、これらに限定されるものではない。単に一例として、ネットワーク１８１０は、イーサネット（登録商標）、トークンリングなどに基づくものなどのローカルエリアネットワーク（ＬＡＮ）であってもよい。ネットワーク１８１０は、広域ネットワークおよびインターネットであってもよい。ネットワーク１８１０は、仮想ネットワークを含んでいてもよく、当該仮想ネットワークは、仮想プライベートネットワーク（virtual private network：
ＶＰＮ）、イントラネット、エクストラネット、公衆交換電話網（public switched telephone network：ＰＳＴＮ）、赤外線ネットワーク、無線ネットワーク（たとえば米国電
気電子学会（Institute of Electrical and Electronics：ＩＥＥＥ）８０２．１８の一
連のプロトコル、ブルートゥース（登録商標）および／またはその他の無線プロトコルのうちのいずれかのもとで動作するネットワーク）、および／またはこれらの任意の組合せ、および／または他のネットワークを含むが、これらに限定されるものではない。

サーバ１８１２は、１つ以上の汎用コンピュータ、専用サーバコンピュータ（一例として、ＰＣ（パーソナルコンピュータ）サーバ、ＵＮＩＸ（登録商標）サーバ、ミッドレンジサーバ、メインフレームコンピュータ、ラックマウント式サーバなどを含む）、サーバファーム、サーバクラスタ、またはその他の適切な構成および／または組合せで構成され得る。サーバ１８１２は、仮想オペレーティングシステムを実行する１つ以上の仮想マシン、または仮想化を含む他のコンピューティングアーキテクチャを含み得る。論理記憶装置の１つ以上のフレキシブルプールは、サーバのための仮想記憶デバイスを維持するように仮想化することができる。仮想ネットワークは、ソフトウェア定義型ネットワーキングを用いて、サーバ１８１２によって制御することができる。さまざまな局面においては、サーバ１８１２は、上記の開示に記載されている１つ以上のサービスまたはソフトウェアアプリケーションを実行するように適合され得る。たとえば、サーバ１８１２は、本開示の局面に係る上記の処理を実行するためのサーバに対応してもよい。

サーバ１８１２は、上記のもののうちのいずれか、および、任意の市販のサーバオペレーティングシステムを含むオペレーティングシステムを実行し得る。また、サーバ１８１２は、ハイパーテキスト転送プロトコル（hypertext transport protocol：ＨＴＴＰ）サーバ、ファイル転送プロトコル（file transfer protocol：ＦＴＰ）サーバ、共通ゲート
ウェイインターフェース（common gateway interface：ＣＧＩ）サーバ、ＪＡＶＡ（登録商標）サーバ、データベースサーバなどを含むさまざまな付加的サーバアプリケーションおよび／または中間層アプリケーションのうちのいずれかを実行し得る。例示的なデータベースサーバは、オラクル社（Oracle）、マイクロソフト社（Microsoft）、サイベース
社（Sybase）、ＩＢＭ社（International Business Machines）などから市販されている
ものを含むが、これらに限定されるものではない。

いくつかの実現例では、サーバ１８１２は、クライアントコンピューティングデバイス８０２，８０４，８０６および８０８のユーザから受取ったデータフィードおよび／またはイベント更新を分析および統合するための１つ以上のアプリケーションを含み得る。一例として、データフィードおよび／またはイベント更新は、１つ以上の第三者情報源および連続的なデータストリームから受信されるTwitter（登録商標）フィード、Facebook（
登録商標）更新またはリアルタイム更新を含み得るが、これらに限定されるものではなく、センサデータアプリケーション、金融ティッカ、ネットワーク性能測定ツール（たとえばネットワークモニタリングおよびトラフィック管理アプリケーション）、クリックストリーム分析ツール、自動車交通モニタリングなどに関連するリアルタイムイベントを含み得る。また、サーバ１８１２は、クライアントコンピューティングデバイス１８０２，１８０４，１８０６および１８０８の１つ以上の表示装置を介してデータフィードおよび／またはリアルタイムイベントを表示するための１つ以上のアプリケーションを含み得る。

また、分散型システム１８００は、１つ以上のデータベース１８１４および１８１６を含み得る。データベース１８１４および１８１６は、さまざまな場所に存在し得る。一例として、データベース１８１４および１８１６の１つ以上は、サーバ１８１２にローカルな（および／または存在する）非一時的な記憶媒体に存在していてもよい。代替的に、データベース１８１４および１８１６は、サーバ１８１２から遠く離れていて、ネットワークベースまたは専用の接続を介してサーバ１８１２と通信してもよい。一組の局面においては、データベース１８１４および１８１６は、記憶領域ネットワーク（storage-area network：ＳＡＮ）に存在していてもよい。同様に、サーバ１８１２に起因する機能を実行するための任意の必要なファイルが、サーバ１８１２上にローカルに、および／または、リモートで適宜格納されていてもよい。一組の局面においては、データベース１８１４および１８１６は、ＳＱＬフォーマットコマンドに応答してデータを格納、更新および検索するように適合された、オラクル社によって提供されるデータベースなどのリレーショナルデータベースを含み得る。

図１９は、本開示の一局面に係る、一局面のシステムの１つ以上の構成要素によって提供されるサービスをクラウドサービスとして供給することができるシステム環境１９００の１つ以上の構成要素の簡略化されたブロック図である。示されている局面においては、システム環境１９００は、クラウドサービスを提供するクラウドインフラストラクチャシステム１９０２と相互作用するようにユーザによって使用され得る１つ以上のクライアントコンピューティングデバイス１９０４，１９０６および１９０８を含む。クライアントコンピューティングデバイスは、クラウドインフラストラクチャシステム１９０２によって提供されるサービスを使用するためにクラウドインフラストラクチャシステム１９０２と相互作用するようにクライアントコンピューティングデバイスのユーザによって使用され得る、ウェブブラウザ、専有のクライアントアプリケーション（たとえばオラクルフォームズ）または他のアプリケーションなどのクライアントアプリケーションを動作させるように構成され得る。

図に示されているクラウドインフラストラクチャシステム１９０２が図示されている構成要素とは他の構成要素を有し得ることが理解されるべきである。さらに、図に示されている局面は、本発明の局面を組込むことができるクラウドインフラストラクチャシステム
の一例に過ぎない。いくつかの他の局面においては、クラウドインフラストラクチャシステム１９０２は、図に示されているものよりも多いまたは少ない数の構成要素を有していてもよく、２つ以上の構成要素を組合せてもよく、または構成要素の異なる構成または配置を有していてもよい。

クライアントコンピューティングデバイス１９０４，１９０６および１９０８は、１００２，１００４，１００６および１００８について上記したものと類似のデバイスであってもよい。

例示的なシステム環境１９００は３個のクライアントコンピューティングデバイスを有するように示されているが、任意の数のクライアントコンピューティングデバイスがサポートされてもよい。センサなどを有する装置などの他の装置が、クラウドインフラストラクチャシステム１９０２と相互作用してもよい。

ネットワーク１９１０は、クライアントコンピューティングデバイス１９０４，１９０６および１９０８とクラウドインフラストラクチャシステム１９０２との間のデータの通信およびやりとりを容易にし得る。各々のネットワークは、ネットワーク１８１０について上記したものを含むさまざまな市販のプロトコルのうちのいずれかを用いてデータ通信をサポートすることができる、当業者になじみのある任意のタイプのネットワークであってもよい。

クラウドインフラストラクチャシステム１００２は、サーバ１８１２について上記したものを含み得る１つ以上のコンピュータおよび／またはサーバを備え得る。

特定の局面においては、クラウドインフラストラクチャシステムによって提供されるサービスは、オンラインデータ記憶およびバックアップソリューション、ウェブベースのｅメールサービス、ホスト型オフィススイートおよびドキュメントコラボレーションサービス、データベース処理、管理技術サポートサービスなどの、クラウドインフラストラクチャシステムのユーザがオンデマンドで利用可能な多数のサービスを含み得る。クラウドインフラストラクチャシステムによって提供されるサービスは、そのユーザのニーズを満たすように動的にスケーリング可能である。クラウドインフラストラクチャシステムによって提供されるサービスの具体的なインスタンス化は、本明細書では「サービスインスタンス」と称される。一般に、インターネットなどの通信ネットワークを介してクラウドサービスプロバイダのシステムからユーザが利用可能な任意のサービスは、「クラウドサービス」と称される。通常、パブリッククラウド環境では、クラウドサービスプロバイダのシステムを構成するサーバおよびシステムは、顧客自身のオンプレミスサーバおよびシステムとは異なっている。たとえば、クラウドサービスプロバイダのシステムがアプリケーションをホストしてもよく、ユーザは、インターネットなどの通信ネットワークを介してオンデマンドで当該アプリケーションを注文および使用してもよい。

いくつかの例では、コンピュータネットワーククラウドインフラストラクチャにおけるサービスは、ストレージ、ホスト型データベース、ホスト型ウェブサーバ、ソフトウェアアプリケーションへの保護されたコンピュータネットワークアクセス、またはクラウドベンダによってユーザに提供されるかもしくはそうでなければ当該技術分野において公知の他のサービスを含み得る。たとえば、サービスは、インターネットを介したクラウド上のリモートストレージへのパスワードによって保護されたアクセスを含み得る。別の例として、サービスは、ネットワーク化された開発者による私的使用のためのウェブサービスベースのホスト型リレーショナルデータベースおよびスクリプト言語ミドルウェアエンジンを含み得る。別の例として、サービスは、クラウドベンダのウェブサイト上でホストされるｅメールソフトウェアアプリケーションへのアクセスを含み得る。

特定の局面においては、クラウドインフラストラクチャシステム１９０２は、セルフサービスの、サブスクリプションベースの、弾性的にスケーラブルな、信頼性のある、高可用性の、安全な態様で顧客に配信される一連のアプリケーション、ミドルウェアおよびデータベースサービス提供品を含み得る。このようなクラウドインフラストラクチャシステムの一例は、本譲受人によって提供されるオラクルパブリッククラウドである。

時としてビッグデータとも称される大量のデータは、インフラストラクチャシステムによって、多数のレベルにおいて、および異なるスケールでホストおよび／または操作され得る。このようなデータが含み得るデータセットは、非常に大型で複雑であるので、典型的なデータベース管理ツールまたは従来のデータ処理アプリケーションを用いて処理するのが困難になる可能性がある。たとえば、テラバイトのデータはパーソナルコンピュータまたはそれらのラックベースの対応物を用いて格納、検索取得および処理することが難しいかもしれない。このようなサイズのデータは、最新のリレーショナルデータベース管理システムおよびデスクトップ統計ならびに視覚化パッケージを用いて機能させるのが困難である可能性がある。それらは、データを許容可能な経過時間内に捕捉しキュレーションし管理し処理するよう、一般的に用いられるソフトウェアツールの構造を超えて、何千ものサーバコンピュータを動作させる大規模並列処理ソフトウェアを必要とし得る。

大量のデータを視覚化し、トレンドを検出し、および／または、データと相互作用させるために、分析者および研究者は極めて大きいデータセットを格納し処理することができる。平行にリンクされた何十、何百または何千ものプロセッサがこのようなデータに対して作用可能であり、これにより、このようなデータを表示し得るか、または、データに対する外力をシミュレートし得るかもしくはそれが表しているものをシミュレートし得る。これらのデータセットは、データベースにおいて編制されたデータ、もしくは構造化モデルに従ったデータ、および／または、非体系的なデータ（たとえば電子メール、画像、データブロブ（バイナリ大型オブジェクト）、ウェブページ、複雑なイベント処理）などの構造化されたデータを必要とする可能性がある。目標物に対してより多くの（またはより少数の）コンピューティングリソースを比較的迅速に集中させるために局面の能力を強化することにより、ビジネス、政府関係機関、研究組織、私人、同じ目的をもった個々人もしくは組織のグループ、または他のエンティティからの要求に基づいて大量のデータセット上でタスクを実行するために、クラウドインフラストラクチャシステムがより良好に利用可能となる。

さまざまな局面においては、クラウドインフラストラクチャシステム１００２は、クラウドインフラストラクチャシステム１９０２によって供給されるサービスへの顧客のサブスクリプションを自動的にプロビジョニング、管理および追跡するように適合され得る。クラウドインフラストラクチャシステム１００２は、さまざまなデプロイメントモデルを介してクラウドサービスを提供し得る。たとえば、クラウドインフラストラクチャシステム１００２が、（たとえばオラクル社によって所有される）クラウドサービスを販売する組織によって所有され、一般大衆またはさまざまな産業企業がサービスを利用できるパブリッククラウドモデルのもとでサービスが提供されてもよい。別の例として、クラウドインフラストラクチャシステム１００２が単一の組織のためだけに運営され、当該組織内の１つ以上のエンティティにサービスを提供し得るプライベートクラウドモデルのもとでサービスが提供されてもよい。また、クラウドインフラストラクチャシステム１００２およびクラウドインフラストラクチャシステム１００２によって提供されるサービスが、関連のコミュニティ内のいくつかの組織によって共有されるコミュニティクラウドモデルのもとでクラウドサービスが提供されてもよい。また、２つ以上の異なるモデルの組合せであるハイブリッドクラウドモデルのもとでクラウドサービスが提供されてもよい。

いくつかの局面においては、クラウドインフラストラクチャシステム１００２によって提供されるサービスは、ソフトウェア・アズ・ア・サービス（Software as a Service：
ＳａａＳ）カテゴリ、プラットフォーム・アズ・ア・サービス（Platform as a Service
：ＰａａＳ）カテゴリ、インフラストラクチャ・アズ・ア・サービス（Infrastructure as a Service：ＩａａＳ）カテゴリ、またはハイブリッドサービスを含むサービスの他の
カテゴリのもとで提供される１つ以上のサービスを含み得る。顧客は、サブスクリプションオーダーによって、クラウドインフラストラクチャシステム１９０２によって提供される１つ以上のサービスをオーダーし得る。次いで、クラウドインフラストラクチャシステム１００２は、顧客のサブスクリプションオーダーでサービスを提供するために処理を実行する。

いくつかの局面においては、クラウドインフラストラクチャシステム１００２によって提供されるサービスは、アプリケーションサービス、プラットフォームサービスおよびインフラストラクチャサービスを含み得るが、これらに限定されるものではない。いくつかの例では、アプリケーションサービスは、ＳａａＳプラットフォームを介してクラウドインフラストラクチャシステムによって提供されてもよい。ＳａａＳプラットフォームは、ＳａａＳカテゴリに分類されるクラウドサービスを提供するように構成され得る。たとえば、ＳａａＳプラットフォームは、一体化された開発およびデプロイメントプラットフォーム上で一連のオンデマンドアプリケーションを構築および配信するための機能を提供し得る。ＳａａＳプラットフォームは、ＳａａＳサービスを提供するための基本的なソフトウェアおよびインフラストラクチャを管理および制御し得る。ＳａａＳプラットフォームによって提供されるサービスを利用することによって、顧客は、クラウドインフラストラクチャシステムで実行されるアプリケーションを利用することができる。顧客は、顧客が別々のライセンスおよびサポートを購入する必要なく、アプリケーションサービスを取得することができる。さまざまな異なるＳａａＳサービスが提供されてもよい。例としては、大規模組織のための販売実績管理、企業統合およびビジネスの柔軟性のためのソリューションを提供するサービスが挙げられるが、これらに限定されるものではない。

いくつかの局面においては、プラットフォームサービスは、ＰａａＳプラットフォームを介してクラウドインフラストラクチャシステムによって提供されてもよい。ＰａａＳプラットフォームは、ＰａａＳカテゴリに分類されるクラウドサービスを提供するように構成され得る。プラットフォームサービスの例としては、組織（オラクル社など）が既存のアプリケーションを共有の共通アーキテクチャ上で統合することを可能にするサービス、および、プラットフォームによって提供される共有のサービスを活用する新たなアプリケーションを構築する機能を挙げることができるが、これらに限定されるものではない。ＰａａＳプラットフォームは、ＰａａＳサービスを提供するための基本的なソフトウェアおよびインフラストラクチャを管理および制御し得る。顧客は、顧客が別々のライセンスおよびサポートを購入する必要なく、クラウドインフラストラクチャシステムによって提供されるＰａａＳサービスを取得することができる。プラットフォームサービスの例としては、オラクルＪａｖａクラウドサービス（Java Cloud Service：ＪＣＳ）、オラクルデータベースクラウドサービス（Database Cloud Service：ＤＢＣＳ）などが挙げられるが、これらに限定されるものではない。

ＰａａＳプラットフォームによって提供されるサービスを利用することによって、顧客は、クラウドインフラストラクチャシステムによってサポートされるプログラミング言語およびツールを利用することができ、デプロイされたサービスを制御することもできる。いくつかの局面においては、クラウドインフラストラクチャシステムによって提供されるプラットフォームサービスは、データベースクラウドサービス、ミドルウェアクラウドサービル（たとえばオラクルフージョンミドルウェアサービス）およびＪａｖａクラウドサービスを含み得る。一局面においては、データベースクラウドサービスは、組織がデータ
ベースリソースをプールしてデータベースクラウドの形態でデータベース・アズ・ア・サービスを顧客に供給することを可能にする共有のサービスデプロイメントモデルをサポートし得る。ミドルウェアクラウドサービスは、クラウドインフラストラクチャシステムにおいてさまざまなビジネスアプリケーションを開発およびデプロイするために顧客にプラットフォームを提供し得るともに、Ｊａｖａクラウドサービスは、クラウドインフラストラクチャシステムにおいてＪａｖａアプリケーションをデプロイするために顧客にプラットフォームを提供し得る。

さまざまな異なるインフラストラクチャサービスは、クラウドインフラストラクチャシステムにおけるＩａａＳプラットフォームによって提供されてもよい。インフラストラクチャサービスは、ストレージ、ネットワークなどの基本的な計算リソース、ならびに、ＳａａＳプラットフォームおよびＰａａＳプラットフォームによって提供されるサービスを利用する顧客のための他の基礎的な計算リソースの管理および制御を容易にする。

また、特定の局面においては、クラウドインフラストラクチャシステム１００２は、クラウドインフラストラクチャシステムの顧客にさまざまなサービスを提供するために使用されるリソースを提供するためのインフラストラクチャリソース１９３０を含み得る。一局面においては、インフラストラクチャリソース１９３０は、ＰａａＳプラットフォームおよびＳａａＳプラットフォームによって提供されるサービスを実行するための、サーバ、ストレージおよびネットワーキングリソースなどのハードウェアの予め一体化された最適な組合せを含み得る。

いくつかの局面においては、クラウドインフラストラクチャシステム１００２におけるリソースは、複数のユーザによって共有され、デマンドごとに動的に再割り振りされてもよい。また、リソースは、異なる時間帯にユーザに割り振られてもよい。たとえば、クラウドインフラストラクチャシステム１００２は、第１の時間帯におけるユーザの第１の組が規定の時間にわたってクラウドインフラストラクチャシステムのリソースを利用することを可能にし得るとともに、異なる時間帯に位置するユーザの別の組への同一のリソースの再割り振りを可能にし得ることによって、リソースの利用を最大化することができる。

特定の局面においては、クラウドインフラストラクチャシステム１９０２のさまざまな構成要素またはモジュール、および、クラウドインフラストラクチャシステム１９０２によって提供されるサービス、によって共有されるいくつかの内部共有サービス１９３２が提供され得る。これらの内部共有サービスは、セキュリティおよびアイデンティティサービス、インテグレーションサービス、企業リポジトリサービス、企業マネージャサービス、ウイルススキャンおよびホワイトリストサービス、高可用性・バックアップおよび回復サービス、クラウドサポートを可能にするためのサービス、ｅメールサービス、通知サービス、ファイル転送サービスなどを含み得るが、これらに限定されるものではない。

特定の局面においては、クラウドインフラストラクチャシステム１９０２は、クラウドインフラストラクチャシステムにおけるクラウドサービス（たとえばＳａａＳサービス、ＰａａＳサービスおよびＩａａＳサービス）の包括的管理を提供し得る。一局面においては、クラウド管理機能は、クラウドインフラストラクチャシステム１９０２によって受信された顧客のサブスクリプションをプロビジョニング、管理および追跡などするための機能を含み得る。

一局面においては、図に示されるように、クラウド管理機能は、オーダー管理モジュール１９２０、オーダーオーケストレーションモジュール１９２２、オーダープロビジョニングモジュール１９２４、オーダー管理および監視モジュール１９２６、ならびにアイデンティティ管理モジュール１９２８などの１つ以上のモジュールによって提供され得る。
これらのモジュールは、汎用コンピュータ、専用サーバコンピュータ、サーバファーム、サーバクラスタ、またはその他の適切な構成および／もしくは組み合わせであり得る１つ以上のコンピュータおよび／またはサーバを含み得るか、またはそれらを用いて提供され得る。

例示的な動作１９３４において、クライアントコンピューティングデバイス１９０４，１９０６または１９０８などのクライアントコンピューティングトデバイスを用いる顧客は、クラウドインフラストラクチャシステム１９０２によって提供される１つ以上のサービスを要求し、クラウドインフラストラクチャシステム１９０２によって供給される１つ以上のサービスのサブスクリプションについてオーダーを行うことによって、クラウドインフラストラクチャシステム１９０２と対話し得る。特定の局面においては、顧客は、クラウドユーザインターフェース（User Interface：ＵＩ）、すなわちクラウドＵＩ１９１９、クラウドＵＩ１９１４および／またはクラウドＵＩ１９１６にアクセスして、これらのＵＩを介してサブスクリプションオーダーを行い得る。顧客がオーダーを行ったことに応答してクラウドインフラストラクチャシステム１９０２によって受信されたオーダー情報は、顧客と、顧客がサブスクライブする予定のクラウドインフラストラクチャシステム１９０２によって提供される１つ以上のサービスとを特定する情報を含み得る。

オーダーが顧客によって行われた後、オーダー情報は、クラウドＵＩ１０１０，１０１４および／または１０１４を介して受信される。

動作１９３６において、オーダーは、オーダーデータベース１９１８に格納される。オーダーデータベース１９１８は、クラウドインフラストラクチャシステム１９０２によって動作させられるとともに他のシステム要素と連携して動作させられるいくつかのデータベースのうちの１つであってもよい。

動作１９３８において、オーダー情報は、オーダー管理モジュール１９２０に転送される。いくつかの例では、オーダー管理モジュール１９２０は、オーダーの確認および確認時のオーダーの予約などのオーダーに関連する請求書発行機能および会計経理機能を実行するように構成され得る。

動作１９４０において、オーダーに関する情報は、オーダーオーケストレーションモジュール１９２２に通信される。オーダーオーケストレーションモジュール１９２２は、顧客によって行われたオーダーについてのサービスおよびリソースのプロビジョニングをオーケストレートするためにオーダー情報を利用し得る。いくつかの例では、オーダーオーケストレーションモジュール１９２２は、オーダープロビジョニングモジュール１９２４のサービスを用いてサブスクライブされたサービスをサポートするためにリソースのプロビジョニングをオーケストレートし得る。

特定の局面においては、オーダーオーケストレーションモジュール１９２２は、各々のオーダーに関連付けられるビジネスプロセスの管理を可能にし、ビジネス論理を適用してオーダーがプロビジョニングに進むべきか否かを判断する。動作１９４２において、新たなサブスクリプションについてのオーダーを受信すると、オーダーオーケストレーションモジュール１９２２は、リソースを割り振って当該サブスクリプションオーダーを満たすのに必要とされるそれらのリソースを構成するための要求をオーダープロビジョニングモジュール１９２４に送る。オーダープロビジョニングモジュール１９２４は、顧客によってオーダーされたサービスについてのリソースの割り振りを可能にする。オーダープロビジョニングモジュール１９２４は、クラウドインフラストラクチャシステム１９０２によって提供されるクラウドサービスと、要求されたサービスを提供するためのリソースをプロビジョニングするために使用される物理的実装層との間にあるレベルの抽象化を提供す
る。したがって、オーダーオーケストレーションモジュール１９２２は、サービスおよびリソースが実際に実行中にプロビジョニングされるか、事前にプロビジョニングされて要求があったときに割振られる／割当てられるのみであるかなどの実装の詳細から切り離すことができる。

動作１９４４において、サービスおよびリソースがプロビジョニングされると、提供されたサービスの通知が、クラウドインフラストラクチャシステム１９０２のオーダープロビジョニングモジュール１９２４によってクライアントコンピューティングデバイス１９０４，１９０６および／または１９０８上の顧客に送られ得る。

動作１９４６において、顧客のサブスクリプションオーダーが、オーダー管理および監視モジュール１９２６によって管理および追跡され得る。いくつかの例では、オーダー管理および監視モジュール１９２６は、使用される記憶量、転送されるデータ量、ユーザの数、ならびにシステムアップ時間およびシステムダウン時間の量などのサブスクリプションオーダーにおけるサービスについての使用統計を収集するように構成され得る。

特定の局面においては、クラウドインフラストラクチャシステム１９０２は、アイデンティティ管理モジュール１９２８を含み得る。アイデンティティ管理モジュール１９２８は、クラウドインフラストラクチャシステム１９０２におけるアクセス管理および認可サービスなどのアイデンティティサービスを提供するように構成され得る。いくつかの局面においては、アイデンティティ管理モジュール１９２８は、クラウドインフラストラクチャシステム１９０２によって提供されるサービスを利用したい顧客についての情報を制御し得る。このような情報は、このような顧客のアイデンティティを認証する情報と、それらの顧客がさまざまなシステムリソース（たとえばファイル、ディレクトリ、アプリケーション、通信ポート、メモリセグメントなど）に対してどのアクションを実行することを認可されるかを記載する情報とを含み得る。また、アイデンティティ管理モジュール１９２８は、各々の顧客についての説明的情報、ならびに、どのようにしておよび誰によってこの説明的情報がアクセスおよび変更され得るかについての説明的情報の管理を含み得る。

図２０は、本発明のさまざまな局面を実現することができる例示的なコンピュータシステム２０００を示す。コンピュータシステム２０００は、上記のコンピュータシステムのうちのいずれかを実現するために使用され得る。図に示されているように、コンピュータシステム２０００は、バスサブシステム２００２を介していくつかの周辺サブシステムと通信する処理ユニット２００４を含む。これらの周辺サブシステムは、処理加速ユニット２００６と、Ｉ／Ｏサブシステム２００８と、記憶サブシステム２０１８と、通信サブシステム２０２４とを含み得る。記憶サブシステム２０１８は、有形のコンピュータ読取可能な記憶媒体２０２２と、システムメモリ２０１０とを含む。

バスサブシステム２００２は、コンピュータシステム２０００のさまざまな構成要素およびサブシステムに、意図されたように互いに通信させるための機構を提供する。バスサブシステム２００２は、単一のバスとして概略的に示されているが、バスサブシステムの代替的な局面は、複数のバスを利用してもよい。バスサブシステム２００２は、メモリバスまたはメモリコントローラ、周辺バス、およびさまざまなバスアーキテクチャのうちのいずれかを使用するローカルバスを含むいくつかのタイプのバス構造のうちのいずれかであってもよい。たとえば、このようなアーキテクチャは、ＩＥＥＥＰ２０８６．１標準に合わせて製造されたメザニンバスとして実現可能な、業界標準アーキテクチャ（Industry Standard Architecture：ＩＳＡ）バス、マイクロチャネルアーキテクチャ（Micro Channel Architecture：ＭＣＡ）バス、拡張ＩＳＡ（Enhanced ISA：ＥＩＳＡ）バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション（Video Electronics Standard
s Association：ＶＥＳＡ）ローカルバスおよび周辺機器相互接続（Peripheral Component Interconnect：ＰＣＩ）バスを含み得る。

１つ以上の集積回路（たとえば従来のマイクロプロセッサまたはマイクロコントローラ）として実現可能な処理ユニット２００４は、コンピュータシステム２０００の動作を制御する。処理ユニット２００４には、１つ以上のプロセッサが含まれ得る。これらのプロセッサは、単一コアまたはマルチコアのプロセッサを含み得る。特定の局面においては、処理ユニット２００４は、各々の処理ユニットに含まれる単一コアまたはマルチコアのプロセッサを有する１つ以上の独立した処理ユニット２０３２および／または２０３４として実現されてもよい。また、他の局面においては、処理ユニット２００４は、２つのデュアルコアプロセッサを単一のチップに組み入れることによって形成されるクアッドコア処理ユニットとして実現されてもよい。

さまざまな局面においては、処理ユニット２００４は、プログラムコードに応答してさまざまなプログラムを実行し得るとともに、同時に実行される複数のプログラムまたはプロセスを維持し得る。任意の所与の時点において、実行されるべきプログラムコードのうちのいくつかまたは全ては、処理ユニット２００４および／または記憶サブシステム２０１８に存在し得る。好適なプログラミングを通じて、処理ユニット２００４は、上記のさまざまな機能を提供し得る。また、コンピュータシステム２０００は、加えて、デジタル信号プロセッサ（digital signal processor：ＤＳＰ）、特殊用途プロセッサなどを含み得る処理加速ユニット２００６を含み得る。

Ｉ／Ｏサブシステム２００８は、ユーザインターフェイス入力装置と、ユーザインターフェイス出力装置とを含み得る。ユーザインターフェイス入力装置は、キーボード、マウスまたはトラックボールなどのポインティング装置、タッチパッドまたはタッチスクリーンを含んでいてもよく、これらは、音声コマンド認識システム、マイクロホンおよび他のタイプの入力装置とともに、ディスプレイ、スクロールホイール、クリックホイール、ダイアル、ボタン、スイッチ、キーパッド、オーディオ入力装置に組込まれている。ユーザインターフェイス入力装置は、たとえば、ジェスチャおよび話されたコマンドを用いてナチュラルユーザインターフェースを介してユーザがマイクロソフトＸｂｏｘ（登録商標）３６０ゲームコントローラなどの入力装置を制御して入力装置と対話することを可能にするマイクロソフトキネクト（登録商標）モーションセンサなどのモーション検知および／またはジェスチャ認識装置を含み得る。また、ユーザインターフェイス入力装置は、ユーザから眼球運動（たとえば撮影および／またはメニュー選択を行っている間の「まばたき」）を検出して、当該眼球ジェスチャを入力装置への入力として変換するグーグルグラス（登録商標）まばたき検出器などの眼球ジェスチャ認識装置を含み得る。また、ユーザインターフェイス入力装置は、ユーザが音声コマンドを介して音声認識システム（たとえばＳｉｒｉ（登録商標）ナビゲータ）と対話することを可能にする音声認識検知装置を含み得る。

また、ユーザインターフェイス入力装置は、三次元（３Ｄ）マウス、ジョイスティックまたはポインティングスティック、ゲームパッドおよびグラフィックタブレット、およびスピーカなどのオーディオ／ビジュアル装置、デジタルカメラ、デジタルカムコーダ、携帯型メディアプレーヤ、ウェブカム、画像スキャナ、指紋スキャナ、バーコードリーダ３Ｄスキャナ、３Ｄプリンタ、レーザレンジファインダ、および視線検出装置を含み得るが、これらに限定されるものではない。また、ユーザインターフェイス入力装置は、たとえば、コンピュータ断層撮影、磁気共鳴画像化、位置発光断層撮影、医療用超音波検査装置などの医療用画像化入力装置を含み得る。また、ユーザインターフェイス入力装置は、たとえばＭＩＤＩキーボード、デジタル楽器などのオーディオ入力装置を含み得る。

ユーザインターフェイス出力装置は、ディスプレイサブシステム、表示灯、またはオーディオ出力装置などの非視覚的ディスプレイなどを含み得る。ディスプレイサブシステムは、陰極線管（cathode ray tube：ＣＲＴ）、液晶ディスプレイ（liquid crystal display：ＬＣＤ）またはプラズマディスプレイを使用するものなどのフラットパネルディスプレイ、投影装置、タッチスクリーンなどであってもよい。一般に、「出力装置」という用語の使用は、コンピュータシステム２０００からの情報をユーザまたは他のコンピュータに出力するための全ての実現可能なタイプの装置および機構を含むよう意図されている。たとえば、ユーザインターフェイス出力装置は、モニタ、プリンタ、スピーカ、ヘッドホン、自動車のナビゲーションシステム、プロッタ、音声出力装置およびモデムなどの、テキスト、グラフィックスおよびオーディオ／ビデオ情報を視覚的に伝えるさまざまな表示装置を含み得るが、これらに限定されるものではない。

コンピュータシステム２０００は、現在のところシステムメモリ２０１０内に位置しているように示されているソフトウェア要素を備える記憶サブシステム２０１８を備え得る。システムメモリ２０１０は、処理ユニット２００４上でロード可能および実行可能なプログラム命令と、これらのプログラムの実行中に生成されるデータとを格納し得る。

コンピュータシステム２０００の構成およびタイプに応じて、システムメモリ２０１０は、揮発性（ランダムアクセスメモリ（random access memory：ＲＡＭ）など）であってもよく、および／または、不揮発性（リードオンリメモリ（read-only memory：ＲＯＭ）、フラッシュメモリなど）であってもよい。ＲＡＭは、典型的には、処理ユニット２００４が直ちにアクセス可能なデータおよび／またはプログラムモジュール、および／または、処理ユニット２００４によって現在動作および実行されているデータおよび／またはプログラムモジュールを収容する。いくつかの実現例では、システムメモリ２０１０は、スタティックランダムアクセスメモリ（static random access memory：ＳＲＡＭ）または
ダイナミックランダムアクセスメモリ（dynamic random access memory：ＤＲＡＭ）などの複数の異なるタイプのメモリを含み得る。いくつかの実現例では、始動中などにコンピュータシステム２０００内の要素間で情報を転送することを助ける基本ルーチンを含む基本入力／出力システム（basic input/output system：ＢＩＯＳ）が、典型的にはＲＯＭ
に格納され得る。一例としておよび非限定的に、システムメモリ２０１０は、クライアントアプリケーション、ウェブブラウザ、中間層アプリケーション、リレーショナルデータベース管理システム（relational database management system：ＲＤＢＭＳ）などを含
み得るアプリケーションプログラム２０１２、プログラムデータ２０１４およびオペレーティングシステム２０１６も示す。一例として、オペレーティングシステム２０１６は、マイクロソフトウィンドウズ（登録商標）、アップルマッキントッシュ（登録商標）および／もしくはリナックスオペレーティングシステムのさまざまなバージョン、さまざまな市販のＵＮＩＸ（登録商標）もしくはＵＮＩＸライクオペレーティングシステム（さまざまなＧＮＵ／リナックスオペレーティングシステム、ＧｏｏｇｌｅＣｈｒｏｍｅ（登録商標）ＯＳなどを含むが、これらに限定されるものではない）、ならびに／または、ｉＯＳ、ウィンドウズ（登録商標）フォン、アンドロイド（登録商標）ＯＳ、ブラックベリー（登録商標）１０ＯＳおよびパーム（登録商標）ＯＳオペレーティングシステムなどのモバイルオペレーティングシステムを含み得る。

また、記憶サブシステム２０１８は、いくつかの局面の機能を提供する基本的なプログラミングおよびデータ構造を格納するための有形のコンピュータ読取可能な記憶媒体を提供し得る。プロセッサによって実行されたときに上記の機能を提供するソフトウェア（プログラム、コードモジュール、命令）が記憶サブシステム２０１８に格納され得る。これらのソフトウェアモジュールまたは命令は、処理ユニット２００４によって実行され得る。また、記憶サブシステム２０１８は、本発明に従って使用されるデータを格納するためのリポジトリを提供し得る。

また、記憶サブシステム２０１８は、コンピュータ読取可能な記憶媒体２０２２にさらに接続可能なコンピュータ読取可能な記憶媒体リーダ２０２０を含み得る。ともにおよび任意には、システムメモリ２０１０と組合せて、コンピュータ読取可能な記憶媒体２０２２は、コンピュータ読取可能な情報を一時的および／または永久に収容、格納、送信および検索するための記憶媒体に加えて、リモートの、ローカルの、固定されたおよび／または取外し可能な記憶装置を包括的に表わし得る。

コードまたはコードの一部を含むコンピュータ読取可能な記憶媒体２０２２は、当該技術分野において公知のまたは使用される任意の適切な媒体を含み得る。当該媒体は、情報の格納および／または送信のための任意の方法または技術において実現される揮発性および不揮発性の、取外し可能および取外し不可能な媒体などであるが、これらに限定されるものではない記憶媒体および通信媒体を含む。これは、ＲＡＭ、ＲＯＭ、電子的消去・プログラム可能ＲＯＭ（electronically erasable programmable ROM：ＥＥＰＲＯＭ）、フラッシュメモリもしくは他のメモリ技術、ＣＤ－ＲＯＭ、デジタル多用途ディスク（digital versatile disk：ＤＶＤ）、または他の光学式記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、または他の有形のコンピュータ読取可能な媒体などの有形の一時的なコンピュータ読取可能な記憶媒体を含み得る。また、これは、データ信号、データ送信などの無形の一時的なコンピュータ読取可能な媒体、または、所望の情報を送信するために使用可能であるとともにコンピュータシステム２０００によってアクセス可能である他の任意の媒体を含み得る。

一例として、コンピュータ読取可能な記憶媒体２０２２は、取外し不可能な不揮発性磁気媒体から読取るまたは当該媒体に書込むハードディスクドライブ、取外し可能な不揮発性磁気ディスクから読取るまたは当該ディスクに書込む磁気ディスクドライブ、ならびに、ＣＤＲＯＭ、ＤＶＤおよびブルーレイ（登録商標）ディスクまたは他の光学式媒体などの取外し可能な不揮発性光学ディスクから読取るまたは当該ディスクに書込む光学式ディスクドライブを含み得る。コンピュータ読取可能な記憶媒体２０２２は、ジップ（登録商標）ドライブ、フラッシュメモリカード、ユニバーサルシリアルバス（universal serial bus：ＵＳＢ）フラッシュドライブ、セキュアデジタル（secure digital：ＳＤ）カード、ＤＶＤディスク、デジタルビデオテープなどを含み得るが、これらに限定されるものではない。また、コンピュータ読取可能な記憶媒体２０２２は、フラッシュメモリベースのＳＳＤ、企業向けフラッシュドライブ、ソリッドステートＲＯＭなどの不揮発性メモリに基づくソリッドステートドライブ（solid-state drive：ＳＳＤ）、ソリッドステート
ＲＡＭ、ダイナミックＲＡＭ、スタティックＲＡＭなどの揮発性メモリに基づくＳＳＤ、ＤＲＡＭベースのＳＳＤ、磁気抵抗ＲＡＭ（magnetoresistive RAM：ＭＲＡＭ）ＳＳＤ、およびＤＲＡＭとフラッシュメモリベースのＳＳＤとの組合せを使用するハイブリッドＳＳＤを含み得る。ディスクドライブおよびそれらの関連のコンピュータ読取可能な媒体は、コンピュータ読取可能な命令、データ構造、プログラムモジュールおよび他のデータをコンピュータシステム２０００に提供し得る。

通信サブシステム２０２４は、他のコンピュータシステムおよびネットワークとのインターフェイスを提供する。通信サブシステム２０２４は、他のシステムからデータを受信したり、コンピュータシステム２０００から他のシステムにデータを送信するためのインターフェイスの役割を果たす。たとえば、通信サブシステム２０２４は、コンピュータシステム２０００がインターネットを介して１つ以上の装置に接続することを可能にし得る。いくつかの局面においては、通信サブシステム２０２４は、（たとえば３Ｇ、４ＧまたはＥＤＧＥ（enhanced data rates for global evolution）などの携帯電話技術、高度データネットワーク技術を用いて）無線音声および／またはデータネットワークにアクセスするための無線周波数（radio frequency：ＲＦ）トランシーバコンポーネント、ＷｉＦ
ｉ（ＩＥＥＥ８０２．１０ファミリ標準または他のモバイル通信技術またはそれらの任意の組合せ）、全地球測位システム（global positioning system：ＧＰＳ）レシーバコン
ポーネント、および／または、他のコンポーネントを含み得る。いくつかの局面においては、通信サブシステム２０２４は、無線インターフェイスに加えて、または無線インターフェイスの代わりに、有線ネットワーク接続（たとえばイーサネット）を提供し得る。

また、いくつかの局面においては、通信サブシステム２０２４は、コンピュータシステム２０００を使用し得る１人以上のユーザを代表して、構造化されたおよび／または構造化されていないデータフィード２０２６、イベントストリーム２０２８、イベント更新２０３０などの形態で入力通信を受信し得る。

一例として、通信サブシステム２０２４は、ツイッター（登録商標）フィード、フェースブック（登録商標）更新、リッチ・サイト・サマリ（Rich Site Summary：ＲＳＳ）フ
ィードなどのウェブフィードなどのデータフィード２０２６をリアルタイムでソーシャルメディアネットワークおよび／または他の通信サービスのユーザから受信し、および／または、１つ以上の第三者情報源からリアルタイム更新を受信するように構成され得る。

加えて、通信サブシステム２０２４は、連続的なデータストリームの形態でデータを受信するように構成され得る。当該データは、連続的である場合もあれば本質的に明確な端部をもたない状態で境界がない場合もあるリアルタイムイベントのイベントストリーム２０２８および／またはイベント更新２０３０を含み得る。連続的なデータを生成するアプリケーションの例としては、たとえばセンサデータアプリケーション、金融ティッカ、ネットワーク性能測定ツール（たとえばネットワークモニタリングおよびトラフィック管理アプリケーション）、クリックストリーム分析ツール、自動車交通モニタリングなどを含み得る。

また、通信サブシステム２０２４は、構造化されたおよび／または構造化されていないデータフィード２０２６、イベントストリーム２０２８、イベント更新２０３０などを、コンピュータシステム２０００に結合された１つ以上のストリーミングデータソースコンピュータと通信し得る１つ以上のデータベースに出力するように構成され得る。

コンピュータシステム２０００は、手持ち式携帯機器（たとえばｉＰｈｏｎｅ（登録商標）携帯電話、ｉＰａｄ（登録商標）計算タブレット、ＰＤＡ）、ウェアラブル装置（たとえばグーグルグラス（登録商標）ヘッドマウントディスプレイ）、ＰＣ、ワークステーション、メインフレーム、キオスク、サーバラックまたはその他のデータ処理システムを含むさまざまなタイプのうちの１つであってもよい。

コンピュータおよびネットワークの絶え間なく変化し続ける性質のために、図に示されているコンピュータシステム２０００の説明は、特定の例として意図されているに過ぎない。図に示されているシステムよりも多くのまたは少ない数の構成要素を有する多くの他の構成が可能である。たとえば、ハードウェア、ファームウェア、（アプレットを含む）ソフトウェア、または組合せにおいて、カスタマイズされたハードウェアが使用されてもよく、および／または、特定の要素が実装されてもよい。さらに、ネットワーク入力／出力装置などの他のコンピューティングデバイスへの接続が利用されてもよい。本明細書中に提供される開示および教示に基づいて、当業者は、さまざまな局面を実現するための他の手段および／または方法を理解するであろう。

上述の明細書では、本発明の局面は、その具体的な局面を参照して記載されているが、本発明はこれに限定されるものではないことを当業者は認識するであろう。上述の発明のさまざまな特徴および局面は、個々にまたは一緒に使用されてもよい。さらに、局面は、
明細書のより広い精神および範囲から逸脱することなく、本明細書に記載されているものを越えたいくつもの環境およびアプリケーションでも利用可能である。したがって、明細書および図面は、限定的ではなく例示的なものとみなされるべきである。

Claims

方法であって、
コンピューティングデバイスが質問から質問エンティティを含む質問談話ツリーを構築することを含み、前記質問談話ツリーは、前記質問の基本談話単位間の修辞関係を表し、前記方法はさらに、
前記コンピューティングデバイスがテキストコーパスから初期回答にアクセスすることと、
前記コンピューティングデバイスが、前記初期回答から、回答エンティティを含む回答談話ツリーを構築することとを含み、前記回答談話ツリーは、前記初期回答の基本談話単位間の修辞関係を表し、前記方法はさらに、
前記コンピューティングデバイスが、前記質問エンティティに対する前記回答エンティティの関連性を示すスコアが閾値未満であると判断することと、
前記テキストコーパスから追加の談話ツリーを作成することと、前記追加の談話ツリーは前記質問エンティティを前記回答エンティティと接続する修辞関係を含むと判断することと、前記質問エンティティ、前記回答エンティティ、および前記修辞関係を含む前記追加の談話ツリーのサブツリーを抽出することとによって仮想談話ツリーを生成することと、
前記回答談話ツリーと前記仮想談話ツリーとの組み合わせによって表される回答を出力することとを含む、方法。
前記初期回答にアクセスすることは、
テキストの一部分について回答関連性スコアを判断することと、
前記回答関連性スコアが閾値より大きいと判断することに応答して、前記テキストの一部分を前記初期回答として選択することとを含む、請求項１に記載の方法。
前記仮想談話ツリーは、前記修辞関係を表すノードを含み、前記方法は、前記ノードを前記回答エンティティに接続することによって前記仮想談話ツリーを前記回答談話ツリーに統合することをさらに含む、請求項１に記載の方法。
前記追加の談話ツリーを作成することは、
複数の追加の談話ツリーの各々について、それぞれの追加の談話ツリーにおいて１つ以上の回答エンティティへのマッピングを含む質問エンティティの数を示すスコアを計算することと、
前記複数の追加の談話ツリーから、最も高いスコアを有する追加の談話ツリーを選択することとを含む、請求項１に記載の方法。
前記追加の談話ツリーを作成することは、
複数の追加の談話ツリーの各々について、トレーニングされた分類モデルを（ａ）前記質問談話ツリーおよび（ｂ）それぞれの追加の回答談話ツリーの１つ以上に適用することによってスコアを計算することと、
前記複数の追加の談話ツリーから、最も高いスコアを有する追加の談話ツリーを選択することとを含む、請求項１に記載の方法。
前記質問は、複数のキーワードを含み、前記初期回答にアクセスすることは、
複数の電子文書の検索を行うことにより、前記キーワードを含む検索クエリに基づいて複数の回答を取得することと、
前記複数の回答の各々について、前記質問とそれぞれの回答との間の一致のレベルを示す回答スコアを判断することと、
前記複数の回答の中から、最も高いスコアを有する回答を前記初期回答として選択する
こととを含む、請求項１に記載の方法。
前記スコアを計算することは、
トレーニングされた分類モデルを、（ａ）前記質問談話ツリーおよび（ｂ）前記回答談話ツリーのうちの１つ以上に適用することと、
前記分類モデルから前記スコアを受け取ることとを含む、請求項１に記載の方法。
談話ツリーを構築することは、
複数のフラグメントを含むセンテンスにアクセスすることを含み、少なくとも１つのフラグメントは動詞および複数の単語を含み、各単語は前記フラグメント内において前記単語の役割を含み、各フラグメントは基本談話単位であり、前記談話ツリーを構築することはさらに、
前記複数のフラグメント間の修辞関係を表す談話ツリーを生成することを含み、前記談話ツリーは複数のノードを含み、各非終端ノードは前記複数のフラグメントのうちの２つのフラグメント間の修辞関係を表し、前記談話ツリーの前記ノードの各終端ノードは前記複数のフラグメントのうちの１つに関連付けられる、請求項１に記載の方法。
前記方法は、さらに、前記質問談話ツリーから、質問ルートノードを含む質問コミュニケーション用談話ツリーを判断することを含み、コミュニケーション用談話ツリーは、コミュニケーション行動を含む談話ツリーであり、前記生成することは、さらに、
仮想談話ツリーから回答コミュニケーション用談話ツリーを判断することを含み、前記回答コミュニケーション用談話ツリーは回答ルートノードを含み、前記生成することは、さらに、
前記質問ルートノードと前記回答ルートノードとが同一であると識別することによって、前記コミュニケーション用談話ツリーをマージすることと、
予測モデルを前記マージされたコミュニケーション用談話ツリーに適用することによって、前記質問コミュニケーション用談話ツリーと前記回答コミュニケーション用談話ツリーとの間の相補性のレベルを計算することと、
前記相補性のレベルが閾値を超えると判断することに応答して、前記仮想談話ツリーに対応する最終回答を出力することとを含む、請求項１に記載の方法。
談話ツリーはテキストの複数のフラグメント間の修辞関係を表し、前記談話ツリーは複数のノードを含み、各非終端ノードは前記複数のフラグメントのうちの２つのフラグメント間の修辞関係を表し、前記談話ツリーの前記ノードの各終端ノードは前記複数のフラグメントのうちの１つに関連付けられ、コミュニケーション用談話ツリーを構築することは、
動詞を有する各フラグメントを動詞シグネチャにマッチングすることを含み、前記マッチングすることは、
複数の動詞シグネチャにアクセスすることであって、各動詞シグネチャが前記フラグメントの前記動詞と主題役割のシーケンスとを含み、前記主題役割は前記動詞と関連する単語との間の関係を記述する、前記複数の動詞シグネチャにアクセスすることと、
前記複数の動詞シグネチャの各動詞シグネチャについて、前記フラグメント内の単語の役割に一致する、それぞれのシグネチャの複数の主題役割を判断することと、
前記複数の動詞シグネチャから、特定の動詞シグネチャが最大数の一致を含むことに基づいて、前記特定の動詞シグネチャを選択することと、
前記特定の動詞シグネチャを前記フラグメントに関連付けることとによって行われる、請求項１に記載の方法。
コンピュータにより実現される方法であって、
ある質問について、複数の質問エンティティを含む質問談話ツリーを構築することと、
初期回答から、複数の回答エンティティを含む回答談話ツリーを構築することと、
前記複数の質問エンティティのうちの第１の質問エンティティと前記複数の回答エンティティのうちのある回答エンティティとの間において、前記第１の質問エンティティに対する前記ある回答エンティティの関連性を確立するマッピングを確立することと、
前記複数の質問エンティティのうちの第２の質問エンティティが前記複数の回答エンティティのいずれによっても対処されないと判断することに応答して、追加の回答に対応する追加の談話ツリーを前記回答談話ツリーと組み合わせることによって仮想談話ツリーを生成することと、
前記質問談話ツリーから質問コミュニケーション用談話ツリーを判断することと、
仮想談話ツリーから回答コミュニケーション用談話ツリーを判断することと、
予測モデル前記質問コミュニケーション用談話ツリーおよび前記回答コミュニケーション用談話ツリーを適用することによって前記質問コミュニケーション用談話ツリーと前記回答コミュニケーション用談話ツリーとの間の相補性のレベルを計算することと、
前記相補性のレベルが閾値を超えると判断することに応答して、前記仮想談話ツリーに対応する最終回答を出力することとを含む、コンピュータにより実現される方法。
システムであって、
非一時的コンピュータ実行可能プログラム命令を記憶するコンピュータ読取可能媒体と、
前記コンピュータ読取可能媒体に通信可能に結合され、前記非一時的コンピュータ実行可能プログラム命令を実行するための処理装置とを備え、前記非一時的コンピュータ実行可能プログラム命令を実行することは、動作を実行するように前記処理装置を構成し、前記動作は、
コンピューティングデバイスが質問から質問エンティティを含む質問談話ツリーを構築することを含み、前記質問談話ツリーは、前記質問の基本談話単位間の修辞関係を表し、前記動作はさらに、
前記コンピューティングデバイスがテキストコーパスから初期回答にアクセスすることと、
前記コンピューティングデバイスが、前記初期回答から、回答エンティティを含む回答談話ツリーを構築することとを含み、前記回答談話ツリーは、前記初期回答の基本談話単位間の修辞関係を表し、前記動作はさらに、
前記コンピューティングデバイスが、前記質問エンティティに対する前記回答エンティティの関連性を示すスコアが閾値未満であると判断することと、
前記テキストコーパスから追加の談話ツリーを作成することと、前記追加の談話ツリーは前記質問エンティティを前記回答エンティティと接続する修辞関係を含むと判断することと、前記質問エンティティ、前記回答エンティティ、および前記修辞関係を含む前記追加の談話ツリーのサブツリーを抽出することとによって仮想談話ツリーを生成することと、
前記回答談話ツリーと前記仮想談話ツリーとの組み合わせによって表される回答を出力することとを含む、システム。
前記初期回答にアクセスすることは、
テキストの一部分について回答関連性スコアを判断することと、
前記回答関連性スコアが閾値より大きいと判断することに応答して、前記テキストの一部分を前記初期回答として選択することとを含む、請求項１２に記載のシステム。
前記仮想談話ツリーは、前記修辞関係を表すノードを含み、前記動作は、前記ノードを前記回答エンティティに接続することによって前記仮想談話ツリーを前記回答談話ツリーに統合することをさらに含む、請求項１２に記載のシステム。
前記追加の談話ツリーを作成することは、
複数の追加の談話ツリーの各々について、それぞれの追加の談話ツリーにおいて１つ以上の回答エンティティへのマッピングを含む質問エンティティの数を示すスコアを計算することと、
前記複数の追加の談話ツリーから、最も高いスコアを有する追加の談話ツリーを選択することとを含む、請求項１２に記載のシステム。
前記追加の談話ツリーを作成することは、
複数の追加の談話ツリーの各々について、トレーニングされた分類モデルを（ａ）前記質問談話ツリーおよび（ｂ）それぞれの追加の回答談話ツリーの１つ以上に適用することによってスコアを計算することと、
前記複数の追加の談話ツリーから、最も高いスコアを有する追加の談話ツリーを選択することとを含む、請求項１２に記載のシステム。
前記質問は、複数のキーワードを含み、前記初期回答にアクセスすることは、
複数の電子文書の検索を行うことにより、前記キーワードを含む検索クエリに基づいて複数の回答を取得することと、
前記複数の回答の各々について、前記質問とそれぞれの回答との間の一致のレベルを示す回答スコアを判断することと、
前記複数の回答の中から、最も高いスコアを有する回答を前記初期回答として選択することとを含む、請求項１２に記載のシステム。
前記スコアを計算することは、
トレーニングされた分類モデルを、（ａ）前記質問談話ツリーおよび（ｂ）前記回答談話ツリーのうちの１つ以上に適用することと、
前記分類モデルから前記スコアを受け取ることとを含む、請求項１２に記載のシステム。
談話ツリーを構築することは、
複数のフラグメントを含むセンテンスにアクセスすることを含み、少なくとも１つのフラグメントは動詞および複数の単語を含み、各単語は前記フラグメント内において前記単語の役割を含み、各フラグメントは基本談話単位であり、前記談話ツリーを構築することはさらに、
前記複数のフラグメント間の修辞関係を表す談話ツリーを生成することを含み、前記談話ツリーは複数のノードを含み、各非終端ノードは前記複数のフラグメントのうちの２つのフラグメント間の修辞関係を表し、前記談話ツリーの前記ノードの各終端ノードは前記複数のフラグメントのうちの１つに関連付けられる、請求項１２に記載のシステム。
前記動作はさらに、
前記質問談話ツリーから、質問ルートノードを含む質問コミュニケーション用談話ツリーを判断することを含み、コミュニケーション用談話ツリーは、コミュニケーション行動を含む談話ツリーであり、前記生成することは、さらに、
仮想談話ツリーから回答コミュニケーション用談話ツリーを判断することを含み、前記回答コミュニケーション用談話ツリーは回答ルートノードを含み、前記生成することは、さらに、
前記質問ルートノードと前記回答ルートノードとが同一であると識別することによって、前記コミュニケーション用談話ツリーをマージすることと、
予測モデルを前記マージされたコミュニケーション用談話ツリーに適用することによって、前記質問コミュニケーション用談話ツリーと前記回答コミュニケーション用談話ツリーとの間の相補性のレベルを計算することと、
前記相補性のレベルが閾値を超えると判断することに応答して、前記仮想談話ツリーに対応する最終回答を出力することとを含む、請求項１２に記載のシステム。