JP2023531345A - Improved discourse parsing - Google Patents

Improved discourse parsing Download PDF

Info

Publication number
JP2023531345A
JP2023531345A JP2022546461A JP2022546461A JP2023531345A JP 2023531345 A JP2023531345 A JP 2023531345A JP 2022546461 A JP2022546461 A JP 2022546461A JP 2022546461 A JP2022546461 A JP 2022546461A JP 2023531345 A JP2023531345 A JP 2023531345A
Authority
JP
Japan
Prior art keywords
discourse
tree
text
rhetorical
discourse tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022546461A
Other languages
Japanese (ja)
Other versions
JPWO2021262408A5 (en
Inventor
ガリツキー,ボリス
Original Assignee
オラクル・インターナショナル・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US17/003,593 external-priority patent/US11748572B2/en
Application filed by オラクル・インターナショナル・コーポレイション filed Critical オラクル・インターナショナル・コーポレイション
Publication of JP2023531345A publication Critical patent/JP2023531345A/en
Publication of JPWO2021262408A5 publication Critical patent/JPWO2021262408A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本発明のシステム、デバイス、および方法は、談話ツリーを含む。いくつかの態様では、システムは、テキスト中において基本談話単位を識別することによって談話ツリーを作成する。談話ツリーはノードを含み、各非終端ノードは2つの基本談話単位間の修辞関係を表し、各終端ノードはある基本談話単位に関連付けられる。システムは、談話ツリーの参照センテンスにおいて、タイプ詳述またはジョイントの修辞関係を識別する。システムは、構文一般化スコアのセットのうち最も高い構文一般化スコアを有する候補センテンスを選択する。システムは、候補センテンスに対応する意味的関係を識別する。意味的関係は、候補センテンス中の単語に対応し、候補センテンス中において役割を定義する。システムは、談話ツリーにおいて、修辞関係を、意味的関係に対応する更新された修辞関係に置き換え、それによって、更新された談話ツリーを作成する。The systems, devices, and methods of the present invention include discourse trees. In some aspects, the system creates a discourse tree by identifying basic discourse units in the text. A discourse tree contains nodes, each non-terminal node representing a rhetorical relationship between two basic discourse units, and each terminal node being associated with a basic discourse unit. The system identifies type elaboration or joint rhetorical relations in the reference sentences of the discourse tree. The system selects the candidate sentence with the highest syntactic generalization score from the set of syntactic generalization scores. The system identifies semantic relationships that correspond to candidate sentences. Semantic relationships correspond to words in a candidate sentence and define roles in the candidate sentence. The system replaces rhetorical relations in the discourse tree with updated rhetorical relations corresponding to semantic relations, thereby creating an updated discourse tree.

Description

本開示は、概して言語学に関する。より具体的には、本開示は、改善された談話ツリーの生成に関する。 The present disclosure relates generally to linguistics. More specifically, the present disclosure relates to improved discourse tree generation.

背景
言語学は、言語の科学的研究である。言語学の一態様は、英語などの人間の自然言語へのコンピュータ科学の適用である。プロセッサの速度およびメモリの容量の大幅な増加に起因して、言語学のコンピュータ適用例は増加しつつある。例えば、言語談話のコンピュータ対応分析は、ユーザからの質問に答えることができる自動化されたエージェントなどの多数の適用例を容易にする。しかしながら、そのような適用例は、質問に回答し、ダイアログ管理を実行し、または推奨システムを提供するために、豊富な談話関連情報を活用することができない。
Background Linguistics is the scientific study of language. One aspect of linguistics is the application of computer science to natural human languages such as English. Computer applications of linguistics are increasing due to the tremendous increase in processor speed and memory capacity. For example, computer-aided analysis of linguistic discourse facilitates numerous applications such as automated agents that can answer questions from users. However, such applications fail to leverage rich discourse-related information to answer questions, perform dialog management, or provide recommendation systems.

概要
概して、本発明のシステム、デバイス、および方法は、改善された談話ツリー(discourse trees)に関する。
Overview In general, the systems, devices, and methods of the present invention relate to improved discourse trees.

いくつかの局面では、談話ツリーの精度を改善する方法は、テキスト中において基本談話単位(elementary discourse units)を識別することによってテキストから談話ツリーを作成することを含み、談話ツリーはノードを含み、談話ツリー中のノードの各非終端ノードは2つの基本談話単位間の修辞関係を表し、談話ツリー中のノードの各終端ノードは、ある基本談話単位に関連付けられ、方法はさらに、談話ツリーにおいて、タイプ詳述またはジョイントの修辞関係を識別することを含み、修辞関係は、第1の基本談話単位および第2の基本談話単位を関係付け、第1の基本談話単位および第2の基本談話単位は、参照センテンスを形成し、方法はさらに、候補センテンスのセットの各候補センテンスについて構文一般化スコアを決定することを含み、各候補センテンスは対応する意味的関係を有し、決定することは、候補センテンスと参照センテンスとの間において1つ以上の共通エンティティを識別することと、識別された1つ以上の共通エンティティの数に等しい構文一般化スコアを計算することとを含み、方法はさらに、構文一般化スコアのうち最も高い構文一般化スコアを有する候補センテンスを選択することと、候補センテンスに対応する意味的関係を識別することとを含み、意味的関係は、候補センテンス内の単語に対応し、候補センテンスにおいて役割を定義し、方法はさらに、談話ツリーにおいて、修辞関係を、意味的関係に対応する更新された修辞関係に置き換えることにより、更新された談話ツリーを作成することを含む。 In some aspects, a method of improving accuracy of a discourse tree includes creating a discourse tree from a text by identifying elementary discourse units in the text, the discourse tree comprising nodes, each non-terminal node of a node in the discourse tree representing a rhetorical relationship between two elementary discourse units, each terminal node of a node in the discourse tree being associated with an elementary discourse unit, the method further comprising identifying a rhetorical relationship of type elaboration or joint in the discourse tree. wherein the rhetorical relation relates the first elementary discourse unit and the second elementary discourse unit, the first elementary discourse unit and the second elementary discourse unit forming a reference sentence, the method further comprising determining a syntactic generalization score for each candidate sentence of the set of candidate sentences, each candidate sentence having a corresponding semantic relationship, determining identifying one or more common entities between the candidate sentence and the reference sentence; calculating a syntactic generalization score equal to the number of one or more common entities in the discourse tree, the method further comprising selecting the candidate sentence having the highest syntactic generalization score among the syntactic generalization scores; identifying semantic relationships corresponding to the candidate sentences, the semantic relationships corresponding to words in the candidate sentences and defining roles in the candidate sentences; , including creating an updated discourse tree.

いくつかの態様では、テキストから談話ツリーを作成することは、テキストを分類モデルに提供することと、分類モデルを用いて、第1の基本談話単位と、第2の基本談話単位と、修辞関係とを識別することとを含む。 In some aspects, creating a discourse tree from the text includes providing the text to a classification model and using the classification model to identify a first elementary discourse unit, a second elementary discourse unit, and a rhetorical relation.

いくつかの態様では、更新された修辞関係は、目的、手段、原因、または時間的シーケンスのうちの1つである。 In some aspects, the rhetorical relation updated is one of an end, a means, a cause, or a temporal sequence.

いくつかの態様では、1つ以上の共通エンティティの各々は、候補センテンスと参照センテンスとの間で音声の共通部分を共有する。 In some aspects, each of the one or more common entities shares a common portion of speech between the candidate sentence and the reference sentence.

いくつかの態様では、本方法は、更新された談話ツリーから応答を形成することと、その応答を外部装置に出力することとをさらに含む。 In some aspects, the method further includes forming a response from the updated discourse tree and outputting the response to an external device.

いくつかの態様では、本方法は、各候補センテンスから第1の構文パースツリーを形成することと、参照センテンスから第2の構文パースツリーを形成することとを含み、候補センテンスと参照センテンスとの間において1つ以上の共通エンティティを識別することは、共通エンティティごとに、第1の構文パースツリーおよび第2の構文パースツリーにおいて共通エンティティを識別することを含む。 In some aspects, the method includes forming a first syntactic parsetree from each candidate sentence and forming a second syntactic parsetree from the reference sentence, wherein identifying one or more common entities between the candidate sentence and the reference sentence includes, for each common entity, identifying common entities in the first syntactic partree and the second syntactic partree.

いくつかの態様では、本方法は、動詞を有する各フラグメントを動詞シグネチャに一致させることによって、更新された談話ツリーからコミュニケーション用談話ツリー(a communicative discourse tree)を形成することと、議論を検出するようにトレーニングされた分類モデルをコミュニケーション用談話ツリーに適用することによって、テキストが議論を含むことを識別することと、テキストから応答を形成し、応答を外部装置に出力することとを含む。 In some aspects, the method includes forming a communicative discourse tree from the updated discourse tree by matching each fragment having a verb to a verb signature, identifying that the text contains discourse by applying a classification model trained to detect discourse to the communicative discourse tree, forming a response from the text, and outputting the response to an external device.

いくつかの態様では、本方法は、動詞を有する各フラグメントを動詞シグネチャに一致させることによって、更新された談話ツリーからコミュニケーション用談話ツリーを形成することと、議論を検出するようにトレーニングされた分類モデルをコミュニケーション用談話ツリーに適用することによって、テキストが主張に対応する論証を含むことを識別することと、論理システムを解くことによって、論証の整合性を、それ自体に関して、およびテキストのドメインに関連付けられるドメイン定義節に関して評価することとを含み、論理システムは、主張の項およびドメイン定義節を含む固定部分と、コミュニケーション用談話ツリーからの撤回可能(defeasible)規則のセットおよびコミュニケーション用談話ツリーのコミュニケーション行動からの事実を含む可変部分とを含み、方法はさらに、評価された整合性が閾値よりも大きいと判定することに応答して、テキストからテキスト応答を形成し、テキスト応答を外部装置に出力することを含む。 In some aspects, the method includes forming a communicative discourse tree from the updated discourse tree by matching each fragment having a verb to a verb signature; identifying that the text contains an argument corresponding to an assertion by applying a classification model trained to detect arguments to the communicative discourse tree; , an assertion term and a domain definition clause, and a variable portion including a set of defeasible rules from the communicative discourse tree and facts from the communicative behavior of the communicative discourse tree, the method further comprising forming a text response from the text and outputting the text response to an external device in response to determining that the evaluated consistency is greater than the threshold.

上記の方法は、有形のコンピュータ可読媒体として、ならびに/またはコンピュータプロセッサおよび付属メモリ内で動作するものとして実現され得る。 The methods described above may be implemented as a tangible computer-readable medium and/or operating within a computer processor and associated memory.

一局面に従った例示的な談話ツリー環境を示す図である。FIG. 4 illustrates an exemplary discourse tree environment according to one aspect; 一局面に従った談話ツリーの一例を示す図である。FIG. 3 illustrates an example of a discourse tree according to one aspect; 一局面に従った談話ツリーのさらに別の例を示す図である。FIG. 4 illustrates yet another example of a discourse tree according to one aspect; 一局面に従った例示的なスキーマを示す図である。FIG. 4 illustrates an exemplary schema according to one aspect; 一局面に従った階層型バイナリツリーのノードリンク表現を示す図である。FIG. 4 illustrates a node-link representation of a hierarchical binary tree according to one aspect; 一局面に従った、図5における表現についての例示的なインデントされたテキストエンコーディングを示す図である。6 shows an exemplary indented text encoding for the representation in FIG. 5, according to one aspect; FIG. 一局面に従った、財産税に関する要求例についての例示的な談話ツリーを示す図である。FIG. 12 illustrates an example discourse tree for an example claim regarding property taxes, according to one aspect; 図7に表わされる質問についての例示的な応答を示す図である。FIG. 8 illustrates exemplary responses to the question presented in FIG. 7; 一局面に従った公式の回答についての談話ツリーを示す図である。FIG. 11 shows a discourse tree for a formal answer according to one aspect; 一局面に従った未処理の回答についての談話ツリーを示す図である。FIG. 4 illustrates a discourse tree for raw answers according to one aspect; 一局面に従った、第1のエージェントの主張についてのコミュニケーション用談話ツリーを示す図である。FIG. 10 illustrates a communicative discourse tree for a first agent's claims, according to one aspect; 一局面に従った、第2のエージェントの主張についてのコミュニケーション用談話ツリーを示す図である。FIG. 10 illustrates a communicative discourse tree for a second agent's claims, according to one aspect; 一局面に従った、第3のエージェントの主張についてのコミュニケーション用談話ツリーを示す図である。FIG. 10 illustrates a communicative discourse tree for a third agent's claims, according to one aspect; 一局面に従ったパース交錯を示す図である。FIG. 4 illustrates perspective intersection according to one aspect; 一局面に従った、コミュニケーション用談話ツリーを構築するための例示的なプロセスを示す図である。FIG. 2 illustrates an exemplary process for building a discourse tree for communication, according to one aspect; 一局面に従った、談話ツリーおよびシナリオグラフを示す図である。FIG. 3 shows a discourse tree and scenario graph, according to one aspect; 一局面に従った、要求・応答ペアの形成を示す図である。FIG. 4 illustrates forming a request-response pair, according to one aspect; 一局面に従った、最大の共通サブコミュニケーション用談話ツリーを示す図である。FIG. 4 illustrates a discourse tree for maximal common sub-communications, according to one aspect; 一局面に従った、コミュニケーション用談話ツリーのためのカーネル学習フォーマットでツリーを示す図である。FIG. 4 illustrates a tree in kernel learning format for communication discourse trees, according to one aspect; 一局面に従った、修辞学的合致分類器を実現するのに用いられる例示的なプロセスを示す図である。FIG. 4 illustrates an exemplary process used to implement a rhetorical match classifier, according to one aspect; 一局面に従った、投稿に関してコメントするチャットボットを示す図である。FIG. 10 illustrates a chatbot commenting on a post, according to one aspect; 一局面に従った、投稿に関してコメントするチャットボットを示す図である。FIG. 10 illustrates a chatbot commenting on a post, according to one aspect; 一局面に従った、アルゴリズムテキストについての談話ツリーを示す図である。FIG. 10 illustrates a discourse tree for algorithmic text, according to one aspect; 一局面に従った注釈付きセンテンスを示す図である。FIG. 4 illustrates an annotated sentence according to one aspect; 一局面に従った注釈付きセンテンスを示す図である。FIG. 4 illustrates an annotated sentence according to one aspect; 一局面に従ったダイアログの談話動作を示す図である。FIG. 4 illustrates discourse actions of a dialog according to one aspect; 一局面に従ったダイアログの談話動作を示す図である。FIG. 4 illustrates discourse actions of a dialog according to one aspect; 一態様による例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree according to one aspect; 一態様による例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree according to one aspect; 一態様による例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree according to one aspect; 一態様による例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree according to one aspect; 一態様による例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree according to one aspect; 一態様による例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree according to one aspect; 一態様による例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree according to one aspect; 一態様による例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree according to one aspect; 一態様による、機械学習を用いて議論を判定するための例示的なプロセスを示す。1 illustrates an exemplary process for determining arguments using machine learning, according to one aspect; 一態様による談話ツリーのフラグメントである。4 is a fragment of a discourse tree according to one aspect; 一態様による境界線レビューのための談話ツリーを示す。4 illustrates a discourse tree for boundary review according to one aspect; 一態様による、感情分析に対する複合的意味論的手法を示す文の談話ツリーを示す。1 illustrates a discourse tree of sentences illustrating a complex semantic approach to sentiment analysis, according to one aspect; 一態様による、論証を検証するための例示的な方法を示す。1 illustrates an exemplary method for validating an argument, according to one aspect; 一態様による論証の例示的なコミュニケーション用談話ツリーを示す。1 illustrates an exemplary communicative discourse tree of an argument according to one aspect; 一態様による、撤回可能論理プログラミングを用いて論証を検証するための例示的な方法を示す。1 illustrates an exemplary method for validating an argument using reversible logic programming, according to one aspect. 一態様による例示的な弁証法的ツリーを示す。1 illustrates an exemplary dialectical tree according to one aspect; 一態様による、談話ツリーおよびセマンティックツリーを示す。1 illustrates a discourse tree and a semantic tree, according to one aspect; 一態様による、談話ツリーおよびセマンティックツリーを示す。1 illustrates a discourse tree and a semantic tree, according to one aspect; 一態様による、改善された談話ツリーを生成するための例示的なプロセスのフローチャートである。1 is a flowchart of an exemplary process for generating an improved discourse tree, according to one aspect; 一態様による、既知の意味的関係での文およびテンプレートの一般化を示す。FIG. 4 illustrates generalization of sentences and templates with known semantic relationships, according to one aspect. 一態様による、2つの文の間の整合を示す。FIG. 11 illustrates a match between two sentences, according to one aspect; FIG. 態様のうちの1つを実現するための分散システムの簡略図を示す。1 shows a simplified diagram of a distributed system for implementing one of the aspects; FIG. 一態様による、態様システムの構成要素によって提供されるサービスがクラウドサービスとして提供され得る、システム環境の構成要素の簡略ブロック図である。1 is a simplified block diagram of components of a system environment in which services provided by components of aspect systems may be provided as cloud services, according to one aspect; FIG. 本発明の様々な態様が実現され得る例示的なコンピュータシステムを示す。1 illustrates an exemplary computer system in which various aspects of the invention may be implemented;

詳細な説明
本明細書に開示される態様は、コンピュータにより実現される言語学の分野に対する技術的改善を提供する。より具体的には、開示される解決策は、テキストの意味的表現の意味的関係から談話ツリーの更新された修辞関係を決定することによって、改善された談話ツリーを生成する。改善された談話ツリーは、ダイアログ管理、推論、議論検出、検索、およびナビゲーションなどの、談話ツリーを用いる改善された適用例を可能にすることができる。改善された談話ツリーは、コミュニケーション行動で拡張することができ、それによってコミュニケーション用談話ツリー(「CDT」)を形成する。コミュニケーション行動は、個人相互の熟慮および議論に基づいて個人によって行われる協調的行動である。
DETAILED DESCRIPTION Aspects disclosed herein provide technical improvements to the field of computer-implemented linguistics. More specifically, the disclosed solution generates an improved discourse tree by determining updated rhetorical relations of the discourse tree from the semantic relations of the semantic expressions of the text. Improved discourse trees can enable improved applications using discourse trees, such as dialog management, reasoning, argument detection, retrieval, and navigation. The improved discourse tree can be augmented with communicative behaviors, thereby forming a communicative discourse tree (“CDT”). Communicative behavior is collaborative behavior undertaken by individuals based on mutual deliberation and discussion.

したがって、いくつかの態様の技術的利点は、ソーステキストをより正確に表す談話ツリーと、CDTを用いてテキスト内の議論を検証することができる自律エージェントなどの改善された自律エージェントとを含む。例えば、CDTは、文間の合意を判定するため、またはテキスト内の議論を検出もしくは検証するために用いられることができる。有効論証は、例えば論理的に整合する論証であり、その論証のテキストはその論証の前提をサポートする。 Accordingly, technical advantages of some aspects include discourse trees that more accurately represent source texts and improved autonomous agents, such as autonomous agents that can verify arguments within texts using CDT. For example, CDT can be used to determine agreement between sentences, or to detect or verify arguments within a text. A valid argument is, for example, an argument that is logically consistent and whose text supports the premises of the argument.

より具体的には、コミュニケーション行動を識別するラベルを組込むことにより、コミュニケーション用談話ツリーの学習が、基本談話単位(EDU)の単純に修辞学的な関係および構文よりも豊富な特徴セットにわたって生じ得る。そのような特徴セットを用いると、分類などの追加の技法を用いて、質問と回答との間または要求・応答ペア間の修辞学的合致のレベルを判断することができ、テキスト内の議論を検出し、テキスト内の議論を検証し、それによって、改善された自動化されたエージェントを可能にする。そうする際に、コンピューティングシステムは、質問に知的に回答することができる自律型エージェントを可能にする。 More specifically, by incorporating labels that identify communicative behaviors, learning of communicative discourse trees can occur across feature sets that are richer than the purely rhetorical relationships and syntax of elementary discourse units (EDUs). With such a feature set, additional techniques such as classification can be used to determine the level of rhetorical agreement between questions and answers or between request-response pairs, detect arguments in text, and validate arguments in text, thereby enabling improved automated agents. In doing so, computing systems enable autonomous agents that can intelligently answer questions.

別の例では、コンピューティングデバイス上で実行される修辞学的分類アプリケーションは、ユーザから質問を受取る。修辞学的分類アプリケーションは、質問についてのコミュニケーション用談話ツリーを生成する。コミュニケーション用談話ツリーは、コミュニケーション行動を含む談話ツリーである。修辞学的分類アプリケーションは、質問に対する起こり得る回答のデータベースにアクセスする。予測モデルを用いて、修辞学的合致アプリケーションは、質問と起こり得る各回答との間の相補性(complementarity)のレベルを判断する。相補性のレベルがしきい値を上回っていると判断したことに応じて、修辞学的合致分類器は、たとえば表示装置を介してユーザに回答を提供する。 In another example, a rhetorical classification application executing on a computing device receives a question from a user. A rhetorical taxonomy application generates a communicative discourse tree for a question. A communicative discourse tree is a discourse tree containing communicative behaviors. A rhetorical classification application accesses a database of possible answers to questions. Using predictive models, the rhetorical matching application determines the level of complementarity between the question and each possible answer. In response to determining that the level of complementarity is above the threshold, the rhetorical match classifier provides an answer to the user, eg, via a display device.

別の例では、修辞学的分類アプリケーションは、入力テキストからコミュニケーション用談話ツリー(CDT)を生成し、機械学習を用いてテキストのサブセットにおいて議論を検証する。修辞学的分類アプリケーションは、コミュニケーション用談話ツリーから事実および撤回可能規則を抽出することによって論理プログラムを作成し、事実および撤回可能規則を、撤回可能論理プログラミング(DeLP:defeasible logic programming)などの論理システムに提供する。次に、論理システムは、固定ルールおよびドメイン固有定義節にアクセスし、論理プログラムを解き、それによって、議論が有効である(たとえば、論証が主張をサポートする)か無効である(例えば、論証は主張をサポートしない)かを決定する。 In another example, a rhetorical classification application generates a communicative discourse tree (CDT) from input text and uses machine learning to validate arguments in a subset of the text. Rhetorical taxonomy applications create logic programs by extracting facts and retractable rules from a communicative discourse tree, and provide facts and retractable rules to logic systems such as defeasible logic programming (DeLP). The logic system then accesses the fixed rules and domain-specific definition clauses and solves the logic program, thereby determining whether the argument is valid (e.g., the argument supports the claim) or invalid (e.g., the argument does not support the claim).

特定の定義
「修辞構造理論(rhetorical structure theory)」は、この明細書中において用いられる場合、談話の一貫性の分析を可能にし得る論理基礎を提供した調査および研究の分野である。
Specific Definitions "Rhetorical structure theory", as used herein, is a field of research and research that has provided a logical foundation that can enable the analysis of discourse coherence.

「談話ツリー」または「DT(discourse tree)」は、この明細書中において用いられる場合、センテンスの一部をなすセンテンスについての修辞関係を表現する構造を指している。 A "discourse tree" or "DT", as used herein, refers to a structure that expresses rhetorical relationships about sentences forming part of a sentence.

「修辞関係」、「修辞関係性」、「一貫性関係」または「談話関係」は、この明細書中において用いられる場合、談話のうち2つのセグメントが互いに如何に論理的に接続されているかを述べている。修辞関係の例は詳述、対比および属性を含む。 "Rhetoric relation", "rhetorical relation", "consistency relation" or "discourse relation" as used herein describes how two segments of discourse are logically connected to each other. Examples of rhetorical relationships include elaboration, contrast and attribution.

「センテンスフラグメント」または「フラグメント」は、この明細書中において用いられる場合、センテンスの残りから分割することができるセンテンスの一部である。フラグメントは基本談話単位である。たとえば、「Dutch accident investigators say that evidence points to pro-Russian rebels as being responsible for shooting down the plane(オランダの事故調査員は、証拠が、飛行機の撃墜をロシア支持派の反乱分子によるものであると示唆していると述べている)」というセンテンスの場合、2つのフラグメントは、「Dutch accident investigators say that evidence points to pro-Russian rebels」および「as being responsible for shooting down the plane」である。フラグメントは動詞を含み得るが、必ずしも動詞を含んでいる必要はない。 A "sentence fragment" or "fragment" as used herein is a portion of a sentence that can be separated from the rest of the sentence. Fragments are basic discourse units. For example, in the sentence "Dutch accident investigators say that evidence points to pro-Russian rebels as being responsible for shooting down the plane," the two fragments are "Dutch accident investigators say that evidence points to pro-Russian rebels" and "as being responsible for shooting down the plane." A fragment may, but need not, contain a verb.

「シグネチャ」または「フレーム」は、この明細書中において用いられる場合、フラグメントにおける動詞の特性を指している。各々のシグネチャは1つ以上の主題役割を含み得る。たとえば、「Dutch accident investigators say that evidence points to pro-Russian rebels」というフラグメントの場合、動詞は「say」であり、動詞「say」をこのように特別に使用している場合のシグネチャは「エージェント動詞トピック」であり得る。この場合、「investigators」はエージェントであり、「evidence」はトピックである。 A "signature" or "frame" as used herein refers to a verb characteristic in a fragment. Each signature may contain one or more thematic roles. For example, for the fragment "Dutch accident investigators say that evidence points to pro-Russian rebels", the verb may be "say" and the signature for this particular use of the verb "say" may be "agent verb topic." In this case, "investigators" are agents and "evidence" are topics.

「主題役割」は、この明細書中において用いられる場合、1つ以上の単語の役割を記述するのに用いられるシグネチャの構成要素を指している。上述の例に続いて、「エージェント」および「トピック」は主題役割である。 "Thematic role", as used herein, refers to the component of a signature used to describe the role of one or more words. Continuing with the example above, "agent" and "topic" are subject roles.

「核性(nuclearity)」は、この明細書中において用いられる場合、どのテキストセグメント、フラグメントまたはスパンが書き手の目的の中心により近いかを指している。核はより中心的なスパンであり、衛星はそれほど中心的ではない。 "Nuclearity" as used herein refers to which text segment, fragment or span is closer to the writer's center of purpose. The core is the more central span and the satellites are less central.

「一貫性(coherency)」は、この明細書中において用いられる場合、2つの修辞関係をともにリンクするものを指している。 "Coherency", as used herein, refers to what links two rhetorical relationships together.

「コミュニケーション動詞(communicative verb)」は、この明細書中において用いられる場合、コミュニケーションを示す動詞である。たとえば、「否定する(deny)」という動詞はコミュニケーション動詞である。 A "communicative verb," as used herein, is a verb that indicates communication. For example, the verb "deny" is a communicative verb.

「コミュニケーション行動」は、この明細書中において用いられる場合、1以上のエージェントによって実行される行動、およびエージェントの主題を記述するものである。 A "communicative action" as used herein describes an action performed by one or more agents and the subject matter of the agents.

本明細書で用いられる場合、「主張」は、何かの真実の表明である。例えば、主張は、「今月に賃借料を支払う責任を負わない」または「賃借料が遅れている」とすることができる。 As used herein, a "claim" is a true statement of something. For example, a claim may be "I am not responsible for paying rent this month" or "I am late on rent."

本明細書で用いられる場合、「論証」は、主張をサポートするために述べられる理由または理由のセットである。上記主張の例示的な論証は、「必要な修復が完了しなかった」である。 As used herein, an "argument" is a reason or set of reasons stated to support a claim. An exemplary argument for the above claim is "necessary repairs were not completed."

本明細書で用いられる場合、「論証有効性」または「有効性」は、主張をサポートする論証が内部的かつ整合性があるかどうかを指す。内部整合性は、論証がそれ自体と整合性があるかどうか、例えば、2つの矛盾する記述を含まないかどうかを指す。外部整合性は、論証が既知の事実およびルールと整合するかどうかを指す。 As used herein, "argument validity" or "effectiveness" refers to whether the arguments supporting a claim are internal and consistent. Internal consistency refers to whether an argument is consistent with itself, eg, does not contain two conflicting statements. External consistency refers to whether an argument is consistent with known facts and rules.

本明細書で用いる「論理システム」または「論理プログラム」は、特定の主張の議論を表すことができる命令、ルール、事実、および他の情報のセットである。論理システムを解くことは、議論が有効であるかどうかの判定をもたらす。 As used herein, a "logical system" or "logical program" is a set of instructions, rules, facts, and other information that can represent an argument for a particular argument. Solving the logic system yields a determination of whether the argument is valid.

本明細書で用いる「弁証法的ツリー(dialectic tree)」は、個々の論証を表すツリーである。弁証法的ツリーを解いて、個々の論証によってサポートされる主張の真偽を判定する。弁証法的ツリーを評価することは、個々の論証の妥当性を判定することを伴う。 As used herein, a "dialectic tree" is a tree that represents individual arguments. Solve the dialectical tree to determine the truth or falsity of the claims supported by each argument. Evaluating the dialectical tree involves determining the validity of individual arguments.

図1は、一態様による例示的な談話ツリー環境を示す。図1は、コンピューティングデバイス101、入力テキスト130、および議論インジケータ165を示す。コンピューティングデバイス101は、アプリケーション102、談話パーサ104、回答データベース105、修辞学的合致分類器120、およびトレーニングデータ125のうちの1つ以上を含む。コンピューティングデバイスの例は、図49および図50にそれぞれ示されるデバイス4902,4904,4906および4908、ならびにクラウドコンピューティングデバイス5002およびクライアントデバイス5004、5006、5008を含む。 FIG. 1 illustrates an exemplary discourse tree environment according to one aspect. FIG. 1 shows computing device 101 , input text 130 and discussion indicator 165 . Computing device 101 includes one or more of application 102 , discourse parser 104 , answer database 105 , rhetorical match classifier 120 , and training data 125 . Examples of computing devices include devices 4902, 4904, 4906 and 4908 shown in Figures 49 and 50, respectively, as well as cloud computing device 5002 and client devices 5004, 5006, 5008.

ある例では、アプリケーション102は、これまでのソリューションに関してよりも高い品質および/または精度を有する談話ツリーを生成する。ある例では、談話パーサ104は、入力テキスト130から談話ツリーを生成する。アプリケーション102は、談話ツリーを分析し、抽象的意味表現(AMR)グラフなどの意味的表現を生成する。AMRは意味的表現言語である。AMRグラフは、全文を含む、根付き、ラベル付き、有向、非巡回グラフ(DAG)である。AMRグラフから、本明細書に開示される技法を用いて、アプリケーション102は、改善された談話ツリーを生成し、それは、次に、談話分析を実行するために用いられ得る。改善された談話ツリーを作成するためのプロセスの例は、図45に関して論じられる。 In some examples, the application 102 generates discourse trees with higher quality and/or accuracy than with previous solutions. In one example, discourse parser 104 generates a discourse tree from input text 130 . Application 102 analyzes discourse trees and generates semantic representations, such as abstract semantic representation (AMR) graphs. AMR is a semantic expression language. AMR graphs are full-text, rooted, labeled, directed, acyclic graphs (DAGs). From the AMR graph, using the techniques disclosed herein, application 102 generates an improved discourse tree, which can then be used to perform discourse analysis. An example process for creating an improved discourse tree is discussed with respect to FIG.

別の例では、アプリケーション102は、チャットセッションを介して受信された質問に回答する。入力テキスト130は、単一の質問または質問のストリームであり得る。アプリケーション102は、入力テキスト130から質問コミュニケーション用談話ツリーを作成し、1つ以上の候補回答を選択する。回答は、回答データベース105などの既存のデータベースから取得することができる。入力テキスト130は、携帯電話、スマートフォン、タブレット、ラップトップ、スマートウォッチなどの任意のモバイルデバイスによって生成され得る。モバイルデバイスは、データネットワークを介してコンピューティングデバイス101に通信することができる。このようにして、モバイルデバイスは、たとえばユーザからの質問をコンピューティングデバイス101に提供することができる。 In another example, application 102 answers questions received via chat sessions. Input text 130 can be a single question or a stream of questions. Application 102 creates a discourse tree for question communication from input text 130 and selects one or more candidate answers. Answers can be obtained from existing databases, such as answer database 105 . Input text 130 may be generated by any mobile device such as a mobile phone, smart phone, tablet, laptop, smartwatch. Mobile devices can communicate with computing device 101 over a data network. In this way, the mobile device can provide the computing device 101 with questions from the user, for example.

例を続けると、候補回答から、アプリケーション102は、最も好適な回答を判断する。異なる方法を用いることができる。一局面においては、アプリケーション102は、各候補回答ごとに候補回答コミュニケーション用談話ツリーを作成し、質問コミュニケーション用談話ツリーを各候補談話ツリーと比較し得る。アプリケーション102は、質問コミュニケーション用談話ツリーと候補回答コミュニケーション用談話ツリーとの間の最適な一致を識別する。アプリケーション102は、次いで、最適なコミュニケーション用談話ツリーからテキストについてのデータベースにアクセスするかまたは問合せを行う。アプリケーション102は、次いで、第2のコミュニケーション用談話ツリーに関連付けられたテキストをモバイルデバイスに送る。 Continuing the example, from the candidate answers, application 102 determines the most suitable answer. Different methods can be used. In one aspect, application 102 may create a discourse tree for candidate answer communication for each candidate answer and compare the discourse tree for question communication to each candidate discourse tree. Application 102 identifies the best match between the discourse tree for question communication and the discourse tree for candidate answer communication. Application 102 then accesses or queries the database for text from the optimal communicative discourse tree. Application 102 then sends the text associated with the second communication discourse tree to the mobile device.

別の例では、アプリケーション102は、回答候補ごとに回答コミュニケーション用談話ツリーを作成する。次いで、アプリケーション102は、各回答候補について、入力テキスト130および回答候補を含む質問-回答ペアを作成する。アプリケーション102は、質問-回答ペアを修辞学的合致分類器120などの予測モデルに提供する。トレーニングされた修辞学的合致分類器120を用いて、アプリケーション102は、質問-回答ペアが、例えば、回答が質問に対処するかどうかを示す、一致の閾値レベルを上回るかどうかを判定する。そうでない場合、アプリケーション102は、好適な回答が見つかるまで、質問および異なる回答を含む追加のペアを分析し続ける。コミュニケーション用談話ツリーを用いることによって、質問と回答との間の修辞学的合致およびコミュニケーション行動を正確にモデル化することができる。 In another example, application 102 creates a discourse tree for answer communication for each answer candidate. Application 102 then creates a question-answer pair that includes input text 130 and a candidate answer for each candidate answer. Application 102 provides question-answer pairs to a predictive model, such as rhetorical match classifier 120 . Using the trained rhetorical match classifier 120, the application 102 determines whether a question-answer pair exceeds a threshold level of match, eg, indicating whether the answer addresses the question. Otherwise, application 102 continues to analyze additional pairs containing questions and different answers until a suitable answer is found. By using a communicative discourse tree, rhetorical agreement and communicative behavior between questions and answers can be accurately modeled.

さらなる例では、アプリケーション102は、修辞学的合致分類器120を用いて、入力テキスト130に議論が存在するか存在しないかを判定する。例えば、修辞学的分類アプリケーション102は、以下のような入力テキスト130にアクセスする:"[t]he rent was properly refused....The landlord contacted me, the tenant, and the rent was requested.(賃料の支払いは適切に拒否された……家主から私、つまり入居者に連絡があり、賃料を請求された。)However, I refused the rent since I demanded repair to be done.(しかし、修理が行われることを依頼していたので、賃料の支払いを断った。)I reminded the landlord about necessary repairs, but the landlord issued the three-day notice confirming that the rent was overdue.(家主に必要な修理について念押ししたが、家主は賃料が滞っていることを確認する3日前通知を出した。)Regretfully, the property still stayed unrepaired."( 残念ながら、物件はまだ修理されていないままだった。)したがって、入力テキスト130は、"the rent was properly refused"という主張と、"The landlord contacted me, the tenant, and the rent was requested. However, I refused the rent since I demanded repair to be done. I reminded the landlord about necessary repairs, but the landlord issued the three-day notice confirming that the rent was overdue. Regretfully, the property still stayed unrepaired."という関連する論証とを含む。 In a further example, application 102 uses rhetorical match classifier 120 to determine whether an argument is present or absent in input text 130 . For example, the rhetorical classification application 102 accesses input text 130 that reads: "[t]he rent was properly refused.... The landlord contacted me, the tenant, and the rent was requested. However, I refused the rent since I demanded repair to be done." I reminded the landlord about necessary repairs, but the landlord issued the three-day notice confirming that the rent was overdue.Regretfully, the property still stayed unrepaired." However, I refused the rent since I demanded repair to be done. I reminded the landlord about necessary repairs, but the landlord issued the three-day notice confirming that the rent was overdue. Regretfully, the property still stayed unrepaired."

議論を検出するために、アプリケーション102は、入力テキスト130からコミュニケーション用談話ツリーを判断し、そのコミュニケーション用談話ツリーを、修辞学的合致分類器120などのトレーニングされた分類器に提供する。アプリケーション102は、修辞学的合致分類器120から議論が存在するかどうかの予測を受け取る。アプリケーション102は、その予測を議論インジケータ165として提供する。修辞学的合致分類器120は、コミュニケーション用談話ツリーを、トレーニングセットにおいて陽性(議論)または陰性(議論なし)として識別されたコミュニケーション用談話ツリーと比較する。例示的なプロセスは、図36に関して論じられる。 To detect arguments, application 102 determines a communicative discourse tree from input text 130 and provides the communicative discourse tree to a trained classifier, such as rhetorical matching classifier 120 . Application 102 receives a prediction of whether an argument exists from rhetorical match classifier 120 . Application 102 provides that prediction as discussion indicator 165 . The rhetorical match classifier 120 compares the communicative discourse trees to those identified as positive (argument) or negative (no argument) in the training set. An exemplary process is discussed with respect to FIG.

さらに別の態様では、アプリケーション102は、入力テキスト130に存在する議論を検証することができる。例示的なプロセスは、図40に関して論じられる。ある例では、アプリケーション102は、たとえば、修辞学的合致分類器120を用いることによって、議論の存在を判断する。次いで、アプリケーション102は、検出された論証が有効か無効かを判断することができる。撤回可能論理プログラミングを用いることができる。ある例示的なプロセスが、図42に関して論じられる。アプリケーション102は、議論が検出されたかどうかを示すことができる議論インジケータ165を出力することができ、検出された場合には、論証が有効であるか無効であるかを示すことができる。 In yet another aspect, application 102 can validate arguments present in input text 130 . An exemplary process is discussed with respect to FIG. In one example, application 102 determines the existence of an argument by using rhetorical match classifier 120, for example. Application 102 can then determine whether the detected argument is valid or invalid. Reversible logic programming can be used. One exemplary process is discussed with respect to FIG. Application 102 may output an argument indicator 165 that may indicate whether an argument has been detected, and if so, indicate whether the argument is valid or invalid.

修辞学構造理論および談話ツリー
言語学は言語についての科学的研究である。たとえば、言語学は、センテンス(構文)の構造、たとえば、主語-動詞-目的語、センテンス(セマンティックス)の意味、たとえば、「dog bites man(犬が人を噛む)」に対して「man bites dog(人が犬を噛む)」、さらに、話し手が会話中に行うこと、すなわち、談話分析またはセンテンスの範囲を超えた言語の分析、を含み得る。
Rhetorical Structural Theory and Discourse Trees Linguistics is the scientific study of language. For example, linguistics can include the structure of sentences (syntax), e.g., subject-verb-object, the meaning of sentences (semantics), e.g., "man bites dog" versus "dog bites man," and what speakers do during conversation, i.e., discourse analysis or analysis of language beyond sentences.

談話の理論上の基礎(修辞構造理論(Rhetoric Structure Theory:RST))は、Mann、WilliamおよびThompson、Sandraによる「Rhetorical structure theory: A Theory ofText organization」(Text-Interdisciplinary Journal for the Study of Discourse)8(3):243-281: 1988)によるものであり得る。プログラミング言語理論の構文およびセマンティックスが現代のソフトウェアコンパイラの可能化に如何に役立ったのかと同様に、RSTは談話の分析の可能化に役立った。より具体的には、RSTは、構造ブロックを少なくとも2つのレベルで想定している。2つのレベルは、核性および修辞関係などの第1のレベルと、構造またはスキーマの第2のレベルとを含む。談話パーサーまたは他のコンピュータソフトウェアは、テキストを談話ツリーにパース(構文解析)することができる。 The theoretical basis for discourse (Rhetoric Structure Theory (RST)) can be attributed to Mann, William and Thompson, Sandra, "Rhetorical structure theory: A Theory of Text organization" (Text-Interdisciplinary Journal for the Study of Discourse) 8(3):243-281: 1988). Just as the syntax and semantics of programming language theory have helped enable modern software compilers, RST has helped enable the analysis of discourse. More specifically, RST envisions building blocks on at least two levels. The two levels include a first level such as nuclearity and rhetorical relations and a second level of structure or schema. A discourse parser or other computer software can parse the text into a discourse tree.

修辞構造理論は、テキストの部分間の関係に依存して、テキストの論理的構成(書き手によって用いられる構造)をモデル化する。RSTは、談話ツリーを介してテキストの階層型の接続された構造を形成することによって、テキスト一貫性をシミュレートする。修辞関係は、同等のクラスおよび下位のクラスに分割される。これらの関係は、2つ以上のテキストスパンにわたって維持されるので、一貫性を実現する。これらのテキストスパンを基本談話単位(EDU)と称する。センテンス中の節およびテキスト中のセンテンスは、著者によって論理的に接続される。所与のセンテンスの意味は前のセンテンスおよび次のセンテンスの意味と関係がある。節同士の間のこの論理関係はテキストの一貫性構造と称される。RSTは、ツリー状の談話構造、談話ツリー(discourse tree:DT)に基づいた、談話について最も普及している理論のうちの1つである。DTの葉部は、EDU(連続する原子的なテキストスパン)に対応する。隣接するEDUは、より高いレベルの談話単位を形成する一貫性関係(たとえば、属性、シーケンス)によって接続されている。これらの単位は、さらに、この関係リンクにも従属する。関係によってリンクされたEDUは、さらに、それぞれの相対的重要性に基づいて区別される。核は関係の核心部分であり、衛星は周辺部分である。上述したように、正確な要求・応答ペアを判断するために、トピックおよび修辞学的合致がともに分析される。話し手がフレーズまたはセンテンスなどの質問に回答するとき、話し手の回答はこの質問のトピックに対処していなければならない。質問が暗示的に形成されている場合、メッセージのシードテキストを介することで、トピックを維持するだけでなくこのシードについての一般化された認識状態とも一致するような適切な回答が期待される。 Rhetorical structure theory models the logical organization of a text (the structure used by the writer) in dependence on the relationships between parts of the text. RST simulates textual coherence by forming a hierarchical, connected structure of text via discourse trees. Rhetorical relations are divided into peer classes and subclasses. These relationships are maintained across two or more text spans, thus providing consistency. These text spans are called elementary discourse units (EDUs). Clauses within a sentence and sentences within a text are logically connected by the author. The meaning of a given sentence is related to the meaning of the previous sentence and the next sentence. This logical relationship between clauses is called the coherence structure of the text. RST is one of the most popular theories of discourse, based on a tree-like discourse structure, the discourse tree (DT). The leaves of DT correspond to EDUs (contiguous atomic text spans). Adjacent EDUs are connected by coherence relations (eg, attributes, sequences) that form higher-level discourse units. These units are also subordinate to this relationship link. EDUs linked by relationships are further differentiated based on their relative importance. The core is the core part of the relationship and the satellite is the peripheral part. As noted above, topical and rhetorical matches are analyzed together to determine the correct request-response pair. When a speaker answers a question such as a phrase or sentence, the speaker's answer must address the topic of the question. If the question is implicitly formulated, then through the seed text of the message, we expect an appropriate answer that not only maintains the topic but also matches the generalized state of awareness about this seed.

修辞関係
上述したように、この明細書中に記載されるいくつかの局面はコミュニケーション用談話ツリーを用いている。修辞関係はさまざまな方法で説明することができる。たとえば、MannおよびThompsonは23の実現可能な関係について記載している。C. Mann, William & Thompson, Sandra(1987)(「Mann and Thompson」)による「Rhetorical Structure Theory: A Theory of Text Organization)がある。他のいくつかの関係も実現可能である。
Rhetorical Relations As noted above, some aspects described in this specification use discourse trees for communication. Rhetorical relations can be explained in various ways. For example, Mann and Thompson describe 23 possible relationships. There is "Rhetorical Structure Theory: A Theory of Text Organization" by C. Mann, William & Thompson, Sandra (1987) ("Mann and Thompson") Several other relationships are possible.

Figure 2023531345000002
Figure 2023531345000002

いくつかの経験的研究は、大多数のテキストが核-衛星関係を用いて構築されていることを前提としている。MannおよびThompsonを参照されたい。しかしながら、他の関係は、核の有限選択を伴わない。このような関係の例を以下に示す。 Some empirical studies assume that the majority of texts are constructed using nuclear-satellite relationships. See Mann and Thompson. However, other relationships do not involve a finite selection of nuclei. Examples of such relationships are shown below.

Figure 2023531345000003
Figure 2023531345000003

図2は、一局面に従った談話ツリーの例を示す。図2は談話ツリー200を含む。談話ツリーは、テキストスパン201、テキストスパン202、テキストスパン203、関係210、および関係228を含む。図2における数は3つのテキストスパンに対応する。図3は、1、2、3と番号付けられた3つのテキストスパン付きの以下のテキスト例に相当する。 FIG. 2 shows an example discourse tree according to one aspect. FIG. 2 includes discourse tree 200 . The discourse tree includes text spans 201 , text spans 202 , text spans 203 , relations 210 and relations 228 . The numbers in FIG. 2 correspond to three text spans. FIG. 3 corresponds to the following text example with three text spans numbered 1, 2, 3:

1.ホノルル(ハワイ)はハワイの歴史に関する2017年の会議の開催地になるだろう(Honolulu, Hawaii will be site of the 2017 Conference on Hawaiian History)。 1. Honolulu, Hawaii will be site of the 2017 Conference on Hawaiian History.

2.米国およびアジアから200人の歴史家が参加することが期待される(It is expected that 200 historians from the U.S. and Asia will attend)。 2. It is expected that 200 historians from the U.S. and Asia will attend.

3.会議はポリネシア人がハワイまでどのように航海したかに関する(The conference will be concerned with how the Polynesians sailed to Hawaii)。 3. The conference will be concerned with how the Polynesians sailed to Hawaii.

たとえば、関係210または詳述は、テキストスパン201とテキストスパン202との間の関係を記載する。関係228は、テキストスパン203とテキストスパン204との間の関係(詳述)を示す。示されるように、テキストスパン202および203はテキストスパン201をさらに詳述している。上述の例においては、読み手に会議を通知することが目的であると想定すると、テキストスパン1が核である。テキストスパン2および3は、会議に関するより多くの詳細を提供する。図2において、水平方向に並んだ数(たとえば1-3、1、2、3)は、(場合によってはさらに別のスパンで構成された)テキストのスパンをカバーしており、垂直な線は核または複数の核を示している。曲線は修辞関係(詳述)を表わしており、矢印の方向は衛星から核を指している。テキストスパンのみが、核としてではなく衛星として機能する場合、衛星を削除しても依然としてテキストには一貫性が残るだろう。図2から核を削除する場合、テキストスパン2および3を理解することが困難になる。 For example, relationship 210 or specification describes the relationship between text span 201 and text span 202 . Relationship 228 indicates the relationship (detailed) between text span 203 and text span 204 . As shown, text spans 202 and 203 elaborate on text span 201 . In the example above, text span 1 is the kernel, assuming the purpose is to notify the reader of a meeting. Text spans 2 and 3 provide more details about the meeting. In FIG. 2, the horizontal numbers (eg, 1-3, 1, 2, 3) cover spans of text (possibly composed of further spans), and the vertical lines indicate a kernel or kernels. The curve represents the rhetorical relationship (detailed), the direction of the arrow pointing from the satellite to the nucleus. If only text spans acted as satellites instead of cores, removing the satellites would still leave the text consistent. If we remove the kernel from FIG. 2, text spans 2 and 3 become difficult to understand.

図3は、一局面に従った談話ツリーのさらなる例を示す。図3は、構成要素301および302、テキストスパン305~307、関係310、および関係328を含む。関係310は、構成要素306と構成要素305との間、および構成要素307と構成要素305との間の関係310(可能化)を示す。図3は以下のテキストスパンを指している:
1.新しい技術報告の要約は、現在、簡略版辞典付近の蔵書の雑誌領域にあります(The new Tech Report abstracts are now in the journal area of the library near the abridged dictionary)。
FIG. 3 shows a further example of a discourse tree according to one aspect. FIG. 3 includes components 301 and 302 , text spans 305 - 307 , relation 310 and relation 328 . Relationships 310 show relationships 310 (enablings) between components 306 and 305 and between components 307 and 305 . Figure 3 points to the following text spans:
1. The new Tech Report abstracts are now in the journal area of the library near the abridged dictionary.

2.閲覧に興味のある方はご署名ださい(Please sign your name by any means that you would be interested in seeing)。 2. Please sign your name by any means that you would be interested in seeing.

3.登録の最終日は5月31日です(Last day for sign-ups is 31 May)。
図から分かるように、関係328は、エンティティ307とエンティティ306との関係、すなわち可能化、を示している。図3は、複数の核を入れ子状にすることができるが、最も核性のある1つのテキストスパンだけが存在することを例示している。
3. Last day for sign-ups is 31 May.
As can be seen, relationship 328 indicates the relationship, or enablement, between entity 307 and entity 306 . FIG. 3 illustrates that multiple kernels can be nested, but there is only one text span with the most kernels.

談話ツリーの構築
談話ツリーはさまざまな方法を用いて生成することができる。DTボトムアップ(DT bottom up)を構築するための方法の単純な例は以下のとおりである:
(1)以下の(a)および(b)によって談話テキストを複数単位に分割する。
Building Discourse Trees Discourse trees can be generated using a variety of methods. A simple example of how to build a DT bottom up is:
(1) Divide the discourse text into multiple units according to the following (a) and (b).

(a)単位サイズが分析の目的に応じて変わる可能性がある。
(b)典型的には単位は節である。
(a) unit size may vary depending on the purpose of analysis;
(b) typically the unit is a clause;

(2)各々の単位およびそれぞれの隣接単位を検査する。それらの間に関係が保たれているか?
(3)関係が保たれている場合、その関係に印を付ける。
(2) Examine each unit and each adjacent unit. Are there relationships between them?
(3) Mark the relationship if it holds.

(4)関係が保たれていない場合、その単位はより高いレベルの関係の境界にある可能性がある。より大きな単位(スパン)同士の間に保たれている関係に注目する。 (4) If the relationship does not hold, the unit may be on the border of a higher level relationship. Note the relationships held between larger units (spans).

(5)テキスト中のすべての単位が把握されるまで続ける。
MannおよびThompsonはまた、スキーマ・アプリケーションと呼ばれるブロック構造の構築の第2のレベルを記載している。RSTにおいては、修辞関係が、テキスト上に直接マッピングされず、それらはスキーマ・アプリケーションと呼ばれる構造上に適合され、これらはさらにテキストに適合される。スキーマ・アプリケーションは、(図4によって示されるような)スキーマと呼ばれる、より単純な構造に由来している。各々のスキーマは、テキストの特定の単位が如何にしてより小さなテキスト単位に分解されるかを示している。修辞構造ツリーまたはDTは、スキーマ・アプリケーションの階層システムである。スキーマ・アプリケーションは、いくつかの連続するテキストスパンをリンクさせ、複雑なテキストスパンを作成する。複雑なテキストスパンはさらに、より高レベルのスキーマ・アプリケーションによってリンクされ得る。RSTの主張によれば、すべての一貫した談話の構造を単一の修辞構造ツリーによって記述することができ、その最上位のスキーマによって談話全体を包含するスパンが作成される。
(5) Continue until all units in the text are captured.
Mann and Thompson also describe a second level of building block structures called schema applications. In RST, rhetorical relations are not mapped directly onto the text, they are fitted onto constructs called schema applications, which are further fitted onto the text. Schema applications derive from a simpler structure called a schema (as illustrated by FIG. 4). Each schema indicates how a particular unit of text can be decomposed into smaller units of text. A rhetorical structure tree or DT is a hierarchical system of schema applications. Schema applications link several consecutive text spans to create complex text spans. Complex text spans can also be linked by higher level schema applications. RST argues that the structure of all coherent discourse can be described by a single rhetorical structure tree, whose top-level schema creates spans that encompass the entire discourse.

図4は、一局面に従った例示的なスキーマを示す。図4は、ジョイントスキーマが、核から成るが衛星を含まないアイテムのリストであることを示す。図4はスキーマ401~406を示す。スキーマ401は、テキストスパン410とテキストスパン428との状況関係を示す。スキーム402は、テキストスパン420とテキストスパン421とのシーケンス関係、およびテキストスパン421とテキストスパン422とのシーケンス関係を示す。スキーマ403は、テキストスパン430とテキストスパン431との対比関係を示す。スキーマ404は、テキストスパン440とテキストスパン441とのジョイント関係を示す。スキーマ405は、450と451との動機づけ関係、および452と451との可能化関係を示す。スキーマ406は、テキストスパン460とテキストスパン462とのジョイント関係を示す。ジョイント方式の一例が、以下の3つのテキストスパンに関して図4に示される。 FIG. 4 shows an exemplary schema according to one aspect. FIG. 4 shows that the joint schema is a list of items that consist of nuclei but do not contain satellites. FIG. 4 shows schemas 401-406. Schema 401 shows the contextual relationship between text spans 410 and text spans 428 . Scheme 402 shows the sequence relationship between text spans 420 and 421 and between text spans 421 and 422 . Schema 403 shows a contrasting relationship between text span 430 and text span 431 . Schema 404 shows the joint relationship between text span 440 and text span 441 . Schema 405 shows the motivation relationship between 450 and 451 and the enablement relationship between 452 and 451 . Schema 406 shows the joint relationship between text span 460 and text span 462 . An example joint scheme is shown in FIG. 4 for the following three text spans.

1.本日、ニューヨーク首都圏における天候は部分的に晴天となるでしょう(Skies will be partly sunny in the New York metropolitan area today)。 1. Skies will be partly sunny in the New York metropolitan area today.

2.温度は華氏80度半ばで湿度はより高くなるでしょう(It will be more humid, with temperatures in the middle 80’s)。 2. It will be more humid, with temperatures in the middle 80's.

3.今晩、おおむね曇りとなり、華氏65度から70度と低温になるでしょう(Tonight will be mostly cloudy, with the low temperature between 65 and 70)。 3. Tonight will be mostly cloudy, with the low temperature between 65 and 70.

図2~図4は、談話ツリーをいくつかのグラフで表示しているが、他の表現も可能である。 2-4 show discourse trees in several graphical representations, other representations are possible.

図5は、一局面に従った階層型バイナリツリーのノードリンク表現を示す。図5から分かるように、DTの葉部は基本談話単位(EDU)と呼ばれる、連続するが重複しないテキストスパンに相当する。隣接するEDU同士は、関係(たとえば詳述、属性…)によって接続されており、関係によって接続されるより大きな談話単位を形成している。「RSTにおける談話分析は2つのサブタスクを含む。談話セグメンテーションはEDUを識別するタスクであり、談話構文解析は、談話単位をラベル付けされたツリーにリンクするタスクである。」Joty, Shafiq RおよびGiuseppe Carenini, Raymond T Ng,およびYashar Mehdad(2013年)による、「Combining intra-and multi-sentential rhetorical parsing for document-level discourse analysis」(ACL (1), pages 486-496)を参照されたい。 FIG. 5 shows a node-linked representation of a hierarchical binary tree according to one aspect. As can be seen from FIG. 5, the leaves of the DT correspond to contiguous but non-overlapping text spans called elementary discourse units (EDUs). Adjacent EDUs are connected by relations (eg, descriptions, attributes...) and form larger discourse units connected by relations. "Discourse analysis in RST includes two subtasks: discourse segmentation is the task of identifying EDUs, and discourse parsing is the task of linking discourse units into labeled trees." Joty, Shafiq R and Giuseppe Carenini, Raymond T Ng, and Yashar Mehdad (2013), "Combining intra-and multi-sentential rhetorical parsing for document-level discourse analysis" (ACL (1), pages 486-496).

図5は、ツリー上の葉部または終端ノードであるテキストスパンを示しており、図6に示されるテキスト全体に現われる順序で番号付けされている。図5はツリー500を含む。ツリー500は、たとえばノード501~507を含む。ノードは関係性を示す。ノードは、ノード501などの非終端ノードまたはノード502~507などの終端ノードである。図から分かるように、ノード503および504はジョイントの関係性によって関連づけられている。ノード502、505、506および508は核である。点線は、ブランチまたはテキストスパンが衛星であることを示している。これらの関係は灰色のボックスにおけるノードである。 FIG. 5 shows text spans that are leaves or terminal nodes on the tree, numbered in the order in which they appear throughout the text shown in FIG. FIG. 5 includes tree 500 . Tree 500 includes, for example, nodes 501-507. Nodes show relationships. The nodes may be non-terminal nodes such as node 501 or terminal nodes such as nodes 502-507. As can be seen, nodes 503 and 504 are related by a joint relationship. Nodes 502, 505, 506 and 508 are kernels. Dotted lines indicate that branches or text spans are satellites. These relationships are the nodes in the gray boxes.

図6は、一局面に従った、図5における表現についての例示的なインデントされたテキストエンコーディングを示す。図6はテキスト600をおよびテキストシーケンス602~604を含む。テキスト600は、コンピュータプログラミングにより適用し易い態様で表わされている。テキストシーケンス602はノード502に対応する。シーケンス603はノード503に対応する。シーケンス604はノード504に対応する。図6においては、「N」は核を示し、「S」は衛星を示す。 FIG. 6 shows exemplary indented text encoding for the representation in FIG. 5, according to one aspect. FIG. 6 includes text 600 and text sequences 602-604. Text 600 is represented in a manner more amenable to computer programming. Text sequence 602 corresponds to node 502 . Sequence 603 corresponds to node 503 . Sequence 604 corresponds to node 504 . In FIG. 6, "N" indicates the nucleus and "S" indicates the satellite.

談話パーサの例
自動的な談話セグメンテーションはさまざまな方法で実行することができる。たとえば、或るセンテンスを想定すると、セグメンテーションモデルは、センテンスにおける各々の特定のトークンの前に境界が挿入されるべきであるかどうかを予測することによって、複合的な基本談話単位の境界を識別する。たとえば、1つのフレームワークは、センテンス内の各トークンを連続的に独立して考慮に入れる。このフレームワークにおいては、セグメンテーションモデルは、トークンによってセンテンストークンをスキャンし、サポートベクトルマシンまたはロジスティック回帰などの二進法分類を用いて、検査されているトークンの前に境界を挿入することが適切であるかどうかを予測する。別の例においては、タスクは連続的にラベル付けする際の問題である。テキストが基本談話単位にセグメント化されると、センテンスレベルの談話構文解析を実行して談話ツリーを構築することができる。機械学習技術を用いることができる。
Discourse Parser Example Automatic discourse segmentation can be performed in a variety of ways. For example, given a sentence, the segmentation model identifies boundaries of complex elementary discourse units by predicting whether a boundary should be inserted before each particular token in the sentence. For example, one framework considers each token in a sentence independently in succession. In this framework, the segmentation model scans sentence token by token and uses binary classification such as support vector machines or logistic regression to predict whether it is appropriate to insert a boundary before the token being examined. In another example, the task is a continuous labeling problem. Once the text is segmented into basic discourse units, sentence-level discourse parsing can be performed to build a discourse tree. Machine learning techniques can be used.

本発明の一局面においては、構成要素の構文に依拠するCoreNLPProcessorおよび依存性構文を用いるFastNLPProcessorという2つの修辞構造理論(RST)談話パーサが用いられる。Surdeanu, Mihai & Hicks, Thomas & Antonio Valenzuela-Escarcega, Marcoによる「Two Practical Rhetorical Structure Theory Parsers」(2015)を参照されたい。 In one aspect of the invention, two Rhetorical Structure Theory (RST) discourse parsers are used, the CoreNLPProcessor, which relies on component syntax, and the FastNLPProcessor, which uses dependency syntax. See Surdeanu, Mihai & Hicks, Thomas & Antonio Valenzuela-Escarcega, Marco, "Two Practical Rhetorical Structure Theory Parsers" (2015).

加えて、上述の2つの談話パーサ、すなわち、CoreNLPProcessorおよびFastNLPProcessorは、自然言語処理(Natural Language Processing:NLP)を構文解析に用いる。たとえば、Stanford CoreNLPは、会社、人々などの名前であろうとなかろうとスピーチの部分である複数単語の基本形状を提示し、日付、時間および数値量を標準化し、フレーズおよび構文依存の点からセンテンスの構造に印を付け、どの名詞句が同じエンティティを指しているかを示す。実際には、RSTは依然として、談話の多くの場合に機能し得る理論であるが、場合によっては機能しない可能性もある。どんなEDUが一貫したテキスト中にあるか、すなわち、どんな談話セグメンタが用いられているか、どんな関係のインベントリが用いられているか、EDUのためにどんな関係が選択されているか、トレーニングおよびテストのために用いられるドキュメントのコーパス、さらには、どんなパーサが用いられているか、を含むがこれらに限定されない多くの変数が存在している。このため、たとえば、Surdeanu他による上述の論文「Two Practical Rhetorical Structure Theory Parsers」においては、どのパーサがよりよい性能を与えるかを判断するために、特化されたメトリクスを用いて特定のコーパス上でテストを実行しなければならない。このため、予測可能な結果をもたらすコンピュータ言語パーサとは異なり、談話パーサ(およびセグメンタ)は、トレーニングおよび/またはテストのテキストコーパスに応じて、予測不可能な結果をもたらす可能性がある。したがって、談話ツリーは、予測可能な技術(たとえば、コンパイラ)と(たとえば、どの組合わせが所望の結果をもたらし得るかを判断するのに実験が必要となる化学のような)予測不可能な技術とを混合したものとなる。 In addition, the two discourse parsers mentioned above, CoreNLPProcessor and FastNLPProcessor, use Natural Language Processing (NLP) for parsing. For example, Stanford CoreNLP presents basic shapes for multiwords that are parts of speech, whether or not they are the names of companies, people, etc., normalizes dates, times and numerical quantities, marks the structure of sentences in terms of phrase and syntactic dependence, and indicates which noun phrases refer to the same entity. In practice, RST is still a theory that can work in many cases of discourse, but it may not work in some cases. There are many variables including, but not limited to, what EDUs are in the coherent text, i.e. what discourse segmenters are used, what inventory of relations is used, what relations are selected for EDUs, the corpus of documents used for training and testing, and even what parsers are used. Thus, for example, in the above-mentioned paper by Surdeanu et al., "Two Practical Rhetorical Structure Theory Parsers," tests must be run on a particular corpus with specialized metrics to determine which parser gives better performance. Thus, unlike computer language parsers, which yield predictable results, discourse parsers (and segmenters) can yield unpredictable results, depending on the training and/or testing text corpus. Thus, discourse trees are a mixture of predictable techniques (e.g., compilers) and unpredictable techniques (e.g., chemistry that requires experimentation to determine which combinations can produce desired results).

談話分析が如何に優れているかを客観的に判断するために、たとえば、Daniel Marcuの「The Theory and Practice of Discourse Parsing and Summarization」(MIT Press)(2000)によるPrecision/Recall/F1(精度/再現度/F1)測定基準などの一連のメトリクスが用いられている。精度または肯定的な予測値は検索されたインスタンス中の関連するインスタンスのごく一部であるとともに、(感度としても公知である)再現度は、関連するインスタンスの総量にわたって検索された関連するインスタンスのごく一部である。したがって、精度および再現度はともに、関連性についての理解および基準に基づいている。写真中の犬を認識するためのコンピュータプログラムが12匹の犬および何匹かの猫を含む写真中に8匹の犬を識別すると想定する。識別された8匹の犬のうち、5匹は実際に犬(真陽性)であるが残りは猫(擬陽性)である。プログラムの精度は5/8であり、その再現度は5/12である。検索エンジンが30ページを戻すがそのうち20ページしか関連しておらず、追加の関連する40ページを戻してこなかった場合、その精度は20/30=2/3であり、その再現度は20/60=1/3である。したがって、この場合、精度は「検索結果がどれくらい有用であるか」であり、再現度は、「結果はどれくらい完全であるか」である。F1スコア(F-スコアまたはF-基準)はテストの精度の基準である。それは、スコアを計算するためにテストの精度および再現度の両方を考慮に入れる。F1=2x(精度x再現度)/(精度+再現度))であり、精度と再現度との調和平均である。F1スコアは、1(完全な精度および再現度)でその最適値に達し、0で最悪値に達する。 To objectively judge how good discourse analysis is, a set of metrics is used, for example, the Precision/Recall/F1 metric by Daniel Marcu, "The Theory and Practice of Discourse Parsing and Summarization" (MIT Press) (2000). Accuracy, or positive predictive value, is the fraction of relevant instances among retrieved instances, while recall (also known as sensitivity) is the fraction of relevant instances retrieved over the total amount of relevant instances. Therefore, both precision and recall are based on understanding and criteria for relevance. Suppose a computer program for recognizing dogs in pictures identifies 8 dogs in a picture containing 12 dogs and some cats. Of the 8 dogs identified, 5 are actually dogs (true positives) and the rest are cats (false positives). The accuracy of the program is 5/8 and its recall is 5/12. If a search engine returns 30 pages, but only 20 of them are relevant, and does not return an additional 40 relevant pages, its accuracy is 20/30=2/3 and its recall is 20/60=1/3. So, in this case, precision is "how useful are the search results" and recall is "how complete are the results?" The F1 score (F-score or F-criterion) is a measure of test accuracy. It takes into account both precision and recall of the test to calculate the score. F1=2×(precision×recall)/(precision+recall)), which is the harmonic mean of precision and recall. The F1 score reaches its optimum value at 1 (perfect precision and recall) and its worst value at 0.

自律型エージェントまたはチャットボット
人Aと人Bとの間の会話は談話の一形式である。たとえば、FaceBook(登録商標)メッセンジャ、WhatsApp(登録商標)、Slack(登録商標)、SMSなどのアプリケーションが存在し、AとBとの間の会話は、典型的には、より従来型の電子メールおよび音声会話に加えて、メッセージを介するものであってもよい。(知的なボットまたは仮想アシスタントなどと称されることもある)チャットボットは、「知的な」マシンであって、たとえば、人Bと置き換わって、2人の人同士の間の会話をさまざまな程度に模倣する。究極の目的の一例としては、人Aは、Bが人であるかまたはマシンであるかどうか区別できないようにすることである(1950年にAlan Turingによって開発されたチューリング(Turning)テスト)。談話分析、機械学習を含む人工知能および自然言語処理は、チューリングテストに合格するという長期目標に向かって大きく発展してきた。当然ながら、コンピュータにより、莫大なデータのリポジトリを検索および処理して、予測的分析を含めるようにデータに対して複雑な分析を行うことも次第に可能になってきており、長期目標は、人のようなチャットボットとコンピュータとを組合わせることである。
Autonomous Agents or Chatbots A conversation between person A and person B is a form of discourse. For example, there are applications such as FaceBook Messenger, WhatsApp, Slack, SMS, etc., and conversations between A and B typically may be via messages in addition to more traditional email and voice conversations. Chatbots (sometimes referred to as intelligent bots or virtual assistants, etc.) are "intelligent" machines that, for example, replace person B and mimic a conversation between two people to varying degrees. An example ultimate goal is for person A to be unable to distinguish whether B is a person or a machine (Turning test developed by Alan Turing in 1950). Artificial intelligence and natural language processing, including discourse analysis, machine learning, have come a long way toward the long-term goal of passing the Turing test. Of course, computers are also increasingly capable of searching and processing vast repositories of data and performing complex analyzes on the data, including predictive analytics, and the long-term goal is to combine human-like chatbots with computers.

たとえば、ユーザは、会話のやり取りによってインテリジェント・ボット・プラットホームと対話することができる。会話型ユーザインターフェイス(user interface:UI)と呼ばれるこの対話は、ちょうど2人の人の間で交わされるようなエンドユーザとチャットボットとの間のダイアログである。これは、エンドユーザがチャットボットに「Hello(こんにちは)」と発言し、チャットボットが「Hi(やあ)」と返答し、さらにチャットボットが用件が何かをユーザに尋ねる、という程度に単純であり得るか、または、1つの口座から別の口座に送金するなどの銀行業務チャットボットによる業務処理上の対話であり得るか、または、休暇バランスをチェックするなどのHRチャットボットでの情報のやり取り、もしくは、返品を如何に処理するかなどの小売りチャットボットでのFAQへの質問であり得る。他のアプローチと組み合わされた自然言語処理(NLP)および機械学習(machine learning:ML)アルゴリズムを用いて、エンドユーザの意図を分類することができる。高レベルの意図はエンドユーザが達成したいこと(たとえば、勘定残高を得て購入する)である。意図は、本質的には、バックエンドが実行すべき作業の単位に入力された顧客のマッピングである。したがって、チャットボットでユーザによって発せられたフレーズに基づいて、これらは、たとえば、残高照会、送金および支出の追跡のための特定の別個の使用事例または作業単位に対してマッピングされるものであり、エンドユーザが自然言語で入力する自由なテキストエントリからどの作業単位がトリガされなければならないかをチャットボットがサポートして解決することができるはずであるすべての「使用事例」である。 For example, users can interact with the intelligent bot platform through conversational exchanges. This interaction, called a conversational user interface (UI), is a dialogue between an end-user and a chatbot, just like between two people. This could be as simple as the end-user saying "Hello" to the chatbot, the chatbot replying "Hi", and the chatbot asking the user what the business is about, or it could be a transactional interaction with a banking chatbot, such as transferring money from one account to another, or an exchange of information in a HR chatbot, such as checking a vacation balance, or asking an FAQ in a retail chatbot, such as how to handle returns. can be Natural language processing (NLP) and machine learning (ML) algorithms combined with other approaches can be used to classify end-user intent. A high-level intent is what the end-user wants to accomplish (eg, get an account balance and make a purchase). An intent is essentially a mapping of customers entered into units of work that the backend should perform. Thus, based on the phrases uttered by the user in the chatbot, these map to specific distinct use cases or units of work, e.g., for balance inquiries, money transfers, and tracking expenses, all "use cases" that the chatbot should be able to support and resolve which units of work must be triggered from free text entry that the end user inputs in natural language.

AIチャットボットに人のように応答させるための根本的な原理は、人の脳が要求を策定して理解することができるとともに、さらに、マシンよりもはるかに優れた人の要求に対して優れた応答を返すことができる点にある。したがって、人Bが模倣される場合、チャットボットの要求/応答は著しく改善されていなければならない。そうすると、この問題の最初の部分は、人の脳が要求を如何に策定して理解するかである。模倣のためにモデルが用いられる。RSTおよびDTは、これを実行する形式的かつ反復可能な方法を可能にする。 The underlying principle behind making AI chatbots respond like humans is that the human brain is able to formulate and understand requests, as well as being able to respond better to human requests, much better than machines. Therefore, if Person B is imitated, the chatbot's request/response should be significantly improved. So the first part of the problem is how the human brain formulates and understands requests. Models are used for imitation. RST and DT allow a formal and repeatable way to do this.

高レベルでは、典型的には、2つのタイプの要求がある。具体的には、(1)何らかの行動を実行するようにとの要求、および(2)情報についての要求(たとえば質問)である。第1のタイプは、作業単位が作成される応答を有する。第2のタイプは、質問に対する応答(すなわち、たとえば、優れた回答)を有する。回答は、たとえばいくつかの局面において、広範囲な知識ベースから、または、インターネットもしくはイントラネットまたは他の公的または私的に利用可能なデータソースを探索することによって最適な既存の回答に一致させることから、回答を構築するAIの形を取り得る。 At a high level, there are typically two types of requests. Specifically, (1) a request to perform some action, and (2) a request for information (eg, a question). The first type has a response in which a unit of work is created. The second type has responses to questions (ie, good answers, for example). Answers may, for example, in some aspects take the form of AI constructing answers from extensive knowledge bases or from matching the best existing answers by searching the internet or intranet or other publicly or privately available data sources.

コミュニケーション用談話ツリーおよび修辞学的分類器
本開示の局面はコミュニケーション用談話ツリーを構築するとともに、コミュニケーション用談話ツリーを用いて、要求または質問の修辞構造が回答に合致しているかどうかを分析する。より具体的には、この明細書中に記載される局面は、要求・応答ペアの表現を作成し、これらの表現を学習し、ペアを有効なペアまたは無効なペアのクラスに関連づける。このような態様で、自律型エージェントはユーザから質問を受取り、たとえば複数の回答を検索することによって質問を処理し、複数の回答の中から最適な回答を判断して、ユーザに対して回答を提供することができる。
Communicative Discourse Trees and Rhetorical Classifiers Aspects of the present disclosure build and use communicative discourse trees to analyze whether the rhetorical structure of a request or question matches an answer. More specifically, aspects described herein create representations of request-response pairs, learn these representations, and associate pairs with classes of valid or invalid pairs. In this manner, an autonomous agent can receive a question from a user, process the question, for example, by retrieving multiple answers, determine the best answer among the multiple answers, and provide the answer to the user.

より具体的には、テキストの言語特徴を表現するために、この明細書中に記載される局面は、修辞関係および発話動作(またはコミュニケーション行動)を用いる。修辞関係は、典型的には談話ツリーから得られるセンテンスの部分同士の関係性である。発話動作は、VerbNetなどの動詞リソースからの動詞として得られる。修辞関係およびコミュニケーション行動の両方を用いることによって、この明細書中に記載される複数の局面は、有効な要求・応答ペアを正確に認識することができる。そうするために、複数の局面は、質問の構文構造を回答の構文構造と相互に関連付ける。当該構造を用いることにより、より優れた回答を決定することができる。 More specifically, the aspects described herein employ rhetorical relations and speech actions (or communicative actions) to express the linguistic features of text. A rhetorical relation is a relation between parts of a sentence, typically obtained from a discourse tree. Speech actions are obtained as verbs from a verb resource such as VerbNet. By using both rhetorical relationships and communicative behaviors, the aspects described herein can accurately recognize valid request-response pairs. To do so, multiple aspects correlate the syntactic structure of the question with the syntactic structure of the answer. By using the structure, a better answer can be determined.

たとえば、或る人が特定の特徴を備えたアイテムを販売したいと希望していることを示す表示を自律型エージェントがこの人から受け取った場合、この自律型エージェントは、当該特徴を含んでいるだけではなく購入する意図も示している検索結果を提供するはずである。このような態様で、自律型エージェントはユーザの意図を判断した。同様に、自律型エージェントが特定のアイテムについての情報を共有するようにとの要求を或る人から受取った場合、検索結果は、推薦を受け取る意図を含んでいるはずである。或る人がトピックに関する意見について自律型エージェントに質問する場合、自律型エージェントは、別の意見を求めるのではなく、主題に関する意見を共有する。 For example, if an autonomous agent receives an indication from a person that he or she wishes to sell an item with a particular characteristic, the autonomous agent should provide search results that not only contain that characteristic but also indicate an intent to purchase. In this manner, the autonomous agent has determined the user's intent. Similarly, if an autonomous agent receives a request from someone to share information about a particular item, the search results should include an intent to receive recommendations. When a person asks an autonomous agent about its opinion on a topic, the autonomous agent shares its opinion on the subject rather than soliciting another's opinion.

要求および応答のペアの分析
図7は、一局面に従った、財産税に関する要求例についての例示的な談話ツリーを示す。ノードラベルは関係であり、矢印付きの線は衛星を指している。核は実線である。図7は以下のテキストを示す。
Analysis of Request-Response Pairs FIG. 7 illustrates an exemplary discourse tree for a request example regarding property taxes, according to one aspect. Node labels are relations and lines with arrows point to satellites. Nuclei are solid lines. Figure 7 shows the following text.

要求:「My husbands’ grandmother gave him his grandfather’s truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck. By the time it came to sending off the title and getting the tag, I didn't have the money to do so. Now, due to circumstances, I am not going to be able to afford the truck. I went to the insurance place and was refused a refund. I am just wondering that since I am not going to have a tag on this truck, is it possible to get the property tax refunded?(私の夫の祖母が彼に彼の祖父のトラックを与えました。彼女は所有権を譲渡しましたが、私の夫には自身の免許に対する未払いの罰金があったため、彼はトラックを自身の名義に入れることができませんでした。私は自分の名義に入れたかったので、財産税を納付し、トラック用の保険に入りました。所有権を取り寄せて識別票を得るときには、私はそうするだけのお金を持っていませんでした。現在、状況によっては、私はトラックを所有するだけの余裕がなくなるでしょう。私は保険代理店を訪れましたが、払い戻しは拒否されました。私は、このトラックに識別票を付けることができないのであれば、財産税を払い戻してもらうことができるのではないかと考えています)」。 Request: “My husbands’ grandmother gave him his grandfather’s truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck. refund. I am just wondering that since I am not going to have a tag on this truck, is it possible to get the property tax refunded?(My husband's grandmother gave him his grandfather's truck. She transferred the ownership but my husband had an outstanding fine against his license so he couldn't put the truck in his name. I wanted it in my name so I paid the property tax and got insurance for the truck. I got the property tax refunded and got the property tax refunded. Sometimes I didn't have the money to do so.Now, depending on the circumstances, I won't be able to afford to own the truck.I have visited the insurance agent and have been denied a refund.I'm wondering if I can get my property tax refunded if I can't put an identification tag on this truck."

応答:「The property tax is assessed on property that you own. Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax. If you apply late, there will be penalties on top of the normal taxes and fees. You don't need to register it at the same time, but you absolutely need to title it within the period of time stipulated in state law(財産税は、あなたが所有する財産に課されるものです。あなたがそれを登録しないことを選択しただけですので、これは、あなたがそれを所有していないことを意味するものではありません。したがいまして、税を払い戻すことはできません。あなたがまだ乗物の権利を得ていないとしても、あなたは依然として課税区画の境界内に当該乗物を所有していますので、税金を払わなくてはなりません。なお、いずれの州においても、所有権の譲渡および利用税の納付のためにあなたに与えられている時間には制限があることに留意してください。あなたの申請が遅れた場合には、普通税および通常料金に加えて罰金が課されることになるでしょう。あなたは、乗物を同時に登録する必要はありませんが、州の法律で規定された期間内に確実にその権利を得る必要があります)」
図7から分かるように、上述のテキストを分析することにより、以下の結果が得られる。「My husbands’ grandmother gave him his grandfather’s truck」は、「I wanted to put in my name」、「and paid the property tax」、および「and got insurance for the truck」という表現によって詳述される「having unpaid fines on his license, he was not able to get the truck put in his name」によって詳述される「She signed the title over but due to my husband」という表現によって詳述される。
Response: “The property tax is assessed on property that you own. Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax. same time, but you absolutely need to title it within the period of time stipulated in state law (property tax is on property you own. Just because you chose not to register it, this doesn't mean you don't own it. So you can't get the tax refunded. Even if you haven't been entitled to the vehicle yet, you still own it within the boundaries of the taxable lot and will have to pay the tax eventually.) Please keep in mind that some states also limit the time available to you for transferring ownership and paying the use tax.If you file late, you will be subject to fines in addition to the regular tax and regular fee.You do not have to register the vehicle at the same time, but you must ensure that you are entitled to it within the time stipulated by state law."
As can be seen from FIG. 7, analyzing the above text yields the following results. "My husbands' grandmother gave him his grandfather's truck" is elaborated by the expression "She signed the title over but due to my husband" elaborated by the expressions "I wanted to put in my name", "and paid the property tax", and "having unpaid fines on his license, he was not able to get the truck put in his name".

「My husbands’ grandmother gave him his grandfather’s truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck.」は、「it came to sending off the title」によって詳述される「By the time」と対比される「to do so」によって詳述される「I didn't have the money」によって詳述される。 "My husbands' grandmother gave him his grandfather's truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck."

「My husbands’ grandmother gave him his grandfather’s truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck. By the time it came to sending off the title and getting the tag, I didn't have the money to do so」は、「I went to the insurance place」および「and was refused a refund」によって詳述される「I am not going to be able to afford the truck」によって詳述される「Now, due to circumstances,」と対比される。 “My husbands’ grandmother gave him his grandfather’s truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and the property tax and got insurance for the truck. Contrast with "Now, due to circumstances," detailed by "the truck".

「My husbands’ grandmother gave him his grandfather’s truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and paid the property tax and got insurance for the truck. By the time it came to sending off the title and getting the tag, I didn't have the money to do so. Now, due to circumstances, I am not going to be able to afford the truck. I went to the insurance place and was refused a refund.」は、「I am just wondering that since I am not going to have a tag on this truck, is it possible to get the property tax refunded?」で詳述されている。 “My husbands’ grandmother gave him his grandfather’s truck. She signed the title over but due to my husband having unpaid fines on his license, he was not able to get the truck put in his name. I wanted to put in my name and the property tax and got insurance for the truck. is detailed in "I am just wondering that since I am not going to have a tag on this truck, is it possible to get the property tax refunded?"

「I am just wondering」は、「since I am not going to have a tag on this truck 」という条件を有する「is it possible to get the property tax refunded?」と同じ単位である「that」に属している。 "I am just wondering" belongs to the same unit "that" as "is it possible to get the property tax refunded?" with the condition "since I am not going to have a tag on this truck".

以上のように、トピックの主な主題は「自動車に対する財産税」である。質問は、一方では、すべての所有物は課税可能であるというのに対して、他方では、所有権がいくらか不完全であるという矛盾を含んでいる。好適な応答により、質問のトピックに対処するとともに矛盾を明確にしなければならない。このために、応答者は、登録状態に関係なく所有されるものすべてに関して税金を納付する必要性についてさらに強い主張を行なっている。この例は、Yahoo(登録商標)!Answersの評価ドメインから得られる肯定的なトレーニングセットの一要素である。トピックの主な主題は「自動車に対する財産税」である。質問は、一方では、所有物はすべて課税可能であるのに対して、他方では、所有権はいくらか不完全であるという矛盾を含んでいる。好適な回答/応答により、質問のトピックに対処するとともに矛盾を明確にしなければならない。読み手は、質問が対比の修辞関係を含んでいるので、納得させるために同様の関係で回答をこの質問と一致させなければならないことに気付き得る。他の場合には、この回答はその分野のエキスパートでない人々にとっても不完全に見えるだろう。 As mentioned above, the main subject of the topic is "property tax on automobiles". The question contains the contradiction that, on the one hand, all property is taxable, on the other hand, ownership is somewhat imperfect. A suitable response should address the topic of the question and clarify any discrepancies. Because of this, respondents are making even stronger arguments about the need to pay taxes on everything owned regardless of registration status. An example of this is Yahoo! A member of the positive training set from the Answers evaluation domain. The main subject of the topic is "property tax on motor vehicles". The question contains the contradiction that, on the one hand, all property is taxable, while on the other hand, ownership is somewhat imperfect. A suitable answer/response should address the topic of the question and clarify any discrepancies. The reader may realize that since the question contains a rhetorical relation of contrast, the answer must match this question in a similar relation to be convincing. In other cases, the answer will appear incomplete even to people who are not experts in the field.

図8は、本発明の特定の局面に従った、図7に表わされた質問についての例示的な応答を示す。中心核は、「that you own」によって詳述される「The property tax is assessed on property」である。「The property tax is assessed on property that you own 」はまた、「Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax」によって詳述される核である。 FIG. 8 shows exemplary responses to the questions presented in FIG. 7, according to certain aspects of the invention. The core is "The property tax is assessed on property" detailed by "that you own". "The property tax is assessed on property that you own" is also the core detailed by "Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax."

核である「The property tax is assessed on property that you own. Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax.」は、「If you apply late,」という条件付きの「there will be penalties on top of the normal taxes and fees」によって詳述される。これは、さらに、「but you absolutely need to title it within the period of time stipulated in state law」および「You don't need to register it at the same time」という対比によって詳述される。 The core, "The property tax is assessed on property that you own. Just because you chose to not register it does not mean that you don't own it, so the tax is not refundable. Even if you have not titled the vehicle yet, you still own it within the boundaries of the tax district, so the tax is payable. Note that all states give you a limited amount of time to transfer title and pay the use tax." fees”. This is further elaborated by the contrast "but you absolutely need to title it within the period of time stipulated in state law" and "You don't need to register it at the same time".

図7のDTと図8のDTとを比較することで、応答(図8)を要求(図7)と如何に適切に一致させるかを判断することが可能となる。本発明のいくつかの局面においては、上述のフレームワークは、DT間の要求/応答および修辞学的合致についてDTを判断するために、少なくとも部分的に用いられる。 By comparing the DT of FIG. 7 with the DT of FIG. 8, it is possible to determine how well the response (FIG. 8) matches the request (FIG. 7). In some aspects of the invention, the framework described above is used, at least in part, to determine DTs for request/response and rhetorical agreement between DTs.

別の例において、「What does The Investigative Committee of the Russian Federation do(ロシア連邦の調査委員会が何を行なったのか」という質問は、たとえば、公式の回答または実際の回答という少なくとも2つの回答を有する。 In another example, the question "What does The Investigative Committee of the Russian Federation do" has at least two answers, for example an official answer or an actual answer.

図9は、一局面に従った公式の回答についての談話ツリーを示す。図9に示されるように、公式回答または声明は、「The Investigative Committee of the Russian Federation is the main federal investigating authority which operates as Russia's Anti-corruption agency and has statutory responsibility for inspecting the police forces, combating police corruption and police misconduct, is responsible for conducting investigations into local authorities and federal governmental bodies.(ロシア連邦の調査委員会は主たる連邦捜査機関であって、ロシアの汚職防止機関として機能するとともに、警察を監査して警察の汚職および警察の違法行動を根絶するための法定上の責任を有しており、地方自治体および連邦行政体の調査を行なう責任を負っている)」と述べている。 FIG. 9 shows a discourse tree for a formal answer according to one aspect. As shown in Figure 9, the official response or statement is "The Investigative Committee of the Russian Federation is the main federal investigating authority which operates as Russia's Anti-corruption agency and has statutory responsibility for inspecting the police forces, combating police corruption and police misconduct, is responsible for conducting investigations into local authorities and federal governmental bodies." We have a statutory responsibility to eradicate the behavior and are responsible for conducting investigations of local and federal government bodies."

図10は、一局面に従った未処理の回答についての談話ツリーを示す。図10に示されるように、別の、場合によってはより正直な回答は以下のとおりである。「Investigative Committee of the Russian Federation is supposed to fight corruption. However, top-rank officers of the Investigative Committee of the Russian Federation are charged with creation of a criminal community. Not only that, but their involvement in large bribes, money laundering, obstruction of justice, abuse of power, extortion, and racketeering has been reported. Due to the activities of these officers, dozens of high-profile cases including the ones against criminal lords had been ultimately ruined.(ロシア連邦の調査委員会は汚職と戦うよう想定されている。しかしながら、ロシア連邦の調査委員会のトップランクの高官は、犯罪集団の設立の役割を担っている。それだけでなく、これらの高官らが大規模な賄賂、マネーロンダリング、司法妨害、職権乱用、恐喝およびゆすりに関与していることが報告されてきた。これらの職員の活動により、犯罪の大物に関する事例を含むとともに注目を集めた数十の事例は最終的に台無しにされた。」
回答の選択は文脈に依存する。修辞構造は、「公式の(official)」、「政治的に正しい(politically correct)」テンプレートベースの回答と、「実際の(actual)」、「未処理の(raw)」、「現場からの報告(reports from the field)」または「論争の的となる(controversial)」回答とを区別することを可能にする。図9および図10を参照されたい。時として、質問自体は、どのカテゴリの回答が期待されているかについてのヒントを与えることができる。質問が、第2の意味を持たない類事実または定義的性質をもつ質問として策定されている場合、第1のカテゴリーの回答が適している。他の場合には、質問が、「それが実際に何であるかを私に伝える」という意味を有する場合、第2のカテゴリが適している。一般に、質問から修辞構造を抽出した後、同様の修辞構造、一致した修辞構造、または補足的な修辞構造を有するであろう適切な回答を選択することはより容易である。
FIG. 10 shows a discourse tree for raw answers according to one aspect. As shown in Figure 10, another, possibly more honest, answer is as follows. “Investigative Committee of the Russian Federation is supposed to fight corruption. However, top-rank officers of the Investigative Committee of the Russian Federation are charged with creation of a criminal community. "However, top-ranking officials of the Russian Federation's Commission of Inquiry have a role in founding criminal gangs. Not only that, but it has been reported that these officials have been implicated in large-scale bribery, money laundering, obstruction of justice, abuse of power, extortion and racketeering. Dozens of high-profile cases, including those involving big criminals, have ultimately been undermined through the actions of these officials."
Choice of answer depends on the context. The rhetorical structure allows us to distinguish between 'official', 'politically correct' template-based answers and 'actual', 'raw', 'reports from the field' or 'controversial' answers. See FIGS. 9 and 10. FIG. Sometimes the question itself can give hints as to what category of answer is expected. Answers in the first category are appropriate if the question is formulated as a question with a quasi-factual or defining character without secondary meaning. In other cases, if the question has the meaning "tell me what it really is," the second category is appropriate. In general, after extracting the rhetorical structure from the question, it is easier to select appropriate answers that will have a similar rhetorical structure, a matching rhetorical structure, or a complementary rhetorical structure.

公式の回答は、テキストが含む可能性のある論争の点から見て中立的である詳述およびジョイントに基づいている(図を参照)。同時に、未処理の回答は対比関係を含んでいる。エージェントが行うと予想されるものについてのフレーズと、このエージェントが行ったと判明したことについてのフレーズとのこの関係が抽出される。 Official responses are based on elaborations and joints that are neutral in terms of the controversies the text may contain (see figure). At the same time, the raw responses contain contrasting relationships. This relationship between phrases about what the agent is expected to do and phrases about what the agent was found to do is extracted.

要求-応答ペアの分類
アプリケーション102は、回答データベース105または公共のデータベースから得られる回答などの所与の回答または応答が、所与の質問または要求に応答したものであるかどうかを判断することができる。より特定的には、アプリケーション102は、要求と応答との間で、(i)関連性または(ii)修辞学的合致のうち一方または両方を判断することによって、要求と応答のペアが正確であるかまたは不正確であるかを分析する。修辞学的合致は、直交的に処理することができる関連性を考慮に入れることなく、分析することができる。
Classification of Request-Response Pairs Application 102 can determine whether a given answer or response, such as an answer obtained from answer database 105 or a public database, is in response to a given question or request. More specifically, application 102 analyzes whether a request and response pair is accurate or inaccurate by determining one or both of (i) relevance or (ii) rhetorical agreement between the request and response. Rhetorical agreement can be analyzed without taking into account relationships that can be processed orthogonally.

アプリケーション102は、さまざまな方法を用いて、質問・回答ペア間の類似性を判断することができる。たとえば、アプリケーション102は、個々の質問と個々の回答との間の類似性のレベルを判断することができる。代替的には、アプリケーション102は、質問および回答を含む第1のペアと質問および回答を含む第2のペアとの間の類似性の基準を判断することができる。 Application 102 may use a variety of methods to determine similarity between question-answer pairs. For example, application 102 can determine the level of similarity between individual questions and individual answers. Alternatively, application 102 can determine a measure of similarity between a first pair of questions and answers and a second pair of questions and answers.

たとえば、アプリケーション102は、一致する回答または一致しない回答を予測するようにトレーニングされた修辞学的合致分類器120を用いる。アプリケーション102は一度に2つのペア、たとえば<q1,a1>および<q2,a2>、を処理することができる。アプリケーション102は、q1をq2と比較し、a1をa1と比較して、組合わされた類似性スコアを生成する。このような比較は、既知のラベルが付いた別の質問/回答ペアからの距離を評価することによって、未知の質問/回答ペアが正しい回答を含んでいるか否かを判断することを可能にする。特に、ラベル無しのペア<q2,a2>は、q2およびa2によって共有される単語または構造に基づいて正確さを「推測する」のではなく、q2とa2がともに、このような単語または構造を根拠として、ラベル付きのペア<q2,a2>のそれらの対応する構成要素q1およびa2と比較することができるように、処理することができる。この手法は、ドメインに依存することなく回答を分類することを目標としているので、質問と回答と間の構造上の結合性しか活用することができず、回答の「意味」を活用することができない。 For example, application 102 employs a rhetorical match classifier 120 trained to predict matching or non-matching answers. Application 102 can process two pairs at a time, eg <q1, a1> and <q2, a2>. Application 102 compares q1 to q2 and a1 to a1 to generate a combined similarity score. Such a comparison allows determining whether an unknown question/answer pair contains the correct answer by evaluating the distance from another question/answer pair with a known label. In particular, the unlabeled pair <q2,a2> can be treated such that both q2 and a2 can be compared to their corresponding components q1 and a2 of the labeled pair <q2,a2> on the basis of such words or structures, rather than "guessing" correctness based on words or structures shared by q2 and a2. Since this method aims to classify answers without relying on domains, it can only exploit the structural connectivity between questions and answers, and cannot exploit the "meaning" of the answers.

一局面においては、アプリケーション102は、トレーニングデータ125を用いて、修辞学的合致分類器120をトレーニングする。このような態様で、修辞学的合致分類器120は、質問および回答のペア同士の類似性を判断するようにトレーニングされる。これは分類の問題である。トレーニングデータ125は肯定的なトレーニングセットおよび否定的なトレーニングセットを含み得る。トレーニングデータ125は、肯定的なデータセットにおける一致する要求・応答ペアと、否定的なデータセットにおける任意であるかまたは関連性もしくは適切さがより低い要求・応答ペアとを含む。肯定的なデータセットに関して、回答または応答が質問について好適であるかどうかを示す別個の受諾基準を備えたさまざまなドメインが選択される。 In one aspect, application 102 uses training data 125 to train rhetorical match classifier 120 . In this manner, the rhetorical match classifier 120 is trained to determine the similarity between question and answer pairs. This is a classification problem. Training data 125 may include a positive training set and a negative training set. The training data 125 includes matching request-response pairs in the positive data set and arbitrary or less relevant or relevant request-response pairs in the negative data set. For positive datasets, different domains are selected with distinct acceptance criteria that indicate whether the answer or response is suitable for the question.

各々のトレーニングデータセットはトレーニングペアのセットを含む。各々のトレーニングセットは、質問を表現する質問コミュニケーション用談話ツリーと、回答を表現するとともに質問と回答との間の予想される相補性のレベルを表現する回答コミュニケーション用談話ツリーを含む。反復プロセスを用いることにより、アプリケーション102は、トレーニングペアを修辞学的合致分類器120に提供し、モデルから相補性のレベルを受取る。アプリケーション102は、特定のトレーニングペアについて、判断された相補性のレベルと予想される相補性のレベルとの間の相違を判断することによって、損失関数を計算する。アプリケーション102は、損失関数に基づいて、損失関数を最小限にするように分類モデルの内部パラメータを調整する。 Each training data set contains a set of training pairs. Each training set includes a discourse tree for question communication that expresses questions and a discourse tree for answer communication that expresses answers and the expected level of complementarity between questions and answers. Using an iterative process, application 102 provides training pairs to rhetorical match classifier 120 and receives levels of complementarity from the model. Application 102 calculates a loss function by determining the difference between the determined level of complementarity and the expected level of complementarity for a particular training pair. Based on the loss function, application 102 adjusts the internal parameters of the classification model to minimize the loss function.

受諾基準はアプリケーションに応じて異なり得る。たとえば、受諾基準は、コミュニティ質問回答、自動化された質問回答、自動化された顧客サポートシステム、手動による顧客サポートシステム、ソーシャルネットワークコミュニケーション、ならびに、調査および苦情などの製品についての経験に関する消費者などの個々人による書込みに関しては、低い可能性がある。RR受諾基準は、科学技術文書、専門の新聞雑誌、FAQ形式の健康および法律に関する文書、「stackoverflow」などの専門のソーシャルネットワークにおいては、高い可能性がある。 Acceptance criteria may vary depending on the application. For example, acceptance criteria may be low for community question-answers, automated question-answers, automated customer support systems, manual customer support systems, social network communications, and writings by individuals, such as consumers, about their experiences with the product, such as surveys and complaints. RR acceptance criteria are likely to be high in scientific and technical documents, professional journals, health and legal documents in FAQ format, and professional social networks such as "stackoverflow".

コミュニケーション用談話ツリー(CDT)
アプリケーション102は、コミュニケーション用談話ツリーを作成し、分析し、比較することができる。コミュニケーション用談話ツリーは、修辞情報を発話動作構造と組合わせるように設計されている。CDTは、コミュニケーション行動についての表現でラベル付けされた円弧を含む。コミュニケーション行動を組合わせることにより、CDTは、RST関係およびコミュニケーション行動のモデリングを可能にする。CDTはパース交錯の縮図である。Galitsky、B. Ilvovsky、D. Kuznetsov SOによる「Rhetoric Map of an Answer to Compound Queries Knowledge Trail Inc. ACL 2015,681-686(Galitsky(2015))を参照されたい。パース交錯は、センテンスについてのパースツリーを1つのグラフにおけるセンテンスの単語と部分との談話レベル関係と組合わせたものである。発話動作を識別するラベルを組込むことにより、コミュニケーション用談話ツリーの学習が、基本談話単位(EDU)の構文および適正な修辞関係よりもより豊富な特徴セットにわたって実行可能となる。
Communicative discourse tree (CDT)
Application 102 can create, analyze, and compare discourse trees for communication. Communicative discourse trees are designed to combine rhetorical information with speech action structure. The CDT contains arcs labeled with expressions for communicative behavior. By combining communicative behavior, CDT allows modeling of RST relationships and communicative behavior. The CDT is the epitome of Peirce intersection. See Galitsky, B. Ilvovsky, D. Kuznetsov SO, Rhetoric Map of an Answer to Compound Queries Knowledge Trail Inc. ACL 2015, 681-686 (Galitsky (2015)). Speech trees can be learned over a richer set of features than the syntax and proper rhetorical relations of the Basic Discourse Units (EDUs).

一例においては、民間航空機であるマレーシア航空会社17便の撃墜の原因に関して3つの当事者間でなされた論争が分析される。やり取りされている論証のRST表現が構築される。この例においては、3つの相争っているエージェントであるオランダの調査員、ロシア連邦の調査委員会および自称ドニエツク人民共和国が問題に関する彼らの意見を交換している。この例が示している論争の的になっている対立においては、各々の当事者が皆それぞれの相手方を非難する恐れがある。より説得力があるように思わせるために、各々の当事者は自身の主張を行うだけではなく、相手方の主張を拒絶するように応答を策定している。この目的を達成するために、各々の当事者は、相手方の主張のスタイルおよび談話と一致させるよう試みる。 In one example, a dispute between three parties regarding the cause of the downing of a commercial airliner, Malaysia Airlines Flight 17, is analyzed. An RST representation of the argument being exchanged is constructed. In this example, three competing agents, Dutch Investigators, the Russian Federation Commission of Inquiry and the self-proclaimed Donetsk People's Republic, are exchanging their views on the matter. In the contentious conflict that this example illustrates, each party may all blame their respective counterparts. To appear more persuasive, each party formulates its response not only to make its own case, but to reject the other party's. To this end, each party attempts to match the other's style and discourse.

図11は、一局面に従った、第1のエージェントの主張についてのコミュニケーション用談話ツリーを示す。図11は、以下のテキストを表わすコミュニケーション用談話ツリー100を示す。「Dutch accident investigators say that evidence points to pro-Russian rebels as being responsible for shooting down plane. The report indicates where the missile was fired from and identifies who was in control of the territory and pins the downing of MH17 on the pro-Russian rebels.(オランダの事故調査員は、証拠が、飛行機の撃墜をロシア支持派の反乱分子によるものであると示唆していると述べている。この報告書は、ミサイルが発射された場所を示しており、誰が領域を制圧していたかを識別し、MH17の撃墜の責任をロシア支持派の反乱分子に負わせている。)」
図11から分かるように、CDTの非終端ノードは修辞関係であり、終端ノードは、これらの関係の主題である基本談話単位(フレーズ、センテンスフラグメント)である。CDTのいくつかの円弧は、行動者であるエージェント、およびこれらの行動の主題(やり取りされていること)を含むコミュニケーション行動についての表現でラベル付けされている。たとえば、(左側の)詳細関係についての核ノードは、say(Dutch, evidence)でラベル付けされており、衛星は、responsible(rebels, shooting down)でラベル付けされている。これらのラベルは、EDUの主題がevidence(証拠)およびshooting down(撃墜)であることを表すように意図されたものではなく、このCDTと他のものとの間の類似性を見出す目的でこのCDTを他のものと一致させるように意図されている。この場合、コミュニケーション用談話の情報を提供するのではなく修辞関係によってこれらのコミュニケーション行動を単にリンクさせることは、あまりに制限され過ぎていて、やり取りされている物およびその方法についての構造を表わすことができない。同じ修辞関係または調整された修辞関係を有するべきというRRペアについての要件は弱すぎるため、ノード同士を一致させることに加えて円弧に関するCDTラベル同士を合致させることが必要となる。
FIG. 11 shows a communicative discourse tree for a first agent's claims, according to one aspect. FIG. 11 shows a communicative discourse tree 100 representing the following text. “Dutch accident investigators say that evidence points to pro-Russian rebels as being responsible for shooting down plane. The report indicates where the missile was fired from and identifies who was in control of the territory and pins the downing of MH17 on the pro-Russian rebels. Identifying whether they were in control of the territory and blaming pro-Russian insurgents for shooting down MH17."
As can be seen from FIG. 11, the non-terminal nodes of the CDT are rhetorical relations, and the terminal nodes are the basic discourse units (phrases, sentence fragments) that are the subject of these relations. Several arcs of the CDT are labeled with representations about communicative behaviors, including agents who are actors and the subject of these behaviors (what is being communicated). For example, the kernel node for detailed relations (on the left) is labeled say (Dutch, evidence) and the satellites are labeled responsible (rebels, shooting down). These labels are not intended to represent that the subject of the EDU is evidence and shooting down, but are intended to match this CDT with others for the purpose of finding similarities between this CDT and others. In this case, simply linking these communicative behaviors by rhetorical relations rather than providing information in communicative discourse is too restrictive to express structure about what is being communicated and how. The requirement for RR pairs to have the same rhetorical relation or adjusted rhetorical relation is too weak, requiring matching CDT labels for arcs in addition to matching nodes.

このグラフの真っ直ぐなエッジは構文関係であり、湾曲した円弧は、前方照応、同じエンティティ、サブエンティティ、修辞関係およびコミュニケーション行動などの談話関係である。このグラフは、単なる個々のセンテンスについてのパースツリーの組合わせよりもはるかに豊富な情報を含んでいる。CDTに加えて、パース交錯は、単語、関係、フレーズおよびセンテンスのレベルで一般化することができる。発話行動は、それぞれの発話動作およびそれらの主題に関与するエージェントを表わす論理述語である。論理述語の論証は、VerbNetなどのフレームワークによって提案されるように、それぞれの意味役割に従って形成される。Karin Kipper、Anna Korhonen、Neville Ryant、Martha Palmerによる「A Large-scale Classification of English Verbs」(Language Resources and Evaluation Journal, 42(1), 21-40,Springer Netherland, 2008)を参照されたい。および/または、Karin Kipper Schuler、Anna Korhonen、Susan W. Brownによる「VerbNet overview, extensions, mappings and apps」(Tutorial, NAACL-HLT: 2009, Boulder, Colorado)を参照されたい。 The straight edges of this graph are syntactic relations, and the curved arcs are discourse relations such as anaphora, same-entity, sub-entity, rhetorical relation and communicative behavior. This graph contains much richer information than just combining partrees for individual sentences. In addition to CDTs, parse intersections can be generalized at the level of words, relationships, phrases and sentences. Speech actions are logical predicates that represent the agents involved in each speech action and their subject. Arguments for logical predicates are formed according to their semantic roles, as suggested by frameworks such as VerbNet. See "A Large-scale Classification of English Verbs" by Karin Kipper, Anna Korhonen, Neville Ryant and Martha Palmer (Language Resources and Evaluation Journal, 42(1), 21-40, Springer Netherland, 2008). and/or See "VerbNet overview, extensions, mappings and apps" by Karin Kipper Schuler, Anna Korhonen, and Susan W. Brown (Tutorial, NAACL-HLT: 2009, Boulder, Colorado).

図12は、一局面に従った、第2のエージェントの主張についてのコミュニケーション用談話ツリーを示す。図12は、以下のテキストを表わすコミュニケーション用談話ツリー1200を示す。「The Investigative Committee of the Russian Federation believes that the plane was hit by a missile, which was not produced in Russia. The committee cites an investigation that established the type of the missile.(ロシア連邦の調査委員会は、飛行機がロシアで生産されたものではないミサイルによって攻撃されたと信じている。委員会は、ミサイルの種類を立証した調査を引用している。)」
図13は、一局面に従った、第3のエージェントの主張についてのコミュニケーション用談話ツリーを示す。図13は、以下のテキストを表わすコミュニケーション用談話ツリー1300を示す。「Rebels, the self-proclaimed Donetsk People's Republic, deny that they controlled the territory from which the missile was allegedly fired. It became possible only after three months after the tragedy to say if rebels controlled one or another town.(反乱分子である自称ドニエツク人民共和国は、彼らが、ミサイルが発射されたと主張されている領域を制圧していたことを否定している。反乱分子が或る町または別の町を制圧していたかどうかは、悲劇の後に3か月経った後にしか発表することができなかった。)」
コミュニケーション用談話ツリー1100~1300から分かるように、応答は任意ではない。応答は、元のテキストと同じエンティティについて述べている。たとえば、コミュニケーション用談話ツリー1200および1300はコミュニケーション用談話ツリー1100に関係している。応答は、これらのエンティティについての、かつこれらのエンティティの行動についての、推定および感情との不合致を裏づけしている。
FIG. 12 shows a communicative discourse tree for a second agent's claims, according to one aspect. FIG. 12 shows a communicative discourse tree 1200 representing the following text. "The Investigative Committee of the Russian Federation believes that the plane was hit by a missile, which was not produced in Russia. The committee cites an investigation that established the type of the missile."
FIG. 13 shows a communicative discourse tree for a third agent's claims, according to one aspect. FIG. 13 shows a communicative discourse tree 1300 representing the following text. “Rebels, the self-proclaimed Donetsk People's Republic, deny that they controlled the territory from which the missile was allegedly fired. It became possible only after three months after the tragedy to say if rebels controlled one or another town. It could only be published after menstruation."
As can be seen from the communication discourse trees 1100-1300, responses are not arbitrary. The response mentions the same entity as the original text. For example, communication discourse trees 1200 and 1300 are related to communication discourse tree 1100 . The responses confirm discrepancies with assumptions and feelings about these entities and about the behavior of these entities.

より具体的には、関与するエージェントの返答は、第1のシードメッセージのコミュニケーション用談話を反映させる必要がある。単純な観察結果として、第1のエージェントが自身の主張を伝えるための属性を用いるので、他のエージェントは、その一式に従って、彼ら自身の属性を提供するかもしくは支持者の属性の有効性を攻撃するかまたはこれらの両方を行う。シードメッセージのコミュニケーション構造を如何にして連続メッセージに保持する必要があるかについて、広くさまざまな特徴を捕らえるために、それぞれのCDTのペアを学習することができる。 More specifically, the involved agent's reply should reflect the communicative discourse of the first seed message. As a simple observation, as the first agent uses attributes to convey its claims, the other agents either provide their own attributes or attack the validity of the advocates' attributes, or do both, according to the set. Each CDT pair can be studied to capture a wide variety of characteristics of how the communicative structure of the seed message should be preserved in successive messages.

要求・応答の合致を検証するためには、談話関係または発話動作(コミュニケーション行動)だけではしばしば不十分である。図11~図13に示される例からから分かるように、エージェント間の対話の談話構造および対話の種類は有用である。しかしながら、対話のドメイン(たとえば、軍事衝突もしくは政治)またはこれらの対話の主題(つまりエンティティ)を分析する必要はない。 Discourse relations or speech behaviors (communicative behaviors) alone are often insufficient to verify request-response matching. As can be seen from the examples shown in FIGS. 11-13, the discourse structure and types of interactions between agents are useful. However, it is not necessary to analyze the domain of dialogue (eg military conflict or politics) or the subject matter (ie entities) of these dialogues.

修辞関係およびコミュニケーション行動の表現
抽象的な構造同士の間の類似性を演算するために、2つのアプローチがしばしば用いられる。(1)これらの構造を数値空間で表わすとともに類似性を数として表す(統計学習アプローチ);または、(2)数値空間ではなくツリーおよびグラフなどの構造表現を用いて、最大の共通サブ構造として類似性を表現する。最大の共通サブ構造として類似性を表わすことは一般化と称される。
Representing Rhetorical Relationships and Communication Behavior Two approaches are often used to compute similarities between abstract structures. (1) represent these structures in numerical space and represent similarities as numbers (statistical learning approaches); or (2) use structural representations such as trees and graphs rather than numerical spaces to represent similarities as the largest common substructure. Representing similarity as the largest common substructure is called generalization.

コミュニケーション行動を学習することは、論証の表現および理解を助ける。計算用動詞レキシコンは、行動についてのエンティティの取得をサポートするとともに、それらの意味を示すためにルールベースの形式を提供するのを助ける。動詞は、記載されているイベントのセマンティックスとともに、そのイベントにおける関与者間の関係情報を表わして、その情報をエンコードする構文構造を投影している。動詞、特にコミュニケーション行動動詞は極めて変動し易く、豊富な範囲の意味論的挙動を表示することができる。これに応じて、動詞分類は、学習システムが、コアの意味論的特性を共有している動詞をグループごとに組織化することによって、この複雑さに対処することを助ける。 Learning communicative behavior aids in the presentation and understanding of arguments. Computational verb lexicons support the retrieval of entities for actions and help provide a rule-based format for denoting their meaning. Verbs represent the semantics of the event being described as well as the relational information between the participants in that event, projecting syntactic structures that encode that information. Verbs, especially communicative action verbs, are highly variable and can display a rich range of semantic behaviors. Accordingly, verb taxonomy helps the learning system to address this complexity by organizing verbs that share core semantic properties into groups.

VerbNetはこのような1レキシコンであって、各々のクラス内における動詞の意味論的役割および構文的パターン特徴を識別するとともに、構文的パターンとクラスのうちすべてのメンバについて推論することができる基礎をなす意味論的関係との間のつながりを明確にする。Karin Kipper、Anna Korhonen、Neville RyantおよびMartha Palmerによる「Language Resources and Evaluation」(Vol.42, No. 1 (March 2008) 21)を参照されたい。クラスについての各々の構文フレームまたは動詞シグネチャは、イベントのコースにわたるイベント関与者間の意味論的関係を詳しく述べる、対応する意味論的表現を有する。 VerbNet is one such lexicon that identifies the semantic roles and syntactic pattern features of verbs within each class, and makes explicit the connections between syntactic patterns and the underlying semantic relationships that can be inferred for all members of the class. See "Language Resources and Evaluation" by Karin Kipper, Anna Korhonen, Neville Ryant and Martha Palmer, Vol. 42, No. 1 (March 2008) 21). Each syntactic frame or verb signature for a class has a corresponding semantic expression that details the semantic relationships between event participants over the course of the event.

たとえば、「楽しませる(amuse)」という動詞は、驚かせる(amaze)、怒らせる(anger)、何らかの感情を喚起する(arouse)、邪魔する(disturb)、いらいらさせる(irritate)などの論証(意味論的役割)の同様の構造を有する同様の動詞のクラスタの一部である。これらのコミュニケーション行動の論証の役割は、Experiencer(経験者)(通常、生きている実体)、Stimulus(刺激)およびResult(結果)である。各々の動詞は、この動詞が如何にセンテンスまたはフレーム内に現れているかについての構文特徴によって区別される意味のクラスを有し得る。たとえば、「amuse」のためのフレームは、以下のとおり、以下の主要な名詞句(NP)、名詞(N)、コミュニケーション行動(V)、動詞句(VP)、副詞(ADV)を用いている。 For example, the verb "amuse" is part of a cluster of similar verbs with similar structures of argumentation (semantic role) such as amaze, anger, arouse, disturb, irritate. The demonstrative roles of these communicative behaviors are Experiencer (usually a living entity), Stimulus and Result. Each verb can have a semantic class that is distinguished by syntactic characteristics of how the verb appears within a sentence or frame. For example, the frame for "amuse" uses the following main noun phrase (NP), noun (N), communicative action (V), verb phrase (VP), adverb (ADV):

NP V NP。例:「教師は子供たちを楽しませた(The teacher amused the children)」。構文:Stimulus V Experiencer。節:amuse(Stimulus, E, Emotion, Experiencer), cause(Stimulus, E), emotional_state(Result(E), Emotion, Experiencer)。 NP V NP. For example: "The teacher amused the children". Syntax: Stimulus V Experiencer. Clauses: amuse(Stimulus, E, Emotion, Experiencer), cause(Stimulus, E), emotional_state(Result(E), Emotion, Experiencer).

NP V ADV-Middle:例:「Small children amuse quickly(小さな子供たちは直ちに楽しむ)」。構文:Experiencer V ADV。節:amuse(Experiencer, Prop):-, property(Experiencer, Prop), adv(Prop)。 NP V ADV-Middle: Example: "Small children amuse quickly". Syntax: Experiencer V ADV. Clauses: amuse(Experiencer, Prop):-, property(Experiencer, Prop), adv(Prop).

NP V NP-PRO-ARB。例「The teacher amused(教師は楽しんだ)」。構文:Stimulus V. amuse(Stimulus, E, Emotion, Experiencer): cause(Stimulus, E), emotional_state(Result(E), Emotion, Experiencer)。 NP V NP-PRO-ARB. Example "The teacher amused". Syntax: Stimulus V. amuse(Stimulus, E, Emotion, Experiencer): cause(Stimulus, E), emotional_state(Result(E), Emotion, Experiencer).

NPcause V NP。例「The teacher's dolls amused the children(教師の人形は子供を楽しませた)」。構文:Stimulus <+genitive>('s) V Experiencer。 amuse(Stimulus, E, Emotion, Experiencer): cause(Stimulus, E), emotional_state(during(E), Emotion, Experiencer)。 NP cause V NP. Example "The teacher's dolls amused the children". Syntax: Stimulus <+genitive>('s) V Experiencer. amuse(Stimulus, E, Emotion, Experiencer): cause(Stimulus, E), emotional_state(during(E), Emotion, Experiencer).

NP V NP ADJ。例「This performance bored me totally(この性能は私を完全にうんざりさせた)」。構文:Stimulus V Experiencer Result。amuse(Stimulus, E, Emotion, Experiencer)。cause(Stimulus,E), emotional_state(result(E), Emotion, Experiencer), Pred(result(E), Experiencer)。 NP V NP ADJ. For example "This performance bored me totally". Syntax: Stimulus V Experiencer Result. amuse (Stimulus, E, Emotion, Experiencer). cause(Stimulus,E), emotional_state(result(E), Emotion, Experiencer), Pred(result(E), Experiencer).

コミュニケーション行動は複数のクラスタに特徴付けることができる。たとえば、述語的な補足語を備えた動詞(appoint(指定する)、characterize(特徴付ける)、dub(名称を付ける)、declare(宣言する)、conjecture(推測する)、masquerade(変装する)、orphan(孤児にする)、captain(キャプテンを務める)、consider(考慮する)、classify(分類する));知覚動詞(see(見る)、sight(観測する)、peer(凝視する));精神状態の動詞(amuse(楽しませる)、admire(賞賛する)、marvel(驚嘆する)、appeal(アピールする));要望の動詞(want(欲する)、long(切望する));判断動詞(judgment(判断));評価の動詞(assess(評価する)、estimate(推定する));探索の動詞(hunt(狩る)、search(探索する)、stalk(忍び寄る)、investigate(調査する)、rummage(くまなく探す)、ferret(狩り出す));社会的対話の動詞(correspond(応答する)、marry(結婚する)、meet(会う)、battle(戦う));コミュニケーションの動詞(transfer(message)((メッセージを)伝達する)、inquire(照会する)、interrogate(尋問する)、tell(伝える)、態様(speaking:発話)、talk(話す)、chat(閑談する)、say(言う)、complain(苦情を訴える)、advise(助言する)、confess(告白する)、lecture(講義する)、overstate(誇張する)、promise(約束する));回避動詞(avoid(回避する));測定動詞(register(記録する)、cost(費用がかかる)、fit(適合させる)、price(値をつける)、bill(請求する));相動詞(begin(開始する)、complete(完成する)、continue(継続する)、stop(止まる)、establish(確立する)、sustain(維持する))がある。 Communication behavior can be characterized into multiple clusters. For example, verbs with predicative complements (appoint, characterize, dub, declare, conjecture, masquerade, orphan, captain, consider, classify); perceptual verbs (see, sight, peer); mental state verbs (amuse). verbs of desire (want, long); verbs of judgment (judgment); verbs of evaluation (assess, estimate); verbs of exploration (hunt, search, stalk, investigate, rum). verbs of social dialogue (correspond, marry, meet, battle); verbs of communication (transfer(message), inquire, interrogate, tell, speaking, talk, chat, say, comp). lain, advise, confess, lecture, overstate, promise; avoidance verbs; measure verbs (register, cost, fit, price, bill); relative verbs (begin, complete, continue, stop) stop), establish, sustain).

この明細書中に記載される局面は、統計学習モデルに勝る利点を備えている。統計的な解決策とは対照的に、分類システムを用いる局面は、(修辞学的合致などの)目的の特徴をもたらすと判断される動詞または動詞状構造を提供することができる。たとえば、統計機械学習モデルは、解釈を困難にする可能性のある類似性を数として表わす。 The aspects described herein have advantages over statistical learning models. In contrast to statistical solutions, aspects using classification systems can provide verbs or verb-like structures that are determined to yield desired characteristics (such as rhetorical matching). For example, statistical machine learning models represent similarities as numbers, which can make interpretation difficult.

要求・応答ペアの表現
要求・応答ペアを表現することは、或るペアに基づいた分類ベースの動作を促進する。一例においては、要求・応答ペアはパース交錯として表わすことができる。パース交錯は、1つのグラフにおけるセンテンスの単語と部分との間の談話・レベル関係を用いて、2つ以上のセンテンスについてのパースツリーを表わしたものである。Galitsky(2015)を参照されたい。質問と回答との間の話題の類似性は、パース交錯の共通のサブグラフとして表わすことができる。共通のグラフノードの数が多ければ多いほど、類似性は高くなる。
Representing Request-Response Pairs Representing request-response pairs facilitates taxonomy-based operations based on certain pairs. In one example, a request-response pair can be represented as a parse intersection. A parse intersection is a representation of a parse tree for two or more sentences, using the discourse-level relationships between the words and parts of the sentences in a graph. See Galitsky (2015). Topic similarities between questions and answers can be represented as a common subgraph of perspective intersections. The higher the number of common graph nodes, the higher the similarity.

図14は、一局面に従ったパース交錯を示す。図14は、要求1401についてのパースツリーと対応する応答1402についてのパースツリーとを含むパース交錯1400を示す。 FIG. 14 illustrates Peirce intersection according to one aspect. FIG. 14 shows a parse intersection 1400 that includes a parsetree for a request 1401 and a corresponding parsetree for a response 1402 .

パースツリー1401が表している質問は以下のとおりである。「I just had a baby and it looks more like the husband I had my baby with. However it does not look like me at all and I am scared that he was cheating on me with another lady and I had her kid. This child is the best thing that has ever happened to me and I cannot imagine giving my baby to the real mom.(私は赤ん坊を出産したところで、夫との間にできたこの赤ん坊が夫により似ているように思えます。でも、赤ん坊は私に全く似ておらず、彼が私を裏切って別の女性と浮気してできた彼女の子供を世話しているのではないかと脅えています。この子供はこれまでに私の身に起こったことのうち最良のことなので、私は本当の母親に赤ん坊を譲り渡すことは想像できません。)」
応答1402が表わす応答は以下のとおりである。「Marital therapists advise on dealing with a child being born from an affair as follows. One option is for the husband to avoid contact but just have the basic legal and financial commitments. Another option is to have the wife fully involved and have the baby fully integrated into the family just like a child from a previous marriage.(結婚に関するセラピストは、ある情事から生まれてきた子供への対処について以下のように助言しています。1つのオプションは、夫との接触を避けて、基本的な法的および財政的義務だけを果たさせることです。別のオプションは、妻に十分に関与させて、赤ん坊を前の結婚からできた子供のように家族に完全に溶け込ませることです)」。
The question represented by the parse tree 1401 is as follows. "I just had a baby and it looks more like the husband I had my baby with. However it does not look like me at all and I am scared that he was cheating on me with another lady and I had her kid. This child is the best thing that has ever happened to me and I cannot imagine giving my baby to the real mom."I'm afraid she's taking care of her child, which is the best thing that's ever happened to me, and I can't imagine giving a baby to a real mother."
The response represented by response 1402 is as follows. “Marital therapists advise on dealing with a child being born from an affair as follows. One option is for the husband to avoid contact but just have the basic legal and financial commitments. Another option is to have the wife fully involved and have the baby fully integrated into the family just like a child from a previous marriage. option is to get the wife fully involved so that the baby is fully integrated into the family, like a child from a previous marriage."

図14は、テキストのパラグラフについての言語情報を表わすための貪欲なアプローチを表わす。このグラフの真っ直ぐなエッジは構文関係であり、湾曲した円弧は、前方照応、同じエンティティ、サブエンティティ、修辞関係およびコミュニケーション行動などの談話関係である。実線の円弧は、同じエンティティ/サブエンティティ/前方照応関係についてのものであり、点線の円弧は修辞関係およびコミュニケーション行動についてのものである。真っ直ぐなエッジにある楕円形のラベルは構文関係を示している。補題はノードのための箱内に書かれており、補題形式はノードの右側に書かれている。 FIG. 14 represents a greedy approach to representing linguistic information about a paragraph of text. The straight edges of this graph are syntactic relations, and the curved arcs are discourse relations such as anaphora, same-entity, sub-entity, rhetorical relation and communicative behavior. Solid arcs are for same-entity/sub-entity/anaphora relationships and dashed arcs are for rhetorical relationships and communicative behaviors. Elliptical labels on straight edges indicate syntactic relationships. The lemma is written in the box for the node, and the lemma form is written to the right of the node.

パース交錯1400は単なる個々のセンテンスについてのパースツリーの組合わせよりはるかに豊富な情報を含んでいる。構文関係についてのエッジおよび談話関係についての円弧に沿ったこのグラフによるナビゲーションは、他のパース交錯と一致させてテキスト類似性評価タスクを実行するために所与のパース交錯を意味論的に等価な形式に変換することを可能にする。パラグラフの完全な形式上の表現を形成するために、可能な限り多くのリンクが表わされる。談話円弧の各々は、潜在的な一致になり得るパースフレーズのペアを生成する。 Parse intersection 1400 contains much richer information than just combining parse trees for individual sentences. Navigation through this graph along edges for syntactic relations and arcs for discourse relations allows a given parse intersection to be transformed into a semantically equivalent form for matching with other parse intersections to perform text similarity evaluation tasks. As many links as possible are presented to form a complete formal representation of the paragraph. Each discourse arc produces a pair of parse phrases that can be potential matches.

シード(要求)と応答との間のトピックの類似性はパース交錯の共通のサブグラフとして表わされる。これらは接続されたクラウドとして視覚化される。共通のグラフノードの数が多ければ多いほど、類似性は高くなる。修辞学的合致については、共通のサブグラフは、所与のテキストにある場合には、大きくする必要がない。しかしながら、シードおよび応答の修辞関係およびコミュニケーション行動が相互に関連付けられて、対応関係が必要となる。 Topic similarities between seeds (requests) and responses are represented as common subgraphs of perspective intersections. These are visualized as connected clouds. The higher the number of common graph nodes, the higher the similarity. For rhetorical matching, common subgraphs do not need to grow if present in a given text. However, the rhetorical relationship and communicative behavior of seeds and responses are interrelated and require correspondence.

コミュニケーション行動についての一般化
2つのコミュニケーション行動AとAとの間の類似性は、AとAとの間で共通である特徴を所有する抽象動詞として規定される。2つの動詞の類似性を抽象動詞のような構造として定義することにより、修辞学的合致の評価などの帰納的学習タスクがサポートされる。一例においては、agree(合致する)およびdisagree(合致しない)という共通の2つの動詞間の類似性を以下のように一般化することができる。agree ^ disagree = verb(Interlocutor, Proposed_action, Speaker)。この場合、Interlocutor(対話)は、Proposed_actionをSpeaker(話し手)に提案した人であって、この人に対してSpeakerが自身の応答を伝えている。さらに、proposed_actionは、要求または提案を受諾するかまたは拒絶する場合にSpeakerが実行するであろう行動であり、Speakerは、特定の行動が提案された対象の人であって、なされた要求または提案に応える人である。
Generalizations on Communicative Behaviors The similarity between two communicative behaviors A 1 and A 2 is defined as abstract verbs possessing features that are common between A 1 and A 2 . Defining the similarity of two verbs as an abstract verb-like structure supports inductive learning tasks such as assessing rhetorical agreement. In one example, the similarity between two common verbs agree and disagree can be generalized as follows. agree ^ disagree = verb(Interlocutor, Proposed_action, Speaker). In this case, the Interlocutor is the person who proposed the Proposed_action to the Speaker to whom the Speaker is communicating his response. In addition, proposed_action is the action that the Speaker would perform if the request or proposal were to be accepted or rejected, and the Speaker is the person to whom the particular action is proposed and the person who responds to the request or proposal made.

さらに別の例においては、agree(合致する)とexplain(説明する)という動詞間の類似性は以下のとおりとなる:agree ^ explain = verb(Interlocutor, *, Speaker)。コミュニケーション行動の主題はコミュニケーション行動の文脈において一般化されているが、他の「物理的な」行動では一般化されない。したがって、局面は、対応する主題とともにコミュニケーション行動の個々の発生を一般化する。 In yet another example, the similarity between the verbs agree and explain is: agree ^ explain = verb(Interlocutor, *, Speaker). The subject of communicative behavior is generalized in the context of communicative behavior, but not in other "physical" behaviors. Aspects thus generalize individual occurrences of communicative behavior with corresponding subjects.

加えて、ダイアログを表わすコミュニケーション行動のシーケンスは、同様のダイアログの他のこのようなシーケンスと比較することができる。このような態様で、ダイアログの動的な談話構造と同様に個々のコミュニケーション行動の意味も(修辞関係によって反映されるその静的構造とは対照的に)表現される。一般化は各レベルで起こる複合的な構造的表現である。コミュニケーション行動の補題は、補題で一般化されており、その意味的役割はそれぞれの意味的役割で一般化されている。 Additionally, a sequence of communicative actions representing a dialog can be compared to other such sequences of similar dialogs. In this manner, the dynamic discourse structure of the dialogue as well as the meaning of individual communicative behaviors are represented (as opposed to their static structure reflected by rhetorical relations). Generalization is a complex structural expression that occurs at each level. The lemma of communicative behavior is generalized in the lemma, whose semantic roles are generalized with their respective semantic roles.

コミュニケーション行動は、ダイアログまたは対立の構造を示すために、テキストの著者によって用いられる。Searle, J. R.(1969)による「Speech acts: an essay in the philosophy of language」(Cambridge University Press)を参照されたい。主題は、これらの行動の文脈において一般化されており、他の「物理的な」行動では一般化されない。したがって、コミュニケーション行動の個々の出現は、それらの主題およびそれらのペアでも談話「ステップ」として一般化される。 Communicative behavior is used by text authors to indicate the structure of a dialogue or conflict. See "Speech acts: an essay in the philosophy of language" by Searle, J. R. (1969), Cambridge University Press. The subject is generalized in the context of these actions and not other "physical" actions. Individual occurrences of communicative behavior are thus generalized as discourse 'steps' in their subjects and also in their pairs.

VerbNetなどの動詞フレームと一致させる観点からも、コミュニケーション行動の一般化について考察することができる。コミュニケーション用リンクは、テキストにおける単一のエージェントよりも、参加(または言及)により関連付けられた談話構造を反映している。リンクは、コミュニケーション行動についての単語(人の伝達意図を暗示的に示す動詞または多数の単語)を接続するシーケンスを形成する。 Generalization of communication behavior can also be considered from the viewpoint of matching with verb frames such as VerbNet. Communicative links reflect discourse structures that are related by participation (or mention) rather than by a single agent in the text. A link forms a sequence that connects words (a verb or a number of words that imply a person's communicative intent) of a communicative action.

コミュニケーション行動は、行動者と、それら行動者に対して働きかける1つ以上のエージェントと、この行動の特徴を記述するフレーズとを含む。コミュニケーション行動は、形式の機能として記載することができる:動詞(エージェント、主題、原因)。この場合、動詞は、関与するエージェント同士の間における何らかのタイプの対話(たとえば、explain(説明する)、confirm(確認する)、remind(思い出させる)、disagree(合致しない)、deny(否定する)など)を特徴付ける。主題は、伝えられた情報または記載された目的語を指す。原因は、主題についての動機づけまたは説明を指す。 A communicative behavior includes an actor, one or more agents working with those actors, and a phrase that describes the characteristics of this behavior. Communicative behavior can be described as a function of form: verb (agent, subject, cause). In this case, the verb characterizes some type of interaction between the agents involved (e.g., explain, confirm, remind, disagree, deny, etc.). Subject refers to the information conveyed or the object of the statement. Cause refers to the motivation or explanation for the subject.

シナリオ(ラベル付きの有向グラフ)は、パース交錯G=(V,A)のサブグラフである。この場合、V={action、action、…action}は、コミュニケーション行動に対応する頂点の有限集合であり、Aは、以下のように分類されるラベル付きの円弧(順序付けされた頂点のペア)の有限集合である。 Scenarios (labeled directed graphs) are subgraphs of Perth intersection G=(V,A). where V={action 1 , action 2 , .

各々の円弧action、action∈Asequenceは、同じ主題(たとえばs=sまたはさまざまな主題)を参照する2つの行動v、ag、s、cおよびv、ag、s、cに対応している。各々の円弧action、action∈Acauseは、actionの原因がactionの主題または原因と対立していることを示すactionとactionとの攻撃関係に対応している。 Each arc action i , action j εA sequence corresponds to two actions v i , ag i , s i , c i and v j , ag j , s j , c j that refer to the same subject (eg s j =s i or different themes). Each arc action i , action j εA cause corresponds to an attack relationship between action i and action j indicating that the cause of action i is in conflict with the subject or cause of action j .

エージェント同士の間の対話のシナリオに関連付けられたパース交錯のサブグラフはいくつかの顕著な特徴を有する。たとえば、(1)すべての頂点は時間で順序づけられており、このため、(最初の頂点および終端の頂点を除いた)すべての頂点には1つの入来する円弧および1つの外向き円弧が存在する。(2)Asequenceの円弧の場合、最大でも1つの入来する円弧および1つの外向き円弧だけが許容される。(3)Acause円弧の場合、入来する多くの円弧だけでなく、所与の頂点からの多くの外向き円弧も存在し得る。関与する頂点は、異なるエージェントまたは同じエージェント(つまりこのエージェントが自分自身と矛盾している場合)に関連付けられてもよい。パース交錯とそれらのコミュニケーション行動との間の類似性を演算するために、誘導されたサブグラフ、円弧の同様のラベルと同じ構成を有するサブグラフおよび頂点の厳密な対応関係が分析される。 The perspective intersection subgraphs associated with interaction scenarios between agents have several salient features. For example: (1) all vertices are time-ordered, so there is one incoming arc and one outgoing arc for every vertex (except for the initial and terminal vertices). (2) For A sequence arcs, at most only one incoming and one outgoing arc is allowed. (3) For A cause arcs, there may be many incoming arcs as well as many outgoing arcs from a given vertex. The vertices involved may be associated with different agents or the same agent (ie if this agent contradicts itself). To compute the similarity between perspective intersections and their communication behavior, the induced subgraphs, the subgraphs with similar labels and the same configuration of arcs and the strict correspondences of vertices are analyzed.

以下の類似性は、パース交錯のコミュニケーション行動の円弧を分析することによって存在する。(1)T2からの主題付き別のコミュニケーション行動に対する、T1からの主題付き1つのコミュニケーション行動(コミュニケーション行動の円弧は用いられない)、および、(2)T2からの別のペアのコミュニケーション行動と比較される、T1からの主題付きの1ペアのコミュニケーション行動(コミュニケーション行動の円弧が用いられる)。 The following similarities exist by analyzing the communicative behavioral arcs of Peirce crossovers. (1) one topic communication action from T1 against another topic communication action from T2 (communication action arc is not used) and (2) one pair of topic communication action from T1 (communication action arc is used) compared to another pair of communication action from T2.

2つの異なるコミュニケーション行動の一般化はそれらの属性に基づいている。Galitsky他(2013)を参照されたい。図14に関連付けて説明した例から分かるように、T1からの1つのコミュニケーション行動、すなわちcheating(husband, wife, another lady)は、T2からの第2のコミュニケーション行動、すなわちavoid(husband, contact(husband, another lady)と比較することができる。一般化の結果、communicative_action(husband,*)となり、これにより、所与のエージェント(= husband)がQにおいてCAの主題として言及される場合に、彼(彼女)がAにおける(場合によっては別の)CAの主題でもあるべきという形式の制約がAに対して導入される。2つのコミュニケーション行動は常に一般化することができるが、これはそれらの主題の場合には該当しない。それらの一般化の結果が空である場合、これらの主題を備えたコミュニケーション行動の一般化の結果も空となる。 A generalization of two different communicative behaviors is based on their attributes. See Galitsky et al. (2013). 14, one communicative action from T1, namely cheating(husband, wife, another lady), can be compared with a second communicative action from T2, namely avoid(husband, contact(husband, another lady). The generalization results in communicative_action(husband,*), whereby if a given agent (=husband) is mentioned in Q as the subject of CA, then he (she) is (possibly A constraint of the form that it should also be the subject of CA is introduced for A. Two communicative behaviors can always be generalized, but this is not the case with their subjects: if the result of their generalization is empty, then the result of generalizing the communicative behavior with these subjects is also empty.

RST関係の一般化
談話ツリー同士の間のいくつかの関係は一般化することができ、同じタイプの関係(対照などの表示関係、条件などの主題関係、およびリストなどの多核の関係)を表わす円弧などは一般化することができる。核または核によって示される状況は、「N」によって示される。衛星または衛星によって示される状況は、「S」によって示される。「W」は書き手を示す。「R」は読み手(聞き手)を示す。状況は、提案、完了した行動または進行中の行動、ならびにコミュニケーション行動および状態(beliefs(信念)、desires(要望)、approve(承認する)、explain(説明する)、reconcile(和解させる)などを含む)である。上述のパラメータによる2つのRST関係の一般化は以下のように表わされる:
rst1(N1,S1,W1,R1) ^ rst2(N2,S2,W2,R2)=
(rst1 ^ rst2)(N1 ^ N2,S1 ^ S2,W1 ^ W2,R1 ^ R2).
N1、S1、W1、R1におけるテキストはフレーズとして一般化される。たとえば、rst1 ^ rst2は以下のように一般化することができる。(1)relation_type(rst1)!= relation_type(rst2)である場合、一般化は空である。(2)その他の場合には、修辞関係のシグネチャがセンテンスとして一般化される。
Generalization of RST Relations Some relations between discourse trees can be generalized, such as arcs representing the same type of relations (presentation relations such as contrasts, subject relations such as conditions, and polynuclear relations such as lists). A nucleus or a situation denoted by a nucleus is denoted by "N". A satellite or a situation indicated by a satellite is indicated by an 'S'. "W" indicates the writer. "R" indicates a reader (listener). Contexts are proposals, completed or ongoing actions, and communicative actions and states (including beliefs, desires, approve, explain, reconcile, etc.). A generalization of the two RST relations with the above parameters is expressed as follows:
rst1(N1,S1,W1,R1)^rst2(N2,S2,W2,R2)=
(rst1^rst2)(N1^N2,S1^S2,W1^W2,R1^R2).
The text in N1, S1, W1, R1 is generalized as phrases. For example, rst1 ^ rst2 can be generalized to (1) The generalization is empty if relation_type(rst1) != relation_type(rst2). (2) Otherwise, rhetorical signatures are generalized as sentences.

sentence(N1,S1,W1,R1) ^ sentence(N2,S2,W2,R2)
Iruskieta、Mikel、Iria da CunhaおよびMaite Taboadaによる「A qualitative comparison method for rhetorical structures: identifying different discourse structures in multilingual corpora」(Lang Resources & Evaluation. June 2015, Volume 49, Issue 2)を参照されたい。
sentence(N1,S1,W1,R1) ^ sentence(N2,S2,W2,R2)
See Iruskieta, Mikel, Iria da Cunha and Maite Taboada, "A qualitative comparison method for rhetorical structures: identifying different discourse structures in multilingual corpora" (Lang Resources & Evaluation. June 2015, Volume 49, Issue 2).

たとえば、the meaning of rst-background ^ rst-enablement= (S increases the ability of R to comprehend an element in N) ^ (R comprehending S increases the ability of R to perform the action in N) = increase-VB the-DT ability-NN of-IN R-NN to-IN。 For example, the meaning of rst-background ^ rst-enablement= (S increases the ability of R to comprehend an element in N) ^ (R comprehending S increases the ability of R to perform the action in N) = increase-VB the-DT ability-NN of-IN R-NN to-IN.

また、rst-background ^ rst-enablementの関係はさまざまであるので、RST関係部分は空である。次いで、それぞれのRST関係の動詞的定義である表現が一般化される。たとえば、各々の単語ごとに、またはエージェントなどの単語についてのプレースホルダに関して、この単語(そのPOSを備える)は、その単語が各々の入力されたフレーズにおいて同じであれば保持され、その単語がこれらのフレーズ間で異なっていればその単語を除外する。結果として生ずる表現は、形式的に取得される2つの異なるRST関係の定義間で共通の意味として解釈することができる。 Also, since the rst-background ^ rst-enablement relationship varies, the RST relationship part is empty. Expressions that are verbal definitions of each RST relation are then generalized. For example, for each word, or for a placeholder for a word such as agent, this word (with its POS) is retained if the word is the same in each input phrase, and excluded if the word is different between these phrases. The resulting representation can be interpreted as a common meaning between two different RST relation definitions that are formally obtained.

図14に示される質問と回答との間の2つの円弧が、RST関係「RST-対比」に基づいた一般化インスタンスを示す。たとえば、「I just had a baby」は、「it does not look like me」とのRST-対比であり、さらには、「have the basic legal and financial commitments」とのRST-対比である「husband to avoid contact」に関連している。上記から分かるように、回答は、質問の動詞句に類似している必要はないが、質問および回答の修辞構造は類似している。回答内のすべてのフレーズが必ずしも質問におけるフレーズと一致するとは限らない。たとえば、一致しないフレーズは、質問におけるフレーズに関連する回答内のフレーズとの特定の修辞関係を有している。 The two arcs between the question and answer shown in FIG. 14 indicate generalized instances based on the RST relation "RST-contrast". For example, "I just had a baby" relates to the RST-contrast to "it does not look like me", which in turn relates to the RST-contrast to "have the basic legal and financial commitments", "husband to avoid contact". As can be seen from the above, the answer need not resemble the verb phrase of the question, but the rhetorical structure of the question and answer are similar. Not every phrase in the answer necessarily matches the phrase in the question. For example, unmatched phrases have a particular rhetorical relationship with phrases in the answer that are related to phrases in the question.

コミュニケーション用談話ツリーの構築
図15は、一局面に従った、コミュニケーション用談話ツリーを構築するための例示的なプロセスを示す。アプリケーション102はプロセス1500を実現することができる。上述のように、コミュニケーション用談話ツリーは改善された検索エンジン結果を可能にする。
Building a Communicative Discourse Tree FIG. 15 illustrates an exemplary process for building a communicative discourse tree, according to one aspect. Application 102 may implement process 1500 . As noted above, the discourse tree for communication enables improved search engine results.

ブロック1501では、プロセス1500はフラグメントを含むセンテンスにアクセスするステップを含む。少なくとも1つのフラグメントは動詞および複数の単語を含む。各々の単語は、フラグメント内における複数の単語の役割を含む。各々のフラグメントは基本談話単位である。たとえば、アプリケーション102は、図13に関連付けて記載されるように、「Rebels, the self-proclaimed Donetsk People's Republic, deny that they controlled the territory from which the missile was allegedly fired」などのセンテンスにアクセスする。 At block 1501, process 1500 includes accessing a sentence containing a fragment. At least one fragment includes a verb and multiple words. Each word contains multiple word roles within the fragment. Each fragment is a basic discourse unit. For example, application 102 accesses a sentence such as "Rebels, the self-proclaimed Donetsk People's Republic, deny that they controlled the territory from which the missile was allegedly fired," as described in connection with FIG.

上述の例に続けて、アプリケーション102は、センテンスがいくつかのフラグメントを含んでいると判断する。たとえば、第1のフラグメントは、「Rebels, …, deny」である。第2のフラグメントは「that they controlled the territory」である。第3のフラグメントは、「from which the missile was allegedly fired」である。各々のフラグメントは、動詞(たとえば、第1のフラグメントについての「deny」および第2のフラグメントについての「controlled」)を含んでいる。ただし、フラグメントは動詞を含んでいる必要はない。 Continuing with the example above, application 102 determines that the sentence contains several fragments. For example, the first fragment is "Rebels, ..., deny". The second fragment is "that they controlled the territory". The third fragment is "from which the missile was allegedly fired". Each fragment contains a verb (eg, "deny" for the first fragment and "controlled" for the second fragment). However, fragments need not contain verbs.

ブロック1502では、プロセス1500は、センテンスフラグメント間の修辞関係を表わす談話ツリーを生成するステップを含む。談話ツリーは複数ノードを含む。各々の非終端ノードは、センテンスフラグメントのうちの2つのセンテンスフラグメント間の修辞関係を表わし、談話ツリーの複数ノードのうちの各終端ノードはセンテンスフラグメントのうちの1つに関連付けられている。 At block 1502, process 1500 includes generating a discourse tree representing rhetorical relationships between sentence fragments. A discourse tree contains multiple nodes. Each non-terminal node represents a rhetorical relationship between two of the sentence fragments, and each terminal node of the nodes of the discourse tree is associated with one of the sentence fragments.

上述の例に続けて、アプリケーション102は図13に示されるような談話ツリーを生成する。たとえば、第3のフラグメントである「from which the missile was allegedly fired」は、「that they controlled the territory」を詳述している。第2のフラグメントおよび第3のフラグメントはともに、起こった(すなわち、反乱分子が領域を制圧していないのでその攻撃は反乱分子ではあり得なかった)ことの属性に関係している。 Continuing with the example above, application 102 generates a discourse tree as shown in FIG. For example, the third fragment, "from which the missile was allegedly fired," details "that they controlled the territory." Both the second and third fragments relate to the attributes of what happened (ie, the attack could not have been an insurgent because the insurgent did not take over the area).

ブロック1503においては、プロセス1500は多数の動詞シグネチャにアクセスするステップを含む。たとえば、アプリケーション102は、たとえばVerbNetからの動詞のリストにアクセスする。各々の動詞は、フラグメントの動詞と一致するかまたはフラグメントの動詞と関係がある。たとえば、第1のフラグメントの場合、動詞は「deny」である。したがって、アプリケーション102は、動詞「deny」に関係のある動詞シグネチャのリストにアクセスする。 At block 1503, process 1500 includes accessing multiple verb signatures. For example, application 102 accesses a list of verbs, eg from VerbNet. Each verb matches or is related to the verb of the fragment. For example, for the first fragment the verb is "deny". Accordingly, application 102 accesses a list of verb signatures related to the verb "deny."

上述のとおり、各々の動詞シグネチャは、フラグメントの動詞および主題役割の1つ以上を含んでいる。たとえば、シグネチャは、名詞句(NP)、名詞(N)、コミュニケーション行動(V)、動詞句(VP)または副詞(ADV)のうち1つ以上を含む。主題役割は、動詞と関連する単語との関係を記述している。たとえば、「The teacher amused the children」は、「small children amuse quickly」とは異なるシグネチャを有する。第1のフラグメントである動詞「deny」の場合、アプリケーション102は、フレームのリスト、または、「deny」に一致する動詞についての動詞シグネチャにアクセスする。リストは「NP V NP to be NP」、「NP V that S」、および「NP V NP」である。 As noted above, each verb signature includes one or more of the fragment's verbs and thematic roles. For example, the signature includes one or more of noun phrases (NP), nouns (N), communicative behaviors (V), verb phrases (VP) or adverbs (ADV). Thematic roles describe the relationship between verbs and related words. For example, "The teacher amused the children" has a different signature than "small children amuse quickly". For the first fragment, the verb "deny", application 102 accesses the list of frames or verb signatures for verbs that match "deny". The list is "NP V NP to be NP", "NP V that S", and "NP V NP".

各々の動詞シグネチャは主題役割を含む。主題役割は、センテンスフラグメントにおける動詞の役割を指している。アプリケーション102は、各々の動詞シグネチャにおける主題役割を判断する。例示的な主題役割は、「actor」(行動者)、「agent」(エージェント)、「asset」(アセット)、「attribute」(属性)、「beneficiary」(受益者)、「cause」(原因)、「location destination source」(位置宛先送信元)、「destination」(宛先)、「source」(源)、「location」(位置)、「experiencer」(経験者)、「extent」(程度)、「instrument」(器具)、「material and product」(材料および製品)、「material」(材料)、「product」(製品)、「patient」(患者)、「predicate」(述語)、「recipient」(受取側)、「stimulus」(刺激)、「theme」(テーマ)、「time」(時間)または「topic」(トピック)を含む。 Each verb signature contains a thematic role. Thematic role refers to the role of the verb in the sentence fragment. Application 102 determines the thematic role in each verb signature. Exemplary subject roles are "actor", "agent", "asset", "attribute", "beneficiary", "cause", "location destination source", "destination", "source", "location", "experiencer", "extent", "instrument". ), "material and product", "material", "product", "patient", "predicate", "recipient", "stimulus", "theme", "time" or "topic".

ブロック1504において、プロセス1500は、動詞シグネチャのうちの各動詞シグネチャごとに、フラグメントにおける単語の役割と一致するそれぞれのシグネチャの主題役割の数を判断するステップを含む。第1のフラグメントの場合、修辞学的分類アプリケーション102は、動詞「deny」が「agent」、「verb」および「theme」という3つの役割しか持たないと判断する。 At block 1504, the process 1500 includes, for each verb signature of the verb signatures, determining the number of thematic roles of each signature that match the word roles in the fragment. For the first fragment, the rhetorical classification application 102 determines that the verb "deny" has only three roles: "agent", "verb" and "theme".

ブロック1505において、プロセス1500は、最多数の一致を有する特定の動詞シグネチャに基づいて動詞シグネチャから特定の動詞シグネチャを選択するステップを含む。たとえば、図13を再び参照すると、第1のフラグメントである「the rebels deny that they controlled the territory」における「deny」は、動詞シグネチャdeny「NP V NP」に一致しており、「control」はcontrol(rebels, territory)に一致している。動詞シグネチャは入れ子状にされており、結果として、「deny(rebel, control(rebel, territory))」という入れ子状にされたシグネチャが得られる。 At block 1505, process 1500 includes selecting a particular verb signature from the verb signatures based on the particular verb signature with the highest number of matches. For example, referring back to FIG. 13, "deny" in the first fragment "the rebels deny that they controlled the territory" matches the verb signature deny "NP V NP" and "control" matches control(rebels, territory). The verb signatures are nested, resulting in a nested signature of "deny(rebel, control(rebel, territory))".

要求・応答の表現
要求・応答ペアは、単独でまたはペアとして分析することができる。一例において、要求・応答ペアをつなぎ合わせることができる。つなぎ合わせの際に、修辞学的合致は、連続するメンバー間だけでなく、3つのメンバー間および4タプルのメンバー間でも保持されると予想される。談話ツリーは要求・応答ペアのシーケンスを表すテキストのために構築することができる。たとえば、顧客苦情のドメインにおいては、要求および応答は、苦情を申し立てた顧客の観点から見て同じテキスト内にある。顧客苦情テキストは、要求および応答テキスト部分に分割することができ、次いで、肯定的なデータセットおよび否定的なデータセットのペアを形成することができる。一例においては、支持者についてのすべてのテキストおよび相手方についてのすべてのテキストが組合わされる。以下の各パラグラフのうちの第1のセンテンスは(3つのセンテンスを含むであろう)要求部分を形成することとなり、各パラグラフの第2のセンテンスは、(この例においては3つのセンテンスを含むであろう)応答部分を形成することとなる。
Request-Response Representation Request-response pairs can be analyzed singly or as pairs. In one example, request-response pairs can be strung together. Upon splicing, rhetorical agreement is expected to be preserved not only between consecutive members, but also between tri-members and members of a 4-tuple. A discourse tree can be constructed for text that represents a sequence of request-response pairs. For example, in the domain of customer complaints, the request and response are in the same text from the point of view of the complaining customer. The customer complaint text can be split into request and response text parts, which can then form pairs of positive and negative data sets. In one example, all texts about supporters and all texts about opponents are combined. The first sentence of each paragraph below will form the request portion (which will contain three sentences) and the second sentence of each paragraph will form the response portion (which in this example will contain three sentences).

図16は、一局面に従った、談話ツリーおよびシナリオグラフを示す。図16は、談話ツリー1601およびシナリオグラフ1602を示す。談話ツリー1601は以下の3つのセンテンスに対応する。 FIG. 16 shows discourse trees and scenario graphs, according to one aspect. FIG. 16 shows discourse tree 1601 and scenario graph 1602 . Discourse tree 1601 corresponds to the following three sentences.

(1)私は、(私が預金した後に記入した)私の小切手が不渡りになったことを説明した。顧客サービス代表は、預金を処理するのに通常いくらか時間がかかることを認めた(I explained that my check bounced (I wrote it after I made a deposit). A customer service representative accepted that it usually takes some time to process the deposit.)。 (1) I explained that my check (written after I made the deposit) had been dishonored. A customer service representative accepted that it usually takes some time to process the deposit.

(2)私は、1か月前に同様の状況で超過引出し料金を不当に請求されたことを思い出した。彼らは、超過引出し料金が私の口座情報に開示されていたのでそれが不当であったことを否定した(I reminded that I was unfairly charged an overdraft fee a month ago in a similar situation. They denied that it was unfair because the overdraft fee was disclosed in my account information.)。 (2) I recall being unfairly charged an overdraft fee in a similar situation a month ago. They denied that it was unfair because the overdraft fee was disclosed in my account information.

(3)私は彼らの料金に同意せず、この料金が私の口座に返却されることを希望した。彼らは、この時点で何も行うことができないこと、および、私が口座規則をより綿密に調べる必要があることを説明した(I disagreed with their fee and wanted this fee deposited back to my account. They explained that nothing can be done at this point and that I need to look into the account rules closer.)。 (3) I disagreed with their charge and wanted this charge returned to my account. They explained that nothing can be done at this point and that I disagreed with their fee and wanted this fee deposited back to my account. They explained that nothing can be done at this point and that I need to look into the account rules closer.

図16における談話ツリーから分かるように、テキストが対話または説明を表わしているかどうか判断することは判定が困難であるかもしれない。したがって、パース交錯のコミュニケーション行動の円弧を分析することによって、テキスト間の暗黙的な類似性を発見することができる。たとえば、一般的な条件では、
(1)第2のツリーからの主題付きの別のコミュニケーション行動に対する、第1のツリーからの主題付きの1つのコミュニケーション行動(コミュニケーション行動の円弧は用いられていない)。
As can be seen from the discourse tree in FIG. 16, it can be difficult to determine if the text represents dialogue or explanation. Therefore, implicit similarities between texts can be discovered by analyzing the arcs of communicative behavior of Perth crossovers. For example, in general conditions,
(1) One communicative action with a subject from the first tree against another communicative action with a subject from the second tree (communication action arcs are not used).

(2)第2のツリーからの別のペアのコミュニケーション行動に対する、第1のツリーからの主題付きの1ペアのコミュニケーション行動(コミュニケーション行動の円弧が用いられている)。 (2) one pair of communicative behaviors with themes from the first tree (the arc of the communicative behavior is used) against another pair of communicative behaviors from the second tree;

たとえば、上述の例においては、cheating(husband, wife, another lady) ^ avoid(husband, contact(husband, another lady))の一般化は、我々にcommunicative_action(husband, *)を提供し、これにより、所与のエージェント(=husband)がQにおいてCAの主題として言及される場合、彼(彼女)がAにおける(場合によっては別の)CAの主題でもあるべきという形式の制約がAに対して導入される。 For example, in the above example, the generalization of cheating(husband, wife, another lady) ^ avoid(husband, contact(husband, another lady)) gives us communicative_action(husband, *), which introduces a constraint on A of the form that if a given agent (=husband) is mentioned as the subject of a CA in Q, he (she) should also be the subject of a (possibly another) CA in A.

CAの主題を表す単語の意味を扱うために、ある単語を、「word2vector」モデルなどのベクトルモデルに適用することができる。より具体的には、コミュニケーション行動の主題間の一般化を演算するために、以下の規則を用いることができる:subject1=subject2であれば、subject1^subject2 = <subject1, POS(subject1), 1>である。この場合、主題は残ってままであり、スコアは1である。その他の場合、主題が同じpart-of-speech(POS)を有する場合、subject1^subject2 = <*, POS(subject1), word2vecDistance(subject1^subject2)>となる。ここで、「*」は、補題がプレースホルダであることを示しており、スコアはこれらの単語間のword2vec距離である。POSが異なっている場合、一般化は空のタプルであるとともに、さらに一般化されない可能性もある。 A word can be applied to a vector model, such as the "word2vector" model, to handle the meaning of words that represent the subject of CA. More specifically, the following rules can be used to compute cross-subject generalizations of communication behavior: If subject1=subject2 then subject1^subject2 = <subject1, POS(subject1), 1>. In this case the subject remains and the score is 1. Otherwise, subject1^subject2 = <*, POS(subject1), word2vecDistance(subject1^subject2)> if the subjects have the same part-of-speech (POS). Here the '*' indicates that the lemma is a placeholder and the score is the word2vec distance between these words. If the POS are different, the generalization is an empty tuple and may not generalize further.

要求・応答ペアのための分類設定
従来の検索では、基準線として、要求・応答ペア間の一致は、単語出現頻度に対する逆文書頻度(term frequency-inverse document frequency)の略であるTF*IDFなどのキーワード統計の観点から測定することができる。検索の関連性を改善させるために、このスコアは、アイテム人気度、アイテム位置または分類学ベースのスコア(Galitsky(2015))によって強化される。検索も、機械学習フレームワークにおける経路の再ランク付け問題として策定することができる。特徴空間は、要求・応答ペアを要素として含んでおり、分離超平面は、この特徴空間を正確なペアと不正確なペアとに分割する。したがって、検索の問題は、ReqとRespとの間の類似性としてローカルな方法で、または要求・応答ペア間の類似性によって、グローバルな学習方法で策定することができる。
Classification Settings for Request-Response Pairs In traditional searches, as a baseline, match between request-response pairs can be measured in terms of keyword statistics such as TF*IDF, which stands for term frequency-inverse document frequency. To improve search relevance, this score is augmented by item popularity, item location or taxonomy-based scores (Galitsky (2015)). Search can also be formulated as a path re-ranking problem in a machine learning framework. A feature space contains request-response pairs as elements, and a separating hyperplane divides this feature space into exact and imprecise pairs. Thus, the search problem can be formulated in a local way as the similarity between Req and Resp or in a global learning way as the similarity between request-response pairs.

要求と応答との間の一致を判断するための他の方法も実現可能である。第1の例においては、アプリケーション102は、ReqおよびRespについての特徴を抽出し、これらの特徴をカウントとして比較して、スコアがクラスを示し得るようにスコアリング関数を導入する(不正確なペアの場合には低いスコア、正確なペアの場合には高いスコアとなる)。 Other methods for determining matches between requests and responses are also possible. In a first example, application 102 extracts features for Req and Resp, compares these features as counts, and introduces a scoring function so that scores can indicate class (low score for incorrect pairs, high score for correct pairs).

第2の例においては、アプリケーション102は、ReqおよびRespについての表現を互いと比較して、比較結果についてのスコアを割当てる。同様に、スコアはクラスを示すだろう。 In a second example, application 102 compares expressions for Req and Resp against each other and assigns a score for the comparison result. Similarly, the score would indicate class.

第3の例においては、アプリケーション102は、ペアであるReqおよびResp<Req,Resp>についての表現を、トレーニングセットの要素として構築する。アプリケーション102は、次いで、すべてのこのような要素<Req,Resp>の特徴空間において学習を実行する。 In a third example, application 102 constructs expressions for pairs Req and Resp<Req, Resp> as elements of the training set. Application 102 then performs learning in the feature space of all such elements <Req, Resp>.

図17は、一局面に従った、要求・応答ペアの形成を示す。図17は、要求・応答ペア1701、要求ツリー(または目的語)1702および応答ツリー1703を示す。<Req,Resp>の目的語を形成するために、アプリケーション102は、要求についての談話ツリーと応答についての談話ツリーとをルートRRと組合わせて単一のツリーにする。アプリケーション102は、次いで、目的語を正確な(高い合致度の)カテゴリーと不正確な(低合致度の)カテゴリーとに分類する。 FIG. 17 illustrates forming a request-response pair, according to one aspect. FIG. 17 shows request-response pairs 1701 , request trees (or objects) 1702 and response trees 1703 . To form the object of <Req, Resp>, application 102 combines the discourse tree for the request and the discourse tree for the response with the root RR into a single tree. Application 102 then classifies the objects into exact (high match) and inexact (low match) categories.

最隣接グラフをベースにした分類
CDTが構築されると、テキストにおける論証を識別するために、アプリケーション102は、肯定的なクラスについてのCDTと比較された類似性を演算し、それがその否定的なクラスについてのCDTのセットに達するほどに低いことを検証する。CDT間の類似性は最大共通サブCDTによって規定される。
Nearest Neighbor Graph Based Classification Once the CDT is constructed, to identify arguments in the text, the application 102 computes the similarity compared to the CDT for the positive class and verifies that it is low enough to reach the CDT set for the negative class. Similarity between CDTs is defined by the largest common sub-CDT.

一例においては、 In one example,

Figure 2023531345000004
Figure 2023531345000004

からの頂点ラベルおよびエッジラベルを備えたCDT(V,E)の順序付けされたセットGが構築される。Gからのラベル付けされたCDT Γは、複数ペアをなす形式((V,l),(E,b))の1ペアである。この場合、Vは1セットの頂点であり、Eは1セットのエッジであり、 An ordered set G of CDT(V,E) is constructed with vertex and edge labels from . The labeled CDT Γ from G is a pair of the multipaired form ((V, l), (E, b)). where V is a set of vertices, E is a set of edges,

Figure 2023531345000005
Figure 2023531345000005

は、頂点にラベルを割当てる関数であり、b:E→Λは、エッジにラベルを割当てる関数である。同一のラベルが付された同形のツリーは識別されない。 is a function that assigns labels to vertices, and b:E→Λ E is a function that assigns labels to edges. Isomorphic trees with identical labels are not identified.

順序は以下のように規定される。2つのCDTに関して、Gから、Γ:=((V,l),(E,b))およびΓ:=((V,l),((E,b))となり、さらに、そのΓは、1対1のマッピングφ:V→Vが存在する場合、ΓまたはΓ≦Γを支配している(かまたは、ΓはΓのサブCDTである)。このため、これは、 The order is defined as follows. For two CDTs, from G we have Γ 1 :=((V 1 ,l 1 ),(E 1 ,b 1 )) and Γ 2 :=((V 2 ,l 2 ),((E 2 ,b 2 )) , and that Γ 1 dominates Γ 2 or Γ 2 ≦Γ 1 if there exists a one-to-one mapping φ:V 2 →V 1 (or , Γ 2 is a sub-CDT of Γ 1 ), so this is

Figure 2023531345000006
Figure 2023531345000006

を考慮に入れるとともに、(2) (2)

Figure 2023531345000007
Figure 2023531345000007

の下で適合することとなる。
この定義は、「より大きな」CDT Gから「より小さな」CDT Gに至る場合に、一致した頂点同士のラベルの類似性(「弱まり」)の計算を考慮に入れている。
will be compatible under
This definition allows for the computation of label similarity (“weakening”) between matched vertices when going from a “larger” CDT G 1 to a “smaller” CDT G 2 .

ここで、X^Y=Zによって示されるCDT XおよびCDT Yのペアの類似性CDT Zは、XおよびYのすべての含有-最大共通サブCDTのセットであり、それらの各々は、一致させるために以下の追加条件を満たしている。具体的には、(1)CDT XおよびCDT Yからの2つの頂点は同じRST関係を示さなければならない。(2)Zからの各々の共通サブCDTは、XおよびYにおけるのと同じVerbNetシグネチャを備えた少なくとも1つのコミュニケーション行動を含む。 where the similarity CDT Z of a pair of CDT X and CDT Y denoted by X^Y=Z is the set of all containing-maximum common sub-CDTs of X and Y, each of which satisfies the following additional conditions for matching: Specifically, (1) two vertices from CDT X and CDT Y must exhibit the same RST relation. (2) Each common sub-CDT from Z contains at least one communication behavior with the same VerbNet signature as in X and Y;

この定義は、いくつかのグラフの一般化を発見できるように容易に拡張される。グラフセットXおよびYのペアについての包摂の順序は、当然、XμY:=X*Y=Xとして規定される。 This definition is easily extended so that some graph generalizations can be found. The order of subsumption for pairs of graphsets X and Y is naturally defined as XμY:=X*Y=X.

図18は、一局面に従った、最大の共通サブコミュニケーション用談話ツリーを示す。ツリーが反転されており、円弧のラベルが一般化されていることに留意されたい。コミュニケーション行動site()は、コミュニケーション行動say()で一般化される。前者のCA委員会の第1の(エージェント)論証は後者のCAオランダ人の第1の論証で一般化される。同じ動作が、CA同士のこのペアについての第2の論証に適用される: investigator ^ evidence。 FIG. 18 shows a discourse tree for maximal common subcommunications, according to one aspect. Note that the tree is inverted and the arc labels are generalized. The communication behavior site() is generalized with the communication behavior say(). The CA Commission's first (agent) argument for the former is generalized in the CA Dutch's first argument for the latter. The same behavior applies to the second evidence for this pair of CAs: investigator^evidence.

CDT Uは肯定的なクラスに属しているため、(1)Uは肯定的な例Rで(空でない共通サブCDTを有する)と類似するとともに、(2)如何なる否定的な例Rの場合であっても、Uが、 CDT U belongs to the positive class, so that (1) U is similar (with non-empty common sub-CDT) in positive examples R + and (2) for any negative example R , if U

Figure 2023531345000008
Figure 2023531345000008

と類似している場合には、U*RμU*Rとなる。
この条件は、類似性の基準を導入するものであって、クラスに割り当てられるようにするために、未知のCDT Uと肯定的なクラスから最も近接しているCDTとの間の類似性が、Uと各々の否定的な例との間の類似性よりも高くなるはずであることを述べている。条件2は、肯定的な例Rが存在しており、このため、するRがない場合には、U*RμRを有すること、すなわち、肯定的な例のこの一般化に対する反例が存在しないこと、を示唆している。
, then U*R μU*R + .
This condition introduces a similarity criterion, stating that in order to be assigned to a class, the similarity between an unknown CDT U and the closest CDT from the positive class should be higher than the similarity between U and each negative example. Condition 2 implies that if there is a positive example R + and therefore there is no R to do, then we have U*R + μR , i.e. there is no counterexample to this generalization of positive examples.

CDTのための交錯カーネル学習
ストリング、パースツリーおよびパース交錯についてのツリーカーネル学習は、最近になって確立された研究分野である。パースツリーカーネルは、2つのインスタンス間の談話類似性の基準として共通のサブツリーの数をカウントする。ツリーカーネルはJoty、ShafiqおよびA. MoschittiによりDTに関して規定された「Discriminative Reranking of Discourse Parses Using Tree Kernels」(Proceedings of EMNLP; 2014)である。さらに、Wang、W., Su, J., & Tan, C. L.(2010)による「Kernel Based Discourse Relation Recognition with Temporal Ordering Information」(In Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics)も参照されたい。(談話関係認識のためにツリーカーネルの特別な形式を使用している)。交錯カーネルは、コミュニケーション行動についての情報によってDTカーネルを増強することによって、CDTに関して規定される。
Interlace Kernel Learning for CDT Tree kernel learning for strings, partrees and parse intersections is a recently established research area. The partree kernel counts the number of common subtrees as a measure of discourse similarity between two instances. The tree kernel is the "Discriminative Reranking of Discourse Parses Using Tree Kernels" (Proceedings of EMNLP; 2014) specified for DT by Joty, Shafiq and A. Moschitti. See also Wang, W., Su, J., & Tan, CL (2010), "Kernel Based Discourse Relation Recognition with Temporal Ordering Information" (In Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics). (We are using a special form of tree kernel for discursive relation recognition). A crossover kernel is defined for the CDT by augmenting the DT kernel with information about communication behavior.

CDTは、各々のサブツリータイプの整数カウントのベクトルVによって(その先祖を考慮に入れることなく)表わすことができる:
V(T)=(タイプ1のサブツリーの#,…,タイプIのサブツリーの#,…,タイプnのサブツリーの#)。この結果、異なるサブツリーの数がそのサイズでは指数関数的になるので、次元性が非常に高くなる。したがって、特徴ベクトル
A CDT can be represented by a vector V of integer counts of each subtree type (without taking into account its ancestors):
V(T)=(# of type 1 subtree, . . . , # of type I subtree, . . . , # of type n subtree). This results in very high dimensionality, since the number of different subtrees is exponential in size. So the feature vector

Figure 2023531345000009
Figure 2023531345000009

を直接用いることは、計算上、実行不可能である。計算上の問題を解決するために、ツリーカーネル関数を導入して、上述の高次元ベクトル間のドット積を効率的に計算する。2つのツリーセグメントCDT1およびCDT2があると想定して、ツリーカーネル関数が以下のとおり規定される:
K(CDT1,CDT2)=<V(CDT1),V(CDT2)>=ΣiV(CDT1)[i],V(CDT2)[i]=Σn1Σn2 Σi Ii(n1)Ii(n2)
この場合、n1∈N1およびn2∈N2であり、N1およびN2は、それぞれ、CDT1およびCDT2におけるすべてのノードのセットである。
directly using is computationally infeasible. To solve the computational problem, we introduce a tree kernel function to efficiently compute the dot product between the above high-dimensional vectors. Assuming there are two tree segments CDT1 and CDT2, the tree kernel function is defined as follows:
K(CDT1, CDT2)=<V(CDT1), V(CDT2)>=ΣiV(CDT1)[i], V(CDT2)[i]=Σn1Σn2 Σi Ii(n1) * Ii(n2)
In this case n1εN1 and n2εN2, where N1 and N2 are the set of all nodes in CDT1 and CDT2, respectively.

Ii(n)はインジケータ関数である。
Ii(n)={タイプiのサブツリーがノードにおけるルートで起こる場合には1であり、他の場合には0である}。K(CDT1,CDT2)は、ツリー構造に対する畳み込みカーネルのインスタンスであり(CollinsおよびDuffy;2002年)、回帰的定義によって演算することができる。
Ii(n) is the indicator function.
Ii(n)={1 if a subtree of type i occurs at the root at the node, 0 otherwise}. K(CDT1, CDT2) is an instance of the convolution kernel for the tree structure (Collins and Duffy; 2002) and can be computed by a recursive definition.

Δ(n1,n2)=ΣI Ii(n1)Ii(n2)
ここで、n1およびn2に同じPOSタグが割り当てられるかまたはそれらの子供が異なるサブツリーである場合にはΔ(n1,n2)=0となる。
Δ(n1,n2)=ΣIIi(n1) * Ii(n2)
where Δ(n1,n2)=0 if n1 and n2 are assigned the same POS tag or their children are different subtrees.

それ以外の場合、n1およびn2がともにPOSタグである(前終端ノードである)場合、Δ(n1,n2)=1xλとなる。
その他の場合、以下のとおりである。
Otherwise, if n1 and n2 are both POS tags (pre-terminal nodes), then Δ(n1, n2)=1×λ.
Otherwise:

Figure 2023531345000010
Figure 2023531345000010

この場合、ch(n,j)はノードnのj番目の子供であり、nc(n)はnの子供の数であり、λ(0<λ<1)は、カーネル値をサブツリーサイズに対してそれほど変動させないようにするための腐食要因となる。加えて、再帰的なルール(3)が保持される。なぜなら、同じ子供たちに2つのノードがあると想定すると、これら子供たちを用いて共通サブツリーを構築するとともに、さらなる子孫の共通サブツリーを構築することができるからである。パースツリーカーネルは、2つのインスタンス間の構文的な類似性基準として共通サブツリーの数をカウントする。 In this case, ch(n,j) is the jth child of node n, nc(n 1 ) is the number of children of n 1 , and λ(0<λ<1) is a corrosion factor to keep the kernel value from varying too much with subtree size. Additionally, the recursive rule (3) is retained. This is because, given two nodes of the same children, these children can be used to build a common subtree, as well as a common subtree of further descendants. The partree kernel counts the number of common subtrees as a syntactic similarity measure between two instances.

図19は、一局面に従った、コミュニケーション用談話ツリーのためのカーネル学習フォーマットでツリーを示す。 FIG. 19 shows trees in a kernel training format for discourse trees for communication, according to one aspect.

ラベルとしてのコミュニケーション行動についての項は、RST関係についてのそれぞれのノードに加えられるツリーに変換される。終端ノードのためのラベルとしてのEDUについてのテキストに関しては、フレーズ構造だけが保持される。終端ノードは、パースツリーフラグメントではなくフレーズタイプのシーケンスでラベル付けされる。 Terms on communicative behavior as labels are transformed into a tree that is added to each node on RST relations. For the text of EDUs as labels for terminal nodes, only the phrase structure is preserved. Terminal nodes are labeled with a sequence of phrase types rather than parse tree fragments.

ラベルA(B,C(D))が付けられた、ノードXから終端EDUノードYまでの修辞関係円弧がある場合、サブツリーA-B→(C-D)がXに付加される。 If there is a rhetorical relational arc from node X to the terminal EDU node Y, labeled A(B,C(D)), then the subtree AB→(CD) is attached to X.

修辞学的合致分類器の実現
修辞学的合致分類器120は、コミュニケーション用談話ツリーを用いることにより、質問および回答などの2つのセンテンス間の相補性を判断することができる。図20は、一局面に従った、修辞学的合致分類器を実現するのに用いられる例示的なプロセスを示す。図20は、アプリケーション102によって実現することができるプロセス2000を示す。上述のように、修辞学的合致分類器120はトレーニングデータ125でトレーニングされる。
Implementation of the Rhetorical Match Classifier The rhetorical match classifier 120 can determine complementarity between two sentences, such as questions and answers, by using a communicative discourse tree. FIG. 20 illustrates an exemplary process used to implement a rhetorical match classifier, according to one aspect. FIG. 20 shows a process 2000 that may be implemented by application 102 . As described above, rhetorical matching classifier 120 is trained with training data 125 .

修辞学的合致分類器120は、質問および回答の両方についてのコミュニケーション用談話ツリーを判断する。たとえば、修辞学的合致分類器120は、質問171または入力テキスト130などの質問から質問コミュニケーション用談話ツリーを構築するとともに、候補回答から回答コミュニケーション用談話ツリーを構築する。 A rhetorical match classifier 120 determines a communicative discourse tree for both questions and answers. For example, rhetorical match classifier 120 builds a discourse tree for question communication from a question, such as question 171 or input text 130, and a discourse tree for answer communication from candidate answers.

ブロック2001においては、プロセス2000は、質問センテンスに関して、質問ルートノードを含む質問コミュニケーション用談話ツリーを判断するステップを含む。質問センテンスは明確な質問、要求またはコメントであり得る。アプリケーション102は、入力テキスト130から質問コミュニケーション用談話ツリー110を作成する。図13および図15に関連付けて説明された例を用いて、例示的な質問センテンスは、「are rebels responsible for the downing of the flight」である。アプリケーション102は、図15に関連付けて記載されるプロセス1500を用いることができる。例示的な質問は「elaborate(詳述する)」のルートノードを有する。 At block 2001, process 2000 includes determining, for a question sentence, a discourse tree for question communication that includes a question root node. A question sentence can be a specific question, request or comment. Application 102 creates discourse tree 110 for question communication from input text 130 . Using the example described in connection with Figures 13 and 15, an exemplary question sentence is "are rebels responsible for the downing of the flight". Application 102 may use process 1500 described in connection with FIG. The exemplary question has a root node of "elaborate".

ブロック2002において、プロセス2000は、回答センテンスに関して、第2のコミュニケーション用談話ツリーを判断するステップを含む。この場合、回答コミュニケーション用談話ツリーは回答ルートノードを含む。上述の例に続けて、アプリケーション102は、図13に示されるように、ルートノード「詳述する」も有するコミュニケーション用談話ツリー111を作成する。 At block 2002, process 2000 includes determining a second communicative discourse tree for the answer sentence. In this case, the discourse tree for reply communication includes the reply root node. Continuing with the example above, application 102 creates a communication discourse tree 111 that also has a root node "explain", as shown in FIG.

ブロック2003において、プロセス2000は、質問ルートノードおよび回答ルートノードが同一であることを識別することによって、コミュニケーション用談話ツリーを関連付けるステップを含む。アプリケーション102は、質問コミュニケーション用談話ツリーおよび回答コミュニケーション用談話ツリーが同一のルートノードを有すると判断する。結果として得られる関連付けられたコミュニケーション用談話ツリーが図17に示されており、「要求・応答ペア」としてラベル付けされ得る。 At block 2003, process 2000 includes associating communication discourse trees by identifying that the question root node and the answer root node are the same. Application 102 determines that the discourse tree for question communication and the discourse tree for answer communication have the same root node. The resulting associated discourse tree for communication is shown in Figure 17 and can be labeled as "request-response pairs".

ブロック2004において、プロセス2000は、マージされた談話ツリーに予測モデルを適用することによって、質問コミュニケーション用談話ツリーと回答コミュニケーション用談話ツリーとの間の相補性のレベルを演算するステップを含む。 At block 2004, process 2000 includes computing the level of complementarity between the discourse trees for question communication and the discourse trees for answer communication by applying a predictive model to the merged discourse trees.

修辞学的合致分類器は機械学習技術を用いる。一局面においては、アプリケーション102は修辞学的合致分類器120をトレーニングして用いる。たとえば、アプリケーション102は、肯定的なクラスおよび否定的なクラスの要求・応答ペアを規定する。肯定的なクラスは、修辞学的に正確な要求・応答ペアを含んでおり、否定的なクラスは関連しているが修辞学的に異種の要求・応答ペアを含んでいる。 The rhetorical match classifier uses machine learning techniques. In one aspect, application 102 trains and uses rhetorical match classifier 120 . For example, application 102 defines a positive class and a negative class of request-response pairs. The positive class contains rhetorically exact request-response pairs, and the negative class contains related but rhetorically disparate request-response pairs.

各々の要求・応答ペアごとに、アプリケーション102は、各々のセンテンスをパースして、センテンスフラグメントについての動詞シグネチャを取得することによってCDTを構築する。 For each request-response pair, application 102 constructs a CDT by parsing each sentence and obtaining verb signatures for sentence fragments.

アプリケーション102は、関連付けられたコミュニケーション用談話ツリーペアを修辞学的合致分類器120に提供する。修辞学的合致分類器120は、相補性のレベルを出力する。 Application 102 provides associated communicative discourse tree pairs to rhetorical match classifier 120 . The rhetorical match classifier 120 outputs the level of complementarity.

ブロック2005においては、プロセス2000は、相補性のレベルがしきい値を上回っていると判断したことに応じて、質問センテンスと回答センテンスとを補足的なものとして識別するステップを含む。アプリケーション102は、質問・回答ペアが十分に補足的であるかどうかを判断するために相補性のしきい値レベルを用いることができる。たとえば、分類スコアがしきい値よりも大きい場合、アプリケーション102は、回答を回答172または回答150として出力することができる。代替的には、アプリケーション102は、回答を廃棄し、回答データベース105または別の候補回答のための公共データベースにアクセスして、必要に応じてプロセス2000を繰り返し得る。 At block 2005, process 2000 includes identifying the question and answer sentences as complementary in response to determining that the level of complementarity exceeds the threshold. Application 102 can use the threshold level of complementarity to determine whether question-answer pairs are sufficiently complementary. For example, application 102 may output the answer as answer 172 or answer 150 if the classification score is greater than the threshold. Alternatively, application 102 may discard the answer, access answer database 105 or another public database for candidate answers, and repeat process 2000 as necessary.

一局面においては、アプリケーション102が同一指示(co-reference)を得る。さらなる局面においては、アプリケーション102はエンティティおよびサブエンティティまたは下位語リンク(hyponym link)を得る。下位語は、単語に適用可能な一般的用語または上位の用語よりも具体的な意味をもつ単語である。たとえば、「スプーン」は「刃物類」の下位語である。 In one aspect, application 102 obtains a co-reference. In a further aspect, application 102 obtains entities and subentities or hyponym links. Narrower terms are words that have a more specific meaning than the general terms or broader terms applicable to the word. For example, "spoon" is a narrower term for "cutlery."

別の局面においては、アプリケーション102は交錯カーネル学習を表現に適用する。交錯カーネル学習は、たとえば、ブロック2004において、分類ベースの学習の代わりに行うことができる。アプリケーション102は要求・応答ペアのパースツリーのためのパース交錯ペアを構築する。アプリケーション102は、要求・応答ペアについての談話ツリーペアを得るために談話を構文解析する。アプリケーション102は、談話ツリー要求・応答およびパースツリー要求・応答の基本談話単位を整合させる。アプリケーション102は、談話ツリー要求・応答の基本談話単位とパースツリー要求・応答の基本談話単位とをマージする。 In another aspect, application 102 applies interlaced kernel learning to the representation. Interlaced kernel learning may be performed in block 2004 instead of classification-based learning, for example. Application 102 builds parse interlaced pairs for a partree of request-response pairs. Application 102 parses the discourse to obtain discourse tree pairs for request-response pairs. Application 102 aligns the basic discourse units of discourse-tree request-response and partree request-response. The application 102 merges the basic discourse units of the discourse-tree request-response and the basic discourse units of the partree request-response.

一局面においては、アプリケーション102はword2vectorモデルによってテキスト類似性評価を改善させる。 In one aspect, the application 102 improves text similarity assessment with the word2vector model.

さらなる局面においては、アプリケーション102は、質問コミュニケーション用談話ツリーに対応するセンテンス、または回答コミュニケーション用談話ツリーに対応するセンテンスをモバイルデバイス170などのデバイスに送る。アプリケーション102からの出力は、検索クエリ、データベース照合または他のシステムへの入力として用いることができる。このような態様で、アプリケーション102は検索エンジンシステムと一体化することができる。 In a further aspect, application 102 sends sentences corresponding to discourse trees for question communication or sentences corresponding to discourse trees for answer communication to a device, such as mobile device 170 . Output from application 102 can be used as input to search queries, database lookups, or other systems. In this manner, application 102 can be integrated with a search engine system.

図21は、一局面に従った、投稿に関してコメントするチャットボットを示す。図21は、チャット2100、ユーザメッセージ2101~2104およびエージェント応答2105を示す。エージェント応答2105は、アプリケーション102によって実現することができる。図示のとおり、エージェント応答2105は、ユーザメッセージ2101~2104のスレッドに対する適切な回答を識別した。 FIG. 21 illustrates a chatbot commenting on posts, according to one aspect. FIG. 21 shows chat 2100, user messages 2101-2104 and agent responses 2105. FIG. Agent response 2105 can be implemented by application 102 . As shown, agent response 2105 identified an appropriate answer to the thread of user messages 2101-2104.

図22は、一局面に従った、投稿に関してコメントするチャットボットを示す。図22は、チャット2200、ユーザメッセージ2201~2205およびエージェント応答2206を示す。図22は、ユーザ1からの3つのメッセージ、具体的には2201、2203および2205と、ユーザ2からの2つのメッセージ、具体的には2202および2204とを示す。エージェント応答2206は、アプリケーション102によって実現することができる。図示のとおり、エージェント応答2106は、メッセージ2201~2204のスレッドに対する適切な回答を識別した。 FIG. 22 illustrates a chatbot commenting on posts, according to one aspect. FIG. 22 shows chat 2200, user messages 2201-2205 and agent responses 2206. FIG. FIG. 22 shows three messages from User 1, specifically 2201, 2203 and 2205, and two messages from User 2, specifically 2202 and 2204. FIG. Agent response 2206 can be implemented by application 102 . As shown, agent response 2106 identified an appropriate answer for the thread of messages 2201-2204.

図21および図22において示される特徴は、コンピューティングデバイス101によって実現することができるか、または、コンピューティングデバイス101に入力テキスト130を提供して、コンピューティングデバイス101から回答150を受取る装置によって実現することができる。 The features shown in FIGS. 21 and 22 can be implemented by computing device 101 or by an apparatus that provides input text 130 to computing device 101 and receives answers 150 from computing device 101.

RR合致およびRR不合理性についての付加的なルール
以下は、RR合致を実施するために制約を導入する構造ルールの例である:
1.ReqおよびRespはともに、同じ感情極性を有する(要求が肯定的であれば、応答も同様に肯定的であるはずであり、逆の場合も同様である)。
Additional Rules for RR Matches and RR Irrationality The following are examples of structural rules that introduce constraints to enforce RR matches:
1. Both Req and Resp have the same emotional polarity (if the request is positive, the response should be positive as well, and vice versa).

2.ReqおよびRespはともに論理的な論証を有している。
合理的な推論下では、要求および応答は完全に一致するだろう。合理的なエージェントは、関連性があるとともに質問の修辞表現と一致するであろう回答を提示するだろう。しかしながら、実際の世界においては、すべての応答が十分に合理的であるとは限らない。認識のバイアスについての調査団体は、合理性または好適な判断の基準から体系的に逸脱する可能性のある特定の方法で思考する人の傾向を調査している。
2. Both Req and Resp have a logical argument.
Under reasonable reasoning, the request and response would match perfectly. A rational agent will present an answer that will be both relevant and consistent with the rhetorical expression of the question. In the real world, however, not all responses are sufficiently rational. Cognitive bias research groups examine people's propensity to think in certain ways that may systematically deviate from their standards of rationality or good judgment.

対応関係バイアスは、人々が、質問に応答する際に、自分以外の人について観察される挙動に関して個性ベースの説明を過剰に強調する傾向である。Baumeister, R. F. & Bushman, B. J.による「Social psychology and human nature」(International Edition: 2010)を参照されたい。同時に、問合せに返答する人々は、同じ挙動に対する状況に応じた影響の役割および力を過少に強調する。 Correspondence bias is the tendency of people to overemphasize personality-based explanations of observed behavior of others other than themselves when responding to questions. See Baumeister, R. F. & Bushman, B. J., Social psychology and human nature (International Edition: 2010). At the same time, people responding to queries underemphasize the role and power of contextual influence on the same behavior.

確認バイアスは、質問に回答する人々の先入観を確認するようなやり方で情報を探索するかまたは解釈する傾向である。彼らは、彼らの見解を支持しない情報を信用しない可能性がある。確認バイアスは認知的不協和の概念と関係がある。これにより、個々人は、自身の見解を再確認する情報を探索することによって矛盾を減らすこともある。 Confirmation bias is the tendency to seek or interpret information in a way that confirms the preconceived notions of those answering the question. They may distrust information that does not support their views. Confirmation bias is related to the concept of cognitive dissonance. This may allow individuals to reduce conflicts by seeking out information that reaffirms their views.

アンカリングは、決定を下す際に、情報の一特性または一部分に極めて大きく依存しすぎることまたは「アンカーする」ことにつながる。 Anchoring leads to relying too heavily on or "anchoring" one property or piece of information in making a decision.

利用可能性ヒューリスティックは、我々に、記憶内においてイベントの起こる見込みをより大きな「可用性」で過大評価させるものであって、これは、記憶がどれほど最近のものであるかによって、または、記憶が如何に異常にまたは感情的に変更され得るかによって、影響を受ける可能性がある。 The availability heuristic causes us to overestimate the likelihood of an event occurring within a memory with a greater 'availability', which can be affected by how recent the memory is or how it can be abnormally or emotionally altered.

バンドワゴン効果に従うと、人々は、他の多くの人々が同じことを実行する(または信じる)ことを信じて質問に回答する。 According to the bandwagon effect, people answer questions by believing that many other people will do (or believe) the same thing.

信念バイアスは、論証の論理強度についての誰かの評価が結論の信用性によって偏らされる効果である。 Belief bias is the effect in which someone's assessment of the logical strength of an argument is biased by the credibility of the conclusion.

バイアス盲点は、他の人々に対するバイアスよりも自分に対するバイアスを少なくして自身を見つめる傾向、または、自分自身よりも他人をより高い認識バイアスで識別することができる傾向である。 A bias blind spot is the tendency to see oneself less biased toward oneself than toward other people, or the tendency to be able to identify others with a higher cognitive bias than oneself.

評価
テストデータの第1のドメインはYahoo!Answersからの質問・回答ペアに由来しており、これは、質問と回答とのセットが広範囲なトピックでペアになっている。440万人のユーザの質問のセットのうち、2つを超えるセンテンスを含む20000の質問が選択されている。大多数の質問に対する回答は適正に詳述されているため、フィルタリングは回答に適用されなかった。1つの質問当たり複数の回答があり、最良の回答に印が付けられている。質問・最良回答のペアを肯定的なトレーニングセットの要素としてみなし、質問-その他回答を否定的なトレーニングセットの要素としてみなしている。否定的なセットを導き出すために、異なっているがいくらか関連している質問に対する回答を任意に選択するか、または、質問からクエリを形成して、ウェブ検索結果から回答を得た。
Evaluation The primary domain for test data is Yahoo! Derived from Question-Answer Pairs from Answers, which is a set of questions and answers paired on a wide range of topics. Of the set of questions of 4.4 million users, 20,000 questions containing more than 2 sentences were selected. No filtering was applied to the answers, as the answers to the majority of the questions were properly detailed. There are multiple answers per question and the best answer is marked. We consider question-best-answer pairs as members of the positive training set and question-other-answers as members of the negative training set. To derive the negative set, we randomly selected answers to different but somewhat related questions, or formed queries from the questions and obtained answers from web search results.

我々の第2のデータセットはソーシャルメディアを含む。我々は、主としてFacebook(登録商標)上の投稿から要求・応答ペアを抽出した。我々は、さらに、雇用に関係するLinkedIn.comとvk.comとの会話のうちより小さな部分を用いた。ソーシャルドメインにおいては、記述の基準がかなり低い。テキストの粘着性は非常に制限されており、論理的構造および関連性がしばしば欠けている。著者は、数年にわたり、自身のアカウントと、APIを介して利用可能な公のFacebookアカウントとから、トレーニングセットを形成した(記述時には、メッセージを得るためのFacebook APIの書込みは不可能である)。加えて、我々は、エンロン(Enron)データセットからの860個の電子メールスレッドを用いた。さらに、我々は、人のユーザホストの代わりに自動的に投稿を生成するエージェントの投稿に対する手動応答のデータを集めた。Galitsky B.、Dmitri Ilvovsky、 Nina LebedevaおよびDaniel Usikovによる「Improving Trust in Automation of Social Promotion: AAAI Spring Symposium on The Intersection of Robust Intelligence and Trust in Autonomous Systems; Stanford, CA 2014)(「Galitsky 2014」)を参照されたい。さまざまなソーシャルネットワークソースから4000のペアを形成した。 Our second dataset includes social media. We extracted request-response pairs primarily from Facebook posts. We also used smaller portions of conversations with LinkedIn.com and vk.com related to employment. In the social domain, the standard of writing is quite low. Text cohesiveness is very limited and often lacks logical structure and relevance. Over the years, the author has formed a training set from his own account and public Facebook accounts available via the API (at the time of writing writing the Facebook API to get the messages is not possible). Additionally, we used 860 email threads from the Enron dataset. In addition, we collected data on manual responses to posts by agents that automatically generate posts on behalf of human user hosts. See Galitsky B., Dmitri Ilvovsky, Nina Lebedeva and Daniel Usikov, Improving Trust in Automation of Social Promotion: AAAI Spring Symposium on The Intersection of Robust Intelligence and Trust in Autonomous Systems; Stanford, CA 2014 (“Galitsky 2014”). Formed 4000 pairs from various social network sources.

第3のドメインは顧客苦情である。典型的な苦情に関して、不満を示す顧客は、製品およびサービスに関する自身の問題と、さらに、顧客がこれらの問題を如何に会社に伝えるようと試みたか、および会社がそれに如何に応答したかについてのプロセスとを記載している。苦情は、しばしば、製品故障を誇張するとともに相手方の行動を不当で不適切であると表現するといった偏見を持って書かれている。同時に、苦情を申し立てる人々は、説得力があり一貫した論理的に矛盾のない方法で苦情を記載しようと試みる(「Galitsky 2014」)。したがって、苦情は、要求と応答との間の合致率が高いドメインとして機能する。ユーザの苦情と会社の応答との間の合致を(このユーザがどのように記載するかに応じて)査定する目的で、我々は、10年にわたってplanetfeedback.comから670の苦情を集めた。 A third domain is customer complaints. For typical complaints, dissatisfied customers describe their problems with products and services, as well as the process by which the customer attempted to communicate these problems to the company and how the company responded. Complaints are often written with prejudices such as exaggerating product failures and portraying the other party's behavior as unfair and inappropriate. At the same time, complainants attempt to state their complaints in a persuasive, coherent, and logically consistent manner (“Galitsky 2014”). Complaints thus serve as a domain with a high rate of matching between requests and responses. For the purpose of assessing the match between user complaints and company responses (according to how the user describes them), we collected 670 complaints from planetfeedback.com over ten years.

第4のドメインはジャーナリストによるインタビューである。通常、専門のジャーナリストによるインタビューの記載は、質問と回答との一致する水準が非常に高くなるような方法で書かれている。また、我々は、datran.com、allvoices.com、huffingtonpost.comなどのようなソースから専門ジャーナリストおよび市民ジャーナリストによる1200の寄稿を集めた。 A fourth domain is interviews by journalists. Professional journalists usually write interviews in such a way that the level of agreement between questions and answers is very high. We also collected over 1200 contributions by professional and citizen journalists from sources such as datran.com, allvoices.com, huffingtonpost.com and others.

データ収集を促進するために、我々はクローラーを設計した。クローラーは、サイトの特定のセットを検索し、ウェブページをダウンロードし、候補テキストを抽出し、この候補テキストを質問もしくは要求に対する応答フォーマットに準拠していることを確認するものである。次いで、それぞれのペアのテキストが形成される。この検索は、ウェブおよびニュースのドメインにおけるBing Azure Search Engine APIによって実現される。 We designed a crawler to facilitate data collection. A crawler searches a particular set of sites, downloads web pages, extracts candidate text, and verifies that this candidate text conforms to a response format for a question or request. Each pair of texts is then formed. This search is powered by the Bing Azure Search Engine API in the web and news domains.

有効な回答および無効な回答の認識
回答分類の精度を表1に示す。各々の行は特定の方法を表わす。方法についての各クラスが灰色の領域に示されている。
Recognition of Valid and Invalid Responses Table 1 shows the accuracy of the response classification. Each row represents a particular method. Each class of methods is shown in the gray area.

Figure 2023531345000011
Figure 2023531345000011

最高精度がジャーナリズムおよびコミュニティー回答ドメインにおいて達成されており、最低精度が顧客苦情およびソーシャル社会ネットワークにおいて達成されていることが分かる。我々は、方法を確定させる精度が高ければ高いほど、ReqとRespとの間の合致レベルがより高くなり、これに応じて、応答者の適正能力がより高くなると結論付けることができる。 It can be seen that the highest accuracy is achieved in the journalism and community response domains and the lowest accuracy is achieved in customer complaints and social social networks. We can conclude that the higher the accuracy with which the method is established, the higher the level of agreement between Req and Resp and, accordingly, the higher the competence of the responder.

アプローチの決定論的ファミリ(中間の2行、ローカルなRR類似性ベースの分類)は、SVM TKよりも低い約9%を実行する。これは、ReqとResとpの間の類似性が、実質的には、RR合致を示すRRペアの特定の構造ほど重要でないことを示している。これは、ReqとRespとの間の合致を個人ベースで査定できないことを意味している。我々は、DT(Req)がDT(Resp)に非常に類似していることを必要とする場合、我々が得られる精度は適正であるものの再現度が極めて低くなるだろう。DTからCDTまで進展させたとしてもほんの1%~2%しか役に立たない。なぜなら、コミュニケーション行動が要求を構成したり応答を形成したりするという主な役割を果たさないからである。 The deterministic family of approaches (middle two rows, local RR-similarity-based classification) perform about 9% lower than SVM TK. This indicates that the similarity between Req and Res and p is substantially less important than the specific structure of the RR pair that indicates the RR match. This means that the match between Req and Resp cannot be assessed on an individual basis. If we require DT(Req) to be very similar to DT(Resp), the accuracy we get is reasonable but the recall will be very poor. Even progressing from DT to CDT is only 1% to 2% useful. This is because communicative behavior does not play a major role in constructing requests or shaping responses.

アプローチの統計的ファミリ(下5行、ツリーカーネル)に関して、談話データ(RR-DTについてのSVM TK)のうち最も豊富なソースが、RR類似性ベースの分類とほぼ同じである最高の分類精度を与える。RSTおよびCAについてのSVM TK(十分なパースツリー)はより多くの言語データを含んでいたが、そのうちのいくらかの部分(構文的である可能性が最も高い)は余分であって、制限されたトレーニングセットについての結果がより劣ったものとなる。感情および議論などのTK下で付加的な特徴を用いても役に立たない。ほとんどの場合、これらの特徴がRR-CDT特徴に由来するものであって、それら自体では分類精度に寄与するものではない可能性が高い。 Regarding the statistical family of approaches (bottom five rows, tree kernel), the richest source of discourse data (SVM TK for RR-DT) gives the highest classification accuracy, which is almost the same as RR similarity-based classification. SVM TK for RST and CA (sufficient partrees) contained more linguistic data, but some parts of it (most likely syntactic) were redundant, leading to poorer results on the restricted training set. Using additional features under TK, such as emotion and argument, does not help. Most likely, these features are derived from RR-CDT features and do not contribute to classification accuracy by themselves.

CDTに基づいたアプローチのTKファミリを採用することにより、DTを正確なものおよび不正確なものとして分類する際に達成される精度に匹敵する精度が得られる。修辞学的な構文解析タスクにおいて、最先端技術のシステムが過去数年にわたって激しい競争にさらされて、80%を超える精度を導き出した。 Employing the TK family of CDT-based approaches yields an accuracy comparable to that achieved in classifying DTs as correct and incorrect. In rhetorical parsing tasks, state-of-the-art systems have come under intense competition over the past few years, yielding accuracies in excess of 80%.

決定性ファミリにおける直接的な分析アプローチの機能はやや弱い。これは、より数多くのより複雑な特徴構造が必要であることを意味しており、修辞関係のタイプを単にカウントして考慮に入れるだけでは、RRが互いに如何に合致しているかを判断するのに不十分である。2つのRRペアが同じタイプおよびカウントの修辞関係さらにはコミュニケーション行動も有する場合、これらは依然として、大多数の事例における逆のRR合致クラスに属することができる。 The performance of the direct analytical approach in the deterministic family is rather weak. This means that more and more complex feature structures are needed, and simply counting and taking into account types of rhetorical relations is insufficient to determine how well the RRs match each other. If two RR pairs have the same type and count of rhetorical relations and even communicative behavior, they can still belong to opposite RR match classes in the vast majority of cases.

CDTについての最隣接ペアの学習ではCDTについてのSVM TKより精度が低くなるが、前者によって与えられるサブツリーの興味深い例は、議論に典型的なものであって、類事実データ中で共有されるものである。CDTサブツリーの前者グループの数は、当然はるかに多くなる。残念ながら、SVM TKアプローチは、RR合致問題が如何に正確に解決されるかを説明する助けにはならず、単に最終スコアリングおよびクラスラベルを示すだけである。コミュニケーション行動なしで応答中に論理的な論証を表わすこともできるが、稀である(この観察は我々のデータによって裏付けされている)。 Nearest-neighbor pair learning for CDT is less accurate than SVM TK for CDT, but interesting examples of subtrees given by the former are typical of the discussion and shared among analogous data. The number of former groups of CDT subtrees will naturally be much higher. Unfortunately, the SVM TK approach does not help explain how exactly the RR matching problem is solved, it merely shows the final scoring and class labels. Logical arguments can also be expressed in responses without communicative behavior, but are rare (this observation is supported by our data).

評価ドメインにおけるRR合致の測定
認識精度の評価の観点から、我々は、前述のサブセクションにおいて最適な方法を得た。ここで、この方法を確定させて、我々は、我々の評価ドメインにおけるRR合致を測定することとなる。さらに、我々は、最適な方法によって提供される一般的な合致の合計が、如何に、感情、論理的議論、トピックおよびキーワード関連性などの個々の合致基準と相互に関連付けられているかを示すだろう。我々がトレーニングセットにラベル付けするための我々の最適なアプローチ(RR-CDTについてのSVM TK)を用いる場合、そのサイズは劇的に大きくなり得るとともに、我々は、さまざまなドメインにおけるRR合致の興味深い特性を探究することができる。我々は、従前の評価よりも大きなデータセットに関するRR合致についてのいくつかの直観的な特徴の寄与を発見するだろう。
Measuring RR Matches in the Evaluation Domain In terms of recognition accuracy evaluation, we have obtained the optimal method in the previous subsection. Now, having finalized this method, we will measure RR agreement in our evaluation domain. In addition, we will show how the sum of general matches provided by the optimal method correlates with individual match criteria such as sentiment, reasoning, topic and keyword relevance. When we use our optimal approach to label the training set (SVM TK for RR-CDT), its size can grow dramatically and we can explore interesting properties of RR matches in various domains. We will find some intuitive feature contributions to the RR agreement on larger datasets than previous evaluations.

このサブセクションにおいて、我々は、RRペア有効性認識フレームワークが、任意の要求と応答との間の合致の基準として機能し得ることを証明することを意図している。さらに、この認識フレームワークは、さまざまな特徴が如何に強固にRRペア有効性と相互に関連付けられているかを査定することができる。 In this subsection, we intend to demonstrate that the RR pair validity recognition framework can serve as a basis for matching between arbitrary requests and responses. Furthermore, this recognition framework can assess how strongly various features are correlated with RR pair effectiveness.

認識精度の評価から、我々は、RRペアが有効であるか否かを認識するための最適な方法を得た。ここで、この認識方法を確定させて、我々は、我々の評価ドメインにおいてRR合致を測定し、さらに、最適な方法によって提供される一般的な合致の合計が、如何に、感情、論理的議論、トピックおよびキーワード関連性などの個々の合致基準と相互に関連付けられているかを推測するだろう。我々がトレーニングセットにラベル付けするための我々の最適なアプローチ(RR-CDTについてのSVM TK)を用いる場合、そのサイズは劇的に大きくなり得るとともに、我々は、さまざまなドメインにおけるRR合致の興味深い特性を探究することができる。我々は、従前の評価よりも大きなデータセット上に、RR合致のうちいくつかの直観的な特徴の寄与を発見するだろう。我々は、認識精度(%、表2)として、上述の評価の肯定的なトレーニングデータセット上のみで、特徴ごとに、この合致を測定するだろう。再現度および否定的なデータセットが合致の査定には不要であることに留意されたい。 From the evaluation of recognition accuracy, we obtained the optimal method for recognizing whether RR pairs are valid or not. Now, having established this recognition method, we will measure the RR match in our evaluation domain and also infer how the sum of general matches provided by the best method correlates with individual match criteria such as sentiment, reasoning, topic and keyword relevance. When we use our optimal approach to label the training set (SVM TK for RR-CDT), its size can grow dramatically and we can explore interesting properties of RR matches in various domains. We will find the contribution of some intuitive features of the RR matches on a larger dataset than previous evaluations. We will measure this agreement, feature by feature, only on the positive training dataset of the above assessment as recognition accuracy (%, Table 2). Note that recall and negative data sets are not required for match assessment.

Figure 2023531345000012
Figure 2023531345000012

たとえば、我々は、bag-of-words(単語の袋)アプローチによって演算されるようなトピックによる合致によって判断されるRRペアが、RR-CDT分類についてのSVM TKに従って、顧客苦情のドメインにおける有効なRRペアであるという観察の精度を64.3%と評価する。 For example, we rate the accuracy of the observation that RR pairs determined by matching by topic as computed by the bag-of-words approach are valid RR pairs in the domain of customer complaints according to SVM TK for RR-CDT classification at 64.3%.

感情による合致は、RRペアにおける適切な感情合致の寄与を示す。感情ルールは、特に、RRの極性が同じである場合、要求が何を述べているかを応答が確認するべきであることを含んでいる。反対に、極性が逆の場合、要求が求めているものを応答は攻撃するべきである。論理的議論による合致は、応答が要求中の主張と合致していない適切なコミュニケーション談話を必要とする。 Emotional matches indicate the appropriate emotional match contribution in the RR pair. The sentiment rule specifically includes that if the RR polarity is the same, the response should confirm what the request says. Conversely, if the polarity is reversed, the response should attack what the request wants. A match by logical argument requires an appropriate communicative discourse in which the response does not match the assertion being requested.

このデータは、支持者が言っていることと相手方が如何に応答しているかとの間の言語的合致の性質を解明することの助けとなる。有効なダイアログ談話の場合、すべての合致特徴は存在する必要があるとは限らない。しかしながら、これらの特徴のうちほとんどが合致しない場合、所与の回答が無効で不適切であるとみなされるべきであり、別の回答が選択されるべきである。表2は、さまざまなドメインにおいて、どの特徴をどの程度、ダイアログのサポートに用いなければならないかを我々に示している。したがって、提案された技術は、書込み品質および顧客サポート品質査定の自動化手段としての役割を果たすことができる。 This data helps elucidate the nature of the linguistic match between what the advocate is saying and how the other party is responding. Not all matching features need to be present for a valid dialog discourse. However, if most of these characteristics are not met, the given answer should be considered invalid and inappropriate and another answer should be selected. Table 2 shows us which features have to be used to support dialogs and to what extent in various domains. Therefore, the proposed technique can serve as an automated means of writing quality and customer support quality assessment.

チャットボットアプリケーション
ソーシャルプロモーションのための会話エージェント(Conversational Agent for Social Promotion:CASP)は、彼または彼女についてのコミュニケーションを促進して管理するために人であるそのホストの代わりに機能する、シミュレートされた人格として提供されるエージェントである。Galitsky B., Dmitri Ilvovsky, Nina LebedevaおよびDaniel Usikovによる「Improving Trust in Automation of Social Promotion」(AAAI Spring Symposium on The Intersection of Robust Intelligence and Trust in Autonomous Systems; Stanford, CA 2014)がある。CASPは、他人のメッセージ、ブログ、フォーラム、画像および映像上でニュースを共有したりコメントしたりするなどの、ソーシャルネットワーク上のさほど重要でない活動であるルーチンから、そのホストである人を救済するものである。ソーシャルプロモーションのための会話エージェントは発展しているが、信頼を失う可能性もある。ウェブから掘り出された返答をフィルタリングするRRペア合致に焦点を合わせたCASPの性能全体が評価される。
Chatbot Applications A Conversational Agent for Social Promotion (CASP) is an agent provided as a simulated persona acting on behalf of its human host to facilitate and manage communications about him or her. Galitsky B., Dmitri Ilvovsky, Nina Lebedeva and Daniel Usikov, "Improving Trust in Automation of Social Promotion" (AAAI Spring Symposium on The Intersection of Robust Intelligence and Trust in Autonomous Systems; Stanford, CA 2014). CASP relieves its host from the routine of minor activities on social networks, such as sharing news and commenting on other people's messages, blogs, forums, images and videos. Conversational agents for social promotion are developing, but they can also lose credibility. The overall performance of CASP focused on RR pair matching filtering responses mined from the web is evaluated.

人々は、FacebookおよびLinkedInなどのソーシャルネットワークシステム上に、平均で、200人~300人の友人または接点を持っている。この多数の友人と積極的な関係を維持するために、これら友人らが投稿したりコメントしたりするものを読むのに1週間に数時間が必要となる。実際には、人々は、10人~20人の最も親しい友人、家族および同僚との関係しか維持しておらず、残りの友人との連絡をとるのは非常に稀である。それほど親しくないこれらの友人は、ソーシャルネットワーク関係が放棄されたと感じる。しかしながら、ソーシャルネットワークのすべてのメンバーとの積極的な関係を維持することは、仕事関連から個人的なことに至るまで生活の多くの局面にとって有益である。ソーシャルネットワークのユーザは、彼らに興味を持っていて、彼らのことを気にかけており、したがって、彼らの生活内のイベントに反応して、彼らが投稿したメッセージに応答することを、彼らの友人らに知らせるものと予想されている。したがって、ソーシャルネットワークのユーザは、ソーシャルネットワーク上で関係を維持するためにかなりの時間を当てる必要があるが、しばしばその時間がないこともある。親しい友人および家族のためには、ユーザは依然として手入力を用いて社交的に活動するだろう。ネットワークの残りについては、彼らは提案されているソーシャルプロモーション用のCASPを用いるだろう。 People have, on average, 200-300 friends or contacts on social networking systems such as Facebook and LinkedIn. Maintaining positive relationships with this large number of friends requires several hours a week to read what these friends post and comment on. In reality, people only maintain relationships with their 10-20 closest friends, family members and co-workers, and contact the rest of their friends very rarely. These not-so-close friends feel abandoned social network relationships. However, maintaining positive relationships with all members of a social network is beneficial to many aspects of life, from work-related to personal affairs. Users of social networks are expected to let their friends know that they are interested in them and care about them and therefore respond to the messages they post in response to events in their lives. Therefore, users of social networks must, and often do not have, a significant amount of time to maintain relationships on social networks. For close friends and family, the user will still socialize using manual input. For the rest of the network, they will use the proposed CASP for social promotion.

CASPは、ユーザのチャット、ブログおよびフォーラムに関するユーザの投稿、ショッピングサイトに対するコメントを追跡して、購入判断に関連するウェブドキュメントおよびそれらの断片情報を提案する。このために、テキストの部分を引用し、検索エンジンクエリ生成し、Bingなどの検索エンジンAPIに対してそれを実行させて、シードメッセージと無関係であると判断された検索結果をフィルタリングして除去する必要がある。最後のステップは、CASPの堅実な機能にとって重要であり、修辞学的空間における関連性が乏しければ、その空間における信頼の損失につながるだろう。したがって、RR合致の正確な査定はCASPを正常に使用するのに重要である。 CASP tracks user chats, user posts on blogs and forums, and comments on shopping sites to suggest web documents and their pieces of information relevant to purchasing decisions. This requires quoting portions of the text, generating a search engine query, and having a search engine API such as Bing execute it to filter out search results determined to be irrelevant to the seed message. The last step is critical to the robust functioning of CASP, and poor relevance in the rhetorical space will lead to a loss of trust in that space. Therefore, accurate assessment of RR match is critical to the successful use of CASP.

CASPは、或る人のコミュニケーションをその人のために促進して管理するためにその人のホストの代わりに機能する、シミュレートされた人格として提供される(図21~図22)。エージェントは、他人のメッセージ、ブログ、フォーラム、画像および映像上でニュースを共有したりコメントしたりするなどの、ソーシャルネットワーク上のさほど重要でない活動であるルーチンから、そのホストである人を救済するように設計されている。シミュレートされた人格のための大多数のアプリケーションドメインとは異なり、そのソーシャルパートナーは、彼らがニュース、世論および最新情報を自動化エージェントと交換することを必ずしも認識しているわけではない。我々は、CASPの修辞学的合致と、いくつかのFacebookアカウント内のその仲間の精神状態についての推理とを用いて実験を行った。我々は、それと通信する人のユーザに関係する精神状態に関する推論についてのその性能および精度を評価する。会話システムに関して、ユーザは、当該システムがユーザらの行動に適切に反応し、当該システムが返答したものが意味をなしていると感じる必要がある。水平なドメインおいてこれを達成するために、有意義な方法でメッセージを交換することができるように、言語情報を十分に活用する必要がある。 A CASP is provided as a simulated persona that acts on behalf of a person's host to facilitate and manage one's communications for that person (FIGS. 21-22). Agents are designed to rescue their hosts from routine, non-trivial activities on social networks such as sharing news and commenting on other people's messages, blogs, forums, images and videos. Unlike most application domains for simulated personalities, their social partners are not necessarily aware that they exchange news, opinion and updates with automated agents. We experimented with CASP's rhetorical matching and reasoning about the mental states of its peers within several Facebook accounts. We evaluate its performance and accuracy for reasoning about mental states related to human users with whom it communicates. For conversational systems, users need to feel that the system responds appropriately to their actions and that what the system replies makes sense. To achieve this in the horizontal domain, we need to make full use of linguistic information so that messages can be exchanged in a meaningful way.

CASPは、シード(人によって書き込まれた投稿)を入力するとともに、当該シードが形成するメッセージを出力する。当該メッセージは、ウェブ上で探し出された内容を、入力された投稿に関連するように調整することによって形成される。この関連性は、内容の点から見た適切さと、RR合致または精神状態合致の点から見た適切さとに基づいている(たとえば、それは、質問に対する質問、より多くの質問を求める推薦投稿に対する回答、などによって回答する)。 CASP inputs seeds (posts written by humans) and outputs messages formed by the seeds. The message is formed by tailoring content found on the web to be relevant to the entered post. This relevance is based on relevance in terms of content and relevance in terms of RR match or state of mind match (e.g., it answers by asking a question, answering a recommendation post asking for more questions, etc.).

図21および図22は、投稿に関してコメントするチャットボットを例示する。
我々は、内容および精神状態の両方に関連性がない場合に、人のユーザがCASPおよび自身のホストに対する信頼をどれほど失うのかを評価する。システム有用性の点から見て中間パラメータである修辞学的関連性を評価する代わりに、我々は、ユーザが、修辞学的に関連性がなく不適当な投稿によって悩まされている場合に当該ユーザがどれほどCASPに対する信頼を失うかを査定する。
Figures 21 and 22 illustrate chatbots commenting on posts.
We assess how much human users lose trust in CASPs and their hosts when there is no relevance in both content and state of mind. Instead of evaluating rhetorical relevance, which is an intermediate parameter in terms of system utility, we assess how much users lose trust in CASP when they are plagued by rhetorically irrelevant and inappropriate posts.

Figure 2023531345000013
Figure 2023531345000013

表3において、我々は、CASPの失敗に対するユーザの許容性の結果を示す。何回かの失敗の後に、友人らは信頼を失い、苦情を申し立て、友だちリストから削除し、他人との信頼を損失したことについての否定的な情報を共有し、さらには、CASPで有効にされている友人を友だちリストから削除するように他の友人らに奨励する。セルにおける値は、信頼が失われたそれぞれのイベントが起こった場合における修辞学的関連性が損なわれた投稿の平均数を示している。これらの関連性を損なった投稿は、この査定実施の1か月内に起こったものであり、我々は、これらの投稿の発生の相対的頻度についての値は得ていない。各ユーザ毎に、平均して100の投稿に対して応答があった(シード投稿当たり1~4)。 In Table 3 we show the results of user tolerance to CASP failures. After several failures, friends lose trust, file complaints, remove from friend lists, share negative information about their loss of trust with others, and even encourage other friends to remove CASP-enabled friends from their friend lists. The values in the cells indicate the average number of rhetorically disrelevant posts when each trust loss event occurred. These disrelevant postings occurred within one month of performing this assessment, and we do not obtain values for the relative frequency of occurrence of these postings. For each user, on average, 100 posts were responded to (1-4 per seed post).

さまざまなドメインに応じて、ユーザがCASPに対する信頼を失うシナリオが異なっていることが分かる。情報がそれほど重要ではない旅行およびショッピングのようなドメインの場合、関連性を損なうことに対する許容性は比較的高い。 It can be seen that different domains have different scenarios in which a user loses trust in a CASP. For domains such as travel and shopping where the information is less important, the tolerance for loss of relevance is relatively high.

逆に、仕事関連、私生活のような個人の好みなどの、より深刻に解釈されるドメインにおいては、ユーザは、CASPが機能しないことに対してより敏感であり、そのさまざまな形の信頼がより速やかに損われてしまう。 Conversely, in domains that are taken more seriously, such as work-related, personal preferences, etc., users are more sensitive to CASP failures and their various forms of trust are eroded more quickly.

すべてのドメインに関して、投稿が複雑になるのに応じて、許容性はゆっくりと低下する。ユーザの認識は、内容またはそれらの期待の点では関係なく、CASPによるより短くて単一のセンテンスまたはフレーズ投稿と比べて、より長いテキストの方が、より低下する。 For all domains, acceptance slowly declines as posts become more complex. Users' perceptions, regardless of content or their expectations, are worse for longer texts compared to posting shorter, single sentences or phrases by CASP.

アルゴリズムの自然言語記述のドメイン
形式クエリまたはコマンド言語に対して自然言語をマップできることは、データベースなどの多くのコンピューティングシステムに対するよりユーザフレンドリーなインターフェイスの開発にとって重要である。しかしながら、それらの形式言語の同等物とペアにされるセンテンスのコーパスからこのようなセマンティックパーサを学習する問題に対処している調査は相対的にほとんどない。Kate、Rohit、Y. W. WongおよびR. Mooneyによる「Learning to transform natural to formal languages」(AAAI,2005)がある。さらに、我々の知る限りでは、このような調査は談話レベルでは行なわれなかった。自然言語(natural language:NL)を完全な形式言語に変換することを学習することにより、複合型のコンピューティングおよびAIシステムに対するNLインターフェイスをより容易に開発することができる。
The Domain of Natural Language Descriptions of Algorithms The ability to map natural language to a formal query or command language is important for the development of more user-friendly interfaces to many computing systems such as databases. However, relatively little research has addressed the problem of learning such semantic parsers from corpora of sentences paired with their formal language counterparts. There is "Learning to transform natural to formal languages" by Kate, Rohit, YW Wong and R. Mooney (AAAI, 2005). Moreover, to our knowledge, no such investigation was conducted at the discourse level. Learning to convert natural language (NL) into a fully formal language makes it easier to develop NL interfaces to hybrid computing and AI systems.

40年以上前に、「構造化プログラミング(structured programming)」の概念を考案したオランダのコンピュータ科学者であるダイクストラ(Dijkstra)は、以下のように述べている。「私は、我々の母国語(それがオランダ語、英語、米語、フランス語、ドイツ語、またはスワヒリ語であろうと)でプログラミングされるべきマシンが、それらマシンが用いるであろうものと同じくらい途方もなく難解なものになっているのではないかと疑問に思っている。」。この先見者は明らかに正しかった。すなわち、プログラミング言語の専門性および高精度は、コンピューティングおよびコンピュータにおける極めて大きな進歩を可能にしたものでもある。ダイクストラは、プログラミング言語の発明を数学的な象徴体系の発明と比較している。ダイクストラは以下のようにも述べている。「形式コードを用いる義務を負担とみなすのではなく、我々は、形式コードを用いる利便性を特権とみなすべきである。これら形式コードのおかげで、児童らは、天才だけが達成することができたことを初期に学ぶことができるのである」。しかし、40数年後、我々は、典型的な産業用途において占められている量のコード(サポートして開発するのが恐ろしいほどの数千万および数億行ものコード)に行き詰ったままである。「コード自体は最適な記述である」という言い回しは一種の悪い冗談となった。 Dijkstra, a Dutch computer scientist who coined the concept of "structured programming" more than 40 years ago, said: "I wonder if machines that are supposed to be programmed in our native language (whether it's Dutch, English, American, French, German, or Swahili) have become as extravagantly arcane as what they would use." The seer was clearly right. That is, the specialization and precision of programming languages have also enabled tremendous advances in computing and computing. Dijkstra compares the invention of programming languages to the invention of mathematical symbolism. Dijkstra also states: "Rather than viewing the obligation to use formal codes as a burden, we should regard the convenience of using formal codes as a privilege. These formal codes enable children to learn early on what only a genius could achieve." But forty-odd years later, we are still stuck with the amount of code occupied in typical industrial applications (tens and hundreds of millions of lines of code that are terrifying to support and develop). The phrase "code itself is the best description" has become a kind of bad joke.

プログラムの自然言語記述は、テキスト修辞学が特殊であるとともに記述間の合致は不可欠である分野である。我々は、アルゴリズム記述をソフトウェアコードにマップする共通の修辞学的表現およびドメイン特有の表現に注目するだろう。 Natural language description of programs is an area where text rhetoric is special and where agreement between descriptions is essential. We will focus on common rhetorical and domain-specific expressions that map algorithmic descriptions to software code.

図23は、一局面に従った、アルゴリズムテキストについての談話ツリーを示す。我々は、以下のテキストおよびそのDT(図23)を有する。 FIG. 23 shows a discourse tree for an algorithmic text, according to one aspect. We have the following text and its DT (Fig. 23).

1)任意のピクセルp1を発見する。
2)すべてのピクセルが128未満となるようにこのピクセルp1が属する凸状エリアa_offを発見する。
1) Find any pixel p1.
2) Find the convex area a_off to which this pixel p1 belongs such that all pixels are less than 128;

3)選択されたエリアの境界が128を超えるピクセルをすべて有していることを検証する。 3) Verify that the boundaries of the selected area have all pixels greater than 128;

4)上述の検証が成功した場合、肯定的な結果で停止する。その他の場合には、128未満であるすべてのピクセルをa_offに加える。 4) If the above verification is successful, stop with a positive result. Otherwise, add all pixels that are less than 128 to a_off.

5)a_offのサイズがしきい値未満であることをチェックする。次に、2に進む。その他の場合には、否定的な結果で停止する。 5) Check that the size of a_off is less than the threshold. Then go to 2. Otherwise, stop with a negative result.

我々は、ここで、特定のセンテンスを論理形式に変換して、さらにソフトウェアコード表現に変換する方法を示す。いくつかの修辞関係は、個々のセンテンスの翻訳の結果得られた記述を組合わせるのに役立つ。 We now show how to convert a given sentence to a logical form and then to a software code representation. A number of rhetorical relations serve to combine the statements resulting from the translation of individual sentences.

選択されたエリアの境界が128を超えるピクセルをすべて有していることを検証する。 Verify that the boundaries of the selected area have all pixels greater than 128.

図24は、一局面に従った注釈付きセンテンスを示す。1-1~1-3の擬似コードの注釈付きディコンストラクションに関して、図24を参照されたい。 FIG. 24 shows an annotated sentence according to one aspect. See FIG. 24 for the pseudocode annotated deconstruction of 1-1 through 1-3.

すべての定数を変数に変換することで、我々は、自由変数の数を最小限にして、表現を同時に過剰抑制しないよう試みる。連結された(エッジによってリンクされた)矢印は、同じ定数値(ピクセル)が、論理プログラミングの規則に従って、等しい変数(ピクセル)にマップされることを示している。これを実現するために、我々は、自由変数を制約することを必要とする述語を加える(単項)。 By converting all constants to variables, we try to minimize the number of free variables and not overconstrain the representation at the same time. Connected (edge-linked) arrows indicate that the same constant value (pixel) maps to an equal variable (pixel) according to the rules of logic programming. To achieve this, we add a predicate that requires constraining the free variables (unary).

1-4)自由変数を抑制する述語を追加する。
epistemic_action(verify) & border(Area) & border(Pixel) & above(Pixel, 128) & area(Area)
ここで、我々は、すべてを定量化するために明瞭な表現を構築する必要があるが、この特定の場合には、我々はループ構造を用いるので、使用されないだろう。
1-4) Add predicates that suppress free variables.
epistemic_action(verify) & border(Area) & border(Pixel) & above(Pixel, 128) & area(Area)
Now we need to construct an articulation to quantify everything, but in this particular case we use a loop structure so it will not be used.

図25は、一局面に従った注釈付きセンテンスを示す。1-5~2-3の擬似コードの注釈付きディコンストラクションに関して、図25を参照されたい。 FIG. 25 shows an annotated sentence according to one aspect. See FIG. 25 for an annotated deconstruction of the pseudocode of 1-5 through 2-3.

最終的に、我々は以下を有することとなる。
2-3)結果として得られるコードフラグメント
Ultimately, we have:
2-3) Resulting code fragment

Figure 2023531345000014
Figure 2023531345000014

関連作業
談話分析は、質問に対する回答ならびにテキストの要約および一般化において限られた数のアプリケーションを有しているが、我々は、自動的に構築された談話ツリーのアプリケーションを発見していない。我々は、2つのエリアであるダイアログ管理とダイアログゲームとに対する談話分析のアプリケーションに関連する調査を列挙する。これらのエリアは、本提案が意図されているのと同じ問題に適用される可能性がある。これらの提案はともに、一連の論理ベースのアプローチだけでなく、分析ベースおよび機械学習ベースのアプローチも有している。
Related Work Discourse analysis has a limited number of applications in answering questions and summarizing and generalizing texts, but we have not found an application for automatically constructed discourse trees. We list research related to the application of discourse analysis to two areas: dialog management and dialog games. These areas may apply to the same problems for which this proposal is intended. Both of these proposals have not only a series of logic-based approaches, but also analytical- and machine-learning-based approaches.

ダイアログの管理および質問に対する回答
質問および回答が論理的に関連している場合、それらの修辞構造の合致はそれほど重要ではなくなる。
Managing Dialogs and Answering Questions When questions and answers are logically related, matching their rhetorical structure becomes less important.

De Boniは、真理の論理的証拠ではなく論理的関連性の証拠によって質問に対する回答の適切さを判断する方法を提案した。De BoniおよびMarcoによる「Using logical relevance for question answering」(Journal of Applied Logic, Volume 5, Issue 1, March 2007, Pages 92-103)を参照されたい。我々は、論理的関連性を、回答が質問に関して絶対的に真であるかまたは誤りであるとみなされるべきではなく適切さをスライド的に変動させてより柔軟に真であるとみなされるべきであるという考えとして、定義している。さらに、回答の源が不完全であるか一貫性がないかまたはエラーを含んでいる場合であっても、回答の適切性について厳格に推論することが可能となる。著者は、回答が実際に特定の質問に対する回答であるという論理的証拠を捜し求めるために、測定された単純化を用いることにより、制約を緩和した形式で、論理的関連性を如何に実現することができるか示している。 De Boni proposed a method for judging the adequacy of answers to questions based on evidence of logical relevance rather than logical evidence of truth. See "Using logical relevance for question answering" by De Boni and Marco, Journal of Applied Logic, Volume 5, Issue 1, March 2007, Pages 92-103. We define logical relevance as the idea that an answer should not be considered absolutely true or false with respect to the question, but should be more flexibly true with sliding relevance. In addition, it is possible to make rigorous inferences about the appropriateness of an answer even if the source of the answer is incomplete, inconsistent, or contains errors. The authors show how logical relevance can be achieved in a relaxed form by using measured simplifications to seek logical evidence that an answer is in fact the answer to a particular question.

CDTの我々のモデルは、単一構造での一般的な修辞情報と発話動作情報とを組合わせるよう試みている。発話動作が或る種の実際的な力の有用な特徴付けをもたらす一方で、特にダイアログシステムを構築する際のより近年の作業は、このコア概念を著しく拡張し、発言によって実行できるより多くの種類の会話関数をモデル化している。結果として豊富になった動作はダイアログ動作と呼ばれる。Jurafsky、DanielおよびMartin, James H.(2000年)による「Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition」(Upper Saddle River, NJ, Prentice Hall)を参照されたい。会話動作に対する彼らのマルチレベルアプローチにおいては、TraumおよびHinkelmanは、会話の一貫性および内容の両方を保証するのに必要な4レベルのダイアログ動作を識別する。Traum、David R.およびJames F. Allen(1994年)による「Discourse obligations in dialogue processing)」(In Proceedings of the 32nd annual meeting on Association for Computational Linguistics (ACL '94). Association for Computational Linguistics, Stroudsburg, PA, USA, 1-8)を参照されたい。4レベルの会話動作は、方向転換動作、理由付け動作、コア発話動作および議論動作である。 Our model of CDT attempts to combine general rhetorical and speech action information in a single structure. While speech actions provide a useful characterization of certain practical powers, more recent work, especially in building dialog systems, has significantly extended this core concept to model a wider variety of conversational functions that can be performed by utterances. The resulting enriched behavior is called a dialog behavior. See Jurafsky, Daniel and Martin, James H. (2000), "Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition," Upper Saddle River, NJ, Prentice Hall. In their multi-level approach to dialogue behavior, Traum and Hinkelman identify four levels of dialogue behavior necessary to ensure both consistency and content of conversation. See Traum, David R. and James F. Allen (1994), "Discourse obligations in dialogue processing" (In Proceedings of the 32nd annual meeting on Association for Computational Linguistics (ACL '94). Association for Computational Linguistics, Stroudsburg, PA, USA, 1-8). The four levels of speech actions are turning actions, reasoning actions, core speaking actions and discussion actions.

Q/Aの論理的および哲学的な基礎に関する調査は、数十年にわたって行なわれてきたが、小規模な制限されたドメインおよびシステムに焦点を合わせたものであって、産業環境において使用するには限界があることが判明した。言語学および数理論理学において開発された「being an answer to(に対する回答であること)」という論理的証拠についての考えは、実際のシステム内の限定的な適用可能性を有するものとして提示されてきた。汎用の(「オープンドメイン」)作業システムを生成することを目的とした最新の応用研究は、Text Retrieval Conference(TREC)Q/Aトラックによって与えられる標準的な評価フレームワークで提供されるシステムによって実証されたように、情報抽出と検索とを組み合わせる比較的単純なアーキテクチャに基づいている。 Decades of research into the logical and philosophical underpinnings of Q/A have focused on small, restricted domains and systems and have proven to be of limited use in industrial settings. The idea of the logical evidence of "being an answer to", developed in linguistics and mathematical logic, has been presented as having limited applicability within practical systems. Current applied research aimed at creating general-purpose (“open domain”) working systems is based on relatively simple architectures that combine information extraction and retrieval, as demonstrated by systems provided in the standard evaluation framework given by the Text Retrieval Conference (TREC) Q/A track.

SperberおよびWilson(1986)は、特定の回答が質問に関連していることを「証明する(prove)」ために必要とされる労力の量に応じて、回答の関連性を判断した。このルールは、関連性の基準として修辞学用語によって策定することができる。回答が質問に一致していることを証明するのに必要な修辞関係の仮定性が低ければ低いほど、回答の関連性はより高くなる。必要とされる労力は、必要とされる予備的知識の量、テキストからの推論または仮定の観点から測定され得る。より管理し易い基準を提供するために、我々は、制約または修辞関係が、質問の策定方法から除外され得る方法に焦点を合わせることによって問題を単純化することを提案する。言いかえれば、我々は、回答を証明するために、質問が如何に単純化され得るかを評価する。結果として得られるルールは以下のように策定される。回答の関連性は、証明されるべき回答についての質問からどれだけ多くの修辞制約が除外されなければならないかによって判断される。除外されなければならない修辞学的制約が少なければ少ないほど、回答の関連性は高くなる。 Sperber and Wilson (1986) judged the relevance of an answer according to the amount of effort required to "prove" that a particular answer is relevant to the question. This rule can be formulated with rhetorical terms as a criterion of relevance. The less hypothetical the rhetorical relation required to prove that the answer matches the question, the more relevant the answer will be. The effort required can be measured in terms of the amount of prior knowledge required, inferences from the text or assumptions. In order to provide a more manageable criterion, we propose to simplify the problem by focusing on how constraints or rhetorical relations can be left out of the way questions are formulated. In other words, we evaluate how the question can be simplified to prove the answer. The resulting rule is formulated as follows. The relevance of an answer is determined by how many rhetorical constraints must be left out of the question about which answer to prove. The fewer rhetorical constraints that must be left out, the more relevant the answer.

修辞関係の発見がQ/Aにおいて如何に役立つかについての調査のコーパスは非常に制限されている。Kontosが紹介したシステムは、生物医学システムのモデルを提案する「基本」テキストと、このモデルをサポートする実験の発見を提示している論文の要約部分との間の修辞関係の活用を可能にした。Kontos、John、Ioanna Malagardi、John Peros(2016)による「Question Answering and Rhetoric Analysis of Biomedical Texts in the AROMA System」(未出版原稿)を参照されたい。 The corpus of research on how finding rhetorical relationships can help in Q/A is very limited. The system introduced by Kontos made it possible to exploit the rhetorical relationship between the "basic" text, which proposes a model of a biomedical system, and the abstract portion of the paper, which presents the experimental findings that support this model. See "Question Answering and Rhetoric Analysis of Biomedical Texts in the AROMA System" by Kontos, John, Ioanna Malagardi, and John Peros (2016) (unpublished manuscript).

隣接するペアは、別々の話者によって生成されるとともに第1の部分および第2の部分として順序づけられた隣接する発言のペアとして規定される。特定のタイプの第1の部分は特定のタイプの第2の部分を必要とする。これらの制約のうちのいくつかは、発言間の依存性についてのより多くの事例をカバーするため削除される可能性もある。Popescu-Belis、Andreiによる「Dialogue Acts: One or More Dimensions?」(Tech Report ISSCO Working paper n.62. 2005)を参照されたい。 Adjacent pairs are defined as pairs of adjacent utterances produced by separate speakers and ordered as first and second parts. A particular type of first portion requires a particular type of second portion. Some of these constraints may also be removed to cover more cases of dependencies between utterances. See Popescu-Belis, Andrei, "Dialogue Acts: One or More Dimensions?" (Tech Report ISSCO Working paper n.62. 2005).

隣接するペアは、本来、関係があるが、ラベル(「第1の部分」,「第2の部分」,「無し」)に分解され得るものであって、場合によっては、ペアのうち別のメンバーを指すポインタで増強され得る。頻繁に遭遇する観察される種類の隣接ペアは以下を含む。要求/提示/招待→受諾/拒絶(request / offer / invite → accept / refuse);査定→合致/非合致(assess → agree / disagree);非難→否定/許可(blame → denial / admission);質問→回答(question → answer);謝罪→軽視(apology → downplay);感謝→歓迎(thank → welcome);挨拶→挨拶(greeting → greeting)。Levinson、Stephen C(2000年)による「Presumptive Meanings; The Theory of Generalized Conversational implicature」(Cambridge, MA: The MIT Press)を参照されたい。 Adjacent pairs are inherently related, but can be decomposed into labels (“first part”, “second part”, “none”), possibly augmented with pointers to other members of the pair. Observed types of adjacent pairs that are frequently encountered include: request / offer / invite → accept / refuse; assessment → agree / disagree; blame → denial / admission; question → answer; apology → downplay; thank → welcome; greeting → greeting. See Levinson, Stephen C (2000), "Presumptive Meanings; The Theory of Generalized Conversational Implicature" (Cambridge, MA: The MIT Press).

修辞関係は、隣接ペアと同様に、孤立状態での発言と非発言との関係に関する関係性概念である。しかしながら、発言が1つの関係のみにおける核に対する衛星であるとすれば、関係のラベルを発言に割当てることが可能となる。これにより、ダイアログ構造の深い分析が強く必要とされることとなる。RSTにおける修辞関係の数は、(GroszおよびSidner(1986年))によって用いられる「制圧する(dominates)」クラスおよび「満足感を優先する」クラスから100を超えるタイプに至る範囲にわたっている。一貫性関係は、テキスト内の修辞構造を表わす代替的方法である。Scholman、Merel、Jacqueline Evers-Vermeul、Ted Sandersによる「Categories of coherence relations in discourse annotation」(Dialogue & Discourse; Vol 7, No 2 (2016))を参照されたい。 A rhetorical relation is a relational concept related to the relation between utterances and non-utterances in isolation, similar to adjacency pairs. However, if an utterance is a satellite to a nucleus in only one relationship, it becomes possible to assign a relationship label to the utterance. This makes a strong need for a deep analysis of the dialog structure. The number of rhetorical relations in the RST ranges from the "dominates" and "prioritizes gratification" classes used by (Grosz and Sidner (1986)) to over 100 types. Consistency relations are an alternative way of representing rhetorical structures within a text. See "Categories of coherence relations in discourse annotation" by Scholman, Merel, Jacqueline Evers-Vermeul, and Ted Sanders (Dialogue &Discourse; Vol 7, No 2 (2016)).

テキストの情報構造を活用すると予想されている多くのクラスのNLPアプリケーションが存在する。DTは非常に有用なテキスト要約であり得る。テキストセグメントの特徴についての情報は、Sparck-Jonesによって1995年に提案された核-衛星関係とセグメント間の関係の構造とに基づいて、正確で一貫性のある概要を形成するように考慮されなければならない。Sparck Jones, Kによる「Summarising: analytic framework, key component, experimental method, in Summarising Text for Intelligent Communication」(Ed. B. Endres-Niggemeyer, J. Hobbs and K. Sparck Jones; Dagstuhl Seminar Report 79 (1995))を参照されたい。ルートノードから開始する詳述関係のうち最も重要なセグメント同士を組合わせることによって、最も多くの情報を与える概要を生成することができる。DTはマルチドキュメントの概要に用いられてきた。Radev、Dragomir R.、Hongyan JingおよびMalgorzata Budzikowska(2000年)による「Centroid-based summarization of multiple documents: sentence extraction, utility-based evaluation, and user studies」(In Proceedings of the 2000 NAACL-ANLP Workshop on Automatic summarization - Volume 4))を参照されたい。 There are many classes of NLP applications that are expected to exploit textual information structures. DT can be a very useful text summary. Information about the characteristics of the text segments must be considered to form an accurate and consistent overview based on the structure of the nuclear-satellite relationships and inter-segment relationships proposed by Sparkk-Jones in 1995. See "Summarising: analytic framework, key component, experimental method, in Summarizing Text for Intelligent Communication" by Sparck Jones, K. (Ed. B. Endres-Niggemeyer, J. Hobbs and K. Sparck Jones; Dagstuhl Seminar Report 79 (1995)). Combining the most important segments of the detailing relationships starting from the root node produces the most informative summary. DT has been used for multi-document overviews. See Radev, Dragomir R., Hongyan Jing and Malgorzata Budzikowska (2000), "Centroid-based summarization of multiple documents: sentence extraction, utility-based evaluation, and user studies" (In Proceedings of the 2000 NAACL-ANLP Workshop on Automatic summarization - Volume 4).

主たる難題が一貫性である自然言語生成の問題においては、テキストのうち抽出されたフラグメントを一貫した方法で組織化するために、テキストの情報構造に依存することができる。テキストの一貫性を測定する方法は、エッセイの自動的評価の際に用いることができる。DTがテキスト一貫性を捕捉することができるので、エッセイの柔軟な談話構造を用いて、エッセイの文体および品質を査定することができる。Bursteinは、テキスト一貫性を評価したエッセイ査定のための半自動的方法を記載した。Burstein、Jill C.、Lisa Braden-Harder、Martin S. Chodoro、Bruce A. Kaplan、Karen Kukich、Chi Lu、Donald A. RockおよびSusanne Wolff(2002年)を参照されたい。 In natural language generation problems where the main challenge is consistency, one can rely on the information structure of the text to organize the extracted fragments of the text in a consistent way. Methods for measuring textual coherence can be used in the automatic assessment of essays. Because DT can capture textual coherence, the essay's flexible discourse structure can be used to assess essay style and quality. Burstein described a semi-automatic method for essay assessment that assessed textual coherence. See Burstein, Jill C., Lisa Braden-Harder, Martin S. Chodoro, Bruce A. Kaplan, Karen Kukich, Chi Lu, Donald A. Rock and Susanne Wolff (2002).

2003年にengioにおいて提案されたニューラルネットワーク言語モデルは、ニューラルネットワークの入力を形成するためにいくつかの先行する単語ベクトルの連結を用いて、次の単語を予測しようと試みる。Bengio、Yoshua、Rejean Ducharme、Pascal VincentおよびChristian Janvin(2003年)による「A neural probabilistic language model」(J. Mach. Learn. Res. 3 (March 2003), 1137-1155)を参照されたい。結果は以下のとおりである。具体的には、モデルがトレーニングされた後、単語ベクトルは、センテンスおよびドキュメントの分散表現の意味論的に同様の単語が同様のベクトル表現を有するように、ベクトル空間にマップされる。この種類のモデルは、潜在的に談話関係で動作し得るが、我々がツリーカーネル学習のために供給するほどに豊富な言語情報を供給するのは困難である。フレーズレベルまたはセンテンスレベルの表現を達成するために単語レベルを越えるようにword2vecモデルを拡張する調査のコーパスが存在する。たとえば、単純なアプローチは、ドキュメントにおけるすべての単語の重み付け平均(単語ベクトルの重み付けされた平均)を用いており、bag-of-wordsのアプローチが行うのと同様の語順を損なってしまう。より高度化なアプローチでは、マトリックス・ベクトル演算を用いて、センテンスのパースツリーによって与えられる順序で単語ベクトルを組合わせている。R. Socher、C. D. ManningおよびA. Y. Ng(2010年)による「Learning continuous phrase representations and syntactic parsing with recursive neural networks」(In Proceedings of the NIPS-2010 Deep Learning and Unsupervised Feature Learning Workshop)を参照されたい。パースツリーを用いて単語ベクトルを組合わせることは、構文解析に依存しているので、センテンスのみに対して作用することが明らかにされた。 A neural network language model proposed in engio in 2003 attempts to predict the next word using the concatenation of several previous word vectors to form the input of the neural network. See "A neural probabilistic language model" by Bengio, Yoshua, Rejean Ducharme, Pascal Vincent and Christian Janvin (2003), J. Mach. Learn. Res. 3 (March 2003), 1137-1155. The results are as follows. Specifically, after the model is trained, the word vectors are mapped into a vector space such that semantically similar words in distributed representations of sentences and documents have similar vector representations. This kind of model can potentially work in discourse, but it is difficult to supply as rich linguistic information as we supply for tree kernel learning. A corpus of research exists that extends the word2vec model beyond the word level to achieve phrase-level or sentence-level representation. For example, the naive approach uses a weighted average of all the words in the document (the weighted average of the word vectors), which impairs word order similar to what the bag-of-words approach does. A more sophisticated approach uses matrix-vector operations to combine word vectors in the order given by the parse tree of the sentence. See R. Socher, C. D. Manning and A. Y. Ng (2010), "Learning continuous phrase representations and syntactic parsing with recursive neural networks" (In Proceedings of the NIPS-2010 Deep Learning and Unsupervised Feature Learning Workshop). Combining word vectors using a partree has been shown to work only on sentences, since it relies on parsing.

ダイアログシステムのためのポリシー学習に対する多くの初期アプローチは、小さな状態空間および動作セットを用いており、制限されたポリシー学習実験(たとえば、確認のタイプまたはイニシアチブのタイプ)のみに集中されていた。コミュニケータデータセット(Walker他(2001年))は、人・マシン間のダイアログの利用可能な最大コーパスであり、さらにダイアログコンテキストで注釈が付けられていた。このコーパスは、ダイアログマネージャをトレーニングしたりテストしたりするために広範囲にわたって用いられていたが、目的地の都市などの限られた数の属性に関しては、飛行機旅行ドメインにおけるダイアログを要求する情報に制限されている。同時に、この作業においては、我々は、さまざまな性質からなる要求・応答ペアの広範囲なコーパスに依拠していた。 Many early approaches to policy learning for dialog systems used small state spaces and action sets and focused only on limited policy learning experiments (eg, confirmation or initiative types). The communicator dataset (Walker et al., 2001) is the largest available corpus of human-machine dialogs, further annotated with dialog context. This corpus has been used extensively to train and test dialog managers, but for a limited number of attributes such as destination city, it is restricted to information requiring dialogs in the air travel domain. At the same time, in this work we relied on an extensive corpus of request-response pairs of varying nature.

Reichman(1985年)は、発言の発話動作を認識するための従来の方法に関して、形式的記述および会話の動きの拡張遷移ネットワーク(Augmented Transition Network:ATN)モデルを提供している。著者は、動詞前の「please」、法助動詞、韻律、参照、手掛かりフレーズなどの修辞学的構文解析のために現在用いられているものと同様の言語マーカーの分析を用いている(たとえば、「Yes, but…(はいそうです。ですが…)」(副次的論証譲歩および対抗論証);「Yes, and…(はいそうです。ですので…)」(論証の合致およびさらなるサポート);「No(いいえ)」および「Yes(はい)」(非合致/合致);「Because …(ので)」(サポート)、ならびに他の発話内の標識)。Reichman R.(1985年)による「Getting computers to talk like you and me: discourse context, focus and semantics (an ATN model)」(Cambridge, Mass. London: MIT Press.)を参照されたい。 Reichman (1985) provides a formal description and an Augmented Transition Network (ATN) model of speech movement for conventional methods for recognizing the speech behavior of an utterance. The authors used an analysis of linguistic markers similar to those currently used for rhetorical syntactic parsing of preverb ``please'', modal verbs, prosody, references, clue phrases, etc. match); "Because..." (support), as well as indicators in other utterances). See "Getting computers to talk like you and me: discourse context, focus and semantics (an ATN model)" by Reichman R. (1985), Cambridge, Mass. London: MIT Press.

複合的なクエリに対する候補回答としてのテキスト用のDTを想定して、このDTにおけるクエリキーワードの有効性および無効性の発生についてのルールシステムが提案されている。Galisky(2015年)を参照されたい。クエリに対して有効な回答とするために、そのキーワードは、この回答の一連の基本談話単位が核-衛星関係によって十分に順序づけられてつなげられるように、当該一連の基本談話単位において発生する必要がある。クエリのキーワードが回答の衛星談話単位においてのみ起こる場合、回答は無効であるかもしれない。 Given a DT for text as candidate answers to complex queries, a rule system is proposed for the occurrence of validity and invalidity of query keywords in this DT. See Galisky (2015). To be a valid answer to a query, the keyword must occur in the sequence of basic discourse units of this answer such that the sequence of basic discourse units are sufficiently ordered and linked by the nuclear-satellite relationship. An answer may be invalid if the keywords of the query occur only in the satellite discourse units of the answer.

ダイアログゲーム
任意の会話においては、典型的には、質問の後に回答が続くか、または、回答できないことまたは回答の拒否についての何らかの明瞭な記述が続く。会話の意図的な空間についての以下のモデルがある。エージェントBによる質問が発生すると、エージェントAは、回答を見つけ出すためにエージェントBの目的を認識し、協調するためにBに回答を伝える目的を採用する。Aは、次いで、目的を達成することによって回答を生成することを計画する。これは、単純な事例における手際のよい説明を提供しているが、協調性のために強い仮定を必要とする。エージェントAはエージェントBの目的を彼女自身の目的として採用しなければならない。結果として、これは、彼女が回答を知らない場合またはBの目的を受理するのに彼女の準備ができていない場合に、なぜAが発言しているかを説明していない。
Dialog Games In any conversation, a question is typically followed by an answer, or some explicit statement of inability or refusal to answer. We have the following model for the intentional space of conversation. When a question is posed by agent B, agent A recognizes agent B's purpose in order to find an answer and employs the purpose of communicating the answer to B in order to collaborate. A then plans to generate an answer by achieving an objective. It provides a neat explanation in a simple case, but requires strong assumptions for cooperativeness. Agent A must adopt Agent B's objectives as her own. As a result, this does not explain why A is speaking when she does not know the answer or when she is not ready to accept B's purpose.

LitmanおよびAllenは、ドメインレベルに加えて談話レベルで意図的な分析を導入して、談話レベルでの1セットの従来のマルチエージェント行動を想定した。Litman、D. L. およびAllen, J. F.(1987年)による「A plan recognition model for subdialogues in conversation」(Cognitive Science, 11:163-2)を参照されたい。他には、連帯の意図などの社会的な意図的構造を用いてこの種類の挙動を説明しようと試みるものもあった。Cohen P. R.およびLevesque, H. J.(1990年)による「Intention is choice with commitment」(Artificial Intelligence, 42:213-261)を参照されたい。また、Grosz、Barbara J.およびSidner、Candace L.(1986)による「Attentions, Intentions and the Structure of Discourse」(Computational Linguistics, 12(3), 175- 204)を参照されたい。これらの説明がいくつかの談話現象をより十分に説明するのに役立っているが、これらの説明は、依然として、ダイアログの一貫性を説明するために強い協調性を必要としているものの、高レベルの相互の目的をサポートしない場合にエージェントが動作する理由についての簡単な説明を提供していない。 Litman and Allen introduced intentional analysis at the discourse level in addition to the domain level to assume a set of conventional multi-agent behaviors at the discourse level. See Litman, D. L. and Allen, J. F. (1987), "A plan recognition model for subdialogues in conversation," Cognitive Science, 11:163-2. Others have attempted to explain this kind of behavior using social intentional structures such as solidarity intentions. See Cohen P. R. and Levesque, H. J. (1990), "Intention is choice with commitment," Artificial Intelligence, 42:213-261. See also "Attentions, Intentions and the Structure of Discourse" by Grosz, Barbara J. and Sidner, Candace L. (1986), Computational Linguistics, 12(3), 175-204. While these explanations have helped explain some discourse phenomena more fully, they still require strong cooperation to account for dialogue coherence, but do not provide a simple explanation for why agents behave when they do not support high-level mutual objectives.

見知らぬ人が或る人に接近して、「余分なお金を持っていますか?(Do you have spare coins?)」尋ねると想像する。彼らが以前に会ったことがないので、連帯の意図または共有される計画がある可能性は低い。純粋に戦略的観点から、エージェントは、見知らぬ人の目的が満たされるかどうかに興味を持つ可能性はない。しかし、典型的には、エージェントはこのような状況で応答するだろう。したがって、Q/Aの説明は話者の意図の認識を越えるはずである。質問が話者の目的の証拠を提供する以上のことをするとともに、対話者の目的を採用する以上の何かが、質問に対する応答の策定に関与している。 Imagine a stranger approaching a person and asking, "Do you have spare coins?" Since they have never met before, it is unlikely that there is any intention of solidarity or plans to be shared. From a purely strategic point of view, agents may not be interested in whether the stranger's objectives are met. However, typically the agent will respond in such situations. Therefore, Q/A explanations should go beyond recognizing speaker intent. Questions do more than provide evidence of the speaker's purpose, and something more than adopts the interlocutor's purpose is involved in formulating the response to the question.

Mannは、共通のコミュニケーション対話をコード化する、ダイアログゲームと呼ばれることもある談話レベル行動のライブラリを提案した。Mann、WilliamおよびSandra Thompson(1988年)による「Rhetorical structure theory: Towards a functional theory of text organization」(Text-Interdisciplinary Journal for the Study of Discourse, 8(3):243- 281)を参照されたい。協調的にするために、エージェントは、常にこれらのゲームのうちの1つに参加していなければならない。そのため、質問が尋ねられる場合、一定数の活動(すなわち質問によって導入されたもの)だけが協調的な応答となる。ゲームは、一貫性についての優れた説明を提供するが、ダイアログゲームを実行するためにエージェントが互いの意図を認識することが依然として必要となる。結果として、この作業は、意図的な見解の特殊な事例として捉えることができる。この分離のせいで、エージェントらは、各エージェントが実行しているタスクに対する協調を想定する必要はないが、意図および協調を会話レベルで認識する必要がある。どのような目的が会話の協調性を動機付けるのかは説明されないままである。 Mann proposed a library of discourse-level behaviors, sometimes called dialogue games, that encode common communicative dialogues. See "Rhetorical structure theory: Towards a functional theory of text organization" by Mann, William and Sandra Thompson (1988), Text-Interdisciplinary Journal for the Study of Discourse, 8(3):243-281. To be cooperative, an agent must always participate in one of these games. So when a question is asked, only a certain number of activities (ie those introduced by the question) will result in a collaborative response. Games provide an excellent illustration of coherence, but still require agents to be aware of each other's intentions in order to perform dialogue games. As a result, this work can be viewed as a special case of intentional observation. Because of this separation, agents need not assume cooperation for the task each agent is performing, but must be aware of intent and cooperation at the conversational level. It remains unexplained what purpose motivates conversational cooperativeness.

CoulthardおよびBrazilは、複数の応答が応答および新しい開始の両方についての2重の役割を果たすことができることを示唆した:Initiation ^ (Re-Initiation) ^ Response ^(Follow-up)。Coulthard R. M.およびBrazil D.(1979年)による「Exchange structure」(Discourse analysis monographs no. 5.:Birmingham: The University of Birmingham, English Language Research)を参照されたい。交換は2~4つの発言で構成され得る。さらに、フォローアップ自体がフォローアップされ得る。オープニングの動きは、しばしば、交換の開始を示しているが、これは、次の動きのタイプを制限するものではない。最後に、フォローアップを必要としないクロージングの動きが起こることがある。これらの観察結果がそれらの式に加えられると、以下で終わりとなる:
(Open) ^ Initiation ^ (Re-Initiation) ^ Response ^ (Feedback) ^(Follow-up) ^ (Close)
これは、ここで、2から7以上の交換から得られるものであれば何にでも対処することができる。
Coulthard and Brazil suggested that multiple responses can play a dual role for both response and new initiation: Initiation ^ (Re-Initiation) ^ Response ^ (Follow-up). See "Exchange structure" by Coulthard RM and Brazil D. (1979) (Discourse analysis monographs no. 5.: Birmingham: The University of Birmingham, English Language Research). An exchange may consist of 2-4 utterances. Additionally, follow-ups themselves can be followed up. An opening move often marks the beginning of an exchange, but this does not limit the type of next move. Finally, there may be closing moves that do not require follow-up. When these observations are added to their formula, we end up with:
(Open) ^ Initiation ^ (Re-Initiation) ^ Response ^ (Feedback) ^(Follow-up) ^ (Close)
This can now deal with anything that comes from 2 to 7 or more exchanges.

図26は、一局面に従ったダイアログの談話動作を示す。Tsui(1994)は3部分からなるトランザクションに従った談話動作を特徴とする。開始、応答およびフォローアップについての選択のための彼女のシステムは、図26において、上部、中間部および下部に対応して示されている。 FIG. 26 illustrates discourse behavior of a dialog according to one aspect. Tsui (1994) features discourse actions according to three-part transactions. Her system for initiation, response and follow-up selection is shown in FIG. 26, corresponding to the upper, middle and lower portions.

図27は、一局面に従った対話の談話動作を示す。
有効なRRペアに対する無効なRRペアの分類問題はまた、質問に対する回答および自動化されたダイアログサポートを超える完全なダイアログ生成のタスクに適用可能である。Popescuは、人とコンピュータとのダイアログのための自然言語ジェネレータの論理ベースの修辞学的構造の構成要素を提示した。Popescu、Vladimir、Jean Caelen、CorneliuBurileanuによる「Logic-Based Rhetorical Structuring for Natural Language Generation in Human-Computer Dialogue」(Lecture Notes in Computer Science Volume 4629, pp 309-317, 2007)を参照されたい。実際的な局面および文脈上の局面は、ドメインおよびアプリケーション依存の情報を提供するとともに完全に形式化されたタスクオントロジーで構造化されたタスクコントローラとのやりとりの際に考慮に入れられる。計算の実現可能性および一般性の目的を達成するために、談話オントロジーが構築され、修辞関係についての制約を導入するいくつかの公理が提案されてきた。
FIG. 27 shows discourse actions of a dialogue according to one aspect.
The problem of classifying invalid versus valid RR pairs is also applicable to the task of complete dialog generation beyond answering questions and automated dialog support. Popescu presented the building blocks of a logic-based rhetorical structure of a natural language generator for human-computer dialogue. See Popescu, Vladimir, Jean Caelen, Corneliu Burileanu, "Logic-Based Rhetorical Structuring for Natural Language Generation in Human-Computer Dialogue" (Lecture Notes in Computer Science Volume 4629, pp 309-317, 2007). Practical and contextual aspects are taken into account when interacting with task controllers that provide domain and application dependent information and are structured in a fully formalized task ontology. To achieve the goals of computational feasibility and generality, a discourse ontology has been constructed and several axioms have been proposed that introduce constraints on rhetorical relations.

たとえば、トピック(α)のセマンティックスを指定する公理が以下のとおり与えられる。 For example, the axioms specifying the semantics of topic (α) are given as follows.

Figure 2023531345000015
Figure 2023531345000015

この場合、K(α)は、発言αのセマンティックスを論理的に表わす節である。
発言のトピックについての概念は、ここでは、ドメインオントロジーにおける目的語のセットの観点から規定されており、発言内においてさだめられた態様で参照されている。したがって、発言間のトピック関係は、タスクコントローラによって対処されるタスク/ドメイン・オントロジーを用いて演算される。
where K(α) is a clause that logically represents the semantics of utterance α.
Concepts about the topic of an utterance are defined here in terms of a set of objects in the domain ontology and are referenced in a defined manner within the utterance. Therefore, topical relationships between utterances are computed using the task/domain ontology addressed by the task controller.

このようなルールのインスタンスとして、以下を考慮に入れることができる。 As instances of such rules, the following can be considered.

Figure 2023531345000016
Figure 2023531345000016

この場合、t+は「future and 『new』」である。
修辞関係および議論
しばしば、質問と回答とをリンクする主な手段は論理的議論である。この研究で学習しようと試みたRST関係と議論関係との間には明らかなつながりがある。方向付けられた関係、サポート、攻撃、詳細および方向付けられていないシーケンス関係という4つのタイプの関係がある。サポートと攻撃との関係は論争的な関係であって、関連する作業から既知となっている。Peldszus,A.およびStede, M.(2013年)による「From Argument Diagrams to Argumentation Mining in Texts」(A Survey. Int. J of Cognitive Informatics and Natural Intelligence 7(1), 1-31))を参照されたい。後者の2つはRSTにおいて用いられる談話関係に対応している。議論シーケンス関係はRSTにおける「シーケンス(Sequence)」に対応しており、議論詳細関係は、おおむね、「背景」および「詳細」に対応している。
In this case, t+ is "future and 'new'".
Rhetorical Relationships and Arguments Often the primary means of linking questions and answers is logical argument. There is a clear connection between the RST relationships and the argumentative relationships that this study attempts to learn. There are four types of relationships: directed relationships, support, attack, detail and undirected sequence relationships. The relationship between support and attack is a controversial one and is known from related work. See "From Argument Diagrams to Argumentation Mining in Texts" by Peldszus, A. and Stede, M. (2013), A Survey. Int. J of Cognitive Informatics and Natural Intelligence 7(1), 1-31). The latter two correspond to the discourse relations used in RST. The discussion sequence relation corresponds to "Sequence" in RST, and the discussion detail relation roughly corresponds to "background" and "detail".

議論詳細関係は重要であるが、それは、科学技術出版物において、多くの場合、何らかの背景事項(たとえば、用語の定義)が全体的な議論の理解にとって重要であるからである。論証構成要素Respと別の論証構成要素Reqとの間のサポート関係は、RespがReqをサポート(推論、証明)していることを示している。同様に、RespとReqとの攻撃関係は、RespがReqを攻撃(制限、反駁)している場合には注釈が付けられる。RespがReqの詳細であるとともに、より多くの情報を与えるかまたは議論による推論なしにReqに記載されているものを定義している場合には、詳細関係が用いられる。最後に、構成要素が相互に属しており、組み合わされたときにだけ意味をなす場合、すなわち、構成要素がマルチセンテンス論証構成要素を形成する場合、我々は、(ReqまたはResp内の)2つの論証構成要素をシーケンス関係とリンクさせる。 The discussion detail relationship is important because in scientific publications often some background matter (eg definitions of terms) is important to the understanding of the overall discussion. A support relationship between an argumentation component Resp and another argumentation component Req indicates that Resp supports (deduces, proves) Req. Similarly, the attack relationship between Resp and Req is annotated if Resp is attacking (restricting, refuting) Req. Where Resp is a detail of Req and defines what is stated in Req without giving more information or inference by discussion, then detail relations are used. Finally, we link two argumentative constructs (in Req or Resp) with a sequence relation if the constructs belong to each other and only make sense when combined, i.e., if the constructs form a multi-sentence argumentative construct.

我々は、SVM TKを用いることで、議論のないテキストスタイルおよびさまざまな形式の議論を含むテキストスタイルを含む、広範囲のテキストスタイル(Galitsky(2015年))同士を区別することができることに気付いた。各々のテキストスタイルおよびジャンルは、活用されるとともに自動的に学習されるその固有の修辞構造を有する。テキストスタイルとテキスト語いとの間の相関性がいくらか低いので、キーワード統計情報だけを考慮に入れる従来の分類アプローチでは、複雑な事例においては精度が欠ける可能性があった。我々はまた、言語対象に属するものおよび文献ドメイン内のメタ言語などのやや抽象的なクラスへのテキスト分類を実行するとともに、プロプライエタリ設計ドキュメントへのスタイルベースのドキュメント分類を実行した。Galitsky, B、Ilvovsky, D.およびKuznetsov SOによる「Rhetoric Map of an Answer to Compound Queries」(Knowledge Trail Inc. ACL 2015, 681-686)を参照されたい。有効な顧客の苦情に対する無効な顧客の苦情についてのドメインにおけるテキスト保全性の評価(苦情を言う人の不機嫌さを示す、まとまりのない議論の流れを含むもの)は、感情プロフィール情報と比べて修辞構造情報がより強く寄与することを示している。RSTパーサによって得られる談話構造はテキスト保全性の査定を実行するのに十分であるのに対して、感情プロフィールベースのアプローチは、はるかに弱い結果を示しており、修辞構造を強固に補完するものではない。 We find that SVM TK can be used to distinguish between a wide range of text styles (Galitsky, 2015), including text styles without arguments and text styles with various forms of arguments. Each text style and genre has its own rhetorical structure that is leveraged and automatically learned. Because of the somewhat low correlation between text style and text words, conventional classification approaches that only consider keyword statistics can lack accuracy in complex cases. We also performed text classification into somewhat abstract classes such as those belonging to linguistic objects and metalanguages within the literature domain, as well as style-based document classification into proprietary design documents. Galitsky, B; Ilvovsky, D.; and Kuznetsov SO, "Rhetoric Map of an Answer to Compound Queries" (Knowledge Trail Inc. ACL 2015, 681-686). Evaluation of textual integrity in the domain of invalid vs. valid customer complaints (including disjointed discussion streams indicative of the complainer's sullenness) shows a stronger contribution of rhetorical structure information compared to sentiment profile information. While the discourse structure obtained by the RST parser is sufficient to perform textual integrity assessments, the affective profile-based approach shows much weaker results and is not a strong complement to rhetorical structure.

広範囲な研究のコーパスはRSTパーサのみに向けられたものであるが、実際のNLP問題に関するRST構文解析結果を如何に活用するかについての調査は、内容の生成、要約および検索に限られている(Jansen他;2014年)。これらのパーサによって得られるDTは、テキストをフィルタリングまたは構築するためにルールベースで直接用いることができない。したがって、学習は、DTの暗示的な特性を活用することが必要とされる。この研究は、我々の知る限りでは、談話ツリーおよびそれらの拡張部分を、一般的なオープンドメインの質問応答、チャットボット、ダイアログ管理およびテキスト構造のために採用している先駆的研究である。 Although an extensive corpus of research is dedicated to RST parsers, investigations into how to exploit RST parsing results on real NLP problems are limited to content generation, summarization and retrieval (Jansen et al., 2014). The DTs obtained by these parsers cannot be used directly in rule bases to filter or construct text. Learning is therefore required to exploit the implicit properties of DT. This work is, to our knowledge, the pioneering work that employs discourse trees and their extensions for general open-domain question answering, chatbots, dialog management and text construction.

ダイアログチャットボットシステムは、ユーザのコミュニケーションの意図を理解して一致させることができ、これらの意図で推論し、ユーザ自身のそれぞれのコミュニケーション意図を構築し、ユーザに伝えられるべき実際の言語でこれらの意図をポピュレートする必要がある。それら自体の談話ツリーはこれらのコミュニケーションの意図についての表現を提供するものでない。この研究において、我々は、従来の談話ツリーで構築されたコミュニケーション用談話ツリーを導入したが、これらは、一方では、最近では大規模に生成することができ、他方では、ダイアログの記述的な発言レベルモデルを構成することができる。コミュニケーション用談話ツリーの機械学習によってダイアログを処理することにより、我々が、広範囲のダイアログタイプの協調モードおよび対話タイプ(プランニング、実行、およびインタリーブされたプラニングとその実行)をモデル化することが可能となった。 A dialog chatbot system needs to be able to understand and match the user's communication intentions, reason with these intentions, construct the user's own respective communication intentions, and populate these intentions with the actual language to be communicated to the user. Discourse trees by themselves do not provide an expression for the intent of these communications. In this work, we introduced communicative discourse trees built on conventional discourse trees, which, on the one hand, can be generated on a large scale these days, and on the other hand, can constitute descriptive utterance-level models of dialogue. Processing dialogs by machine learning of communicative discourse trees has allowed us to model a wide range of dialog types of cooperation modes and interaction types (planning, execution, and interleaved planning and execution).

統計的な計算学習アプローチは、手動のルールベースのハンドコーディングアプローチに勝るいくつかの主要な潜在的利点をダイアログシステム開発に提供する。 Statistical computational learning approaches offer several major potential advantages for dialog system development over manual, rule-based, hand-coding approaches.

・データ駆動型の開発サイクル;
・場合によっては最適な行動ポリシー;
・応答の選択のためのより正確なモデル;
・目に見えない状態への一般化の可能性;
・産業に関する開発および配備コストの削減。
A data-driven development cycle;
the optimal policy of conduct in some cases;
A more accurate model for response selection;
- Possibility of generalization to invisible states;
• Reduced development and deployment costs for industry.

帰納的学習結果をカーネルベースの統計的学習と比較すると、同じ情報に依拠することにより、我々が、いずれかのアプローチで行うよりもより簡潔な特徴エンジニアリングを実行することが可能となった。 Comparing inductive learning results with kernel-based statistical learning, reliance on the same information allowed us to perform more concise feature engineering than either approach does.

RSTパーサに関する文献の広範囲なコーパスは、結果として得られるDTが実際のNLPシステムにおいて如何に採用され得るかについての問題に対処していない。RSTパーサは、大抵、対象となる特徴のその表現性ではなく人によって注釈付けされたテストセットとの合致に関して評価される。この作業においては、我々は、DTの解釈に焦点を合わせるとともに、事実の中立的な列挙ではなく合致または非合致を示す形式でこれらを表現する方法を探った。 The extensive corpus of literature on RST parsers does not address the question of how the resulting DT can be employed in practical NLP systems. RST parsers are mostly evaluated on their match with a human-annotated test set rather than on their expressiveness of the features of interest. In this work, we focused on the interpretation of DTs and explored ways to express them in a form that indicates agreement or disagreement rather than fact-neutral enumeration.

ダイアログ内の所与のメッセージの後に如何に次のメッセージが続くかについての合致の基準を提供するために、我々はCDTを用いた。CDTは、ここでは、コミュニケーション行動のためのラベルを、代用したVerbNetフレームの形で含んでいる。我々は、正確な要求・応答および質問・回答のペアに対する不正確な要求・応答および質問・回答のペアを示す談話特徴を調査した。我々は、正確なペアを認識するために2つの学習フレームワークを用いた。2つの学習フレームワークは、すなわち、グラフとしてのCDTの決定論的な最隣接学習およびCDTのツリーカーネル学習である。この場合、すべてのCDTサブツリーの特徴空間はSVM学習の対象となる。 We used the CDT to provide matching criteria for how the next message follows a given message within a dialog. The CDT now contains labels for communication actions in the form of substituted VerbNet frames. We investigated discourse features that indicated incorrect request-response and question-answer pairs versus correct request-response and question-answer pairs. We used two learning frameworks to recognize exact pairs. Two learning frameworks are deterministic nearest-neighbor learning for CDT as graphs and tree-kernel learning for CDT. In this case, the feature space of all CDT subtrees is subject to SVM training.

肯定的なトレーニングセットは、Yahoo Answers、ソーシャルネットワーク、Enron電子メールを含む企業の会話、顧客の苦情、およびジャーナリストによるインタビューから得られた正確なペアから構築された。対応する否定的なトレーニングセットは、要求と応答との間の関連類似性が高くなるように、関連するキーワードを含んださまざまな任意の要求および質問についての応答を添えることによって作成された。その評価によれば、弱い要求・応答合致のドメインにおける事例のうち68%~79%、および強い合致のドメインにおける事例のうち80%~82%において有効なペアを認識することができる。これらの精度は自動化された会話をサポートするのに必須である。これらの精度は、談話ツリー自体を有効または無効として分類するベンチマークタスクに匹敵するとともに、類事実の質問・回答システムに匹敵している。 A positive training set was constructed from accurate pairs obtained from Yahoo Answers, social networks, company conversations including Enron emails, customer complaints, and interviews with journalists. A corresponding negative training set was created by appending responses to a variety of arbitrary requests and questions that contained relevant keywords such that the relevance similarity between requests and responses was high. According to the evaluation, valid pairs can be recognized in 68%-79% of cases in domains with weak request-response matching and 80%-82% of cases in domains with strong matching. These accuracies are essential to support automated conversations. These accuracies are comparable to benchmark tasks that classify the discourse tree itself as valid or invalid, as well as analogous question-answer systems.

我々は、この研究が質問応答サポートのために自動的に構築された談話ツリーを活用する最初の研究であると信じている。従来の研究は、系統的に収集し、説明可能に学習し、リバースエンジニアを行い、互いに比較するのが困難である特定の顧客談話モデルおよび特徴を用いていた。我々は、CDTの形式で修辞構造を学習することが、複雑な質問への回答、チャットボットおよびダイアログ管理をサポートするための主要なデータソースであると結論付ける。 We believe this work is the first to leverage automatically constructed discourse trees for question-answering support. Previous research has used specific customer discourse models and features that are systematically collected, explainably learned, reverse engineered, and difficult to compare with each other. We conclude that learning rhetorical structures in the form of CDTs is a major data source for supporting complex question answering, chatbots and dialog management.

コミュニケーション用談話ツリーを用いた議論検出
本明細書で説明される態様は、テキストが議論を含むかどうかを判断するためにコミュニケーション用談話ツリーを用いる。そのような手法は、例えば、ユーザが議論しているか否かを判断できるチャットボットにとって有用であり得る。ユーザが何かに対する論証を提供することを試みる場合、いくつかの議論パターンが採用され得る。論証は、任意のコミュニケーション、説得力のあるエッセイ、またはスピーチのキーポイントであり得る。
Argument Detection Using a Communicative Discourse Tree Aspects described herein use a communicative discourse tree to determine whether a text contains an argument. Such an approach can be useful, for example, for chatbots that can determine whether users are arguing or not. Several argument patterns may be employed when a user attempts to provide an argument for something. An argument can be the key point of any communication, persuasive essay, or speech.

所与のテキストに対するコミュニケーション用談話ツリーは、テキストに存在する議論を反映する。例えば、議論の基本点は、論証が提示されるテキストの修辞構造に反映される。論証のないテキストは、異なる修辞構造を有する。Marie-Francine, Erik Boiy, Raquel Mochales Palau, and Chris Reed. 2007. Automatic detection of arguments in legal texts(法律文書における論証の自動検出)を参照されたい。(人工知能および法律に関する第11回国際会議の会議録、ICAIL 07,225~230頁、スタンフォード、カリフォルニア、米国における)。加えて、議論はドメイン間で異なり得る。例えば、製品推薦のために、肯定的な感情を有するテキストは、潜在的な購入者に購入を促すために用いられる。政治的ドメインでは、感情対論証対エージェンシーの論理構造は、はるかに複雑である。 The communicative discourse tree for a given text reflects the arguments present in the text. For example, the basic points of an argument are reflected in the rhetorical structure of the text in which the argument is presented. A text without argument has a different rhetorical structure. See Marie-Francine, Erik Boiy, Raquel Mochales Palau, and Chris Reed. 2007. Automatic detection of arguments in legal texts. (Proceedings of the 11th International Conference on Artificial Intelligence and Law, ICAIL 07, pp. 225-230, Stanford, California, USA). Additionally, arguments may differ between domains. For example, for product recommendations, text with positive sentiment is used to encourage potential purchasers to purchase. In the political domain, the logic of emotion versus argument versus agency is much more complex.

機械学習は、議論を判定するためにコミュニケーション用談話ツリーと併せて用いることができる。議論を判断することは、テキストの特定のブロックを表すコミュニケーション用談話ツリーが分類モデルに提供される二値分類タスクとして取り組むことができる。分類モデルは、コミュニケーション用談話ツリーが陽性クラスであるか陰性クラスであるかの予測を返す。陽性クラスは、論証を有するテキストに対応し、陰性クラスは、論証のないテキストに対応する。本明細書で説明される態様は、論理的議論に関連付けられる異なる構文的および談話特徴に基づいて分類を実行することができる。ある例では、論証を含むテキストとして分類されるテキストについて、そのテキストは、このクラスに割り当てられる第1のクラスの要素に類似する。我々の情報源の寄与を評価するために、2つのタイプの学習、すなわち最近傍学習および統計的学習手法を用いることができる。 Machine learning can be used in conjunction with a communicative discourse tree to determine arguments. Determining arguments can be approached as a binary classification task in which a communicative discourse tree representing a particular block of text is provided to a classification model. A classification model returns a prediction of whether the communicative discourse tree is a positive or negative class. The positive class corresponds to texts with arguments and the negative class corresponds to texts without arguments. Aspects described herein can perform classification based on different syntactic and discourse features associated with logical arguments. In one example, for text classified as argument-containing text, the text is similar to the elements of the first class assigned to this class. Two types of learning can be used to assess the contribution of our information sources: nearest neighbor learning and statistical learning techniques.

最近傍(kNN)学習は、グラフ記述の明示的な工学を用いる。測定される類似度は、所与のテキストのグラフとトレーニングセットの所与の要素のグラフとの間の重複である。統計的学習では、さまざまな態様が、暗黙的な特徴を有する構造を学習する。 Nearest Neighbor (kNN) learning uses explicit engineering of graph descriptions. The similarity measure is the overlap between the graph of the given text and the graph of the given element of the training set. In statistical learning, various aspects learn structures with implicit features.

概して、機械学習手法は、対向する論証の存在を含む論証識別の問題に対する各特徴タイプおよび上記の学習方法の寄与を推定する(Stab および Gurevych, 2016年)。より具体的には、さまざまな態様が、修辞関係と、談話および意味的関係が議論検出タスクにおいてどのように協働するかとを利用する。 In general, machine learning methods estimate the contribution of each feature type and the learning method described above to the problem of argumentation identification involving the presence of opposing arguments (Stab and Gurevych, 2016). More specifically, various aspects make use of rhetorical relationships and how discourse and semantic relationships cooperate in an argument detection task.

感情分析は広範囲の産業用途に必要であるが、その精度はかなり低いままである。論証の存在の認識は、それが確実に行われる場合、強力な意見付けされた内容を中立的な内容から区別しようとするときに、いくつかの意見マイニングタスクを潜在的に置き換え得る。次いで、論証認識結果は、感情分析分類器の特徴としての役割を果たすことができ、感情極性が高いケースを、中立のケース、極性が低いケースと区別する。 Sentiment analysis is necessary for a wide range of industrial applications, but its accuracy remains rather low. Recognizing the existence of arguments, if done reliably, could potentially replace some opinion mining tasks when trying to distinguish strongly opinionated content from neutral content. The demonstrative recognition results can then serve as features for sentiment analysis classifiers, distinguishing cases of high emotional polarity from neutral and low polarity cases.

議論を分析するためのコミュニケーション用談話ツリーの使用の例
以下の例は、テキストにおける議論の存在を判断するためにコミュニケーション用談話ツリーを用いる価値を例示するために導入される。第1の例は、血液検査に革命を起こすことを望んだヘルスケア会社であるTheranosについて論じている。ウォールストリートジャーナルを含むいくつかの情報筋は、この企業の行為が不正であったと主張した。これらの主張は、Theranosを去った従業員の告発に基づいてなされた。ある時点で、FDAが関与した。2016年、一部の人々は、この問題は、Theranosが約束した血液検査技術の効率について嫉妬したTheranosの競合者によって始められた、というTheranosの見解を信じた。しかしながら、議論分析を用いて、本明細書に記載される態様は、TheranosのウェブサイトでマイニングされたTheranosの議論パターンは不完全であったことを示す。実際に、不正行為の事例が前面に押し出され、大量の不正行為報告に至った。証券取引委員会によると、TheranosのCEOのエリザベス・ホルムズは、彼女が企業の技術および財務についての声明を誇張するかまたは誤った声明を出した「綿密な長年にわたる不正行為を通して」出資者から7億ドル超を集めた。
Examples of Using Communicative Discourse Trees to Analyze Arguments The following examples are introduced to illustrate the value of using communicative discourse trees to determine the presence of arguments in a text. The first example discusses Theranos, a healthcare company that hoped to revolutionize blood testing. Several sources, including The Wall Street Journal, claimed the company's conduct was fraudulent. These allegations were based on accusations by employees who left Theranos. At some point, the FDA got involved. In 2016, some believed Theranos' view that the issue was initiated by Theranos' competitors who were jealous of the efficiency of Theranos' promised blood-testing technology. However, using argument analysis, embodiments described herein show that the Theranos argument pattern mined on Theranos' website was incomplete. In fact, cases of cheating were brought to the fore, leading to a flood of cheating reports. According to the Securities and Exchange Commission, Theranos CEO Elizabeth Holmes has raised more than $700 million from investors "through years of scrupulous fraud" in which she exaggerated or misrepresented statements about the company's technology and finances.

Theranosについてのコンテンツを考慮すると、あるユーザが、Theranosに偏しており、その反対者に偏していない場合、議論検出システムは、Theranosの見解に有利な回答を提供しようとする。この場合、支持者の良好な論証、またはその反対者の悪い論証も、有用であろう。表4は、エンティティA対エンティティBの特定の選好をともなう所与のユーザに対する検索結果を調整するための、エージェンシー、感情、および議論の様々な組合せに対するフラグを示す。列の右の灰色側は、第2および第3の行について反対のフラグを有する。第4行については、概して受容された意見共有メリットを有するケースのみが、表示のためにフラグが立てられる。 Given content about Theranos, if a user is biased toward Theranos and not biased against its opponents, the discussion detection system will attempt to provide answers that favor Theranos' views. In this case, the good arguments of the proponents, or the bad arguments of their opponents, would also be useful. Table 4 shows flags for various combinations of agency, sentiment, and discussion to tailor search results for a given user with particular preferences for Entity A versus Entity B. The right gray side of the column has opposite flags for the second and third rows. For row 4, only cases with generally accepted opinion-sharing merit are flagged for display.

チャットボットは、表4の情報を用いて、応答をパーソナライズするか、または検索結果もしくは意見のあるデータをユーザの期待に合わせることができる。例えば、チャットボットは、ユーザにニュースを提供する際に政治的観点を考慮することができる。さらに、応答をパーソナライズすることは、製品推奨に有用である。例えば、特定のユーザは、あるユーザがスノーボーダーを好まない人々の話を共有することによって証明されるように、スノーボードよりもスキーを好むかもしれない。このように、本明細書に記載される態様は、チャットボットが、共感を示し、ユーザがチャットボットとの共通の意見の欠如によって刺激を受けないことを確実にすることによって、仲間のように振る舞うことを可能にする。 The chatbot can use the information in Table 4 to personalize responses or tailor search results or opinionated data to user expectations. For example, a chatbot can consider political perspectives when providing news to users. Additionally, personalizing responses is useful for product recommendations. For example, a particular user may prefer skiing to snowboarding, as evidenced by one user sharing stories of people who do not like snowboarding. As such, aspects described herein enable chatbots to exhibit empathy and behave like peers by ensuring that users are not irritated by a lack of common opinion with the chatbot.

Figure 2023531345000017
Figure 2023531345000017

Theranosの例を続けると、論証のRST表現が構築され、さまざまな態様は、あるパラグラフが主張およびそれを支援する議論の両方を伝えるかどうかを談話ツリーが示すことができるかどうかを観察することができる。談話ツリーには、それが議論パターンを表現しているか否かを判断できるように、付加情報が付加されている。ウォールストリートジャーナルによれば、以下が実際に起こったことであった:「(2015年)10月以来、ウォールストリートジャーナルは、Theranosを不正確に描く、一連の匿名の情報筋による告発を公開してきた。今回、ウォールストリートジャーナルは、その最新の記事(「米国、Theranosの苦情を調査」、12月20日)において、再び匿名の情報筋に依存して、今度は、メディケア・メディケイド・サービス・センター(Centers for Medicare and Medicaid Services (CMS))および米国食品医薬品局( U.S., Food and Drug Administration (FDA))によって提出されたとされる2つの未開示および未確認の苦情を報告している(Carreyrou, 2016年)。 Continuing with Theranos' example, an RST representation of the argument is constructed, and various aspects can be observed to see if the discourse tree can indicate whether a paragraph conveys both the assertion and the arguments that support it. Additional information is attached to the discourse tree so that it can be determined whether or not it expresses a discourse pattern. According to The Wall Street Journal, here's what actually happened: "Since October [2015], The Wall Street Journal has published a series of accusations by anonymous sources that portray Theranos inaccurately. Now, in its most recent article ("U.S. Investigates Theranos Complaints," December 20), The Wall Street Journal again relied on anonymous sources, this time to the Centers for Medicare and Medicaid. (Carreyrou, 2016) reported two undisclosed and unverified complaints allegedly filed by the U.S. Food and Drug Administration (FDA) and the U.S. Food and Drug Administration (CMS).

図28は、一態様による例示的なコミュニケーション用談話ツリーを示す。図28は、談話ツリー2800、コミュニケーション行動2801、およびコミュニケーション行動2802を示す。より具体的には、談話ツリー2800は、以下のパラグラフを表す:"But Theranos has struggled behind the scenes to turn the excitement over its technology into reality.(しかし、Theranosは、背後では、その技術上の興奮を現実に変えるために苦闘していた。)At the end of 2014, the lab instrument developed as the linchpin of its strategy handled just a small fraction of the tests then sold to consumers, according to four former employees." (4人の元従業員によれば、2014年の終わりに、その戦略の要として開発された研究室機器は、試験のうちのほんのわずかな部分を処理し、次いで消費者に販売した。)お分かりのように、任意のコミュニケーション行動が終端弧のラベルとして談話ツリー2800に添付される場合、文書作成者は、単に事実を共有するのではなく、自分の言いたいことを人に分からせようとしていることが明らかになる。図示のように、コミュニケーション行動2801は「struggle(苦闘する)」であり、コミュニケーション行動2802は「develop(開発する)」である。 FIG. 28 illustrates an exemplary communicative discourse tree according to one aspect. FIG. 28 shows discourse tree 2800, communication behavior 2801, and communication behavior 2802. FIG. More specifically, discourse tree 2800 represents the following paragraph: "But Theranos has struggled behind the scenes to turn the excitement over its technology into reality. At the end of 2014, the lab instrument developed as the linchpin of its strategy handled just a small fraction of the tests then sold to consumers, according to four former employees." (At the end of 2014, the lab equipment developed as the cornerstone of that strategy processed only a small portion of the tests and then sold them to consumers.) As can be seen, when arbitrary communicative behaviors are attached to the discourse tree 2800 as terminal arc labels, it becomes clear that authors are trying to make people understand what they mean, rather than just sharing facts. As shown, communication behavior 2801 is "struggle" and communication behavior 2802 is "develop."

図29は、一態様による例示的なコミュニケーション用談話ツリーを示す。図29は、以下のテキストを表す談話ツリー2900を示す:"Theranos remains actively engaged with its regulators, including CMS and the FDA, and no one, including the Wall Street Journal, has provided Theranos a copy of the alleged complaints to those agencies.(Theranosは、CMSおよびFDAを含むその規制当局と積極的に関わったままであり、ウォールストリートジャーナルを含む誰も、Theranosに、それらの機関に対する苦情とされるものの写しを提供していない。Because Theranos has not seen these alleged complaints, it has no basis on which to evaluate the purported complaints." (Theranosは、これらの苦情とされるものを見ていないので、この苦情とされるものを評価する基礎がない。)しかしながら、お分かりのように、談話ツリー、ならびに複数の詳述の修辞関係および単一の背景のインスタンスのみからでは、文書作成者が反対者と論争しているのか、またはいくつかの所見を列挙するのか、不明である。CDTは、「engaged(関わって)」または「not see(見ていない)」などのコミュニケーション行動に依拠して、文書作成者が実際に反対者と論争しているという事実を表すことができる。 FIG. 29 illustrates an exemplary communicative discourse tree according to one aspect. Figure 29 shows a discourse tree 2900 representing the following text: "Theranos remains actively engaged with its regulators, including CMS and the FDA, and no one, including the Wall Street Journal, has provided a copy of the alleged complaints to those agencies. os has not seen these alleged complaints, it has no basis on which to evaluate the purported complaints." or "not see" can be relied upon to represent the fact that the author is actually arguing with the opponent.

図30は、一態様による例示的なコミュニケーション用談話ツリーを示す。図30は、以下のテキストを表す談話ツリー3000を示し、Theranosは、窮地を脱しようと試みている:"It is not unusual for disgruntled and terminated employees in the heavily regulated health care industry to file complaints in an effort to retaliate against employers for termination of employment.(厳しく規制されたヘルスケア産業において、不満を抱いて契約解除された従業員が、雇用終了に対して雇用者に報復しようとして苦情を提出することは珍しいことではない。Regulatory agencies have a process for evaluating complaints, many of which are not substantiated.(規制機関には、苦情を評価するためのプロセスがあるが、苦情の多くは実証されていない。)Theranos trusts its regulators to properly investigate any complaints."(Theranosは、規制当局が苦情を適切に調査すると信頼している。)
このように、論証の構造を示すためには、談話関係が必要だが不充分であり、発話動作(コミュニケーション行動)も同様に必要だが不充分である。図30に関連付けられるパラグラフについては、エージェント間の対話の談話構造、およびそれらがどのような種類の対話であるかを知ることが必要である。具体的には、中立的な詳述(コミュニケーション行動を含まない)と、論証に相関付けられる"not provide"(提供しない)などの感情を伴うコミュニケーション行動を含む詳述関係とを区別する必要がある。対話のドメイン(例えば、ヘルスケア)は必要ではなく、これらの対話の主題(会社、雑誌、機関)またはエンティティが何であるかも必要ではないことに留意されたい。しかしながら、これらのエンティティ間の精神的なドメイン非依存関係は有用である。
FIG. 30 illustrates an exemplary communicative discourse tree according to one aspect. FIG. 30 shows a discourse tree 3000 representing the following text, in which Theranos attempts to save the day: "It is not unusual for disgruntled and terminated employees in the heavily regulated health care industry to file complaints in an effort to retaliate against employers for termination of employment. Regulatory agencies have a process for evaluating complaints, many of which are not substantiated. Theranos trusts its regulators to properly investigate any complaints."
Thus, discourse relations are necessary but insufficient to show the structure of arguments, and speech behaviors (communicative behaviors) are likewise necessary but insufficient. For the paragraphs associated with FIG. 30, it is necessary to know the discourse structure of interactions between agents and what kinds of interactions they are. Specifically, it is necessary to distinguish between neutral elaboration (which does not involve communicative behavior) and elaboration relationships that involve communicative behavior with emotions such as "not provide" that are correlated with arguments. Note that the domain of the interactions (eg, healthcare) is not necessary, nor is it necessary what the subject (company, magazine, institution) or entity of these interactions is. However, mental domain-independent relationships between these entities are useful.

図31は、一態様による例示的なコミュニケーション用談話ツリーを示す。図31は、反対者の論証が不完全であるというTheranosの論証についての以下のテキストを表す談話ツリー3100を示す:"By continually relying on mostly anonymous sources, while dismissing concrete facts, documents, and expert scientists and engineers in the field provided by Theranos, the Journal denies its readers the ability to scrutinize and weigh the sources' identities, motives, and the veracity of their statements."(Theranosによって提供される当該分野における具体的な事実、文書、ならびに専門科学者およびエンジニアを退けながら、ほとんど匿名の情報源に依拠し続けることによって、ウォールストリートジャーナルは、その読者に、情報源の素性、動機、ならびに当雑誌の記述の真正性を精査および考察する能力を与えなていない。)
常識推論の観点から、Theranos社は、その試験が有効であるという論証を確認するために2つの選択肢、すなわち、(1)独立した調査を行い、それらの結果を同等物と比較し、データを公開し、彼らの分析結果が正しいことを確認する、または(2)彼らの試験結果は無効であるという反対者による議論を打破し、反対者は間違っているという主張を支援する、を有する。明らかに、前者の論証の方が、はるかに強力であり、通常、後者の論証が選択されるのは、前者の論証が実施するにはあまりにも難しいとエージェントが考えるときである。一方で、読者は、WSJがTheranosに対するその告発について、より多くの証拠を提供すべきであった、とTheranosに同意するかもしれない。他方で、読者は、おそらく、Theranosが上記後者の論証タイプ(2)を選択することを嫌い、したがって、Theranosの立場はかなり弱くなる。Theranosの論証が弱い理由の1つは、TheranosがクライアントからのTheranosのサービスに関する苦情に関する反対者の申し立てを論駁しようとするためである。WSJに情報源および苦情の本質を開示させることによって証拠を求めるTheranosの要求は弱い。ある主張は、第三者(独立した調査代行者)がより合理的かつ決定的である、というものである。しかしながら、一部の読者は、Theranosの論証(証明回避の負担)が論理的かつ有効であると考えるかもしれない。議論評価部は、テキストのみに依拠することによって、テキスト内の修辞関係を識別することはできないことに留意されたい。むしろ、論者の意図を把握するためには、状況の前後関係が有用である。
FIG. 31 illustrates an exemplary communicative discourse tree according to one aspect. FIG. 31 shows a discourse tree 3100 representing the following text about Theranos' argument that the opponent's argument is incomplete: "By continually relying on mostly anonymous sources, while dismissing concrete facts, documents, and expert scientists and engineers in the field provided by Theranos, the Journal denies its readers the ability to scrutinize and weigh the sources' identities, motives, and the veracity of their statements." By continuing to rely on documents and largely anonymous sources while shunning expert scientists and engineers, The Wall Street Journal denies its readers the ability to scrutinize and consider the origins and motives of the sources and the authenticity of the journal's statements.)
From the point of view of common sense reasoning, Theranos has two options for confirming its argument that its trials are valid: (1) conduct independent research, compare their results with peers, publish the data, and confirm their analytical results, or (2) defeat arguments by opponents that their trial results are invalid and support the argument that they are wrong. Clearly, the former argument is much stronger, and the latter argument is usually chosen when the agent thinks the former argument is too difficult to enforce. On the one hand, readers may agree with Theranos that the WSJ should have provided more evidence for its charges against Theranos. On the other hand, the reader probably dislikes Theranos' choice of the latter argument type (2) above, thus weakening Theranos' position considerably. One reason Theranos' argument is weak is that Theranos seeks to refute opponents' allegations of client complaints about Theranos' services. Theranos' demand for evidence by forcing the WSJ to disclose the source and nature of the complaint is weak. One argument is that a third party (an independent investigative agent) is more rational and conclusive. However, some readers may find Theranos' argument (burden of proof avoidance) logical and valid. Note that the argument evaluator cannot identify rhetorical relationships within the text by relying solely on the text. Rather, the context of the situation is useful for grasping the intention of the speaker.

第2の例では、文書作成者の目的は、シリア政府が2018年の春に化学兵器を使用したという主張を攻撃することである。図32は、一態様による例示的なコミュニケーション用談話ツリーを示す。図32は、この第2の例のコミュニケーション用談話ツリー3200を示す。 In the second example, the author's aim is to attack allegations that the Syrian government used chemical weapons in the spring of 2018. FIG. 32 illustrates an exemplary communicative discourse tree according to one aspect. FIG. 32 shows a communicative discourse tree 3200 for this second example.

この例を考慮すると、許容可能な証拠は、同等者の観点から、化学兵器攻撃がないことと関連付けられる、特定の所見を共有することである。例えば、化学兵器攻撃とされるものの時期が非常に強い雨の時期と一致したことを実証することができれば、それはこの主張を攻撃する説得力のある方法であろう。しかしながら、そのような所見は確認されなかったので、情報源のRussia Todayは、その主張がどのように伝達されたかに関する複雑な精神状態を謀ることに訴えたが、その場合、関係者の精神状態に関するほとんどの記述を検証することは困難である。以下は、談話パーサによって分割される基本談話単位を示す:[Whatever the Douma residents ,][who had first-hand experience of the shooting of the water][dousing after chemical attack video ,][have to say ,][their words simply do not fit into the narrative][allowed in the West ,][analysts told RT .] [Footage of screaming bewildered civilians and children][being doused with water ,][presumably to decontaminate them ,][was a key part in convincing Western audiences][that a chemical attack happened in Douma .] [Russia brought the people][seen in the video][to Brussels ,][where they told anyone][interested in listening][that the scene was staged .] [Their testimonies , however , were swiftly branded as bizarre and underwhelming and even an obscene masquerade][staged by Russians .] [They refuse to see this as evidence ,][obviously pending][what the OPCW team is going to come up with in Douma ], [Middle East expert Ammar Waqqaf said in an interview with RT .] [The alleged chemical incident ,][without any investigation , has already become a solid fact in the West ,][which the US , Britain and France based their retaliatory strike on .](化学兵器による攻撃の映像の後の放水の撮影を直接経験したドゥーマの住民が何を言おうと、彼らの言葉は単に西側で許容される筋書きに合わない、とアナリストはRTに語った。恐らく除染のために水を浴びせられている、悲鳴を上げている当惑した民間人と子供たちの映像は、化学兵器攻撃がドゥーマで起こったことを西側の視聴者に納得させる重要な部分であった。ロシアは映像に映った人々をブリュッセルに連れて行き、そこで彼らは、耳を傾ける者には、あのシーンはでっち上げだと話した。しかし、彼らの証言は、ロシア人によって仕組まれた奇妙で圧倒的で卑劣でさえある虚構であるとして速やかに烙印を押された。中東問題の専門家であるAmmarWaqqaf氏は、RTとのインタビューで、彼らはこれを証拠として見ることを拒否し、明らかにOPCWチームはドゥーマで何を打ち出すかを懸案中である、述べた。疑惑の化学兵器攻撃事件は、いかなる調査も行われることなく、すでに、西側において、米国、英国、フランスが報復攻撃を基づかせる、確固たる事実になっている)。 Given this example, acceptable evidence would be to share certain observations that, from the perspective of peers, would be associated with the absence of chemical weapons attacks. For example, if it could be demonstrated that the timing of the alleged chemical weapons attack coincided with a period of very heavy rains, that would be a persuasive way of attacking this claim. However, since no such observations were confirmed, the source Russia Today resorted to plotting complex mental states as to how the allegations were conveyed, in which case most accounts of the mental states of those involved are difficult to verify. [Whatever the Douma residents ,][who had first-hand experience of the shooting of the water][dousing after chemical attack video ,][have to say ,][their words simply do not fit into the narrative][allowed in the West ,][analysts told RT .] [Footage of screaming bewildered civilians and children][being dosed with water ,][presumably to defuse] contaminate them ,][was a key part in convincing Western audiences][that a chemical attack happened in Douma .] [Russia brought the people][seen in the video][to Brussels ,][where they told anyone][interested in listening][that the scene was staged .] [Their testimonies , however , were swiftly branded as bizarre and underwhelming and even an obscene masquerade][staged by Russians .] [They refuse to see this as evidence,][obviously pending][what the OPCW team is going to come up with in Douma], [Middle East expert Ammar Waqqaf said in an interview with RT .] [The alleged chemical incident,][without any investigation, has already become a solid fact in the West,][which the US, Britain and France based their retaliatory strike on.] Whatever they say, their words simply don't fit the narrative accepted in the West, analysts told RT. Images of bewildered screaming civilians and children, presumably being doused with water for decontamination, were a key part of convincing Western viewers that a chemical weapons attack had taken place in Douma. Russia took the people in the video to Brussels, where they told those who would listen that the scene was a hoax. But their testimony was quickly branded as a bizarre, overwhelming, and even despicable fiction engineered by the Russians. Ammar Waqqaf, an expert on Middle East affairs, said in an interview with RT that they refused to see this as evidence and that the OPCW team was apparently pending on what to come up with in Douma. The alleged chemical weapons attack, without any investigation, has already become a solid fact in the West on which the US, UK and France base their retaliatory attacks.)

上記のテキストは、それが覆そうとする化学兵器攻撃の主張についての反証を見出していないことに注目されたい。代わりに、上記のテキストは、反対者がこの反証を観察することに興味がないことを述べている。この記事の主な記述は、特定のエージェントが、この証拠を提供および後押しするのではなく、主な主張を攻撃する特定の種類の証拠を「認めない」ことである。化学兵器攻撃の主張を覆す代わりに、記事は、住民と、住民をブリュッセルに連れて行ったロシアの代理人と、西側と、中東の専門家との間の複雑な精神状態の衝突を構築している。 Note that the above text finds no refutation of the chemical weapons attack claims it seeks to refute. Instead, the above text states that dissenters are not interested in observing this rebuttal. The main statement of this article is that certain agents "disallow" certain types of evidence that attack the main allegations, rather than provide and support this evidence. Instead of debunking the chemical weapons attack claim, the article builds on a complex mental conflict between residents, the Russian agents who brought them to Brussels, and Western and Middle Eastern experts.

図33は、一態様による例示的なコミュニケーション用談話ツリーを示す。図33は、別の物議を醸した記事であるTrump-Russia link acquisition(BBC2018年)に関するコミュニケーション用談話ツリー3300を示す。長い間、BBCはこの主張を確認することができずにおり、したがって、この記事は、それはある日裏付けが取られるであろうという読者の期待を維持するために、何度も繰り返されている。関係書類が存在するということの確証も否定もなく、執筆者の目標は、そのような関係書類が事象を誤って伝えることなく存在すると視聴者に信じさせることである。この目標を達成するために、執筆者は、トピックの真正性および妥当性を読者に印象づけるために、既存の関係書類に関するいくつかの仮説的な記述を様々な精神状態に付すことができる。 FIG. 33 illustrates an exemplary communicative discourse tree according to one aspect. FIG. 33 shows a communication discourse tree 3300 for another controversial article, Trump-Russia link acquisition (BBC 2018). For a long time, the BBC has been unable to confirm this claim, so this article has been repeated over and over to keep readers hopeful that it will one day be corroborated. The existence of dossiers is neither confirmed nor denied, and the author's goal is to convince the viewer that such dossiers exist without misrepresenting events. To achieve this goal, authors can attach several hypothetical statements about existing dossiers to various states of mind in order to impress readers of the authenticity and relevance of the topic.

図32および図33に描写されるように、多くの修辞関係は、精神状態に関連付けられる。精神状態は充分に複雑であり、人間が主な主張の正確さを検証することは困難である。コミュニケーション用談話ツリーは、執筆者が、主張を後押しするであろう論理鎖を、複雑な精神状態と置換しようとすることを示す。図32および図33に示すCDTを、関連テキストを読むことなく、単に見るだけで、論証の線が不完全であると分かるのに充分である。 As depicted in FIGS. 32 and 33, many rhetorical relationships are associated with mental states. Mental states are complex enough to make it difficult for humans to verify the accuracy of the main claims. The communicative discourse tree shows that the author tries to replace the logic chains that would support the argument with complex mental states. A simple look at the CDT shown in Figures 32 and 33, without reading the associated text, is sufficient to see that the line of argument is incomplete.

加熱した論証の取り扱い
図34は、一態様による例示的なコミュニケーション用談話ツリーを示す。図34は、加熱した議論の例のコミュニケーション用談話ツリー3400を示す。具体的には、コミュニケーション用談話ツリー3400によって表される以下のテキストは、2007年にクレジットカード会社アメリカンエクスプレス(アメックス)によって酷い扱いを受けた顧客の過熱した議論に対するCDTの例を示す。コミュニケーション用談話ツリー3400は、感情プロファイルを示す。感情プロファイルとは、提議者(ここでは「私」)および反対者(ここでは「アメックス」)の指示に付された感情値である。お分かりのように、提議者はほぼ常に肯定的、反対者は否定的に、この苦情の議論の流れを確認する。揺らぐ感情値は、文書作成者がどのように議論を提供するかに関する問題があることを示すであろう。
Handling Heated Arguments FIG. 34 illustrates an exemplary communicative discourse tree according to one aspect. FIG. 34 shows a communication discourse tree 3400 for an example heated argument. Specifically, the following text, represented by communication discourse tree 3400, provides a CDT example for a heated discussion of a customer who was badly treated by the credit card company American Express (Amex) in 2007. Communicative discourse tree 3400 shows the emotional profile. The affective profile is the emotional value attached to the instructions of the proposer (here "I") and the opponent (here "Amex"). As you can see, proponents almost always positively and opponents negatively confirm the line of argument for this complaint. A fluctuating sentiment value would indicate a problem with how the author presents the arguments.

テキストは、以下のように、論理的な塊に分割される:[I 'm another one of the many][that has been carelessly mistreated by American Express .] [I have had my card since 2004 and never late .] [In 2008][they reduced my credit limit from $16,600 to $6,000][citing several false excuses .] [Only one of their excuses was true - other credit card balances .] [They also increased my interest rate by 3 %][at the same time .] [I have never been so insulted by a credit card company .] [I used to have a credit score of 830 , not anymore , thanks to their unfair credit practices .] [They screwed my credit score .] [In these bad economic times you 'd think][they would appreciate consistent paying customers like us][but I guess][they are just so full of themselves .] [I just read today][that their CEO stated][that they will be hurt less than their competitors][because 80 percent of their revenues][are generated from fees. That][explains their callous , arrogant , unacceptable credit practices .] [It seems][they have to screw every cardholder][they can before the new law becomes effective .] [Well America , let 's learn from our appalling experience][and stop using our American Express credit card][so we can pay it off !](私はアメリカン・エキスプレスによって軽々しく不当な扱いを受けたてきた多くの人の一人です。私は2004年からカードを持っていて、支払いを遅れたことはありません。 2008年に、彼らはいくつかの誤った言い訳を引用して、私のクレジット制限を$16,600から$6,000に引き下げました。彼らの言い訳の1つ-他のクレジットカードの残高-だけが真実でした。同時に私の金利も3%上昇しました。私はクレジットカード会社にこんなに侮辱されたことはありません。私は以前は830のクレジットスコアを持っていましたが、彼らの不公正な信用慣行のおかげで、現在はもうそうではありません。彼らは私のクレジットスコアを台無しにしました。昨今の悪い経済状況では、あなたは彼らが私たちのような一貫した支払いの顧客に感謝すると思うでしょうが、私は彼らが彼ら自身のことばかり考えているのだと思います。今日読んだばかりですが、彼らのCEOは、収益の80%が手数料から発生しているため、競合他社よりも被害が少ない、と述べています。それは、彼らの冷酷で傲慢で容認できない信用慣行を説明しています。新しい法律が施行される前に、彼らはできる限りすべてのカード所有者を搾取する必要があるようです。さあアメリカよ、私たちの恐ろしい経験から学び、私たちのアメリカンエキスプレスクレジットカードの使用をやめて、復讐しましょう!)。 The text is divided into logical chunks as follows: [I 'm another one of the many][that has been carelessly mistreated by American Express .] [I have had my card since 2004 and never late .] [In 2008][they reduced my credit limit from $16,600 to $6,000][citing several false excuses .] [Only one of their excuses was true - other credit card balances .] [They also increased. my interest rate by 3 %][at the same time .] [I have never been so insulted by a credit card company .] [I used to have a credit score of 830 , not anymore , thanks to their unfair credit practices .] [They screwed my credit score .] [In these bad economic times you'd think][they would appreciate consistent paying customers like us][but I guess][they are just so full of themselves .] [I just read today][that their CEO stated][that they will be hurt less than their competitors][because 80 percent of their revenues][are generated from fees. ] (I am one of many who have been blatantly wronged by American Express. I have had the card since 2004 and have never missed a payment. In 2008, they lowered my credit limit from $16,600 to $6,000, citing some false excuses. Only one of their excuses - another credit card balance - was true. At the same time, my interest rate also increased by 3%. I have never been so insulted by a credit card company. I used to have an 830 credit score, but now I don't because of their unfair credit practices. They ruined my credit score. In these bad economic times, you'd think they would appreciate consistent paying customers like us, but I think they're just thinking about themselves. I just read today that their CEO says that 80% of their revenue comes from fees, making them less vulnerable than their competitors. It explains their ruthless, arrogant and unacceptable credit practices. It looks like they need to exploit every cardholder they can before the new law comes into force. Come on America, learn from our horrible experience, stop using our American Express credit cards, and take revenge! ).

図35は、一態様による例示的なコミュニケーション用談話ツリーを示す。図35は、論証を伝達する振る舞いをどのように行うかについて助言するテキストを表すコミュニケーション用談話ツリー3500を示す:"When a person is in the middle of an argument, it can be easy to get caught up in the heat of the moment and say something that makes the situation even worse. Nothing can make someone more frenzied and hysterical than telling them to calm down. It causes the other person to feel as if one is putting the blame for the elevation of the situation on them. Rather than actually helping them calm down, it comes off as patronizing and will most likely make them even angrier." (人が論証の最中にいる場合、その瞬間の熱に捕らわれて、状況をさらに悪化させる何かを言うことは簡単であり得る。落ち着くように言うことほど、人をより興奮させヒステリックにすることはない。これは、その人に、状況の過熱の責めが自分に押し付けられていると感じさせる。それは、実際にその人が落ち着くのを助けるよりもむしろ、庇護者ぶっているように表れ、おそらくその人をさらに怒らせるであろう)。図35は、メタ議論の例である。メタ議論とは、過熱した議論をどのように行うかについての議論であり、同じ修辞関係によって表すことができる。 FIG. 35 illustrates an exemplary communicative discourse tree according to one aspect. FIG. 35 shows a communicative discourse tree 3500 representing text advising how to conduct behavior that conveys an argument: "When a person is in the middle of an argument, it can be easy to get caught up in the heat of the moment and say something that makes the situation even worse. Nothing can make someone more frenzied and hysterical than telling them to calm down. It causes the other person to feel as if one is putting the blame for the elevation of the situation on them. Rather than actually helping them calm down." , it comes off as patronizing and will most likely make them even angrier." (which will probably make the person even more angry). FIG. 35 is an example of a meta-argument. A meta-argument is an argument about how to conduct a heated argument and can be represented by the same rhetorical relation.

議論を判断するための機械学習モデルの使用
論じたように、アプリケーション102はテキスト内の議論を検出することができる。図36は、一態様による、機械学習を用いて議論を判断するための例示的なプロセスを示す。
Using Machine Learning Models to Determine Arguments As discussed, the application 102 can detect arguments within text. FIG. 36 illustrates an exemplary process for determining arguments using machine learning, according to one aspect.

ブロック3601において、プロセス3600は、フラグメントを含むテキストにアクセスすることを含む。アプリケーション102は、入力テキスト130、またはチャット、Twitterなどのインターネットベースのソースなどの異なるソースからテキストを受け取ることができる。テキストは、フラグメント、センテンス、パラグラフ、またはより長い量からなることができる。 At block 3601, the process 3600 includes accessing text containing fragments. Application 102 can receive input text 130 or text from different sources such as chat, Twitter, and other Internet-based sources. Text can consist of fragments, sentences, paragraphs, or longer amounts.

ブロック3602において、プロセス3600は、テキストから談話ツリーを作成することを含み、談話ツリーは、ノードを含み、各非終端ノードは、フラグメントのうちの2つの間の修辞関係を表し、談話ツリーのノードの各終端ノードは、フラグメントのうちの1つに関連付けられる。アプリケーション102は、プロセス1500のブロック1502で説明したのと実質的に同様の方法で談話を作成する。 At block 3602, the process 3600 includes creating a discourse tree from the text, the discourse tree containing nodes, each non-terminal node representing a rhetorical relationship between two of the fragments, and each terminal node of the nodes of the discourse tree being associated with one of the fragments. Application 102 creates a discourse in substantially the same manner as described in block 1502 of process 1500 .

ブロック3603では、プロセス3600は、動詞を有する各フラグメントを動詞シグネチャと一致させ、それによって、コミュニケーション用談話ツリーを作成するステップを伴う。アプリケーション102は、プロセス1500のステップ1503~1505で説明したのと実質的に同様の方法で談話を作成する。 At block 3603, the process 3600 involves matching each fragment with a verb with a verb signature, thereby creating a communicative discourse tree. Application 102 creates a discourse in substantially the same manner as described in steps 1503-1505 of process 1500. FIG.

ブロック3604において、プロセス3600は、議論を検出するようにトレーニングされた分類モデルをコミュニケーション用談話ツリーに適用することによって、コミュニケーション用談話ツリーが議論を含むかどうかを判断することを含む。分類モデルは、異なる学習手法を用いることができる。例えば、分類モデルは、サポートベクターマシンをツリーカーネル学習とともに用いることができる。さらに、分類モデルは、最大共通サブツリーの最近傍学習を用いることができる。 At block 3604, the process 3600 includes determining whether the communication discourse tree contains arguments by applying a classification model trained to detect arguments to the communication discourse tree. Classification models can use different learning techniques. For example, a classification model can use support vector machines with tree kernel learning. In addition, the classification model can use nearest neighbor learning of maximal common subtrees.

例として、アプリケーション102は、機械学習を用いて、ブロック3603で識別されたコミュニケーション用談話ツリーと、コミュニケーション用談話ツリーのトレーニングセットからの1つ以上のコミュニケーション用談話ツリーとの間の類似性を判断することができる。アプリケーション102は、複数のコミュニケーション用談話ツリーを含むトレーニングセットから追加のコミュニケーション用談話ツリーを選択することができる。トレーニングは、追加のコミュニケーション用談話ツリーとの最多数の類似性を有するコミュニケーション用談話ツリーに基づくことができる。アプリケーション102は、追加のコミュニケーション用談話ツリーが陽性セットからのものであるか陰性セットからのものであるかを識別する。陽性セットは、議論を含むテキストに関連付けられ、陰性セットは、議論を含まないテキストに関連付けられる。アプリケーション102は、この識別に基づいて、テキストが議論を含むか議論を含まないかを判定する。 As an example, application 102 can use machine learning to determine the similarity between the communicative discourse tree identified in block 3603 and one or more communicative discourse trees from the training set of communicative discourse trees. Application 102 may select additional communicative discourse trees from a training set containing multiple communicative discourse trees. Training can be based on the communicative discourse tree that has the highest number of similarities with the additional communicative discourse trees. Application 102 identifies whether additional communicative discourse trees are from the positive set or the negative set. A positive set is associated with texts containing arguments, and a negative set is associated with texts without arguments. Application 102 determines whether the text contains discussion or does not contain discussion based on this identification.

論理的論証検出の評価
議論検出を評価するために、陽性データセットが、不均一なものとされ、異なるスタイル、ジャンル、および議論タイプを一緒に拾い上げるよう、いくつかのソースから作成される。まず、議論が頻繁であるデータの一部、例えば、ニューヨークタイムズ(1400記事)、ボストングローブ(1150記事)、ロサンゼルスタイムズ(2140)およびその他(1200)などの新聞からの、意見のあるデータを使用した。顧客の苦情のテキストも使用する。さらに、テキストスタイルおよびジャンル認識データセットを使用する(Lee, 2001)。このデータセットは、議論に関連付けられるする特定の次元を有する(セクション[ted] "Emotional speech on a political topic with an attempt to sound convincing"(説得力のあるように聞こえるように試みる、政治的トピックに関する感情的なスピーチ))。そして、最終的に、論証の存在が注釈者によって確立される標準的論証マイニングデータセットからいくつかのテキストを追加する:"Fact and Feeling" データセット (Oraby et al., 2015)、680記事およびデータセット"Argument annotated essays v.2" (Stab and Gurevych, 2016), 430記事。
Evaluating Logical Argument Detection To evaluate argument detection, a positive dataset is made heterogeneous and created from several sources to pick together different styles, genres, and argument types. First, we used some of the more frequently debated data, such as opinionated data from newspapers such as the New York Times (1400 articles), Boston Globe (1150 articles), Los Angeles Times (2140) and others (1200). Also use the customer complaint text. In addition, we use text style and genre recognition datasets (Lee, 2001). This dataset has a specific dimension associated with the argument (section [ted] "Emotional speech on a political topic with an attempt to sound convincing"). And finally, we add some texts from standard argumentation mining datasets where the presence of arguments is established by the annotators: the "Fact and Feeling" dataset (Oraby et al., 2015), 680 articles and the dataset "Argument annotated essays v.2" (Stab and Gurevych, 2016), 430 articles.

陰性データセットについては、Wikipedia(3500記事)、事実ニュース源(3400記事を伴うロイター供給、およびさらに(Lee, 2001)[tells] のようなコーパスのセクションを含むデータセット(450記事)、"Instructions for how to use software" (ソフトウェア使用法指南)(320記事)[tele];"Instructions for how to use hardware"(ハードウェア使用法指南)(175記事);[news]、"A presentation of a news article in an objective, independent manner"(客観的で独立した態様でのニュース記事の表現)(220記事)、および論証のない他の混合データセット(735記事)を用いることができる。 For negative datasets: Wikipedia (3500 articles), factual news sources (Reuters-supplied with 3400 articles), and datasets that also include corpus sections such as (Lee, 2001) [tells] (450 articles), "Instructions for how to use software" (320 articles) [tele]; "Instructions for how to use hardware" (175 articles); [news], "A presentation of a news article in an objective, independent manner" (220 articles), and other mixed datasets without arguments (735 articles) can be used.

陽性データセットおよび陰性データセットは両方とも8800のテキストを含む。平均テキストサイズは400語(常に200語を上回り1000語を下回る)であった。我々は、Amazon Mechanical Turkを用いて、陽性データセットは、採用された作業者によれば、常識的見解において議論を含むことを確認した。85%を上回る以前の受容スコアを有した12人の作業者に、ラベル付けするタスクを割り当てた。論証の有無の手動確認のために、我々は、各セットから代表を無作為に選択し(約10%)、あるクラスに95%を超える信頼度で適切に属することを確認した。我々は、そのような信頼度が95%未満であったソースを回避した。手動ラベル付けを受けたテキストの第1の部分について、我々は、注釈者間合意の評価を行い、それが90%を超えたことを認めた。したがって、残りの注釈については、テキストごとに一人の作業者に依存した。評価のために、我々は、データセットをトレーニングおよびテスト部分に4:1の割合で分けた。 Both the positive and negative datasets contain 8800 texts. The average text size was 400 words (always >200 words and <1000 words). Using Amazon Mechanical Turk, we confirmed that the positive dataset contained arguments in common sense view according to the workers employed. Twelve workers with previous acceptance scores above 85% were assigned the labeling task. For manual confirmation of the presence or absence of arguments, we randomly selected representatives from each set (approximately 10%) and confirmed that they belonged properly to a class with greater than 95% confidence. We avoided sources with less than 95% confidence as such. For the first portion of text that received manual labeling, we performed an assessment of inter-annotator agreement and found it to exceed 90%. Therefore, we relied on one operator per text for the remaining annotations. For evaluation, we split the dataset into training and testing parts in a 4:1 ratio.

特定の議論パターンデータセット
この議論データセットの目的は、文書作成者がビジネスの犠牲者であることを証明するために様々な議論手段を用いる苦情のテキストを収集することである。顧客の苦情は、顧客が特定のビジネスで経験した問題の記述を含む感情の漲ったテキストである。生の苦情は、PlanetFeedback.comから、2006年~2010年に提出された多数の銀行について収集される。400の苦情は、議論に関連する以下のパラメータに関して手動でタグ付けされる:
・知覚された苦情の妥当性、
・議論の妥当性、
・特定の議論パターンの存在、および
・検出可能な誤表現。
Specific Argument Patterns Dataset The purpose of this argumentation dataset is to collect texts of complaints that use a variety of argumentation tools to prove that the document creator is a business victim. A customer complaint is an emotional text containing a description of a problem a customer has experienced with a particular business. Raw complaints are collected from PlanetFeedback.com for a number of banks submitted from 2006-2010. The 400 complaints are manually tagged with respect to the following parameters relevant to the discussion:
the validity of the perceived complaint;
・Relevance of the discussion,
• Presence of specific argument patterns and • Detectable misspellings.

苦情によって判断すると、ほとんどの苦情者は、彼らがサービスから期待したもの、彼らが何を受け取ったか、およびそれが伝えられた態様からの強い逸脱に起因して、本当に難渋している状態にある。ほとんどの苦情作成者は、不適格性、欠陥のある方針、無視、顧客のニーズに対する無関心、および顧客サービス要員からの誤表現を報告している。 Judging by the complaints, most complainers are in a real quandary due to strong deviations from what they expected from the service, what they received and the manner in which it was communicated. Most complaint writers report incompetence, flawed policies, neglect, indifference to customer needs, and misrepresentations from customer service personnel.

文書作成者は、彼らが利用可能な伝達手段を使い果たし、混乱し、他のユーザからの推奨を求め、特定の金融サービスを回避することについて他者に助言することが多い。苦情の焦点は、提議者が正しく、反対者が間違っていることの証明、決議提案、および所望の結果である。 Authors often exhaust the channels available to them, become confused, seek recommendations from other users, and advise others about avoiding certain financial services. Complaints focus on proving that the proponent is right and the opponent is wrong, the proposed resolution, and the desired outcome.

複数の議論パターンが、苦情において用いられる:
・最も頻繁であるのは、常識に従って、実際に起こったことの、期待されたものからの逸脱である。このパターンは、有効議論および無効議論の両方をカバーする(有効パターン)。
・第2の人気議論パターンは、約束(広告、伝達)されたことと受け取ったものまたは実際に発生したことの間の違いを引用する。このパターンは、反対者がルールに従って行動しないことにも言及する(有効)。
・多数の苦情が、銀行の代表者は嘘をついている、と明示的に述べている。嘘をつくとは、異なる銀行代理人によって提供される情報間の不整合、事実の誤表現、および不注意な約束を含む(有効)。
・別の理由苦情は、銀行代理人および顧客サービス要員の無作法によるものである。顧客は、両方の場合において無作法を引用し、そのとき、反対者ポイントが有効であるかまたはそうではない(ならびに苦情および議論有効性はそれに応じてタグ付けされる)。たとえ金融的損失も不都合もないとしても、苦情者は、無礼に扱われた場合には、所与の銀行が行うすべてに同意しない。(無効パターン)。
・苦情者らは、銀行が特定の方法で振る舞うべき理由として、彼らのニーズを挙げている。人気のある議論は、行政が納税者を介して銀行を救済したので、今度は銀行が顧客に恩恵を与えるべきである、というものである(無効)。
Several argument patterns are used in complaints:
• Most often, according to common sense, deviations of what actually happened from what was expected. This pattern covers both valid and invalid arguments (valid pattern).
• A second popular argument pattern cites the difference between what was promised (advertised, communicated) and what was received or actually happened. This pattern also mentions that the opponent does not act according to the rules (valid).
A number of complaints explicitly state that bank representatives are lying. Lying includes inconsistencies between information provided by different bank agents, misrepresentation of facts, and careless promises (valid).
• Another reason for complaints is due to the rudeness of bank agents and customer service personnel. Customers cite rudeness in both cases and then the objector points are valid or not (and complaint and argument validity are tagged accordingly). Even if there is no financial loss or inconvenience, complainants will not agree to anything a given bank does if they are treated disrespectfully. (invalid pattern).
• Complainants cite their needs as a reason for banks to behave in a certain way. A popular argument is that the administration bailed out banks through the taxpayers and now banks should benefit their customers (null).

このデータセットは、他の論証マイニングデータセットと比較して、より感情的に過熱した苦情を含む。不充分な資金手数料などの所与のトピックについて、このデータセットは、この料金は不公平であるという多くの異なる議論の方法を提供する。したがって、我々のデータセットは、トピックから独立した議論パターンのクラスタの系統的探索を斟酌し、議論タイプと全体的な苦情の妥当性との間のリンクを観察する。法的論証、学生論文(Stab and Gurevych 2017)、インターネット論証コーパス(Abbot et al., 2016)、事実-感覚データセット(Oraby et al., 2016)、および政治討論を含む他の議論データセットは、トピックの強い変動を有し、したがって、トピックあたりの可能な議論パターンのスペクトルを追跡することはより困難である。法的領域および政治的領域における専門的な書面とは異なり、苦情を訴えるユーザの真正な書面は、単純な動機付け構造、彼らの目的の透明性を有し、一定の領域および文脈において生じる。本研究で用いられるデータセットでは、論証は、不当な大量の金銭の請求または住宅からの立ち退きの対象となる文書作成者の幸福のために重要な役割を果たす。したがって、文書作成者らは、彼らの主張を後押しし、事例を強化するために、できるだけ強い議論を与えようと試みる。 This dataset contains more emotionally heated complaints compared to other argumentation mining datasets. For a given topic such as insufficient funding fees, this dataset offers many different ways of arguing that this fee is unfair. Our dataset therefore allows for a systematic search for clusters of topic-independent argument patterns and observes links between argument types and overall complaint relevance. Other argumentation datasets, including legal argumentation, student papers (Stab and Gurevych 2017), Internet argumentation corpora (Abbot et al., 2016), fact-sensory datasets (Oraby et al., 2016), and political debates, have strong topical variation and are therefore more difficult to track the spectrum of possible argumentation patterns per topic. Unlike professional writing in legal and political spheres, genuine writing of complaining users has a simple motivational structure, transparency of their purpose, and occurs in a given domain and context. In the dataset used in this study, argumentation plays an important role for the well-being of authors who are subject to unjustified large financial claims or evicted from their homes. Therefore, authors attempt to give as strong an argument as possible to back up their claims and strengthen the case.

苦情が真実でない場合、それは通常は無効である:顧客は、悪い気分を訴えるか、または代償を得ようとするかのいずれかである。しかしながら、苦情が真実である場合でも、特に論証に欠陥がある場合、それは容易に無効になり得る。虚偽の苦情が有効な議論パターンを有する場合、注釈者がそれを有効または無効として適切に割り当てることは困難である。3人の注釈者がこのデータセットで作業し、注釈者間の合意は80%を超える。 If the complaint is untrue, it is usually invalid: the customer either complains or seeks compensation. However, even if the complaint is true, it can easily be invalidated, especially if the argument is flawed. If a false complaint has a valid argument pattern, it is difficult for the annotator to properly assign it as valid or invalid. Three annotators worked on this dataset and the agreement among the annotators is over 80%.

評価設定および結果
最近傍分類については、我々は、テキストから抽出されたCA上で構築されたシナリオグラフに基づいたCA手法のための最大共通サブグラフとならんで、DT手法のための最大共通サブグラフを使用した(表5)。SVM TK分類については、我々は、パース交錯手法のツリーカーネル学習を採用し、ここで、各パラグラフは、網羅的な構文情報および談話情報を含むパース交錯によって表される。我々は、DTのためにSVM TKも使用し、CA情報は考慮されない。
Evaluation Settings and Results For nearest neighbor classification, we used the maximal common subgraph for the DT method alongside the maximal common subgraph for the CA method based on scenario graphs constructed on CA extracted from the text (Table 5). For SVM TK classification, we employ the parse-crossover approach tree-kernel learning, where each paragraph is represented by a parse-crossover containing exhaustive syntactic and discourse information. We also use SVM TK for DT and CA information is not considered.

我々のファミリーのプレベースライン手法は、キーワードおよびキーワード統計に基づく。単純ベイズ手法については、我々はWEKAフレームワークに依拠した(Hall et al., 2009)。ほとんどの語彙および長さベースの特徴は、充分にサポートされない論証を見つけるのに信頼できるので(Stab and Gurevych 2017)、我々は、非NERを、議論を潜在的に表現するフレーズにおけるトークンの数とともに特徴として使用した。また、NERカウントは論証の強さと相関があると仮定して用いた。これらの特徴が論証と強く相関している場合であっても、CDTによって表されるように、議論がどのように構造化され、言語で伝達されるかという性質を理解するのには役立たない。 Our family of pre-baseline methods is based on keywords and keyword statistics. For the naive Bayes approach, we relied on the WEKA framework (Hall et al., 2009). Since most lexical and length-based features are reliable for finding poorly supported arguments (Stab and Gurevych 2017), we used non-NER as a feature along with the number of tokens in phrases that potentially express arguments. Also, the NER count was used assuming that it correlates with the strength of the argument. Even when these features are strongly correlated with arguments, they do not help us understand the nature of how arguments are structured and communicated in language, as represented by the CDT.

Figure 2023531345000018
Figure 2023531345000018

Figure 2023531345000019
Figure 2023531345000019

単純手法は、単にキーワードに依存して、議論の存在を把握する。通常、少なくとも1つが(反対者に関連する)負の感情極性を有するようないくつかのコミュニケーション行動は、論理的議論が存在すると演繹するのに充分である。この単純手法は、最高性能のCDT手法よりも29%劣っている。単純ベイズ分類器がもたらす改善は、わずか2%である。 A naive approach simply relies on keywords to capture the presence of arguments. Usually several communicative behaviors, at least one of which has a negative emotional polarity (related to the opponent), are sufficient to deduce that a logical argument exists. This simple approach is 29% worse than the best performing CDT approach. The naive Bayes classifier provides only 2% improvement.

最近傍学習について、DTおよびCAは実際に互いに補完し合い、前者の26%超および後者の30%超のCDTの精度をもたらすことを観察することができる。単にCAがもたらした結果は、独立したDTよりも悪い(表6)。お分かりのように、CDTのSVM TKは、RST+CAおよび完全な構文的特徴のSVM TK(SVM TKベースライン)より5%優れている。これは、特徴エンジニアリングおよびより少ないデータに依存することによるが、ベースラインよりも関連性が高いものによる。 For nearest neighbor learning, it can be observed that DT and CA actually complement each other, yielding a CDT accuracy of over 26% for the former and over 30% for the latter. CA alone produced worse results than independent DT (Table 6). As can be seen, CDT SVM TK outperforms RST+CA and full syntactic feature SVM TK (SVM TK baseline) by 5%. This is due to feature engineering and reliance on less data, but more relevant than the baseline.

Figure 2023531345000020
Figure 2023531345000020

CDTに対する最近傍学習は、CDTに対するSVM TKよりも、達成される精度がわずかに低いが、前者は、議論に典型的なサブツリー、および事実データ間で共有されるサブツリーの、興味深い例を与える。CDTサブツリーの前者のグループの数は、当然ながら著しく多い。残念ながら、SVM TK手法は、論証識別問題がどのように正確に解決されるかを説明するのに役立たない。それは、最終スコアリングおよびクラスラベルを与えるにすぎない。CAなしで論理的論証を表現することは可能であるが、稀である。この所見は我々のデータによって補強される。 Nearest neighbor learning on CDT achieves slightly less accuracy than SVM TK on CDT, but the former provides an interesting example of subtrees typical of the discussion and shared among factual data. The number of former groups of CDT subtrees is of course significantly higher. Unfortunately, the SVM TK approach does not help explain how exactly the argument identification problem is solved. It just gives the final scoring and class label. Expressing logical arguments without CA is possible, but rare. This observation is reinforced by our data.

我々の評価設定は、RST構文解析のSVMベースのランキングに近いことに言及する価値がある。この問題は、DTを、手動で注釈付けされたツリーに近い正しいツリーおよび正しくないツリーのセットに分類するものとして、定式化される。我々の設定は、より小さなデータセットに、より良好に調整されるので、少し異なる。DTからCDTに進む論証検出の改善は、発話動作関連情報によるRSTの我々の拡張の妥当性を実証することに留意されたい。 It is worth mentioning that our evaluation setup is close to the SVM-based ranking of RST parsers. The problem is formulated as classifying the DT into a set of correct and incorrect trees that are close to the manually annotated trees. Our settings are slightly different as they are better tuned to smaller datasets. Note that the improvement in argument detection going from DT to CDT demonstrates the validity of our extension of RST with speech action related information.

表7は、ソースごとのSVM TK論証検出結果を示す。陽性セットとして、我々はここで個々のソースのみを取る。陰性セットは、同じソースから形成されるが、より小さい陽性セットのサイズに適合するようにサイズが低減される。交差検証設定は、陽性セット全体の我々の評価に類似している。 Table 7 shows the SVM TK argumentation detection results by source. As a positive set we take only individual sources here. A negative set is formed from the same source, but reduced in size to match the size of the smaller positive set. Cross-validation settings are similar to our evaluation of the entire positive set.

我々は、特定のドメインの特異性と談話レベル情報の論証検出精度に対する寄与との間に相関を見出さなかった。同時に、我々がキーワードおよび単純ベイズからSVM TKに進むとき、これらの4つのドメインはすべて単調な改善を示す。4つのソースのすべてがCDTによる論証検出率の改善を示すので、我々は、同じことが、議論関連の情報の他のソースについてありそうである、と結論付ける。 We found no correlation between the specificity of a particular domain and the contribution of discourse-level information to argumentative detection accuracy. At the same time, all four domains show monotonic improvement when we progress from Keywords and Naive Bayes to SVM TK. Since all four sources show improvement in argumentation detection rate with CDT, we conclude that the same is likely for other sources of argument-related information.

Figure 2023531345000021
Figure 2023531345000021

パターン特定的議論検出結果を表8に示す。我々は、分類の精度を特定のパターン対他のパターンおよび議論の欠如として計算する。第1および第2のタイプの論証は、認識するのがより困難であり(一般的な論証より7~10%低い)、第3および第4のタイプは、検出するのがより容易である(一般的な論証精度を3%超える)。 Table 8 shows the pattern-specific argument detection results. We calculate the classification accuracy as specific patterns versus other patterns and lack of arguments. The first and second types of argumentation are more difficult to recognize (7-10% lower than typical argumentation), and the third and fourth types are easier to detect (3% above general argumentation accuracy).

これらの論証認識精度は、現状技術の論証マイニング技術に匹敵する。ある研究では、128の前提結論ペアを含むテキストの分析を行い、63~67%のF尺度を得て、議論における推論的つながりの方向性を判定した。Lawrence, John and Chris Reed. Mining Argumentative Structure from Natural Language text using Automatically Generated Premise-Conclusion Topic Models. Proceedings of the 4th Workshop on Argument Mining, pages 39-48. 2017を参照されたい。Bar-Haim et al.は、初期語彙の自動拡張によって、論証スタンス認識の正確さおよびカバレッジの両方(何がサポートしているか、および何が主張を覆しているか)を69%F尺度まで有意に改善できることを示している。Bar-Haim, Roy Lilach Edelstein, Charles Jochim and Noam Slonim. Improving Claim Stance Classification with Lexical Knowledge Expansion and Context Utilizationを参照されたい。Proceedings of the 4th Workshop on Argument Mining, pages 32-38. 2017. Aker et al.は、論証マイニングタスクに対する異なる教師あり機械学習方法および特徴セットの性能の比較分析を提供し、議論文を検出することについて81%のF尺度および論証構造予測タスクについて59%を達成する。Aker, Ahmet, Alfred Sliwa, Yuan Ma, Ruishen Liu Niravkumar Borad, Seyedeh Fatemeh Ziyaei, Mina Ghbadi What works and what does not: Classifier and feature analysis for argument mining. Proceedings of the 4th Workshop on Argument Mining, pages 91-96. 2017を参照されたい。論証単位およびそれらの非議論的対応物への論証テキストの議論セグメント化に関して、Ajjour et alは、エッセイに関してはBi-LSTMを用いて88%を達成し、編集に関しては84%である。Ajjour, Yamen ,Wei-Fan Chen, Johannes Kiesel, Henning Wachsmuth and Benno Stein. Unit Segmentation of Argumentative Textsを参照されたい。Proceedings of the 4th Workshop on Argument Mining, pages 118-128, 2017。論証マイニングタスクの複雑さを考慮に入れると、これらの分類精度は、現在の研究に匹敵するが、談話レベル分析を介した議論の原因の探索を欠いている。したがって、この研究は、一般的な議論およびその特定のパターンの、はるかにより直接的な特徴エンジニアリングを提案する。 These argument recognition accuracies are comparable to state-of-the-art argument mining techniques. One study analyzed a text containing 128 premise-conclusion pairs and obtained an F scale of 63-67% to determine the directionality of inferential connections in an argument. See Lawrence, John and Chris Reed. Mining Argumentative Structure from Natural Language text using Automatically Generated Premise-Conclusion Topic Models. Proceedings of the 4th Workshop on Argument Mining, pages 39-48. 2017. Bar-Haim et al. show that automatic expansion of the initial vocabulary can significantly improve both the accuracy and coverage of argumentative stance recognition (what supports and what refutes) up to the 69% F scale. See Bar-Haim, Roy Lilach Edelstein, Charles Jochim and Noam Slonim. Improving Claim Stance Classification with Lexical Knowledge Expansion and Context Utilization. Proceedings of the 4th Workshop on Argument Mining, pages 32-38. 2017. Aker et al. provide a comparative analysis of the performance of different supervised machine learning methods and feature sets on the argument mining task, achieving an F-measure of 81% for detecting argument sentences and 59% for the argument structure prediction task. See Aker, Ahmet, Alfred Sliwa, Yuan Ma, Ruishen Liu Niravkumar Borad, Seyedeh Fatemeh Ziyaei, Mina Ghbadi What works and what does not: Classifier and feature analysis for argument mining. Proceedings of the 4th Workshop on Argument Mining, pages 91-96. Regarding the argumentative segmentation of argumentative texts into argumentative units and their non-argumentative counterparts, Ajjour et al achieve 88% with Bi-LSTM for essays and 84% for edits. See Ajjour, Yamen, Wei-Fan Chen, Johannes Kiesel, Henning Wachsmuth and Benno Stein. Unit Segmentation of Argumentative Texts. Proceedings of the 4th Workshop on Argument Mining, pages 118-128, 2017. Taking into account the complexity of the argumentation mining task, these classification accuracies are comparable to current studies, but lack the exploration of arguments' causes via discourse-level analysis. This work therefore proposes a much more direct feature engineering of the general discussion and its specific patterns.

CDT構築
EDUへの分割は適度に良好に機能するが、RST関係の割当はノイズが多く、いくつかのドメインでは、その精度は50%程度に低くあり得る。しかしながら、RST関係ラベルがランダムである場合、それは、我々の議論検出システムの性能を著しく低下させず、なぜならば、ランダムな談話ツリーは、陽性または陰性のトレーニングセットの要素にあまり類似せず、陽性または陰性の決定に関与しない可能性が最も高いからである。ノイズの多い入力問題を克服するために、信頼できる妥当な談話ツリーの数が、分類されるケースをカバーするのに充分に多くあるよう、より広範なトレーニングデータセットが必要とされる。この数が充分に大きい限り、ノイズが多く不適切に構築された談話ツリーの寄与は低い。
CDT Construction Although the partitioning into EDUs works reasonably well, the assignment of RST relations is noisy and in some domains its accuracy can be as low as 50%. However, if the RST relational label is random, it does not significantly degrade the performance of our argument detection system, because random discourse trees are not very similar to the positive or negative training set elements and most likely do not participate in the positive or negative decision. To overcome the noisy input problem, a broader training dataset is needed so that the number of reliable and valid discourse trees is large enough to cover the cases to be classified. As long as this number is large enough, the contribution of noisy and poorly constructed discourse trees is low.

談話パーサによって得られる正しい直感的な談話ツリーからは、ある系統的な偏差がある。このセクションでは、CDTの偏差と我々のトレーニングセットとの間に相関があるかどうかを評価する。我々は、議論を有するテキストに対するCDT偏差が、議論のないテキストに対するCDT偏差よりも強い可能性を許容する。 There are some systematic deviations from the correct intuitive discourse tree obtained by the discourse parser. In this section, we assess whether there is a correlation between CDT deviations and our training set. We allow the possibility that the CDT deviations for texts with arguments are stronger than those for texts without arguments.

各ソースについて、我々は、有意に逸脱したCDTの数を計算した。この評価の目的のために、我々は、修辞関係の20%超が不適切なように判断される場合、そのCDTは逸脱する、と考えた。我々は、属性および対比などの議論に関連付けられる特定のRST関係を区別しない。歪み評価データセットは、検出データセットよりも著しく小さく、なぜならば、実質的に手動の努力が要求され、タスクはAmazon Mechanical Turk作業者に提出することができないからである。 For each source, we calculated the number of CDTs that deviated significantly. For the purposes of this assessment, we considered the CDT to be deviated if more than 20% of rhetorical relationships were judged inappropriate. We do not distinguish between specific RST relationships associated with arguments such as attributes and contrasts. The strain assessment dataset is significantly smaller than the detection dataset because it requires substantial manual effort and the task cannot be submitted to Amazon Mechanical Turk workers.

Figure 2023531345000022
Figure 2023531345000022

認識クラスとCDT歪み率との間には明らかな相関がないことを観察することができる(表9)。したがって、我々は、ノイズの多いCDTのトレーニングセットを、議論検出に関して適切に評価することができる、と結論付ける。お分かりのように、これらのノイズのあるCDTと論理的論証の存在との間には強い相関がある。 It can be observed that there is no clear correlation between recognition class and CDT distortion rate (Table 9). Therefore, we conclude that the noisy CDT training set can be adequately evaluated for argument detection. As can be seen, there is a strong correlation between these noisy CDTs and the presence of logical arguments.

感情
任意のドメインにおける信頼できる感情検出は困難であるため、我々は、特定の極性を有する論理的議論などの特定の感情関連特徴に焦点を当てる。論理的議論の検出は、感情検出の検出の性能を改善するのに役立ち得る。我々は、パラグラフのレベルで感情検出問題を定式化する。感情極性のみを検出する。
Emotion Reliable emotion detection in any domain is difficult, so we focus on specific emotion-related features such as logical arguments with specific polarities. Logical argument detection can help improve the detection performance of emotion detection. We formulate the emotion detection problem at the paragraph level. Detects emotional polarity only.

個々の単語に基づいて感情を分類することは、語彙的要因、談話要因、または文脈的要因に基づいて原子的な感情キャリアを修正する(弱める、強化する、または逆転させる)ことがあり得るので、誤解を招く可能性がある。単語は、互いに相互作用して、表現レベル極性を生じさせる。例えば、複合表現の意味は、それの部分の意味およびそれらが組み合わされる構文規則の関数である。したがって、RSTによって必要とされるよりも多くの言語学的構造を考慮することは、様々な談話分析モデルからのこれらの洞察の我々の組合せを動機付けるものである。我々の仮説は、テキストのより大きな構文要素の極性値を、それらの下位構成要素の極性の関数として、形式意味論における「構成性の原理」と同様の方法で、非常に正確に計算することが可能であるというものである。言い換えれば、センテンスの意味がそれの部分の意味の関数である場合、センテンスの全体的な極性はそれの部分の極性の関数である。例えば、我々は、動詞「減少させる」に負の特性を帰することができるが、「リスク」がそれ自体負であるにもかかわらず、「リスクを減少させる」において正の極性を帰することができる(「生産性を減少させる」における負の極性を参照)。この極性反転は、センテンスレベルを超えて解析を拡張してテキスト全体としての全体的な極性を計算するときにしか捕捉されない。したがって、あらゆる極性競合は、テキスト因子および文脈因子に基づいて、テキストの全体的な意味の関数として解決される。極性重みは、テキストの個々の要素のプロパティではないが、結束性のレベルで動作するプロパティの関数であり、談話分析の構文レベル、談話レベルおよび語用論レベルにおいて潜在的な一貫性関係である。 Categorizing emotions based on individual words can be misleading because it is possible to modify (weaken, strengthen, or reverse) atomic emotion carriers based on lexical, discourse, or contextual factors. Words interact with each other to produce expression level polarities. For example, the meaning of a compound expression is a function of the meanings of its parts and the syntactic rules with which they are combined. Considering more linguistic structures than required by RST is therefore what motivates our combination of these insights from various discourse analysis models. Our hypothesis is that it is possible to very accurately compute the polarity values of the larger syntactic elements of a text as a function of the polarity of their subcomponents, in a manner similar to the ``composition principle'' in formal semantics. In other words, if the meaning of a sentence is a function of the meanings of its parts, then the overall polarity of a sentence is a function of the polarities of its parts. For example, we can ascribe a negative trait to the verb "reduce", but a positive polarity in "reduce risk" even though "risk" is itself negative (see negative polarity in "reduce productivity"). This polarity reversal is only captured when extending the analysis beyond the sentence level to compute the overall polarity of the text as a whole. Therefore, any polarity conflicts are resolved as a function of the overall meaning of the text, based on textual and contextual factors. Polarity weights are not properties of the individual elements of the text, but are functions of properties that operate at the level of cohesion and are implicit coherence relations at the syntactic, discourse and pragmatic levels of discourse analysis.

多くの研究は、談話関連の情報が感情分析の性能をうまく改善できることを示しており、例えば、EDUの重要性を、DTにおけるそれらの関連タイプまたは深度に基づいて、再度重み付けすることができる(Hogenboom et al, 2015a)。いくつかの方法は、2つのレベルと4つのレベルとの間で固定された深度のツリーをもたらすように、特定の閾値で談話ツリーを剪定する。他の手法は、入力特徴としての関係タイプに基づいて機械学習分類器をトレーニングする(Hogenboom et al, 2015b)。RDSTにおける感情に関するほとんどの研究は、任意の複雑さの非構造化データを固定長ベクトルで符号化することが事実上不可能であるため、DT構造を数学的により単純な表現にマッピングすることを試みている(Markle-Hus et al 2017)。 Many studies have shown that discourse-related information can successfully improve the performance of sentiment analysis, for example, the importance of EDUs can be reweighted based on their association type or depth in DT (Hogenboom et al, 2015a). Some methods prune the discourse tree at a certain threshold to result in a tree of fixed depth between two and four levels. Other approaches train machine learning classifiers based on relationship types as input features (Hogenboom et al, 2015b). Most studies on emotion in RDSTs attempt to map DT structures to mathematically simpler representations, as it is virtually impossible to encode unstructured data of arbitrary complexity in fixed-length vectors (Markle-Hus et al., 2017).

図37は、一態様による談話ツリーのフラグメントである。図37は、以下のテキストを表す談話ツリー3700を示す。核-衛星関係が、あるエンティティの感情を判断するのに重要であることを示すために、以下の2つの文を用いる:[Although the camera worked well ,][I could not use it because of the viewfinder]、これはカメラについての否定的な感情を表し、;および[The camera worked well ], [although the viewfinder was inconvenient]、これはカメラに関する肯定的な感情を表す。 FIG. 37 is a fragment of a discourse tree according to one aspect. FIG. 37 shows a discourse tree 3700 representing the following text. To show that the nuclear-satellite relationship is important in determining the sentiment of an entity, we use the following two sentences: [Although the camera worked well ,] [I could not use it because of the viewfinder], which expresses negative feelings about the camera; and [The camera worked well ], [although the viewfinder was inconvenient], which expresses positive feelings about the camera.

感情検出の評価のために、我々は、シカゴエリアのホテルの肯定的および否定的、本物および偽の旅行者のレビューのデータセットを使用した。Ott, C. Cardie, and J.T. Hancock. 2013. Negative Deceptive Opinion Spamを参照されたい。In Proceedings of the 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies.文書作成者らは、本物のレビューと偽のレビューとを区別する目的でデータセットをコンパイルする。レビューが偽造であることは論理的論証の存在と強く相関しないことが分かる。Mechanical Turn作業者によって作成された偽のレビューは、実際の旅行者が行うのと同じ方法で文書作成者の意見を後押しする。テストコーパスは、各々1~3パラグラフの400レビューの4つのグループを含む。1)TripAdvisorからの400の真実の肯定的レビュー;2)Mechanical Turkからの400の偽の肯定的レビュー;3)Expedia, Hotels.com, Orbitz, Priceline, TripAdvisor からの400の真実の否定的レビュー、および4)Mechanical Turkからの400の偽の否定的レビュー。 For the emotion detection evaluation, we used a dataset of positive and negative, real and fake traveler reviews of hotels in the Chicago area. See Ott, C. Cardie, and J.T. Hancock. 2013. Negative Deceptive Opinion Spam. In Proceedings of the 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Authors compile datasets with the goal of distinguishing between genuine and fake reviews. It turns out that the fact that a review is fake does not correlate strongly with the presence of a logical argument. Fake reviews created by Mechanical Turn workers support authors' opinions in the same way real travelers do. The test corpus contains four groups of 400 reviews of 1-3 paragraphs each. 1) 400 true positive reviews from TripAdvisor; 2) 400 false positive reviews from Mechanical Turk; 3) 400 true negative reviews from Expedia, Hotels.com, Orbitz, Priceline, TripAdvisor, and 4) 400 false negative reviews from Mechanical Turk.

ベースライン手法として、Stanford NLP Sentimentを用いる。センテンスレベルの極性を取得し、それをパラグラフレベルに集約する。通常、意見が肯定的である場合、文書作成者は自分が好むものを単に列挙する。しかしながら、意見が否定的である場合、多くの場合、文書作成者は、それを後押しし、彼が正しい理由および彼の評価が適切である理由についての比較、説明、論証を実行することを試みるであろう。 As a baseline method, we use Stanford NLP Sentiment. Take the sentence-level polarity and aggregate it to the paragraph level. Usually, when the opinion is positive, the author simply lists what he likes. However, if the opinion is negative, the author will often try to back it up and carry out comparisons, explanations, and arguments as to why he is correct and why his assessment is appropriate.

したがって、デフォルトの感情検出器および議論ベースの感情検出器の統合のルールは、以下の通りである(表10)。このルールは、消費者レビューデータに向けられ、他のテキストジャンルをより良く扱うための修正を必要とするであろう。 Therefore, the rules for the integration of default emotion detectors and argument-based emotion detectors are as follows (Table 10). This rule is directed at consumer review data and will need modification to better handle other text genres.

Figure 2023531345000023
Figure 2023531345000023

以下のケースは、境界線の肯定的レビューであり、容易に反転して否定的になり得る:「Like all hotels in Chicago, this hotel caters to wealthy and/or business clients with very high parking price. However, if you are aware of that prior to arrival, it's not a big deal. It makes sense to find a different place to park the car and bring your own snacks for the room. It would be nice though if hotels such as the Swissotel had a fridge in the room for guest use. Staff was very helpful. Overall, if I can get a good rate again, I'll stay at the Swissotel the next time I am in Chicago.(シカゴのすべてのホテルのように、このホテルは裕福なクライアントおよび/またはビジネスクライアントには非常に高い駐車料金でサービスを提供する。しかし、到着前にそれに気づいているのであれば、それは大きな問題ではない。違う場所を見つけて車を駐車し、部屋に自分の軽食を持参するのが、賢明である。しかしながら、Swissotelなどのホテルが客室に冷蔵庫を持っている場合、それは結構であろう。スタッフは非常に助けになった。全体として、私が再び良い料金を得ることができる場合には、次回シカゴに滞在するときにはSwissotelに滞在するつもりだ。)」このテキストは、DTの観点から全体的に否定的なレビューのように見える。類似のDTを有するほとんどのレビューは否定的である。 The following case is a borderline positive review that could easily be flipped to negative: "Like all hotels in Chicago, this hotel caters to wealthy and/or business clients with very high parking price. However, if you are aware of that prior to arrival, it's not a big deal. It makes sense to find a different place to park the car and bring your own snacks for the room. It would be nice though if hotels such as the Swissotel had a fridge in the room for guest use. Staff was very helpful. Overall, if I can get a good rate again, I'll stay at the Swissotel the next time I am in Chicago. All in all, if I can get a good rate again, I will stay at the Swissotel next time I'm in Chicago." This text looks like an overall negative review from DT's point of view. Most reviews with similar DT are negative.

図38は、一態様による境界線レビューのための談話ツリーを示す。図38は、境界線レビューのための談話ツリー3800を示す。境界線レビューは、談話の観点からは否定的であり、読者の立場からは中立的である。 FIG. 38 illustrates a discourse tree for boundary review, according to one aspect. FIG. 38 shows a discourse tree 3800 for boundary review. The Boundary Review is negative from the point of view of discourse and neutral from the point of view of the reader.

談話に向かう構成性意味論の延長
第1のセンテンスにおける感情が意味論的構成性モデルによってどのように評価されるかを調べる。R. Socher, A. Perelygin, J. Wu, J. Chuang, C.Manning, A. Ng and C. Potts. Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebankを参照されたい。Conference on Empirical Methods in Natural Language Processing(自然言語処理における経験的方法についての会議)(EMNLP 2013)。ここで、「high price(高価格)」が否定的な感情値を有するということは、個々の単語およびそれらの構成で判断すると、理解しにくい。トレーニングのための映画データベースにおいて、「high(高い)」は肯定的な感情を割り当てられ、「high price」は否定的としてタグ付けされない可能性が高い。たとえ「high price」が否定的であると認識されたとしても、「wealthy and/or business clients(裕福なクライアントおよび/またはビジネスクライアント)」というフレーズのように、ツリーの残りがそれにどのように影響を及ぼすかを判断することは困難であろう。映画の領域でも、このフレーズの単語にも適正な感情が割り当てられないことに留意されたい。
Extending Constructive Semantics toward Discourse We examine how sentiment in the first sentence is assessed by the semantic constructive model. See R. Socher, A. Perelygin, J. Wu, J. Chuang, C. Manning, A. Ng and C. Potts. Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank. Conference on Empirical Methods in Natural Language Processing (EMNLP 2013). Here, it is difficult to understand that "high price" has a negative sentiment value, judging by the individual words and their composition. In a movie database for training, 'high' is likely to be assigned a positive sentiment and 'high price' is not tagged as negative. Even if "high price" were perceived to be negative, it would be difficult to determine how the rest of the tree would affect it, such as the phrase "wealthy and/or business clients". Note that neither the words in this phrase are assigned the correct emotion, even in the realm of the movie.

このセンテンスの感情極性を単独で判断することは、それの単語および言い回しを考えると、かなり困難である。代わりに、連続するセンテンスの談話を考慮して、全体的なパラグラフの感情および所与のセンテンスの感情をより高い精度で判断することができる。 Judging the emotional polarity of this sentence in isolation is rather difficult given its words and phrasing. Instead, the discourse of consecutive sentences can be considered to determine the overall paragraph sentiment and the sentiment of a given sentence with greater accuracy.

図39は、一態様による感情分析に対する構成的意味論的手法を示すセンテンスの談話ツリーを示す。図39は、談話ツリー3900を示す。 FIG. 39 shows a discourse tree of sentences illustrating a constructive semantic approach to sentiment analysis according to one aspect. FIG. 39 shows discourse tree 3900 .

我々は、「構成的意味論」洞察から利益を得る感情分析が上記の例において極性感情を正確に割り当てるのは、その分析が捉えるのが、単語「high」(負の感情極性が割り当てられる)、フレーズ「high price」(負の感情極性を伴う)、またはセンテンスレベル構造「Like all ....price」(感情極性を判断するのは困難であり、なぜならば、大局的な感情極性属性についてテキスト全体を読む必要があるためである)のみだけではない場合であろう、と述べる。感情分析は、大局的な極性に基づき、センテンスの個々の要素に依存するのではなく、より興味深いことには、談話レベル構造(マクロ構造)に基づいて、計算される。例えば、「high reliability(高信頼性)」は、「I want a car with high reliability(私は高信頼性車を望む)」という意味では、中立であり、なぜならば、それは、肯定的特性であるが、特定の車を指すものではないからである。 We argue that a sentiment analysis that benefits from 'constructive semantics' insights would correctly assign polar sentiments in the above example if it captures more than just the word 'high' (assigned a negative sentiment polarity), the phrase 'high price' (with a negative sentiment polarity), or the sentence-level construct 'Like all....price' (sentiment polarity is difficult to determine because one needs to read the entire text for global sentiment polarity attributes). state. Sentiment analysis is calculated based on the global polarity and not on the individual elements of the sentence, but more interestingly on the discourse-level structure (macrostructure). For example, "high reliability" is neutral in the sense of "I want a car with high reliability" because it is a positive characteristic but does not refer to a particular car.

結果
感情検出の我々の評価はドメインに依存しないため、ベースラインシステム(Socher et al., 2013)は、テストドメインとは異なるドメインでトレーニングされる。
Results Because our evaluation of emotion detection is domain-independent, the baseline system (Socher et al., 2013) is trained on a different domain than the test domain.

ハイブリッドの構成的意味論および談話分析によって達成された感情分析の結果を表11に示す。第1の行では、我々のデータに対するベースラインシステムの精度を示す。第2の灰色の行では、ハイブリッドシステムによる改善を示す。この改善は、議論の存在が認識された場合にパラグラフレベルで全体的な否定的な感情を発見することによって達成される。これらの場合のうちのいくつかにおいては、否定的な感情は暗黙的であり、個々の単語が否定的な感情を示さない談話構造から間接的にしか検出できない。 Results of sentiment analysis achieved by hybrid constructive semantics and discourse analysis are shown in Table 11. The first row shows the accuracy of the baseline system for our data. The second gray row shows the improvement due to the hybrid system. This improvement is achieved by discovering overall negative sentiment at the paragraph level when the presence of arguments is recognized. In some of these cases, negative sentiment is implicit and can only be detected indirectly from discourse structures in which individual words do not exhibit negative sentiment.

Figure 2023531345000024
Figure 2023531345000024

我々は、様々な表現(行3~行5)を有するスタンドアロンSVM TK感情認識システムを調査する。CDT表現は、パース交錯およびDT表現をよりも性能が優れている。談話レベルの情報を全く考慮しない、より単純な表現では、感情認識精度はかなり低い(図示せず)。 We investigate a standalone SVM TK emotion recognition system with various representations (rows 3-5). The CDT representation outperforms the parse intersection and DT representations. Emotion recognition accuracy is much lower with simpler representations that do not consider discourse-level information at all (not shown).

我々はまた、偽の意見のテキストが本物とは異なる修辞構造を有するかどうかを調査した。Jindal and Liu, Opinion Spam and Analysis, Department of Computer Science, University of Illinois at Chicago, 2008を参照されたい。JindalおよびLiuは、荒し意見スパム:人間の読者によって容易に識別される明白なインスタンス、例えば、広告、質問、および他の無関係なまたは意見のないテキストの検出の問題に対処した。(Ott et al.は、読者を欺くために、本物のように聞こえるように意図的に書かれた、荒し意見スパムなど、潜在的により陰湿なタイプの意見スパムを調査した。M. Ott, Y. Choi, C. Cardie, and J.T. Hancock. 2011. Finding Deceptive Opinion Spam by Any Stretch of the Imaginationを参照のこと。計算言語学会第49回年次総会の議事録:人間の言語技術。偽のレビューは、Amazon Mechanical Turkの作業者によって書かれた。指示書は、作業者に、彼らがホテルのマーケティング部門によって雇われると仮定し、彼らが旅行レビューウェブサイトに投稿される偽のレビューを(あたかも彼らが顧客であるかのように)書くように依頼されるふりをするよう依頼され;さらには、レビューは、現実的に聞こえ、ホテルを前向きに描く必要がある。否定的レビューの要求も同様に行われる。 We also investigated whether fake opinion texts have a different rhetorical structure than the real ones. See Jindal and Liu, Opinion Spam and Analysis, Department of Computer Science, University of Illinois at Chicago, 2008. Jindal and Liu addressed the problem of troll spam: detection of obvious instances that are easily identified by human readers, such as advertisements, questions, and other irrelevant or opinionless text. (Ott et al. investigated potentially more insidious types of opinion spam, such as rant spam, intentionally written to sound like the real thing to deceive readers. See M. Ott, Y. Choi, C. Cardie, and J.T. Hancock. 2011. Finding Deceptive Opinion Spam by Any Stretch of the Imagination. Proceedings of the 49th Annual Meeting of the Society for Computational Linguistics: Human Language Technology. , written by workers at Amazon Mechanical Turk.The instructions assume that they are hired by a hotel's marketing department and are asked to pretend they are being asked to write a fake review (as if they were a customer) posted on a travel review website;

我々のSVM TKシステムは90%の性能を達成しなかったが、偽のレビューテキストを検出するタスクは、汎用のテキスト分類システムによって実行され(76~77%の精度で、2つの下の灰色の行)、これは論証を抽出し、感情の極性を評価する。 Although our SVM TK system did not achieve 90% performance, the task of detecting fake review text was performed by a general-purpose text classification system (76-77% accuracy, two bottom gray rows), which extracts arguments and assesses sentiment polarity.

論証の検証
本開示の態様は、議論を検証する。説得力があるようにするために、テキストまたは発話は有効な論証を含む。アプリケーション102は、テキストの本体から議論構造を抽出し、その議論を、コミュニケーション用談話ツリー(CDT)を介して表す。その後、アプリケーション102は、テキスト内の主張またはターゲットの主張が有効である、すなわち、他の主張によって論理的に攻撃されず、外部真理、すなわち、ルールと整合していることを検証することができる。ドメイン知識を用いて、主張の有効性を検証することができる。しかしながら、場合によっては、ドメイン知識が利用不可能である場合があり、書き込みスタイルおよび書き込み論理等の他のドメイン独立情報が用いられる。
Verification of the Argument Aspects of this disclosure verify the argument. To be persuasive, the text or speech contains valid arguments. Application 102 extracts the argument structure from the body of the text and presents the argument via a communicative discourse tree (CDT). The application 102 can then verify that the assertion in the text or the target assertion is valid, i.e., not logically attacked by other assertions, and consistent with external truths, i.e. rules. Domain knowledge can be used to verify the validity of claims. However, in some cases, domain knowledge may not be available and other domain independent information such as writing style and writing logic is used.

いくつかの態様は、顧客関係管理(CRM)などのアプリケーションを可能にする。CRMは、顧客の苦情を取り扱うことに対処する(Galitsky and de la Rosa 2011)。顧客の苦情では、文書作成者は、彼らが受け取った製品またはサービス、および顧客サポートによって問題がどのように伝えられたかについて動揺している。苦情者は、しばしば、非常に強い感情的な言語で苦情を書くが、これは、議論の論理を歪め、したがって、苦情の妥当性の判断を困難にする可能性がある。情緒的および論理的議論の両方が多用される。 Some aspects enable applications such as customer relationship management (CRM). CRM deals with handling customer complaints (Galitsky and de la Rosa 2011). In customer complaints, the writer is upset about the product or service they received and how the problem was communicated by customer support. Complainants often write their complaints in very strong emotional language, which can skew the logic of the argument and thus make it difficult to judge the validity of the complaint. Both emotional and logical arguments are heavily used.

改善された自律エージェントを容易にするために、いくつかの態様は、言語学ベースである論証マイニングと、論理ベースである論証の論理的検証とを用いる。議論スキームを自動的に識別する概念は、(Walton et al., 2008)において最初に論じられた。Ghosh et al. (2014)は、特定のタイプの通信-オンライン対話スレッドの議論談話構造を調査している。テキストにおいて議論を識別することは、ウェブ上の真実、誤情報、および偽情報を識別する問題につながる(Pendyala and Figueira, 2015, Galitsky 2015, Pisarevskaya et al 2015)。(Lawrence and Reed, 2015)では、3つのタイプの論証構造識別、すなわち、言語学的特徴、トピック変化および機械学習が組み合わされる。本明細書でさらに説明するように、いくつかの態様は、コミュニケーション用談話ツリーと併せて撤回可能論理プログラミング(Defeasible Logic Programming)(DeLP)(Garcia and Simari, 2004; Alsinet et al., 2008)を採用する。 To facilitate improved autonomous agents, some aspects employ linguistic-based argument mining and logic-based logical verification of arguments. The concept of automatically identifying argumentation schemes was first discussed in (Walton et al., 2008). Ghosh et al. (2014) investigate the discussion discourse structure of specific types of communication-online dialogue threads. Identifying arguments in text leads to problems identifying truth, misinformation, and disinformation on the web (Pendyala and Figueira, 2015, Galitsky 2015, Pisarevskaya et al 2015). (Lawrence and Reed, 2015) combine three types of argumentative structure identification: linguistic features, topic change and machine learning. As further described herein, some aspects employ Defeasible Logic Programming (DeLP) (Garcia and Simari, 2004; Alsinet et al., 2008) in conjunction with discourse trees for communication.

図40は、一態様による論証を検証するための例示的なプロセス4000を示す。アプリケーション102は、プロセス4000を実行することができる。 FIG. 40 illustrates an example process 4000 for validating an argument according to one aspect. Application 102 may execute process 4000 .

ブロック4001において、プロセス4000は、フラグメントを含むテキストにアクセスすることを含む。ブロック4001において、プロセス4000は、プロセス3600のブロック3601で説明したものと実質的に同様のステップを実行する。テキストは、パラグラフ、センテンス、発話、または他のテキストであり得る入力テキスト130を含むことができる。 At block 4001, process 4000 includes accessing text containing fragments. At block 4001 , process 4000 performs steps substantially similar to those described at block 3601 of process 3600 . The text may include input text 130, which may be paragraphs, sentences, utterances, or other text.

ブロック4002において、プロセス4000は、テキストからコミュニケーション用談話ツリーを作成し、議論を検出するようにトレーニングされた分類モデルをコミュニケーション用談話ツリーに適用することによって、テキストのサブセットにおいて議論の存在を識別することを含む。ブロック4002において、プロセス4000は、プロセス3600のブロック3602~3604で説明したものと実質的に同様のステップを実行する。他の議論検出方法を用いることができる。 At block 4002, the process 4000 includes identifying the presence of arguments in a subset of the texts by creating a communicative discourse tree from the text and applying a classification model trained to detect arguments to the communicative discourse tree. At block 4002 , process 4000 performs steps substantially similar to those described in blocks 3602 - 3604 of process 3600 . Other discussion detection methods can be used.

ブロック4003で、プロセス4000は、論理システムを用いることによって議論を評価することを含む。アプリケーション102は、異なるタイプの論理システムを用いて、議論を評価することができる。例えば、撤回可能論理プログラミング(DeLP)を用いることができる。図42は、ブロック4003を実現することができる例示的な動作を示す。例示目的で、プロセス4000は、図41に関して説明される。 At block 4003, process 4000 includes evaluating arguments by using a logic system. Applications 102 can evaluate arguments using different types of logic systems. For example, Retractable Logic Programming (DeLP) can be used. FIG. 42 illustrates example operations by which block 4003 may be implemented. For illustrative purposes, process 4000 is described with respect to FIG.

図41は、一態様による論証の例示的なコミュニケーション用談話ツリーを示す。図41は、コミュニケーション用談話ツリー4101を含む。コミュニケーション用談話ツリー4101は、ノード4120および他のノードを含み、それらのいくつかは、コミュニケーション行動4110~4117でラベル付けされる。 FIG. 41 illustrates an exemplary communicative discourse tree for an argument according to one aspect. FIG. 41 includes discourse tree 4101 for communication. Communicative discourse tree 4101 includes node 4120 and other nodes, some of which are labeled communicative behaviors 4110-4117.

ある例では、裁判官は、退去事例を審理し、賃料が立証可能に支払われたか(預けられたか)否か(rent_receipt(賃料受領)として示される)の判断をしたい。入力は、被告人が自身のポイントを表現しているテキストである。CDT4101は、以下のテキストを表す:"The landlord contacted me, the tenant, and the rent was requested.However, I refused the rent since I demanded repair to be done.I reminded the landlord about necessary repairs, but the landlord issued the three-day notice confirming that the rent was overdue.Regretfully, the property still stayed unrepaired."
図42は、一態様による、撤回可能論理プログラミングを用いて論証を検証するための例示的な方法を示す。撤回可能論理プログラミング(DeLP)は、事実のセット、(A:-B)の形式の絶対規則Π、およびA-<Bの形式の撤回可能規則Δのセットであり、その意図される意味は、「Bが当てはまる場合、通常はAも当てはまる」である。P=(Π,Δ)をDeLPプログラムとし、Lを基礎リテラルとする。絶対規則は、意見に基づいていても、変更できない。対照的に、撤回可能規則は、場合によっては偽であり得る。
In one example, a judge hears an eviction case and wants to determine whether rent was verifiably paid (deposited) or not (denoted as rent_receipt). The input is text in which the defendant expresses his point. CDT4101 represents the following text: "The landlord contacted me, the tenant, and the rent was requested.However, I refused the rent since I demanded repair to be done.I reminded the landlord about necessary repairs, but the landlord issued the three-day notice confirming that the rent was overdue.Regretfully, the property still stayed unrepaired."
FIG. 42 illustrates an exemplary method for validating arguments using reversible logic programming, according to one aspect. Retractable Logic Programming (DeLP) is a set of facts, absolute rules Π of the form (A:-B), and sets of reversible rules Δ of the form A-<B, whose intended meaning is "if B applies, usually A also applies". Let P=(Π,Δ) be a DeLP program and L be a base literal. Absolute rules, even if based on opinion, cannot be changed. In contrast, revocable rules can be false in some cases.

上記の例において、下線を引いた単語はDeLPにおいて節を形成し、他の表現は事実を形成することができる。事実の一例は、「rent_refused」、すなわち、家主が賃料を拒否したことである。絶対規則の一例は、「地球は平らである」である。撤回可能規則の一例は、「rent_receipt -< rent_deposit_transaction」であり、これは、通常、「rent_deposit_transaction(賃料入金処理)」 であれば、"rent_receipt" (賃料は受領された)を意味する。しかし、例えば、賃料が間違った口座に入金されるかまたは銀行にエラーがある場合、撤回可能規則は常に真ではないかもしれない。 In the example above, the underlined words form clauses in DeLP, and other expressions can form facts. An example of a fact is "rent_refused", ie the landlord refused the rent. An example of an absolute rule is "the earth is flat". An example of a revocable rule is "rent_receipt -< rent_deposit_transaction", which usually means "rent_receipt" if "rent_deposit_transaction". However, the reversibility rule may not always be true if, for example, the rent is credited to the wrong account or there is an error with the bank.

アプリケーション102は、DeLPに対する入力として、ブロック4002で創出されたコミュニケーション用談話ツリーからの結果を用いることができる。コミュニケーション用談話ツリーは、事実が撤回可能規則によってどのように相互接続されるかなどの貴重な情報を示す。修辞関係タイプ「対比」であるCDTの基本的談話単位およびタイプ「不一致」であるコミュニケーション行動は、撤回可能規則を示す。 Application 102 can use the results from the communicative discourse tree created in block 4002 as input to DeLP. A communicative discourse tree shows valuable information such as how facts are interconnected by revocable rules. CDT basic discourse units of rhetorical relation type "contrast" and communicative behaviors of type "disagree" indicate retractable rules.

ブロック4201において、方法4200は、論理システムの固定部分を作成することを含む。論理システムの固定部分は、1つ以上の主張項および1つ以上のドメイン定義節を含む。ドメイン定義節は、テキストのドメインに関連付けられ、特定のドメインにおける法的、科学的用語、および常識的知識を含むことができる。科学的な例としては、「物体が加速度で動いている場合、物理的な力を受ける」というものがある。家主-入居者法の分野では、標準的な定義の一例は、「修理が行われた場合->家屋は居住可能であり、器具は稼働している」である。 At block 4201, method 4200 includes creating a fixed portion of the logical system. A fixed part of a logical system includes one or more claim clauses and one or more domain definition clauses. A domain definition clause is associated with a domain of text and can include legal, scientific terms, and common sense knowledge in a particular domain. A scientific example is that if an object is moving with acceleration, it experiences a physical force. In the area of landlord-tenant law, an example of a standard definition is "if repairs are made -> house is habitable and appliances are in working order".

上記の例を続けると、テキストは、評価されるべきターゲットの主張「rent_receipt」、すなわち、「賃料は受け取られたか?」を含む。アプリケーション102はまた、テキスト「refused the rent since I demanded repair to be done.」から以下の節「repair_is_done -< rent_refused」を抽出する。 Continuing the above example, the text contains the target claim "rent_receipt" to be evaluated, ie, "Has the rent been received?" Application 102 also extracts the following clause "repair_is_done -< rent_refused" from the text "refused the rent since I demanded repair to be done."

ブロック4202において、方法4200は、撤回可能規則のセットおよび事実のセットを判断することによって論理システムの可変部分を作成することを含む。アプリケーション102は、コミュニケーション用談話ツリーから、(i)修辞関係タイプ対比である基本談話単位および(ii)クラスタイプ不同意であるコミュニケーション行動のうちの1つ以上を抽出することによって、コミュニケーション用談話ツリーから、撤回可能規則のセットを決定する。クラス不同意は、「否定する」、「異なる意見を有する」、「信じない」、「信じることを拒否する」、「矛盾する」、「それる」、「逸脱する」、「逆らう」、「異なる」、「意義がある」、「非類似である」などの行動を含む。他の例も可能である。 At block 4202, method 4200 includes creating a variable portion of the logical system by determining a set of revocable rules and a set of facts. Application 102 determines a set of retractable rules from the communicative discourse tree by extracting from the communicative discourse tree one or more of (i) basic discourse units that are rhetorical relation type contrasts and (ii) communicative behaviors that are class type disagreeable. Class disagreements include actions such as "deny", "disagree", "disbelieve", "refusing to believe", "contradict", "deviate", "deviate", "contrary", "differ", "significant", "dissimilar". Other examples are possible.

アプリケーション102は、以下の撤回可能規則を判断する。 Application 102 determines the following revocable rules.

Figure 2023531345000025
Figure 2023531345000025

加えて、アプリケーション102は、タイプ「不同意」であるコミュニケーション行動から追加の事実を判断する。この例を続けると、図41に戻って参照すると、アプリケーション102は、CDTのコミュニケーション行動の対象から以下の事実を判断する: contact_tenant (コミュニケーション行動 4111), rent_is_requested (コミュニケーション行動 4112), rent_refused (コミュニケーション行動 4113), stay_unrepaired (コミュニケーション行動 4114), remind_about_repair (コミュニケーション行動 4115), three_days_notice_is_issued (コミュニケーション行動 4116)、および rent_is_overdue (コミュニケーション行動 4117)。 In addition, application 102 determines additional facts from communication behavior that is of type "disagree." Continuing with this example and referring back to FIG. 41, application 102 determines the following facts from the CDT's communication behavior objects: contact_tenant (communication behavior 4111), rent_is_requested (communication behavior 4112), rent_refused (communication behavior 4113), stay_unrepaired (communication behavior 4114), remind_about_repair (communication behavior 4115), three_days_notice_is. _issued (communication behavior 4116), and rent_is_overdue (communication behavior 4117).

ブロック4203で、方法4200は、撤回可能な規則のセットから、矛盾しない撤回可能規則のセットを含む撤回可能導出を判断することを含む。PからのLの撤回可能導出は、基礎リテラルの有限列L,L,...L=Lからなり、各リテラルLはその列内にあり、なぜならば、(a)LはΠにおける事実であるか、または(b)Pには規則R(絶対または撤回可能)が存在し、ヘッドLおよびボディB,B,...Bを伴い、ボディのすべてのリテラルは、L(j<i)の前に現れる列の要素Lであるからである。hをリテラルとし、P=(Π,Δ)をDeLPプログラムとする。<A,h>はhに対する論証であり、AがΔの撤回可能規則のセットである場合、
1.=(Π∪A)からhについて撤回可能導出が存在し、
2.セット(Π∪A)は矛盾しておらず、
3.Aは最小であり、条件(1)および(2)を満たす、Aの適切なサブセットAはない。
At block 4203, the method 4200 includes determining, from the set of revocable rules, revocable derivations that include a set of non-conflicting revocable rules. A revocable derivation of L from P consists of a finite sequence L 1 , L 2 , . , L j ( j < i ) . Let h be a literal and P=(Π,Δ) be a DeLP program. If <A,h> is an argument for h and A is the set of reversible rules of Δ, then
1. There exists a reversible derivation for h from =(Π∪A),
2. The set (Π∪A) is not contradictory and
3. A is the smallest and there is no suitable subset A 0 of A that satisfies conditions (1) and (2).

したがって、論証<A,h>は、プログラムPに関連付けられる所与のリテラルhについて撤回可能導出から得られる、撤回可能規則の最小の矛盾しないセットである。上述したように、最小サブセットは、条件1および2を満たすサブセットは存在しないことを意味する。 Thus, the argument <A,h> is the minimal consistent set of reversible rules resulting from reversible derivation for a given literal h associated with program P. As mentioned above, minimal subset means that there is no subset that satisfies conditions 1 and 2.

ブロック4204において、方法4200は、事実のセットから1つ以上の反論を作成することを含む。反論は、人間の対話の場合のように、他の論証によって攻撃され得る順番にあり得る論証である。議論ラインは、論証のシーケンスであり、シーケンス内の各要素は、その先行要素を覆す。DeLPの場合、(同じ論証を2回繰り返すことによる循環推論などの)謬論を回避するために、議論ラインについていくつかの許容性要件がある。 At block 4204, the method 4200 includes creating one or more rebuttals from the set of facts. Counter-arguments are possible arguments in order that can be attacked by other arguments, as in human dialogue. An argument line is a sequence of arguments in which each element in the sequence overrules its predecessor. For DeLP, there are some admissibility requirements for argument lines to avoid fallacies (such as circular reasoning by repeating the same argument twice).

反論は、以下のように形成することができる。例えば、論証<A,h>が<A,h>を攻撃するのは、<A,h>の下位論証<A,h>が存在し(A⊆A)、hおよびhは矛盾する(すなわち、Π∪{h,h}は相補的なリテラルを導出する)場合およびその場合に限ってである。我々は、<A,h>が<A,h>を覆すのは、<A,h>が<A,h>を下位論証<A,h>で攻撃し、<A,h>が<A,h>よりも厳密に好まれる(かまたはそれに匹敵しない)場合である、と言うことになる。第1のケースでは、<A,h>を適切な反論(proper defeater)と呼び、第2のケースでは、阻止反論(blocking defeater)と呼ぶ。 A counter-argument can be formulated as follows. For example, an argument <A 1 ,h 1 > attacks <A 2 ,h 2 > if and only if there is a subargument <A,h> of <A 2 ,h 2 > (A⊆A 1 ) and h and hi contradict (i.e., Π∪{h, hi } derives complementary literals). We would say that <A 1 ,h 1 > overrules <A 2 ,h 2 > if <A 1 ,h 1 > attacks <A 2 ,h 2 > with subarguments <A,h> such that <A 1 ,h 1 > is strictly preferred (or not comparable) to <A,h>. In the first case, <A 1 , h 1 > is called a proper defeater, and in the second case a blocking defeater.

ブロック4205において、方法4200は、撤回可能導出から、論証を表すルートノードと反論を表すリーフノードとを含む弁証法的ツリーを構築することを含む。ターゲットの主張は、所与のクエリに対するすべての可能な議論ラインを包含する弁証法的ツリーに関して解決されるDeLPクエリと考えることができる。弁証法的ツリーの定義は、ユーザの主張における暗黙的な自己攻撃関係を発見するためのアルゴリズム的見解を我々に提供する。<A,h>をプログラムPからの論証(ターゲットの主張)とする。説明のために、ブロック4205について、図43に関して説明する。 At block 4205, the method 4200 includes building a dialectical tree including root nodes representing arguments and leaf nodes representing rebuttals from the retractable derivations. A target claim can be thought of as a DeLP query resolved with respect to a dialectical tree containing all possible lines of argument for a given query. The definition of a dialectical tree provides us with an algorithmic view for discovering implicit self-aggressive relationships in user assertions. Let <A 0 , h 0 > be an argument from program P (target assertion). For purposes of explanation, block 4205 is described with respect to FIG.

図43は、一態様による例示的な弁証法的ツリーを示す図である。図43は、上記で開発されたテキストのための弁証法的ツリーを描写する。図43は、ルートノード4301およびノード4302~4307を含む弁証法的ツリー4300を含む。弁証法的ツリー4300は、<A,h>に基づき、それは、以下のように定義される:
1.ツリーのルート(ルートノード4301)は、<A,h>でラベル付けされる。
2.Nを、<A,h>とラベル付けされる非ルート頂点とし、Λ=[<A,h>,<A,h>,…<A,h>](ルートからNまでの経路のラベルのシーケンス)。[<B,q>,<B,q>,…<B,q>]すべてに、<A,h>を攻撃させる。許容可能な議論ライン[Λ,<B,q>]を有する各攻撃者<B,q>について、Nとその子Nとの間に弧を有する。
FIG. 43 is a diagram illustrating an exemplary dialectical tree according to one aspect. Figure 43 depicts the dialectical tree for the text developed above. FIG. 43 includes a dialectical tree 4300 that includes a root node 4301 and nodes 4302-4307. The dialectical tree 4300 is based on <A 0 , h 0 > , which is defined as follows:
1. The root of the tree (root node 4301) is labeled with <A 0 ,h 0 > .
2. Let N be a non- root vertex labeled <A n , h n > , and let Λ=[ <A 0 , h 0 > , <A 1 , h 1 > , . Let all [<B 0 , q 0 >, <B 1 , q 1 >, . . . <B k , q k >] attack <A n , h n > . For each attacker <B i , q i > with an acceptable line of argument [Λ, <B i , q i >], we have an arc between N and its child N 1 .

次いで、弁証法的ツリーに対するラベル付けを以下のように行うことができる:
1.すべてのリーフ(ノード4302~4307)は、Uノード(論駁されないノード)としてラベル付けされる。
2.任意の内部ノードは、それの関連付けられる子ノードのすべてがDノードとしてラベル付けされるときはいつでもUノードとしてラベル付けされる。
3.任意の内部ノードは、それの関連付けられる子ノードの少なくとも1つがUノードとしてラベル付けされるときはいつでもDノードとしてラベル付けされる。
Labeling for the dialectical tree can then be done as follows:
1. All leaves (nodes 4302-4307) are labeled as U nodes (unrefuted nodes).
2. Any interior node is labeled as a U node whenever all of its associated child nodes are labeled as D nodes.
3. Any interior node is labeled as a D node whenever at least one of its associated child nodes is labeled as a U node.

ブロック4206において、方法4200は、反論を再帰的に評価することによって弁証法的ツリーを評価することを含む。 At block 4206, the method 4200 includes evaluating the dialectical tree by recursively evaluating the objections.

DeLPの例では、リテラルrent_receiptは、<A, rent_receipt> = <{ (rent_receipt -< rent_deposit_transaction), (rent_deposit_transaction -< tenant_short_on_money)}, rent_receipt>によってサポートされ、それについて、3つの反論が、3つのそれぞれの議論ラインとともに、存在する: In the DeLP example, the literal rent_receipt is supported by <A, rent_receipt> = <{ (rent_receipt -< rent_deposit_transaction), (rent_deposit_transaction -< tenant_short_on_money)}, rent_receipt>, for which there are three objections, with three respective lines of argument:

Figure 2023531345000026
Figure 2023531345000026

(1)および(2)は適正な反論であり、最後のものは阻止反論である。第1の論証構造は、反論証、<{rent_deposit_transaction -< tenant_short_on_money}, rent_deposit_transaction),を有するが、それは反論ではなく、なぜならば、前者の方がより具体的であるからである。したがって、反論は存在せず、そこで議論ラインはそこで終了する。 (1) and (2) are proper rebuttals and the last one is a blocking rebuttal. The first argumentation structure has a counterargument, <{rent_deposit_transaction -<tenant_short_on_money}, rent_deposit_transaction), which is not a counterargument, because the former is more specific. Therefore, there is no counter-argument and the argument line ends there.

上記のBは、阻止反論<{(rent_deposit_transaction -< tenant_short_on_money)}, rent_deposit_transaction>であり、それは、<A, rent_receipt>の不同意下位論証であり、導入することはできず、なぜならば、それは許容できない議論ラインを生じさせるからである。Bは、導入することができる2つの反論を有し: B3 above is the blocking objection <{(rent_deposit_transaction -<tenant_short_on_money)}, rent_deposit_transaction>, which is a dissenting subargument of <A, rent_receipt> and cannot be introduced because it creates an unacceptable line of argument. B2 has two objections that can be introduced:

Figure 2023531345000027
Figure 2023531345000027

およびCは阻止反論を有するが、議論ラインを許容できないものにするので、導入することはできない。したがって、リテラルrent_receiptをサポートする論証は保証されないので、状態rent_receiptに到達することはできない。 D 1 and C 2 have blocking objections, but cannot be introduced as they render the argument line unacceptable. Therefore, the state rent_receipt cannot be reached, since no arguments are guaranteed to support the literal rent_receipt.

ブロック4207において、方法4200は、反論のいずれも撤回可能導出と矛盾しないと判定することに応答して、論証によってサポートされる主張を有効として識別することを伴う。矛盾する論証が存在しないという判定は、主張が有効であることを示し、矛盾する論証が存在するという判定は、主張が無効であることを示す。次いで、修辞学的分類102は、主張の有効性に基づいてユーザデバイスに異なる回答を提供するなど、検証に基づいて行動を実行することができる。 At block 4207, method 4200 entails identifying as valid the argument supported by the argument in response to determining that none of the counterarguments are inconsistent with the reversible derivation. A determination that there are no conflicting arguments indicates that the assertion is valid, and a determination that there are conflicting arguments indicates that the assertion is invalid. The rhetorical classifier 102 can then take action based on the verification, such as providing different answers to the user device based on the validity of the assertion.

論証検証結果
論証検証は、論証検出(言語学的手段による)、次いで検証(論理的手段)に基づいて評価される。Landlord vs Tenant (2018) からかき集めた623の法的事例のデータセットが形成される。毎年、このウェブサイトは、最近の家主対入居者の裁判事例および機関判決の700を超える要約を提供する。Landlord v. Tenantは、ニューヨーク市民事裁判所、ニューヨーク市住宅および地域社会再開発部門(DHCR)、ニューヨーク市環境管理委員会等を含む十数を越える裁判所および機関をカバーする。このウェブサイトは、ユーザが、1993年まで遡る事例のそれらの動的データベース、およびニューヨークLandlord v. Tenant ニュースレターアーカイブに対するアクセスを得、ならびに指定された事例の概要の検索を実行することを可能にする。判決全文および意見書簡も、このソースから入手可能である。
Argumentary Verification Results Argumentative verification is evaluated based on argumentation detection (by linguistic means) and then verification (logical means). A dataset of 623 legal cases scraped from Landlord vs Tenant (2018) is formed. Each year, this website provides summaries of over 700 recent landlord-tenant court cases and agency decisions. Landlord v. Tenant covers over a dozen courts and agencies, including the New York Civil Court, the New York City Department of Housing and Community Redevelopment (DHCR), the New York City Environmental Board of Trustees, and others. This website allows users to gain access to their dynamic database of cases dating back to 1993, as well as the New York Landlord v. Tenant Newsletter Archive, and to perform searches of specified case summaries. The full judgment and comments are also available from this source.

ある典型的な事例要約は、以下の通りである:"Tenants complained of a reduction in building-wide services. They said that the building super didn't make needed repairs as requested and that landlord had refused to perform repairs in their apartment. They also complained about building accessibility issues. Among other things, the building side door walkway was reconstructed and made narrower. This made it hard to navigate a wheelchair through that doorway. The DRA ruled against tenants, who appealed and lost."(入居者らは、建物全体にわたるのサービスの減少について訴えた。入居者らは、建物の管理人が要求通りに必要とされる修理をしなかったこと、および家主が入居者らのアパートにおいて修理を行うことを拒否したことを述べた。入居者らは、建物へのアクセス性の問題についても訴えた。とりわけ、建物側方扉通路が改造され、狭くされた。これは、その出入口を通って車椅子を通過させることを困難にした。DRAは、入居者の敗訴とし、入居者は控訴したが、敗訴した。)第1に、我々は、議論を含むセンテンスを抽出し、次いで、DeLPオントロジーから伝えられている主張を見つけようと試みる。上記の例において検証されるべき主張は、repair_is_done(修復が行われる)ことである。我々は、次いで、この主張を検証に供する。我々は、rent_reduction_denied(賃料減額拒否)などの、事例を審理した裁判官によって割り当てられた、ウェブページ上のタグから、主張有効性値を取得する。以下の表12は、家主対入居者事例テキストにおいて議論とともに伝えられている評価結果を示す。 A typical case summary reads: "Tenants complained of a reduction in building-wide services. They said that the building super didn't make needed repairs as requested and that landlord had refused to perform repairs in their apartment. They also complained about building accessibility issues. Among other things, the building side door walkway was reconstructed and made narrower. This made it hard to navigate a wheelchair through that doorway. The DRA ruled against tenants, who appealed and lost." Tenants complained of reduced services.The tenants stated that the building manager did not make the necessary repairs as requested, and that the landlord refused to make repairs in their apartments.The residents also complained of accessibility problems to the building.In particular, the side door passages of the building were modified and narrowed.This made it difficult to pass a wheelchair through the doorway.The DRA dismissed the resident's complaint, and the resident appealed but lost.Firstly, We extract sentences containing arguments and then try to find the assertions conveyed from the DeLP ontology. The assertion to be verified in the above example is that repair_is_done. We then test this claim. We get claim validity values from tags on the web page assigned by the judge who heard the case, such as rent_reduction_denied. Table 12 below shows the evaluation results conveyed along with the discussion in the landlord-tenant case text.

Figure 2023531345000028
Figure 2023531345000028

論証検出タスクについて、我々は、この家主対入居者を陽性トレーニングセットとして用いる。陰性データセットとして、議論も意見データも含んではならない様々なテキストソースを用いる。我々は、Wikipedia、事実ニュース源、および、['tells']、ソフトウェアの使用方法の指示;['tele']、ハードウェアの使用方法の指示、および[news]、客観的で独立した様式でのニュース記事の提示などのようなコーパスのセクションを含む(Lee, 2001) データセットの構成要素も使用した。陰性の、議論のないデータセットに関するさらなる詳細は、(Galitsky et al 2018 and Chapter 10)において入手可能である。 For the argumentation detection task, we use this landlord vs. tenant as the positive training set. As negative data sets, we use various text sources that should not contain argumentative or opinion data. We also used components of the dataset (Lee, 2001), including Wikipedia, factual news sources, and sections of the corpus such as ['tells'], instructions on how to use software; ['tele'], instructions on how to use hardware, and [news], presentation of news articles in an objective and independent manner. Further details on the negative, non-controversial data set are available in (Galitsky et al 2018 and Chapter 10).

ベースライン論証検出手法は、キーワードおよび構文的特徴に依拠して議論を検出する(表13.8)。しばしば、コミュニケーション行動の調整されたペア(したがって、少なくとも一方は、反対者に関連する負の感情極性を有する)は、論理的議論が存在するというヒントである。このナイーブな手法は、トップ性能のTK学習CDT手法よりも29%劣っている。CDTのSVM TKは、議論検出について頻繁に冗長であるノイズのある構文データに起因して、RST+CAおよびRST+全パースツリー(Galitsky, 2017)のSVM TKよりも約5%優れている。 The baseline argument detection approach relies on keywords and syntactic features to detect arguments (Table 13.8). Often a coordinated pair of communicative behaviors (thus at least one having a negative emotional polarity associated with the opponent) is a hint that a logical argument exists. This naive approach is 29% worse than the top performing TK-learned CDT approach. The SVM TK of CDT outperforms the SVM TK of RST+CA and RST+full partree (Galitsky, 2017) by about 5% due to noisy syntactic data that is frequently redundant for argument detection.

SVM TK手法は、許容可能なF尺度を提供するが、感情的論証識別問題がどのように正確に解かれるかを説明するのには役立たず、最終スコアリングおよびクラスラベルのみを与える。最近傍最大共通部分グラフアルゴリズムは、この点においてはるかにより有益である (Galitsky et al., 2015)。下の2つの行を比較すると、CAなしで感情的論証を表現することは可能ではあるが、稀であることが観察される。 The SVM TK approach provides an acceptable F-measure, but does not help explain how the emotional argumentation identification problem is solved exactly, giving only the final scoring and class labels. The nearest neighbor maximum common subgraph algorithm is much more informative in this regard (Galitsky et al., 2015). Comparing the bottom two rows, we observe that it is possible, but rare, to express emotional arguments without CA.

テキストから抽出された論理的論証を評価すると、我々は、ある文書作成者が、無効で、一貫性のない、自己矛盾するケースを提供するケースに関心を持った。これは、顧客の保持に焦点を当て、顧客との通信を容易にするCRMシステムのフロントエンドとしてのチャットボットにとって重要である (Galitsky et al., 2009)。住居不動産の苦情のドメインを選択し、このドメインについてDeLPシソーラスを構築した。自動化された苦情処理システムは、例えば、財産管理会社にとって、意思決定支援手順において必須であり得る(Constantinos et al., 2003)。 Evaluating the logical arguments extracted from the text, we were concerned with cases where one author provided an invalid, inconsistent, and self-contradictory case. This is important for chatbots as a front-end to CRM systems that focus on customer retention and facilitate customer communication (Galitsky et al., 2009). A domain of residential real estate complaints was selected and a DeLP thesaurus was constructed for this domain. Automated grievance systems can be essential in decision support procedures, for example for property management companies (Constantinos et al., 2003).

Figure 2023531345000029
Figure 2023531345000029

我々の妥当性評価では、我々は、compensation_required, proceed_with_eviction, rent_receipt(必要とされる補償、退去に進む、賃料受領)など、所与の苦情がどのように対処される必要があるかに関する目標特徴に焦点を当てる。 In our plausibility assessment, we focus on target features regarding how a given complaint needs to be addressed, such as compensation_required, proceed_with_eviction, rent_receipt.

妥当性評価結果を表13に示す。第1行および第2行には、それぞれ、対比などの単一の修辞関係および抽出された議論攻撃関係を示す単一のCAを伴う最も単純な苦情の結果を示す。第3および第4の行では、対応して、2つの非デフォルト修辞関係および不同意タイプの2つのCAを伴う法的事例についての検証結果を示す。第5行では、平均的な複雑さの苦情を評価し、最下行では、それらのCDTに関して、最も複雑で、より長い苦情を評価する。第3列は、スタンドアロンの論証検証システムにおける苦情における無効議論の検出精度を示す。最後に、第4列は、統合された議論抽出および検証システムの精度を示す。 Validity evaluation results are shown in Table 13. The first and second rows show the results of the simplest complaint with a single CA indicating a single rhetorical relation such as contrast and an extracted argument-aggressive relation, respectively. In the third and fourth rows, correspondingly, we show the verification results for legal cases with two non-default rhetorical relations and two CAs of disagreement type. Row 5 evaluates complaints of average complexity, and the bottom row evaluates the most complex and longer complaints for their CDT. The third column shows the detection accuracy of invalid arguments in complaints in the stand-alone argumentation verification system. Finally, the fourth column shows the accuracy of the integrated argument extraction and verification system.

我々の妥当性評価では、我々は、compensation_required, proceed_with_eviction, rent_receipt(必要とされる補償、退去に進む、賃料受領)など、どのような種類の裁断が発行される必要があるかに関する目標特徴(主張)に焦点を当てる。システム決定は、識別された主張が妥当と認められるか否かによって決定され、妥当と認められる場合、裁断はこの主張を支持し、妥当と認められない場合、この主張に反して決定する。 In our plausibility assessment, we focus on target features (claims) about what kind of eviction needs to be issued, such as compensation_required, proceed_with_eviction, rent_receipt. A system decision is determined by whether an identified claim is plausible, and if plausible, the ruling upholds this claim, and if not plausible, decides against it.

これらの結果において、大多数の場合においては、主張の無効性は自滅以外の要因によるものであるため、再現度は低い。論証における論理的欠陥が確立される場合、議論以外の他の要因(誤った事実など)も寄与するため、主張全体が無効である可能性が高いため、精度は比較的高い。苦情およびその談話ツリーの複雑さが増すにつれて、F1は、最初に、より多くの論理項が利用可能であるため改善し、次いで、より雑音の多い入力による、より高い推論誤差の機会があるため、低下する。 In these results, the reproducibility is low because in the majority of cases the invalidity of the claims is due to factors other than self-destruction. Accuracy is relatively high because if a logical flaw in the argument is established, other factors besides the argument (such as false facts) also contribute, so the whole claim is likely invalid. As the complexity of the complaint and its discourse tree increases, F1 first improves because more logical terms are available and then degrades because there is a higher chance of inference error due to noisier input.

意思決定支援システムでは、低い偽陽性率を維持することが重要である。無効な苦情を見逃すことは許容可能であるが、検出された無効な苦情については、信頼度はかなり高くあるべきである。人間のエージェントが、所与の苦情を無効として見ることを推奨される場合、エージェントの期待は、ほとんどの場合において満たされるべきである。全体的な論証検出および検証システムのF1値は、現代の認識システムと比較して低いが、依然としてCRM決定支援システムの構成要素として使用可能であると考えられる。 It is important to maintain a low false positive rate in decision support systems. Missing invalid complaints is acceptable, but the confidence should be fairly high for invalid complaints that are detected. If a human agent is encouraged to view a given complaint as invalid, the agent's expectations should be met in most cases. Although the F1 value of the overall argumentation detection and verification system is low compared to modern recognition systems, it is still considered usable as a component of a CRM decision support system.

構文生成
改善された談話パーサを含む、本明細書で論じられる技法のいくつかは、構文一般化を用いることができる。2つのセンテンスの構文一般化を実行することは、センテンスの各々における単語および/またはセンテンスの各々における同一の品詞(POS)を識別することを含む。見出語は、関連する品詞情報を持たない単語を指す。2つの単語の見出語が異なるが、各単語の品詞が同じである場合、品詞は一般化結果の一部である。見出語が同じであるが品詞が異なる場合、一般化された結果の見出し部分である。
Syntax Generation Some of the techniques discussed herein, including the improved discourse parser, can use syntax generalization. Performing syntactic generalization of two sentences includes identifying words in each of the sentences and/or identical parts of speech (POS) in each of the sentences. Headwords refer to words that do not have associated part-of-speech information. If two words have different lemmas but the part of speech of each word is the same, then the part of speech is part of the generalization result. If the lemma is the same but the part of speech is different, it is the heading part of the generalized result.

この概念を説明するために、2つの自然言語表現の例を考える。各表現の意味は論理式で表される。これらの式の統合および反統合が構築される。いくつかの単語(エンティティ)は述語にマッピングされ、いくつかの単語はそれらの論証にマッピングされ、他のいくつかの単語は論理形式表現において明示的には生じないが、論証をともなう述語の上記のインスタンス化を示す。 To illustrate this concept, consider two examples of natural language expressions. The meaning of each expression is represented by a logical expression. Integrations and anti-integrations of these formulas are constructed. Some words (entities) map to predicates, some to their arguments, and some others do not occur explicitly in the logical form representation, but indicate the above instantiations of predicates with arguments.

以下の2つのセンテンス「camera with digital zoom(デジタルズーム付きカメラ)」および「camera with zoom for beginners(初心者用ズーム付きカメラ)」について考える。意味を表現するために、以下の論理述語が用いられる。 Consider the following two sentences "camera with digital zoom" and "camera with zoom for beginners". The following logical predicates are used to express meaning.

camera(name_of_feature, type_of_users) および
zoom(type_of_zoom)。
camera(name_of_feature, type_of_users) and
zoom(type_of_zoom).

これは、単純化された例であり、したがって、より典型的な例と比較して、低減された数の論証を有し得ることに留意されたい。例を続けると、上記の表現は、以下のように表すことができる:
camera(zoom(digital), AnyUser),
camera(zoom(AnyZoom), beginner)
表記法によれば、変数(NL表現に指定されていない非実体化値)が大文字で始められている。上記の式の対を仮定すると、統合は、それらの最も一般的な特殊化camera(zoom(digital), beginner)を計算し、反統合は、それらの最も具体的な一般化camera(zoom(AnyZoom), AnyUser)を計算する。
Note that this is a simplified example and thus may have a reduced number of arguments compared to more typical examples. Continuing with the example, the above expression can be expressed as:
camera(zoom(digital), AnyUser),
camera(zoom(AnyZoom), beginner)
According to the notation, variables (dematerialized values not specified in the NL expression) are capitalized. Given the above pair of equations, the integration computes their most general specialization camera(zoom(digital), beginner) and the anti-integration computes their most specific generalization camera(zoom(AnyZoom), AnyUser).

構文レベルでは、これらの表現は、{NN-camera, PRP-with, [digital], NN-zoom [for beginners]}として2つの名詞句の一般化(‘^’) を受ける。角括弧内の表現は、一方の表現には生ずるが、他方には生じないため、除去される。結果として、意味的一般化の構文的アナログである、obtain{NN-camera, PRP-with, NN-zoom]}が得えらる。 At the syntactic level, these expressions receive two noun phrase generalizations (‘^’) as {NN-camera, PRP-with, [digital], NN-zoom [for beginners]}. Expressions in square brackets are removed because they occur in one expression but not in the other. The result is obtain{NN-camera, PRP-with, NN-zoom]}, the syntactic analog of the semantic generalization.

抽象的一般化の目的は、テキストの部分間の共通性を様々な意味的レベルで見つけることである。一般化操作は、1つ以上のレベルで行われる。レベルの例は、パラグラフレベル、センテンスレベル、フレーズレベル、および単語レベルである。 The goal of abstract generalization is to find commonalities between parts of text at various semantic levels. Generalization operations are performed at one or more levels. Examples of levels are paragraph level, sentence level, phrase level and word level.

各レベル(単語レベルを除く)、個々の単語において、2つの表現の一般化の結果は、表現のセットである。そのようなセットでは、一方が他方よりも一般的でないような表現の各ペアについて、後者は排除される。2セットの表現の一般化は、これらの表現のペア的一般化の結果であるセットのうちのあるセットである。 At each level (except word level), at an individual word, the result of the generalization of the two expressions is a set of expressions. In such a set, for each pair of expressions in which one is less common than the other, the latter is eliminated. A generalization of two sets of representations is a set of sets that is the result of a pairwise generalization of these representations.

1対の単語に対して1つの一般化のみが存在する:単語が同じ形式で同じである場合、結果は、この単語をこの形式で有するノードである。word2vecモデルを伴うために、2つの異なる単語の一般化を計算するために、以下のルールが用いられる。subject1=subject2である場合、subject1^subject2 = <subject1, POS(subject1), 1>。そうではなく、それらが同じ品詞を有する場合、subject1^subject2 =<*,POS(subject1), word2vecDistance(subject1^subject2)>。品詞が異なる場合、一般化は空のタプルである。それをさらに一般化することはできない。 There is only one generalization for a pair of words: if the words are the same in the same form, the result is the node that has this word in this form. To involve the word2vec model, the following rules are used to compute two different word generalizations. If subject1=subject2 then subject1^subject2 = <subject1, POS(subject1), 1>. otherwise subject1^subject2 =<*,POS(subject1), word2vecDistance(subject1^subject2)> if they have the same part of speech. If the parts of speech are different, the generalization is an empty tuple. It cannot be generalized further.

フレーズのペアについて、一般化は、単語の順序が保持されるように、フレーズ内の単語について、一般化ノードのすべての最大の順序付けられたセットを含む。以下の例では、
"To buy digital camera today, on Monday."(「今日、月曜日にデジタルカメラを購入するために。」)
"Digital camera was a good buy today, first Monday of the month."(「デジタルカメラは、今日、月の最初の月曜日の良い買物であった。」)
一般化は{<JJ-digital, NN-camera> ,<NN- today, ADV,Monday>}であり、名詞句の一般化の後に、副詞句の一般化が続く。動詞 buy は、上記のフレーズにおいては異なる順序で生ずるため、両方の一般化から除外される。Buy - digital - cameraは一般化フレーズではなく、なぜならば、buy は、他の一般化ノードを伴う、異なるシーケンスで生ずるからである。
For a pair of phrases, the generalization includes all the maximal ordered sets of generalized nodes for the words in the phrase such that the order of the words is preserved. In the example below,
"To buy digital camera today, on Monday."
"Digital camera was a good buy today, first Monday of the month."
The generalization is {<JJ-digital, NN-camera>,<NN-today,ADV,Monday>}, where noun phrase generalizations are followed by adverbial phrase generalizations. The verb buy is excluded from both generalizations because it occurs in a different order in the above phrases. Buy-digital-camera is not a generalized phrase because buy occurs in a different sequence with other generalized nodes.

改善された談話パーサ
特定の態様は、改善された談話パーサに関する。2つのセンテンスの間の修辞関係の予測は、テキストセグメンテーション(センテンスを基本談話単位に分割する)と共に談話分析の目標である。文書は階層的談話構造のシーケンスとして分析することができるが、談話一貫性における問題は、どのように修辞的な関係がソーステキストによって合図される(そしてパーサによって識別され得るか)である。例えば、修辞関係は、多くの場合、and, because, however および whileなどの談話マーカによって合図され、関係がそのようなマーカを含む場合、ときには、それらは明示的な関係として分類される。談話マーカーは、信頼可能な一貫性関係の信号である。
Improved Discourse Parser Certain aspects relate to an improved discourse parser. Predicting the rhetorical relationship between two sentences is a goal of discourse analysis along with text segmentation (dividing a sentence into basic discourse units). A document can be analyzed as a sequence of hierarchical discourse structures, but the issue in discourse coherence is how rhetorical relationships are signaled by the source text (and can be identified by the parser). For example, rhetorical relations are often signaled by discourse markers such as and, because, however and while, and when relations contain such markers they are sometimes classified as explicit relations. Discourse markers are reliable coherence relation signals.

しかしながら、既存の談話パーサは、機械学習手法およびデータセットを使用し、これは、拡張するのが困難かつ時間がかかり得る。談話関係予測のタスクは、すでに複雑であり、これらの注釈付きデータセットを拡張することの、時間のかかる性質によって、複合化される。したがって、多くの利用可能な談話パーサは、他のより記述的な修辞関係がより好適である場合、詳述およびジョイン関係を割り当てる。したがって、他のより具体的な修辞関係を確立することの再現度は、比較的低くなり得る。 However, existing discourse parsers use machine learning techniques and datasets, which can be difficult and time consuming to scale. The task of discourse prediction is already complex, compounded by the time-consuming nature of extending these annotated datasets. Therefore, many available discourse parsers assign elaboration and join relations where other more descriptive rhetorical relations are more suitable. Therefore, the reproducibility of establishing other more specific rhetorical relationships can be relatively low.

しかし、既存の談話パーサは、談話ツリーの追加の分析、例えば、意味分析を実行し、それに応じて談話ツリーを調整することによって、改善することができる。以下で論じられる例では、談話パーサがテキストに適用され、任意の結果として生じる詳述またはジョイントの修辞関係が、利用可能であれば意味解析(たとえば、抽象的意味表現)パターンを用いることによって得られる、より好適な修辞関係と置き換えられ得る。概して、この手法は、センテンス内修辞関係に適用される。 However, existing discourse parsers can be improved by performing additional analysis of the discourse tree, eg semantic analysis, and adjusting the discourse tree accordingly. In the examples discussed below, the discourse parser is applied to the text and any resulting elaboration or joint rhetorical relation can be replaced with a better rhetorical relation obtained by using semantic analysis (e.g., abstract semantic representation) patterns, if available. In general, this approach applies to intra-sentence rhetorical relations.

図44は、一態様による、談話ツリーおよびセマンティックツリーを示す。図44は、談話ツリー4400およびセマンティックツリー4410を示す。 FIG. 44 shows a discourse tree and a semantic tree, according to one aspect. FIG. 44 shows discourse tree 4400 and semantic tree 4410 .

談話ツリー4400およびセマンティックツリー4410は、各々、以下のテキスト"It was a question of life or death for me : I had scarcely enough drinking water to last a week."(私にとっては生か死かの問題であった。私は、1週間持ちこたえるのに充分な飲料水をほとんど有していなかった。)を表す。 Discourse tree 4400 and semantic tree 4410 each represent the following text: "It was a question of life or death for me: I had scarcely enough drinking water to last a week."

談話ツリー4410は、以下のようにテキストベースの形式で表されている(字下げは、ツリーにおけるネスト化のレベルを指す):
詳述
TEXT:It was a question of life or death for me :
詳述
TEXT:I had scarcely enough drinking water
TEXT:to last a week.
談話ツリー4410から分かるように、談話パーサによって生成され"I had scarcely enough drinking water" および "to last a week" に関連する第2の詳述関係4412は、テキストに関して可能な限り正確ではなく、なぜならば、"to last a week" は、単に、 "I had scarcely enough drinking water" の詳述よりも多いからである。これは、セマンティックツリー4420においてAMR関係を活用することによって改善される。セマンティックツリー4410は、以下に、テキストベースの形式でも示される。
The discourse tree 4410 is represented in text-based form as follows (indentation refers to the level of nesting in the tree):
detailed
TEXT: It was a question of life or death for me:
detailed
TEXT: I had scarcely enough drinking water
TEXT: to last a week.
As can be seen from the discourse tree 4410, the second elaboration relation 4412 generated by the discourse parser and relating to "I had scarcely enough drinking water" and "to last a week" is not as accurate as possible for the text, because "to last a week" is simply more than the elaboration of "I had scarcely enough drinking water". This is improved by leveraging AMR relationships in semantic tree 4420 . The semantic tree 4410 is also presented below in text-based form.

Figure 2023531345000030
Figure 2023531345000030

セマンティックツリー4420に見られるように、関係4422として識別される意味的関係「目的」は、役割4424として識別される動詞drink(飲む)に関連する意味的役割を有する。談話ツリー4410およびセマンティックツリー4420は共通のエンティティ「drink」を有するので、談話ツリー4400においてdrinkを有する核EDU("I had scarcely enough drinking water")を特定することができる。 As seen in semantic tree 4420 , the semantic relation “purpose” identified as relation 4422 has a semantic role associated with the verb drink identified as role 4424 . Since discourse tree 4410 and semantic tree 4420 have the common entity “drink”, we can identify the kernel EDU (“I had scarcely enough drinking water”) that has drink in discourse tree 4400 .

談話ツリーとセマンティックツリーテンプレートとの間の共通エンティティの数が多いほど、修辞関係を改善するためのマッチはより良好である。例を続けると、衛星EDU("to last a week")が識別され、修辞関係「詳述」とリンクされる。最後に、「詳述」は、より正確な談話ツリーのために、「目的」と置換される。このリンクはリンク4430として示される。 The higher the number of common entities between the discourse tree and the semantic tree template, the better the match for improving rhetorical relations. Continuing the example, a satellite EDU ("to last a week") is identified and linked with the rhetorical relation "Detailed". Finally, 'Detailed' is replaced with 'Purpose' for a more accurate discourse tree. This link is shown as link 4430 .

意味的情報を活用することは、談話マーカーの欠如がある場合、談話マーカーがあいまいであるかまたは誤解を招く場合、またはAMRなど、センテンスのより深い意味的表現が特定の修辞関係を意味する場合など、特定の状況において、談話ツリーを改善する。構文解析されているテキストとAMRパターンとの間の構文的類似性が確立されると、AMR動詞からの意味的役割は、談話レベルでそれぞれの修辞関係として解釈され得る。AMRにおける意味的関係と特定の修辞関係との間のこのマッピングは、どの接続EDU、核EDUおよび衛星EDUがどのように接続されるかにかかわらず確立される。 Exploiting semantic information improves the discourse tree in certain situations, such as when there is a lack of discourse markers, when discourse markers are ambiguous or misleading, or when deeper semantic representations of sentences imply specific rhetorical relationships, such as AMR. Once the syntactic similarities between the text being parsed and the AMR patterns are established, the semantic roles from the AMR verbs can be interpreted as respective rhetorical relations at the discourse level. This mapping between semantic relationships and specific rhetorical relationships in AMR is established regardless of how connected EDUs, nuclear EDUs and satellite EDUs are connected.

利用可能なAMR注釈の手作業による一般化の結果として、AMR意味的関係と修辞関係との間のマッピングが開発され、以下の表14に示される。表14は、意味的役割および対応する修辞関係の例を示す。表14において、第1の列は、検出されるべき修辞関係を列挙する。第2の列は、AMR意味的関係が修辞関係にマッピングされていることを表す。第3の列は、修辞的に構文解析されているセンテンスに再びマッチされる例示的なセンテンスを提供する。第4列は、テンプレートのAMR構文解析を示す。 As a result of manual generalization of the available AMR annotations, a mapping between AMR semantic and rhetorical relations was developed and is shown in Table 14 below. Table 14 shows examples of semantic roles and corresponding rhetorical relationships. In Table 14, the first column lists the rhetorical relation to be detected. The second column represents the mapping of AMR semantic relations to rhetorical relations. The third column provides exemplary sentences that are rematched to the sentence being parsed rhetorically. The fourth column shows the AMR parsing of the template.

オフラインで(例えば、実行時前に)実行することができる、意味的役割に対する修辞関係のこのマッピングを作成するために、修辞関係のリストが考慮される。各修辞関係について、特定の意味的関係のAMR注釈の集まりが判断される。系統的相関が識別されると、表14のエントリによって表される、対応するマッピングが作成される。表14は、AMR例によって綿密に表される修辞関係を示す。 A list of rhetorical relations is considered to create this mapping of rhetorical relations to semantic roles, which can be performed offline (eg, before runtime). For each rhetorical relation, a set of AMR annotations for a particular semantic relation is determined. Once systematic correlations are identified, corresponding mappings, represented by entries in Table 14, are created. Table 14 shows the rhetorical relationships elaborated by the AMR examples.

Figure 2023531345000031
Figure 2023531345000031

Figure 2023531345000032
Figure 2023531345000032

以下の表15は、詳述が特定の関係に変えられる細分化された談話ツリーの例を提供する。テンプレートを構築し、細分化する。テンプレートは、検出された修辞関係態様を太字で示す。第2の例は、下から2行目からのテンプレートを適用して詳述を譲歩に変えた場合の実際の細分化を示す。このテンプレートとセンテンスとの間の構文一般化も示されている。 Table 15 below provides an example of a fragmented discourse tree whose elaboration is turned into specific relationships. Build and subdivide templates. The template shows the detected rhetorical-related aspects in bold. The second example shows the actual refinement when applying the template from the second row from the bottom and turning the specification into a concession. A syntactic generalization between this template and the sentence is also shown.

Figure 2023531345000033
Figure 2023531345000033

詳述の修辞関係をAMRの手動タグ付けによって得られるものと置き換えるために、この詳述の核および衛星基本談話単位とテンプレートとの間で構文的類似性が確立される。そのような類似性が高い(AMRデータセットからのパターンが構文解析されている)場合、詳述は高い信頼度で上書きされ得る。構文的類似性スコアが高いほど、パターンから得られる意味的役割が修辞関係を正確に記述する信頼度が高い。充分なAMRパターンデータおよび修辞関係データへの広範なマッピングがない場合、そのようなマッピングの形式的学習は困難である。したがって、この類似度スコアの閾値を用いる。 Syntactic similarities are established between the elaboration core and satellite basic discourse units and templates to replace the rhetorical relationships of the elaboration with those obtained by manual tagging of AMR. If such similarity is high (patterns from the AMR dataset have been parsed), the elaboration can be overwritten with high confidence. The higher the syntactic similarity score, the higher the confidence that the semantic role derived from the pattern accurately describes the rhetorical relationship. In the absence of extensive mappings to sufficient AMR pattern data and rhetorical relation data, formal learning of such mappings is difficult. Therefore, this similarity score threshold is used.

表16は、修辞関係との語彙的、構文的および意味的相関についての共起値ならびにパーセンテージを示す。このデータは、「and」および「as」(通常は構文一般化のため無視される)、ならびに while, however, because についてのスコア付けを改善するのに役立ち、なぜならば、通常は非常に低いスコアを有するからである。 Table 16 shows co-occurrence values and percentages for lexical, syntactic and semantic correlations with rhetorical relations. This data helps improve the scoring of "and" and "as" (which are usually ignored due to syntactic generalization), as well as while, however, because, because they usually have very low scores.

Figure 2023531345000034
Figure 2023531345000034

意味的関係および役割を用いて修辞関係を改善する別の例が、図45に示される。
図45は、一態様による、談話ツリーおよびセマンティックツリーを示す。図45は、談話ツリー4510およびセマンティックツリー4520を示す。談話ツリー4510は、テキスト "I ate the most wonderful hamburger that she had ever bought for me." (私は、彼女が今まで買ってくれた中で最も素晴らしいハンバーガーを食べた。)を表す。セマンティックツリー4520は、談話ツリー4510と同じテキストを表さない。むしろ、セマンティックツリー4520は、談話ツリー4510のテキストとの好適なマッチであり、談話ツリー4510を改善するために用いられ得るテンプレートのテキストを表す。
Another example of using semantic relationships and roles to improve rhetorical relationships is shown in FIG.
FIG. 45 shows a discourse tree and a semantic tree, according to one aspect. FIG. 45 shows discourse tree 4510 and semantic tree 4520 . Discourse tree 4510 represents the text "I ate the most wonderful hamburger that she had ever bought for me." Semantic tree 4520 does not represent the same text as discourse tree 4510 . Rather, semantic tree 4520 represents the text of a template that is a good match with the text of discourse tree 4510 and that can be used to improve discourse tree 4510 .

談話ツリー4510は、以下のようにテキスト形式で表わされる:
詳述
TEXT: I ate the most wonderful hamburger
TEXT: that she had ever bought for me.
談話ツリー4510から分かるように、2つの基本談話単位 "I ate the most wonderful hamburger" および "that she had ever bought for me. " は、修辞関係「詳述」によって接続される。したがって、談話ツリー4510は、「詳述」が最も正確な修辞関係ではないかもしれないので、改善のための良好な候補である。
The discourse tree 4510 is represented in text form as follows:
detailed
TEXT: I ate the most wonderful hamburger
TEXT: that she had ever bought for me.
As can be seen from discourse tree 4510, the two basic discourse units "I ate the most wonderful hamburger" and "that she had ever bought for me." are connected by the rhetorical relation "explain". Therefore, discourse tree 4510 is a good candidate for improvement, as "elaborate" may not be the most correct rhetorical relation.

compared-to(~と比較)のAMR意味的役割が、比較の修辞関係にマッピングされる。デフォルトの談話構文解析は、デフォルトの修辞関係を有するEDUペアが、修辞関係にマッピングされ得る特定の意味的関係を有するテンプレートと意味的に類似する場合、より正確な修辞関係に変えられ得る詳述を提供する。センテンス中においてEDU間に正確な修辞関係を確立するために、意味テンプレートのセット(例えば、AMRリポジトリ)中に見出されるテンプレートに対するマッチが試みられる。マッチされたテンプレートは、センテンス "It was the most magnificent and stately planet that he had ever seen."(それは彼が今まで見た中で最も壮大で荘厳な惑星だった。)に対するものである。 The AMR semantic role of compared-to is mapped to the rhetorical relation of comparison. Default discourse parsers provide renditions that can be turned into more accurate rhetorical relationships when EDU pairs with default rhetorical relationships are semantically similar to templates with specific semantic relationships that can be mapped to rhetorical relationships. To establish the correct rhetorical relationship between EDUs in a sentence, a match is attempted against templates found in a set of semantic templates (eg, AMR repository). The template matched is for the sentence "It was the most magnificent and stately planet that he had ever seen."

構文解析されているEDUペアをテンプレートとマッチさせるために、EDUおよびテンプレートは、整列され、一般化される。この場合、EDUペアとテンプレートとの間の構文一般化は、[VB-* DT-the RBS-most JJ-(wonderful ^magnificent) IN-that PRP-she VB-had RB-ever VB-*] のようになり、構文解析されているセンテンスおよびパターンは共通の構文構造を共有するという有意な証拠が存在する。例えば、wonderful ^magnificent は、これらの形容詞の間で共通するものの意味を有する抽象形容詞を生成する。接続4530は、AMR表現における形容詞 magnificent と元のDTにおける形容詞 wonderful との間の対応関係を示す。 The EDU and template are aligned and generalized to match the EDU pair being parsed with the template. In this case, the syntactic generalization between EDU pairs and templates becomes [VB-* DT-the RBS-most JJ-(wonderful ^magnificent) IN-that PRP-she VB-had RB-ever VB-*] and there is significant evidence that the sentences and patterns being parsed share a common syntactic structure. For example, wonderful ^magnificent produces an abstract adjective with the meaning of what is common among these adjectives. Connection 4530 indicates the correspondence between the adjective magnificent in the AMR representation and the adjective wonderful in the original DT.

したがって、談話ツリー4500の詳述は、タイプ「比較」の修辞関係と置き換えられる。補正された談話ツリーは以下の通りである:
比較
TEXT: I ate the most wonderful hamburger
TEXT: that she had ever bought for me.
上記の例に基づいて、談話ツリーを改善するプロセスについてさらに説明する。
Therefore, the elaboration of discourse tree 4500 is replaced with a rhetorical relation of type "compare". The corrected discourse tree is as follows:
comparison
TEXT: I ate the most wonderful hamburger
TEXT: that she had ever bought for me.
Based on the example above, the process of improving the discourse tree is further described.

図46は、一態様による、改善された談話ツリーを生成するための例示的なプロセス4600のフローチャートである。場合によっては、プロセス4600における1つ以上の動作が実行されないことがあることを理解されたい。プロセス4600は、アプリケーション102によって実行され得る。 FIG. 46 is a flowchart of an exemplary process 4600 for generating an improved discourse tree, according to one aspect. It should be appreciated that in some cases one or more actions in process 4600 may not be performed. Process 4600 may be performed by application 102 .

ブロック4602において、プロセス4600は、テキスト内において基本談話単位を識別することによって、テキストから談話ツリーを作成することを含む。ブロック4602において、プロセス4600は、プロセス1500のブロック1502と実質的に同様の動作を含む。決定された談話ツリーは、ノードを含む。ノードの各非終端ノードは、2つの基本談話単位間の修辞関係を表し、談話ツリーのノードの各終端ノードは、基本談話単位に関連付けられる。 At block 4602, process 4600 includes creating a discourse tree from the text by identifying basic discourse units within the text. At block 4602 , process 4600 includes operations substantially similar to block 1502 of process 1500 . The determined discourse tree contains nodes. Each non-terminal node of the node represents a rhetorical relationship between two basic discourse units, and each terminal node of the nodes of the discourse tree is associated with a basic discourse unit.

ブロック4604において、プロセス4600は、談話ツリーにおいて、タイプ詳述またはジョイントの修辞関係を識別することを含む。修辞関係は、(2つの他の修辞関係または1つの修辞関係および1つの基本的談話単位を関連付けるよりはむしろ、)2つの基本談話単位、例えば、第1の基本談話単位および第2の基本談話単位を関係させる。 At block 4604, the process 4600 includes identifying rhetorical relationships of type elaboration or joints in the discourse tree. A rhetorical relation relates two base discourse units, e.g., a first base discourse unit and a second base discourse unit (rather than associating two other rhetorical relations or one rhetorical relation and one base discourse unit).

第1の基本談話単位および第2の基本談話単位は、参照センテンスを形成する。例えば、図45を再び参照すると、第1のEDUは "I ate the most wonderful hamburger" であり、第2のEDUは "that she had ever bought for me" であり、(更新前の)修辞関係は「詳述」である。 The first elementary discourse unit and the second elementary discourse unit form a reference sentence. For example, referring back to Figure 45, the first EDU is "I ate the most wonderful hamburger", the second EDU is "that she had ever bought for me", and the rhetorical relation (before the update) is "detail".

ブロック4606において、プロセス4600は、候補センテンスのセットの各候補センテンスについて構文一般化スコアを決定することを含む。表14および表15において上述したように、各候補センテンスは、対応する意味的関係(例えば、AMR表現)を有する。簡略化された例では、構文一般化スコアは、参照センテンスと候補センテンスとの間の共通エンティティの数である。共通エンティティの各々は、候補センテンスと参照センテンスとの間で共通の品詞を共有する。しかし、構文一般化スコアは、以下で説明するように、他の態様では異なるように計算することができる。 At block 4606, process 4600 includes determining a syntactic generalization score for each candidate sentence in the set of candidate sentences. As described above in Tables 14 and 15, each candidate sentence has a corresponding semantic relationship (eg, AMR expressions). In a simplified example, the syntactic generalization score is the number of common entities between the reference sentence and the candidate sentence. Each common entity shares a common part of speech between the candidate sentence and the reference sentence. However, the syntactic generalization score can be calculated differently in other aspects, as described below.

抽象的一般化の目的は、テキストの部分間の共通性を様々な意味的レベルで見つけることである。一般化は、パラグラフ、センテンス、EDU、フレーズ、および個々の単語レベルで行うことができる。単語レベルを除いて、2つの表現の一般化の結果は、表現のセットである。そのようなセットでは、1つが他のものよりも一般的でないような表現の各ペアについて、後者は排除される。表現の2つのセットの一般化は、これらの表現のペア的一般化の結果である表現のセットのうちのあるセットである。例示の目的で、図46は、一般化を示す図47、および整列を示す図48に関して論じられる。 The goal of abstract generalization is to find commonalities between parts of text at various semantic levels. Generalization can be done at the paragraph, sentence, EDU, phrase, and individual word levels. The result of the generalization of the two expressions, except at the word level, is a set of expressions. In such a set, for each pair of expressions where one is less common than the other, the latter is eliminated. A generalization of two sets of representations is a set of representation sets that is the result of a pairwise generalization of these representations. For illustrative purposes, FIG. 46 will be discussed with respect to FIG. 47 showing generalization and FIG. 48 showing alignment.

図47は、一態様による、既知の意味的関係を有するセンテンスおよびテンプレートの一般化を示す。図47は、センテンス4710"If you read a book at night, your knowledge will improve" (夜に本を読むと知識が向上する。)および表14からのテンプレート4720"If one gets lost in the night, such knowledge is valuable" (夜に道に迷った場合、そのような知識は貴重である。)の一般化を示す。得られた一般化4730は、以下の通りである:
[IN-If PRP-* VB-* ... NN-night ... NN-knowledge ]
このテンプレートでは、IN-If PRP-* VB-* は、:condition() の意味的関係のシグネチャであり、条件の談話関係でもあるが、"NN-night ... NN-knowledge"のように、センテンスとテンプレートとの間に類似性を確立するために用いられるかもしれず、または用いられないかもしれない、より一般的な単語が偶然存在する。
FIG. 47 illustrates generalization of sentences and templates with known semantic relationships, according to one aspect. FIG. 47 shows a generalization of sentence 4710 "If you read a book at night, your knowledge will improve" and template 4720 "If one gets lost in the night, such knowledge is valuable" from Table 14. The resulting generalization 4730 is as follows:
[IN-If PRP-* VB-* ... NN-night ... NN-knowledge ]
In this template, IN-If PRP-* VB-* is the signature of the semantic relation of :condition() and also the discourse relation of the condition, but there happen to be more general words that may or may not be used to establish an affinity between the sentence and the template, such as "NN-night ... NN-knowledge".

適切な一般化スコアをどのように計算するかを決定するために、センテンス間の最も正確な類似性尺度をもたらす品詞重みを決定するための計算研究を行った。問題は、結果的な検索関連性が最大になるように、名詞、形容詞、動詞、およびそれらの形態(動名詞および過去形など)に関して最適な重みを見出すものとして定式化された。検索関連性は、所与のクエリについて最良のものからの検索結果の順序における偏差として測定され、現在の検索順序は、(他の一般化パラメータが固定された)POS重みの所与のセットに対する一般化のスコアに基づいて決定された。実行されたこの最適化の結果として、WVBcommon=0.57である get, take, set, および put のような一般的な頻繁な動詞を除いて、WNN=1.0、WJJ=0.32、WRB=0.71、WCD=0.64、WVB=0.83、WPRP=0.35が得られる。W<POS,*>は0.2に設定され(異なる単語だが同じPOS)、W<*,word>=0.3である(同じ単語であるが、2つのセンテンスにおいて異なるPOSとして生ずる)。W{and,as,but,while,however,because}は、表16の第2列の値に対して正規化された1のデフォルト値として計算される。デフォルトの構文一般化は、ほとんどの場合、談話指示語を無視することに留意されたい。 To determine how to calculate an appropriate generalization score, we performed a computational study to determine the part-of-speech weights that yielded the most accurate similarity measures between sentences. The problem was formulated as finding the optimal weights for nouns, adjectives, verbs, and their forms (such as gerund and past tense) to maximize the resulting search relevance. Search relevance was measured as the deviation in search result order from the best for a given query, and the current search order was determined based on the generalization score for a given set of POS weights (with other generalization parameters fixed). This optimization performed results in W NN =1.0, W JJ =0.32, W RB =0.71, W CD =0.64, W VB =0.83, W PRP =0.35, except for common frequent verbs like get, take, set, and put where W VBcommon =0.57. W <POS,*> is set to 0.2 (different word but same POS) and W <*,word> = 0.3 (same word but occurs as different POS in two sentences). W {and,as,but,while,however,because} is computed as a default value of 1 normalized to the values in the second column of Table 16. Note that the default syntactic generalization ignores discourse directives in most cases.

次いで、参照センテンス(ref_sentence)と候補テンプレート(Template)との間の一般化スコアを、単語 Wwordref_sentenceおよびwordtemplateを介する加重和のフレーズを介する和として表すことができる。 The generalization score between the reference sentence (ref_sentence) and the candidate template (Template) can then be expressed as the sum over the phrases of the weighted sum over the words Word ref_sentence and word template .

Figure 2023531345000035
Figure 2023531345000035

次いで、最大一般化を、最高スコアを有するものとして定義することができる。
フレーズレベルでは、一般化は、2つのフレーズ間の整列(2つのフレーズ間の可能な限り多くの単語の対応)を見つけることから始まる。整列操作は、フレーズ完全性が保持されるように実行される。例えば、2つのフレーズは、それらの先頭名詞間の対応が確立される場合にのみ整列され得る。動詞、前置詞および他のタイプのフレーズを整列させるための同様の完全性制約がある。
The greatest generalization can then be defined as the one with the highest score.
At the phrase level, generalization begins with finding alignments between two phrases (as many word correspondences as possible between two phrases). Alignment operations are performed such that phrase integrity is preserved. For example, two phrases can be aligned only if correspondence between their initial nouns is established. There are similar integrity constraints for aligning verbs, prepositions and other types of phrases.

図48は、一態様による、2つのセンテンスの間の整列を示す。図48は、"use the screw driver from this tool for fixing heaters,"(ヒータを固定するためにこのツールからそのネジ回しを用いる)と読めるセンテンス4810と、"get short screw driver holder for electric heaters"(「電気ヒータのために短いネジ回しホルダを手に入れる)と読めるセンテンス4820との間の整列を示す。結果として生じる整列4830は、以下の通りである:
VB-* JJ-* NN-zoom NN-* IN-for NN-*
ある態様では、核および衛星の別々の一般化を用いて、改善された談話ツリーを生成することができる。例えば、プロセス4600のブロック4602のように談話ツリーが作成される。談話ツリーから、修辞関係が識別される。好適な修辞関係が識別される。好適な修辞関係の例は、詳述およびジョイントの最も内側の関係を含み、ネスト化された関係([別の詳述の上の]別の詳述の上の詳述)も含む。
FIG. 48 shows alignment between two sentences, according to one aspect. 48 shows the alignment between the sentence 4810 that reads "use the screw driver from this tool for fixing heaters," and the sentence 4820 that reads "get short screw driver holder for electric heaters."The resulting alignment 4830 is as follows:
VB-* JJ-* NN-zoom NN-* IN-for NN-*
In an aspect, separate kernel and satellite generalizations can be used to generate an improved discourse tree. For example, a discourse tree is created as in block 4602 of process 4600 . From the discourse tree, rhetorical relations are identified. Preferred rhetorical relations are identified. Examples of suitable rhetorical relationships include elaboration and joint innermost relationships, including nested relationships (details above another elaboration [above another elaboration]).

核EDUおよび衛星EDUが識別される。それらがあまりにも複雑であるかまたは長い場合、これらのEDUは、サイズおよび/または複雑さを低減することができる。核EDUは、各テンプレート(例えば、表14および/または表15)で一般化される。ブロック4608と同様に、最も高い一般化スコアを有する候補センテンスが選択される。スコアが閾値を上回る場合、修辞関係に対応する衛星EDUがテンプレートで一般化される。衛星EDUの一般化スコアが閾値を上回る場合、修辞関係を用いて、参照センテンスにおいて修辞関係を置き換える。一般化閾値の例は、2.0(核の場合)および3.3(衛星の場合)である。 Nuclear EDUs and satellite EDUs are identified. These EDUs can be reduced in size and/or complexity if they are too complex or long. Nuclear EDU is generalized with each template (eg, Table 14 and/or Table 15). Similar to block 4608, the candidate sentence with the highest generalization score is selected. If the score is above the threshold, the satellite EDU corresponding to the rhetorical relation is generalized with the template. If the satellite EDU's generalization score is above a threshold, then the rhetorical relation is used to replace the rhetorical relation in the reference sentence. Examples of generalized thresholds are 2.0 (for nuclei) and 3.3 (for satellites).

図46に戻ると、ブロック4608において、プロセス4600は、構文一般化スコアのうち最も高い構文一般化スコアを有する候補センテンスを選択することを含む。 Returning to Figure 46, at block 4608, the process 4600 includes selecting the candidate sentence with the highest syntactic generalization score of the syntactic generalization scores.

ある態様では、マッチは見出されない。例えば、アプリケーション102は、抽象的意味表現(AMR)データセット(例えば、表14および/または表15)を検索して、識別された意味的関係がAMRデータセット内にないことを識別し、次いで、談話ツリーにおいて、修辞関係を、AMRデータセット内にある追加の意味的関係で置換する。 In some embodiments, no match is found. For example, application 102 searches an Abstract Semantic Representation (AMR) dataset (e.g., Table 14 and/or Table 15) to identify that the identified semantic relationship is not in the AMR dataset, and then replaces the rhetorical relationship in the discourse tree with the additional semantic relationship that is in the AMR dataset.

ブロック4610において、プロセス4600は、候補センテンスに対応する意味的関係を識別することを含む。意味的関係は、候補センテンス中の単語に対応し、候補センテンス中において役割を定義する。例えば、候補センテンスにおける意味的関係は、表14および/または表15において識別される。 At block 4610, process 4600 includes identifying semantic relationships corresponding to the candidate sentences. Semantic relationships correspond to words in a candidate sentence and define roles in the candidate sentence. For example, semantic relationships in candidate sentences are identified in Table 14 and/or Table 15.

ブロック4612において、プロセス4600は、談話ツリーにおいて、修辞関係を、意味的関係に対応する更新された修辞関係に置き換え、それによって、更新された談話ツリーを作成することを含む。ブロック4610において識別された意味的関係に合致する修辞関係が識別される。識別された修辞関係は、ブロック4604で識別された修辞関係の代わりに談話ツリーに挿入される。 At block 4612, the process 4600 includes replacing the rhetorical relations in the discourse tree with updated rhetorical relations corresponding to the semantic relations, thereby creating an updated discourse tree. Rhetorical relationships that match the semantic relationships identified at block 4610 are identified. The identified rhetorical relation is inserted into the discourse tree in place of the rhetorical relation identified at block 4604 .

一般化レベル:構文からから意味論、談話へ
構文一般化が構文レベルから意味的レベルにどのように上昇するかを実証するために、言語構造に適用されるミルの直接的一致法(帰納)に従うことができる。英国人の哲学者 JS Mills は、彼の1843年の著書「論理学大系(A System of Logic)」において、「調査中の現象の2つ以上の事例が共通して1つの状況しか有さない場合、それらすべての事例が一致する状況のみが、所与の現象の原因(または効果)である。」と記述している。
Levels of generalization: from syntactic to semantic to discourse To demonstrate how syntactic generalization rises from the syntactic level to the semantic level, we can follow Mill's method of direct correspondence (induction) applied to linguistic structures. The English philosopher JS Mills wrote in his 1843 book A System of Logic, "If two or more instances of the phenomenon under investigation have only one situation in common, then only the situation in which all the cases agree is the cause (or effect) of the given phenomenon."

フレーズfの言語学的特性Aを考える。Aは何らかの効果Eの必要条件であるためには、Aは常にEに対処する複数のフレーズに存在しなければならない。言語学の領域において、Aは言語構造であり、Eはその意味である。したがって、「可能な必要条件」とみなされる言語学的特性がセンテンス中に存在するかしないかが検証される。明らかに、意味Eが存在する場合に存在しないどのような言語学的特性Aも、フレーズのこの意味Eに対する必要条件ではあり得ない。 Consider the linguistic property A of a phrase f. For A to be a prerequisite for some effect E, A must always be present in multiple phrases addressing E. In the realm of linguistics, A is the linguistic structure and E is its meaning. Therefore, the presence or absence of linguistic features considered as "possible prerequisites" in the sentence is verified. Clearly, any linguistic property A that is absent if the meaning E is present cannot be a prerequisite for this meaning E of a phrase.

例えば、一致法は、単語{ABCD}が、<wxyz>として形式的に表される意味とともに生じるフレーズf1として表すことができる。単語{AEFG}がフレーズf1におけるのと同じ意味<wtuv>とともに生ずる別のフレーズf2も考える。ここで、単語{ABCD}および{AEFG}に一般化を適用することによって、{A}を得る(ここで、例のため、f1およびf2の構文構造は無視する)。したがって、ここでは、単語Aはwの原因である(意味wを有する)ことが分かる。この書物を通して、我々は、このリスト自体に加えて、ABCDをカバーする言語構造を考慮し、一致法を適用する。 For example, the matching method can be represented as the phrase f1 where the words {ABCD} occur with the meaning formally represented as <wxyz>. Consider also another phrase f2 in which the word {AEFG} occurs with the same meaning <wtuv> as in phrase f1. Now we obtain {A} by applying a generalization to the words {ABCD} and {AEFG} (here ignoring the syntactic structures of f1 and f2 for the sake of example). Thus, we now know that word A is the cause of w (has meaning w). Throughout this book, we consider the linguistic structures covering ABCD, in addition to this list itself, and apply the matching method.

したがって、構文一般化を適用する(帰納法的)セマンティクスを生成することができる。サンプルの構文情報のみを考えると、セマンティクスを得ることはできないが、2つ以上のフレーズ(サンプル)を一般化すると、構文構造だけでなく、(帰納的な)意味論的構造が得られる。構文一般化を帰納的認知手順として見ると、構文レベルから意味的レベルへの遷移を形式的に定義することができる。この研究では、我々は、クラスを学習するために構文的特徴および意味論的特徴を混同せず、代わりに、我々は、上記の帰納的枠組みに従って構文から意味論的特徴を導出する。 Thus, (inductive) semantics can be generated that apply syntactic generalizations. Considering only the syntactic information of a sample, we cannot get the semantics, but generalizing two or more phrases (samples), we get not only the syntactic structure, but also the (inductive) semantic structure. Viewing syntactic generalization as an inductive cognitive procedure, we can formally define the transition from the syntactic level to the semantic level. In this work, we do not mix syntactic and semantic features for learning classes, instead we derive semantic features from syntax according to the inductive framework above.

改善されたパーサの評価
詳述の修辞関係の改善において、偽陽性および偽陰性が識別される。それを行うために、要約化、ダイアログ管理、および論証の分析などの談話構文解析の下流適用の機能性を分析する。
Evaluating Improved Parsers False positives and false negatives are identified in the refinement of rhetorical relations in detail. To do so, we analyze the functionality of downstream applications of discourse parsing such as summarization, dialog management, and argumentation analysis.

詳述が正しい関係であるが、より具体的な関係に変えられる場合、ルールが詳述のために調整されるので、得られた検索結果はクエリとマッチしないかもしれず、いくつかのセンテンスは結果の要約に生じないかもしれない。検索および要約化システムを、我々の細分化システムによって得られる偽陽性に対して、より敏感でないようにするために、マッチングおよび選択ルールは、原因、譲歩、条件が詳述の部分的なケースであることを考慮に入れるように更新される必要があり、これらのノードラベルを有する談話ツリーは、それに応じてマッチされるべきである。 If the specification is the correct relationship but is changed to a more specific relationship, the search results obtained may not match the query and some sentences may not occur in the result summary as the rules are adjusted for the specification. In order to make the search and summarization system less sensitive to the false positives obtained by our refinement system, the matching and selection rules need to be updated to take into account that causes, concessions, conditions are partial cases of recitation, and discourse trees with these node labels should be matched accordingly.

詳述がより具体的な関係で上書きされない場合、下流のシステムの精度は悪影響を受ける。質問における特定の特有の関係が識別される場合、それは回答において対応されなければならず、したがって、それが詳述のままである場合、スタイルにおいて質問にマッチする特定の回答の選択は失敗することになる。より関連性のないセンテンスまたはフレーズを要約に含めることができるか、またはそのような包含についての候補の数が低減されるであろう。我々は、偽陰性は偽陽性より悪いと結論付ける。 If the specification is not overridden with a more specific relationship, the accuracy of downstream systems is adversely affected. If a particular idiosyncratic relationship in the question is identified, it must be addressed in the answer, so selection of a particular answer that matches the question in style will fail if it remains detailed. Less relevant sentences or phrases could be included in the summary, or the number of candidates for such inclusion would be reduced. We conclude that false negatives are worse than false positives.

別の考慮事項は、談話構文解析のためのトレーニングデータセットのジャンルに関する。RST Discourse Treebank (RST-DT, Carlson et al., 2001) は、ニュース記事を含み、フィクション、科学テキスト、エンジニアリングシステム記述および法律文書などの他のジャンルにおけるテキスト構造をモデル化するのに良好なソースではない。これらの領域における談話構文解析の適用は重要である。したがって、ニュースプレゼンテーションにおいては詳述が充分であっても、専門的なテキストなどの他のジャンルおよび領域における文書作成者の推論をモデル化するためには、より具体的な構造を必要とする。 Another consideration concerns the genre of the training dataset for discourse parsing. The RST Discourse Treebank (RST-DT, Carlson et al., 2001) contains news articles and is not a good source for modeling textual structure in other genres such as fiction, scientific texts, engineering systems descriptions and legal documents. The application of discourse parsing in these areas is important. Therefore, even if elaboration is sufficient in news presentations, more specific structures are needed to model authors' reasoning in other genres and domains, such as professional texts.

Figure 2023531345000036
Figure 2023531345000036

開発された談話パーサ細分化を評価するために、4つの問題が用いられる(表16):
1)質問と回答との間の調整を実施する、複雑な長い質問を検索(セクション2)。Yahoo!Answersデータセットを用いる;
2)テキストまたは文書からダイアログを形成する発話を見つける。第2巻第1章で開発されたデータセットおよび技術を用いる。この技術は、談話構文解析に大きく依存する;
3)最初のクエリからダイアログを生成する(第2巻第1章)。好適でない発話をフィルタリングするために、修辞関係が考慮される(Galitsky and Ilvovsky 2016);
4)文書の真実性をその談話構造(第2巻第6章)によって評価する。文書作成者がどのように情報を表現するかの談話ツリーの構造は、どの修辞関係によるかとならんで、嘘または偽のニュースを検出するために重要である。
Four problems are used to evaluate the developed discourse parser refinement (Table 16):
1) Search complex long questions (Section 2), implementing coordination between questions and answers. using the Yahoo!Answers dataset;
2) Find utterances that form a dialog from a text or document. We use the dataset and techniques developed in Chapter 1 of Volume 2. This technique relies heavily on discourse parsing;
3) Generate a dialog from the initial query (Volume 2, Chapter 1). Rhetorical relations are considered to filter unsuitable utterances (Galitsky and Ilvovsky 2016);
4) Evaluate the veracity of a document by its discourse structure (Volume 2, Chapter 6). The structure of the discourse tree, how authors present information, along with which rhetorical relationships, is important for detecting lies or fake news.

発話分類およびテキスト分類において、談話パーサ結果の細分化によって4%を超える改善を達成することを観察することができる。しかしながら、探索問題においては、適切な修辞関係に対してあまり敏感でなく、我々は、3%に近い改善を達成した。ここで、個々の修辞関係細分化がどのように行われるかの評価に進む(表17)。我々は、トレーニングのために1つのAMRコーパスを用い、テストのために別のAMRコーパスを用いる。 It can be observed that refinement of discourse parser results achieves over 4% improvement in utterance and text classification. However, in search problems, it is less sensitive to proper rhetorical relations, and we achieved improvements close to 3%. We now turn to an evaluation of how the individual rhetorical relational refinements work (Table 17). We use one AMR corpus for training and another AMR corpus for testing.

Figure 2023531345000037
Figure 2023531345000037

3行目~8行目では、対比などの個別関係種別に対する関係検出結果が分析される。ベースラインパーサでは、対比が原因および条件とともに認識され、残りの関係は認識されない。これは、これらの特有の稀な関係がDiscourse TreeBankにおいては上手く表されないという事実に起因する。全体として、これらの修辞関係についてのみ、これらの関係の量によって重み付けされたベースライン分類器の性能はかなり低い。AMRから学習すると、このデータについて77.7の性能を達成することが可能である。したがって、我々は、これら6つの関係の細分化について36.1の改善を得る。これは、重点が談話ツリー構造上ではなく特定の関係タイプ上に置かれるタスクにとって重要である。 In lines 3 to 8, the relationship detection results for individual relationship types such as contrast are analyzed. The baseline parser recognizes contrasts along with causes and conditions and does not recognize the remaining relationships. This is due to the fact that these unique rare relationships are poorly represented in the Discourse TreeBank. Overall, only for these rhetorical relations, the performance of baseline classifiers weighted by the amount of these relations is rather poor. Learning from AMR, it is possible to achieve a performance of 77.7 on this data. Therefore, we get an improvement of 36.1 for the refinement of these 6 relations. This is important for tasks where the emphasis is on specific relation types rather than on the discourse tree structure.

全体として、これらの6つの関係は稀であるため、パーサの改善は、すべての修辞関係を平均して6%までの改善をもたらす。これは、談話パーサの適用にとって依然として価値がある。 Overall, since these six relations are rare, parser improvements result in an average improvement of up to 6% for all rhetorical relations. This is still valuable for discourse parser applications.

関連作業
談話パーサ改善の焦点である6つの修辞関係は、検索、要約化、および抽象クラスへのテキスト分類のいくつかの適用にとって非常に重要である。検索のために、質問がこれらの6つの関係のいずれかを含む場合、良い包括的な回答は、デフォルトの修辞関係のみを含むことはできず、代わりに、問題となっているこれらの特有の関係をその文書作成者と適切にやり取りする。そのような回答は、単に類事実回答ではあり得ない。
対比は、おそらくは論証パターンを用いて、定立および反定立の両方を提示することによって伝達される必要がある。
原因は、1つまたは別の形式の説明を介して伝達され、理由を提示し、推論のためのフレームワークを設定する必要がある。
条件および比較は、両方(If and Then、または項目A対項目B)の部分で事実データを伝達、提示することよって対処する必要がある。
Related Work The six rhetorical relations that are the focus of discourse parser improvements are very important for retrieval, summarization, and some applications of text classification to abstract classes. For retrieval purposes, if a question involves any of these six relations, a good comprehensive answer cannot contain only the default rhetorical relations, but instead properly communicates with its author these specific relations in question. Such an answer cannot simply be a factual answer.
Contrasts need to be conveyed by presenting both the thesis and antithesis, possibly using argumentation patterns.
Causes must be communicated through one form or another of explanation, providing reasons and setting a framework for reasoning.
Conditions and comparisons must be addressed by communicating and presenting factual data in both (If and Then, or Item A vs. Item B) parts.

したがって、ユーザ質問におけるこれらの6つの関係が適切に認識されない場合、伝達態様において間違った回答が提示される可能性が高くなり、このユーザは、たとえ照会されるエンティティおよびそれらの属性に関して関連性があるとしても、検索に不満を抱くことになる。 Therefore, if these six relationships in a user question are not properly recognized, it is likely that the wrong answers will be presented in the delivery manner, and the user will be frustrated with the search, even if it is relevant in terms of the queried entities and their attributes.

Penn Discourse Treebank (PDTB, Prasad et al 2017))は、談話パーサをトレーニングするための主要なリソースである。バージョン3.0は、談話関係を用いてTreebank-2のWall Street Journalセクションに注釈を付けることを目標とするPenn Discourse Treebankプロジェクトにおける第3のリリースである。Penn Discourse Treebankバージョン3は、53,600を超える注釈付き関係のトークンを含む。いくつかのペア的注釈を正規化し、新たな意味を含ませ、コーパスにおける整合性チェックを実施した。PDTBの開発に関するさらなる詳細は入手可能である(PDBT 2019)。PDBRはニュースジャンルのみを含むので、他のジャンルにおいてそれでトレーニングされる談話パーサの性能は制限される。この研究において、我々は、談話関係を演繹することができる意味的関係のソースを用いることによって、これらの制限を解決することを試みた。 The Penn Discourse Treebank (PDTB, Prasad et al 2017)) is the primary resource for training discourse parsers. Version 3.0 is the third release in the Penn Discourse Treebank project, which aims to annotate the Wall Street Journal section of Treebank-2 using discourse relations. The Penn Discourse Treebank version 3 contains over 53,600 annotated relationship tokens. We normalized some pairwise annotations, impregnated them with new meanings, and performed consistency checks on the corpus. Further details regarding the development of PDTB are available (PDBT 2019). Since PDBR only includes the news genre, the performance of discourse parsers trained on it in other genres is limited. In this study, we attempted to resolve these limitations by using a source of semantic relations from which discourse relations can be deduced.

PDTBプロジェクトは、談話関係は明示的な単語またはフレーズ(談話接続、談話指示)の識別可能なセットまたは単に2つのセンテンスの隣接に基礎をなす、という観察によって着想された。PTDBは、自然言語処理分野における多くの研究者によって、および、より最近では、精神言語学における研究者によって、用いられている。それはまた、他の言語および領域における同様のリソースの開発も刺激した。PDTB3.0が構築される複雑性と談話パーサが取り扱うことができる複雑性との間には強い不一致がある。以前のモデルでトレーニングされた談話パーサは、PDTB3.0で用いられる非常に具体的な関係を認識するのに、性能が非常に乏しい。したがって、この章で説明される改善は、談話構文解析の下流適用に不可欠である。 The PDTB project was inspired by the observation that discourse relations are based on an identifiable set of explicit words or phrases (discourse junctions, discourse directives) or simply the adjacency of two sentences. PTDB is used by many researchers in the field of natural language processing and, more recently, by researchers in psycholinguistics. It has also stimulated the development of similar resources in other languages and domains. There is a strong discrepancy between the complexity with which PDTB 3.0 is built and the complexity a discourse parser can handle. Discourse parsers trained on previous models perform very poorly in recognizing the very specific relationships used in PDTB 3.0. Therefore, the improvements described in this chapter are essential for downstream applications of discourse parsing.

例示的なコンピューティングシステム
図49は、上記局面のうちの1つを実現するための分散型システム4900を示す簡略図である。例示された局面においては、分散型システム4900は、1つ以上のネットワーク4910を介して、ウェブブラウザ、プロプライエタリクライアント(たとえばオラクルフォーム)などのクライアントアプリケーションを実行して動作させるように構成される1つ以上のクライアントコンピューティングデバイス4902、4904、4906および4908を含む。サーバ4912は、ネットワーク4910を介してリモートクライアントコンピューティングデバイス4902、4904、4906および4908と通信可能に結合されてもよい。
Exemplary Computing System FIG. 49 is a simplified diagram illustrating a distributed system 4900 for implementing one of the aspects described above. In the illustrated aspect, distributed system 4900 includes one or more client computing devices 4902, 4904, 4906 and 4908 configured to run and operate client applications such as web browsers, proprietary clients (e.g., Oracle forms), etc., via one or more networks 4910. Server 4912 may be communicatively coupled to remote client computing devices 4902 , 4904 , 4906 and 4908 via network 4910 .

さまざまな局面においては、サーバ4912は、システムの構成要素のうち1つ以上によって提供される1つ以上のサービスまたはソフトウェアアプリケーションを実行するように適合されてもよい。サービスまたはソフトウェアアプリケーションは非仮想環境および仮想環境を含み得る。仮想環境は、2次元または3次元(three-dimensional:3D)表現、ページベースの論理的環境などであろうとなかろうと、仮想イベント、トレードショー、シミュレータ、クラスルーム、購買商品取引および企業活動のために用いられるものを含み得る。いくつかの局面においては、これらのサービスは、ウェブベースのサービスもしくはクラウドサービスとして、またはソフトウェア・アズ・ア・サービス(Software as a Service:SaaS)モデルのもとで、クライアントコンピューティングデバイス4902,4904,4906および/または4908のユーザに供給されてもよい。そして、クライアントコンピューティングデバイス4902,4904,4906および/または4908を動作させるユーザは、1つ以上のクライアントアプリケーションを利用して、サーバ4912と相互作用して、これらの構成要素によって提供されるサービスを利用し得る。 In various aspects, server 4912 may be adapted to run one or more services or software applications provided by one or more of the components of the system. A service or software application may include non-virtual and virtual environments. Virtual environments, whether two-dimensional or three-dimensional (3D) representations, page-based logical environments, etc., can include those used for virtual events, trade shows, simulators, classrooms, purchasing merchandise, and corporate activities. In some aspects, these services may be provided to users of client computing devices 4902, 4904, 4906 and/or 4908 as web-based or cloud services or under a Software as a Service (SaaS) model. Users operating client computing devices 4902, 4904, 4906 and/or 4908 may then utilize one or more client applications to interact with server 4912 and utilize the services provided by these components.

図に示されている構成では、システム4900のソフトウェアコンポーネント4918,4920および4922は、サーバ4912上に実装されるように示されている。また、他の局面においては、分散型システム4900の構成要素のうちの1つ以上および/またはこれらの構成要素によって提供されるサービスは、クライアントコンピューティングデバイス4902,4904,4906および/または4908のうちの1つ以上によって実現されてもよい。その場合、クライアントコンピューティングデバイスを動作させるユーザは、1つ以上のクライアントアプリケーションを利用して、これらの構成要素によって提供されるサービスを使用し得る。これらの構成要素は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの組合せで実現されてもよい。分散型システム4900とは異なり得るさまざまな異なるシステム構成が可能であることが理解されるべきである。したがって、図に示されている局面は、局面のシステムを実現するための分散型システムの一例であり、限定的であるよう意図されたものではない。 In the illustrated configuration, software components 4918 , 4920 and 4922 of system 4900 are shown implemented on server 4912 . Also, in other aspects, one or more of the components of distributed system 4900 and/or services provided by those components may be implemented by one or more of client computing devices 4902, 4904, 4906 and/or 4908. A user operating a client computing device may then utilize one or more client applications to use the services provided by these components. These components may be implemented in hardware, firmware, software, or a combination thereof. It should be appreciated that a variety of different system configurations are possible that may differ from distributed system 4900 . Accordingly, the aspects shown in the figures are an example of distributed systems for implementing systems of aspects and are not intended to be limiting.

クライアントコンピューティングデバイス4902,4904,4906および/または4908は、手持ち式携帯機器(たとえばiPhone(登録商標)、携帯電話、iPad(登録商標)、計算タブレット、パーソナルデジタルアシスタント(personal digital assistant:PDA))またはウェアラブル装置(たとえばグーグルグラス(登録商標)ヘッドマウントディスプレイ)であってもよく、当該装置は、マイクロソフト・ウィンドウズ(登録商標)・モバイル(登録商標)などのソフトウェアを実行し、および/または、iOS、ウィンドウズ・フォン、アンドロイド、ブラックベリー10、パームOSなどのさまざまなモバイルオペレーティングシステムを実行し、インターネット、eメール、ショート・メッセージ・サービス(short message service:SMS)、ブラックベリー(登録商標)、または使用可能な他の通信プロトコルである。クライアントコンピューティングデバイスは、汎用パーソナルコンピュータであってもよく、当該汎用パーソナルコンピュータは、一例として、マイクロソフトウィンドウズ(登録商標)、アップルマッキントッシュ(登録商標)および/またはリナックス(登録商標)オペレーティングシステムのさまざまなバージョンを実行するパーソナルコンピュータおよび/またはラップトップコンピュータを含む。クライアントコンピューティングデバイスは、ワークステーションコンピュータであってもよく、当該ワークステーションコンピュータは、たとえばGoogle Chrome OSなどのさまざまなGNU/リナックスオペレーティングシステムを含むがこれらに限定されるものではないさまざまな市販のUNIX(登録商標)またはUNIXライクオペレーティングシステムのうちのいずれかを実行する。代替的には、または付加的には、クライアントコンピューティングデバイス4902,4904,4906および4908は、シン・クライアントコンピュータ、インターネットにより可能なゲーミングシステム(たとえばキネクト(登録商標)ジェスチャ入力装置を備えるかまたは備えないマイクロソフトXボックスゲーム機)、および/または、ネットワーク4910を介して通信が可能なパーソナルメッセージング装置などのその他の電子装置であってもよい。 Client computing devices 4902, 4904, 4906 and/or 4908 may be handheld mobile devices (e.g., iPhones, cell phones, iPads, computing tablets, personal digital assistants (PDAs)) or wearable devices (e.g., Google Glass head-mounted displays) that run software such as Microsoft Windows Mobile and/or iOS. , Windows Phone, Android, BlackBerry 10, Palm OS, Internet, email, short message service (SMS), BlackBerry®, or any other communication protocol available. The client computing device may be a general purpose personal computer, which includes, by way of example, personal computers and/or laptop computers running various versions of Microsoft Windows®, Apple Macintosh® and/or Linux® operating systems. The client computing device may be a workstation computer running any of a variety of commercially available UNIX or UNIX-like operating systems including, but not limited to, various GNU/Linux operating systems such as Google Chrome OS. Alternatively or additionally, client computing devices 4902, 4904, 4906, and 4908 may be thin client computers, Internet-enabled gaming systems (e.g., Microsoft X-Box game consoles with or without Kinect® gesture input devices), and/or other electronic devices such as personal messaging devices capable of communicating over network 4910.

例示的な分散型システム4900は、4個のクライアントコンピューティングデバイスを有するように示されているが、任意の数のクライアントコンピューティングデバイスがサポートされてもよい。センサを有する装置などの他の装置が、サーバ4912と相互作用してもよい。 Although exemplary distributed system 4900 is shown with four client computing devices, any number of client computing devices may be supported. Other devices, such as devices with sensors, may interact with server 4912 .

分散型システム4900におけるネットワーク4910は、さまざまな市販のプロトコルのうちのいずれかを用いてデータ通信をサポートすることができる、当業者になじみのある任意のタイプのネットワークであってもよく、当該プロトコルは、TCP/IP(伝送制御プロトコル/インターネットプロトコル)、SNA(システムネットワークアーキテクチャ)、IPX(インターネットパケット交換)、アップルトークなどを含むが、これらに限定されるものではない。単に一例として、ネットワーク4910は、イーサネット(登録商標)、トークンリングなどに基づくものなどのローカルエリアネットワーク(LAN)であってもよい。ネットワーク4910は、広域ネットワークおよびインターネットであってもよい。ネットワーク4910は、仮想ネットワークを含んでいてもよく、当該仮想ネットワークは、仮想プライベートネットワーク(virtual private network:VPN)、イントラネット、エクストラネット、公衆交換電話網(public switched telephone network:PSTN)、赤外線ネットワーク、無線ネットワーク(たとえば米国電気電子学会(Institute of Electrical and Electronics:IEEE)802.28の一連のプロトコル、ブルートゥース(登録商標)および/またはその他の無線プロトコルのうちのいずれかのもとで動作するネットワーク)、および/またはこれらの任意の組合せ、および/または他のネットワークを含むが、これらに限定されるものではない。 Network 4910 in distributed system 4900 may be any type of network familiar to those skilled in the art capable of supporting data communications using any of a variety of commercially available protocols, including but not limited to TCP/IP (Transmission Control Protocol/Internet Protocol), SNA (Systems Network Architecture), IPX (Internet Packet Exchange), AppleTalk, and the like. Solely by way of example, network 4910 may be a local area network (LAN), such as those based on Ethernet, Token Ring, or the like. Network 4910 may be a wide area network and the Internet. Network 4910 may include a virtual network, which may include a virtual private network (VPN), an intranet, an extranet, a public switched telephone network (PSTN), an infrared network, a wireless network (eg, a network operating under any of the Institute of Electrical and Electronics (IEEE) 802.28 suite of protocols, Bluetooth and/or other wireless protocols), and/or these. and/or other networks.

サーバ4912は、1つ以上の汎用コンピュータ、専用サーバコンピュータ(一例として、PC(パーソナルコンピュータ)サーバ、UNIX(登録商標)サーバ、ミッドレンジサーバ、メインフレームコンピュータ、ラックマウント式サーバなどを含む)、サーバファーム、サーバクラスタ、またはその他の適切な構成および/または組合せで構成され得る。サーバ4912は、仮想オペレーティングシステムを実行する1つ以上の仮想マシン、または仮想化を含む他のコンピューティングアーキテクチャを含み得る。論理記憶装置の1つ以上のフレキシブルプールは、サーバのための仮想記憶デバイスを維持するように仮想化することができる。仮想ネットワークは、ソフトウェア定義型ネットワーキングを用いて、サーバ4912によって制御することができる。さまざまな局面においては、サーバ4912は、上記の開示に記載されている1つ以上のサービスまたはソフトウェアアプリケーションを実行するように適合され得る。たとえば、サーバ4912は、本開示の局面に係る上記の処理を実行するためのサーバに対応してもよい。 Server 4912 may consist of one or more general-purpose computers, dedicated server computers (including, by way of example, personal computer (PC) servers, UNIX servers, midrange servers, mainframe computers, rack-mounted servers, etc.), server farms, server clusters, or other suitable configurations and/or combinations. Server 4912 may include one or more virtual machines running virtual operating systems, or other computing architectures that include virtualization. One or more flexible pools of logical storage can be virtualized to maintain virtual storage devices for servers. The virtual network can be controlled by server 4912 using software defined networking. In various aspects, server 4912 may be adapted to run one or more services or software applications described in the above disclosures. For example, server 4912 may correspond to a server for performing the above-described processes according to aspects of this disclosure.

サーバ4912は、上記のもののうちのいずれか、および、任意の市販のサーバオペレーティングシステムを含むオペレーティングシステムを実行し得る。また、サーバ4912は、ハイパーテキスト転送プロトコル(hypertext transport protocol:HTTP)サーバ、ファイル転送プロトコル(file transfer protocol:FTP)サーバ、共通ゲートウェイインターフェース(common gateway interface:CGI)サーバ、JAVA(登録商標)サーバ、データベースサーバなどを含むさまざまな付加的サーバアプリケーションおよび/または中間層アプリケーションのうちのいずれかを実行し得る。例示的なデータベースサーバは、オラクル社(Oracle)、マイクロソフト社(Microsoft)、サイベース社(Sybase)、IBM社(International Business Machines)などから市販されているものを含むが、これらに限定されるものではない。 Server 4912 may run an operating system, including any of those listed above, as well as any commercially available server operating system. Server 4912 may also run any of a variety of additional server and/or middle-tier applications, including hypertext transport protocol (HTTP) servers, file transfer protocol (FTP) servers, common gateway interface (CGI) servers, JAVA servers, database servers, and the like. Exemplary database servers include, but are not limited to, those commercially available from Oracle, Microsoft, Sybase, International Business Machines, and the like.

いくつかの実現例では、サーバ4912は、クライアントコンピューティングデバイス4902,4904,4906および4908のユーザから受取ったデータフィードおよび/またはイベント更新を分析および統合するための1つ以上のアプリケーションを含み得る。一例として、データフィードおよび/またはイベント更新は、1つ以上の第三者情報源および連続的なデータストリームから受信されるTwitter(登録商標)フィード、Facebook(登録商標)更新またはリアルタイム更新を含み得るが、これらに限定されるものではなく、センサデータアプリケーション、金融ティッカ、ネットワーク性能測定ツール(たとえばネットワークモニタリングおよびトラフィック管理アプリケーション)、クリックストリーム分析ツール、自動車交通モニタリングなどに関連するリアルタイムイベントを含み得る。また、サーバ4912は、クライアントコンピューティングデバイス4902,4904,4906および4908の1つ以上の表示装置を介してデータフィードおよび/またはリアルタイムイベントを表示するための1つ以上のアプリケーションを含み得る。 In some implementations, server 4912 may include one or more applications for analyzing and aggregating data feeds and/or event updates received from users of client computing devices 4902 , 4904 , 4906 and 4908 . By way of example, data feeds and/or event updates may include, but are not limited to, Twitter feeds, Facebook updates, or real-time updates received from one or more third-party sources and continuous data streams, and may include real-time events associated with sensor data applications, financial tickers, network performance measurement tools (e.g., network monitoring and traffic management applications), clickstream analysis tools, automotive traffic monitoring, and the like. Server 4912 may also include one or more applications for displaying data feeds and/or real-time events via one or more displays of client computing devices 4902 , 4904 , 4906 and 4908 .

また、分散型システム4900は、1つ以上のデータベース4914および4916を含み得る。データベース4914および4916は、さまざまな場所に存在し得る。一例として、データベース4914および4916の1つ以上は、サーバ4912にローカルな(および/または存在する)非一時的な記憶媒体に存在していてもよい。代替的に、データベース4914および4916は、サーバ4912から遠く離れていて、ネットワークベースまたは専用の接続を介してサーバ4912と通信してもよい。一組の局面においては、データベース4914および4916は、記憶領域ネットワーク(storage-area network:SAN)に存在していてもよい。同様に、サーバ4912に起因する機能を実行するための任意の必要なファイルが、サーバ4912上にローカルに、および/または、リモートで適宜格納されていてもよい。一組の局面においては、データベース4914および4916は、SQLフォーマットコマンドに応答してデータを格納、更新および検索するように適合された、オラクル社によって提供されるデータベースなどのリレーショナルデータベースを含み得る。 Distributed system 4900 may also include one or more databases 4914 and 4916 . Databases 4914 and 4916 may reside in various locations. As an example, one or more of databases 4914 and 4916 may reside on non-transitory storage media local to (and/or residing on) server 4912 . Alternatively, databases 4914 and 4916 may be remote from server 4912 and communicate with server 4912 via network-based or dedicated connections. In one set of aspects, databases 4914 and 4916 may reside in a storage-area network (SAN). Similarly, any necessary files to perform functions attributed to server 4912 may be stored locally and/or remotely on server 4912 as appropriate. In one set of aspects, databases 4914 and 4916 may comprise relational databases, such as those provided by Oracle Corporation, adapted to store, update and retrieve data in response to SQL formatted commands.

図50は、本開示の一局面に係る、一局面のシステムの1つ以上の構成要素によって提供されるサービスをクラウドサービスとして供給することができるシステム環境5000の1つ以上の構成要素の簡略化されたブロック図である。示されている局面においては、システム環境5000は、クラウドサービスを提供するクラウドインフラストラクチャシステム5002と相互作用するようにユーザによって使用され得る1つ以上のクライアントコンピューティングデバイス5004,5006および5008を含む。クライアントコンピューティングデバイスは、クラウドインフラストラクチャシステム5002によって提供されるサービスを使用するためにクラウドインフラストラクチャシステム5002と相互作用するようにクライアントコンピューティングデバイスのユーザによって使用され得る、ウェブブラウザ、専有のクライアントアプリケーション(たとえばオラクルフォームズ)または他のアプリケーションなどのクライアントアプリケーションを動作させるように構成され得る。 FIG. 50 is a simplified block diagram of one or more components of a system environment 5000 in which services provided by one or more components of one aspect system can be provided as cloud services, according to one aspect of the present disclosure. In the depicted aspect, the system environment 5000 includes one or more client computing devices 5004, 5006 and 5008 that can be used by users to interact with a cloud infrastructure system 5002 that provides cloud services. A client computing device may be configured to run a client application, such as a web browser, proprietary client application (e.g., Oracle Forms), or other application that may be used by a user of the client computing device to interact with the cloud infrastructure system 5002 to use the services provided by the cloud infrastructure system 5002.

図に示されているクラウドインフラストラクチャシステム5002が図示されている構成要素とは他の構成要素を有し得ることが理解されるべきである。さらに、図に示されている局面は、本発明の局面を組込むことができるクラウドインフラストラクチャシステムの一例に過ぎない。いくつかの他の局面においては、クラウドインフラストラクチャシステム5002は、図に示されているものよりも多いまたは少ない数の構成要素を有していてもよく、2つ以上の構成要素を組合せてもよく、または構成要素の異なる構成または配置を有していてもよい。 It should be appreciated that the illustrated cloud infrastructure system 5002 may have other components than those shown. Additionally, the aspects shown in the figures are only one example of a cloud infrastructure system that may incorporate aspects of the present invention. In some other aspects, the cloud infrastructure system 5002 may have more or fewer components than shown, may combine two or more components, or may have different configurations or arrangements of components.

クライアントコンピューティングデバイス5004,5006および5008は、4902,4904,4906および4908について上記したものと類似のデバイスであってもよい。 Client computing devices 5004 , 5006 and 5008 may be devices similar to those described above for 4902 , 4904 , 4906 and 4908 .

例示的なシステム環境5000は3個のクライアントコンピューティングデバイスを有するように示されているが、任意の数のクライアントコンピューティングデバイスがサポートされてもよい。センサなどを有する装置などの他の装置が、クラウドインフラストラクチャシステム5002と相互作用してもよい。 Although the exemplary system environment 5000 is shown with three client computing devices, any number of client computing devices may be supported. Other devices, such as devices having sensors and the like, may interact with cloud infrastructure system 5002 .

ネットワーク5010は、クライアント5004,5006および5008とクラウドインフラストラクチャシステム5002との間のデータの通信およびやりとりを容易にし得る。各々のネットワークは、ネットワーク4910について上記したものを含むさまざまな市販のプロトコルのうちのいずれかを用いてデータ通信をサポートすることができる、当業者になじみのある任意のタイプのネットワークであってもよい。 Network 5010 may facilitate communication and exchange of data between clients 5004 , 5006 and 5008 and cloud infrastructure system 5002 . Each network may be any type of network familiar to those skilled in the art capable of supporting data communication using any of a variety of commercially available protocols, including those described above for network 4910.

クラウドインフラストラクチャシステム5002は、サーバ4912について上記したものを含み得る1つ以上のコンピュータおよび/またはサーバを備え得る。 Cloud infrastructure system 5002 may comprise one or more computers and/or servers, which may include those described above for server 4912 .

特定の局面においては、クラウドインフラストラクチャシステムによって提供されるサービスは、オンラインデータ記憶およびバックアップソリューション、ウェブベースのeメールサービス、ホスト型オフィススイートおよびドキュメントコラボレーションサービス、データベース処理、管理技術サポートサービスなどの、クラウドインフラストラクチャシステムのユーザがオンデマンドで利用可能な多数のサービスを含み得る。クラウドインフラストラクチャシステムによって提供されるサービスは、そのユーザのニーズを満たすように動的にスケーリング可能である。クラウドインフラストラクチャシステムによって提供されるサービスの具体的なインスタンス化は、本明細書では「サービスインスタンス」と称される。一般に、インターネットなどの通信ネットワークを介してクラウドサービスプロバイダのシステムからユーザが利用可能な任意のサービスは、「クラウドサービス」と称される。通常、パブリッククラウド環境では、クラウドサービスプロバイダのシステムを構成するサーバおよびシステムは、顧客自身のオンプレミスサーバおよびシステムとは異なっている。たとえば、クラウドサービスプロバイダのシステムがアプリケーションをホストしてもよく、ユーザは、インターネットなどの通信ネットワークを介してオンデマンドで当該アプリケーションを注文および使用してもよい。 In certain aspects, the services provided by the cloud infrastructure system may include a number of services available on demand to users of the cloud infrastructure system, such as online data storage and backup solutions, web-based email services, hosted office suites and document collaboration services, database processing, administrative technical support services, and the like. Services provided by a cloud infrastructure system can be dynamically scaled to meet the needs of its users. A concrete instantiation of a service provided by a cloud infrastructure system is referred to herein as a "service instance." Generally, any service available to users from a cloud service provider's system over a communication network such as the Internet is referred to as a "cloud service." Typically, in public cloud environments, the servers and systems that make up a cloud service provider's system are different from the customer's own on-premise servers and systems. For example, a cloud service provider's system may host the application, and users may order and use the application on demand over a communication network such as the Internet.

いくつかの例では、コンピュータネットワーククラウドインフラストラクチャにおけるサービスは、ストレージ、ホスト型データベース、ホスト型ウェブサーバ、ソフトウェアアプリケーションへの保護されたコンピュータネットワークアクセス、またはクラウドベンダによってユーザに提供されるかもしくはそうでなければ当該技術分野において公知の他のサービスを含み得る。たとえば、サービスは、インターネットを介したクラウド上のリモートストレージへのパスワードによって保護されたアクセスを含み得る。別の例として、サービスは、ネットワーク化された開発者による私的使用のためのウェブサービスベースのホスト型リレーショナルデータベースおよびスクリプト言語ミドルウェアエンジンを含み得る。別の例として、サービスは、クラウドベンダのウェブサイト上でホストされるeメールソフトウェアアプリケーションへのアクセスを含み得る。 In some examples, services in a computer network cloud infrastructure may include storage, hosted databases, hosted web servers, secure computer network access to software applications, or other services provided to users by cloud vendors or otherwise known in the art. For example, a service may include password-protected access to remote storage on the cloud over the Internet. As another example, a service may include a web services-based hosted relational database and scripting language middleware engine for private use by networked developers. As another example, a service may include access to an email software application hosted on a cloud vendor's website.

特定の局面においては、クラウドインフラストラクチャシステム5002は、セルフサービスの、サブスクリプションベースの、弾性的にスケーラブルな、信頼性のある、高可用性の、安全な態様で顧客に配信される一連のアプリケーション、ミドルウェアおよびデータベースサービス提供品を含み得る。このようなクラウドインフラストラクチャシステムの一例は、本譲受人によって提供されるオラクルパブリッククラウドである。 In certain aspects, cloud infrastructure system 5002 may include a set of application, middleware, and database service offerings delivered to customers in a self-service, subscription-based, elastically scalable, reliable, highly available, and secure manner. An example of such a cloud infrastructure system is the Oracle Public Cloud provided by the Assignee.

時としてビッグデータとも称される大量のデータは、インフラストラクチャシステムによって、多数のレベルにおいて、および異なるスケールでホストおよび/または操作され得る。このようなデータが含み得るデータセットは、非常に大型で複雑であるので、典型的なデータベース管理ツールまたは従来のデータ処理アプリケーションを用いて処理するのが困難になる可能性がある。たとえば、テラバイトのデータはパーソナルコンピュータまたはそれらのラックベースの対応物を用いて格納、検索取得および処理することが難しいかもしれない。このようなサイズのデータは、最新のリレーショナルデータベース管理システムおよびデスクトップ統計ならびに視覚化パッケージを用いて機能させるのが困難である可能性がある。それらは、データを許容可能な経過時間内に捕捉しキュレーションし管理し処理するよう、一般的に用いられるソフトウェアツールの構造を超えて、何千ものサーバコンピュータを動作させる大規模並列処理ソフトウェアを必要とし得る。 Large amounts of data, sometimes referred to as big data, can be hosted and/or manipulated by infrastructure systems at multiple levels and at different scales. Such data may contain data sets that are so large and complex that they can be difficult to process using typical database management tools or conventional data processing applications. For example, terabytes of data may be difficult to store, retrieve, and process using personal computers or their rack-based counterparts. Data of this size can be difficult to work with modern relational database management systems and desktop statistical and visualization packages. They can go beyond the fabric of commonly used software tools and require massively parallel processing software running thousands of server computers to capture, curate, manage and process data within an acceptable elapsed time.

大量のデータを視覚化し、トレンドを検出し、および/または、データと相互作用させるために、分析者および研究者は極めて大きいデータセットを格納し処理することができる。平行にリンクされた何十、何百または何千ものプロセッサがこのようなデータに対して作用可能であり、これにより、このようなデータを表示し得るか、または、データに対する外力をシミュレートし得るかもしくはそれが表しているものをシミュレートし得る。これらのデータセットは、データベースにおいて編制されたデータ、もしくは構造化モデルに従ったデータ、および/または、非体系的なデータ(たとえば電子メール、画像、データブロブ(バイナリ大型オブジェクト)、ウェブページ、複雑なイベント処理)などの構造化されたデータを必要とする可能性がある。目標物に対してより多くの(またはより少数の)コンピューティングリソースを比較的迅速に集中させるために局面の能力を強化することにより、ビジネス、政府関係機関、研究組織、私人、同じ目的をもった個々人もしくは組織のグループ、または他のエンティティからの要求に基づいて大量のデータセット上でタスクを実行するために、クラウドインフラストラクチャシステムがより良好に利用可能となる。 In order to visualize, detect trends, and/or interact with large amounts of data, analysts and researchers can store and process extremely large data sets. Dozens, hundreds or thousands of processors linked in parallel can operate on such data, thereby displaying such data or simulating external forces on the data or what it represents. These datasets may require structured data such as data organized in databases or according to a structured model and/or unstructured data (e.g. emails, images, data blobs (binary large objects), web pages, complex event processing). By enhancing an aspect's ability to focus more (or fewer) computing resources on a target relatively quickly, cloud infrastructure systems are better available to perform tasks on large data sets based on demand from businesses, government agencies, research organizations, private individuals, groups of like-minded individuals or organizations, or other entities.

さまざまな局面においては、クラウドインフラストラクチャシステム5002は、クラウドインフラストラクチャシステム5002によって供給されるサービスへの顧客のサブスクリプションを自動的にプロビジョニング、管理および追跡するように適合され得る。クラウドインフラストラクチャシステム5002は、さまざまなデプロイメントモデルを介してクラウドサービスを提供し得る。たとえば、クラウドインフラストラクチャシステム5002が、(たとえばオラクル社によって所有される)クラウドサービスを販売する組織によって所有され、一般大衆またはさまざまな産業企業がサービスを利用できるパブリッククラウドモデルのもとでサービスが提供されてもよい。別の例として、クラウドインフラストラクチャシステム5002が単一の組織のためだけに運営され、当該組織内の1つ以上のエンティティにサービスを提供し得るプライベートクラウドモデルのもとでサービスが提供されてもよい。また、クラウドインフラストラクチャシステム5002およびクラウドインフラストラクチャシステム5002によって提供されるサービスが、関連のコミュニティ内のいくつかの組織によって共有されるコミュニティクラウドモデルのもとでクラウドサービスが提供されてもよい。また、2つ以上の異なるモデルの組合せであるハイブリッドクラウドモデルのもとでクラウドサービスが提供されてもよい。 In various aspects, cloud infrastructure system 5002 may be adapted to automatically provision, manage and track customer subscriptions to services provided by cloud infrastructure system 5002 . Cloud infrastructure system 5002 may provide cloud services via various deployment models. For example, cloud infrastructure system 5002 may be owned by an organization that sells cloud services (e.g., owned by Oracle Corporation), and serviced under a public cloud model in which the service is available to the general public or various industrial enterprises. As another example, cloud infrastructure system 5002 may be operated solely for a single organization and service may be provided under a private cloud model, which may serve one or more entities within that organization. Cloud services may also be provided under a community cloud model in which the cloud infrastructure system 5002 and the services provided by the cloud infrastructure system 5002 are shared by several organizations within an associated community. Cloud services may also be provided under a hybrid cloud model, which is a combination of two or more different models.

いくつかの局面においては、クラウドインフラストラクチャシステム5002によって提供されるサービスは、ソフトウェア・アズ・ア・サービス(Software as a Service:SaaS)カテゴリ、プラットフォーム・アズ・ア・サービス(Platform as a Service:PaaS)カテゴリ、インフラストラクチャ・アズ・ア・サービス(Infrastructure as a Service:IaaS)カテゴリ、またはハイブリッドサービスを含むサービスの他のカテゴリのもとで提供される1つ以上のサービスを含み得る。顧客は、サブスクリプションオーダーによって、クラウドインフラストラクチャシステム5002によって提供される1つ以上のサービスをオーダーし得る。次いで、クラウドインフラストラクチャシステム5002は、顧客のサブスクリプションオーダーでサービスを提供するために処理を実行する。 In some aspects, the services provided by cloud infrastructure system 5002 may include one or more services provided under a Software as a Service (SaaS) category, a Platform as a Service (PaaS) category, an Infrastructure as a Service (IaaS) category, or other categories of services, including hybrid services. A customer may order one or more services provided by the cloud infrastructure system 5002 through a subscription order. The cloud infrastructure system 5002 then performs processing to provide the service on the customer's subscription order.

いくつかの局面においては、クラウドインフラストラクチャシステム5002によって提供されるサービスは、アプリケーションサービス、プラットフォームサービスおよびインフラストラクチャサービスを含み得るが、これらに限定されるものではない。いくつかの例では、アプリケーションサービスは、SaaSプラットフォームを介してクラウドインフラストラクチャシステムによって提供されてもよい。SaaSプラットフォームは、SaaSカテゴリに分類されるクラウドサービスを提供するように構成され得る。たとえば、SaaSプラットフォームは、一体化された開発およびデプロイメントプラットフォーム上で一連のオンデマンドアプリケーションを構築および配信するための機能を提供し得る。SaaSプラットフォームは、SaaSサービスを提供するための基本的なソフトウェアおよびインフラストラクチャを管理および制御し得る。SaaSプラットフォームによって提供されるサービスを利用することによって、顧客は、クラウドインフラストラクチャシステムで実行されるアプリケーションを利用することができる。顧客は、顧客が別々のライセンスおよびサポートを購入する必要なく、アプリケーションサービスを取得することができる。さまざまな異なるSaaSサービスが提供されてもよい。例としては、大規模組織のための販売実績管理、企業統合およびビジネスの柔軟性のためのソリューションを提供するサービスが挙げられるが、これらに限定されるものではない。 In some aspects, services provided by cloud infrastructure system 5002 may include, but are not limited to, application services, platform services, and infrastructure services. In some examples, application services may be provided by a cloud infrastructure system via a SaaS platform. A SaaS platform may be configured to provide cloud services that fall into the SaaS category. For example, a SaaS platform may provide functionality for building and delivering a suite of on-demand applications on a unified development and deployment platform. A SaaS platform may manage and control the underlying software and infrastructure for providing SaaS services. By using the services provided by the SaaS platform, customers can take advantage of applications running on cloud infrastructure systems. Customers can acquire application services without the need for customers to purchase separate licenses and support. A variety of different SaaS services may be offered. Examples include, but are not limited to, services that provide solutions for sales performance management, enterprise consolidation and business flexibility for large organizations.

いくつかの局面においては、プラットフォームサービスは、PaaSプラットフォームを介してクラウドインフラストラクチャシステムによって提供されてもよい。PaaSプラットフォームは、PaaSカテゴリに分類されるクラウドサービスを提供するように構成され得る。プラットフォームサービスの例としては、組織(オラクル社など)が既存のアプリケーションを共有の共通アーキテクチャ上で統合することを可能にするサービス、および、プラットフォームによって提供される共有のサービスを活用する新たなアプリケーションを構築する機能を挙げることができるが、これらに限定されるものではない。PaaSプラットフォームは、PaaSサービスを提供するための基本的なソフトウェアおよびインフラストラクチャを管理および制御し得る。顧客は、顧客が別々のライセンスおよびサポートを購入する必要なく、クラウドインフラストラクチャシステムによって提供されるPaaSサービスを取得することができる。プラットフォームサービスの例としては、オラクルJavaクラウドサービス(Java Cloud Service:JCS)、オラクルデータベースクラウドサービス(Database Cloud Service:DBCS)などが挙げられるが、これらに限定されるものではない。 In some aspects, platform services may be provided by a cloud infrastructure system via a PaaS platform. A PaaS platform may be configured to provide cloud services that fall into the PaaS category. Examples of platform services include, but are not limited to, services that enable an organization (such as Oracle) to integrate existing applications on a shared common architecture, and the ability to build new applications that leverage shared services provided by the platform. A PaaS platform may manage and control the underlying software and infrastructure for providing PaaS services. Customers can acquire PaaS services provided by cloud infrastructure systems without the need for customers to purchase separate licenses and support. Examples of platform services include, but are not limited to, Oracle Java Cloud Service (JCS), Oracle Database Cloud Service (DBCS), and the like.

PaaSプラットフォームによって提供されるサービスを利用することによって、顧客は、クラウドインフラストラクチャシステムによってサポートされるプログラミング言語およびツールを利用することができ、デプロイされたサービスを制御することもできる。いくつかの局面においては、クラウドインフラストラクチャシステムによって提供されるプラットフォームサービスは、データベースクラウドサービス、ミドルウェアクラウドサービル(たとえばオラクルフージョンミドルウェアサービス)およびJavaクラウドサービスを含み得る。一局面においては、データベースクラウドサービスは、組織がデータベースリソースをプールしてデータベースクラウドの形態でデータベース・アズ・ア・サービスを顧客に供給することを可能にする共有のサービスデプロイメントモデルをサポートし得る。ミドルウェアクラウドサービスは、クラウドインフラストラクチャシステムにおいてさまざまなビジネスアプリケーションを開発およびデプロイするために顧客にプラットフォームを提供し得るともに、Javaクラウドサービスは、クラウドインフラストラクチャシステムにおいてJavaアプリケーションをデプロイするために顧客にプラットフォームを提供し得る。 By using the services provided by the PaaS platform, customers can take advantage of the programming languages and tools supported by the cloud infrastructure system and also control the deployed services. In some aspects, platform services provided by the cloud infrastructure system may include database cloud services, middleware cloud services (eg, Oracle Fusion middleware services) and Java cloud services. In one aspect, the database cloud service may support a shared service deployment model that allows an organization to pool database resources and provide database-as-a-service to customers in the form of a database cloud. The middleware cloud service may provide a platform for customers to develop and deploy various business applications on the cloud infrastructure system, and the Java cloud service may provide a platform for customers for deploying Java applications on the cloud infrastructure system.

さまざまな異なるインフラストラクチャサービスは、クラウドインフラストラクチャシステムにおけるIaaSプラットフォームによって提供されてもよい。インフラストラクチャサービスは、ストレージ、ネットワークなどの基本的な計算リソース、ならびに、SaaSプラットフォームおよびPaaSプラットフォームによって提供されるサービスを利用する顧客のための他の基礎的な計算リソースの管理および制御を容易にする。 Various different infrastructure services may be provided by the IaaS platform in the cloud infrastructure system. Infrastructure services facilitate the management and control of basic computing resources such as storage, networks, and other basic computing resources for customers who utilize services provided by SaaS and PaaS platforms.

また、特定の局面においては、クラウドインフラストラクチャシステム5002は、クラウドインフラストラクチャシステムの顧客にさまざまなサービスを提供するために使用されるリソースを提供するためのインフラストラクチャリソース5030を含み得る。一局面においては、インフラストラクチャリソース5030は、PaaSプラットフォームおよびSaaSプラットフォームによって提供されるサービスを実行するための、サーバ、ストレージおよびネットワーキングリソースなどのハードウェアの予め一体化された最適な組合せを含み得る。 In certain aspects, cloud infrastructure system 5002 may also include infrastructure resources 5030 for providing resources used to provide various services to customers of the cloud infrastructure system. In one aspect, infrastructure resources 5030 may include a pre-integrated optimal combination of hardware such as servers, storage and networking resources for running the PaaS platform and services provided by the SaaS platform.

いくつかの局面においては、クラウドインフラストラクチャシステム5002におけるリソースは、複数のユーザによって共有され、デマンドごとに動的に再割り振りされてもよい。また、リソースは、異なる時間帯にユーザに割り振られてもよい。たとえば、クラウドインフラストラクチャシステム5030は、第1の時間帯におけるユーザの第1の組が規定の時間にわたってクラウドインフラストラクチャシステムのリソースを利用することを可能にし得るとともに、異なる時間帯に位置するユーザの別の組への同一のリソースの再割り振りを可能にし得ることによって、リソースの利用を最大化することができる。 In some aspects, resources in the cloud infrastructure system 5002 may be shared by multiple users and dynamically reallocated on a per demand basis. Also, resources may be allocated to users at different times. For example, the cloud infrastructure system 5030 may allow a first set of users in a first time zone to utilize resources of the cloud infrastructure system for a defined period of time, and may allow reallocation of the same resources to another set of users located in different time zones, thereby maximizing resource utilization.

特定の局面においては、クラウドインフラストラクチャシステム5002のさまざまな構成要素またはモジュール、および、クラウドインフラストラクチャシステム5002によって提供されるサービス、によって共有されるいくつかの内部共有サービス5032が提供され得る。これらの内部共有サービスは、セキュリティおよびアイデンティティサービス、インテグレーションサービス、企業リポジトリサービス、企業マネージャサービス、ウイルススキャンおよびホワイトリストサービス、高可用性・バックアップおよび回復サービス、クラウドサポートを可能にするためのサービス、eメールサービス、通知サービス、ファイル転送サービスなどを含み得るが、これらに限定されるものではない。 In certain aspects, a number of internal shared services 5032 shared by various components or modules of cloud infrastructure system 5002 and services provided by cloud infrastructure system 5002 may be provided. These internal shared services may include, but are not limited to, security and identity services, integration services, enterprise repository services, enterprise manager services, virus scanning and whitelisting services, high availability and backup and recovery services, services to enable cloud support, email services, notification services, file transfer services, and the like.

特定の局面においては、クラウドインフラストラクチャシステム5002は、クラウドインフラストラクチャシステムにおけるクラウドサービス(たとえばSaaSサービス、PaaSサービスおよびIaaSサービス)の包括的管理を提供し得る。一局面においては、クラウド管理機能は、クラウドインフラストラクチャシステム5002によって受信された顧客のサブスクリプションをプロビジョニング、管理および追跡などするための機能を含み得る。 In certain aspects, cloud infrastructure system 5002 may provide comprehensive management of cloud services (eg, SaaS, PaaS and IaaS services) in the cloud infrastructure system. In one aspect, cloud management functions may include functions for provisioning, managing, tracking, etc. customer subscriptions received by cloud infrastructure system 5002 .

一局面においては、図に示されるように、クラウド管理機能は、オーダー管理モジュール5020、オーダーオーケストレーションモジュール5022、オーダープロビジョニングモジュール5024、オーダー管理および監視モジュール5026、ならびにアイデンティティ管理モジュール5028などの1つ以上のモジュールによって提供され得る。これらのモジュールは、汎用コンピュータ、専用サーバコンピュータ、サーバファーム、サーバクラスタ、またはその他の適切な構成および/もしくは組み合わせであり得る1つ以上のコンピュータおよび/またはサーバを含み得るか、またはそれらを用いて提供され得る。 In one aspect, as shown, cloud management functionality can be provided by one or more modules such as order management module 5020, order orchestration module 5022, order provisioning module 5024, order management and monitoring module 5026, and identity management module 5028. These modules may include or be provided with one or more computers and/or servers, which may be general purpose computers, dedicated server computers, server farms, server clusters, or other suitable configurations and/or combinations.

例示的な動作5034において、クライアントデバイス5004,5006または5008などのクライアントデバイスを用いる顧客は、クラウドインフラストラクチャシステム5002によって提供される1つ以上のサービスを要求し、クラウドインフラストラクチャシステム5002によって供給される1つ以上のサービスのサブスクリプションについてオーダーを行うことによって、クラウドインフラストラクチャシステム5002と対話し得る。特定の局面においては、顧客は、クラウドユーザインターフェース(User Interface:UI)、すなわちクラウドUI5012、クラウドUI5014および/またはクラウドUI5016にアクセスして、これらのUIを介してサブスクリプションオーダーを行い得る。顧客がオーダーを行ったことに応答してクラウドインフラストラクチャシステム5002によって受信されたオーダー情報は、顧客と、顧客がサブスクライブする予定のクラウドインフラストラクチャシステム5002によって提供される1つ以上のサービスとを特定する情報を含み得る。 At exemplary operation 5034, a customer using a client device, such as client device 5004, 5006, or 5008, may interact with cloud infrastructure system 5002 by requesting one or more services provided by cloud infrastructure system 5002 and placing an order for subscriptions to one or more services provided by cloud infrastructure system 5002. In certain aspects, a customer may access a cloud User Interface (UI), namely cloud UI 5012, cloud UI 5014 and/or cloud UI 5016, and place a subscription order through these UIs. Order information received by cloud infrastructure system 5002 in response to a customer placing an order may include information identifying the customer and one or more services provided by cloud infrastructure system 5002 to which the customer is to subscribe.

オーダーが顧客によって行われた後、オーダー情報は、クラウドUI5050,5014および/または5016を介して受信される。 After the order is placed by the customer, the order information is received via cloud UI 5050, 5014 and/or 5016.

動作5036において、オーダーは、オーダーデータベース5018に格納される。オーダーデータベース5018は、クラウドインフラストラクチャシステム5018によって動作させられるとともに他のシステム要素と連携して動作させられるいくつかのデータベースのうちの1つであってもよい。 At operation 5036 the order is stored in order database 5018 . Orders database 5018 may be one of several databases operated by cloud infrastructure system 5018 and operated in conjunction with other system elements.

動作5038において、オーダー情報は、オーダー管理モジュール5020に転送される。いくつかの例では、オーダー管理モジュール5020は、オーダーの確認および確認時のオーダーの予約などのオーダーに関連する請求書発行機能および会計経理機能を実行するように構成され得る。 At operation 5038 the order information is transferred to order management module 5020 . In some examples, order management module 5020 may be configured to perform order-related billing and accounting functions, such as order confirmation and order reservation upon confirmation.

動作5040において、オーダーに関する情報は、オーダーオーケストレーションモジュール5022に通信される。オーダーオーケストレーションモジュール5022は、顧客によって行われたオーダーについてのサービスおよびリソースのプロビジョニングをオーケストレートするためにオーダー情報を利用し得る。いくつかの例では、オーダーオーケストレーションモジュール5022は、オーダープロビジョニングモジュール5024のサービスを用いてサブスクライブされたサービスをサポートするためにリソースのプロビジョニングをオーケストレートし得る。 At operation 5040 information about the order is communicated to order orchestration module 5022 . Order orchestration module 5022 may utilize order information to orchestrate the provisioning of services and resources for orders placed by customers. In some examples, order orchestration module 5022 may orchestrate the provisioning of resources to support services subscribed to using the services of order provisioning module 5024 .

特定の局面においては、オーダーオーケストレーションモジュール5022は、各々のオーダーに関連付けられるビジネスプロセスの管理を可能にし、ビジネス論理を適用してオーダーがプロビジョニングに進むべきか否かを判断する。動作5042において、新たなサブスクリプションについてのオーダーを受信すると、オーダーオーケストレーションモジュール5022は、リソースを割り振って当該サブスクリプションオーダーを満たすのに必要とされるそれらのリソースを構成するための要求をオーダープロビジョニングモジュール5024に送る。オーダープロビジョニングモジュール5024は、顧客によってオーダーされたサービスについてのリソースの割り振りを可能にする。オーダープロビジョニングモジュール5024は、クラウドインフラストラクチャシステム5000によって提供されるクラウドサービスと、要求されたサービスを提供するためのリソースをプロビジョニングするために使用される物理的実装層との間にあるレベルの抽象化を提供する。したがって、オーダーオーケストレーションモジュール5022は、サービスおよびリソースが実際に実行中にプロビジョニングされるか、事前にプロビジョニングされて要求があったときに割振られる/割当てられるのみであるかなどの実装の詳細から切り離すことができる。 In certain aspects, order orchestration module 5022 enables management of business processes associated with each order and applies business logic to determine whether an order should proceed to provisioning. At operation 5042, upon receiving an order for a new subscription, order orchestration module 5022 sends a request to order provisioning module 5024 to allocate resources and configure those resources needed to fulfill the subscription order. Order provisioning module 5024 enables allocation of resources for services ordered by customers. Order provisioning module 5024 provides a level of abstraction between the cloud services provided by cloud infrastructure system 5000 and the physical implementation layer used to provision the resources to provide the requested service. Thus, the order orchestration module 5022 can be decoupled from implementation details such as whether services and resources are actually provisioned on the fly, or pre-provisioned and only allocated/assigned on demand.

動作5049において、サービスおよびリソースがプロビジョニングされると、提供されたサービスの通知が、クラウドインフラストラクチャシステム5002のオーダープロビジョニングモジュール5024によってクライアントコンピューティングデバイス5004,5006および/または5008上の顧客に送られ得る。 At operation 5049 , once the services and resources have been provisioned, a notification of the services provided may be sent by the order provisioning module 5024 of the cloud infrastructure system 5002 to the customer on the client computing device 5004 , 5006 and/or 5008 .

動作5051において、顧客のサブスクリプションオーダーが、オーダー管理および監視モジュール5026によって管理および追跡され得る。いくつかの例では、オーダー管理および監視モジュール5026は、使用される記憶量、転送されるデータ量、ユーザの数、ならびにシステムアップ時間およびシステムダウン時間の量などのサブスクリプションオーダーにおけるサービスについての使用統計を収集するように構成され得る。 At operation 5051 , the customer's subscription orders may be managed and tracked by order management and monitoring module 5026 . In some examples, the order management and monitoring module 5026 may be configured to collect usage statistics about the services in the subscription order, such as the amount of storage used, amount of data transferred, number of users, and amount of system uptime and system downtime.

特定の局面においては、クラウドインフラストラクチャシステム5000は、アイデンティティ管理モジュール5028を含み得る。アイデンティティ管理モジュール5028は、クラウドインフラストラクチャシステム5000におけるアクセス管理および認可サービスなどのアイデンティティサービスを提供するように構成され得る。いくつかの局面においては、アイデンティティ管理モジュール5028は、クラウドインフラストラクチャシステム5002によって提供されるサービスを利用したい顧客についての情報を制御し得る。このような情報は、このような顧客のアイデンティティを認証する情報と、それらの顧客がさまざまなシステムリソース(たとえばファイル、ディレクトリ、アプリケーション、通信ポート、メモリセグメントなど)に対してどのアクションを実行することを認可されるかを記載する情報とを含み得る。また、アイデンティティ管理モジュール5028は、各々の顧客についての説明的情報、ならびに、どのようにしておよび誰によってこの説明的情報がアクセスおよび変更され得るかについての説明的情報の管理を含み得る。 In certain aspects, cloud infrastructure system 5000 may include identity management module 5028 . Identity management module 5028 may be configured to provide identity services such as access management and authorization services in cloud infrastructure system 5000 . In some aspects, identity management module 5028 may control information about customers who want to use services provided by cloud infrastructure system 5002 . Such information may include information authenticating the identity of such customers and information describing what actions those customers are authorized to perform on various system resources (e.g., files, directories, applications, communication ports, memory segments, etc.). Identity management module 5028 may also include management of descriptive information about each customer and how and by whom this descriptive information may be accessed and changed.

図51は、本発明のさまざまな局面を実現することができる例示的なコンピュータシステム5100を示す。コンピュータシステム5100は、上記のコンピュータシステムのうちのいずれかを実現するために使用され得る。図に示されているように、コンピュータシステム5100は、バスサブシステム5102を介していくつかの周辺サブシステムと通信する処理ユニット5104を含む。これらの周辺サブシステムは、処理加速ユニット5106と、I/Oサブシステム5108と、記憶サブシステム5118と、通信サブシステム5124とを含み得る。記憶サブシステム5118は、有形のコンピュータ読取可能な記憶媒体5122と、システムメモリ5110とを含む。 FIG. 51 illustrates an exemplary computer system 5100 upon which various aspects of the invention can be implemented. Computer system 5100 may be used to implement any of the computer systems described above. As shown, computer system 5100 includes a processing unit 5104 that communicates with several peripheral subsystems via bus subsystem 5102 . These peripheral subsystems may include processing acceleration unit 5106 , I/O subsystem 5108 , storage subsystem 5118 and communication subsystem 5124 . Storage subsystem 5118 includes tangible computer-readable storage media 5122 and system memory 5110 .

バスサブシステム5102は、コンピュータシステム5100のさまざまな構成要素およびサブシステムに、意図されたように互いに通信させるための機構を提供する。バスサブシステム5102は、単一のバスとして概略的に示されているが、バスサブシステムの代替的な局面は、複数のバスを利用してもよい。バスサブシステム5102は、メモリバスまたはメモリコントローラ、周辺バス、およびさまざまなバスアーキテクチャのうちのいずれかを使用するローカルバスを含むいくつかのタイプのバス構造のうちのいずれかであってもよい。たとえば、このようなアーキテクチャは、IEEE P3086.1標準に合わせて製造されたメザニンバスとして実現可能な、業界標準アーキテクチャ(Industry Standard Architecture:ISA)バス、マイクロチャネルアーキテクチャ(Micro Channel Architecture:MCA)バス、拡張ISA(Enhanced ISA:EISA)バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション(Video Electronics Standards Association:VESA)ローカルバスおよび周辺機器相互接続(Peripheral Component Interconnect:PCI)バスを含み得る。 Bus subsystem 5102 provides a mechanism for causing the various components and subsystems of computer system 5100 to communicate with each other as intended. Although bus subsystem 5102 is shown schematically as a single bus, alternate aspects of the bus subsystem may utilize multiple buses. Bus subsystem 5102 may be any of several types of bus structures including memory buses or memory controllers, peripheral buses, and local buses using any of a variety of bus architectures. For example, such architectures include Industry Standard Architecture (ISA) buses, Micro Channel Architecture (MCA) buses, Enhanced ISA (EISA) buses, Video Electronics Standards Association (VESA) local buses and Peripheral Component Interconnect (PCI) buses, which can be implemented as mezzanine buses manufactured to the IEEE P3086.1 standard. can include

1つ以上の集積回路(たとえば従来のマイクロプロセッサまたはマイクロコントローラ)として実現可能な処理ユニット5104は、コンピュータシステム5100の動作を制御する。処理ユニット5104には、1つ以上のプロセッサが含まれ得る。これらのプロセッサは、単一コアまたはマルチコアのプロセッサを含み得る。特定の局面においては、処理ユニット5104は、各々の処理ユニットに含まれる単一コアまたはマルチコアのプロセッサを有する1つ以上の独立した処理ユニット5132および/または5134として実現されてもよい。また、他の局面においては、処理ユニット5104は、2つのデュアルコアプロセッサを単一のチップに組み入れることによって形成されるクアッドコア処理ユニットとして実現されてもよい。 A processing unit 5104 , which may be implemented as one or more integrated circuits (eg, a conventional microprocessor or microcontroller), controls the operation of computer system 5100 . Processing unit 5104 may include one or more processors. These processors may include single-core or multi-core processors. In particular aspects, processing unit 5104 may be implemented as one or more independent processing units 5132 and/or 5134, with single-core or multi-core processors included in each processing unit. Also, in other aspects, processing unit 5104 may be implemented as a quad-core processing unit formed by incorporating two dual-core processors into a single chip.

さまざまな局面においては、処理ユニット5104は、プログラムコードに応答してさまざまなプログラムを実行し得るとともに、同時に実行される複数のプログラムまたはプロセスを維持し得る。任意の所与の時点において、実行されるべきプログラムコードのうちのいくつかまたは全ては、処理ユニット5104および/または記憶サブシステム5118に存在し得る。好適なプログラミングを通じて、処理ユニット5104は、上記のさまざまな機能を提供し得る。また、コンピュータシステム5100は、加えて、デジタル信号プロセッサ(digital signal processor:DSP)、特殊用途プロセッサなどを含み得る処理加速ユニット5106を含み得る。 In various aspects, the processing unit 5104 may execute various programs in response to program code and may maintain multiple programs or processes executing simultaneously. At any given moment, some or all of the program code to be executed may reside in processing unit 5104 and/or storage subsystem 5118 . Through suitable programming, processing unit 5104 may provide the various functions described above. Computer system 5100 may also additionally include a processing acceleration unit 5106, which may include a digital signal processor (DSP), special purpose processor, or the like.

I/Oサブシステム5108は、ユーザインターフェイス入力装置と、ユーザインターフェイス出力装置とを含み得る。ユーザインターフェイス入力装置は、キーボード、マウスまたはトラックボールなどのポインティング装置、タッチパッドまたはタッチスクリーンを含んでいてもよく、これらは、音声コマンド認識システム、マイクロホンおよび他のタイプの入力装置とともに、ディスプレイ、スクロールホイール、クリックホイール、ダイアル、ボタン、スイッチ、キーパッド、オーディオ入力装置に組込まれている。ユーザインターフェイス入力装置は、たとえば、ジェスチャおよび話されたコマンドを用いてナチュラルユーザインターフェースを介してユーザがマイクロソフトXbox(登録商標)360ゲームコントローラなどの入力装置を制御して入力装置と対話することを可能にするマイクロソフトキネクト(登録商標)モーションセンサなどのモーション検知および/またはジェスチャ認識装置を含み得る。また、ユーザインターフェイス入力装置は、ユーザから眼球運動(たとえば撮影および/またはメニュー選択を行っている間の「まばたき」)を検出して、当該眼球ジェスチャを入力装置への入力として変換するグーグルグラス(登録商標)まばたき検出器などの眼球ジェスチャ認識装置を含み得る。また、ユーザインターフェイス入力装置は、ユーザが音声コマンドを介して音声認識システム(たとえばSiri(登録商標)ナビゲータ)と対話することを可能にする音声認識検知装置を含み得る。 The I/O subsystem 5108 may include user interface input devices and user interface output devices. User interface input devices may include keyboards, pointing devices such as mice or trackballs, touch pads or touch screens, which are incorporated into displays, scroll wheels, click wheels, dials, buttons, switches, keypads, audio input devices, as well as voice command recognition systems, microphones and other types of input devices. User interface input devices may include, for example, motion sensing and/or gesture recognition devices such as the Microsoft Kinect® motion sensor that allow a user to control and interact with an input device such as the Microsoft Xbox® 360 game controller through a natural user interface using gestures and spoken commands. The user interface input device may also include an eye gesture recognizer, such as the Google Glass® Blink Detector, which detects eye movements from the user (e.g., "blinking" while taking pictures and/or menu selections) and converts the eye gestures as input to the input device. A user interface input device may also include a voice recognition sensing device that allows a user to interact with a voice recognition system (eg, Siri® navigator) via voice commands.

また、ユーザインターフェイス入力装置は、三次元(3D)マウス、ジョイスティックまたはポインティングスティック、ゲームパッドおよびグラフィックタブレット、およびスピーカなどのオーディオ/ビジュアル装置、デジタルカメラ、デジタルカムコーダ、携帯型メディアプレーヤ、ウェブカム、画像スキャナ、指紋スキャナ、バーコードリーダ3Dスキャナ、3Dプリンタ、レーザレンジファインダ、および視線検出装置を含み得るが、これらに限定されるものではない。また、ユーザインターフェイス入力装置は、たとえば、コンピュータ断層撮影、磁気共鳴画像化、位置発光断層撮影、医療用超音波検査装置などの医療用画像化入力装置を含み得る。また、ユーザインターフェイス入力装置は、たとえばMIDIキーボード、デジタル楽器などのオーディオ入力装置を含み得る。 User interface input devices may also include, but are not limited to, audio/visual devices such as three-dimensional (3D) mice, joysticks or pointing sticks, gamepads and graphics tablets, and speakers, digital cameras, digital camcorders, portable media players, webcams, image scanners, fingerprint scanners, bar code readers 3D scanners, 3D printers, laser range finders, and gaze detection devices. User interface input devices may also include, for example, medical imaging input devices such as computed tomography, magnetic resonance imaging, position emission tomography, medical ultrasound, and the like. User interface input devices may also include audio input devices such as MIDI keyboards, digital musical instruments, and the like.

ユーザインターフェイス出力装置は、ディスプレイサブシステム、表示灯、またはオーディオ出力装置などの非視覚的ディスプレイなどを含み得る。ディスプレイサブシステムは、陰極線管(cathode ray tube:CRT)、液晶ディスプレイ(liquid crystal display:LCD)またはプラズマディスプレイを使用するものなどのフラットパネルディスプレイ、投影装置、タッチスクリーンなどであってもよい。一般に、「出力装置」という用語の使用は、コンピュータシステム5100からの情報をユーザまたは他のコンピュータに出力するための全ての実現可能なタイプの装置および機構を含むよう意図されている。たとえば、ユーザインターフェイス出力装置は、モニタ、プリンタ、スピーカ、ヘッドホン、自動車のナビゲーションシステム、プロッタ、音声出力装置およびモデムなどの、テキスト、グラフィックスおよびオーディオ/ビデオ情報を視覚的に伝えるさまざまな表示装置を含み得るが、これらに限定されるものではない。 User interface output devices may include display subsystems, indicator lights, non-visual displays such as audio output devices, and the like. The display subsystem may be a flat panel display, such as one that uses a cathode ray tube (CRT), liquid crystal display (LCD) or plasma display, a projection device, a touch screen, or the like. In general, use of the term "output device" is intended to include all possible types of devices and mechanisms for outputting information from computer system 5100 to a user or other computer. For example, user interface output devices can include, but are not limited to, various display devices that visually convey text, graphics and audio/video information, such as monitors, printers, speakers, headphones, automotive navigation systems, plotters, audio output devices and modems.

コンピュータシステム5100は、現在のところシステムメモリ5110内に位置しているように示されているソフトウェア要素を備える記憶サブシステム5118を備え得る。システムメモリ5110は、処理ユニット5104上でロード可能および実行可能なプログラム命令と、これらのプログラムの実行中に生成されるデータとを格納し得る。 Computer system 5100 may comprise a storage subsystem 5118 comprising software elements currently shown residing within system memory 5110 . System memory 5110 may store program instructions loadable and executable on processing unit 5104 and data generated during execution of these programs.

コンピュータシステム5100の構成およびタイプに応じて、システムメモリ5110は、揮発性(ランダムアクセスメモリ(random access memory:RAM)など)であってもよく、および/または、不揮発性(リードオンリメモリ(read-only memory:ROM)、フラッシュメモリなど)であってもよい。RAMは、典型的には、処理ユニット5104が直ちにアクセス可能なデータおよび/またはプログラムモジュール、および/または、処理ユニット5104によって現在動作および実行されているデータおよび/またはプログラムモジュールを収容する。いくつかの実現例では、システムメモリ5110は、スタティックランダムアクセスメモリ(static random access memory:SRAM)またはダイナミックランダムアクセスメモリ(dynamic random access memory:DRAM)などの複数の異なるタイプのメモリを含み得る。いくつかの実現例では、始動中などにコンピュータシステム5100内の要素間で情報を転送することを助ける基本ルーチンを含む基本入力/出力システム(basic input/output system:BIOS)が、典型的にはROMに格納され得る。一例としておよび非限定的に、システムメモリ5110は、クライアントアプリケーション、ウェブブラウザ、中間層アプリケーション、リレーショナルデータベース管理システム(relational database management system:RDBMS)などを含み得るアプリケーションプログラム5112、プログラムデータ5114およびオペレーティングシステム5116も示す。一例として、オペレーティングシステム5116は、マイクロソフトウィンドウズ(登録商標)、アップルマッキントッシュ(登録商標)および/もしくはリナックスオペレーティングシステムのさまざまなバージョン、さまざまな市販のUNIX(登録商標)もしくはUNIXライクオペレーティングシステム(さまざまなGNU/リナックスオペレーティングシステム、Google Chrome(登録商標)OSなどを含むが、これらに限定されるものではない)、ならびに/または、iOS、ウィンドウズ(登録商標)フォン、アンドロイド(登録商標)OS、ブラックベリー(登録商標)10OSおよびパーム(登録商標)OSオペレーティングシステムなどのモバイルオペレーティングシステムを含み得る。 Depending on the configuration and type of computer system 5100, system memory 5110 may be volatile (such as random access memory (RAM)) and/or non-volatile (such as read-only memory (ROM), flash memory, etc.). RAM typically contains data and/or program modules that are immediately accessible to processing unit 5104 and/or are currently being operated on and executed by processing unit 5104 . In some implementations, system memory 5110 may include multiple different types of memory, such as static random access memory (SRAM) or dynamic random access memory (DRAM). In some implementations, a basic input/output system (BIOS), containing the basic routines that help to transfer information between elements within computer system 5100, such as during start-up, can be typically stored in ROM. By way of example and not limitation, system memory 5110 also illustrates application programs 5112, program data 5114, and an operating system 5116, which may include client applications, web browsers, middle-tier applications, relational database management systems (RDBMS), and the like. By way of example, operating system 5116 may include various versions of Microsoft Windows, Apple Macintosh and/or Linux operating systems, various commercially available UNIX or UNIX-like operating systems (including, but not limited to, various GNU/Linux operating systems, Google Chrome OS, etc.), and/or iOS, Windows Phone, Android. ® OS, BlackBerry® 10 OS and Palm® OS operating systems.

また、記憶サブシステム5118は、いくつかの局面の機能を提供する基本的なプログラミングおよびデータ構造を格納するための有形のコンピュータ読取可能な記憶媒体を提供し得る。プロセッサによって実行されたときに上記の機能を提供するソフトウェア(プログラム、コードモジュール、命令)が記憶サブシステム5118に格納され得る。これらのソフトウェアモジュールまたは命令は、処理ユニット5104によって実行され得る。また、記憶サブシステム5118は、本発明に従って使用されるデータを格納するためのリポジトリを提供し得る。 Storage subsystem 5118 may also provide tangible computer-readable storage media for storing the basic programming and data structures that provide the functionality of some aspects. Software (programs, code modules, instructions) that provide the functions described above when executed by the processor may be stored in storage subsystem 5118 . These software modules or instructions may be executed by processing unit 5104 . Storage subsystem 5118 may also provide a repository for storing data used in accordance with the present invention.

また、記憶サブシステム5118は、コンピュータ読取可能な記憶媒体5122にさらに接続可能なコンピュータ読取可能な記憶媒体リーダ5120を含み得る。ともにおよび任意には、システムメモリ5110と組合せて、コンピュータ読取可能な記憶媒体5122は、コンピュータ読取可能な情報を一時的および/または永久に収容、格納、送信および検索するための記憶媒体に加えて、リモートの、ローカルの、固定されたおよび/または取外し可能な記憶装置を包括的に表わし得る。 Storage subsystem 5118 may also include a computer readable storage media reader 5120 that is further connectable to computer readable storage media 5122 . Together and optionally in combination with system memory 5110, computer-readable storage media 5122 may collectively represent remote, local, fixed and/or removable storage devices, as well as storage media for temporarily and/or permanently containing, storing, transmitting, and retrieving computer-readable information.

コードまたはコードの一部を含むコンピュータ読取可能な記憶媒体5122は、当該技術分野において公知のまたは使用される任意の適切な媒体を含み得る。当該媒体は、情報の格納および/または送信のための任意の方法または技術において実現される揮発性および不揮発性の、取外し可能および取外し不可能な媒体などであるが、これらに限定されるものではない記憶媒体および通信媒体を含む。これは、RAM、ROM、電子的消去・プログラム可能ROM(electronically erasable programmable ROM:EEPROM)、フラッシュメモリもしくは他のメモリ技術、CD-ROM、デジタル多用途ディスク(digital versatile disk:DVD)、または他の光学式記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、または他の有形のコンピュータ読取可能な媒体などの有形の一時的なコンピュータ読取可能な記憶媒体を含み得る。また、これは、データ信号、データ送信などの無形の一時的なコンピュータ読取可能な媒体、または、所望の情報を送信するために使用可能であるとともにコンピュータシステム5100によってアクセス可能である他の任意の媒体を含み得る。 A computer-readable storage medium 5122 containing code or portions of code may include any suitable medium known or used in the art. Such media include, but are not limited to, storage media and communication media such as volatile and nonvolatile, removable and non-removable media implemented in any method or technology for the storage and/or transmission of information. This may include tangible temporary computer-readable storage media such as RAM, ROM, electronically erasable programmable ROM (EEPROM), flash memory or other memory technology, CD-ROM, digital versatile disk (DVD), or other optical storage device, magnetic cassette, magnetic tape, magnetic disk storage device or other magnetic storage device, or other tangible computer-readable medium. It may also include intangible, transitory computer-readable media such as data signals, data transmissions, or any other medium that can be used to transmit desired information and that is accessible by computer system 5100.

一例として、コンピュータ読取可能な記憶媒体5122は、取外し不可能な不揮発性磁気媒体から読取るまたは当該媒体に書込むハードディスクドライブ、取外し可能な不揮発性磁気ディスクから読取るまたは当該ディスクに書込む磁気ディスクドライブ、ならびに、CD ROM、DVDおよびブルーレイ(登録商標)ディスクまたは他の光学式媒体などの取外し可能な不揮発性光学ディスクから読取るまたは当該ディスクに書込む光学式ディスクドライブを含み得る。コンピュータ読取可能な記憶媒体5122は、ジップ(登録商標)ドライブ、フラッシュメモリカード、ユニバーサルシリアルバス(universal serial bus:USB)フラッシュドライブ、セキュアデジタル(secure digital:SD)カード、DVDディスク、デジタルビデオテープなどを含み得るが、これらに限定されるものではない。また、コンピュータ読取可能な記憶媒体5122は、フラッシュメモリベースのSSD、企業向けフラッシュドライブ、ソリッドステートROMなどの不揮発性メモリに基づくソリッドステートドライブ(solid-state drive:SSD)、ソリッドステートRAM、ダイナミックRAM、スタティックRAMなどの揮発性メモリに基づくSSD、DRAMベースのSSD、磁気抵抗RAM(magnetoresistive RAM:MRAM)SSD、およびDRAMとフラッシュメモリベースのSSDとの組合せを使用するハイブリッドSSDを含み得る。ディスクドライブおよびそれらの関連のコンピュータ読取可能な媒体は、コンピュータ読取可能な命令、データ構造、プログラムモジュールおよび他のデータをコンピュータシステム5100に提供し得る。 By way of example, the computer readable storage medium 5122 may include a hard disk drive that reads from or writes to non-removable, nonvolatile magnetic media, a magnetic disk drive that reads from or writes to removable nonvolatile magnetic disks, and an optical disk drive that reads from or writes to removable nonvolatile optical disks such as CD ROM, DVD and Blu-ray disks or other optical media. Computer readable storage media 5122 can include, but are not limited to, Zip drives, flash memory cards, universal serial bus (USB) flash drives, secure digital (SD) cards, DVD discs, digital video tapes, and the like. The computer-readable storage medium 5122 may also include flash memory-based SSDs, enterprise flash drives, solid-state drives (SSDs) based on non-volatile memory such as solid-state ROM, SSDs based on volatile memory such as solid-state RAM, dynamic RAM, static RAM, DRAM-based SSDs, magnetoresistive RAM (MRAM) SSDs, and hybrid SSDs that use a combination of DRAM and flash memory-based SSDs. The disk drives and their associated computer-readable media can provide computer readable instructions, data structures, program modules and other data for computer system 5100 .

通信サブシステム5124は、他のコンピュータシステムおよびネットワークとのインターフェイスを提供する。通信サブシステム5124は、他のシステムからデータを受信したり、コンピュータシステム5100から他のシステムにデータを送信するためのインターフェイスの役割を果たす。たとえば、通信サブシステム5124は、コンピュータシステム5100がインターネットを介して1つ以上の装置に接続することを可能にし得る。いくつかの局面においては、通信サブシステム5124は、(たとえば3G、4GまたはEDGE(enhanced data rates for global evolution)などの携帯電話技術、高度データネットワーク技術を用いて)無線音声および/またはデータネットワークにアクセスするための無線周波数(radio frequency:RF)トランシーバコンポーネント、WiFi(IEEE802.28ファミリ標準または他のモバイル通信技術またはそれらの任意の組合せ)、全地球測位システム(global positioning system:GPS)レシーバコンポーネント、および/または、他のコンポーネントを含み得る。いくつかの局面においては、通信サブシステム5124は、無線インターフェイスに加えて、または無線インターフェイスの代わりに、有線ネットワーク接続(たとえばイーサネット)を提供し得る。 Communications subsystem 5124 provides an interface with other computer systems and networks. Communications subsystem 5124 serves as an interface for receiving data from other systems and for transmitting data from computer system 5100 to other systems. For example, communications subsystem 5124 may allow computer system 5100 to connect to one or more devices over the Internet. In some aspects, the communication subsystem 5124 includes a radio frequency (RF) transceiver component for accessing wireless voice and/or data networks (e.g., using cellular technologies, advanced data network technologies such as 3G, 4G or enhanced data rates for global evolution (EDGE)), WiFi (IEEE 802.28 family standards or other mobile communication technologies or any combination thereof), a global positioning system (GPS) receiver component, and/or may include other components. In some aspects, communication subsystem 5124 may provide a wired network connection (eg, Ethernet) in addition to or instead of a wireless interface.

また、いくつかの局面においては、通信サブシステム5124は、コンピュータシステム5100を使用し得る1人以上のユーザを代表して、構造化されたおよび/または構造化されていないデータフィード5126、イベントストリーム5128、イベント更新5151などの形態で入力通信を受信し得る。 Also, in some aspects, communications subsystem 5124 may receive input communications in the form of structured and/or unstructured data feeds 5126, event streams 5128, event updates 5151, etc., on behalf of one or more users who may be using computer system 5100.

一例として、通信サブシステム5124は、ツイッター(登録商標)フィード、フェースブック(登録商標)更新、リッチ・サイト・サマリ(Rich Site Summary:RSS)フィードなどのウェブフィードなどのデータフィード5126をリアルタイムでソーシャルメディアネットワークおよび/または他の通信サービスのユーザから受信し、および/または、1つ以上の第三者情報源からリアルタイム更新を受信するように構成され得る。 As an example, the communication subsystem 5124 may be configured to receive data feeds 5126, such as web feeds such as Twitter feeds, Facebook updates, Rich Site Summary (RSS) feeds, etc., in real-time from users of social media networks and/or other communication services, and/or receive real-time updates from one or more third-party sources.

加えて、通信サブシステム5124は、連続的なデータストリームの形態でデータを受信するように構成され得る。当該データは、連続的である場合もあれば本質的に明確な端部をもたない状態で境界がない場合もあるリアルタイムイベントのイベントストリーム5128および/またはイベント更新5151を含み得る。連続的なデータを生成するアプリケーションの例としては、たとえばセンサデータアプリケーション、金融ティッカ、ネットワーク性能測定ツール(たとえばネットワークモニタリングおよびトラフィック管理アプリケーション)、クリックストリーム分析ツール、自動車交通モニタリングなどを含み得る。 Additionally, communication subsystem 5124 may be configured to receive data in the form of a continuous data stream. Such data may include an event stream 5128 and/or event updates 5151 of real-time events that may be continuous or essentially without distinct edges and without boundaries. Examples of applications that generate continuous data may include, for example, sensor data applications, financial tickers, network performance measurement tools (eg, network monitoring and traffic management applications), clickstream analysis tools, automotive traffic monitoring, and the like.

また、通信サブシステム5124は、構造化されたおよび/または構造化されていないデータフィード5126、イベントストリーム5128、イベント更新5151などを、コンピュータシステム5100に結合された1つ以上のストリーミングデータソースコンピュータと通信し得る1つ以上のデータベースに出力するように構成され得る。 Communication subsystem 5124 may also be configured to output structured and/or unstructured data feeds 5126, event streams 5128, event updates 5151, etc. to one or more databases that may communicate with one or more streaming data source computers coupled to computer system 5100.

コンピュータシステム5100は、手持ち式携帯機器(たとえばiPhone(登録商標)携帯電話、iPad(登録商標)計算タブレット、PDA)、ウェアラブル装置(たとえばグーグルグラス(登録商標)ヘッドマウントディスプレイ)、PC、ワークステーション、メインフレーム、キオスク、サーバラックまたはその他のデータ処理システムを含むさまざまなタイプのうちの1つであってもよい。 Computer system 5100 may be one of a variety of types, including handheld portable devices (e.g., iPhone mobile phones, iPad computing tablets, PDAs), wearable devices (e.g., Google Glass head-mounted displays), PCs, workstations, mainframes, kiosks, server racks, or other data processing systems.

コンピュータおよびネットワークの絶え間なく変化し続ける性質のために、図に示されているコンピュータシステム5100の説明は、特定の例として意図されているに過ぎない。図に示されているシステムよりも多くのまたは少ない数の構成要素を有する多くの他の構成が可能である。たとえば、ハードウェア、ファームウェア、(アプレットを含む)ソフトウェア、または組合せにおいて、カスタマイズされたハードウェアが使用されてもよく、および/または、特定の要素が実装されてもよい。さらに、ネットワーク入力/出力装置などの他のコンピューティングデバイスへの接続が利用されてもよい。本明細書中に提供される開示および教示に基づいて、当業者は、さまざまな局面を実現するための他の手段および/または方法を理解するであろう。 Due to the ever-changing nature of computers and networks, the depicted description of computer system 5100 is intended only as a specific example. Many other configurations are possible, having more or fewer components than the system shown in the figures. Customized hardware may be used and/or particular elements may be implemented, for example, in hardware, firmware, software (including applets), or a combination. Additionally, connections to other computing devices, such as network input/output devices, may be utilized. Based on the disclosure and teachings provided herein, a person of ordinary skill in the art will appreciate other means and/or methods for implementing various aspects.

上述の明細書では、本発明の局面は、その具体的な局面を参照して記載されているが、本発明はこれに限定されるものではないことを当業者は認識するであろう。上述の発明のさまざまな特徴および局面は、個々にまたは一緒に使用されてもよい。さらに、局面は、明細書のより広い精神および範囲から逸脱することなく、本明細書に記載されているものを越えたいくつもの環境およびアプリケーションでも利用可能である。したがって、明細書および図面は、限定的ではなく例示的なものとみなされるべきである。 In the foregoing specification, aspects of the invention have been described with reference to specific aspects thereof, but those skilled in the art will appreciate that the invention is not so limited. Various features and aspects of the above-described invention may be used individually or together. Moreover, aspects may be utilized in numerous environments and applications beyond those described herein without departing from the broader spirit and scope of the specification. The specification and drawings are, accordingly, to be regarded in an illustrative rather than a restrictive sense.

Claims (20)

談話ツリーの精度を向上させる方法であって、
テキスト中において基本談話単位を識別することによって前記テキストから談話ツリーを作成することを含み、前記談話ツリーは複数のノードを含み、前記談話ツリー中の前記ノードの各非終端ノードは2つの基本談話単位間の修辞関係を表し、前記談話ツリー中の前記ノードの各終端ノードは、ある基本談話単位に関連付けられ、前記方法はさらに、
前記談話ツリーにおいて、タイプ詳述またはジョイントの修辞関係を識別することを含み、前記修辞関係は、第1の基本談話単位および第2の基本談話単位を関係付け、前記第1の基本談話単位および前記第2の基本談話単位は、参照センテンスを形成し、前記方法はさらに、
候補センテンスのセットの各候補センテンスについて構文一般化スコアを決定することを含み、各候補センテンスは対応する意味的関係を有し、前記決定することは、
前記候補センテンスと前記参照センテンスとの間において1つ以上の共通エンティティを識別することと、
前記識別された1つ以上の共通エンティティの数に等しい構文一般化スコアを計算することとを含み、前記方法はさらに、
前記構文一般化スコアのうち最も高い構文一般化スコアを有する候補センテンスを選択することと、
前記候補センテンスに対応する意味的関係を識別することとを含み、前記意味的関係は、前記候補センテンス内の単語に対応し、前記候補センテンスにおいて役割を定義し、前記方法はさらに、
前記談話ツリーにおいて、前記修辞関係を、前記意味的関係に対応する更新された修辞関係に置き換えることにより、更新された談話ツリーを作成することを含む、方法。
A method for improving the accuracy of a discourse tree, comprising:
creating a discourse tree from the text by identifying base discourse units in the text, the discourse tree comprising a plurality of nodes, each non-terminal node of the nodes in the discourse tree representing a rhetorical relationship between two base discourse units, each terminal node of the nodes in the discourse tree being associated with a base discourse unit, the method further comprising:
identifying a rhetorical relation of type elaboration or joint in said discourse tree, said rhetorical relation relating a first elementary discourse unit and a second elementary discourse unit, said first elementary discourse unit and said second elementary discourse unit forming a reference sentence, said method further comprising:
determining a syntactic generalization score for each candidate sentence of a set of candidate sentences, each candidate sentence having a corresponding semantic relationship, said determining comprising:
identifying one or more common entities between the candidate sentence and the reference sentence;
calculating a syntactic generalization score equal to the number of the identified one or more common entities, the method further comprising:
selecting the candidate sentence with the highest syntactic generalization score among the syntactic generalization scores;
identifying semantic relationships corresponding to the candidate sentences, the semantic relationships corresponding to words in the candidate sentences and defining roles in the candidate sentences, the method further comprising:
creating an updated discourse tree by replacing the rhetorical relations in the discourse tree with updated rhetorical relations corresponding to the semantic relations.
前記テキストから前記談話ツリーを作成することは、
前記テキストを分類モデルに提供することと、
前記分類モデルを用いて、前記第1の基本談話単位と、前記第2の基本談話単位と、前記修辞関係とを識別することとを含む、請求項1に記載の方法。
Creating the discourse tree from the text includes:
providing the text to a classification model;
2. The method of claim 1, comprising using the classification model to identify the first basic discourse unit, the second basic discourse unit, and the rhetorical relation.
前記更新された修辞関係は、目的、手段、原因、または時間的シーケンスのうちの1つである、請求項1に記載の方法。 2. The method of claim 1, wherein the updated rhetorical relation is one of ends, means, causes, or temporal sequences. 前記更新された談話ツリーから応答を形成することと、
前記応答を外部装置に出力することとをさらに含む、請求項1に記載の方法。
forming a response from the updated discourse tree;
2. The method of claim 1, further comprising outputting the response to an external device.
前記方法はさらに、
各候補センテンスから、第1の構文パースツリーを形成することと、
前記参照センテンスから第2の構文パースツリーを形成することとを含み、前記候補センテンスと前記参照センテンスとの間において前記1つ以上の共通エンティティを識別することは、共通エンティティごとに、前記第1の構文パースツリーおよび前記第2の構文パースツリーにおいて前記共通エンティティを識別することを含む、請求項1に記載の方法。
The method further comprises:
forming a first syntactic parse tree from each candidate sentence;
forming a second syntactic parse tree from the reference sentence, and wherein identifying the one or more common entities between the candidate sentence and the reference sentence comprises, for each common entity, identifying the common entity in the first syntactic parse tree and the second syntactic parse tree.
前記方法はさらに、
動詞を有する各フラグメントを動詞シグネチャに一致させることによって、前記更新された談話ツリーからコミュニケーション用談話ツリーを形成することと、
議論を検出するようにトレーニングされた分類モデルを前記コミュニケーション用談話ツリーに適用することによって、前記テキストが議論を含むことを識別することと、
前記テキストから応答を形成し、前記応答を外部装置に出力することとを含む、請求項1に記載の方法。
The method further comprises:
forming a communicative discourse tree from the updated discourse tree by matching each fragment with a verb to a verb signature;
identifying that the text contains arguments by applying a classification model trained to detect arguments to the communicative discourse tree;
forming a response from the text and outputting the response to an external device.
前記方法はさらに、
動詞を有する各フラグメントを動詞シグネチャに一致させることによって、前記更新された談話ツリーからコミュニケーション用談話ツリーを形成することと、
議論を検出するようにトレーニングされた分類モデルを前記コミュニケーション用談話ツリーに適用することによって、前記テキストが主張に対応する論証を含むことを識別することと、
論理システムを解くことによって、前記論証の整合性を、それ自体に関して、および前記テキストのドメインに関連付けられるドメイン定義節に関して評価することとを含み、前記論理システムは、
(a)前記主張の項および前記ドメイン定義節を含む固定部分と、
(b)前記コミュニケーション用談話ツリーからの撤回可能規則のセットおよび前記コミュニケーション用談話ツリーのコミュニケーション行動からの事実を含む可変部分とを含み、前記方法はさらに、
前記評価された整合性が閾値よりも大きいと判定することに応答して、前記テキストからテキスト応答を形成し、前記テキスト応答を外部装置に出力することを含む、請求項1に記載の方法。
The method further comprises:
forming a communicative discourse tree from the updated discourse tree by matching each fragment with a verb to a verb signature;
identifying that the text contains arguments corresponding to assertions by applying a classification model trained to detect arguments to the communication discourse tree;
evaluating the consistency of the argument with respect to itself and with respect to domain definition clauses associated with domains of the text by solving a logic system, the logic system comprising:
(a) a fixed portion comprising said claim clause and said domain definition clause;
(b) a set of revocable rules from said communicative discourse tree and a variable portion comprising facts from communicative behaviors of said communicative discourse tree, said method further comprising:
2. The method of claim 1, comprising forming a text response from the text and outputting the text response to an external device in response to determining that the evaluated consistency is greater than a threshold.
システムであって、
コンピュータ実行可能プログラム命令を記憶する非一時的コンピュータ可読媒体と、
前記非一時的コンピュータ可読媒体に通信可能に結合され、前記コンピュータ実行可能プログラム命令を実行するための処理装置とを備え、前記コンピュータ実行可能プログラム命令を実行することは、動作を実行するように前記処理装置を構成し、前記動作は、
テキスト中において基本談話単位を識別することによって前記テキストから談話ツリーを作成することを含み、前記談話ツリーは複数のノードを含み、前記談話ツリー中の前記ノードの各非終端ノードは2つの基本談話単位間の修辞関係を表し、前記談話ツリー中の前記ノードの各終端ノードは、ある基本談話単位に関連付けられ、前記動作はさらに、
前記談話ツリーにおいて、タイプ詳述またはジョイントの修辞関係を識別することを含み、前記修辞関係は、第1の基本談話単位および第2の基本談話単位を関係付け、前記第1の基本談話単位および前記第2の基本談話単位は、参照センテンスを形成し、前記動作はさらに、
候補センテンスのセットの各候補センテンスについて構文一般化スコアを決定することを含み、各候補センテンスは対応する意味的関係を有し、前記決定することは、
前記候補センテンスと前記参照センテンスとの間において1つ以上の共通エンティティを識別することと、
前記識別された1つ以上の共通エンティティの数に等しい構文一般化スコアを計算することとを含み、前記動作はさらに、
前記構文一般化スコアのうち最も高い構文一般化スコアを有する候補センテンスを選択することと、
前記候補センテンスに対応する意味的関係を識別することとを含み、前記意味的関係は、前記候補センテンス内の単語に対応し、前記候補センテンスにおいて役割を定義し、前記動作はさらに、
前記談話ツリーにおいて、前記修辞関係を、前記意味的関係に対応する更新された修辞関係に置き換えることにより、更新された談話ツリーを作成することを含む、システム。
a system,
a non-transitory computer-readable medium storing computer-executable program instructions;
a processing device communicatively coupled to the non-transitory computer-readable medium for executing the computer-executable program instructions, wherein executing the computer-executable program instructions configures the processing device to perform an action, the action comprising:
creating a discourse tree from the text by identifying a base discourse unit in the text, the discourse tree comprising a plurality of nodes, each non-terminal node of the node in the discourse tree representing a rhetorical relationship between two base discourse units, each terminal node of the node in the discourse tree being associated with a base discourse unit;
identifying a rhetorical relation of type elaboration or joint in said discourse tree, said rhetorical relation relating first and second elementary discourse units, said first and second elementary discourse units forming a reference sentence, said action further comprising:
determining a syntactic generalization score for each candidate sentence of a set of candidate sentences, each candidate sentence having a corresponding semantic relationship, said determining comprising:
identifying one or more common entities between the candidate sentence and the reference sentence;
calculating a syntactic generalization score equal to the number of the identified one or more common entities, the operation further comprising:
selecting the candidate sentence with the highest syntactic generalization score among the syntactic generalization scores;
identifying semantic relationships corresponding to the candidate sentences, the semantic relationships corresponding to words in the candidate sentences and defining roles in the candidate sentences, the acts further comprising:
creating an updated discourse tree by replacing the rhetorical relations in the discourse tree with updated rhetorical relations corresponding to the semantic relations.
前記テキストから前記談話ツリーを作成することは、
前記テキストを分類モデルに提供することと、
前記分類モデルを用いて、前記第1の基本談話単位と、前記第2の基本談話単位と、前記修辞関係とを識別することとを含む、請求項8に記載のシステム。
Creating the discourse tree from the text includes:
providing the text to a classification model;
9. The system of claim 8, comprising using the classification model to identify the first basic discourse unit, the second basic discourse unit, and the rhetorical relation.
前記更新された修辞関係は、目的、手段、原因、または時間的シーケンスのうちの1つである、請求項8に記載のシステム。 9. The system of claim 8, wherein the updated rhetorical relation is one of ends, means, causes, or temporal sequences. 前記1つ以上の共通エンティティの各々は、前記候補センテンスと前記参照センテンスとの間で発話の共通部分を共有する、請求項8に記載のシステム。 9. The system of claim 8, wherein each of the one or more common entities shares an utterance intersection between the candidate sentence and the reference sentence. 前記動作はさらに、
各候補センテンスから、第1の構文パースツリーを形成することと、
前記参照センテンスから第2の構文パースツリーを形成することとを含み、前記候補センテンスと前記参照センテンスとの間において前記1つ以上の共通エンティティを識別することは、共通エンティティごとに、前記第1の構文パースツリーおよび前記第2の構文パースツリーにおいて前記共通エンティティを識別することを含む、請求項8に記載のシステム。
Said operation further comprises:
forming a first syntactic parse tree from each candidate sentence;
forming a second syntactic parse tree from the reference sentence, and wherein identifying the one or more common entities between the candidate sentence and the reference sentence comprises, for each common entity, identifying the common entity in the first syntactic parse tree and the second syntactic parse tree.
前記動作はさらに、
動詞を有する各フラグメントを動詞シグネチャに一致させることによって、前記更新された談話ツリーからコミュニケーション用談話ツリーを形成することと、
議論を検出するようにトレーニングされた分類モデルを前記コミュニケーション用談話ツリーに適用することによって、前記テキストが議論を含むことを識別することと、
前記テキストから応答を形成し、前記応答を外部装置に出力することとを含む、請求項8に記載のシステム。
Said operation further comprises:
forming a communicative discourse tree from the updated discourse tree by matching each fragment with a verb to a verb signature;
identifying that the text contains arguments by applying a classification model trained to detect arguments to the communicative discourse tree;
forming a response from the text and outputting the response to an external device.
前記動作はさらに、
動詞を有する各フラグメントを動詞シグネチャに一致させることによって、前記更新された談話ツリーからコミュニケーション用談話ツリーを形成することと、
議論を検出するようにトレーニングされた分類モデルを前記コミュニケーション用談話ツリーに適用することによって、前記テキストが主張に対応する論証を含むことを識別することと、
論理システムを解くことによって、前記論証の整合性を、それ自体に関して、および前記テキストのドメインに関連付けられるドメイン定義節に関して評価することとを含み、前記論理システムは、
(a)前記主張の項および前記ドメイン定義節を含む固定部分と、
(b)前記コミュニケーション用談話ツリーからの撤回可能規則のセットおよび前記コミュニケーション用談話ツリーのコミュニケーション行動からの事実を含む可変部分とを含み、前記動作はさらに、
前記評価された整合性が閾値よりも大きいと判定することに応答して、前記テキストからテキスト応答を形成し、前記テキスト応答を外部装置に出力することを含む、請求項8に記載のシステム。
Said operation further comprises:
forming a communicative discourse tree from the updated discourse tree by matching each fragment with a verb to a verb signature;
identifying that the text contains arguments corresponding to assertions by applying a classification model trained to detect arguments to the communication discourse tree;
evaluating the consistency of the argument with respect to itself and with respect to domain definition clauses associated with domains of the text by solving a logic system, the logic system comprising:
(a) a fixed portion comprising said claim clause and said domain definition clause;
(b) a set of revocable rules from said communicative discourse tree and a variable portion comprising facts from communicative behaviors of said communicative discourse tree, said action further comprising:
9. The system of claim 8, comprising forming a text response from the text and outputting the text response to an external device in response to determining that the evaluated consistency is greater than a threshold.
コンピュータ実行可能プログラム命令を記憶する非一時的なコンピュータ可読記憶媒体であって、処理装置によって実行されると、前記コンピュータ実行可能プログラム命令は前記処理装置に動作を実行させ、前記動作は、
テキスト中において基本談話単位を識別することによって前記テキストから談話ツリーを作成することを含み、前記談話ツリーは複数のノードを含み、前記談話ツリー中の前記ノードの各非終端ノードは2つの基本談話単位間の修辞関係を表し、前記談話ツリー中の前記ノードの各終端ノードは、ある基本談話単位に関連付けられ、前記動作はさらに、
前記談話ツリーにおいて、タイプ詳述またはジョイントの修辞関係を識別することを含み、前記修辞関係は、第1の基本談話単位および第2の基本談話単位を関係付け、前記第1の基本談話単位および前記第2の基本談話単位は、参照センテンスを形成し、前記動作はさらに、
候補センテンスのセットの各候補センテンスについて構文一般化スコアを決定することを含み、各候補センテンスは対応する意味的関係を有し、前記決定することは、
前記候補センテンスと前記参照センテンスとの間において1つ以上の共通エンティティを識別することと、
前記識別された1つ以上の共通エンティティの数に等しい構文一般化スコアを計算することとを含み、前記動作はさらに、
前記構文一般化スコアのうち最も高い構文一般化スコアを有する候補センテンスを選択することと、
前記候補センテンスに対応する意味的関係を識別することとを含み、前記意味的関係は、前記候補センテンス内の単語に対応し、前記候補センテンスにおいて役割を定義し、前記動作はさらに、
前記談話ツリーにおいて、前記修辞関係を、前記意味的関係に対応する更新された修辞関係に置き換えることにより、更新された談話ツリーを作成することを含む、非一時的なコンピュータ可読記憶媒体。
A non-transitory computer-readable storage medium storing computer-executable program instructions that, when executed by a processing device, cause the processing device to perform an action, the action comprising:
creating a discourse tree from the text by identifying a base discourse unit in the text, the discourse tree comprising a plurality of nodes, each non-terminal node of the node in the discourse tree representing a rhetorical relationship between two base discourse units, each terminal node of the node in the discourse tree being associated with a base discourse unit;
identifying a rhetorical relation of type elaboration or joint in said discourse tree, said rhetorical relation relating first and second elementary discourse units, said first and second elementary discourse units forming a reference sentence, said action further comprising:
determining a syntactic generalization score for each candidate sentence of a set of candidate sentences, each candidate sentence having a corresponding semantic relationship, said determining comprising:
identifying one or more common entities between the candidate sentence and the reference sentence;
calculating a syntactic generalization score equal to the number of the identified one or more common entities, the operation further comprising:
selecting the candidate sentence with the highest syntactic generalization score among the syntactic generalization scores;
identifying semantic relationships corresponding to the candidate sentences, the semantic relationships corresponding to words in the candidate sentences and defining roles in the candidate sentences, the acts further comprising:
creating an updated discourse tree by replacing the rhetorical relations in the discourse tree with updated rhetorical relations corresponding to the semantic relations.
前記テキストから前記談話ツリーを作成することは、
前記テキストを分類モデルに提供することと、
前記分類モデルを用いて、前記第1の基本談話単位と、前記第2の基本談話単位と、前記修辞関係とを識別することとを含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
Creating the discourse tree from the text includes:
providing the text to a classification model;
16. The non-transitory computer-readable storage medium of claim 15, comprising using the classification model to identify the first basic discourse unit, the second basic discourse unit, and the rhetorical relation.
前記更新された修辞関係は、目的、手段、原因、または時間的シーケンスのうちの1つである、請求項15に記載の非一時的なコンピュータ可読記憶媒体。 16. The non-transitory computer-readable storage medium of claim 15, wherein the updated rhetorical relation is one of ends, means, causes, or temporal sequences. 前記1つ以上の共通エンティティの各々は、前記候補センテンスと前記参照センテンスとの間で発話の共通部分を共有する、請求項15に記載の非一時的なコンピュータ可読記憶媒体。 16. The non-transitory computer-readable storage medium of claim 15, wherein each of the one or more common entities shares a common portion of utterance between the candidate sentence and the reference sentence. 処理装置によって実行されると、前記コンピュータ実行可能プログラム命令は前記処理装置に動作を実行させ、前記動作は、
各候補センテンスから、第1の構文パースツリーを形成することと、
前記参照センテンスから第2の構文パースツリーを形成することとを含み、前記候補センテンスと前記参照センテンスとの間において前記1つ以上の共通エンティティを識別することは、共通エンティティごとに、前記第1の構文パースツリーおよび前記第2の構文パースツリーにおいて前記共通エンティティを識別することを含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
When executed by a processing device, the computer-executable program instructions cause the processing device to perform an action, the action comprising:
forming a first syntactic parse tree from each candidate sentence;
16. The non-transitory computer-readable storage medium of claim 15, wherein identifying the one or more common entities between the candidate sentence and the reference sentence comprises identifying the common entity in the first syntactic parsetree and the second syntactic partree for each common entity.
処理装置によって実行されると、前記コンピュータ実行可能プログラム命令は前記処理装置に動作を実行させ、前記動作は、
動詞を有する各フラグメントを動詞シグネチャに一致させることによって、前記更新された談話ツリーからコミュニケーション用談話ツリーを形成することと、
議論を検出するようにトレーニングされた分類モデルを前記コミュニケーション用談話ツリーに適用することによって、前記テキストが議論を含むことを識別することと、
前記テキストから応答を形成し、前記応答を外部装置に出力することとを含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
When executed by a processing device, the computer-executable program instructions cause the processing device to perform an action, the action comprising:
forming a communicative discourse tree from the updated discourse tree by matching each fragment with a verb to a verb signature;
identifying that the text contains arguments by applying a classification model trained to detect arguments to the communicative discourse tree;
forming a response from the text and outputting the response to an external device.
JP2022546461A 2020-06-26 2021-06-02 Improved discourse parsing Pending JP2023531345A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063044658P 2020-06-26 2020-06-26
US63/044,658 2020-06-26
US17/003,593 2020-08-26
US17/003,593 US11748572B2 (en) 2017-05-10 2020-08-26 Enabling chatbots by validating argumentation
PCT/US2021/035515 WO2021262408A1 (en) 2020-06-26 2021-06-02 Improved discourse parsing

Publications (2)

Publication Number Publication Date
JP2023531345A true JP2023531345A (en) 2023-07-24
JPWO2021262408A5 JPWO2021262408A5 (en) 2024-05-02

Family

ID=79281710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022546461A Pending JP2023531345A (en) 2020-06-26 2021-06-02 Improved discourse parsing

Country Status (3)

Country Link
JP (1) JP2023531345A (en)
CN (1) CN114902230A (en)
WO (1) WO2021262408A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114662469B (en) * 2022-02-25 2023-04-07 北京百度网讯科技有限公司 Emotion analysis method and device, electronic equipment and storage medium

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10679011B2 (en) * 2017-05-10 2020-06-09 Oracle International Corporation Enabling chatbots by detecting and supporting argumentation

Also Published As

Publication number Publication date
CN114902230A (en) 2022-08-12
WO2021262408A1 (en) 2021-12-30

Similar Documents

Publication Publication Date Title
US11748572B2 (en) Enabling chatbots by validating argumentation
JP7439038B2 (en) Enabling rhetorical analysis through the use of communicative discourse trees
US11783126B2 (en) Enabling chatbots by detecting and supporting affective argumentation
US11373632B2 (en) Using communicative discourse trees to create a virtual persuasive dialogue
US10679011B2 (en) Enabling chatbots by detecting and supporting argumentation
US11386274B2 (en) Using communicative discourse trees to detect distributed incompetence
US11347946B2 (en) Utilizing discourse structure of noisy user-generated content for chatbot learning
US11599731B2 (en) Generating recommendations by using communicative discourse trees of conversations
US11960844B2 (en) Discourse parsing using semantic and syntactic relations
US20210174030A1 (en) Chatbot providing a defeating reply
US12001804B2 (en) Using communicative discourse trees to detect distributed incompetence
JP2023531345A (en) Improved discourse parsing
JP2024081640A (en) Enabling rhetorical analysis through the use of communicative discourse trees

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240422

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240422