WO2019160098A1 - 議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造 - Google Patents

議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造 Download PDF

Info

Publication number
WO2019160098A1
WO2019160098A1 PCT/JP2019/005622 JP2019005622W WO2019160098A1 WO 2019160098 A1 WO2019160098 A1 WO 2019160098A1 JP 2019005622 W JP2019005622 W JP 2019005622W WO 2019160098 A1 WO2019160098 A1 WO 2019160098A1
Authority
WO
WIPO (PCT)
Prior art keywords
proposition
discussion
node
template
represented
Prior art date
Application number
PCT/JP2019/005622
Other languages
English (en)
French (fr)
Inventor
航 光田
東中 竜一郎
準二 富田
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US16/970,334 priority Critical patent/US11036935B2/en
Publication of WO2019160098A1 publication Critical patent/WO2019160098A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing

Definitions

  • the present invention relates to a discussion structure expansion device, a discussion structure expansion method, a program, and a data structure.
  • PR Practical Reasoning
  • Non-Patent Document 1 There are many attempts to automatically extract the discussion structure from text data. Such research is summarized in Non-Patent Document 1 below.
  • Reference Document 4 a user utterance is mapped to a node in the discussion structure, and a node having a connection relationship with the node is returned to the user as a system utterance to perform a discussion.
  • Non-Patent Document 1 As summarized in Non-Patent Document 1, there are attempts to extract a discussion structure from a text. However, when a discussion structure is given, a technique for extending the discussion structure by automatically adding a rationale. Does not exist.
  • the present invention has an object to provide a discussion structure expansion device, a discussion structure expansion method, a program, and a data structure that can automatically expand a discussion structure.
  • the discussion structure expansion device of the present invention provides a proposition represented by the node of the debate structure including a node representing each of a proposition to be the center of the discussion and a proposition to be the basis for another proposition.
  • a template creation unit that creates a template by using a predetermined rewrite pattern as an input, and a node that creates a proposition as a rationale for the input proposition using the created template, and adds a node to the discussion structure
  • an additional proposition output unit that outputs as a proposition to represent.
  • the template creation unit receives as input the propositions represented by the nodes of the discussion structure including nodes representing the propositions that are the center of the discussion and the propositions that are the basis of other propositions.
  • a template is created using a predetermined rewrite pattern, and an additional proposition output unit creates a proposition as a rationale for the input proposition using the created template, and represents a node added to the discussion structure Output as a proposition.
  • the program of the present invention is a program for causing a computer to function as each part of the discussion structure expansion device.
  • the data structure of the present invention is a data structure for outputting a proposition represented by a node to be added to a discussion structure including a node representing each of a proposition to be the center of discussion and a proposition to be the basis of another proposition.
  • it is a data structure having, as items, rewrite patterns that are rewritten by replacing words or phrases or adding words or phrases.
  • a proposition represented by the node of the discussion structure is input, a template is created using a predetermined rewrite pattern, and the template is used to input the input.
  • a discussion structure can be automatically expanded by creating a proposition as a rationale for the proposition and outputting it as a proposition represented by a node added to the discussion structure.
  • the propositional discussion scheme represented by the node to be added the polarity indicating whether the proposition represented by the node to be expanded is supported, and the proposition represented by the node to be expanded.
  • the discussion structure can be automatically expanded by having each of the rewrite patterns to be rewritten by replacing a word or a phrase or adding a word or a phrase as an item.
  • deployment apparatus which concerns on this embodiment. It is a figure which shows an example of a template list. It is a figure which shows an example of the output of a template preparation part. It is a figure which shows an example of an element list. It is a figure which shows an example of the word list which a filling element enumeration part outputs. It is a figure which shows an example of an additional proposition candidate. It is a figure which shows an example of the rank and score of an additional proposition candidate. It is a figure which shows the example of an output of an additional proposition. It is a flowchart which shows the flow of the argument structure expansion process which concerns on this embodiment. It is a schematic diagram which shows the argument structure in Walton's theory.
  • the discussion structure expansion device When there is a predetermined discussion structure in a certain domain, the discussion structure expansion device according to the present embodiment automatically adds a node as a rationale to the node in the discussion structure. Specifically, for each of the propositions represented by each node in the discussion structure (propositions are expressed in text), a proposition (a proposition representing support or a proposition representing dissatisfaction) will be created. And connect it to the original node as an additional node. The proposition of the added node is created using a node creation template prepared for each discussion scheme. Since the discussion scheme represents a typical pattern of discussion, using the discussion scheme makes it possible to add propositions to various nodes robustly.
  • Fig. 1 shows a part of the node proposition added.
  • the figure shows a node added to the proposition “climbing gets tired” using a discussion scheme of EO (expert opinion), CO (synthesis), and CE (cause to result). Details of each discussion scheme will be described later in Examples.
  • EO expert opinion
  • CO synthesis
  • CE cause to result
  • FIG. 2 is a block diagram illustrating a functional configuration of the discussion structure expansion device 10 according to the present embodiment.
  • the discussion structure expansion device 10 includes an input unit 12, a calculation unit 14, and an output unit 16.
  • the input unit 12 receives a text (proposition) described in an arbitrary node in a predetermined discussion structure as an input.
  • a text proposition
  • the text described in that node is used as an input.
  • the discussion structure includes a node representing each of a proposition that is the center of the discussion and a proposition that is the basis for other propositions.
  • the calculation unit 14 When the proposition (additional proposition) that can be used as the basis for the input proposition can be generated, the calculation unit 14 outputs the proposition using the output unit 16.
  • the calculation unit 14 includes a template list 20, a template creation unit 22, an element list 24, a filling element listing unit 26, and an additional proposition output unit 28.
  • the template list 20 is a list of templates representing a predetermined rewrite pattern for a proposition, and is a data structure for outputting a proposition represented by a node added to the discussion structure.
  • the template list 20 includes a discussion scheme for the proposition represented by the node to be added, a polarity indicating whether the proposition represented by the node to be added supports the proposition represented by the node to be expanded, and a node to be expanded. It is a data structure having as an item, a rewrite pattern that is rewritten by replacing a word or a phrase or adding a word or a phrase to a proposition to be expressed.
  • FIG. 3 shows a template list used in the present embodiment.
  • This template list is a summary of rewriting patterns when creating a proposition as a rationale from a proposition to be expanded, using the discussion scheme defined in Reference 3 above.
  • Each column in FIG. 3 includes, from the left, the serial number, abbreviation, and English name of the scheme of the added proposition, and support / non-support of the proposition to be expanded about the added proposition (support is “+” Support indicates '-'), rewriting method, and rewriting examples are shown.
  • “()” Included in the output after rewriting represents a blank, and a final template is created by filling an appropriate filling element (word or phrase) in the blank.
  • Rewriting is basically restricted to create a template by replacing one clause or adding one clause to the input. This is because when the number of blanks after rewriting increases, it becomes difficult to automatically estimate appropriate elements, and the accuracy rate of the additional propositions that are finally output decreases.
  • Reference 3 those schemes where rewriting cannot be expressed by replacement of one clause and additional operations are excluded from the template list.
  • the template creation unit 22 receives as input the text representing the proposition of the node to be expanded, and creates a template for creating additional proposition candidates using the templates stored in the template list 20.
  • a template created by rewriting an input “automatic driving is good” and a template created regardless of the input are output. Note that “-” corresponds to no output, and indicates that the template could not be created in the corresponding scheme.
  • the element list 24 stores a word list in which words that can be embedded in the template are listed, and a phrase list in which phrases are listed.
  • Fig. 5 shows an example of the word list and clause list included in the element list.
  • a line beginning with “word:” represents a word list, and a line beginning with “sentence:” represents a phrase list.
  • the filling element enumeration unit 26 uses the element list 24 to output all word lists or phrase lists in accordance with blanks in the template.
  • FIG. 6 shows an example of elements output for the template of the AC scheme of FIG. As described above, in the template of the AC IV scheme in FIG. 4 described above, since the word is filled as a blank element, the entire word list is output.
  • the additional proposition output unit 28 creates a proposition as a rationale for the input proposition using the created template, and outputs it as a proposition represented by the node added to the discussion structure.
  • the additional proposition output unit 28 includes an additional proposition candidate output unit 30 and an additional proposition candidate ranking unit 32.
  • the additional proposition candidate output unit 30 generates additional proposition candidates by embedding each word of the word list included in the element list 24 or each phrase of the phrase list in a blank included in the created template.
  • candidate candidates for additional propositions corresponding to the number of elements output by the embedding element enumeration unit 26 are output. At this time, one element is filled in one blank of the template.
  • FIG. 7 shows additional proposition candidates created using the AC scheme template (FIG. 4) output from the template creation unit 22 and the element list (FIG. 6) output from the filling element enumeration unit 26 for the AC scheme.
  • the additional proposition candidate ranking unit 32 ranks the additional proposition candidates and outputs the upper additional proposition candidates as propositions represented by the nodes added to the discussion structure.
  • the additional proposition candidate ranking unit 32 ranks the additional proposition candidates output by the additional proposition candidate output unit 30 to output a proposition that serves as a rationale for the input proposition.
  • the output of the additional proposition candidate ranking unit 32 is a proposition of a node representing support or non-support.
  • a technique for calculating the appearance probability of a sentence for example, a language model described later
  • a technique for calculating a similarity between sentences for example, word2vec described later
  • a language model is a model for calculating the probability of occurrence of an arbitrary character string. By using the language model, it is possible to determine an inappropriate character string with a low probability of appearing.
  • a language model can be created by preparing a large-scale text set, dividing it through a morphological analysis tool, and then using the language model creation tool. For example, Wikiepda (R) dump data (http: // dumps. Wikimedia.org/) as a large text set, MeCab (http: // taku910. Github.io/mecab/) as a morphological analysis tool, language model creation Kenlm (https://kheafield.com/code/kenlm/) is used as a tool.
  • the additional proposition candidate ranking unit 32 calculates the probability that each additional proposition candidate appears as a sentence using a language model created in advance.
  • word2vec is a technique for expressing a word as a vector. By using a model created using word2vec, arbitrary words can be expressed as vectors, and by calculating the distance between them, it is possible to estimate the closeness of the word contents. In addition, when there are two sentences, it is possible to estimate the closeness of the sentence contents by calculating the vector average of the words included in each sentence and calculating the distance between them. By using word2vec, it is possible to determine inappropriate additional proposition candidates whose contents differ greatly from the input proposition.
  • the additional proposition candidate ranking unit 32 uses word2vec created in advance to estimate the closeness of the contents of the input proposition and the additional proposition candidate.
  • ⁇ LangModelScore represents the language model score for the additional proposition candidate
  • Word2vecScore represents the word2vec score for the additional proposition candidate
  • w represents the weighting coefficient of LangModelScore. Ranking is performed by calculating a score for each additional proposition candidate based on this formula. For example, set w to 0.5 and calculate the score.
  • FIG. 8 shows an example of scores and rankings calculated for each additional proposition candidate shown in FIG.
  • Figure 9 shows the actual output in the case of Figure 8. For example, a threshold of ⁇ 1.0 or more is output, and ranks 1 and 2 “automatic driving is good for economy” and “automatic driving is safe” are output. At this time, the type of discussion scheme of additional proposition candidates and the support / non-support of the scheme are output together. If there is such an output, for example, it is possible to generate the utterance “Because automatic driving is good for economy” as the reason for the utterance “automatic driving is good”.
  • step S100 the input text representing the proposition of the node to be expanded is received, and a template for creating additional proposition candidates is created using the templates stored in the template list 20.
  • step S102 using the element list 24, the entire word list or phrase list is output in accordance with the blank in the template.
  • step S104 additional proposition candidates are generated by embedding each word of the word list included in the element list 24 or each phrase of the phrase list in a blank included in the created template.
  • step S106 the additional proposition candidates are ranked, and the upper additional proposition candidates are output by the output unit 16 as propositions represented by the nodes to be added to the discussion structure.
  • a proposition represented by the node of the discussion structure is input, a template is created using a predetermined rewrite pattern, and input is performed using the template.
  • the argument structure can be automatically extended by creating a proposition as the reasoning for the proposition and outputting it as a proposition represented by the node added to the argument structure.
  • the discussion structure by expanding the discussion structure, the performance of a system that performs processing based on the discussion structure is improved. For example, in the dialogue system in which the discussion structure is given using the discussion structure given in advance as in Reference Document 4, the discussion structure is expanded so that various user utterances can be mapped to the nodes in the discussion structure. The system can return an appropriate response to a wider variety of user utterances.
  • the discussion structure expansion device described above has a computer system inside.
  • the “computer system” uses a WWW system, a homepage providing environment (or display) Environment).
  • the constructed program may be stored in a portable storage medium such as a hard disk or CD-ROM, and installed in a computer or distributed.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

議論構造を自動的に拡張することができる。 テンプレート作成部22が、議論の中心となる命題と、他の命題の論拠となる命題との各々を表すノードを含む議論構造の前記ノードが表す命題を入力とし、所定の書き換えパターンを用いて、テンプレートを作成する。追加命題出力部28が、作成されたテンプレートを用いて、入力の命題の論拠となる命題を作成し、議論構造に追加するノードが表す命題として出力する。

Description

議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造
 本発明は、議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造に関する。
 対話システムにおいて、人間はコンピュータと対話をし、種々の情報を得たり、要望を満たしたりする。また、所定のタスクを達成するだけではなく、日常会話を行う対話システムも存在し、これらによって、人間は精神的な安定を得たり、承認欲を満たしたり、信頼関係を築いたりする。対話システムの類型については参考文献1や参考文献2に詳述されている。
[参考文献1] 河原達也,荒木雅弘,音声対話システム,オーム社,2006.
[参考文献2] 中野幹生,駒谷和範,船越孝太郎,中野有紀子,奥村学(監修)対話システム,コロナ社,2016.
 一方、タスク達成や日常会話ではなく、より深い議論をコンピュータによって実現するための研究も進められている。議論は人間の価値判断を変えたり、思考を整理したりする働きがあり、人間にとって重要な役割を果たす。たとえば、議論のモデルを提案する研究がある。
 ウォルトンのモデルでは、ウォルトンが提案する議論のモデル(参考文献3)では、命題が支持(プラス)・不支持(マイナス)、もしくは、議論スキーム(支持・不支持のパターン)を持つ矢印で結ばれている。ウォルトンのモデルにおける議論構造を図示すると図11のようになる。楕円は命題を表すノードである。ノードには命題を表す文字列が付与されている。「草花がきれい」は「山に行くのがよい」にプラスで接続されており、支持する内容である。「登山は疲れる」は「山に行くのがよい」にマイナスでつながれており、反論となっている。また、「登山は疲れる」は「足腰が鍛えられる」とマイナスでつながれており反論となっている。図中では、Practical Reasoning(PR)という議論スキームが用いられている。PR の前のプラスは支持を表している。PR は「一般的に考えて良いという根拠を支持・不支持に用いる」という議論のパターンを表す。参考文献3 には、29 の議論スキームが列挙されている。PR の他には、Expert Opinion(専門家がそう言っているという根拠を支持・不支持に用いる)などがある。
[参考文献3] Methods of Argumentation, Douglas Walton, Cambridge University Press,2013.
 議論構造を、テキストデータから自動的に抽出する試みは多い。そのような研究は以下の非特許文献1にまとめられている。
 また、議論構造の応用として、人手で作成した議論構造に基づいて議論を行う対話システムに関する研究(参考文献4)が存在する。参考文献4では、ユーザ発話を議論構造中のノードにマッピングし、そのノードと接続関係にあるノードをシステム発話としてユーザに返すことで議論を行う。
[参考文献4] Ryuichiro Higashinaka ほか、Argumentative dialogue system based on argu-mentation structures、Proceedings of The 21st Workshop on the Semantics and Pragmaticsof Dialogue、p154-155、2017
Lippi, M., Torroni, P., Argumentation Mining: State of the Art and Emerging Trends, ACM Transactions on Internet Technology, 16(2): 10, 2016.
 上記非特許文献1でまとめられているように、議論構造をテキストから抽出する試みは存在するが、議論構造が与えられたとき、論拠を自動的に追加することで、議論構造を拡張する技術は存在しない。
 本発明は、議論構造を自動的に拡張することができる議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造を提供することを目的とする。
 上記目的を達成するために、本発明の議論構造拡張装置は、議論の中心となる命題と、他の命題の論拠となる命題との各々を表すノードを含む議論構造の前記ノードが表す命題を入力とし、所定の書き換えパターンを用いて、テンプレートを作成するテンプレート作成部と、前記作成されたテンプレートを用いて、前記入力の命題の論拠となる命題を作成し、前記議論構造に追加するノードが表す命題として出力する追加命題出力部と、を含んで構成されている。
 本発明の議論構造拡張方法は、テンプレート作成部が、議論の中心となる命題と、他の命題の論拠となる命題との各々を表すノードを含む議論構造の前記ノードが表す命題を入力とし、所定の書き換えパターンを用いて、テンプレートを作成し、追加命題出力部が、前記作成されたテンプレートを用いて、前記入力の命題の論拠となる命題を作成し、前記議論構造に追加するノードが表す命題として出力する。
 本発明のプログラムは、コンピュータを、上記議論構造拡張装置の各部として機能させるためのプログラムである。
 本発明のデータ構造は、議論の中心となる命題と、他の命題の論拠となる命題との各々を表すノードを含む議論構造に追加するノードが表す命題を出力するためのデータ構造であって、追加するノードが表す命題の議論スキーム、追加するノードが表す命題が、拡張の対象となるノードが表す命題を支持するか否かを表す極性、及び前記拡張の対象となるノードが表す命題に対して、単語若しくは文節を置換するか、又は単語若しくは文節を追加することによって書き換える書き換えパターンの各々を項目として有するデータ構造である。
 本発明に係る議論構造拡張装置、方法、及びプログラムによれば、議論構造の前記ノードが表す命題を入力とし、所定の書き換えパターンを用いて、テンプレートを作成し、テンプレートを用いて、前記入力の命題の論拠となる命題を作成し、前記議論構造に追加するノードが表す命題として出力することにより、議論構造を自動的に拡張することができる。
 本発明に係るデータ構造によれば、追加するノードが表す命題の議論スキーム、拡張の対象となるノードが表す命題を支持するか否かを表す極性、及び前記拡張の対象となるノードが表す命題に対して、単語若しくは文節を置換するか、又は単語若しくは文節を追加することによって書き換える書き換えパターンの各々を項目として有することにより、議論構造を自動的に拡張することができる。
拡張後の議論構造を示す模式図である。 本実施形態に係る議論構造拡張装置の機能的な構成を示すブロック図である。 テンプレートリストの一例を示す図である。 テンプレート作成部の出力の一例を示す図である。 要素リストの一例を示す図である。 穴埋め要素列挙部が出力する単語リストの一例を示す図である。 追加命題候補の一例を示す図である。 追加命題候補のランク及びスコアの一例を示す図である。 追加命題の出力例を示す図である。 本実施形態に係る議論構造拡張処理の流れを示すフローチャートである。 ウォルトンの理論における議論構造を示す模式図である。
 以下、本実施形態について図面を用いて説明する。
<本実施形態の概要>
 本実施形態に係る議論構造拡張装置は、あるドメインにおける所定の議論構造があるとき、その議論構造中のノードに対して、その論拠となるノードを自動的に追加する。具体的には、議論構造中の各ノードが表す命題(命題はテキストで表現される)に対して、その命題の論拠となる命題(支持を表す命題、または、不支持を表す命題)を作成し、それを追加ノードとして元のノードに接続する。追加されるノードの命題は、議論スキームごとに用意した、ノード作成用のテンプレートを用いて作成される。議論スキームは議論の典型的なパターンを表すため、議論スキームを用いることで、さまざまなノードに対して頑健に命題を追加することができる。
 図1に追加されるノードの命題の一部を示す。図中には、「登山は疲れる」という命題に対して、EO(専門家の意見)、CO(合成)、CE(原因から結果)という議論スキームを用いて追加したノードが示されている。各議論スキームの詳細は実施例にて後述する。
<本実施形態に係る議論構造拡張装置の構成>
 図2は、本実施形態に係る議論構造拡張装置10の機能的な構成を示すブロック図である。図2に示すように、本実施形態に係る議論構造拡張装置10は、入力部12と、演算部14と、出力部16とを備えている。
 入力部12は、入力として、所定の議論構造中の任意のノードに記述されたテキスト(命題)を受け取る。なお、議論構造中のノードを入力として使用する場合は、そのノードに記述されたテキストを入力として利用する。
 なお、議論構造は、議論の中心となる命題と、他の命題の論拠となる命題との各々を表すノードを含むものである。
 演算部14は、入力された命題の論拠となる命題(追加命題)が生成可能な場合、それを出力部16により出力する。
 演算部14は、テンプレートリスト20と、テンプレート作成部22と、要素リスト24と、穴埋め要素列挙部26と、追加命題出力部28とを備えている。
 テンプレートリスト20は、命題に対する所定の書き換えパターンを表すテンプレートのリストであり、議論構造に追加するノードが表す命題を出力するためのデータ構造である。テンプレートリスト20は、追加するノードが表す命題の議論スキーム、追加するノードが表す命題が、拡張の対象となるノードが表す命題を支持するか否かを表す極性、及び拡張の対象となるノードが表す命題に対して、単語若しくは文節を置換するか、又は単語若しくは文節を追加することによって書き換える書き換えパターンの各々を項目として有するデータ構造である。
 図3に、本実施の形態で利用しているテンプレートリストを示す。このテンプレートリストは、上記参考文献3で定義されている議論スキームを用いて、拡張の対象となる命題からその論拠となる命題を作成する際の書き換えのパターンをまとめたものである。図3の各列には、左から、追加される命題のスキームの通し番号、略称、英語名、追加される命題についての拡張の対象となる命題の支持・不支持(支持は‘+'、不支持は‘-' を表す)、書き換え方法、書き換えの例が示されている。書き換え後の出力に含まれる“()” はブランクを表しており、ブランクに適切な穴埋め要素(単語または文節)を埋めることで、最終的なテンプレートが作成される。
 書き換えは基本的に、入力に対して、1つ文節を置換するか、もしくは、1つ文節を追加することでテンプレートが作成されるように制限されている。これは、書き換え後のブランクの数が多くなった場合、適切な要素を自動で推定することが難しくなり、最終的に出力される追加命題の正解率が低くなるためである。参考文献3で定義されている議論スキームの中で、書き換えを1つの文節の置換、および、追加の操作で表現することができないスキームは、テンプレートリストから除外されている。
 テンプレート作成部22は、入力として、拡張の対象となるノードの命題を表すテキストを受け付け、テンプレートリスト20に記憶されているテンプレートを用いて、追加命題候補作成用のテンプレートを作成する。
 例えば、図4に示すように、「自動運転はよい」という入力に対して書き換えを行うことにより作成されたテンプレートと、入力とは関係なく作成されたテンプレートとが出力される。なお、"-"は、出力なしに対応し、該当するスキームではテンプレートが作成できなかったことを表す。
 要素リスト24には、テンプレートに埋まる可能性がある単語が列挙された単語リスト、および、文節が列挙された文節リストが格納されている。
 図5に要素リストが含む単語リスト、および、文節リストの例を示す。“単語:”で始まる行は単語リストを表し、“文節:” で始まる行は文節リストを表す。
 穴埋め要素列挙部26は、要素リスト24を用いて、テンプレート中のブランクに合わせて、単語リスト、もしくは、文節リストを全て出力する。
 図6に、上記図4のACスキームのテンプレートに対して出力する要素の例を示す。このように、上記図4のAC スキームのテンプレートでは、ブランクの要素として単語が埋まるため、単語リストを全て出力する。
 追加命題出力部28は、作成されたテンプレートを用いて、入力の命題の論拠となる命題を作成し、議論構造に追加するノードが表す命題として出力する。
 具体的には、追加命題出力部28は、追加命題候補出力部30と、追加命題候補ランキング部32とを備えている。
 追加命題候補出力部30は、作成されたテンプレートに含まれるブランクに、要素リスト24に含まれる単語リストの各単語又は文節リストの各文節を埋め込むことにより、追加命題候補を生成する。
 具体的には、テンプレート1つにつき、穴埋め要素列挙部26が出力した要素の個数分の追加命題候補を出力する。このとき、テンプレートのブランク1つには、要素1つを埋める。
 図7に、テンプレート作成部22が出力したACスキームのテンプレート(図4)、および、ACスキームに対して穴埋め要素列挙部26が出力した要素リスト(図6)を用いて作成される追加命題候補の例を示す。
 追加命題候補ランキング部32は、追加命題候補をランキングして、上位の追加命題候補を、議論構造に追加するノードが表す命題として出力する。
 具体的には、追加命題候補ランキング部32は、追加命題候補出力部30が出力した追加命題候補をランキングすることで、入力された命題の論拠となる命題を出力する。議論構造のノードを入力として使用した場合、追加命題候補ランキング部32の出力は、支持もしくは不支持を表すノードの命題となる。追加命題候補をランキングする際には、文の出現確率を計算する手法(例えば、後述する言語モデル)、および、文間の類似度を計算する手法(例えば、後述するword2vec)を用いる。
 言語モデルとは、任意の文字列について、その文字列が出現する確率を計算するためのモデルである。言語モデルを用いることで、出現する確率の低い不適切な文字列を判定することができる。言語モデルは、大規模なテキスト集合を用意し、それらを形態素解析ツールにかけて分ち書きした後、言語モデル作成ツールを利用することで、作成が可能である。例えば、大規模テキスト集合としてWikiepda(R)のダンプデータ(http://dumps. wikimedia.org/)、形態素解析ツールとしてMeCab(http://taku910. github.io/mecab/)、言語モデル作成ツールとしてkenlm(https://kheafield.com/code/kenlm/)を利用する。追加命題候補ランキング部32では、あらかじめ作成した言語モデルを利用して、各追加命題候補が文として出現する確率を計算する。word2vecとは、単語をベクトルとして表現する手法である。word2vecを用いて作成したモデルを用いることで、任意の単語をベクトルとして表現することができ、それらの間の距離を計算することで、単語の内容の近さを推定することが可能である。また、2つの文があったとき、各文に含まれる単語のベクトル平均を計算し、それらの距離を計算することで、文の内容の近さを推定することも可能である。word2vecを用いることで、入力された命題と内容が大きく異なる不適切な追加命題候補を判定することができる。word2vecのモデルを作成するためには、言語モデルと同様に、分かち書きした大規模なテキスト集合を用意し、それらをword2vcのツールに適用する。word2vecの作成ツールとして、例えばgensim(https://radimrehurek.com/gensim/)を利用する。追加命題候補ランキング部32では、あらかじめ作成したword2vecを用いて、入力された命題と追加命題候補の内容の近さを推定する。
 言語モデルとword2vecを用いて、各追加命題候補の文としての出現確率、および、各追加命題候補と入力された命題の関連度を計算し、それらを重み付きで足し合わせることで、各追加命題候補の最終的なスコアを決定する。この計算式を以下に示す。
Figure JPOXMLDOC01-appb-M000001

 
 LangModelScoreは追加命題候補に対する言語モデルのスコア、Word2vecScoreは追加命題候補に対するword2vecのスコアを表す。wはLangModelScoreの重み係数を表す。この式に基づいて各追加命題候補に対してスコアを計算することで、ランキングを行う。例えば、wは0.5に設定してスコアを計算する。
 図8に、図7で示した各追加命題候補に対して計算されたスコア、および、ランキングの例を示す。
 図9に、図8の場合の実際の出力を示す。例えば、閾値として-1.0以上を出力するようにし、ランク1と2の「自動運転は経済によい」、「自動運転は安全によい」を出力する。このとき、追加命題候補の議論スキームの種類、および、そのスキームの支持・不支持を合わせて出力する。このような出力があれば、例えば、「自動運転は良いよね」という発話に対して、その理由となる発話「自動運転は経済に良いからね」を生成することが可能になる。
<本実施形態に係る議論構造拡張装置10の作用>
 本実施形態に係る議論構造拡張装置10による議論構造拡張処理の流れを、図10に示すフローチャートを用いて説明する。本実施形態では、議論構造拡張装置10に、所定の議論構造中の、拡張の対象となるノードの命題を表すテキストが入力されると、議論構造拡張処理が開始される。
 ステップS100では、入力された、拡張の対象となるノードの命題を表すテキストを受け付け、テンプレートリスト20に記憶されているテンプレートを用いて、追加命題候補作成用のテンプレートを作成する。
 ステップS102では、要素リスト24を用いて、テンプレート中のブランクに合わせて、単語リスト、もしくは、文節リストを全て出力する。
 ステップS104では、作成されたテンプレートに含まれるブランクに、要素リスト24に含まれる単語リストの各単語又は文節リストの各文節を埋め込むことにより、追加命題候補を生成する。
 ステップS106では、追加命題候補をランキングして、上位の追加命題候補を、議論構造に追加するノードが表す命題として出力部16により出力する。
 以上説明したように、本実施形態に係る議論構造拡張装置によれば、議論構造の前記ノードが表す命題を入力とし、所定の書き換えパターンを用いて、テンプレートを作成し、テンプレートを用いて、入力の命題の論拠となる命題を作成し、議論構造に追加するノードが表す命題として出力することにより、議論構造を自動的に拡張することができる。
 また、議論構造が拡張されることで、議論構造に基づく処理を行うシステムの性能が向上する。例えば、上記参考文献4のように、あらかじめ与えられた議論構造を用いて議論を行う対話システムでは、議論構造が拡張されることで、よりさまざまなユーザ発話を議論構造中のノードにマッピングさせることができるようになるため、システムがよりさまざまなユーザ発話に対して適切な応答を返すことが可能になる。
 なお、本実施形態では、上述の議論構造拡張装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
 また、構築されたプログラムをハードディスク、CD-ROM等の可搬記憶媒体に格納し、コンピュータにインストールしたり、配布したりしても良い。
10 議論構造拡張装置
12 入力部
14 演算部
16 出力部
20 テンプレートリスト
22 テンプレート作成部
24 要素リスト
26 要素列挙部
28 追加命題出力部
30 追加命題候補出力部
32 追加命題候補ランキング部

Claims (5)

  1.  議論の中心となる命題と、他の命題の論拠となる命題との各々を表すノードを含む議論構造の前記ノードが表す命題を入力とし、所定の書き換えパターンを用いて、テンプレートを作成するテンプレート作成部と、
     前記作成されたテンプレートを用いて、前記入力の命題の論拠となる命題を作成し、前記議論構造に追加するノードが表す命題として出力する追加命題出力部と、
     を含む議論構造拡張装置。
  2.  前記テンプレート作成部は、単語又は文節を埋めるためのブランクを有する前記テンプレートを作成し、
     前記追加命題出力部は、前記テンプレートに含まれるブランクに、予め用意された単語リストの各単語又は文節リストの各文節を埋め込むことにより、追加命題候補を生成し、前記追加命題候補をランキングして、上位の前記追加命題候補を、前記議論構造に追加するノードが表す命題として出力する請求項1記載の議論構造拡張装置。
  3.  テンプレート作成部が、議論の中心となる命題と、他の命題の論拠となる命題との各々を表すノードを含む議論構造の前記ノードが表す命題を入力とし、所定の書き換えパターンを用いて、テンプレートを作成し、
     追加命題出力部が、前記作成されたテンプレートを用いて、前記入力の命題の論拠となる命題を作成し、前記議論構造に追加するノードが表す命題として出力する
     議論構造拡張方法。
  4.  コンピュータを、請求項1又は2記載の議論構造拡張装置の各部として機能させるためのプログラム。
  5.  議論の中心となる命題と、他の命題の論拠となる命題との各々を表すノードを含む議論構造に追加するノードが表す命題を出力するためのデータ構造であって、
     追加するノードが表す命題の議論スキーム、
     追加するノードが表す命題が、拡張の対象となるノードが表す命題を支持するか否かを表す極性、及び
     前記拡張の対象となるノードが表す命題に対して、単語若しくは文節を置換するか、又は単語若しくは文節を追加することによって書き換える書き換えパターン
     の各々を項目として有するデータ構造。
PCT/JP2019/005622 2018-02-16 2019-02-15 議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造 WO2019160098A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/970,334 US11036935B2 (en) 2018-02-16 2019-02-15 Argument structure extension device, argument structure extension method, program, and data structure

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-026313 2018-02-16
JP2018026313A JP6973157B2 (ja) 2018-02-16 2018-02-16 議論構造拡張装置、議論構造拡張方法、及びプログラム

Publications (1)

Publication Number Publication Date
WO2019160098A1 true WO2019160098A1 (ja) 2019-08-22

Family

ID=67618730

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/005622 WO2019160098A1 (ja) 2018-02-16 2019-02-15 議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造

Country Status (3)

Country Link
US (1) US11036935B2 (ja)
JP (1) JP6973157B2 (ja)
WO (1) WO2019160098A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11562135B2 (en) * 2018-10-16 2023-01-24 Oracle International Corporation Constructing conclusive answers for autonomous agents
US11321536B2 (en) 2019-02-13 2022-05-03 Oracle International Corporation Chatbot conducting a virtual social dialogue

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612445A (ja) * 1992-06-25 1994-01-21 Agency Of Ind Science & Technol 対話処理制御装置
JP2015121897A (ja) * 2013-12-20 2015-07-02 国立研究開発法人情報通信研究機構 シナリオ生成装置、及びそのためのコンピュータプログラム
WO2016051551A1 (ja) * 2014-10-01 2016-04-07 株式会社日立製作所 文章生成システム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5887120A (en) * 1995-05-31 1999-03-23 Oracle Corporation Method and apparatus for determining theme for discourse
US7392185B2 (en) * 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US6785651B1 (en) * 2000-09-14 2004-08-31 Microsoft Corporation Method and apparatus for performing plan-based dialog
US20020178184A1 (en) * 2001-05-22 2002-11-28 Allan Kuchinsky Software system for biological storytelling
DE112005002534T5 (de) * 2004-10-12 2007-11-08 University Of Southern California, Los Angeles Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
US8041570B2 (en) * 2005-05-31 2011-10-18 Robert Bosch Corporation Dialogue management using scripts
US8032375B2 (en) * 2006-03-17 2011-10-04 Microsoft Corporation Using generic predictive models for slot values in language modeling
US8671341B1 (en) * 2007-01-05 2014-03-11 Linguastat, Inc. Systems and methods for identifying claims associated with electronic text
US10540430B2 (en) * 2011-12-28 2020-01-21 Cbs Interactive Inc. Techniques for providing a natural language narrative
EP3622412A1 (en) * 2017-05-10 2020-03-18 Oracle International Corporation Enabling rhetorical analysis via the use of communicative discourse trees
US10817670B2 (en) * 2017-05-10 2020-10-27 Oracle International Corporation Enabling chatbots by validating argumentation
US10679011B2 (en) * 2017-05-10 2020-06-09 Oracle International Corporation Enabling chatbots by detecting and supporting argumentation
US11373632B2 (en) * 2017-05-10 2022-06-28 Oracle International Corporation Using communicative discourse trees to create a virtual persuasive dialogue
US10839161B2 (en) * 2017-06-15 2020-11-17 Oracle International Corporation Tree kernel learning for text classification into classes of intent
JP6603828B1 (ja) * 2018-03-02 2019-11-06 日本電信電話株式会社 フレーズ生成モデル学習装置、フレーズ生成装置、方法、及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612445A (ja) * 1992-06-25 1994-01-21 Agency Of Ind Science & Technol 対話処理制御装置
JP2015121897A (ja) * 2013-12-20 2015-07-02 国立研究開発法人情報通信研究機構 シナリオ生成装置、及びそのためのコンピュータプログラム
WO2016051551A1 (ja) * 2014-10-01 2016-04-07 株式会社日立製作所 文章生成システム

Also Published As

Publication number Publication date
US11036935B2 (en) 2021-06-15
JP6973157B2 (ja) 2021-11-24
US20210081607A1 (en) 2021-03-18
JP2019144692A (ja) 2019-08-29

Similar Documents

Publication Publication Date Title
JP6678764B1 (ja) 多言語での自動化されたアシスタントを用いたエンドツーエンドコミュニケーションの促進
JP6310150B2 (ja) 意図理解装置、方法およびプログラム
US10037758B2 (en) Device and method for understanding user intent
US20200251091A1 (en) System and method for defining dialog intents and building zero-shot intent recognition models
US20200104746A1 (en) Training encoder model and/or using trained encoder model to determine responsive action(s) for natural language input
US9280967B2 (en) Apparatus and method for estimating utterance style of each sentence in documents, and non-transitory computer readable medium thereof
US20160163314A1 (en) Dialog management system and dialog management method
JP5403696B2 (ja) 言語モデル生成装置、その方法及びそのプログラム
US11016968B1 (en) Mutation architecture for contextual data aggregator
JP6676110B2 (ja) 発話文生成装置とその方法とプログラム
JP6955963B2 (ja) 検索装置、類似度算出方法、およびプログラム
JP2009036999A (ja) コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
EP3598436A1 (en) Structuring and grouping of voice queries
JP2015219583A (ja) 話題決定装置、発話装置、方法、及びプログラム
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
Dethlefs et al. Conditional random fields for responsive surface realisation using global features
CN102999533A (zh) 一种火星文识别方法和系统
CN108536735A (zh) 基于多通道自编码器的多模态词汇表示方法与系统
WO2019160098A1 (ja) 議論構造拡張装置、議論構造拡張方法、プログラム、及びデータ構造
JP7279099B2 (ja) 対話管理
JP2005228075A (ja) 日常言語プログラム処理システム、その方法および修辞構造解析方法
JP6232358B2 (ja) 次発話候補ランキング装置、方法、及びプログラム
JP2010231149A (ja) 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム
JP2008204133A (ja) 回答検索装置及びコンピュータプログラム
JP6574469B2 (ja) 次発話候補ランキング装置、方法、及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19753821

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19753821

Country of ref document: EP

Kind code of ref document: A1