JP5540335B2 - Natural language sentence generation device and computer program - Google Patents
Natural language sentence generation device and computer program Download PDFInfo
- Publication number
- JP5540335B2 JP5540335B2 JP2010224872A JP2010224872A JP5540335B2 JP 5540335 B2 JP5540335 B2 JP 5540335B2 JP 2010224872 A JP2010224872 A JP 2010224872A JP 2010224872 A JP2010224872 A JP 2010224872A JP 5540335 B2 JP5540335 B2 JP 5540335B2
- Authority
- JP
- Japan
- Prior art keywords
- template
- word
- sentence
- extension
- templates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004590 computer program Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 16
- 230000014509 gene expression Effects 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 230000000877 morphologic effect Effects 0.000 description 9
- 238000000605 extraction Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 241001282315 Nemesis Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 235000015114 espresso Nutrition 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- NHDHVHZZCFYRSB-UHFFFAOYSA-N pyriproxyfen Chemical compound C=1C=CC=NC=1OC(C)COC(C=C1)=CC=C1OC1=CC=CC=C1 NHDHVHZZCFYRSB-UHFFFAOYSA-N 0.000 description 2
- 241001632422 Radiola linoides Species 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
この発明は、自然言語の質問文を受けて回答を生成するシステムに関し、特に、自然言語で発せられた任意の質問に対する高精度な回答を自動的に生成する質問応答装置に関する。 The present invention relates to a system that receives a natural language question sentence and generates an answer, and more particularly, to a question answering apparatus that automatically generates a highly accurate answer to an arbitrary question issued in a natural language.
種々の質問に対して回答を与える質問応答システムの開発が進んでいる。たとえば後掲の非特許文献1には、ある関係にある単語対を取り出す技術が開示されている。非特許文献1に開示された技術では、取り出したい関係の単語を少量準備し、その単語対からパターンを学習する。回答時には、このパターンを利用して、その関係の単語対を取り出す。 Development of a question answering system that gives answers to various questions is in progress. For example, Non-Patent Document 1 described later discloses a technique for extracting word pairs having a certain relationship. In the technique disclosed in Non-Patent Document 1, a small amount of related words to be extracted is prepared, and a pattern is learned from the word pairs. At the time of answering, this pattern is used to extract the word pair of the relationship.
しかしこの非特許文献1に記載された技術では、目的の単語対の抽出精度に問題があるとされている。 However, in the technique described in Non-Patent Document 1, there is a problem in the extraction accuracy of the target word pair.
一方、上記したようなパターンをさらに言い換えによって拡張して質問応答システムで利用しようとする試みが、非特許文献2に開示されている。
On the other hand, Non-Patent
しかし、上記した特許文献2に開示された技術は、十分に学習した分野の質問文に対する回答を推定することはできるものの、対応可能な分野に制限があるという問題がある。
However, although the technique disclosed in
特定の分野に予め質問を限定することは、ある特定の使途にのみ使用するシステムでは有用ではあるが、できればより広い範囲の質問に自動的に回答できる質問応答システムがあると望ましい。 Limiting questions in advance to a specific field is useful in a system that is used only for a specific purpose, but it is desirable to have a question answering system that can automatically answer a wider range of questions if possible.
それゆえに本発明の目的は、幅広い分野の、自然言語文による質問に対して精度よく、自動的に回答文を生成できる質問応答システムを提供することである。 SUMMARY OF THE INVENTION Therefore, an object of the present invention is to provide a question answering system capable of automatically generating an answer sentence with high accuracy in response to a question in a natural language sentence in a wide field.
本発明の第1の局面にかかる質問回答装置は、質問文に対する回答文のテンプレートであって、第1及び第2の2つの変数部分をもつテンプレートを記憶するためのテンプレート記憶手段と、質問文の入力を受けたことに応答し、テンプレート記憶手段に記憶されたテンプレートのうち、当該質問文に対する回答文の原型となる1又は複数のテンプレートを推定し、質問文のうちで各テンプレートの第1の変数部分に相当する単語を示す制約条件と共に出力するためのテンプレート推定手段と、テンプレート推定手段により出力されたテンプレートのうち、当該テンプレートの制約条件を構成する単語の単語クラスに基づいて選択されたテンプレートに対し、予め準備されたテンプレート拡張規則を適用することにより、単語又は文の構造が修正された1又は複数の拡張テンプレートを生成するためのテンプレート拡張手段とを含む。拡張テンプレートの各々は、質問文に対する回答候補の位置を示す第1及び第2の2つの変数を含み、当該2つの変数は、前記テンプレート記憶手段に記憶されたテンプレートの前記第1及び第2の2つの変数部分とそれぞれ関係付けられており、かつそれぞれには当該変数が満たすべき属性が指定されている。テンプレート拡張手段は、前記制約条件を構成する単語の属性が前記第1の変数と所定の関係を持つ拡張テンプレートを選択する。質問回答装置はさらに、テンプレート拡張手段により出力された拡張テンプレートの各々と、予め入手可能なように準備された多数の文とをマッチングすることにより、拡張テンプレートの第2の変数と交換可能な候補を1又は複数個出力するためのマッチング手段と、マッチング手段により出力された候補に対し、当該候補が得られるまでの経過、または当該候補にマッチした拡張テンプレートに含まれる単語と当該候補との共起頻度に基づいて、質問文に対する回答としての適格性を示すスコアを算出し、当該スコアの高いものの順番に候補を出力するためのスコアリング及び選択手段とを含む。 A question answering apparatus according to a first aspect of the present invention comprises a template storage means for storing a template of an answer sentence for a question sentence, the template having first and second variable parts, and a question sentence. In response to receiving the input, one or a plurality of templates serving as a prototype of the answer sentence for the question sentence is estimated from the templates stored in the template storage unit, and the first of each template is determined among the question sentences. The template estimation means for outputting together with the constraint condition indicating the word corresponding to the variable part of the template, and the template output by the template estimation means is selected based on the word class of the word constituting the constraint condition of the template By applying the template extension rules prepared in advance to the template, the structure of the word or sentence And a template extension means for generating one or more extension templates were Tadashisa. Each of the extension templates includes first and second variables indicating positions of answer candidates for the question sentence, and the two variables are the first and second variables of the template stored in the template storage unit. The two variable parts are associated with each other, and the attribute to be satisfied by the variable is designated for each. The template expansion means selects an expansion template in which the attribute of the word constituting the constraint condition has a predetermined relationship with the first variable. The question answering device further matches each of the extension templates output by the template extension means with a number of sentences prepared in advance so as to be exchangeable with the second variable of the extension template. Matching means for outputting one or a plurality of words, and the candidate output from the matching means until the candidate is obtained, or the word included in the extended template that matches the candidate and the candidate A scoring and selection means for calculating a score indicating eligibility as an answer to the question sentence based on the occurrence frequency and outputting candidates in order of the highest score is included.
変数の属性は、変数に代入される単語の単語クラスであってもよい。 The attribute of the variable may be a word class of a word assigned to the variable.
好ましくは、質問回答装置はさらに、質問文を通信により音声信号で受信し、音声認識によりテキスト列に変換してテンプレート推定手段に入力するための質問文受信手段を含む。 Preferably, the question answering apparatus further includes a question sentence receiving means for receiving the question sentence as a voice signal by communication, converting it into a text string by voice recognition, and inputting the text string to the template estimation means.
より好ましくは、質問回答装置はさらに、スコアリング及び選択手段により出力される候補を音声合成により音声に変換するための音声合成手段を含む。 More preferably, the question answering apparatus further includes speech synthesis means for converting candidates output by the scoring and selection means into speech by speech synthesis.
質問回答装置は、さらに、質問文を通信により音声信号で受信し、音声認識によりテキスト列に変換してテンプレート推定手段に入力するための質問文受信手段と、スコアリング及び選択手段により出力される候補を音声合成により音声信号に変換して、質問文を送信してきた端末に返信するための音声合成手段とを含んでもよい。 The question answering apparatus further receives the question sentence as a voice signal by communication, converts it into a text string by voice recognition, and outputs it to the template estimation means, and outputs it by the scoring and selection means. Speech candidates may be included for converting the candidate into a speech signal by speech synthesis and returning it to the terminal that sent the question sentence.
本発明の第2の局面にかかるコンピュータプログラムは、コンピュータを、質問文に対する回答文のテンプレートであって、第1及び第2の2つの変数部分をもつテンプレートを記憶するためのテンプレート記憶手段と、質問文の入力を受けたことに応答し、テンプレート記憶手段に記憶されたテンプレートのうち、当該質問文に対する回答文の原型となる1又は複数のテンプレートを推定し、質問文のうちで各テンプレートの第1の変数部分に相当する単語を示す制約条件と共に出力するためのテンプレート推定手段と、テンプレート推定手段により出力されたテンプレートの各々に対し、当該テンプレートの制約条件を構成する単語の単語クラス、及び予め準備されたテンプレート拡張規則を適用することにより、単語又は文の構造が修正された1又は複数の拡張テンプレートを生成するためのテンプレート拡張手段とを含み、拡張テンプレートの各々は、質問文に対する回答候補の位置を示す第1及び第2の2つの変数を含み、当該2つの変数は、前記テンプレート記憶手段に記憶されたテンプレートの前記第1及び第2の2つの変数部分とそれぞれ関係付けられており、テンプレート拡張手段により出力された拡張テンプレートの各々と、予め入手可能なように準備された多数の文とをマッチングすることにより、拡張テンプレートの第2の変数と交換可能な候補を1又は複数個出力するためのマッチング手段と、マッチング手段により出力された候補に対し、当該候補が得られるまでの経過、または若しくは当該候補にマッチした拡張テンプレートに含まれる単語と当該候補との共起頻度に基づいて、質問文に対する回答としての適格性を示すスコアを算出し、当該スコアの高いものの順番に候補を出力するためのスコアリング及び選択手段として機能させる。 A computer program according to a second aspect of the present invention comprises a template storage means for storing a computer as a template of an answer sentence for a question sentence, the template having first and second variable parts; In response to receiving the input of the question sentence, one or more templates that are the prototypes of the answer sentences for the question sentence are estimated from the templates stored in the template storage means, A template estimation unit for outputting together with a constraint condition indicating a word corresponding to the first variable part, a word class of a word constituting the constraint condition of the template for each of the templates output by the template estimation unit, and By applying pre-prepared template expansion rules, the structure of the word or sentence is corrected. A template extension means for generating one or a plurality of extended templates, each of the extension templates including first and second variables indicating positions of answer candidates for the question sentence, A variable is associated with each of the first and second variable parts of the template stored in the template storage means, and can be obtained in advance with each of the extension templates output by the template extension means. The matching means for outputting one or more candidates that can be exchanged with the second variable of the extension template by matching a large number of sentences prepared in the above, and the candidate output by the matching means Progress until a candidate is obtained, or a word included in an extended template that matches the candidate Based on the co-occurrence frequency with complement, it calculates a score indicating the eligibility of the answer to the question message, to function as scoring and selection means for outputting the candidate in the order of having a high the score.
以下の説明及び図面では、同一の部品には同一の参照番号を付してある。したがって、それらについての詳細な説明は繰返さない。 In the following description and drawings, the same parts are denoted by the same reference numerals. Therefore, detailed description thereof will not be repeated.
[構成]
図1を参照して、本発明の1実施の形態に係る質問応答装置30は、Webから収集した文からなるWebコーパス32に含まれる自然言語文を用い、幅広い分野に関する自然言語文の入力質問文20に対する適切な回答文34を精度よく生成するためのものである。なお、Webコーパス32に代えて、通常のコーパスを用いても何ら問題がないことについては当業者には明らかであろう。
[Constitution]
Referring to FIG. 1, a
質問応答装置30は、質問文に対する回答文のテンプレートを多数記憶するテンプレート集合記憶部46と、入力質問文20に対する回答文としてそのパターンがもっともマッチするテンプレートをテンプレート集合記憶部46に記憶されたテンプレートの中で推定し抽出するためのテンプレート推定部48とを含む。テンプレート推定部48により抽出されるテンプレートは、通常は複数個ある。これらの各々をシードテンプレートと呼び、それらをまとめてシードテンプレート集合と呼ぶ。テンプレート推定部48によるテンプレートの推定では、予め入力文と、それに対応するテンプレートとの間の関係を教師付機械学習により学習した推定装置を用いることができる。テンプレート推定部48は、入力質問文から得られる単語のうち、シードテンプレートに含まれる変数のうちのいずれかに入るものを特定し、それをシードテンプレートに対する制約条件としてシードテンプレートと共に出力する。したがって、シードテンプレートのうち、いずれかの変数にどのような値を入れるべきかは定まっている。
The
質問応答装置30はさらに、テンプレート推定部48の出力したシードテンプレート集合を記憶するためのシードテンプレート集合記憶部50と、シードテンプレートに含まれる単語の単語クラス、単語と単語との意味的関係等を記憶するためのシソーラス58と、シードテンプレート集合記憶部50内のシードテンプレートの各々を拡張してさらに多数のテンプレートを形成するために予め準備されたテンプレート拡張規則を記憶するためのテンプレート拡張規則記憶部54と、テンプレート拡張規則記憶部54に記憶されたテンプレート拡張規則、及びシソーラス58を用い、シードテンプレート集合記憶部50に記憶されたシードテンプレートの各々から、シードテンプレートと異なる形の拡張テンプレートを多数生成するためのテンプレート拡張処理部52と、テンプレート拡張処理部52により出力される拡張テンプレート集合を記憶するための拡張テンプレート集合記憶部56とを含む。
The
テンプレート集合記憶部46に記憶されたテンプレートは、質問に回答するための文パターンである。学習のために種々の文を収集し、それらから質問の形を作成しておき、それらをテンプレートとしてテンプレート集合記憶部46に用意しておく。
The template stored in the template
テンプレート推定部48は、入力質問文20を解析し、それに回答するテンプレートをテンプレート集合記憶部46中から抽出するためのものである。入力質問文20を構成する文字列との類似性に基づき、テンプレート集合記憶部46に記憶されたテンプレートの中からもっとも近いテンプレートを特定すること等により、テンプレート推定部48はシードテンプレートを抽出する。推定結果は複数個用いることが可能である。すなわち、シードテンプレート集合記憶部50には複数個のシードテンプレートが格納され得る。
The
図2にシードテンプレートの例を示す。図2の例では、入力質問文20が「ウルトラマンの敵は何?」というようなものであった場合を想定している。この質問文にマッチするテンプレートとしては、Xを変数として、「Yの敵はX」、「XがYの敵」等というテンプレートが得られる。なお、入力質問文20から、上記テンプレートを抽出するにあたり、「ウルトラマン」が変数Yに相当し、変数Xが入力質問文20に対する回答となり得る部分を示す。
FIG. 2 shows an example of a seed template. In the example of FIG. 2, it is assumed that the
テンプレートは、自然言語文から自動的に生成することも可能である。本実施の形態では、人間が手作業で準備するものとする。テンプレートは、本実施の形態ではいわゆる正規表現で記述するものとする。正規表現としては種々のものが知られているが、ここではそれらのいずれも用いるようにしてもよい。 Templates can also be automatically generated from natural language sentences. In this embodiment, it is assumed that a human prepares manually. In this embodiment, the template is described by a so-called regular expression. Various regular expressions are known, but any of them may be used here.
シソーラス58は、各単語について、その属性として単語クラスを対応付けたものである。
The
テンプレート拡張規則記憶部54に記憶されたテンプレート拡張規則は、シードテンプレート集合記憶部50に記憶されたシードテンプレートを拡張し、拡張テンプレートを生成するための規則である。テンプレート拡張規則も正規表現を用いて記述できる。本実施の形態では、各拡張規則は構文解析情報(典型的には構文解析木)を含み、構文解析木中に配置された単語または単語列(以下「単語等」と呼ぶ。)の集合を含む。これら単語等の集合は2つの変数を持つ。変数とは、べつの単語に入れ替えることが可能な箇所を表す。本実施の形態では、各変数にはいずれもその属性(単語クラス)がクラス制限として指定されている。テンプレート拡張規則は、単語の置換、文構造の修正等を含むものでもよい。単語の置換でも、たとえば同じ単語クラスの他の単語に置換する、その単語のより下位の概念の単語に置換する、その単語の類義語に置換する、等の種々の規則を用いることができる。
The template expansion rule stored in the template expansion
シードテンプレートにテンプレート拡張規則を適用する際には、シードテンプレートに含まれる単語のうち、質問文から得られ、テンプレートのうち変数に相当する部分に挿入された単語の単語クラスと、テンプレート拡張規則の変数部分に付された単語クラスとのマッチングが行なわれる。両者が一致した場合にそのテンプレート拡張規則がシードテンプレートに適用される。この結果得られる拡張テンプレートには2箇所の変数があり、それら変数にはその属性(単語クラス)がクラス制限として付されることになる。 When applying a template expansion rule to a seed template, out of the words included in the seed template, the word class of the word obtained from the question sentence and inserted in the portion corresponding to the variable in the template, and the template expansion rule Matching with the word class attached to the variable part is performed. If they match, the template expansion rule is applied to the seed template. The extension template obtained as a result has two variables, and the attribute (word class) is given as a class restriction to these variables.
図3を参照して、拡張テンプレート集合の内容の一例として、図2に示すシードテンプレートに拡張規則を適用することで、変数Y=「ウルトラマン」という制約のもと、「X<怪獣/妖怪>はY<ヒーロー>のライバル」、「X<怪獣/妖怪>がY<ヒーロー>の宿敵」、「Y<ヒーロー>の敵がX<怪獣/妖怪>だった」、等という拡張テンプレートが得られる。X,Yは変数を表す。拡張テンプレートも2つの変数を持ち、それぞれに単語クラスが付されている。ここで、「ウルトラマン」という、入力質問文に含まれる単語から、シソーラスを用いて<ヒーロー>という単語クラスが得られるものとする。 Referring to FIG. 3, as an example of the contents of the extended template set, by applying an extended rule to the seed template shown in FIG. 2, “X <Monster / Yokai>” under the constraint of variable Y = “Ultraman”. Y <hero> rival "," X <monster / youkai> is Y <hero> nemesis "," Y <hero> enemy was X <monster / youkai> ", etc. . X and Y represent variables. The extension template also has two variables, each with a word class. Here, it is assumed that a word class <hero> is obtained from a word “Ultraman” included in an input question sentence by using a thesaurus.
再び図1を参照して、質問応答装置30はさらに、拡張テンプレート集合記憶部56に記憶された拡張テンプレートの各々と、Webコーパス32に含まれる文とのマッチングを、シソーラス58から得られる単語クラスを用いて行ない、Webコーパス32から、拡張テンプレートのいずれかに合致する部分を持つ単語列(「マッチ単語列」と呼ぶ。)を抽出するマッチング部60と、マッチング部60によりWebコーパス32から抽出されたマッチ単語列からなるマッチ単語列集合を記憶するマッチ単語列集合記憶装置62と、マッチ単語列集合記憶装置62に記憶されたマッチ単語列から、質問に対する答えとなりそうな部分を収集するための回答候補収集部66と、回答候補収集部66の出力するマッチ単語列の各々に対し、テンプレート推定部48で適用されたテンプレート、テンプレート拡張処理部52でのテンプレートの拡張に使用されたテンプレート拡張規則及び単語クラス、回答に相当する部分の単語とその周囲に含まれる単語との共起頻度等に基づき、各マッチ単語列に対してスコアを付与し、スコアの高いマッチ単語列から順番に回答文34として出力するためのスコアリング・選択部68とを含む。
Referring again to FIG. 1, the
マッチング部60におけるマッチングでは、拡張テンプレートに含まれる構文解析木を使用し、構文解析木の中の部分木の各々と、Webコーパス32に含まれる文とのマッチングを行なう。例えばWebコーパス32からの文の構文解析木中のあるノードを省略した部分が拡張テンプレートの構文解析木と一致するのであれば、それ以外の条件(変数部分の単語クラスの一致、それ以外の単語列の一致)が満たされさえすればその一致する部分がマッチ単語列として抽出される。したがって、1次元的な単語列の配列を見るだけでは得られないような単語列(Webコーパス32には実際には含まれないような単語列)もマッチ単語列として抽出できる。
In the matching in the
図4を参照して、図1のテンプレート拡張処理部52をコンピュータにより実現するためのプログラムは、以下のような制御構造を有する。このプログラムは、全シードテンプレートの変数部分のうち、入力質問文により補充された部分の単語の単語クラスをシソーラス58を参照して割当てるステップ98と、テンプレート拡張規則記憶部54に記憶されたテンプレート拡張規則を全てコンピュータの主記憶装置に読込むステップ100と、ステップ100で読込まれた各規則に対し、以下に説明するステップ104を実行して拡張テンプレート集合に拡張テンプレートを追加するステップ102と、ステップ102の処理が完了した後、ステップ102の処理で得られた拡張テンプレート集合を出力して処理を終了するステップ106とを含む。
Referring to FIG. 4, a program for realizing the template
ステップ104は、シードテンプレート集合記憶部50に記憶された全てのシードテンプレートに対し変数の単語クラスのうち、入力質問文により補充されたものが拡張規則の変数のいずれかの単語クラスと一致するものがあるか否かを判定するステップ110を含む。ステップ110の判定が否定であればこの拡張規則に対する処理を終了し、次の拡張規則に処理を進める。
In
ステップ104はさらに、ステップ110の判定が肯定のときに、条件を充足するシードテンプレートに対し、以下のステップ114を実行するステップ112を含む。
Step 104 further includes a
ステップ112は、現在処理対象となっている拡張規則を対象のシードテンプレートに適用し、新たなテンプレート(拡張テンプレート)を生成するステップ120と、新たに作成された拡張テンプレートに、基となったシードテンプレートの重みと、適用された拡張規則の重みとの積を計算し、重みとして付すステップ122と、ステップ122で作成された拡張テンプレートを、ステップ122で計算された重みとともに、拡張テンプレート集合にマージするステップ124とを含む。なお、ステップ120で作成された拡張テンプレートが既に拡張テンプレート集合にマージされている場合、そのテンプレートは拡張テンプレート集合に追加されない。
In
図5を参照して、図1に示すマッチング部60を実現するためのプログラムは、Webコーパス32に記憶されている各文に対して以下のステップ132を実行するステップ130を含む。
Referring to FIG. 5, the program for realizing
ステップ130は、処理対象となっている文に対して形態素解析を行なうステップ140と、形態素解析処理により単語クラス、活用形等を示すタグが付された単語列(形態素列)を受け、当該単語列を構文解析し、構文解析木からなる単語列パターンを出力するステップ141と、拡張テンプレート集合記憶部56に記憶された各テンプレートについて、以下のステップ144を実行するステップ142とを含む。なお、ここでは対象言語を日本語としているため、ステップ140では形態素解析を行っている。対象言語が英語のように単語を空白で区切る言語の場合、ここでは形態素解析ではなく品詞解析等の解析処理を実行すればよい。形態素解析には、既存の形態素解析プログラムを使用すればよい。形態素解析プログラムとして、例えば、JUMAN (URL=http://nlp.kuee.Kyoto-u.ac.jp/nl-resource/juman.html)、またはChaSen(URL=http://chasen-legacy.sourceforge.jp/)を用いることができる。
Step 130 receives
ステップ144は、処理対象となっている単語列パターン中で、処理対象となっているテンプレートに木構造を含めてマッチする箇所があるか否かを判定するステップ150と、ステップ150の判定が肯定のときに、そのマッチする箇所の各々に対して以下のステップ154の処理を実行するステップ152とを含む。
In
ステップ154は、、マッチした箇所のうち処理対象となっているものの変数部分(変数X等)に、処理対象となっているテンプレートの重みを付すステップ160と、得られたテンプレートに出現する単語等の共起頻度に基づく重みを、このテンプレートの重みにさらに乗じてテンプレートに付して出力し、処理を次のマッチ箇所に移動させるステップ162とを含む。ステップ150の判定が否定のときには何もされず、処理は次のテンプレートに移動する。
Step 154 includes a
既に述べたように、ステップ150の判定では対象となる文の構文解析木の全部分木と、テンプレートの構文解析木との比較を行ない、一致する場合にはそれをステップ152以下の処理の対象とする。例えば、入力される文の構文解析木のうち、一部のノードを省略したものと、拡張テンプレートの構文解析木とが一致する場合、それ以外の条件が満たされて入れば、その一致した部分のみがマッチ箇所として抽出される。したがって、Webコーパス32には実際には存在しない単語列もマッチ文字列として抽出できる。
As described above, in the determination in
[動作]
図1〜図5に示した質問応答装置30は以下のように動作する。予め、Webから多数の文を収集し、Webコーパス32に記憶させておく。テンプレート集合記憶部46には、予め手作業又は自動処理により、回答文のテンプレートを準備しておく。シソーラス58も予め準備する。テンプレート拡張規則記憶部54には、テンプレート拡張規則を予め手作業又は自動処理により準備しておく。これらはいずれも機械可読な形でハードディスク等に記憶される。
[Operation]
The
入力質問文20が質問応答装置30に与えられると、テンプレート推定部48がテンプレート集合記憶部46に記憶されたテンプレートの中から入力質問文20の回答文として最もふさわしいものを1又は複数個抽出し、シードテンプレートとしてシードテンプレート集合記憶部50に出力する(図2を参照)。この抽出には、機械学習結果に基づく判別器が使用される。
When the
シードテンプレートがシードテンプレート集合記憶部50に記憶されると、テンプレート拡張処理部52が動作し、シードテンプレート集合記憶部50に記憶されたシードテンプレートの各々に、テンプレート拡張規則記憶部54に記憶されたテンプレート拡張規則を適用することにより、シードテンプレートを拡張する。この拡張により多数の拡張テンプレートが生成され拡張テンプレート集合記憶部56に記憶される。
When the seed template is stored in the seed template set
拡張テンプレート集合記憶部56に格納された拡張テンプレートはマッチング部60に読み出され、図示しない主記憶部に記憶される。マッチング部60は、Webコーパス32に記憶された多数の文を順次読出し、各々について形態素解析及び構文解析を行なう(図5のステップ140及び141)。さらにマッチング部60は、形態素解析及び構文解析により得られた単語列(単語クラス、意味クラス等のタグが付された形態素列)が付された構文解析木について、主記憶部に記憶された拡張テンプレートにマッチする部分を持つか否かを判定する(ステップ150)。拡張テンプレートのいずれかとマッチする部分がある場合(ステップ150の判定が肯定)、マッチング部60はその構造により表される単語列のうち、回答に相当する部分(変数X)を、マッチしたテンプレートに付された重みとともにマッチ単語列集合記憶装置に出力する(ステップ152)。マッチ単語列集合記憶装置62は、これらの単語列を、単語に付されたタグ及び重みとともに記憶する。マッチング部60は、Webコーパス32に記憶された全ての文についてこれを繰返す。
The extension template stored in the extension template set
回答候補収集部66は、マッチ単語列集合記憶装置62に記憶されたマッチ単語列の各々について、その回答を得るために使用されたテンプレート、拡張規則、単語クラス等の情報と、その単語と、その周囲の単語との共起頻度とに基づいて、各回答候補にスコアを付与し、スコアリング・選択部68に与える。
For each of the match word strings stored in the match word string set
スコアリング・選択部68は、回答候補収集部66からの回答候補をそのスコアの昇順に並べて保持する。スコアリング・選択部68は、回答候補収集部66からの回答候補の出力がすべて終了すると、スコアの上位のものから順番に所定個数を回答文34として出力する。
The scoring / selection unit 68 holds the answer candidates from the answer
このようにして回答文34が作成される。回答文34は、最初に準備したテンプレートから選択されたシードテンプレートと、シードテンプレートから拡張した拡張テンプレートとに適合した文から生成された多数の回答候補の中から選択される。シードテンプレートは、入力質問文20に対する回答文として最も可能性の高いものである。拡張テンプレートは、そのシードテンプレートに含まれる単語の類義語への置換、シードテンプレートの表現の言い換え等からなる。したがって、回答文34は、入力質問文20に対する多数の回答候補の中から選択されたものとなる。しかもシードテンプレートは、テンプレート拡張規則により拡張されるため、拡張テンプレート集合記憶部56には非常に多数のテンプレートが記憶される。しかもこのテンプレートには正規表現が用いられるため、テンプレートとWebコーパス32に含まれる文とのマッチングにより非常に多くの回答候補がWebコーパス32から抽出される。さらにこのマッチングでは、構文解析木の部分木まで含めてマッチング箇所が検索される。したがって、ここでは「抽出」という語を用いているが、Webコーパス32には含まれない表現もマッチング部60の処理により抽出(生成)されることになる。
In this way, the
Webコーパス32は、入手可能なコーパスとしては、最も多数の表現を含むと考えられる。しかし、Webコーパス32に含まれる表現は、人間により作成されたものであり、そのためにその数にはどうしても限りがある。それに対し、本実施の形態では、テンプレートを拡張して様々な拡張テンプレートでWebコーパス32とマッチングを行なうことにより、マッチ単語列として、人手で作成されたものよりもはるかに幅広い表現が格納されることになる。したがって、それら表現の中からスコアリング・選択部68により選択された回答文34は、入力質問文20に対する回答としてふさわしいものとなる確率が高くなる。その結果、種々の入力質問文20に対して、精度よく、回答文を自動的に生成し出力できる。ただし、既に述べたとおり、Webコーパス32に代えて別のコーパスを使用してもよいことはもちろんである。
The Web corpus 32 is considered to contain the largest number of expressions as an available corpus. However, the expressions included in the Web corpus 32 are created by humans, and therefore the number is inevitably limited. On the other hand, in this embodiment, by expanding the template and performing matching with the Web corpus 32 using various extended templates, a much broader expression than that created manually is stored as the match word string. It will be. Accordingly, the
上記実施の形態では、シードテンプレートの変数には、単語タグ等、単語の属性を示すものは付されていない。しかし本発明はそのような実施の形態に限定されず、変数に単語タグが付されたものをシードテンプレートして用いても良い。また、シードテンプレートの変数の数は2個であったが、シードテンプレートに3個以上の変数を含むようにしてもよい。 In the above-described embodiment, the variables of the seed template are not attached with those indicating word attributes such as word tags. However, the present invention is not limited to such an embodiment, and a variable with a word tag attached may be used as a seed template. Further, although the number of variables in the seed template is two, the seed template may include three or more variables.
なお、上記した実施の形態では、テンプレート拡張処理部52によるテンプレートの拡張はシードテンプレートに対するもののみであった。しかし本発明はそのようなものには限定されない。シードテンプレートに対してテンプレート拡張規則を適用して得られた拡張テンプレートに、さらにテンプレート拡張規則を適用することでさらにテンプレート数を増加させるようにしてもよい。この場合、所定の繰返し回数だけテンプレート拡張の処理を行なっても良いし、新たな拡張テンプレートが出現しなくなるまで、テンプレート拡張の処理を再帰的に繰返し実行するようにしてもよい。
In the above-described embodiment, the template expansion by the template
上記実施の形態では、シードテンプレートに予め種々の重みを付与している。しかし本発明はそのような実施の形態には限定されない。シードテンプレートに付与している重みを一定とし、どのテンプレート拡張規則が用いられたかのみにより、テンプレートの重みを決定するようにしてもよい。または、Webコーパス32に含まれる単語列について、適用可能なテンプレートが複数個ある場合には、その個数に応じて大きくなる重みを与えるようにしてもよい。テンプレート拡張規則をシードテンプレートだけでなく拡張テンプレートにも適用してテンプレートを作成するようにした場合には、テンプレート拡張規則を適用するごとに、テンプレートの重みが軽くなるようにすることが望ましい。 In the above embodiment, various weights are given to the seed template in advance. However, the present invention is not limited to such an embodiment. The weight assigned to the seed template may be constant, and the template weight may be determined only by which template expansion rule is used. Alternatively, when there are a plurality of applicable templates for the word string included in the web corpus 32, a weight that increases according to the number of templates may be given. When a template is created by applying the template expansion rule not only to the seed template but also to the expansion template, it is desirable that the weight of the template is reduced each time the template expansion rule is applied.
上記実施の形態では、各規則はいずれも正規表現を用いて記述されている。しかし本発明はそのような実施の形態には限定されない。目的に応じて規則を的確に記述できるものであれば、どのような記述方式に従うものであってもよい。 In the above embodiment, each rule is described using regular expressions. However, the present invention is not limited to such an embodiment. As long as the rules can be accurately described according to the purpose, any description method may be used.
上記実施の形態では、Webコーパス32としてWebから収集した文を用いている。現在のところ、Web上には非常に多数の文があるため、Webコーパス32はWebそのものを用いることが望ましい。しかし、もちろん、Web以外のコーパスをWebコーパス32として用いることもできる。 In the above embodiment, sentences collected from the Web are used as the Web corpus 32. At present, since there are a large number of sentences on the Web, it is desirable to use the Web itself as the Web corpus 32. However, of course, a corpus other than the web can be used as the web corpus 32.
[動作例]
この実施の形態による具体的な動作例について説明する。質問応答装置30は、さまざまな質問にWWWで答えることができる質問応答システムのサーバ側の装置である。この例では、非特許文献1に記載された類似関係パターンの抽出手法を数億のWWWページに適用し、予め多数の関係パターンを抽出する。同様にして、テンプレート推定部48においてシードテンプレートを抽出するためのデータも予め準備する。
[Operation example]
A specific operation example according to this embodiment will be described. The
具体的な例として、入力質問文20が「ウルトラマンの敵は誰」というものである場合を想定する。この入力に対して、テンプレート推定部48が、テンプレート集合記憶部46から「XはYの敵」及び「XがYの敵」(Y=ウルトラマン)というテンプレートを推定したものとする。テンプレート推定部48は、この2つのテンプレートをシードテンプレートとしてシードテンプレート集合記憶部50に記憶させる。
As a specific example, it is assumed that the
テンプレート拡張処理部52は、シードテンプレート集合記憶部50に記憶されたこの2つのシードテンプレートを拡張する。その結果、「XはYのライバル」、「XがYの宿敵」、「Yの敵がXだった」等のテンプレートが得られる。さらに、(Y=ウルトラマン)という制約に基づき、Yに<ヒーロー>という単語クラスを割当てて、この単語クラスに一致する変数を持つ拡張規則を適用して拡張テンプレートを作成する。このようにして得られた拡張テンプレートが拡張テンプレート集合記憶部56に記憶される。
The template
マッチング部60は、Webコーパス32内の多数の文と、拡張テンプレート集合記憶部56に記憶された拡張テンプレートとの間で、構造解析木の部分木まで考慮してマッチングし、変数Xに相当する表現を求める。これらが回答候補である。すなわち、回答候補の集合=「ピグモン、ジャミラ、バルタン星人、ゼットン…」となる。この回答候補の集合の中から、もととなったテンプレート、拡張テンプレート、元の単語と置換された単語との関係、回答候補の単語とテンプレート中のその単語以外の単語との共起関係等に基づいてスコアリング・選択部68が各候補にスコアを付与し、スコアの高い所定個数、たとえば「ピグモン」及び「バルタン星人」を回答文34として出力する。
The matching
回答文34は、図示しない音声合成装置により音声として出力されてもよい。
The
[コンピュータによる実現]
この実施の形態に係る質問応答装置30は、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現できる。
[Realization by computer]
The
図6を参照して、質問応答装置30を含む質問応答システムは、上記した質問応答装置30として機能するコンピュータシステム330と、コンピュータシステム330に質問文(図1に示す入力質問文20)を音声信号として送信し、コンピュータシステム330からその回答文(図1に示す回答文34)を音声信号により受信する携帯電話300とを含む。本実施の形態では、携帯電話300とコンピュータシステム330との間の通信のうち、質問文と回答文との送信は音声で行なわれる。したがって携帯電話300は通常のキャリアとの間で音声通信が可能なものであればよい。一方、コンピュータシステム330は、電話からの音声信号を受信する機能と、その音声信号を音声認識によりテキスト列に変換し、入力質問文20としてテンプレート推定部48に与える機能と、スコアリング・選択部68の出力する回答文34を音声合成により音声信号に変換し、電話により携帯電話300に返信する機能を持つ必要がある。これらはいずれも既存の機能であるため、ここにはその詳細は説明しない。もちろん、携帯電話300がデータ通信の機能を持っていれば、コンピュータシステム330からの回答文をテキスト形式で携帯電話300に送信したり、回答と、その回答に関係したURLとから合成したHTML(HyperText Markup Language)文書を携帯電話300に返信し、携帯電話300でブラウザを起動させたりしてもよい。
Referring to FIG. 6, the question answering system including
図6を参照して、このコンピュータシステム330は、FD(フレキシブルディスク)ドライブ352およびCD−ROM(コンパクトディスク読出専用メモリ)ドライブ350を有するコンピュータ340と、キーボード346と、マウス348と、モニタ342とを含む。
Referring to FIG. 6, the
図7を参照して、コンピュータ340は、FDドライブ352およびCD−ROMドライブ350に加えて、CPU(中央処理装置)356と、CPU356、FDドライブ352およびCD−ROMドライブ350に接続されたバス366と、ブートアッププログラム等を記憶する読出専用メモリ(ROM)358と、バス366に接続され、プログラム命令、システムプログラム、および作業データ等を記憶するランダムアクセスメモリ(RAM)360とを含む。コンピュータシステム330はさらに、インターネットへの接続を提供するネットワークインターフェイス(I/F)344を含む。図示しないが、コンピュータ340はネットワークI/F344を介して携帯電話ネットワークと接続されており、携帯電話300とデータ通信を行なうことができる。
Referring to FIG. 7, in addition to FD drive 352 and CD-
コンピュータシステム330に質問応答装置30としての動作を行なわせるためのコンピュータプログラムは、CD−ROMドライブ350またはFDドライブ352に挿入されるCD−ROM362またはFD364に記憶され、さらにハードディスク354に転送される。または、プログラムは図示しないネットワークを通じてコンピュータ340に送信されハードディスク354に記憶されてもよい。プログラムは実行の際にRAM360にロードされる。CD−ROM362から、FD364から、またはネットワークを介して、直接にRAM360にプログラムをロードしてもよい。
A computer program for causing the
このプログラムは、コンピュータ340にこの実施の形態の質問応答装置30として動作を行なわせる複数の命令を含む。この動作を行なわせるのに必要な基本的機能のいくつかはコンピュータ340上で動作するオペレーティングシステム(OS)もしくはサードパーティのプログラム、またはコンピュータ340にインストールされる各種ツールキットのモジュールにより提供される。従って、このプログラムはこの実施の形態のシステムおよび方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られるように制御されたやり方で適切な機能または「ツール」(プログラムライブラリ)を呼出すことにより、上記した質問応答装置30としての動作を実行する命令のみを含んでいればよい。
This program includes a plurality of instructions for causing the
なお、図1に示すWebコーパス32、テンプレート集合記憶部46、シードテンプレート集合記憶部50、テンプレート拡張規則記憶部54、拡張テンプレート集合記憶部56、マッチ単語列集合記憶装置62等は、いずれも図7に示すハードディスク354またはRAM360により実現される。特に、例えばWebコーパス32、テンプレート拡張規則記憶部54等は通常はハードディスク354に記憶されており、プログラムの実行時、必要に応じてRAM360にロードされる。シードテンプレート集合記憶部50、拡張テンプレート集合記憶部56、マッチ単語列集合記憶装置62等はワークファイル的な性格を持つ。したがって、これらは生成時にはRAM360に生成され、保存の必要があればハードディスク354に保存される。
The web corpus 32, template set
コンピュータシステム330の動作は周知であるので、ここでは繰返さない。
The operation of
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内での全ての変更を含む。 The embodiment disclosed herein is merely an example, and the present invention is not limited to the above-described embodiment. The scope of the present invention is indicated by each claim of the claims after taking into account the description of the detailed description of the invention, and all modifications within the meaning and scope equivalent to the wording described therein are included. Including.
20 入力質問文
30 質問応答装置
32 Webコーパス
34 回答文
46 テンプレート集合記憶部
48 テンプレート推定部
50 シードテンプレート集合記憶部
52 テンプレート拡張処理部
54 テンプレート拡張規則記憶部
56 拡張テンプレート集合記憶部
60 マッチング部
62 マッチ単語列集合記憶装置
66 回答候補収集部
68 スコアリング・選択部
DESCRIPTION OF
Claims (6)
質問文の入力を受けたことに応答し、前記テンプレート記憶手段に記憶されたテンプレートのうち、当該質問文に対する回答文の原型となる1又は複数のテンプレートを推定し、質問文のうちで各テンプレートの前記第1の変数部分に相当する単語を示す制約条件と共に出力するためのテンプレート推定手段と、
前記テンプレート推定手段により出力されたテンプレートのうち、当該テンプレートの制約条件を構成する単語の単語クラスに基いて選択されたテンプレートに対し、予め準備されたテンプレート拡張規則を適用することにより、単語又は文の構造が修正された1又は複数の拡張テンプレートを生成するためのテンプレート拡張手段とを含み、
前記拡張テンプレートの各々は、前記質問文に対する回答候補の位置を示す第1及び第2の2つの変数を含み、当該2つの変数は、前記テンプレート記憶手段に記憶されたテンプレートの前記第1及び第2の2つの変数部分とそれぞれ関係付けられており、かつそれぞれには当該変数が満たすべき属性が指定されており、
前記テンプレート拡張手段は、前記制約条件を構成する単語の属性が前記第1の変数の属性と所定の関係を持つ拡張テンプレートを選択し、
前記テンプレート拡張手段により出力された拡張テンプレートの各々と、予め準備された複数の文とをマッチングすることにより、拡張テンプレートの前記第2の変数と交換可能な候補を1又は複数個出力するためのマッチング手段と、
前記マッチング手段により出力された候補に対し、当該候補が得られるまでの経過、または当該候補にマッチした拡張テンプレートに含まれる単語と当該候補との共起頻度に基づいて、前記質問文に対する回答としての適格性を示すスコアを算出し、当該スコアの高いものの順番に前記候補を出力するためのスコアリング及び選択手段とを含む、質問回答装置。 A template storage means for storing a template of an answer sentence for a question sentence, the template having first and second variable parts;
In response to receiving an input of a question sentence, one or a plurality of templates as a prototype of an answer sentence for the question sentence is estimated from the templates stored in the template storage unit, and each template in the question sentence is estimated. Template estimation means for outputting together with a constraint indicating a word corresponding to the first variable part of
By applying a template expansion rule prepared in advance to a template selected based on the word class of the words that constitute the constraint condition of the template among the templates output by the template estimation means, a word or sentence Template extension means for generating one or a plurality of extension templates whose structures are modified,
Each of the extension templates includes first and second variables indicating positions of answer candidates for the question sentence, and the two variables are the first and second variables of the template stored in the template storage unit. 2 is associated with each of the two variable parts, and each of them specifies an attribute to be satisfied by the variable,
The template extension means selects an extension template in which the attribute of the word constituting the constraint condition has a predetermined relationship with the attribute of the first variable,
For outputting one or more candidates that can be exchanged with the second variable of the extension template by matching each of the extension templates output by the template extension means and a plurality of sentences prepared in advance. Matching means;
As an answer to the question sentence, based on the process until the candidate is obtained or the co-occurrence frequency of the word included in the extended template that matches the candidate and the candidate for the candidate output by the matching means And a scoring and selection means for calculating a score indicating eligibility of the score and outputting the candidates in order of the highest score.
前記質問文を通信により音声信号で受信し、音声認識によりテキスト列に変換して前記テンプレート推定手段に入力するための質問文受信手段と、
前記スコアリング及び選択手段により出力される候補を音声合成により音声信号に変換して、前記質問文を送信してきた端末に返信するための音声合成手段とを含む、請求項1または請求項2に記載の質問回答装置。 further,
A question sentence receiving means for receiving the question sentence as a voice signal by communication, converting it into a text string by voice recognition and inputting it to the template estimation means;
The speech synthesis means for converting the candidate output by the scoring and selection means into a speech signal by speech synthesis and sending it back to the terminal that has transmitted the question sentence. The question answering device described.
質問文に対する回答文のテンプレートであって、第1及び第2の2つの変数部分をもつテンプレートを記憶するためのテンプレート記憶手段と、
質問文の入力を受けたことに応答し、前記テンプレート記憶手段に記憶されたテンプレートのうち、当該質問文に対する回答文の原型となる1又は複数のテンプレートを推定し、質問文のうちで各テンプレートの前記第1の変数部分に相当する単語を示す制約条件と共に出力するためのテンプレート推定手段と、
前記テンプレート推定手段により出力されたテンプレートの各々に対し、当該テンプレートの制約条件を構成する単語の単語クラス、及び予め準備されたテンプレート拡張規則を適用することにより、単語又は文の構造が修正された1又は複数の拡張テンプレートを生成するためのテンプレート拡張手段とを含み、
前記拡張テンプレートの各々は、前記質問文に対する回答候補の位置を示す第1及び第2の2つの変数を含み、当該2つの変数は、前記テンプレート記憶手段に記憶されたテンプレートの前記第1及び第2の2つの変数部分とそれぞれ関係付けられており、かつそれぞれには当該変数が満たすべき属性が指定されており、
前記テンプレート拡張手段により出力された拡張テンプレートの各々と、予め入手可能なように準備された多数の文とをマッチングすることにより、拡張テンプレートの前記第2の変数と交換可能な候補を1又は複数個出力するためのマッチング手段と、
前記マッチング手段により出力された候補に対し、当該候補が得られるまでの経過、または若しくは当該候補にマッチした拡張テンプレートに含まれる単語と当該候補との共起頻度に基づいて、前記質問文に対する回答としての適格性を示すスコアを算出し、当該スコアの高いものの順番に前記候補を出力するためのスコアリング及び選択手段として機能させる、コンピュータプログラム。 Computer
A template storage means for storing a template of an answer sentence for a question sentence, the template having first and second variable parts;
In response to receiving an input of a question sentence, one or a plurality of templates as a prototype of an answer sentence for the question sentence is estimated from the templates stored in the template storage unit, and each template in the question sentence is estimated. Template estimation means for outputting together with a constraint indicating a word corresponding to the first variable part of
The structure of the word or sentence is corrected by applying the word class of the word constituting the constraint condition of the template and the template expansion rule prepared in advance to each of the templates output by the template estimation means. Template extension means for generating one or more extension templates;
Each of the extension templates includes first and second variables indicating positions of answer candidates for the question sentence, and the two variables are the first and second variables of the template stored in the template storage unit. 2 is associated with each of the two variable parts, and each of them specifies an attribute to be satisfied by the variable,
One or a plurality of candidates that can be exchanged with the second variable of the extension template by matching each of the extension templates output by the template extension means with a number of sentences prepared to be available in advance. Matching means for outputting the number of pieces,
Answers to the question sentence based on the process until the candidate is obtained or the co-occurrence frequency of the word included in the extended template that matches the candidate and the candidate for the candidate output by the matching means A computer program that calculates a score indicating eligibility as a score and functions as scoring and selection means for outputting the candidates in order of the highest score.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010224872A JP5540335B2 (en) | 2010-10-04 | 2010-10-04 | Natural language sentence generation device and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010224872A JP5540335B2 (en) | 2010-10-04 | 2010-10-04 | Natural language sentence generation device and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012079161A JP2012079161A (en) | 2012-04-19 |
JP5540335B2 true JP5540335B2 (en) | 2014-07-02 |
Family
ID=46239310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010224872A Active JP5540335B2 (en) | 2010-10-04 | 2010-10-04 | Natural language sentence generation device and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5540335B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989084A (en) * | 2015-02-11 | 2016-10-05 | 阿里巴巴集团控股有限公司 | Question answering method and device |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5963328B2 (en) | 2014-10-30 | 2016-08-03 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Generating device, generating method, and program |
US20160285816A1 (en) * | 2015-03-25 | 2016-09-29 | Facebook, Inc. | Techniques for automated determination of form responses |
JP6544131B2 (en) * | 2015-08-14 | 2019-07-17 | 富士ゼロックス株式会社 | INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM |
CN107221215A (en) * | 2016-03-21 | 2017-09-29 | 上海鸣皋教育科技有限公司 | A kind of method for quickly generating dynamic exercise |
JP6630701B2 (en) * | 2017-04-13 | 2020-01-15 | 日本電信電話株式会社 | Answer candidate generation device, method, and program |
JP6709748B2 (en) * | 2017-04-13 | 2020-06-17 | 日本電信電話株式会社 | Clustering device, answer candidate generation device, method, and program |
AU2018261870B2 (en) * | 2017-05-05 | 2020-11-05 | Seetvun AMIR | Dynamic response prediction for improved bot task processing |
JP6986978B2 (en) * | 2018-01-16 | 2021-12-22 | ヤフー株式会社 | Information processing equipment, information processing methods, and information processing programs |
JP7041355B2 (en) * | 2018-10-18 | 2022-03-24 | 日本電信電話株式会社 | Technical name / service name generator and its method |
JP7163143B2 (en) * | 2018-11-13 | 2022-10-31 | 株式会社日立製作所 | Question and answer data generation device and question and answer data generation method |
CN110569342B (en) * | 2019-08-15 | 2023-04-07 | 创新先进技术有限公司 | Question matching method, device, equipment and computer readable storage medium |
JP7413703B2 (en) * | 2019-10-04 | 2024-01-16 | 富士通株式会社 | Output method and output program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4635585B2 (en) * | 2004-12-02 | 2011-02-23 | 富士ゼロックス株式会社 | Question answering system, question answering method, and question answering program |
JP2007207127A (en) * | 2006-02-04 | 2007-08-16 | Fuji Xerox Co Ltd | Question answering system, question answering processing method and question answering program |
JP2007219955A (en) * | 2006-02-17 | 2007-08-30 | Fuji Xerox Co Ltd | Question and answer system, question answering processing method and question answering program |
-
2010
- 2010-10-04 JP JP2010224872A patent/JP5540335B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989084A (en) * | 2015-02-11 | 2016-10-05 | 阿里巴巴集团控股有限公司 | Question answering method and device |
CN105989084B (en) * | 2015-02-11 | 2019-09-03 | 阿里巴巴集团控股有限公司 | A kind of method and apparatus of reply problem |
Also Published As
Publication number | Publication date |
---|---|
JP2012079161A (en) | 2012-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5540335B2 (en) | Natural language sentence generation device and computer program | |
CN107797991B (en) | Dependency syntax tree-based knowledge graph expansion method and system | |
Liu et al. | Unsupervised paraphrasing by simulated annealing | |
JP7346609B2 (en) | Systems and methods for performing semantic exploration using natural language understanding (NLU) frameworks | |
JP5807891B2 (en) | Language model learning apparatus and computer program | |
RU2610241C2 (en) | Method and system for text synthesis based on information extracted as rdf-graph using templates | |
Sintoris et al. | Extracting business process models using natural language processing (NLP) techniques | |
JP2018190188A (en) | Summary creating device, summary creating method and computer program | |
JP5370159B2 (en) | Information extraction apparatus and information extraction system | |
JP5403696B2 (en) | Language model generation apparatus, method and program thereof | |
JP4319860B2 (en) | Method and apparatus for developing a transfer dictionary for use in a transfer-based machine translation system | |
JP3921523B2 (en) | Text generation method and text generation apparatus | |
KR101933953B1 (en) | Software domain topics extraction system using PageRank and topic modeling | |
US20220414463A1 (en) | Automated troubleshooter | |
CN112287085B (en) | Semantic matching method, system, equipment and storage medium | |
KR20200084260A (en) | Electronic apparatus and controlling method thereof | |
JP7381052B2 (en) | Inquiry support device, inquiry support method, program and recording medium | |
US9390117B2 (en) | Method of transforming sets of input strings into at least one pattern expression that is string expressing sets of input strings, method of extracting transformation pattern as approximate pattern expression, and computer and computer program for the methods | |
JP6709812B2 (en) | Relationship estimation model learning device, method, and program | |
CN110245349A (en) | A kind of syntax dependency parsing method, apparatus and a kind of electronic equipment | |
CN114398138B (en) | Interface generation method, device, computer equipment and storage medium | |
Mangairkarasi et al. | Semantic based text summarization using universal networking language | |
JP6180340B2 (en) | Dialog sentence generating apparatus, dialog sentence generating method and program | |
JP5462819B2 (en) | Basic tree acquisition device, syntax analysis device, method, and program | |
Li et al. | Chinese frame identification using t-crf model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140408 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5540335 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |