JP5212204B2 - Response generating apparatus and program - Google Patents

Response generating apparatus and program Download PDF

Info

Publication number
JP5212204B2
JP5212204B2 JP2009068038A JP2009068038A JP5212204B2 JP 5212204 B2 JP5212204 B2 JP 5212204B2 JP 2009068038 A JP2009068038 A JP 2009068038A JP 2009068038 A JP2009068038 A JP 2009068038A JP 5212204 B2 JP5212204 B2 JP 5212204B2
Authority
JP
Japan
Prior art keywords
situation
word
response
extracted
clause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009068038A
Other languages
Japanese (ja)
Other versions
JP2010224608A (en
Inventor
和也 下岡
良子 堀田
貴克 吉村
宇唯 山口
生聖 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2009068038A priority Critical patent/JP5212204B2/en
Publication of JP2010224608A publication Critical patent/JP2010224608A/en
Application granted granted Critical
Publication of JP5212204B2 publication Critical patent/JP5212204B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、応答生成装置及びプログラムに係り、特に、ユーザと円滑な対話を行うための応答生成装置及びプログラムに関する。   The present invention relates to a response generation device and a program, and more particularly, to a response generation device and a program for performing a smooth dialogue with a user.

従来、ユーザ発話を解析して述語及び格要素を抽出し、抽出した述語または格要素を確認する応答文候補、省略された格要素を質問する応答文候補、述語が行われた理由、時、場所を質問する応答文候補、及び述語同士の関係を確認する応答文候補を生成し、生成された応答文候補からランダムに選択した応答文候補を音声出力する応答生成装置が提案されている(例えば、特許文献1参照)。   Conventionally, the user utterance is analyzed to extract the predicate and case element, the extracted predicate or the response sentence candidate to confirm the case element, the response sentence candidate to query the omitted case element, the reason why the predicate was performed, There has been proposed a response generation device that generates a response sentence candidate that asks a place and a response sentence candidate that confirms the relationship between predicates, and outputs a response sentence candidate that is randomly selected from the generated response sentence candidates. For example, see Patent Document 1).

また、形容詞、副詞、または名詞である単語を概念語として、修飾関係及びシソーラスに基づいて概念語の属性情報を定めた概念属性データベースを構築しておき、ユーザ発話を解析して概念語を抽出し、抽出された概念語と対応して登録されている属性情報を概念属性データベースから検索して、属性情報に対応した応答文を生成して出力する対話装置が提案されている(例えば、特許文献2参照)。   Also, a word that is an adjective, adverb, or noun is used as a concept word, and a concept attribute database that defines the attribute information of the concept word based on the modification relation and thesaurus is constructed, and the user utterance is analyzed to extract the concept word Then, an interactive device has been proposed in which attribute information registered corresponding to the extracted concept word is searched from the concept attribute database, and a response sentence corresponding to the attribute information is generated and output (for example, a patent) Reference 2).

特開2007−206888号公報JP 2007-206888 A 特開2009−3811号公報JP 2009-3811 A

しかしながら、上記特許文献1の応答生成装置、及び特許文献2の対話装置では、応答文の内容をユーザに尋ねることが適切か不適切かにかかわらず、抽出された単語の品詞や属性情報に対応して定められた応答文が生成される。そのため、例えば、「あの石はすごく大きいよ」というユーザ発話に対して、「どうして大きいの?」といった不自然な応答が生成されてしまう場合がある、という問題がある。   However, in the response generation device of Patent Literature 1 and the dialogue device of Patent Literature 2, it corresponds to the part of speech and attribute information of the extracted word regardless of whether it is appropriate or inappropriate to ask the user about the content of the response sentence. A response sentence determined as described above is generated. Therefore, for example, there is a problem that an unnatural response such as “Why is it big?” May be generated in response to a user utterance “That stone is very big”.

本発明は、上記の問題を解決するためになされたものであり、不適切な応答文の生成を防止して、自然な対話を行うことができる応答生成装置及びプログラムを提供することを目的とする。   The present invention has been made to solve the above-described problem, and an object of the present invention is to provide a response generation apparatus and program capable of preventing natural generation of an inappropriate response sentence and performing natural conversation. To do.

上記目的を達成するために、第1の発明に係る応答生成装置は、入力文の構造を解析した解析結果に基づいて、事態を表す単語を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、前記抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する感情質問応答生成手段とを含んで構成されている。   In order to achieve the above object, a response generation device according to a first aspect of the present invention includes a situation extraction unit that extracts a word representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence, and the situation A word that represents the situation extracted by the extraction means is determined whether it is registered in the emotion questionable judgment dictionary as an appropriate word or an inappropriate word for which an emotion is asked, and an appropriate word to ask an emotion If it is, a response sentence candidate prepared in advance for asking feelings for the word representing the extracted situation, or a response sentence in which the word representing the extracted situation is added to a response sentence format prepared in advance And an emotional question response generating means for generating candidates.

また、第2の発明に係る応答生成プログラムは、コンピュータを、入力文の構造を解析した解析結果に基づいて、事態を表す単語を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、前記抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する感情質問応答生成手段として機能させるためのプログラムである。   According to a second aspect of the present invention, there is provided a response generation program comprising: a situation extraction unit that extracts a word representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence; and the situation extraction unit. When the word representing the extracted situation is a word that is appropriate for asking for emotion after judging whether it is registered in the emotion questionable judgment dictionary as an appropriate word or an inappropriate word for asking for emotion Generates a response sentence candidate prepared in advance for asking feelings about the word representing the extracted situation, or a response sentence candidate in which the word representing the extracted situation is added to a prepared response sentence format It is a program for functioning as an emotional question response generating means.

第1の発明に係る応答生成装置、及び第2の発明に係る応答生成プログラムによれば、事態抽出手段が、入力文の構造を解析した解析結果に基づいて、事態を表す単語を入力文から抽出する。事態とは、人の行動や人が経験する事象及び出来事をいう。そして、感情質問応答生成手段が、事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに抽出された事態を表す単語を付加した応答文候補を生成する。   According to the response generation device according to the first aspect of the invention and the response generation program according to the second aspect of the invention, the situation extraction unit extracts a word representing the situation from the input sentence based on the analysis result obtained by analyzing the structure of the input sentence. Extract. A situation refers to a person's behavior or an event or event that a person experiences. Then, the emotion question response generating means determines whether or not the word representing the situation extracted by the situation extracting means is registered in the emotion questionable judgment dictionary as an appropriate word or an inappropriate word for asking an emotion. If it is an appropriate word to ask for emotion, a response sentence candidate prepared in advance for inquiring feelings for the word representing the extracted situation, or a situation extracted in a response sentence format prepared in advance A response sentence candidate to which a word representing is added is generated.

このように、抽出した事態を表す単語に基づいて、感情を尋ねることが適切か否かを判断した上で応答文候補を生成するため、不適切な応答文の生成を防止して、自然な対話を行うことができる。   In this way, since it is determined whether or not it is appropriate to ask the emotion based on the extracted word, the response sentence candidate is generated. Dialogue can be conducted.

また、第1の発明に係る応答生成装置、及び第2の発明に係る応答生成プログラムにおいて、前記感情質問可能判断辞書に、シソーラス内の感情に関する分類名が付されていない単語を、感情を尋ねることが適切な単語として登録するか、または、前記シソーラス内の感情に関する分類名が付されている単語を、感情を尋ねることが不適切な単語として登録することができる。このような感情質問可能判断辞書を用いることにより、感情を尋ねることが適切か不適切かを容易に判断することができる。   Further, in the response generation device according to the first invention and the response generation program according to the second invention, the emotion questionable judgment dictionary is asked for a word without a classification name related to emotion in the thesaurus. Can be registered as an appropriate word, or a word with a classification name related to emotion in the thesaurus can be registered as an inappropriate word for asking for emotion. By using such an emotion questionable determination dictionary, it is possible to easily determine whether it is appropriate or inappropriate to ask an emotion.

また、第3の発明に係る応答生成装置は、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する頻度質問応答生成手段とを含んで構成することができる。   Further, the response generation device according to the third invention is extracted by the situation extracting means for extracting a clause representing the situation from the input sentence based on the analysis result obtained by analyzing the structure of the input sentence, and the situation extracting means. If the section that describes the situation is registered in the frequency questionable decision dictionary as an appropriate section or an inappropriate section to ask about the frequency, and if it is an appropriate section to ask about the frequency, A frequency question for generating a response sentence candidate prepared in advance for asking the frequency of the clause representing the extracted situation or a response sentence candidate in which a clause representing the extracted situation is added to a prepared response sentence format Response generation means.

また、第4の発明に係る応答生成プログラムは、コンピュータを、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する頻度質問応答生成手段として機能させるためのプログラムである。   According to a fourth aspect of the present invention, there is provided a response generation program comprising: a situation extraction unit that extracts a clause representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence; and the situation extraction unit. When the section that indicates the extracted situation is a section that determines whether or not the frequency is asked in the frequency questionable dictionary as an appropriate section or an inappropriate section that asks the frequency, and asks the frequency Generates a response sentence candidate prepared in advance for inquiring the frequency of the clause representing the extracted situation, or a response sentence candidate obtained by adding the clause representing the extracted situation to a prepared response sentence format It is a program for functioning as a frequency question response generation means.

第3の発明に係る応答生成装置、及び第4の発明に係る応答生成プログラムによれば、事態抽出手段が、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出し、頻度質問応答生成手段が、事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに抽出された事態を表す節を付加した応答文候補を生成する。   According to the response generation device according to the third aspect of the invention and the response generation program according to the fourth aspect of the invention, the situation extraction means adds the clause representing the situation to the input sentence based on the analysis result obtained by analyzing the structure of the input sentence. Whether or not a clause representing the situation extracted by the situation question extracting means is registered in the frequency questionable judgment dictionary as an appropriate clause or an inappropriate clause to ask for the frequency. If it is an appropriate clause to determine the frequency and ask the frequency, it is extracted to a response sentence candidate prepared in advance or a response sentence format prepared in advance to ask the frequency for the section representing the extracted situation. A response sentence candidate with a clause indicating the situation is generated.

このように、抽出した事態を表す節に基づいて、頻度を尋ねることが適切か否かを判断した上で応答文候補を生成するため、不適切な応答文の生成を防止して、自然な対話を行うことができる。   In this way, since it is determined whether or not it is appropriate to ask the frequency based on the section representing the extracted situation, a response sentence candidate is generated. Dialogue can be conducted.

また、第3の発明に係る応答生成装置、及び第4の発明に係る応答生成プログラムにおいて、前記頻度質問可能判断辞書に、経験する頻度が高い事態、経験する頻度が低い事態、特定の時期にのみ起こりうる事態、必ず別の事態に付随し、単独では起こりえない事態、必ず所定の目的のために起こり、単独では完結しない事態、開始または終了を意味する事態、及び存在を意味する事態のいずれかに該当する事態を表す節を、頻度を尋ねることが不適切な節として登録するか、または、前記いずれかに該当する事態以外の事態を表す節を、頻度を尋ねることが適切な節として登録することができる。このような頻度質問不可能判断辞書を用いることにより、頻度を尋ねることが適切か不適切かを容易に判断することができる。   Further, in the response generation device according to the third invention and the response generation program according to the fourth invention, the frequency questionable determination dictionary has a high frequency of experience, a low frequency of experience, and a specific time. A situation that can only happen, that always accompanies another situation, that cannot occur alone, that always occurs for a given purpose and that cannot be completed alone, that means start or end, and a situation that means existence Either register a section that represents a situation that falls into any of the sections where it is inappropriate to ask about the frequency, or a section that represents a situation other than the situation that falls into any of the above sections that is appropriate to ask about the frequency. Can be registered as By using such a frequency question impossible determination dictionary, it is possible to easily determine whether it is appropriate or inappropriate to ask the frequency.

また、第5の発明に係る応答生成装置は、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する並列目的語質問応答生成手段とを含んで構成することができる。   Further, the response generation device according to the fifth invention is extracted by the situation extracting means for extracting a clause representing the situation from the input sentence based on the analysis result obtained by analyzing the structure of the input sentence, and the situation extracting means. It is appropriate to ask whether the clause that represents the situation is registered in the parallel object questionable decision dictionary as an appropriate clause or an inappropriate clause to ask for the parallel object, and ask the parallel object. In the case of a clause, the response sentence candidate prepared in advance for asking a parallel object for the clause representing the extracted situation, or the clause representing the situation extracted in a response sentence format prepared in advance. And a parallel object question answer generating means for generating a response sentence candidate to which is added.

また、第6の発明に係る応答生成プログラムは、コンピュータを、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する並列目的語質問応答生成手段として機能させるためのプログラムである。   According to a sixth aspect of the present invention, there is provided a response generation program comprising: a situation extraction unit that extracts a clause representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence; and the situation extraction unit. Judgment is made as to whether or not the clause representing the extracted situation is registered in the parallel object questionable decision dictionary as an appropriate or inappropriate clause to ask for the parallel object, and the parallel object is asked Is an appropriate clause, a response sentence candidate prepared in advance for asking a parallel object for the clause representing the extracted situation, or the situation extracted in a response sentence format prepared in advance Is a program for functioning as a parallel object question answer generation means for generating a response sentence candidate to which a clause representing is added.

第5の発明に係る応答生成装置、及び第6の発明に係る応答生成プログラムによれば、事態抽出手段が、入力文の構造を解析した解析結果に基づいて、事態を表す節を入力文から抽出し、並列目的語質問応答生成手段が、事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに抽出された事態を表す節を付加した応答文候補を生成する。   According to the response generation device according to the fifth aspect of the invention and the response generation program according to the sixth aspect of the invention, the situation extraction means extracts a clause representing the situation from the input sentence based on the analysis result obtained by analyzing the structure of the input sentence. The parallel object question answer generation means extracts the clause representing the situation extracted by the situation extraction means to the parallel object questionable dictionary as an appropriate clause or an inappropriate clause to ask for the parallel object. If it is an appropriate clause to determine whether or not it is registered and ask for parallel objects, prepared response sentence candidates for asking parallel objects for the clause representing the extracted situation Alternatively, a response sentence candidate is generated by adding a clause indicating the extracted situation to a response sentence format prepared in advance.

このように、抽出した事態を表す節に基づいて、並列する目的語を尋ねることが適切か否かを判断した上で応答文候補を生成するため、不適切な応答文の生成を防止して、自然な対話を行うことができる。   In this way, since it is determined whether or not it is appropriate to ask for parallel objects based on the clauses representing the extracted situations, the generation of response sentence candidates is prevented, thereby preventing the generation of inappropriate response sentences. Can have a natural dialogue.

また、第5の発明に係る応答生成装置、及び第6の発明に係る応答生成プログラムにおいて、前記並列目的語質問可能判断辞書に、複数の入力文から、複数の並列した名詞を目的語としている事態を表す節を抽出し、前記複数の並列した名詞の各々を目的語とする節に分割し、分割された節の各々の出現頻度が所定値以上の前記分割された節を、並列する目的語を尋ねることが適切な節として登録するか、または、出現頻度が所定値より小さい前記分割された節を、並列する目的語を尋ねることが不適切な節として登録することができる。このような並列目的語質問可能判断辞書を用いることにより、並列する目的語を尋ねることが適切か不適切かを容易に判断することができる。   Further, in the response generation device according to the fifth invention and the response generation program according to the sixth invention, the parallel object questionable determination dictionary uses a plurality of parallel nouns from a plurality of input sentences as objects. Extracting a clause representing a situation, dividing each of the plurality of parallel nouns into clauses having the target word, and paralleling the divided clauses each having a frequency of appearance of a predetermined value or more Asking a word can be registered as an appropriate clause, or the divided clauses whose appearance frequency is smaller than a predetermined value can be registered as an inappropriate clause for asking parallel objects. By using such a parallel object questionable determination dictionary, it is possible to easily determine whether it is appropriate or inappropriate to ask for parallel objects.

また、第1の発明に係る応答生成装置、第3の発明に係る応答生成装置、及び第5の発明に係る応答生成装置から選択した少なくとも2つの応答生成装置を組み合わせて構成することもできる。これにより、応答文候補のバリエーションが増え、柔軟に対話を行うことができる。   Moreover, it is also possible to configure a combination of at least two response generation devices selected from the response generation device according to the first invention, the response generation device according to the third invention, and the response generation device according to the fifth invention. Thereby, the variation of a response sentence candidate increases and it can communicate flexibly.

また、第1の発明に係る応答生成装置、第3の発明に係る応答生成装置、及び第5の発明に係る応答生成装置は、入力文の構造を解析した解析結果に基づいて、品詞が名詞の単語を前記入力文から抽出する名詞抽出手段と、前記名詞抽出手段で抽出された品詞が名詞の単語が、詳細を尋ねることが適切な単語または不適切な単語として名詞詳細質問可能判断辞書に登録されているか否かを判断し、詳細を尋ねることが適切な単語である場合には、前記抽出された品詞が名詞の単語に対する詳細を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する名詞詳細質問応答生成手段とを含んで構成することができる。   In addition, the response generation device according to the first invention, the response generation device according to the third invention, and the response generation device according to the fifth invention, the part of speech is a noun based on the analysis result obtained by analyzing the structure of the input sentence. A noun extraction means for extracting the word from the input sentence, and a noun detail questionable judgment dictionary as a word that is appropriate for asking for details or an inappropriate word for a word whose part of speech is extracted by the noun extraction means. If it is appropriate to determine whether it is registered and ask for details, the extracted part of speech is a response sentence candidate prepared in advance for asking details about a noun word, or prepared in advance. And a noun detail question answer generation unit for generating a response sentence candidate in which a word representing the extracted situation is added to the response sentence format.

さらに、入力文の構造を解析した解析結果に基づいて、形容表現の単語または節を前記入力文から抽出する形容表現抽出手段と、前記形容表現抽出手段で抽出された形容表現の単語または節が、理由を尋ねることが適切な単語もしくは節、または不適切な単語もしくは節として形容表現理由質問可能判断辞書に登録されているか否かを判断し、理由を尋ねることが適切な単語または節である場合には、前記抽出された形容表現の単語または節に対する理由を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された形容表現の単語または節を付加した応答文候補を生成する形容表現質問応答生成手段とを含んで構成することもできる。   Further, based on the analysis result obtained by analyzing the structure of the input sentence, an adjective expression extracting means for extracting a word or clause of the adjective expression from the input sentence, and a word or clause of the adjective expression extracted by the adjective expression extracting means , It is appropriate to ask the reason, or whether it is registered in the adjective reasoning questionable judgment dictionary as an inappropriate word or clause, and it is appropriate to ask the reason In the case, the previously prepared response sentence candidate for inquiring the reason for the extracted adjective expression word or clause, or the extracted adjective expression word or clause is added to the prepared response sentence format An adjective expression question answer generation means for generating a response sentence candidate can also be included.

また、前記名詞詳細質問可能判断辞書に、品詞が名詞の単語と疑問詞との組合せのウェブ上での出現頻度が所定値以上の前記品詞が名詞の単語を、詳細を尋ねることが適切な単語として登録するか、または、前記品詞が名詞の単語と疑問詞との組合せのウェブ上での出現頻度が所定値より小さい前記品詞が名詞の単語を、詳細を尋ねることが不適切な単語として登録することができる。   In addition, in the noun detail questionable determination dictionary, a word that is suitable for asking for details is a noun word that has a part of speech that is a noun and a questionable word and whose frequency of appearance on the web is a predetermined value or more. Or the part of speech is a noun word that has a frequency of appearance on the web of a combination of a noun word and a question word that is less than a predetermined value. can do.

また、前記形容表現理由質問可能判断辞書に、シソーラス内の人の感情及び感覚に関する分類名が付されている単語を、理由を尋ねることが適切な単語として登録するか、または、前記シソーラス内の人の感情及び感覚に関する分類名が付されていない単語を、理由を尋ねることが不適切な単語として登録することができる。   In addition, in the adjective expression reason question possible judgment dictionary, a word with a classification name related to a person's emotion and sense in the thesaurus is registered as an appropriate word to ask the reason, or in the thesaurus A word without a classification name relating to a person's emotion and sense can be registered as an inappropriate word for asking a reason.

以上説明したように、本発明の応答生成装置及びプログラムによれば、不適切な応答文の生成を防止して、自然な対話を行うことができる、という効果が得られる。   As described above, according to the response generation device and the program of the present invention, it is possible to prevent the generation of an inappropriate response sentence and to perform a natural conversation.

本実施の形態に係る応答生成装置の概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the response generation apparatus which concerns on this Embodiment. 事態性名詞辞書の一例を示すイメージ図である。It is an image figure which shows an example of a situation noun dictionary. 感情質問の質問文例の一例を示すイメージ図である。It is an image figure which shows an example of the example sentence of an emotional question. 頻度質問の応答文例及び応答文例フォーマットの一例を示すイメージ図である。It is an image figure which shows an example of the response sentence example of a frequency question, and a response sentence example format. 並列目的語質問の応答文例及び応答文例フォーマットの一例を示すイメージ図である。It is an image figure which shows an example of the response sentence example of a parallel object question, and a response sentence example format. 形容表現理由質問の応答文例及び応答文例フォーマットの一例を示すイメージ図である。It is an image figure which shows an example of the response sentence example of an adjective expression reason question, and a response sentence example format. 感情質問可能判断DBの生成処理を示すフローチャートである。It is a flowchart which shows the production | generation process of emotion questionable judgment DB. 形態素解析の結果の一例を示すイメージ図である。It is an image figure which shows an example of the result of a morphological analysis. シソーラスの内容を示すイメージ図である。It is an image figure which shows the content of a thesaurus. 感情を尋ねることができるか否かを判断するためのルールの一例を示す図である。It is a figure which shows an example of the rule for determining whether an emotion can be asked. シソーラスの内容を示す他のイメージ図である。It is another image figure which shows the content of a thesaurus. 感情質問可能判断DBの一例を示すイメージ図である。It is an image figure which shows an example of emotion questionable judgment DB. 頻度質問不可能判断DBの生成処理を示すフローチャートである。It is a flowchart which shows the production | generation process of frequency question impossible judgment DB. 形態素解析の結果の他の例を示すイメージ図である。It is an image figure which shows the other example of the result of a morphological analysis. 頻度を尋ねるのが不適切な事態の種類を示す表である。It is a table showing the types of situations where it is inappropriate to ask the frequency. 頻度質問不可能判断DBの一例を示すイメージ図である。It is an image figure which shows an example of frequency question impossible judgment DB. 並列目的語質問可能判断DBの生成処理を示すフローチャートである。It is a flowchart which shows the production | generation process of parallel object questionable judgment DB. 形態素解析の結果の他の例を示すイメージ図である。It is an image figure which shows the other example of the result of a morphological analysis. 並列目的語を判断する言語パターンの一例を示す図である。It is a figure which shows an example of the language pattern which judges a parallel object. 並列目的語の事態を表す節の出現頻度のカウント結果の一例である。It is an example of the count result of the appearance frequency of the clause showing the situation of a parallel object. 並列目的語質問可能判断DBの一例を示すイメージ図である。It is an image figure which shows an example of parallel object questionable judgment DB. 並列目的語質問可能判断DBの他の例を示すイメージ図である。It is an image figure which shows the other example of parallel object questionable judgment DB. 名詞詳細質問可能判断DBの生成処理を示すフローチャートである。It is a flowchart which shows the production | generation process of noun detailed question possibility judgment DB. 形態素解析の結果の他の例を示すイメージ図である。It is an image figure which shows the other example of the result of a morphological analysis. 疑問詞と名詞との共起パターンの一例を示す図である。It is a figure which shows an example of the co-occurrence pattern of a question word and a noun. 疑問詞と名詞との共起パターンの出現頻度のカウント結果の一例である。It is an example of the count result of the appearance frequency of the co-occurrence pattern of an interrogative word and a noun. 疑問詞と名詞との共起パターンの出現頻度のカウント結果の他の例である。It is another example of the count result of the appearance frequency of the co-occurrence pattern of an interrogative word and a noun. 名詞詳細質問可能判断DBの一例を示すイメージ図である。It is an image figure which shows an example of noun detailed question possibility judgment DB. 品詞が名詞の単語に対して詳細を尋ねるための疑問詞の一例を示す図である。It is a figure which shows an example of the question word for asking the detail with respect to the word whose part of speech is a noun. 形容表現理由質問可能判断DBの生成処理を示すフローチャートである。It is a flowchart which shows the production | generation process of a description expression reason question possibility judgment DB. 形態素解析の結果の他の例を示すイメージ図である。It is an image figure which shows the other example of the result of a morphological analysis. シソーラスの内容を示す他のイメージ図である。It is another image figure which shows the content of a thesaurus. 形容表現の理由を尋ねることができるか否かを判断するためのルールの一例を示す図である。It is a figure which shows an example of the rule for judging whether the reason of an adjective expression can be asked. シソーラスの内容を示す他のイメージ図である。It is another image figure which shows the content of a thesaurus. 形容表現理由質問可能判断DBの一例を示すイメージ図である。It is an image figure which shows an example of a description expression reason question possible judgment DB. 本実施の形態の応答生成装置における応答生成処理ルーチンを示すフローチャートである。It is a flowchart which shows the response production | generation process routine in the response production | generation apparatus of this Embodiment. 形態素解析の結果の他の例を示すイメージ図である。It is an image figure which shows the other example of the result of a morphological analysis.

以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、ユーザからの発話を入力として、所定の処理を実行して音声出力する応答生成装置に本発明を適用した場合について説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the present embodiment, a case will be described in which the present invention is applied to a response generation apparatus that executes a predetermined process and outputs a voice by using an utterance from a user as an input.

図1に示すように、本実施の形態に係る応答生成装置10は、ユーザ発話を集音して音声信号を生成するマイク12と、音声出力を行うスピーカ14と、マイク12及びスピーカ14に接続され、かつ、適切な応答文を生成する所定の処理を実行するコンピュータ16とを備えている。   As shown in FIG. 1, the response generation apparatus 10 according to the present embodiment is connected to a microphone 12 that collects user utterances to generate an audio signal, a speaker 14 that outputs audio, and the microphone 12 and the speaker 14. And a computer 16 for executing a predetermined process for generating an appropriate response sentence.

コンピュータ16は、応答生成装置10全体の制御を司るCPU、後述する応答生成プログラム等各種プログラムを記憶した記憶媒体としてのROM、ワークエリアとしてデータを一時格納するRAM、各種情報が記憶された記憶手段としてのHDD、I/O(入出力)ポート、及びこれらを接続するバスを含んで構成されている。I/Oポートには、マイク12及びスピーカ14が接続されている。   The computer 16 includes a CPU that controls the entire response generation apparatus 10, a ROM as a storage medium that stores various programs such as a response generation program to be described later, a RAM that temporarily stores data as a work area, and a storage unit that stores various information. As an HDD, an I / O (input / output) port, and a bus connecting them. A microphone 12 and a speaker 14 are connected to the I / O port.

また、このコンピュータ16を、ハードウエアとソフトウエアとに基づいて定まる機能実現手段毎に分割した機能ブロックで説明すると、図1に示すように、マイク12から入力された音声信号を音声認識して、一般的な形態素解析器を用いて音声認識されたユーザ発話を示す文字列情報に対して形態素解析を行う言語解析部20、言語解析部20による解析結果に基づいて、ユーザ発話に事態が含まれているか否かを判別する事態判別部22、ユーザ発話に事態が含まれている場合に、ユーザ発話から事態を表す単語を抽出する事態(単語)抽出部24、事態(単語)抽出部24で抽出された単語が感情質問可能判断データベース(DB)28に登録されている場合に感情を尋ねる質問を応答文候補として生成する感情質問応答生成部26、ユーザ発話に事態が含まれている場合に、ユーザ発話から事態を表す節を抽出する事態(節)抽出部30、事態(節)抽出部30で抽出された節が頻度質問不可能判断DB34に登録されていない場合に頻度を尋ねる質問を応答文候補として生成する頻度質問応答生成部32、事態(節)抽出部30で抽出された節が並列目的語質問可能判断DB38に登録されている場合に並列する目的語を尋ねる質問を応答文候補として生成する並列目的語質問応答生成部36、言語解析部20による解析結果に基づいて、ユーザ発話に品詞が名詞の単語が含まれているか否かを判別する名詞判別部40、ユーザ発話に品詞が名詞の単語が含まれている場合に、ユーザ発話から品詞が名詞の単語を抽出する名詞抽出部42、名詞抽出部42で抽出された品詞が名詞の単語が名詞詳細質問可能判断DB46に登録されている場合に詳細を尋ねる質問を応答文候補として生成する名詞詳細質問応答生成部44、言語解析部20による解析結果に基づいて、ユーザ発話に形容表現の単語または節が含まれているか否かを判別する形容表現判別部48、ユーザ発話に形容表現の単語または節が含まれている場合に、ユーザ発話から形容表現の単語または節を抽出する形容表現抽出部50、形容表現抽出部50で抽出された形容表現の単語または節が形容表現理由質問可能判断DB54に登録されている場合に理由を尋ねる質問を応答文候補として生成する形容表現理由質問応答生成部52、応答文候補が生成されなかった場合に、相槌の応答文を生成する相槌応答生成部56、及び生成された応答文候補から選択された1つの応答文候補、または相槌の応答文を音声信号に変換してスピーカ14から出力させる出力部58を含んだ構成で表すことができる。   In addition, when the computer 16 is described by functional blocks divided for each function realizing means determined based on hardware and software, the voice signal input from the microphone 12 is recognized as shown in FIG. A situation is included in the user utterance based on the analysis result of the language analysis unit 20 that performs morphological analysis on the character string information indicating the user utterance that has been voice-recognized using a general morphological analyzer. A situation determination unit 22 that determines whether or not a user utterance includes a situation (word) extraction unit 24 that extracts a word representing the situation from the user utterance, and a situation (word) extraction unit 24 The emotion question response generation unit 26 generates a question asking for an emotion as a response sentence candidate when the word extracted in (2) is registered in the emotion question possibility determination database (DB) 28. When a situation is included in the user utterance, the situation (section) extraction unit 30 that extracts a section representing the situation from the user utterance, and the section extracted by the situation (section) extraction unit 30 are stored in the frequency question impossible determination DB 34. When the question extracted by the frequency question response generation unit 32 and the situation (section) extraction unit 30 is registered in the parallel object question possibility determination DB 38 when the question that is not registered is generated as a response sentence candidate. Whether or not a word of noun is included in the user utterance based on the analysis result by the parallel object question answer generation unit 36 and the language analysis unit 20 that generate a question asking for a question that asks for the parallel object The noun discriminating unit 40 for discriminating the words, the noun extracting unit 42 for extracting the noun word from the user utterance when the user utterance includes the noun word, and the noun extracting unit 42 Based on the analysis result by the noun detail question response generation unit 44 and the language analysis unit 20 that generate a question asking for details when the word whose noun is a noun is registered in the noun detail question possibility determination DB 46. An adjective expression discriminating section 48 for discriminating whether or not an utterance includes a word or a clause of an adjective expression; when a user utterance includes a word or a clause of an adjective expression, the word or clause of the adjective expression from the user utterance When a word or clause of an adjective expression extracted by the adjective expression extracting unit 50 is registered in the adjective expression reason questionable possibility judgment DB 54, a question asking a reason is generated as a response sentence candidate. Adjective expression reason / question response generation unit 52, a response response generation unit 56 that generates a response message when a response message candidate is not generated, and a generated response message candidate Can be expressed by a configuration including an output unit 58 that converts one response sentence candidate selected from the above, or a response sentence of a conflict into an audio signal and outputs it from the speaker 14.

事態判別部22は、ユーザ発話に対する言語解析部20での解析結果に、事態を表す単語が含まれているか否かを判別する。事態とは、人の行動や人が経験する事象及び出来事であり、何らかの感情が対応付けられることが想定される。ここでは、解析結果に(i)「動詞」が含まれている場合、及び(ii)「事態性名詞+(”だ”または”です”)」が含まれている場合に「事態」が含まれていると判別する。「事態性名詞」とは、例えば「雨」や「運動会」といった出来事を示す名詞である。事態性名詞は、図2に示すような事態性名詞辞書を予め作成しておき、判別の際に、この事態性名詞辞書を参照して判別する。   The situation determination unit 22 determines whether or not a word representing the situation is included in the analysis result of the language analysis unit 20 for the user utterance. A situation is a person's behavior or an event or event that a person experiences, and it is assumed that some emotion is associated with the situation. Here, if the analysis result includes (i) "verb" and (ii) "situation noun + (" da "or" is ")" includes "situation" It is determined that “Situation noun” is a noun indicating an event such as “rain” or “athletic meet”. Situation nouns are determined in advance by creating a situation noun dictionary as shown in FIG. 2 and referring to this situation noun dictionary at the time of determination.

事態(名詞)抽出部24は、事態判別部22で事態が含まれていると判別されたユーザ発話の解析結果から事態を表す単語を抽出する。上記(i)の場合であれば「動詞」である単語が抽出され、上記(ii)であれば「事態性名詞」である単語が抽出される。   The situation (noun) extraction unit 24 extracts a word representing the situation from the analysis result of the user utterance determined that the situation is included by the situation determination unit 22. In the case of (i) above, a word that is a “verb” is extracted, and in the case of (ii) above, a word that is a “situation noun” is extracted.

感情質問応答生成部26は、事態(名詞)抽出部24で抽出された単語が後述する感情質問可能判断DB28に登録されているか否かを判断し、登録されている場合には、ユーザに感情を尋ねる質問文を応答文候補として生成する。応答文候補は、基本となる質問文、例えば、「どう思う?」や「どんな感じ?」といった文を予め作成しておき、ユーザ発話の解析結果に基づいて、この基本となる質問文から選択した1つの文の時制や表現(丁寧な表現か砕けた表現かなど)を修正して、応答文候補を生成する。また、図3に示すような質問文例を予め作成しておき、この中からランダムに選択するようにしてもよい。生成された応答文候補は、一旦所定の記憶領域に記憶される。   The emotion question response generation unit 26 determines whether or not the word extracted by the situation (noun) extraction unit 24 is registered in the emotion question possibility determination DB 28 to be described later. Is generated as a response sentence candidate. Response sentence candidates are selected as basic question sentences, for example, “What do you think?” And “How do you feel?” In advance, and selected from these basic question sentences based on the analysis results of user utterances. The response sentence candidate is generated by correcting the tense and expression (such as polite expression or broken expression) of one sentence. Also, a question sentence example as shown in FIG. 3 may be created in advance and selected randomly from this. The generated response sentence candidate is temporarily stored in a predetermined storage area.

事態(節)抽出部30は、事態判別部22で事態が含まれていると判別されたユーザ発話の解析結果から事態を表す節を抽出する。上記(i)の場合であれば該当する「動詞」を含む節が抽出され、上記(ii)であれば該当する「事態性名詞」を含む節が抽出される。   The situation (section) extraction unit 30 extracts a node representing the situation from the analysis result of the user utterance determined that the situation is included by the situation determination unit 22. In the case of (i) above, a clause including the corresponding “verb” is extracted, and in the case of (ii), a clause including the corresponding “situation noun” is extracted.

頻度質問応答生成部32は、事態(節)抽出部30で抽出された節が後述する頻度質問不可能判断DB34に登録されているか否かを判断し、登録されていない場合には、ユーザに頻度を尋ねる質問文を応答文候補として生成する。応答文候補は、例えば、図4に示すような応答文例及び応答文例フォーマットを予め用意しておき、この応答文例からランダムに選択したり、応答文例フォーマットを用いて生成したりする。応答文例フォーマットは、例えば、「よく〜するんですか?」のようなフォーマットとすることができ、「〜」の部分に、ユーザ発話の解析結果から抽出された事態を表す節を挿入して応答文候補を生成することができる。生成された応答文候補は、一旦所定の記憶領域に記憶される。   The frequency question response generation unit 32 determines whether or not the clause extracted by the situation (section) extraction unit 30 is registered in the frequency question impossibility determination DB 34 to be described later. A question sentence that asks the frequency is generated as a response sentence candidate. For example, a response sentence example and a response sentence example format as shown in FIG. 4 are prepared in advance, and the response sentence candidates are randomly selected from the response sentence examples or generated using the response sentence example format. The response sentence example format can be, for example, a format such as "Do you do well?", And insert a clause indicating the situation extracted from the analysis result of the user utterance in the "~" part. Sentence candidates can be generated. The generated response sentence candidate is temporarily stored in a predetermined storage area.

並列目的語質問応答生成部36は、事態(節)抽出部30で抽出された節が後述する並列目的語質問可能判断DB38に登録されているか否かを判断し、登録されている場合には、ユーザに並列する目的語を尋ねる質問文を応答文候補として生成する。応答文候補は、例えば、図5に示すような応答文例及び応答文例フォーマットを予め用意しておき、この応答文例からランダムに選択したり、応答文例フォーマットを用いて生成したりする。応答文例フォーマットは、例えば、「他に何を〜?」のようなフォーマットとすることができ、「〜」の部分に、ユーザ発話の解析結果から抽出された事態を表す節の「動詞」である単語を挿入して応答文候補を生成することができる。生成された応答文候補は、一旦所定の記憶領域に記憶される。   The parallel object question answer generation unit 36 determines whether or not the clause extracted by the situation (section) extraction unit 30 is registered in a parallel object questionable determination DB 38 to be described later. Then, a question sentence that asks the user for a parallel object is generated as a response sentence candidate. For example, a response sentence example and a response sentence example format as shown in FIG. 5 are prepared in advance, and the response sentence candidate is selected at random from the response sentence example or generated using the response sentence example format. The response sentence example format can be, for example, a format such as “What else?”, And a “verb” of a clause representing a situation extracted from the analysis result of the user utterance in the “˜” part. A response sentence candidate can be generated by inserting a certain word. The generated response sentence candidate is temporarily stored in a predetermined storage area.

名詞判別部40は、ユーザ発話に対する言語解析部20での解析結果に、品詞が名詞の単語が含まれているか否かを判別する。   The noun discriminating unit 40 discriminates whether or not the analysis result of the language analyzing unit 20 for the user utterance includes a noun word.

名詞抽出部42は、名詞判別部40で品詞が名詞の単語が含まれていると判別されたユーザ発話の解析結果から品詞が名詞の単語を抽出する。   The noun extraction unit 42 extracts a word whose part of speech is a noun from the analysis result of the user utterance which is determined that the noun determination unit 40 includes a word whose part of speech is a noun.

名詞詳細質問応答生成部44は、名詞抽出部42で抽出された単語が後述する名詞詳細質問可能判断DB46に登録されているか否かを判断し、登録されている場合には、ユーザに名詞である単語についての詳細を尋ねる質問文を応答文候補として生成する。なお、詳細は後述するが、名詞詳細質問可能判断DB46には、名詞の詳細を尋ねるために用いられる疑問詞(例えば、「どんな」「誰の」など)毎に単語が登録された構成となっている。応答文候補は、名詞詳細質問可能判断DB46に登録された単語に対応する疑問詞と抽出された品詞が名詞の単語とを組み合わせて、「どんな(抽出した品詞が名詞の単語)なの?」のように生成することができる。生成された応答文候補は、一旦所定の記憶領域に記憶される。   The noun detail question response generation unit 44 determines whether or not the word extracted by the noun extraction unit 42 is registered in a noun detail question possibility determination DB 46 to be described later. A question sentence that asks for details about a word is generated as a response sentence candidate. Although details will be described later, the noun detail question possible judgment DB 46 has a configuration in which a word is registered for each question word (for example, “what” or “who”) used for asking details of a noun. ing. The response sentence candidate is a combination of the interrogative word corresponding to the word registered in the noun detail questionable judgment DB 46 and the extracted part of speech combined with the noun word, and "What is the extracted part of speech?" Can be generated as follows. The generated response sentence candidate is temporarily stored in a predetermined storage area.

形容表現判別部48は、ユーザ発話に対する言語解析部20での解析結果に、形容表現の単語または節が含まれているか否かを判別する。「形容表現」とは、(i)品詞が「形容詞」の単語、及び(ii)「品詞が名詞の単語+(”だ”または”です”)」をいい、いずれかが含まれている場合に「形容表現」の単語または節が含まれていると判別する。   The adjective expression discriminating unit 48 discriminates whether or not the word or clause of the adjective expression is included in the analysis result of the language analysis unit 20 for the user utterance. “Adjective expression” means (i) a word whose part of speech is “adjective” and (ii) “a part of speech is a noun word + (” is ”or“ is ”)”. Is determined to contain the word or clause of “adjective expression”.

形容表現抽出部50は、形容表現判別部48で形容表現が含まれていると判別されたユーザ発話の解析結果から形容表現の単語または節を抽出する。上記(i)に該当する単語、または上記(ii)に該当する節が抽出される。   The adjective expression extraction unit 50 extracts words or clauses of the adjective expression from the analysis result of the user utterance determined that the adjective expression discriminating section 48 includes the adjective expression. A word corresponding to the above (i) or a clause corresponding to the above (ii) is extracted.

形容表現理由質問応答生成部52は、形容表現抽出部50で抽出された単語または節が後述する形容表現理由質問可能判断DB54に登録されているか否かを判断し、登録されている場合には、ユーザに形容表現に対する理由を尋ねる質問文を応答文候補として生成する。応答文候補は、例えば、図6に示すような応答文例及び応答文例フォーマットを予め用意しておき、この応答文例からランダムに選択したり、応答文例フォーマットを用いて生成したりする。応答文例フォーマットは、例えば、「どうして〜ですか?」のようなフォーマットとすることができ、「〜」の部分に、ユーザ発話の解析結果から抽出された形容表現の単語または節を挿入して応答文候補を生成することができる。生成された応答文候補は、一旦所定の記憶領域に記憶される。   The adjective expression reason question response generation unit 52 determines whether the word or clause extracted by the adjective expression extraction unit 50 is registered in the adjective expression reason question possibility determination DB 54 described later. Then, a question sentence that asks the user for the reason for the adjective expression is generated as a response sentence candidate. For example, a response sentence example and a response sentence example format as shown in FIG. 6 are prepared in advance, and the response sentence candidates are randomly selected from the response sentence examples or generated using the response sentence example format. The response sentence example format can be, for example, a format such as “Why?”, And a word or clause of an adjective expression extracted from the analysis result of the user utterance is inserted in the “˜” part. Response sentence candidates can be generated. The generated response sentence candidate is temporarily stored in a predetermined storage area.

次に、各種質問可能(不可能)判断DBの生成処理について説明する。   Next, various questionable (impossible) determination DB generation processing will be described.

まず、図7を参照して、感情質問可能判断DB28の生成処理について説明する。   First, the generation process of the emotion questionable determination DB 28 will be described with reference to FIG.

ステップ100で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「動物園に行った」という文が抽出されたものとする。次に、ステップ102で、上記ステップ100で抽出された1文に対して形態素解析を行う。ここでは、図8に示すように、「動物園(名詞)」「に(格助詞)」「行く(動詞)」「た(助動詞)」という解析結果が得られる。次に、ステップ104で、解析結果に事態が含まれているか否かを判断する。事態が含まれている場合には、ステップ106へ進み、事態が含まれていない場合には、ステップ114へ進む。ここでは「行く(動詞)」が含まれているため、事態が含まれていると判断されてステップ106へ進む。   In step 100, a sentence is extracted from a large corpus such as text on the web. Here, it is assumed that the sentence “I went to the zoo” has been extracted. Next, in step 102, morphological analysis is performed on one sentence extracted in step 100. Here, as shown in FIG. 8, the analysis results of “zoo (noun)” “ni (case particle)” “go (verb)” “ta (auxiliary verb)” are obtained. Next, in step 104, it is determined whether or not a situation is included in the analysis result. If the situation is included, the process proceeds to step 106, and if the situation is not included, the process proceeds to step 114. Since “go (verb)” is included here, it is determined that the situation is included, and the process proceeds to step 106.

ステップ106で、事態を表す単語を抽出する。ここでは、「行く(動詞)」が抽出される。次に、ステップ108で、抽出された単語について、感情質問可能判断DB28への登録の可否の判別を行ったか否かを判断する。未判別の場合には、ステップ110へ進み、判別済みの場合には、ステップ114へ進む。ここでは、まだ1文目であるので、未判別と判断されて、ステップ110へ進む。   In step 106, words representing the situation are extracted. Here, “go (verb)” is extracted. Next, in step 108, it is determined whether or not the extracted word has been determined to be registered in the emotion questionable determination DB 28. If not determined, the process proceeds to step 110, and if determined, the process proceeds to step 114. Here, since it is still the first sentence, it is determined that it has not been discriminated, and the routine proceeds to step 110.

ステップ110で、図9に示すような、複数の階層(ここでは5階層)の各々の単語間の意味的類似関係に応じて階層上に単語を分類し、かつ意味的類似関係に応じた分類名を各階層の各分類に付したシソーラス上の分類名を用いたルールに基づいて、上記ステップ106で抽出された単語が感情質問可能判断DB28への登録対象か否かを判断する。登録対象の場合には、ステップ112へ進み、登録対象ではない場合には、ステップ114へ進む。シソーラス上の分類名を用いたルールは、例えば、図10に示すように、シソーラス上の第4階層に感情に関する分類名が付されていない単語を登録するように定めることができる。ユーザ発話の解析結果から抽出された単語のシソーラス上の分類名に感情に関する分類名が付されている場合には、ユーザ発話の内容には既に感情が含まれていると想定されるため、このユーザ発話に対してさらに感情を尋ねる応答文を出力することは不適切であり、上記ルールに従って生成された感情質問可能判断DB28を用いれば、このような不適切な応答文の生成を防止することができる。ここでは、「行く(動詞)」のシソーラスの第4階層の分類名は「往復」であり、ルールに基づいて登録対象と判別されるため、ステップ112へ進む。   In step 110, as shown in FIG. 9, the words are classified on the hierarchy according to the semantic similarity between the words in the plurality of hierarchies (here, five hierarchies), and the classification according to the semantic similarity is performed. It is determined whether or not the word extracted in step 106 is a registration target in the emotion questionable determination DB 28 based on a rule using a classification name on the thesaurus with names assigned to each classification of each hierarchy. If it is a registration target, the process proceeds to step 112. If it is not a registration target, the process proceeds to step 114. For example, as shown in FIG. 10, a rule using a classification name on the thesaurus can be defined so as to register a word without a classification name related to emotion in the fourth layer on the thesaurus. If the classification name on the thesaurus of the word extracted from the analysis result of the user utterance has a classification name related to emotion, it is assumed that the content of the user utterance already contains emotion. It is inappropriate to output a response sentence that asks for emotion in response to the user's utterance, and the use of the emotion questionable determination DB 28 generated according to the above rules prevents the generation of such an inappropriate response sentence. Can do. Here, the class name of the fourth hierarchy of the “go (verb)” thesaurus is “round trip”, and since it is determined to be a registration target based on the rule, the process proceeds to step 112.

ステップ112で、上記ステップ110で登録対象と判断された単語を、感情を尋ねることが適切な単語として感情質問可能判断DB28に登録する。   In step 112, the words determined to be registered in step 110 are registered in the emotion questionable determination DB 28 as words suitable for asking for emotions.

次に、ステップ114で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ100へ戻り、次の一文について処理を行う。次に「遊園地に行って久々に楽しんだ」という文が抽出されたとすると、ステップ106で、「行く(動詞)」及び「楽しむ(動詞)」が抽出され、ステップ108で、「行く(動詞)」については判別済み、「楽しむ(動詞)」については未判別と判断される。ステップ110で、図11に示すように「楽しむ(動詞)」のシソーラス上の第4階層の分類名「快・喜び」をルールに基づいて判断すると、「楽しむ(動詞)」という動作に対して感情を尋ねることは適切ではないと判断できるため、「楽しむ(動詞)」は感情質問可能判断DB28へ登録されない。ステップ114で全ての文について上記の処理が終了したと判断された場合には、処理を終了する。図12に、本処理により生成された感情質問可能判断DB28を示す。   Next, in step 114, it is determined whether or not the above processing has been performed for all sentences on the corpus. If there is an unprocessed sentence, the process returns to step 100 to process the next one sentence. Next, assuming that the sentence “I went to the amusement park and enjoyed it for a long time” is extracted, “go (verb)” and “enjoy (verb)” are extracted in step 106, and “go (verb)” in step 108. ) ”Is determined, and“ Enjoy (Verb) ”is determined as not determined. In step 110, as shown in FIG. 11, when the classification name “Pleasure / Pleasure” in the fourth hierarchy on the “Enjoy (Verb)” thesaurus is determined based on the rule, the operation “Enjoy (Verb)” is performed. Since it can be determined that it is not appropriate to ask for emotion, “enjoy (verb)” is not registered in the emotion questionable determination DB 28. If it is determined in step 114 that the above processing has been completed for all sentences, the processing is terminated. FIG. 12 shows the emotion questionable determination DB 28 generated by this processing.

次に、図13を参照して、頻度質問不可能判断DB34の生成処理について説明する。   Next, the generation process of the frequency question impossibility determination DB 34 will be described with reference to FIG.

ステップ120で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「歯を磨いた」という文が抽出されたものとする。次に、ステップ122で、上記ステップ120で抽出された1文に対して形態素解析を行う。ここでは、図14に示すように、「歯(名詞)」「を(格助詞)」「磨く(動詞)」「た(助動詞)」という解析結果が得られる。次に、ステップ124で、解析結果に事態が含まれているか否かを判断する。事態が含まれている場合には、ステップ126へ進み、事態が含まれていない場合には、ステップ132へ進む。ここでは「磨く(動詞)」が含まれているため、事態が含まれていると判断されてステップ126へ進む。   In step 120, a sentence is extracted from a large corpus such as text on the web. Here, it is assumed that the sentence “I brushed my teeth” has been extracted. Next, in step 122, morphological analysis is performed on the one sentence extracted in step 120. Here, as shown in FIG. 14, analysis results of “tooth (noun)”, “wo (case particle)”, “brush (verb)”, and “ta (auxiliary verb)” are obtained. Next, in step 124, it is determined whether or not a situation is included in the analysis result. If the situation is included, the process proceeds to step 126. If the situation is not included, the process proceeds to step 132. In this case, since “brush (verb)” is included, it is determined that the situation is included, and the process proceeds to step 126.

ステップ126で、事態を表す節を抽出する。上記ステップ124で、(i)「動詞」が含まれていると判断された場合には、該当する動詞を述語とする節を抽出する。(ii)「事態性名詞+(”だ”または”です”)」が含まれていると判断された場合には、「事態性名詞+(”だ”または”です”)」を述語とする節を抽出する。ここでは、「歯を磨く」が抽出される。次に、ステップ128で、抽出された節は事態DBに登録済みか否かを判断する。事態DBは、後述する処理のために、大規模コーパスから抽出された大量の事態を表す節を一旦登録しておくためのデータベースである。未登録の場合には、ステップ130へ進み、抽出された節を事態DBへ登録してステップ132へ進む。一方、登録済みの場合には、そのままステップ132へ進む。   In step 126, a clause representing the situation is extracted. If it is determined in step 124 that (i) “verb” is included, a clause having the corresponding verb as a predicate is extracted. (Ii) If it is determined that “situation noun + (“ da ”or“ is ”)” is included, the predicate is “situation noun + (“ da ”or“ is ”)” Extract a clause. Here, “brush teeth” is extracted. Next, in step 128, it is determined whether or not the extracted clause has been registered in the situation DB. The situation DB is a database for temporarily registering clauses representing a large number of situations extracted from a large-scale corpus for processing to be described later. If not registered, the process proceeds to step 130, where the extracted clause is registered in the situation DB and the process proceeds to step 132. On the other hand, if registered, the process proceeds to step 132 as it is.

ステップ132で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ120へ戻り、次の一文について処理を行う。次に「遊園地に行った」という文が抽出されたとすると、ステップ126で、「遊園地に行く」が抽出され、ステップ130で事態DBに登録される。ステップ132で全ての文について上記の処理が終了したと判断された場合には、ステップ134へ進む。   In step 132, it is determined whether or not the above processing has been performed for all sentences on the corpus. If there is an unprocessed sentence, the process returns to step 120 to process the next sentence. Next, if the sentence “I went to the amusement park” is extracted, “Go to the amusement park” is extracted in step 126 and registered in the situation DB in step 130. If it is determined in step 132 that the above processing has been completed for all sentences, the process proceeds to step 134.

ステップ134で、事態DBに登録された事態の各々が、図15に示すような、頻度を尋ねることが不適切な事態に該当する場合には、頻度質問不可能判断DB34へ登録する。頻度を尋ねることが不適切な事態に該当するか否かの判断は、人手で行う。「歯を磨く」は、頻度を尋ねることが不適切な事態として挙げられている「1.誰もが普段当たり前のように経験する事態」に該当するため、頻度質問不可能判断DB34へ登録する。「遊園地へ行く」は、頻度を尋ねるのは不適切な事態として挙げられている事態のいずれにも該当しないため、頻度質問不可能判断DB34へ登録されない。すなわち、頻度質問不可能判断DB34は、頻度質問不可能判断DB34に登録された事態に対して頻度を尋ねることは不適切であるということを示している。事態DBに登録された事態の全てについて上記の処理を終了した場合には、本処理を終了する。図16に、本処理により生成された頻度質問不可能判断DB34を示す。   In step 134, when each of the situations registered in the situation DB corresponds to a situation where it is inappropriate to ask the frequency as shown in FIG. 15, it is registered in the frequency question impossible judgment DB 34. The determination of whether or not it is inappropriate to ask the frequency is done manually. “Brush your teeth” corresponds to “1. Everybody usually experiences as usual”, which is listed as an unsuitable situation to ask about the frequency. . “Going to the amusement park” does not correspond to any of the situations listed as inappropriate situations for asking the frequency, and is not registered in the frequency question impossible judgment DB 34. That is, the frequency question impossibility determination DB 34 indicates that it is inappropriate to ask the frequency for the situation registered in the frequency question impossibility determination DB 34. When the above process is completed for all the situations registered in the situation DB, this process is terminated. FIG. 16 shows the frequency question impossibility determination DB 34 generated by this processing.

次に、図17を参照して、並列目的語質問可能判断DB38の生成処理について説明する。   Next, the generation process of the parallel object questionable determination DB 38 will be described with reference to FIG.

ステップ140で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「お昼にパンとサラダを食べた」という文が抽出されたものとする。次に、ステップ142で、上記ステップ140で抽出された1文に対して形態素解析を行う。ここでは、図18に示すように、「お昼(名詞)」「に(格助詞)」「パン(名詞)」「と(並列助詞)」「サラダ(名詞)」「を(格助詞)」「食べる(動詞)」「た(助動詞)」という解析結果が得られる。   In step 140, a sentence is extracted from a large corpus such as text on the web. Here, it is assumed that the sentence “I ate bread and salad at noon” was extracted. Next, in step 142, morphological analysis is performed on the one sentence extracted in step 140. Here, as shown in FIG. 18, “noon (noun)” “ni (case particle)” “pan (noun)” “to (parallel particle)” “salad (noun)” “wo (case particle)” “ An analysis result of “eating (verb)” and “ta (auxiliary verb)” is obtained.

次に、ステップ146で、名詞の並列を目的語とする動詞が含まれているか否かを、図19に示す言語パターンに該当するか否かに基づいて判断する。含まれる場合には、ステップ148へ進み、含まれない場合には、ステップ152へ進む。ここでは、「パン(名詞)」「と(並列助詞)」「サラダ(名詞)」「を(格助詞)」「食べる(動詞)」が、「1.名詞 と 名詞 格助詞 動詞」のパターンと一致するため、名詞の並列を目的語とする動詞が含まれていると判断されて、ステップ148へ進む。   Next, in step 146, it is determined whether or not a verb whose object is parallel noun is included based on whether or not the language pattern shown in FIG. If it is included, the process proceeds to step 148. If it is not included, the process proceeds to step 152. Here, “Pan (noun)” “To (parallel particle)” “Salad (noun)” “O (case particle)” “Eat (verb)” is the pattern of “1. Noun and noun case particle verb” Since they match, it is determined that a verb whose object is parallel nouns is included, and the process proceeds to step 148.

ステップ148で、名詞の並列を目的語とする動詞が含まれている1文を、複数の並列した名詞の各々を目的語とする節に分割して、それぞれの節を事態を表す節として抽出する。ここでは、「パンを食べる」及び「サラダを食べる」が抽出される。   In step 148, a sentence containing a verb whose object is parallel nouns is divided into clauses each having a plurality of parallel nouns as objects, and each clause is extracted as a clause representing the situation. To do. Here, “eat bread” and “eat salad” are extracted.

次に、ステップ150で、抽出された事態を表す節を、事態を表す節、及びその節の出現頻度を計数したカウント値を定めた事態DBに登録する。既に登録されている節と同一の節の場合は、カウント値を+1する。   Next, in step 150, the node representing the extracted situation is registered in the situation DB in which the node representing the situation and the count value obtained by counting the appearance frequency of the clause are determined. In the case of the same clause as that already registered, the count value is incremented by one.

次に、ステップ152で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ140へ戻り、次の一文について処理を行う。次に「パンとかサンドイッチを食べた」という文が抽出されたとすると、ステップ146で、「2.名詞 とか 名詞 格助詞 動詞」のパターンと一致するため、名詞の並列を目的語とする動詞が含まれていると判断されて、ステップ148で、「パンを食べる」及び「サンドイッチを食べる」が抽出され、ステップ150で、事態DBにおいて、「パンを食べる」については、カウント値を+1し、「サンドイッチを食べる」については、新規に登録する。ステップ152で全ての文について上記の処理が終了したと判断された場合には、ステップ154へ進む。   Next, in step 152, it is determined whether or not the above processing has been performed for all the sentences on the corpus. If there is an unprocessed sentence, the process returns to step 140 and the next one sentence is processed. Next, if the sentence “I ate bread or sandwiches” is extracted, then in step 146, since it matches the pattern of “2. Noun or noun case particle verb”, a verb whose object is a parallel noun is included. In step 148, “eat bread” and “eat sandwich” are extracted. In step 150, in the situation DB, “eating bread” is incremented by one, and “ “Eating sandwiches” is newly registered. If it is determined in step 152 that the above processing has been completed for all sentences, the process proceeds to step 154.

ステップ154で、事態DBを参照して、出現頻度が閾値以上の事態を表す節を並列目的語質問可能判断DBに登録する。コーパスの全ての文を処理した後の事態DBの一例を図20に示す。ここで、閾値を「10」とすると、図20において、「パンを食べる」〜「マウスを買う」までが並列目的語質問可能判断DB38に登録される。事態DBでのカウント値(出現頻度)が高いということは、元々名詞の並列を目的語とした文として現れることが多く、省略された目的語が他にもあることが想定されるため、並列する目的語を尋ねる質問は適切である。カウント値が閾値以上の節を全て並列目的語質問可能判断DB38に登録したら、本処理を終了する。図21に、本処理により生成された並列目的語質問可能判断DB38を示す。   In step 154, with reference to the situation DB, a clause representing a situation whose appearance frequency is equal to or higher than the threshold is registered in the parallel object questionable judgment DB. An example of the situation DB after processing all the sentences in the corpus is shown in FIG. Here, if the threshold is “10”, in FIG. 20, “eating bread” to “buying a mouse” are registered in the parallel object questionable determination DB 38. A high count value (occurrence frequency) in the situation DB often appears as a sentence whose object is parallel nouns originally, and it is assumed that there are other omitted objects. The question asking for the object to do is appropriate. When all the clauses whose count value is greater than or equal to the threshold value are registered in the parallel object questionable determination DB 38, the present process is terminated. FIG. 21 shows the parallel object questionable determination DB 38 generated by this processing.

なお、事態DBに登録された節の「動詞」に着目し、ある「動詞」についてはどのような目的語をとった節であっても、その「動詞」を含む節の全てについて、カウント値が閾値を超えている場合には、事態を表す節ではなく「動詞」のみを並列目的語質問可能判断DB38に登録するようにしてもよい。例えば、図20の事態DBに基づいて、「食べる(動詞)」を含む節は、「パンを」、「サラダを」、及び「サンドイッチを」のいずれの目的語をとった場合でも、カウント値が閾値を超えている。また、「行く(動詞)」についても、「映画館に」、「喫茶店に」、及び「本屋に」のいずれの目的語をとった場合でも、カウント値が閾値を超えている。そこで、図22に示すように、並列目的語質問可能判断DB38には、事態を表す節の各々ではなく「食べる」「行く」の動詞のみを登録する。一方、「買う(動詞)」については、「キーボードを」及び「マウスを」を目的語とする場合にはカウント値が閾値を超えているが、「家を」及び「土地を」を目的語とする場合にはカウント値が閾値を超えていないため、カウント値が閾値を超えている「キーボードを買う」及び「マウスを買う」を、それぞれ事態を表す節の状態で登録する。   In addition, paying attention to the “verb” of the clause registered in the situation DB, the count value of all the clauses including the “verb” for any “verb” in any clause May exceed the threshold, only the “verb” may be registered in the parallel object questionable determination DB 38 instead of the clause representing the situation. For example, based on the situation DB of FIG. 20, the clause containing “eating (verb)” is counted regardless of the object of “bread”, “salad”, and “sandwich”. Exceeds the threshold. In addition, for “go (verb)”, the count value exceeds the threshold value when any of the objects “to the movie theater”, “to the coffee shop”, and “to the bookstore” is taken. Therefore, as shown in FIG. 22, only the verbs “eat” and “go” are registered in the parallel object questionable determination DB 38, not each of the clauses representing the situation. On the other hand, for “buy (verb)”, when “keyboard” and “mouse” are the objects, the count value exceeds the threshold, but “house” and “land” are the objects. In this case, since the count value does not exceed the threshold value, “buy the keyboard” and “buy the mouse” whose count value exceeds the threshold value are respectively registered in the state of the clause indicating the situation.

次に、図23を参照して、名詞詳細質問可能判断DB46の生成処理について説明する。ここでは、疑問詞「どんな」を用いた名詞の詳細を尋ねる質問が適切か否かを判断するためのデータベースの生成の場合を例に説明する。   Next, the generation process of the noun detail questionable determination DB 46 will be described with reference to FIG. Here, a case of generating a database for determining whether or not a question for asking details of a noun using the question word “what” is appropriate will be described.

ステップ160で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「車を買った」という文が抽出されたものとする。次に、ステップ162で、上記ステップ160で抽出された1文に対して形態素解析を行う。ここでは、図24に示すように、「車(名詞)」「を(格助詞)」「買う(動詞)」「た(助動詞)」という解析結果が得られる。次に、ステップ164で、解析結果に名詞が含まれているか否かを判断する。名詞が含まれている場合には、ステップ166へ進み、含まれていない場合には、ステップ176へ進む。ここでは「車(名詞)」が含まれているため、名詞が含まれていると判断されてステップ166へ進む。   In step 160, a sentence is extracted from a large corpus such as text on the web. Here, it is assumed that a sentence “I bought a car” has been extracted. Next, in step 162, morphological analysis is performed on one sentence extracted in step 160. Here, as shown in FIG. 24, the analysis results of “car (noun)”, “wo (case particle)”, “buy (verb)”, and “ta (auxiliary verb)” are obtained. Next, in step 164, it is determined whether or not a noun is included in the analysis result. When the noun is included, the process proceeds to step 166, and when it is not included, the process proceeds to step 176. Since “car (noun)” is included here, it is determined that a noun is included, and the process proceeds to step 166.

ステップ166で、品詞が名詞の単語を抽出する。ここでは、「車(名詞)」が抽出される。次に、ステップ168で、抽出された単語について、名詞詳細質問可能判断DB46への登録の可否の判別を行ったか否かを判断する。未判別の場合には、ステップ170へ進み、判別済みの場合には、ステップ176へ進む。ここでは、まだ1文目であるので、未判別と判断されて、ステップ170へ進む。   In step 166, a word whose part of speech is a noun is extracted. Here, “car (noun)” is extracted. Next, in step 168, it is determined whether or not the extracted word has been determined to be registered in the noun detail questionable determination DB 46. If not determined, the process proceeds to step 170. If determined, the process proceeds to step 176. Here, since it is still the first sentence, it is determined that it has not been discriminated, and the routine proceeds to step 170.

ステップ170で、図25に示すような、疑問詞と名詞との共起パターンに該当する抽出された単語と疑問詞との組合せのウェブ上で出現頻度をカウントする。ここでは、疑問詞「どんな」、及び抽出された単語「車(名詞)」について、例えば、ウェブ上に「どんな車を」が出現した場合には、共起パターン「1:疑問詞 名詞 格助詞(「より」以外)」に該当するため、カウントする。   In step 170, the frequency of appearance on the web of combinations of extracted words and interrogatives corresponding to co-occurrence patterns of interrogatives and nouns as shown in FIG. 25 is counted. Here, for the question word “what” and the extracted word “car (noun)”, for example, when “what car” appears on the web, the co-occurrence pattern “1: question word noun case particle” (Besides “more”) ”, so count.

次に、ステップ172で、抽出された単語と疑問詞との組合せのウェブ上での出現頻度が閾値以上か否かを判断する。閾値以上の場合には、ステップ174へ進み、閾値より小さい場合には、ステップ176へ進む。図26に、カウント結果の一例を示す。ここでは、閾値を「100」とすると、抽出された単語「車(名詞)」と疑問詞「どんな」との組合せの出現頻度の合計は閾値以上であるので、ステップ174へ進む。なお、図26では、共起パター毎に出現頻度をカウントしているが、合計の出現頻度がカウントできればよい。   Next, in step 172, it is determined whether or not the appearance frequency on the web of the combination of the extracted word and questionable word is equal to or higher than a threshold value. If it is equal to or greater than the threshold, the process proceeds to step 174, and if it is smaller than the threshold, the process proceeds to step 176. FIG. 26 shows an example of the count result. Here, assuming that the threshold value is “100”, the sum of the appearance frequencies of the combination of the extracted word “car (noun)” and the question word “what” is equal to or greater than the threshold value. In FIG. 26, the appearance frequency is counted for each co-occurrence pattern, but it is only necessary to be able to count the total appearance frequency.

ステップ174で、上記ステップ172で出現頻度が閾値以上と判断された単語と疑問詞との組合せの単語を、その疑問詞を用いて詳細を尋ねることが適切な単語として名詞詳細質問可能判断DB46に登録する。   In step 174, the noun detail questionable determination DB 46 determines that the word that is the combination of the word and the question word whose appearance frequency is determined to be greater than or equal to the threshold value in step 172 is an appropriate word to ask for details using the question word. sign up.

次に、ステップ176で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ160へ戻り、次の一文について処理を行う。次に「車で焼肉を食べに行った」という文が抽出されたとすると、ステップ166で、「車(名詞)」及び「焼肉(名詞)」が抽出され、ステップ168で、「車(名詞)」については判別済み、「焼肉(名詞)」については未判別と判断される。ステップ170で、疑問詞「どんな」と抽出された単語「焼肉(名詞)」との組合せについて、共起パターンに該当するものをカウントする。図27に、カウント結果の一例を示す。抽出された単語「焼肉(名詞)」と疑問詞「どんな」との組合せの出現頻度の合計は閾値より小さいため、名詞詳細質問可能判断DB46には登録されない。すなわち、「焼肉(名詞)」に対して疑問詞「どんな」を用いて詳細を尋ねることは不適切であるということを示している。   Next, in step 176, it is determined whether or not the above processing has been performed for all the sentences on the corpus. If there is an unprocessed sentence, the process returns to step 160 to process the next one sentence. Next, if the sentence “I went to eat yakiniku by car” is extracted, “car (noun)” and “yaki (noun)” are extracted at step 166, and “car (noun)” is extracted at step 168. "" Has been determined, and "Yakiniku (noun)" is determined to have not been determined. In step 170, the combinations of the question word “what” and the extracted word “yaki (noun)” corresponding to the co-occurrence pattern are counted. FIG. 27 shows an example of the count result. Since the total frequency of appearance of the combination of the extracted word “Yakiniku (noun)” and the interrogative word “what” is smaller than the threshold, it is not registered in the noun detail questionable judgment DB 46. That is, it is unsuitable to ask the details of “Yakiniku (noun)” using the question word “what”.

ステップ176で、全ての文について上記の処理が終了したと判断された場合には、処理を終了する。図28に、本処理により生成された名詞詳細質問可能判断DB46の疑問詞「どんな」について登録された単語を示す。なお、図29に示すように、品詞が名詞の単語に対して詳細を尋ねるための疑問詞を予め複数定めておき、これらの疑問詞の各々について上記と同様の処理により、疑問詞に対応した適切な単語を登録して名詞詳細質問可能判断DB46を生成する。   If it is determined in step 176 that the above processing has been completed for all sentences, the processing is terminated. FIG. 28 shows words registered for the question word “what” in the noun detail questionable judgment DB 46 generated by this processing. Note that, as shown in FIG. 29, a plurality of interrogatives for inquiring details on a word whose part of speech is a noun are determined in advance, and each of these interrogatives corresponds to the interrogative by the same processing as described above. Appropriate words are registered to generate a noun detail questionable judgment DB 46.

次に、図30を参照して、形容表現理由質問可能判断DB54の生成処理について説明する。   Next, with reference to FIG. 30, a description will be given of the generation process of the adjective expression reason questionable determination DB 54.

ステップ180で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「退屈だったよ」という文が抽出されたものとする。次に、ステップ182で、上記ステップ180で抽出された1文に対して形態素解析を行う。ここでは、図31に示すように、「退屈(名詞)」「だ(助動詞)」「た(助動詞)」「よ(終助詞)」という解析結果が得られる。次に、ステップ184で、解析結果に形容表現が含まれているか否かを判断する。形容表現が含まれている場合には、ステップ186へ進み、形容表現が含まれていない場合には、ステップ194へ進む。ここでは「退屈だ(名詞+”だ”)」が含まれているため、形容表現が含まれていると判断されてステップ186へ進む。   At step 180, a sentence is extracted from a large corpus such as text on the web. Here, it is assumed that the sentence “It was boring” has been extracted. Next, in step 182, morphological analysis is performed on the one sentence extracted in step 180. Here, as shown in FIG. 31, the analysis results of “boring (noun)” “da (auxiliary verb)” “ta (auxiliary verb)” “yo (final verb)” are obtained. Next, in step 184, it is determined whether or not an adjective expression is included in the analysis result. If an adjective expression is included, the process proceeds to step 186. If an adjective expression is not included, the process proceeds to step 194. Since “boring (noun +“ it ”)” is included here, it is determined that an adjective expression is included, and the process proceeds to step 186.

ステップ186で、形容表現の単語または節を抽出する。ここでは、「退屈だ(名詞+”だ”)」が抽出される。次に、ステップ188で、抽出された単語または節について、形容表現理由質問可能判断DB54への登録の可否の判別を行ったか否かを判断する。未判別の場合には、ステップ190へ進み、判別済みの場合には、ステップ194へ進む。ここでは、まだ1文目であるので、未判別と判断されて、ステップ190へ進む。   At step 186, words or clauses of the adjective expression are extracted. Here, “boring (noun +“ it ””) is extracted. Next, in step 188, it is determined whether or not the extracted word or clause has been determined to be registered in the adjective expression reason question possibility determination DB 54. If not determined, the process proceeds to step 190. If determined, the process proceeds to step 194. Here, since it is still the first sentence, it is determined that it has not been discriminated, and the routine proceeds to step 190.

ステップ190で、図32に示すようなシソーラス上の分類名を用いたルールに基づいて、上記ステップ186で抽出された単語または節が形容表現理由質問可能判断DB54への登録対象か否かを判断する。登録対象の場合には、ステップ192へ進み、登録対象ではない場合には、ステップ194へ進む。シソーラス上の分類名を用いたルールは、例えば、図33に示すように、シソーラス上の第4階層に人の感情及び感覚に関する分類名が付されている単語または節を登録するように定めることができる。人の感情及び感覚に関する分類名とは、例えば、「感覚」、「疲労・睡眠など」・「快・喜び」など、人の主観に関連するものをいう。ユーザ発話の解析結果から抽出された単語または節のシソーラス上の分類名に人の感情及び感覚に関する分類名が付されている場合には、ユーザ発話の内容にはユーザの主観が含まれていると想定されるため、その理由を尋ねることは適切である。ここでは、「退屈だ」のシソーラスの第4階層の分類名は「疲労・睡眠など」であり、ルールに基づいて登録対象であると判断されて、ステップ192へ進む。   In step 190, based on the rule using the classification name on the thesaurus as shown in FIG. 32, it is determined whether or not the word or clause extracted in step 186 is a registration target in the adjective expression reason questionability determination DB 54. To do. If it is a registration target, the process proceeds to step 192. If it is not a registration target, the process proceeds to step 194. For example, as shown in FIG. 33, a rule using a classification name on the thesaurus is defined to register a word or a clause with a classification name related to human emotions and senses in the fourth layer on the thesaurus. Can do. The classification names related to human emotions and sensations refer to things related to human subjectivity, such as “sense”, “fatigue / sleep, etc.”, “pleasure / joy”. When the classification name on the thesaurus of words or clauses extracted from the analysis result of the user utterance is given a classification name related to human emotions and senses, the contents of the user utterance include the user's subjectivity. It is appropriate to ask why. Here, the category name of the fourth level of the “boring” thesaurus is “fatigue / sleep, etc.”, and based on the rule, it is determined to be a registration target, and the process proceeds to step 192.

ステップ192で、上記ステップ190で登録対象と判断された単語または節を、理由を尋ねることが適切な単語または節として形容表現理由質問可能判断DB54に登録する。   In step 192, the words or clauses determined to be registered in step 190 are registered in the adjective expression reason questionable determination DB 54 as words or clauses that are appropriate to ask the reason.

次に、ステップ194で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ180へ戻り、次の一文について処理を行う。次に「赤い車を買った」という文が抽出されたとすると、ステップ186で、「赤い(形容詞)」が抽出され、ステップ190で、図34に示すように「赤い(形容詞)」のシソーラス上の第4階層の分類名「色」をルールに基づいて判断すると、「赤い(形容詞)」という形容表現に対して理由を尋ねることは適切ではないと判断できるため、「赤い(形容詞)」は形容表現理由質問可能判断DB54へ登録されない。   Next, in step 194, it is determined whether or not the above processing has been performed for all the sentences on the corpus. If there is an unprocessed sentence, the process returns to step 180 to process the next one sentence. Next, if the sentence “I bought a red car” is extracted, “red (adjective)” is extracted in step 186, and on the thesaurus of “red (adjective)” in step 190, as shown in FIG. When the classification name “color” in the fourth hierarchy of is judged based on the rule, it can be judged that it is not appropriate to ask the reason for the adjective expression “red (adjective)”, so “red (adjective)” It is not registered in the adjective expression reason questionable judgment DB 54.

ステップ194で全ての文について上記の処理が終了したと判断された場合には、処理を終了する。図35に、本処理により生成された形容表現理由質問可能判断DB54を示す。   If it is determined in step 194 that the above processing has been completed for all sentences, the processing is terminated. FIG. 35 shows the adjective expression reason questionable judgment DB 54 generated by this processing.

次に、図36を参照して、本実施の形態の応答生成装置10における応答生成処理ルーチンについて説明する。本ルーチンは、ROMに記憶された応答生成プログラムをCPUが実行することにより行われる。   Next, with reference to FIG. 36, a response generation processing routine in the response generation device 10 of the present exemplary embodiment will be described. This routine is performed by the CPU executing a response generation program stored in the ROM.

ステップ200で、マイク12からユーザ発話が入力されたか否かを判断し、ユーザ発話が入力された場合には、ステップ202へ進み、入力されない場合には、入力されるまで本ステップの判断を繰り返す。ここでは、ユーザ発話「映画を観たよ」が入力されたものとする。   In step 200, it is determined whether or not a user utterance has been input from the microphone 12. If a user utterance has been input, the process proceeds to step 202. If not, the determination in this step is repeated until it is input. . Here, it is assumed that the user utterance “I watched a movie” has been input.

ステップ202で、入力されたユーザ発話を示す音声信号を音声認識して文字列情報とし、この文字列情報に対して形態素解析を行う。ここでは、解析結果として、図37に示すように、「映画(名詞)」「を(格助詞)」「観る(動詞)」「た(助動詞)」「よ(終助詞)」が得られる。   In step 202, the input voice signal indicating the user utterance is recognized as voice string information, and morphological analysis is performed on the character string information. Here, as a result of the analysis, as shown in FIG. 37, “movie (noun)” “is (case particle)” “watch (verb)” “ta (auxiliary verb)” “yo (final particle)” is obtained.

次に、ステップ204で、形態素解析の解析結果に基づいて、ユーザ発話に事態が含まれているか否かを判別する。事態が含まれている場合には、ステップ206へ進み、含まれていない場合には、ステップ222へ進む。ここでは、「観る(動詞)」が含まれているため、事態が含まれていると判断されてステップ206へ進む。   Next, in step 204, based on the analysis result of the morphological analysis, it is determined whether or not a situation is included in the user utterance. If the situation is included, the process proceeds to step 206. If not, the process proceeds to step 222. Here, since “view (verb)” is included, it is determined that the situation is included, and the process proceeds to step 206.

ステップ206で、ユーザ発話の解析結果から事態を表す単語を抽出する。ここでは、「観る(動詞)」が抽出される。次に、ステップ208で、抽出された単語が感情質問可能判断DB28に登録されているか否かを判断することにより、感情を尋ねる質問を生成することが適切か否かを判断する。登録されている場合には、ステップ210へ進み、登録されていない場合には、ステップ212へ進む。ここでは、図12に示す感情質問可能判断DB28を参照して、「観る」が登録されているため、感情を尋ねる質問を生成することは適切であると判断されて、ステップ210へ進む。   In step 206, a word representing the situation is extracted from the analysis result of the user utterance. Here, “view (verb)” is extracted. Next, in step 208, it is determined whether or not it is appropriate to generate a question asking for emotion by determining whether or not the extracted word is registered in the emotion questionable determination DB 28. If it is registered, the process proceeds to step 210. If it is not registered, the process proceeds to step 212. Here, referring to the emotion question possible determination DB 28 shown in FIG. 12, since “watch” is registered, it is determined that it is appropriate to generate a question asking for emotion, and the process proceeds to step 210.

ステップ210で、感情を尋ねるための応答文候補を生成して、予め定めた記憶領域に一旦記憶する。ここでは、図3に示す質問文例の中から、「どうでした?」を選択して応答文候補として生成する。   In step 210, response sentence candidates for asking for emotions are generated and temporarily stored in a predetermined storage area. Here, “How was it?” Is selected from the question sentence examples shown in FIG. 3 and generated as a response sentence candidate.

次に、ステップ212で、ユーザ発話の解析結果から事態を表す節を抽出する。ここでは、「映画を観る」が抽出される。次に、ステップ214で、抽出された節が頻度質問不可能判断DB34に登録されているか否かを判断することにより、頻度を尋ねる質問を生成することが適切か否かを判断する。登録されていない場合には、ステップ216へ進み、登録されている場合には、ステップ218へ進む。ここでは、図16に示す頻度質問不可能判断DB34を参照して、「映画を観る」が登録されていないため、頻度を尋ねる質問を生成することは適切であると判断されて、ステップ216へ進む。   Next, in step 212, a clause representing the situation is extracted from the analysis result of the user utterance. Here, “watch movie” is extracted. Next, in step 214, it is determined whether or not it is appropriate to generate a question asking for the frequency by determining whether or not the extracted clause is registered in the frequency question impossible determination DB 34. If not registered, the process proceeds to step 216. If registered, the process proceeds to step 218. Here, referring to the frequency question impossibility determination DB 34 shown in FIG. 16, since “watch movie” is not registered, it is determined that it is appropriate to generate a question asking for frequency, and the process goes to step 216. move on.

ステップ216で、頻度を尋ねるための応答文候補を生成して、予め定めた記憶領域に一旦記憶する。ここでは、図4に示す応答文例及び応答文例フォーマットから応答文例フォーマット「よく〜するんですか?」を選択し、「〜」の部分に、抽出した事態を表す節を挿入して「よく映画を観るんですか?」のような応答文候補を生成する。   In step 216, a response sentence candidate for inquiring the frequency is generated and temporarily stored in a predetermined storage area. Here, the response sentence example format “well? Do you do?” Is selected from the response sentence example and the response sentence example format shown in FIG. Response sentence candidates such as “Do you want to watch?” Are generated.

次に、ステップ218で、上記ステップ212で抽出された節が並列目的語質問可能判断DB38に登録されているか否かを判断することにより、並列する目的語を尋ねる質問を生成することが適切か否かを判断する。登録されている場合には、ステップ220へ進み、例えば、図5に示す応答文例及び応答文例フォーマットを用いて応答文候補を生成する。一方、抽出された節が並列目的語質問可能判断DB38に登録されていない場合には、ステップ230へ進む。ここでは、図21に示す並列目的語質問可能判断DB38を参照して、「映画を観る」が登録されていないため、並列する目的語を尋ねる質問を生成することは不適切であると判断されて、ステップ238へ進む。   Next, in step 218, it is appropriate to generate a question asking for parallel objects by determining whether or not the clause extracted in step 212 is registered in the parallel object question possibility determination DB 38. Judge whether or not. If registered, the process proceeds to step 220, and for example, a response sentence candidate is generated using the response sentence example and the response sentence example format shown in FIG. On the other hand, if the extracted clause is not registered in the parallel object questionable determination DB 38, the process proceeds to step 230. Here, referring to the parallel object question possibility determination DB 38 shown in FIG. 21, since “watch movie” is not registered, it is determined that it is inappropriate to generate a question asking for parallel objects. Then, the process proceeds to step 238.

また、上記ステップ204で、ユーザ発話に事態が含まれていないと判断されてステップ222へ進んだ場合には、形態素解析の解析結果に基づいて、ユーザ発話に名詞が含まれているか否かを判別する。名詞が含まれている場合には、ステップ224へ進み、含まれていない場合には、ステップ230へ進む。ここでは、「映画(名詞)」が含まれているため、名詞が含まれていると判断されてステップ224へ進む。   If it is determined in step 204 that no situation is included in the user utterance and the process proceeds to step 222, whether or not a noun is included in the user utterance is determined based on the analysis result of the morphological analysis. Determine. If the noun is included, the process proceeds to step 224. If the noun is not included, the process proceeds to step 230. Here, since “movie (noun)” is included, it is determined that a noun is included, and the process proceeds to step 224.

ステップ224で、ユーザ発話の解析結果から品詞が名詞の単語を抽出する。ここでは、「映画(名詞)」が抽出される。次に、ステップ226で、抽出された単語が名詞詳細質問可能判断DB46に登録されているか否かを判断することにより、抽出された単語に対する詳細を尋ねる質問を生成することが適切か否かを判断する。登録されている場合には、ステップ228へ進み、登録されていない場合には、ステップ238へ進む。ここでは、図28に示す名詞詳細質問可能判断DB46を参照して、疑問詞「どんな」に対応して「映画」が登録されているため、詳細を尋ねる質問を生成することは適切であると判断されて、ステップ228へ進む。   In step 224, a word whose part of speech is a noun is extracted from the analysis result of the user utterance. Here, “movie (noun)” is extracted. Next, in step 226, it is determined whether or not it is appropriate to generate a question asking for details about the extracted word by determining whether or not the extracted word is registered in the noun detail question possible determination DB 46. to decide. If registered, the process proceeds to step 228. If not registered, the process proceeds to step 238. Here, referring to the noun detail question possible judgment DB 46 shown in FIG. 28, since “movie” is registered corresponding to the question word “what”, it is appropriate to generate a question asking for details. After the determination, the process proceeds to step 228.

ステップ228で、抽出された単語に対する詳細を尋ねるための応答文候補を生成して、予め定めた記憶領域に一旦記憶する。ここでは、名詞詳細質問可能判断DB46に「映画」と対応して記憶された疑問詞「どんな」と「映画」とを組み合わせて「どんな映画?」のような応答文候補を生成する。   In step 228, a response sentence candidate for asking details about the extracted word is generated and temporarily stored in a predetermined storage area. Here, the question sentence “what” and “movie” stored in correspondence with “movie” in the noun detail questionable determination DB 46 are combined to generate a response sentence candidate such as “what movie?”.

また、上記ステップ222で、ユーザ発話に名詞が含まれていないと判断されてステップ230へ進んだ場合には、形態素解析の解析結果に基づいて、ユーザ発話に形容表現が含まれているか否かを判別する。形容表現が含まれている場合には、ステップ232へ進み、含まれていない場合には、ステップ242へ進む。ここでは、(i)品詞が「形容詞」の単語、及び(ii)「品詞が名詞の単語+(”だ”または”です”)」のいずれも含まれていないため、形容表現が含まれていないと判断されてステップ242へ進む。   If it is determined in step 222 that nouns are included in the user utterance and the process proceeds to step 230, whether or not an adjective expression is included in the user utterance based on the analysis result of the morphological analysis. Is determined. If an adjective expression is included, the process proceeds to step 232; otherwise, the process proceeds to step 242. Here, (i) the part of speech is “adjective” and (ii) “part of speech is a noun word + (“ da ”” or “is”) ”is not included, so an adjective expression is included If it is not determined, the process proceeds to step 242.

なお、形容表現が含まれている場合には、ステップ232で、ユーザ発話の解析結果から形容表現の単語または節を抽出し、次に、ステップ234で、抽出された単語または節が形容表現理由質問可能判断DB54に登録されているか否かを判断することにより、形容表現に対する理由を尋ねる質問を生成することが適切か否かを判断する。登録されている場合には、ステップ236へ進み、例えば、図6に示す応答文例及び応答文例フォーマットを用いて応答文候補を生成し、登録されていない場合には、ステップ238へ進む。   If an adjective expression is included, in step 232, words or clauses of the adjective expression are extracted from the analysis result of the user utterance, and then in step 234, the extracted word or clause is the reason for the adjective expression. By determining whether or not it is registered in the questionable determination DB 54, it is determined whether or not it is appropriate to generate a question that asks the reason for the description expression. If registered, the process proceeds to step 236, for example, a response sentence candidate is generated using the response sentence example and response sentence example format shown in FIG. 6, and if not registered, the process proceeds to step 238.

次に、ステップ238で、上記ステップ210、216、220、228、及び236で生成された応答文候補が少なくとも1つ以上あるか否かを判断する。予め定めた記憶領域に応答文候補が記憶されている場合には、ステップ240へ進んで、生成された応答文候補の中からランダムに1つ選択する。ここでは、「どうでした?」、「よく映画を観るんですか?」、及び「どんな映画?」という応答文候補が生成されており、この中から例えば、「どうでした?」を選択する。一方、応答文候補が1つも生成されていない場合には、ステップ242へ進んで、「へえ〜」や「それで?」などの相槌の応答文を生成する。相槌の応答文は、予め用意された定型文から選択したり、予め用意された定型フォーマットにユーザ発話の解析結果から抽出した単語を付加したりすることにより生成することができる。   Next, in step 238, it is determined whether or not there are at least one response sentence candidate generated in steps 210, 216, 220, 228, and 236. If a response sentence candidate is stored in a predetermined storage area, the process proceeds to step 240, and one response sentence candidate is randomly selected from the generated response sentence candidates. Here, response sentence candidates such as “How was it?”, “Do you often watch movies?”, And “What kind of movie?” Are generated, and for example, “How was it?” Is selected. . On the other hand, if no response sentence candidate has been generated, the process proceeds to step 242 to generate a compatible response sentence such as “Hey ~” or “So?”. The response sentence of the companion can be generated by selecting from a standard sentence prepared in advance or adding a word extracted from the analysis result of the user utterance to a standard format prepared in advance.

次に、ステップ244で、上記ステップ240で選択された応答文候補、または上記ステップ242で生成された相槌の応答文を音声信号に変換して出力する。ここでは、「どうでした?」を音声出力して、処理を終了する。   Next, in step 244, the response sentence candidate selected in step 240 or the response sentence generated in step 242 is converted into an audio signal and output. Here, “How was it?” Is output as a voice and the process is terminated.

なお、上記ステップ204〜220、ステップ222〜228、及びステップ230〜236の処理は並列して実行してもよい。また、上記ステップ206〜210、ステップ212〜216、及びステップ212−218−220の処理も並列して実行してもよい。   In addition, you may perform the process of the said steps 204-220, steps 222-228, and steps 230-236 in parallel. Moreover, you may perform the process of said step 206-210, step 212-216, and step 212-218-220 in parallel.

以上説明したように、本実施の形態の応答生成装置によれば、ユーザ発話の解析結果から抽出される事態を表す単語または節、品詞が名詞の単語、及び形容表現の単語または節に基づいて、予め質問することが適切か否かを判断するために生成されたデータベースにこれらの単語や節が登録されているか否かを判断することにより、質問する内容が適切か否かを判断できるため、不適切な応答文の生成を防止して、自然な対話を行うことができる。   As described above, according to the response generation device of the present embodiment, a word or clause representing a situation extracted from the analysis result of the user utterance, a part of speech is a noun word, and an adjective expression word or clause. Because it is possible to determine whether or not the content of the question is appropriate by determining whether or not these words and clauses are registered in the database generated to determine whether or not it is appropriate to ask in advance It is possible to prevent the generation of inappropriate response sentences and perform natural dialogue.

なお、本実施の形態では、感情質問可能判断DB、並列目的語質問可能判断DB、名詞詳細質問可能判断DB、及び形容表現理由質問可能判断DBにおいては、適切な単語または節を登録し、頻度質問不可能判断DBにおいては、不適切な節を登録する場合について説明したが、同様のルールに基づいて、適切でなければ不適切であると判断することができるため、感情質問可能判断DB、並列目的語質問可能判断DB、名詞詳細質問可能判断DB、及び形容表現理由質問可能判断DBにおいても、不適切な単語または節を登録するようにしてもよいし、頻度質問不可能判断DBにおいても、適切な節を登録するようにしてもよい。   In the present embodiment, an appropriate word or clause is registered in the emotion questionable determination DB, parallel object questionable determination DB, noun detail questionable determination DB, and adjective expression reason questionable determination DB. In the question impossibility determination DB, the case where an inappropriate clause is registered has been described. However, since it can be determined that it is inappropriate if it is not appropriate based on similar rules, the emotion question possible determination DB, In the parallel object questionable judgment DB, the noun detail questionable judgment DB, and the adjective expression reason questionable judgment DB, an inappropriate word or clause may be registered, or in the frequency question impossible judgment DB An appropriate clause may be registered.

また、本実施の形態では、スピーカによる音声出力を行う場合を例に説明したが、これに限定されるものではなく、ディスプレイに応答文を表示するようにしてもよい。また、ユーザから音声がマイクに入力される場合を例に説明したが、ユーザがキーボードなどを用いて入力文としてのテキストを入力するようにしてもよい。   Further, in the present embodiment, the case where sound output by a speaker is performed has been described as an example, but the present invention is not limited to this, and a response sentence may be displayed on a display. Moreover, although the case where audio | voice was input into the microphone from the user was demonstrated to the example, you may make it a user input the text as an input sentence using a keyboard etc.

10 応答生成装置
12 マイク
14 スピーカ
16 コンピュータ
20 言語解析部
22 事態判別部
24 事態(単語)抽出部
26 感情質問応答生成部
28 感情質問可能判断DB(データベース)
30 事態(節)抽出部
32 頻度質問応答生成部
34 頻度質問可能判断DB
36 並列目的語質問応答生成部
38 並列目的語質問可能判断DB
40 名詞判別部
42 名詞抽出部
44 名詞詳細質問応答生成部
46 名詞詳細質問可能判断DB
48 形容表現判別部
50 形容表現抽出部
52 形容表現理由質問応答生成部
54 形容表現理由質問可能判断DB
56 相槌応答生成部
58 出力部
DESCRIPTION OF SYMBOLS 10 Response production | generation apparatus 12 Microphone 14 Speaker 16 Computer 20 Language analysis part 22 Situation determination part 24 Situation (word) extraction part 26 Emotion question response generation part 28 Emotion question possibility judgment DB (database)
30 Situation (section) extraction unit 32 Frequency question response generation unit 34 Frequency question possible determination DB
36 Parallel Object Question Answer Generation Unit 38 Parallel Object Questionable Judgment DB
40 Noun discrimination unit 42 Noun extraction unit 44 Noun detail question response generation unit 46 Noun detail question possible judgment DB
48 Adjective expression discriminating unit 50 Adjective expression extracting unit 52 Adjective expression reason question response generating unit 54 Adjective expression reason questionable judgment DB
56 Affinity Response Generation Unit 58 Output Unit

Claims (15)

入力文の構造を解析した解析結果に基づいて、事態を表す単語を前記入力文から抽出する事態抽出手段と、
前記事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、前記抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する感情質問応答生成手段と、
を含む応答生成装置。
A situation extracting means for extracting a word representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence;
It is appropriate to determine whether or not the word representing the situation extracted by the situation extracting means is registered in the emotion questionable determination dictionary as an appropriate word or an inappropriate word for which an emotion is asked. If it is a simple word, a response sentence candidate prepared in advance for inquiring feelings for the word indicating the extracted situation, or a word indicating the extracted situation is added to a response sentence format prepared in advance. An emotional question answer generation means for generating a response sentence candidate;
A response generation device including:
前記感情質問可能判断辞書に、シソーラス内の感情に関する分類名が付されていない単語を、感情を尋ねることが適切な単語として登録するか、または、前記シソーラス内の感情に関する分類名が付されている単語を、感情を尋ねることが不適切な単語として登録した請求項1記載の応答生成装置。   A word that is not assigned a classification name related to emotions in the thesaurus is registered in the emotion questionable judgment dictionary as an appropriate word to ask for emotions, or a classification name related to emotions in the thesaurus is added. The response generation device according to claim 1, wherein the word is registered as a word that is inappropriate for asking an emotion. 入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、
前記事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する頻度質問応答生成手段と、
を含む応答生成装置。
A situation extracting means for extracting a clause representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence;
It is appropriate to ask whether or not the clause representing the situation extracted by the situation extraction means is registered in the frequency questionable judgment dictionary as an appropriate clause or an inappropriate clause to ask the frequency. If it is a long section, a response sentence candidate prepared in advance for inquiring the frequency of the extracted situation is added, or a section representing the extracted situation is added to a prepared response sentence format. A frequency question answer generating means for generating a response sentence candidate;
A response generation device including:
前記頻度質問可能判断辞書に、経験する頻度が高い事態、経験する頻度が低い事態、特定の時期にのみ起こりうる事態、必ず別の事態に付随し、単独では起こりえない事態、必ず所定の目的のために起こり、単独では完結しない事態、開始または終了を意味する事態、及び存在を意味する事態のいずれかに該当する事態を表す節を、頻度を尋ねることが不適切な節として登録するか、または、前記いずれかに該当する事態以外の事態を表す節を、頻度を尋ねることが適切な節として登録した請求項3記載の応答生成装置。   In the frequency questionable judgment dictionary, a situation that is frequently experienced, a situation that is experienced less frequently, a situation that can occur only at a specific time, a situation that always accompanies another situation, and that cannot occur independently, always has a predetermined purpose Whether a section that represents a situation that occurs for the purpose of and is not complete by itself, that means start or end, and that that means existence is registered as a section where it is inappropriate to ask the frequency 4. The response generation apparatus according to claim 3, wherein a clause representing a situation other than the situation corresponding to any one of the above is registered as a clause appropriate to ask the frequency. 入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、
前記事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する並列目的語質問応答生成手段と、
を含む応答生成装置。
A situation extracting means for extracting a clause representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence;
It is determined whether or not the clause representing the situation extracted by the situation extracting means is registered in the parallel object questionable determination dictionary as an appropriate clause or an inappropriate clause for asking for a parallel object. If it is an appropriate clause to ask for an object to be executed, a response sentence candidate prepared in advance for asking a parallel object for the section representing the extracted situation, or a response sentence format prepared in advance is used. Parallel object question answer generating means for generating a response sentence candidate to which a clause representing the extracted situation is added;
A response generation device including:
前記並列目的語質問可能判断辞書に、複数の入力文から、複数の並列した名詞を目的語としている事態を表す節を抽出し、前記複数の並列した名詞の各々を目的語とする節に分割し、分割された節の各々の出現頻度が所定値以上の前記分割された節を、並列する目的語を尋ねることが適切な節として登録するか、または、出現頻度が所定値より小さい前記分割された節を、並列する目的語を尋ねることが不適切な節として登録した請求項5記載の応答生成装置。   In the parallel object questionable judgment dictionary, a clause representing a situation in which a plurality of parallel nouns are set as objects is extracted from a plurality of input sentences, and each of the plurality of parallel nouns is divided into clauses having the object as a target. Then, register the divided clauses with the appearance frequency of each of the divided clauses equal to or higher than a predetermined value as appropriate clauses for asking parallel objects, or the division with the appearance frequency smaller than the predetermined value. The response generation apparatus according to claim 5, wherein the registered clauses are registered as clauses for which it is inappropriate to ask for parallel objects. 請求項1または請求項2記載の応答生成装置、請求項3または請求項4記載の応答生成装置、及び請求項5または請求項6記載の応答生成装置から選択した少なくとも2つの応答生成装置を組み合わせた応答生成装置。   A combination of at least two response generation devices selected from the response generation device according to claim 1 or claim 2, the response generation device according to claim 3 or claim 4, and the response generation device according to claim 5 or claim 6. Response generator. 入力文の構造を解析した解析結果に基づいて、品詞が名詞の単語を前記入力文から抽出する名詞抽出手段と、
前記名詞抽出手段で抽出された品詞が名詞の単語が、詳細を尋ねることが適切な単語または不適切な単語として名詞詳細質問可能判断辞書に登録されているか否かを判断し、詳細を尋ねることが適切な単語である場合には、前記抽出された品詞が名詞の単語に対する詳細を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する名詞詳細質問応答生成手段と、
を含む請求項1〜請求項7のいずれか1項記載の応答生成装置。
Noun extraction means for extracting a word whose part of speech is a noun from the input sentence based on an analysis result obtained by analyzing the structure of the input sentence;
Determine whether a word whose part of speech has been extracted by the noun extraction means is registered in the noun detail questionable dictionary as an appropriate word or an inappropriate word to ask for details, and ask for details Is an appropriate word, the extracted part of speech is a response sentence candidate prepared in advance for asking details of the noun word, or a word indicating the situation extracted in a response sentence format prepared in advance. A noun detail question answer generation means for generating a response sentence candidate to which is added,
The response generation device according to claim 1, comprising:
前記名詞詳細質問可能判断辞書に、品詞が名詞の単語と疑問詞との組合せのウェブ上での出現頻度が所定値以上の前記品詞が名詞の単語を、詳細を尋ねることが適切な単語として登録するか、または、前記品詞が名詞の単語と疑問詞との組合せのウェブ上での出現頻度が所定値より小さい前記品詞が名詞の単語を、詳細を尋ねることが不適切な単語として登録した請求項8記載の応答生成装置。   In the noun detail questionable judgment dictionary, the part-of-speech noun word that has a part-of-speech noun-word combination and a question-phrase on the web that has a frequency of appearance of a predetermined value or more is registered as an appropriate word to ask for details. Or a request that the part-of-speech noun is a noun word whose frequency of appearance on the web of a combination of a noun word and a question word is less than a predetermined value is registered as an inappropriate word to ask for details Item 9. The response generation device according to Item 8. 入力文の構造を解析した解析結果に基づいて、形容表現の単語または節を前記入力文から抽出する形容表現抽出手段と、
前記形容表現抽出手段で抽出された形容表現の単語または節が、理由を尋ねることが適切な単語もしくは節、または不適切な単語もしくは節として形容表現理由質問可能判断辞書に登録されているか否かを判断し、理由を尋ねることが適切な単語または節である場合には、前記抽出された形容表現の単語または節に対する理由を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された形容表現の単語または節を付加した応答文候補を生成する形容表現質問応答生成手段と、
を含む請求項1〜請求項9のいずれか1項記載の応答生成装置。
Based on the analysis result obtained by analyzing the structure of the input sentence, an adjective expression extracting means for extracting words or clauses of the adjective expression from the input sentence;
Whether or not the word or clause of the adjective expression extracted by the adjective expression extracting means is registered in the adjective expression reasonable questionable dictionary as an appropriate word or clause for which the reason is asked, or as an inappropriate word or clause If it is an appropriate word or clause to ask for the reason, a response sentence candidate prepared in advance for asking a reason for the word or clause of the extracted adjective expression, or a response prepared in advance An adjective expression question answer generating means for generating a response sentence candidate by adding the extracted word or clause of the adjective expression to a sentence format;
The response generation device according to claim 1, comprising:
前記形容表現理由質問可能判断辞書に、シソーラス内の人の感情及び感覚に関する分類名が付されている単語を、理由を尋ねることが適切な単語として登録するか、または、前記シソーラス内の人の感情及び感覚に関する分類名が付されていない単語を、理由を尋ねることが不適切な単語として登録した請求項10記載の応答生成装置。   In the adjective expression reason question possible judgment dictionary, a word with a classification name related to a person's emotion and sensation in the thesaurus is registered as an appropriate word to ask the reason, or a word of the person in the thesaurus The response generation device according to claim 10, wherein a word without a classification name related to emotion and sense is registered as an inappropriate word for asking a reason. コンピュータを、
入力文の構造を解析した解析結果に基づいて、事態を表す単語を前記入力文から抽出する事態抽出手段と、
前記事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、前記抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する感情質問応答生成手段と、
して機能させるための応答生成プログラム。
Computer
A situation extracting means for extracting a word representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence;
It is appropriate to determine whether or not the word representing the situation extracted by the situation extracting means is registered in the emotion questionable determination dictionary as an appropriate word or an inappropriate word for which an emotion is asked. If it is a simple word, a response sentence candidate prepared in advance for inquiring feelings for the word indicating the extracted situation, or a word indicating the extracted situation is added to a response sentence format prepared in advance. An emotional question answer generation means for generating a response sentence candidate;
A response generator to make it function.
コンピュータを、
入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、
前記事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する頻度質問応答生成手段と、
して機能させるための応答生成プログラム。
Computer
A situation extracting means for extracting a clause representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence;
It is appropriate to ask whether or not the clause representing the situation extracted by the situation extraction means is registered in the frequency questionable judgment dictionary as an appropriate clause or an inappropriate clause to ask the frequency. If it is a long section, a response sentence candidate prepared in advance for inquiring the frequency of the extracted situation is added, or a section representing the extracted situation is added to a prepared response sentence format. A frequency question answer generating means for generating a response sentence candidate;
A response generator to make it function.
コンピュータを、
入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、
前記事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する並列目的語質問応答生成手段と、
して機能させるための応答生成プログラム。
Computer
A situation extracting means for extracting a clause representing a situation from the input sentence based on an analysis result obtained by analyzing a structure of the input sentence;
It is determined whether or not the clause representing the situation extracted by the situation extracting means is registered in the parallel object questionable determination dictionary as an appropriate clause or an inappropriate clause for asking for a parallel object. If it is an appropriate clause to ask for an object to be executed, a response sentence candidate prepared in advance for asking a parallel object for the section representing the extracted situation, or a response sentence format prepared in advance is used. Parallel object question answer generating means for generating a response sentence candidate to which a clause representing the extracted situation is added;
A response generator to make it function.
コンピュータを、請求項1〜請求項11のいずれか1項記載の応答生成装置を構成する各手段として機能させるための応答生成プログラム。   The response production | generation program for functioning a computer as each means which comprises the response production | generation apparatus of any one of Claims 1-11.
JP2009068038A 2009-03-19 2009-03-19 Response generating apparatus and program Expired - Fee Related JP5212204B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009068038A JP5212204B2 (en) 2009-03-19 2009-03-19 Response generating apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009068038A JP5212204B2 (en) 2009-03-19 2009-03-19 Response generating apparatus and program

Publications (2)

Publication Number Publication Date
JP2010224608A JP2010224608A (en) 2010-10-07
JP5212204B2 true JP5212204B2 (en) 2013-06-19

Family

ID=43041767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009068038A Expired - Fee Related JP5212204B2 (en) 2009-03-19 2009-03-19 Response generating apparatus and program

Country Status (1)

Country Link
JP (1) JP5212204B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798140A (en) * 2017-11-23 2018-03-13 北京神州泰岳软件股份有限公司 A kind of conversational system construction method, semantic controlled answer method and device

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6295869B2 (en) * 2014-07-23 2018-03-20 トヨタ自動車株式会社 Response generation apparatus, response generation method, and program
JP2016080981A (en) * 2014-10-21 2016-05-16 トヨタ自動車株式会社 Response generation device, response generation method, and response generation program
JP6287754B2 (en) * 2014-10-21 2018-03-07 トヨタ自動車株式会社 Response generation apparatus, response generation method, and response generation program
CN108109616A (en) 2016-11-25 2018-06-01 松下知识产权经营株式会社 Information processing method, information processing unit and program
US11526674B2 (en) * 2019-03-01 2022-12-13 Rakuten Group, Inc. Sentence extraction system, sentence extraction method, and information storage medium
CN111611364B (en) * 2020-05-15 2023-08-15 北京百度网讯科技有限公司 Intelligent response method, device, equipment and storage medium

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3533371B2 (en) * 2000-12-01 2004-05-31 株式会社ナムコ Simulated conversation system, simulated conversation method, and information storage medium
JP2004191407A (en) * 2002-12-06 2004-07-08 Casio Comput Co Ltd Conversation system and conversation processing program
JP3699098B2 (en) * 2003-09-04 2005-09-28 コナミ株式会社 GAME PROGRAM AND GAME DEVICE
JP4186992B2 (en) * 2006-01-31 2008-11-26 株式会社豊田中央研究所 Response generating apparatus, method, and program
JP2009003811A (en) * 2007-06-22 2009-01-08 Toyota Central R&D Labs Inc Attribute determination device, interaction device and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798140A (en) * 2017-11-23 2018-03-13 北京神州泰岳软件股份有限公司 A kind of conversational system construction method, semantic controlled answer method and device
CN107798140B (en) * 2017-11-23 2020-07-03 中科鼎富(北京)科技发展有限公司 Dialog system construction method, semantic controlled response method and device

Also Published As

Publication number Publication date
JP2010224608A (en) 2010-10-07

Similar Documents

Publication Publication Date Title
Gardent et al. Creating training corpora for nlg micro-planning
JP5212204B2 (en) Response generating apparatus and program
Baker Public discourses of gay men
Valitutti et al. Developing affective lexical resources.
Harris et al. Perspective-shifting with appositives and expressives
Dahl Egocentricity in discourse and syntax
Zagal et al. Natural language processing in game studies research: An overview
JP6676109B2 (en) Utterance sentence generation apparatus, method and program
JP2005174330A (en) Method, system and program for analyzing opinion expressed from text document
Emmerson Composing strategies and pedagogy
JP6239344B2 (en) Text processing apparatus, text processing method and program
Hengeveld et al. Reflections on the lexicon in Functional Discourse Grammar
Millar et al. Adjectives, communities, and taxonomies of evaluative meaning
JP7381052B2 (en) Inquiry support device, inquiry support method, program and recording medium
JP7091146B2 (en) Information processing equipment, information processing methods, and programs
JP5872183B2 (en) Information processing system, preference visualization system, censorship system, and preference visualization method
Frisch The ethics of testimony: a genealogical perspective
Pereira et al. An augmentative and alternative communication synthetic corpus for brazilian portuguese
Malheiro et al. Keyword-based Approach for Lyrics Emotion Variation Detection.
Salah et al. Analysing storytelling in design talk using LIWC (Linguistic Inquiry and Word Count)
Tucker A functional lexicogrammar of adjectives
Gilquin Taking a new look at lexical networks
Panesar An evaluation of a linguistically motivated conversational software agent framework
Haugland “Excited to see what great things this year will bring💃�”; an empirical study on emojis and discourse relations
SARAGIH . An Analysis of Word Formation Process on Covid–19 News in BBC News Online

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20111031

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20111031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130211

R151 Written notification of patent or utility model registration

Ref document number: 5212204

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees