JP5872516B2 - End-of-sentence extraction device, end-of-sentence conversion device, method, and program - Google Patents

End-of-sentence extraction device, end-of-sentence conversion device, method, and program Download PDF

Info

Publication number
JP5872516B2
JP5872516B2 JP2013207266A JP2013207266A JP5872516B2 JP 5872516 B2 JP5872516 B2 JP 5872516B2 JP 2013207266 A JP2013207266 A JP 2013207266A JP 2013207266 A JP2013207266 A JP 2013207266A JP 5872516 B2 JP5872516 B2 JP 5872516B2
Authority
JP
Japan
Prior art keywords
expression
sentence
dialogue
type
ending
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013207266A
Other languages
Japanese (ja)
Other versions
JP2015072555A (en
Inventor
千明 宮崎
千明 宮崎
平野 徹
徹 平野
東中 竜一郎
竜一郎 東中
牧野 俊朗
俊朗 牧野
松尾 義博
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013207266A priority Critical patent/JP5872516B2/en
Publication of JP2015072555A publication Critical patent/JP2015072555A/en
Application granted granted Critical
Publication of JP5872516B2 publication Critical patent/JP5872516B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文末表現抽出装置、文末表現変換装置、方法、及びプログラムに関する。   The present invention relates to a sentence end expression extraction apparatus, sentence end expression conversion apparatus, method, and program.

対話システムに話をさせるための発話データや、話し相手であるユーザの発話が、どのような意図や目的を伝達するものであるかを把握することは、システムがいつ何を話すべきかを制御するために不可欠である。よってこれまでは、個々の発話の対話行為が何であるかを推定する研究が主として取り組まれてきた。例えば、非特許文献1では機械学習の手法で対話行為の推定を行っている。   Understanding what kind of intent and purpose the utterance data for letting the conversation system speak and the utterances of the user with whom it is speaking controls what and when the system should speak Indispensable for. Thus, until now, research has been mainly focused on estimating what the dialogue act of each utterance is. For example, in Non-Patent Document 1, the dialogue action is estimated by a machine learning method.

また、対話行為を推定する技術の応用として、推定された対話行為を候補として提示することによってアノテータによる対話行為のラベル付けを容易にする、アノテーション支援技術も研究されてきた(例えば、非特許文献2,3)。   In addition, as an application of the technology for estimating a dialogue act, an annotation support technology that facilitates labeling a dialogue act by an annotator by presenting the estimated dialogue act as a candidate has been studied (for example, non-patent literature). 2, 3).

また、対話システムにおける発話生成に関しては、非特許文献4のように、特定のタスクを遂行する対話システムにおいて必要となる発話のテンプレートを予め用意し、ユーザとの対話から得られた情報を基にテンプレートを埋めることで発話を生成する研究が存在する。   As for utterance generation in a dialogue system, as in Non-Patent Document 4, a template for utterances required in a dialogue system that performs a specific task is prepared in advance, and information obtained from dialogue with the user is used as a basis. There are studies that generate utterances by filling templates.

Stolcke, A.、Ries, K.、Coccaro, N.、Shriberg, E.、Bates, R.、Jurafsky, D.、Taylor, P.、Martin, R.、Van Ess-Dykema, C. and Meteer, M.、「Dialogue act modeling for automatic tagging and recognition of conversational speech.」、2000、Computational linguistics、26(3)、p.339-373Stolcke, A., Ries, K., Coccaro, N., Shriberg, E., Bates, R., Jurafsky, D., Taylor, P., Martin, R., Van Ess-Dykema, C. and Meteer, M., `` Dialogue act modeling for automatic tagging and recognition of conversational speech. '', 2000, Computational linguistics, 26 (3), p.339-373 駒谷和範、荒木雅弘、堂下修司、「対話コーパスにおける発話単位タグの一推定手法.」、1999、人工知能学会誌、14(2)、p.273-281Komaya Kazunori, Araki Masahiro, Doshita Shuji, "A Method for Estimating Utterance Unit Tags in Dialogue Corpus", 1999, Japanese Society for Artificial Intelligence, 14 (2), p.273-281 洪陽杓、白井清昭、「対話行為タグ付きコーパスの作成支援」、言語処理学会第11回年次大会発表論文集、2005Hong Yoo, Kiyoaki Shirai, “Corporation for Dialogue-Tagged Corpus”, Proc. Of the 11th Annual Conference of the Language Processing Society of Japan, 2005 Higashinaka, R.、Sudoh, K., & Nakano, M.「Incorporating discourse features into confidence scoring of intention recognition results in spoken dialogue systems.」、2006、Speech Communication、48(3)、p.417-436Higashinaka, R., Sudoh, K., & Nakano, M. `` Incorporating discourse features into confidence scoring of intention recognition results in spoken dialogue systems. '', 2006, Speech Communication, 48 (3), p.417-436

しかし、対話行為について表現可能な発話を生成する研究はこれまでに見当たらない。   However, there has been no research to generate utterances that can express the dialogue act.

また、自由な会話を楽しむことを目的とするような対話システムを扱う場合は、発話すべき内容は多岐に渡るため、あらゆる内容と対話行為とを考慮した発話テンプレートを用意するのは困難である。   In addition, when dealing with a dialogue system that aims to enjoy free conversation, it is difficult to prepare an utterance template that takes into account all the contents and dialogue actions, since the contents to be uttered are diverse. .

本発明は、上記の事情に鑑みてなされたもので、対話行為の種類毎に、対話行為の種類に対応する文末表現を抽出することができる文末表現抽出装置、方法、及びプログラムを提供することを目的とする。
また、入力されたテキストの文末表現を、指定された対話行為の種類に対応する文末表現に変換することができる文末表現変換装置、方法、及びプログラムを提供することを目的とする。
The present invention has been made in view of the above circumstances, and provides a sentence end expression extracting apparatus, method, and program capable of extracting a sentence end expression corresponding to a type of dialogue action for each type of dialogue action. With the goal.
It is another object of the present invention to provide a sentence end expression conversion apparatus, method, and program capable of converting a sentence end expression of input text into a sentence end expression corresponding to a specified type of dialogue action.

上記目的を達成するために、本発明の文末表現抽出装置は、発話の意図を表す対話行為の種類が各々付与された複数の対話テキストの各々について、前記対話テキストから、文末表現を抽出する文末表現抽出部と、前記対話行為の種類毎に、前記対話行為の種類が付与された前記対話テキストから抽出された文末表現から、前記対話行為の種類が付与された前記対話テキストにおける前記文末表現の出現比率と、前記対話行為の種類と異なる対話行為の種類が付与された前記対話テキストにおける前記文末表現の出現比率との比較結果に基づいて、前記対話行為の種類を表現するための文末表現を抽出する特徴的文末表現抽出部と、前記対話行為の種類毎に、前記特徴的文末表現抽出部によって抽出された前記対話行為の種類を表現するための文末表現の各々に対して、前記文末表現の活用語尾を変化させて、前記対話行為の種類を表現するための文末表現として、活用型が異なる複数の文末表現を生成する文末表現拡張部と、を含んで構成されている。 In order to achieve the above object, the sentence ending expression extraction device of the present invention extracts a sentence ending expression from each dialogue text for each of a plurality of dialogue texts each provided with a type of dialogue act indicating the intention of utterance. An expression extraction unit, and for each type of dialogue action, from the sentence end expression extracted from the dialogue text to which the type of dialogue action is assigned, the end of sentence expression in the dialogue text to which the type of dialogue action is assigned Based on the comparison result of the appearance ratio and the appearance ratio of the sentence ending expression in the dialogue text to which the kind of dialogue action different from the kind of dialogue action is given, a sentence ending expression for expressing the type of dialogue action a characteristic sentence end expression extracting unit that extracts, for each type of the dialogue act, for representing a type of the dialog act extracted by said characteristic sentence end expression extraction unit For each sentence end expressions, and said changing the inflectional endings of sentence end expression as a sentence end expression for representing a type of the dialogue act, sentence end expressions extension unit utilizing type produces a different sentence end expressions, It is comprised including.

本発明の文末表現抽出方法は、文末表現抽出部、特徴的文末表現抽出部、及び文末表現拡張部を含む文末表現抽出装置における文末表現抽出方法であって、前記文末表現抽出部によって、発話の意図を表す対話行為の種類が各々付与された複数の対話テキストの各々について、前記対話テキストから、文末表現を抽出するステップと、前記特徴的文末表現抽出部によって、前記対話行為の種類毎に、前記対話行為の種類が付与された前記対話テキストから抽出された文末表現から、前記対話行為の種類が付与された前記対話テキストにおける前記文末表現の出現比率と、前記対話行為の種類と異なる対話行為の種類が付与された前記対話テキストにおける前記文末表現の出現比率との比較結果に基づいて、前記対話行為の種類を表現するための文末表現を抽出するステップと、前記文末表現拡張部によって、前記対話行為の種類毎に、前記特徴的文末表現抽出部によって抽出された前記対話行為の種類を表現するための文末表現の各々に対して、前記文末表現の活用語尾を変化させて、前記対話行為の種類を表現するための文末表現として、活用型が異なる複数の文末表現を生成するステップと、を含む。 Sentence end expression extraction method of the present invention, sentence end expression extraction unit, features specific sentence end expression extraction unit, and a sentence end expression extracting method in the sentence end expression extraction device including a sentence end expressions extension, by the sentence end expression extraction unit, speech Extracting a sentence end expression from the dialog text for each of a plurality of dialog texts each having a dialog action type representing an intention of the user, and for each type of the dialog action by the characteristic sentence end expression extracting unit. From the sentence ending expression extracted from the dialogue text to which the dialogue action type is assigned, the appearance ratio of the sentence ending expression in the dialogue text to which the dialogue action type is given and the dialogue different from the dialogue action type To express the type of dialogue action based on the comparison result with the appearance ratio of the sentence end expression in the dialogue text to which the type of action is assigned Extracting a sentence end expression, by the sentence end expression extensions, for each type of the dialogue act, for each of the sentence end expressions for representing a type of the dialog act extracted by said characteristic sentence end expression extraction unit And generating a plurality of sentence ending expressions having different utilization types as sentence ending expressions for expressing the type of the dialogue action by changing a utilization ending of the sentence ending expression .

また、前記対話行為の種類毎に、前記対話行為の種類を表現するための文末表現から、予め定められた言いさし表現、及び予め定められた文脈に依存する表現の少なくとも一方を含む文末表現を削除して、前記対話行為の種類を表現するための文末表現を出力する不要文末表現フィルタ部を更に含むようにすることができる。   Further, for each type of dialogue action, the sentence ending expression includes at least one of a predetermined wording expression and a predetermined context-dependent expression from a sentence ending expression for expressing the type of the dialogue action. And an unnecessary sentence ending expression filter unit for outputting a sentence ending expression for expressing the type of dialogue action.

本発明の文末表現変換装置は、入力されたテキストから、文末表現及び前記文末表現の直前に出現する形態素の品詞を抽出する文末表現抽出部と、指定された発話の意図を表す対話行為の種類に対して予め求められた、前記対話行為の種類を表現するための文末表現と前記文末表現の直前に出現する形態素の品詞との組み合わせのリストと、前記文末表現抽出部によって抽出された前記文末表現の直前の形態素の品詞とを照合し、前記文末表現抽出部によって抽出された前記文末表現の直前の形態素の品詞に対応する、前記対話行為の種類を表現するための文末表現を、文末表現の変換候補として生成する文末表現候補生成部と、前記文末表現候補生成部によって生成された文末表現の変換候補を用いて、前記入力されたテキストに含まれる文末表現を、前記対話行為の種類を表現するための文末表現に変換する文末表現変換部と、を含んで構成されている。   The sentence ending expression conversion apparatus of the present invention includes a sentence ending expression extracting unit that extracts a sentence ending expression and a part of speech of a morpheme that appears immediately before the sentence ending expression from the input text, and a type of interactive action that represents the intention of the specified utterance. A list of combinations of sentence ending expressions for expressing the type of dialogue act and morpheme parts of speech that appear immediately before the sentence ending expression, and the sentence ending expression extracted by the sentence ending expression extraction unit The sentence ending expression for expressing the type of the dialogue action corresponding to the morpheme immediately preceding the sentence ending expression extracted by the sentence ending expression extracting unit is compared with the part of speech of the morpheme immediately preceding the expression. End-of-sentence expression candidate generation unit to be generated as a conversion candidate and a sentence-end expression conversion candidate generated by the end-of-sentence expression candidate generation unit, and included in the input text The end representation is configured to include a and endnotes representation conversion unit that converts the sentence end expressions for representing a type of the dialogue act.

本発明の文末表現変換方法は、文末表現抽出部、文末表現候補生成部、及び文末表現変換部を含む文末表現変換装置における文末表現変換方法であって、前記文末表現抽出部によって、入力されたテキストから、文末表現及び前記文末表現の直前に出現する形態素の品詞を抽出するステップと、前記文末表現候補生成部によって、指定された発話の意図を表す対話行為の種類に対して予め求められた、前記対話行為の種類を表現するための文末表現と前記文末表現の直前に出現する形態素の品詞との組み合わせのリストと、前記文末表現抽出部によって抽出された前記文末表現の直前の形態素の品詞とを照合し、前記文末表現抽出部によって抽出された前記文末表現の直前の形態素の品詞に対応する、前記対話行為の種類を表現するための文末表現を、文末表現の変換候補として生成するステップと、前記文末表現変換部によって、前記文末表現候補生成部によって生成された文末表現の変換候補を用いて、前記入力されたテキストに含まれる文末表現を、前記対話行為の種類を表現するための文末表現に変換するステップと、を含む。   The sentence ending expression conversion method of the present invention is a sentence ending expression conversion method in a sentence ending expression conversion device including a sentence ending expression extraction unit, a sentence ending expression candidate generation unit, and a sentence ending expression conversion unit, and is input by the sentence ending expression extraction unit The sentence end expression and the morpheme part-of-speech that appears immediately before the sentence end expression are extracted from the text, and the sentence end expression candidate generation unit previously obtained for the type of dialogue action indicating the intention of the specified utterance. , A list of combinations of sentence ending expressions for expressing the type of dialogue action and morpheme parts of speech that appear immediately before the sentence ending expression, and parts of speech of the morpheme immediately before the sentence ending expression extracted by the sentence ending expression extraction unit And a sentence for expressing the type of dialogue action corresponding to the part of speech of the morpheme immediately before the sentence end expression extracted by the sentence end expression extraction unit Generating an expression as a sentence ending expression conversion candidate, and using the sentence ending expression conversion candidate generated by the sentence ending expression candidate generating unit by the sentence ending expression conversion unit, the sentence ending expression included in the input text Converting to a sentence end expression for expressing the type of dialogue action.

本発明の第1のプログラムは、コンピュータを、上記の文末表現抽出装置の各部として機能させるためのプログラムである。   The first program of the present invention is a program for causing a computer to function as each section of the sentence end expression extraction device.

本発明の第2のプログラムは、コンピュータを、上記の文末表現変換装置の各部として機能させるためのプログラムである。   A second program of the present invention is a program for causing a computer to function as each part of the sentence ending expression conversion device.

以上説明したように、本発明の文末表現抽出装置、方法、及びプログラムによれば、対話行為の種類毎に、対話行為の種類が付与された対話テキストから抽出された文末表現から、当該対話行為の種類が付与された対話テキストにおける当該文末表現の出現比率と、異なる対話行為の種類が付与された対話テキストにおける当該文末表現の出現比率との比較結果に基づいて、当該対話行為の種類を表現するための文末表現を抽出することにより、対話行為の種類毎に、対話行為の種類に対応する文末表現を抽出することができる、という効果が得られる。   As described above, according to the sentence end expression extraction apparatus, method, and program of the present invention, for each type of dialogue action, the dialogue action is extracted from the sentence end expression extracted from the dialogue text to which the type of dialogue action is assigned. The type of dialogue act is expressed based on the comparison result of the appearance ratio of the sentence ending expression in the dialogue text with the type of dialogue and the appearance ratio of the sentence ending expression in the dialogue text with the type of different dialogue action By extracting the sentence end expression to be performed, the effect that the sentence end expression corresponding to the type of dialogue action can be extracted for each type of dialogue action is obtained.

また、本発明の文末表現変換装置、方法、及びプログラムによれば、指定された対話行為の種類に対して予め求められた、対話行為の種類を表現するための文末表現と当該文末表現の直前に出現する形態素の品詞との組み合わせのリストと、入力されたテキストから抽出された文末表現の直前の形態素の品詞とを照合し、入力されたテキストから抽出された文末表現の直前の形態素の品詞に対応する、対話行為の種類を表現するための文末表現を、文末表現の変換候補として生成し、生成された文末表現の変換候補を用いて、入力されたテキストに含まれる文末表現を、当該対話行為の種類を表現するための文末表現に変換することにより、入力されたテキストの文末表現を、指定された対話行為の種類に対応する文末表現に変換することができる、という効果が得られる。   Further, according to the sentence end expression conversion device, method, and program of the present invention, the sentence end expression for expressing the type of interactive action, which is obtained in advance for the specified type of interactive action, and immediately before the sentence end expression. The list of combinations of morpheme parts of speech that appear in the text and the part of speech of the morpheme immediately before the end of the sentence extracted from the input text are checked against the part of speech of the morpheme immediately before the end of the sentence extracted from the input text. A sentence ending expression for expressing the type of dialogue action corresponding to is generated as a sentence ending expression conversion candidate, and the sentence ending expression included in the input text is It is possible to convert the sentence ending expression of the input text into the sentence ending expression corresponding to the specified dialogue action type by converting it to the sentence ending expression for expressing the type of dialogue action. Wear, the effect is obtained that.

本実施の形態に係る文末表現抽出装置の機能的な構成例を示すブロック図である。It is a block diagram which shows the functional structural example of the sentence ending expression extraction apparatus which concerns on this Embodiment. 文末表現リストの一例を示すイメージ図である。It is an image figure which shows an example of a sentence end expression list. 対話行為リストの一例を示すイメージ図である。It is an image figure which shows an example of a dialogue action list. 特徴的文末表現候補リストの一例を示すイメージ図である。It is an image figure which shows an example of a characteristic sentence end expression candidate list. 活用語尾リストの一例を示すイメージ図である。It is an image figure which shows an example of a utilization ending list | wrist. 対話行為毎の特徴的文末表現リストの一例を示すイメージ図である。It is an image figure which shows an example of the characteristic sentence end expression list for every dialog action. 本実施の形態に係る文末表現変換装置の機能的な構成例を示すブロック図である。It is a block diagram which shows the functional structural example of the sentence ending expression conversion apparatus which concerns on this Embodiment. 「否定」と「完了」との形態素のリストの一例を示すイメージ図である。It is an image figure which shows an example of the list | wrist of a morpheme of "Negation" and "Done". 変換候補リストの一例を示すイメージ図である。It is an image figure which shows an example of a conversion candidate list | wrist. 本実施の形態におけるリスト生成処理ルーチンを示すフローチャートである。It is a flowchart which shows the list production | generation process routine in this Embodiment. 本実施の形態における文末表現変換処理ルーチンを示すフローチャートである。It is a flowchart which shows the sentence end expression conversion process routine in this Embodiment.

<概要>
まず、本発明の実施の形態の概要について説明する。
<Overview>
First, an outline of an embodiment of the present invention will be described.

本実施の形態では、日本語で書かれた文又は発話の末尾に現れる表現(文末表現)を、任意の異なる文末表現で書き換える。ここで、日本語で書かれた文又は発話とは、日本語で書かれたテキストデータであれば何でも良い。会話音声のような話された言葉であっても、書き起こしや音声認識によってテキスト化されていればよい。   In this embodiment, a sentence written in Japanese or an expression appearing at the end of an utterance (end of sentence expression) is rewritten with any different end of sentence expression. Here, the sentence or utterance written in Japanese may be any text data written in Japanese. Even spoken words such as conversational speech need only be made into text by transcription or speech recognition.

本実施の形態によれば、人間と対話をするコンピュータ(対話システム)のシステム発話に対して、発話の意図(対話行為)を表す文末表現を付与することが可能になる。   According to the present embodiment, it is possible to give a sentence end expression representing the intention (interactive action) of an utterance to the system utterance of a computer (interactive system) that interacts with a human.

例えば、「富士山に登る」「富士山は美しい」のような入力テキストの文末表現を書き換え、「富士山は美しいですよね」(対話行為「共感・同意」)や、「富士山に登ったことがあります」(対話行為「自己開示_経験」)のように、人間同士の間で交わされるような、対話行為を表現可能なテキストへと変換することができる。   For example, rewriting the sentence endings of input texts such as “Climb Mt. Fuji” or “Mt. Fuji is beautiful”, “Mt. Fuji is beautiful” (dialogue “Empathy / Agreement”) or “I have climbed Mt. Fuji” As in (Dialogue act “Self-disclosure_Experience”), it is possible to convert the dialogue act into a text that can be expressed between humans.

本実施の形態では、対話行為を特徴づける文末表現リストの取得は、対話行為ラベルが付与されたテキストデータ(コーパス)から変換候補となる文末表現を自動的に抽出することによって実現する。特定の対話行為を特徴づける文末表現のリストの作成は、まず、コーパスから、特定の対話行為が付与されたテキストに偏って多く出現する文末表現を抽出し、次に、動詞や形容詞の活用型に基づいて文末表現に含まれる活用語尾を変化させることで文末表現のバリエーションを拡張し、最後に、数種のフィルタを用いた精査を行うことによって実現する。   In the present embodiment, acquisition of a sentence end expression list characterizing a dialogue action is realized by automatically extracting a sentence end expression as a conversion candidate from text data (corpus) to which a dialogue action label is assigned. To create a list of sentence ending expressions that characterize a specific dialogue act, first extract from the corpus the sentence ending expressions that appear frequently in the text given the particular dialogue act, and then use verbs and adjectives. Based on the above, it is realized by extending the variation of the sentence ending expression by changing the ending ending included in the sentence ending expression, and finally conducting a scrutiny using several types of filters.

以下、図面を参照して、本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<文末表現抽出装置のシステム構成>
本実施の形態に係る文末表現抽出装置100は、CPUと、RAMと、後述するリスト生成処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成される。このコンピュータは、機能的には、図1に示すように、リスト生成用入力部1と、リスト生成用演算部2と、対話行為毎の特徴的文末表現リストデータベース3とを含んだ構成で表すことができる。以下、各部について詳述する。
<System configuration of sentence ending expression extraction device>
The sentence end expression extraction apparatus 100 according to the present embodiment is configured by a computer including a CPU, a RAM, and a ROM that stores a program for executing a list generation processing routine described later. As shown in FIG. 1, this computer is functionally represented by a configuration including a list generation input unit 1, a list generation calculation unit 2, and a characteristic sentence ending expression list database 3 for each dialogue action. be able to. Hereinafter, each part is explained in full detail.

リスト生成用入力部1は、発話の意図を表す対話行為の種類が各々付与された複数の対話テキストを受け付ける。対話テキストは、1つ以上の文を含む文書である。   The list generation input unit 1 accepts a plurality of dialogue texts each assigned a type of dialogue act representing the intention of the utterance. Dialogue text is a document that contains one or more sentences.

また、本実施の形態で用いる対話行為の種類(タグセット)は下記の通りであるが、対話行為の種類は、対話システムのドメインや用途に応じて変更してもよい。   Moreover, although the kind (tag set) of the interactive action used by this Embodiment is as follows, you may change the kind of interactive action according to the domain and use of an interactive system.

(1)情報提供
(2)自己開示(事実、経験、欲求等をサブタグとして持つ)
(3)質問(事実、経験、欲求、自問等をサブタグとして持つ)
(4)共感・同意、非共感・非同意
(1) Information provision (2) Self-disclosure (having facts, experiences, desires, etc. as subtags)
(3) Question (has facts, experience, desire, self-question, etc. as subtags)
(4) Sympathy / consent, non-sympathy / non-consent

リスト生成用演算部2は、対話行為毎の特徴的文末表現リストを生成する。リスト生成用演算部2は、対話行為付与済テキストデータベース20と、リスト生成部22とを備えている。   The list generation calculation unit 2 generates a characteristic sentence ending expression list for each dialogue action. The list generation calculation unit 2 includes a dialogue act-added text database 20 and a list generation unit 22.

対話行為付与済テキストデータベース20には、リスト生成用入力部1により受け付けた複数の対話テキストが格納される。   The dialogue act-added text database 20 stores a plurality of dialogue texts received by the list generation input unit 1.

リスト生成部22は、文末表現抽出部24と、特徴的文末表現抽出部26と、文末表現拡張部28と、不要文末表現フィルタ部30とを備えている。   The list generation unit 22 includes a sentence ending expression extraction unit 24, a characteristic sentence ending expression extraction unit 26, a sentence ending expression expansion unit 28, and an unnecessary sentence ending expression filter unit 30.

文末表現抽出部24は、対話行為付与済テキストデータベース20に格納された複数の対話テキストの各々について、当該対話テキストから、文末表現を抽出し、文末表現リストを生成する。また、文末表現抽出部24は、対話行為付与済テキストデータベース20に格納された対話テキストに付与されている対話行為の種類に基づいて、各文末表現に対応する対話行為の種類を示す対話行為リストを生成する。   The sentence end expression extraction unit 24 extracts a sentence end expression from the dialog text for each of the plurality of dialog texts stored in the interactive action granted text database 20, and generates a sentence end expression list. In addition, the sentence end expression extraction unit 24 is based on the type of dialogue action assigned to the dialogue text stored in the dialogue action granted text database 20 and shows a dialogue action list indicating the type of dialogue action corresponding to each sentence end expression. Is generated.

具体的には、文末表現抽出部24は、対話行為付与済テキストデータベース20に格納された対話テキストの各々について、当該対話テキストを形態素解析し、文末から見て初出の内容語より後ろの形態素列を文末表現として抽出し、抽出された各文末表現と、各文末表現に含まれる全形態素の品詞列と、各文末表現の直前の形態素の品詞とをリスト化し、図2に示すような文末表現リストを生成する。さらに、文末表現抽出部24は、対話行為付与済テキストデータベース20に格納された対話テキストに付与されている対話行為の種類に基づいて、各文末表現が抽出された対話テキストの対話行為の種類を示す対話行為ラベルを取得してリスト化し、図3に示すような対話行為リストを生成する。上記図2は文末表現、文末表現の品詞、及び文末表現の直前の形態素の品詞の組み合わせのリストを示す文末表現リストの一例であり、図3は各文末表現の抽出元の対話テキストの対話行為を示す対話行為リストの一例である。   Specifically, the sentence end expression extraction unit 24 performs morphological analysis on the dialogue text for each of the dialogue texts stored in the dialogue act-added text database 20, and the morpheme sequence after the first content word when viewed from the end of the sentence. 2 as sentence ending expressions, list each extracted sentence ending expression, part of speech of all morphemes included in each sentence ending expression, and part of speech of the morpheme immediately before each sentence ending expression, as shown in FIG. Generate a list. Further, the sentence ending expression extraction unit 24 determines the type of dialogue action of the dialogue text from which each sentence ending expression is extracted based on the type of dialogue action assigned to the dialogue text stored in the dialogue action granted text database 20. The dialogue action labels shown are acquired and listed, and a dialogue action list as shown in FIG. 3 is generated. FIG. 2 is an example of a sentence ending expression list showing a list of combinations of sentence ending expressions, part of speech of sentence ending expressions, and part of speech of morphemes immediately before the sentence ending expression, and FIG. 3 is an interactive action of dialogue text from which each sentence ending expression is extracted. It is an example of the dialogue action list which shows.

なお、本実施の形態では、動詞・形容詞の活用型も品詞に含むこととする。また、記号や英文字は文末表現に含めないようにし、内容語としては、名詞、形容詞および動詞の語幹、連用詞、連体詞、独立詞、並びに数詞を使用する。ただし、顔文字を文末表現の一種として扱う場合など、必要に応じて記号や英文字、及び他の品詞を利用してもよい。なお、対話行為に特徴的な文末表現を抽出する処理においては、「こと」「よう」「つもり」等の形式名詞(補助名詞)や、補助動詞の「ある」も文末表現に含める。これによって、対話行為を特徴づける表現のバリエーションを拡げることができる。例えば、経験を表す文末表現である「たことがある」等の抽出が可能となる。   In the present embodiment, verbs and adjectives are also included in the part of speech. In addition, symbols and English characters are not included in the sentence ending expression, and nouns, adjectives and verb stems, conjunctions, conjunctions, independents, and numbers are used as content words. However, symbols, English characters, and other parts of speech may be used as necessary, such as when emoticons are handled as a kind of sentence ending expression. In the process of extracting the sentence end expression characteristic of the dialogue action, formal nouns (auxiliary nouns) such as “Koto”, “yo”, “intention” and the auxiliary verb “A” are also included in the sentence end expression. As a result, it is possible to expand the variations of expressions that characterize the dialogue act. For example, it is possible to extract “there has been” which is a sentence end expression representing experience.

例として、「富士山に登ったことがあります」という発話を入力とすると、文末から見て初出の内容語は動詞語幹の「登」となり、文末表現は「ったことがある」となる。   As an example, if an utterance “I have climbed Mt. Fuji” is input, the content word that appears for the first time from the end of the sentence will be the “verb” of the verb stem, and the expression at the end of the sentence will be “I have never had”.

特徴的文末表現抽出部26は、対話行為の種類毎に、文末表現抽出部24によって、当該対話行為の種類が付与された対話テキストから抽出された文末表現から、当該対話行為の種類が付与された対話テキストにおける文末表現の出現頻度と、対話行為付与済テキストデータベース20に格納されている、当該対話行為の種類とは異なる対話行為の種類が付与された対話テキストにおける文末表現の出現頻度とに基づいて、当該対話行為の種類を表現するための文末表現を抽出する。   The characteristic sentence ending expression extraction unit 26 is assigned, for each type of dialogue action, the type of dialogue act from the sentence ending expression extracted from the dialogue text to which the type of dialogue action is given by the sentence ending expression extraction unit 24. Between the appearance frequency of the sentence ending expression in the dialogue text and the appearance frequency of the sentence ending expression in the dialogue text that is stored in the interactive action granted text database 20 and that has a different dialogue action type from the dialogue action type. Based on this, a sentence end expression for expressing the type of the dialogue action is extracted.

具体的には、特徴的文末表現抽出部26は、上記図2の文末表現リストと、上記図3の対話行為リストとに基づいて、対話行為の種類毎に、各対話行為に偏って多く使用される文末表現を抽出し、図4に示すような、対話行為毎の特徴的な文末表現、文末表現の品詞、文末表現の直前の形態素の品詞、及び対数尤度比(スコア)の組み合わせのリストである、特徴的文末表現候補リストを生成する。   Specifically, the characteristic sentence ending expression extraction unit 26 uses a large amount biased to each dialogue action for each type of dialogue action based on the sentence ending expression list in FIG. 2 and the dialogue action list in FIG. 4 is extracted, and a combination of a characteristic sentence ending expression for each dialogue action, a part of speech of the sentence ending expression, a part of speech of the morpheme immediately before the sentence ending expression, and a log likelihood ratio (score) as shown in FIG. A list of characteristic sentence ending expression candidates, which is a list, is generated.

以下では、一例として、対話行為「自己開示_経験」を対象として説明する。   In the following, the dialogue action “self-disclosure_experience” will be described as an example.

特徴的文末表現抽出部26は、まず、対話行為の種類毎に、文末表現抽出部24によって当該対話行為の種類が付与された対話テキストから抽出された文末表現の各々について、当該対話行為の種類が付与された対話テキストにおける当該文末表現の出現頻度と、当該対話行為の種類と異なる対話行為の種類が付与された対話テキストにおける当該文末表現の出現頻度とに基づいて、対数尤度比を算出し、統計的検定である対数尤度比検定によって、各対話行為に偏って多く使用される文末表現を抽出する(p<0.01)。本実施の形態では有意水準は1%としたが、有意水準はデータや目的に応じて変更可能である。   The characteristic sentence ending expression extraction unit 26 first, for each type of dialogue action, for each of the sentence ending expressions extracted from the dialogue text to which the kind of dialogue action is given by the sentence ending expression extraction unit 24, The log likelihood ratio is calculated based on the appearance frequency of the sentence ending expression in the dialogue text to which is assigned and the appearance frequency of the sentence ending expression in the dialogue text to which the type of dialogue action different from the type of the dialogue action is assigned. Then, by using a log-likelihood ratio test, which is a statistical test, sentence ending expressions that are often used biased to each dialogue action are extracted (p <0.01). In the present embodiment, the significance level is set to 1%, but the significance level can be changed according to data and purpose.

なお、統計的検定以外の方法によって、対話行為の種類に依存して出現する文末表現を抽出してもよい。例えば、対話行為の種類がAである場合に、文末表現Bが偏って多く使用されるか否かを、以下のように出現比率を比較して判定してもよい。   Note that sentence ending expressions that appear depending on the type of dialogue act may be extracted by a method other than the statistical test. For example, when the type of dialogue action is A, it may be determined by comparing the appearance ratio as follows whether or not the sentence end expression B is heavily used.

対話行為Aの対話テキストにおける文末表現Bの出現頻度をa、対話行為A以外の対話行為の対話テキストにおける文末表現Bの出現頻度をb、対話行為Aの対話テキストにおける文末表現B以外の出現頻度をc、対話行為A以外の対話行為の対話テキストにおける文末表現B以外の出現頻度をdとする。   The appearance frequency of the sentence end expression B in the dialogue text of the dialogue action A is a, the appearance frequency of the sentence end expression B in the dialogue text of the dialogue action other than the dialogue action A is b, and the appearance frequency other than the sentence end expression B in the dialogue text of the dialogue action A C, and the appearance frequency other than the sentence end expression B in the dialogue text of the dialogue act other than the dialogue act A is d.

そして、対話行為Aの対話テキストでの文末表現Bの出現比率a/(a+c)が、対話行為A以外の対話行為の対話テキストでの文末表現Bの出現比率b/(b+d)とほぼ等しい又は小さいようであれば、対数尤度比が小さくなるため、対話行為がAである場合に、文末表現Bが偏って多く使用されるとはいえない。   And the appearance ratio a / (a + c) of the sentence end expression B in the dialogue text of the dialogue action A is substantially equal to the appearance ratio b / (b + d) of the sentence end expression B in the dialogue text of the dialogue action other than the dialogue action A or If it is small, the log-likelihood ratio becomes small, so when the dialogue action is A, it cannot be said that the sentence end expression B is biased and often used.

一方、対話行為Aの対話テキストでの文末表現Bの出現比率a/(a+c)が、対話行為A以外の対話行為の対話テキストでの文末表現Bの出現比率b/(b+d)よりも大きいようであれば、対話尤度比が大きくなるため、対話行為がAである場合に、文末表現Bが偏って多く使用されるといえる。   On the other hand, the appearance ratio a / (a + c) of the sentence end expression B in the dialogue text of the dialogue action A seems to be larger than the appearance ratio b / (b + d) of the sentence end expression B in the dialogue text of the dialogue action other than the dialogue action A. Then, since the dialogue likelihood ratio becomes large, when the dialogue action is A, it can be said that the sentence end expression B is used in a biased manner.

また、本実施の形態では、偏って多く使用される文末表現の抽出には対数尤度比検定を用いたが、tスコアやカイ二乗値など、出現比率の比較に用いられる指標ならどのような指標を用いてもよい。次に、ここで抽出された文末表現を上記図2の文末表現リスト内の文末表現と対応付け、上記図3の対話行為リスト内の対話行為の種類毎に、文末表現の直前に接続可能な形態素と文末表現の品詞とを取得し、対数尤度比と合せてリスト化し、上記図4に示す特徴的文末表現候補リストを生成する。上記図4は、対話行為毎の特徴的な文末表現、文末表現の品詞、文末表現の直前の形態素の品詞、及び対数尤度比(スコア)のリストである、特徴的文末表現候補リストの一例である。なお、対数尤度比が、対話行為の種類が付与された対話テキストにおける文末表現の出現比率と、異なる対話行為の種類が付与された対話テキストにおける文末表現の出現比率との比較結果の一例である。   In this embodiment, the log likelihood ratio test is used to extract the end-of-sentence expression that is often used in a biased manner. However, any index that is used for comparison of appearance ratios such as t-score and chi-square value can be used. An indicator may be used. Next, the sentence ending expression extracted here is associated with the sentence ending expression in the sentence ending expression list of FIG. 2, and each type of dialogue action in the dialogue action list of FIG. 3 can be connected immediately before the sentence ending expression. The morpheme and the part of speech of the sentence ending expression are acquired, listed together with the log likelihood ratio, and the characteristic sentence ending expression candidate list shown in FIG. 4 is generated. FIG. 4 is an example of a characteristic sentence ending expression candidate list that is a list of characteristic sentence ending expressions for each dialogue action, part of speech of sentence ending expressions, parts of speech of morphemes immediately before the sentence ending expression, and log likelihood ratio (score). It is. Note that the log-likelihood ratio is an example of a comparison result between the appearance ratio of the sentence end expression in the dialogue text with the dialogue action type and the appearance ratio of the sentence end expression in the dialogue text with the different dialogue action type. is there.

ここで、対話行為付与済テキストデータベース20に格納された対話テキストから文末表現を取得しただけでは、動詞語幹:ラ行五段の特殊形(「おっしゃ(る)」等)のように対話テキスト中の出現頻度が比較的低い品詞について、接続可能な文末表現のリストが不足してしまうという問題が起こる。これを解決するために、活用型に応じた活用語尾の変形による文末表現の拡張が必要となる。   Here, if the end-of-sentence expression is acquired from the dialogue text stored in the dialogue act-added text database 20, the verb stem: in the dialogue text as in the special form of “La line 5” (“Ossha (ru)”, etc.) There is a problem that the list of connectable sentence ending expressions is insufficient for parts of speech whose appearance frequency is relatively low. In order to solve this problem, it is necessary to expand the sentence ending expression by changing the ending of the usage in accordance with the usage type.

文末表現拡張部28は、特徴的文末表現抽出部26によって生成された特徴的文末表現候補リストに基づいて、対話行為の種類毎に、特徴的文末表現抽出部26によって抽出された当該対話行為の種類を表現するための文末表現の各々に対して、文末表現の活用語尾を変化させて、当該対話行為の種類を表現するための文末表現として、活用型が異なる複数の文末表現を生成する。   The sentence end expression expansion unit 28, based on the characteristic sentence end expression extraction list generated by the characteristic sentence end expression extraction unit 26, for each type of dialogue action, extracts the dialogue action extracted by the characteristic sentence end expression extraction unit 26. For each of the sentence ending expressions for expressing the type, the ending ending of the sentence ending expression is changed to generate a plurality of sentence ending expressions having different utilization types as the sentence ending expression for expressing the type of the dialogue action.

具体的には、文末表現拡張部28は、上記図4の特徴的文末表現候補リストと、図5に示すような予め用意された動詞・形容詞の活用語尾リストとに基づいて、動詞・形容詞に接続可能な文末表現について、文末表現の活用語尾を変化させることにより、活用型の異なる他の動詞・形容詞にも接続できるよう、文末表現を拡張して、複数の文末表現を生成する。そして、文末表現拡張部28は、図6に示すように、活用型に応じて拡張された対話行為毎の特徴的な文末表現、文末表現の品詞、文末表現の直前の形態素の品詞、及び対数尤度比の組み合わせのリストである活用型拡張文末表現リストを生成する。   Specifically, the sentence ending expression expansion unit 28 converts the verb / adjective verb into an adjective based on the characteristic sentence ending expression candidate list in FIG. 4 and a verb / adjective ending list prepared in advance as shown in FIG. For connectable sentence ending expressions, the sentence ending expression is expanded so that it can be connected to other verbs and adjectives with different utilization types by changing the ending of the sentence ending expression, thereby generating a plurality of sentence ending expressions. Then, as shown in FIG. 6, the sentence ending expression extension unit 28 has a characteristic sentence ending expression for each dialogue action expanded according to the utilization type, a part of speech of the sentence ending expression, a part of speech of the morpheme immediately before the sentence ending expression, and a logarithm. A utilization type extended sentence ending expression list which is a list of likelihood ratio combinations is generated.

なお、本実施の形態では、拡張された文末表現の対数尤度比(各対話行為における偏りを表すスコア)は対話テキストから抽出された文末表現に付与されているスコアよりも低い値(=5)を一律で付与したが、スコアの設定は何でもよい。また、上記図6に示す活用型拡張文末表現リストは、上記図4の特徴的文末表現候補リストに対して追加されるリストの一部を示している。   In the present embodiment, the log likelihood ratio of the expanded sentence end expression (score representing the bias in each dialogue act) is lower than the score given to the sentence end expression extracted from the dialogue text (= 5). ) Is given uniformly, but the score can be set to anything. The utilization-type extended sentence ending expression list shown in FIG. 6 shows a part of the list added to the characteristic sentence ending expression candidate list shown in FIG.

不要文末表現フィルタ部30は、文末表現拡張部28によって生成された活用型拡張文末表現リストに基づいて、対話行為の種類毎に、当該対話行為の種類を表現するための文末表現から、予め定められた言いさし表現、及び予め定められた文脈に依存する表現の少なくとも一方を含む文末表現を削除して、当該対話行為の種類を表現するための文末表現を出力する。   The unnecessary sentence ending expression filter unit 30 determines in advance from the sentence ending expression for expressing the type of interactive action for each type of interactive action based on the utilization-type extended sentence ending expression list generated by the sentence end expression extending unit 28. A sentence ending expression including at least one of the given saying expression and an expression depending on a predetermined context is deleted, and a sentence ending expression for expressing the type of the dialogue action is output.

具体的には、不要文末表現フィルタ部30は、文末表現拡張部28によって生成された上記図6の活用型拡張文末表現リストに基づいて、言いさし表現が末尾にくる文末表現や、文脈なしに文意が解釈できない表現は除外し、不要な文末表現が除去された対話行為毎の特徴的な文末表現、文末表現の品詞、文末表現の直前の形態素の品詞、及び対数尤度比の組み合わせのリストである、対話行為毎の特徴的文末表現リストを生成する。   Specifically, the unnecessary sentence ending expression filter unit 30 is based on the utilization-type extended sentence ending expression list of FIG. Is a combination of a characteristic sentence ending expression for each dialogue act from which unnecessary sentence ending expressions are removed, part of speech of the sentence ending expression, part of speech of the morpheme immediately before the sentence ending expression, and log likelihood ratio A characteristic end-of-sentence expression list for each dialogue action is generated.

例えば、人間同士の対話では、「〜ですけど。」「〜ので。」のような言いさし表現が頻出する(特に「情報提供」や「自己開示_事実」)。人間同士ならば、文末を言い切らない曖昧な表現であっても対話が成立するが、システムとの対話の場合は、システム発話が継続中であるかのような印象を与えることを避けるため、本実施の形態では言いさし表現(「連用」「連体」「接続」を含む品詞(活用形))をリストから除外する。また、文脈に依存する表現は、不適切な文脈で出現すると文意が解釈できずコミュニケーションを破たんさせる恐れがあるため、文脈に依存する表現も除外する。本実施の形態では、直後や限定を表す「ばかりです」、並列・列挙を表す「とかです」、二つ以上あるもののうちの一つを取り上げたり、どちらかと言えばこちらの部類だという意味を表す「方です」等を、文脈に依存する表現として除外する。その他、対象とする対話システムのドメインや用途に応じて、不適切な文末表現または除外したい文末表現があれば、不要な文末表現として予め用意しておき、文字列マッチング等により、不要文末表現フィルタ部30において除外することが可能である。どのような文末表現を除外し、どのような文末表現を残すかは、目的次第で変更してもよい。   For example, in human-to-human conversations, sayings such as “~ Is.” “~ So.” Appear frequently (especially “information provision” and “self-disclosure_facts”). For humans, conversations can be established even with ambiguous expressions that do not end the sentence, but in the case of dialogue with the system, in order to avoid giving the impression that the system utterance is ongoing, In this embodiment, saying expressions (parts of speech including “continuous use”, “joint”, and “connection”) are excluded from the list. In addition, expressions that depend on the context are also excluded because they can not interpret the meaning of the sentence if they appear in an inappropriate context, which may disrupt communication. In the present embodiment, “just” that represents immediately after or limited, “or something” that represents parallel / enumeration, one of two or more things, or rather, this means that it is this category The expression “is” is excluded as a context-dependent expression. In addition, if there is an inappropriate sentence ending expression or a sentence ending expression that you want to exclude depending on the domain and application of the target dialogue system, prepare it as an unnecessary sentence ending expression in advance, and use an unnecessary sentence ending expression filter by character string matching etc. It can be excluded in the section 30. What kind of sentence ending expression is excluded and what kind of sentence ending expression is left may be changed depending on the purpose.

対話行為毎の特徴的文末表現リストデータベース3には、不要文末表現フィルタ部30によって生成された、対話行為毎の特徴的文末表現リストが格納される。   The characteristic sentence ending expression list database 3 for each dialogue action stores a characteristic sentence ending expression list for each dialogue action generated by the unnecessary sentence ending expression filter unit 30.

<文末表現変換装置のシステム構成>
本実施の形態に係る文末表現変換装置200は、文末表現変換対象のテキスト、及び変換後のテキストが表すように指定された対話行為の種類を入力として受け取り、入力されたテキストの文末表現を、指定された対話行為の種類を特徴づける文末表現で置換して出力する。
<System configuration of sentence ending expression conversion device>
The sentence ending expression conversion apparatus 200 according to the present embodiment receives as input the text to be converted to the sentence ending expression and the type of dialogue action designated to be expressed by the converted text, and the sentence ending expression of the input text is Replace with the end-of-sentence characterizing the specified type of dialogue action and output.

本実施の形態に係る文末表現変換装置200は、CPUと、RAMと、後述する文末表現変換処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成される。このコンピュータは、機能的には、図7に示すように、入力部4と、対話行為毎の特徴的文末表現リストデータベース5と、演算部6と、出力部7とを含んだ構成で表すことができる。以下、各部について詳述する。   The sentence ending expression conversion apparatus 200 according to the present embodiment is configured by a computer including a CPU, a RAM, and a ROM that stores a program for executing a sentence ending expression conversion processing routine described later. As shown in FIG. 7, this computer is functionally represented by a configuration including an input unit 4, a characteristic sentence ending expression list database 5 for each dialogue action, a calculation unit 6, and an output unit 7. Can do. Hereinafter, each part is explained in full detail.

入力部4は、文末表現変換対象のテキストと、当該テキストの発話の意図を表す対話行為の種類を受け付ける。なお、テキストは、1つ以上の文を含む文書である。また、文末表現変換対象のテキストの発話の意図を表す対話行為の種類は、ユーザ等によって予め指定される。   The input unit 4 accepts the text to be converted to the sentence ending expression and the type of dialogue act representing the intention of the utterance of the text. The text is a document including one or more sentences. Also, the type of dialogue act representing the intention of utterance of the text to be converted to the sentence end expression is designated in advance by the user or the like.

対話行為毎の特徴的文末表現リストデータベース5には、文末表現抽出装置100の対話行為毎の特徴的文末表現リストデータベース3に格納されている対話行為毎の特徴的文末表現リストと同じ対話行為毎の特徴的文末表現リストが格納される。   In the characteristic sentence ending expression list database 5 for each dialogue action, each dialogue action same as the characteristic sentence ending expression list for each dialogue action stored in the characteristic sentence ending expression list database 3 for each dialogue action of the sentence ending expression extraction device 100 is stored. A characteristic end-of-sentence expression list is stored.

演算部6は、文末表現抽出部60と、文末表現候補生成部62と、文末表現変換部64とを備えている。   The calculation unit 6 includes a sentence end expression extraction unit 60, a sentence end expression candidate generation unit 62, and a sentence end expression conversion unit 64.

文末表現抽出部60は、入力部4により受け付けた文末表現変換対象のテキストから、文末表現及び当該文末表現の直前に出現する形態素の品詞を抽出する。具体的には、文末表現抽出部60は、文末表現抽出装置100の文末表現抽出部24と同様に、入力部4により受け付けたテキストを形態素解析し、文末から見て初出の内容語より後ろの形態素列を文末表現として抽出すると共に、当該文末表現の直前に出現する形態素の品詞を抽出する。   The sentence end expression extraction unit 60 extracts the sentence end expression and the morpheme part of speech that appears immediately before the sentence end expression from the text of the sentence end expression conversion target received by the input unit 4. Specifically, the sentence end expression extraction unit 60 performs a morphological analysis on the text received by the input unit 4 in the same manner as the sentence end expression extraction unit 24 of the sentence end expression extraction device 100, and after the first appearing content word as seen from the end of the sentence. The morpheme string is extracted as a sentence end expression, and the part of speech of the morpheme that appears immediately before the sentence end expression is extracted.

文末表現候補生成部62は、対話行為毎の特徴的文末表現リストデータベース5に格納された、指定された対話行為の特徴的文末表現リストにおける、文末表現の直前に出現する形態素の品詞と、文末表現抽出部60によって抽出された文末表現の直前の形態素の品詞とを照合する。そして、文末表現候補生成部62は、指定された対話行為の特徴的文末表現リストから、文末表現抽出部60によって抽出された文末表現の直前の形態素の品詞に対応する、指定された対話行為の種類を表現するための文末表現を、文末表現の変換候補として抽出し、抽出された文末表現からなる変換候補リストを生成する。   The sentence ending expression candidate generation unit 62 stores the part of speech of the morpheme that appears immediately before the sentence ending expression in the characteristic sentence ending expression list of the specified dialogue action stored in the characteristic sentence ending expression list database 5 for each dialogue action, The part of speech of the morpheme immediately before the sentence end expression extracted by the expression extraction unit 60 is collated. Then, the sentence end expression candidate generation unit 62 selects the specified dialogue action corresponding to the morphological part of speech immediately before the sentence end expression extracted by the sentence end expression extraction unit 60 from the characteristic sentence end expression list of the specified dialogue action. A sentence end expression for expressing the type is extracted as a conversion candidate for the sentence end expression, and a conversion candidate list composed of the extracted sentence end expressions is generated.

本実施の形態では、文末表現候補生成部62は、予め定められた、図8に示すような「否定」「完了」を表す形態素列のリストを用いて、文末表現変換対象のテキスト、及び変換候補となる文末表現に「否定」「完了」を表す形態素列が含まれているかを照合する。照合の結果、文末表現変換対象のテキストの文末表現に「否定」又は「完了」を表す形態素列が含まれていた場合は、抽出された文末表現の変換候補のうち、「否定」又は「完了」を表す形態素列が含まれる文末表現のみを変換候補リストに含めることとする。これは、事実性(ある事象が既に起こったのか、現実には起きない・起きなかったのか)が変更されないようにするための処理である。ただし、事実性の変化に配慮しない場合は、「否定」「完了」を表す形態素列の照合は不要である。   In the present embodiment, the sentence ending expression candidate generation unit 62 uses a predetermined list of morpheme strings representing “No” and “Done” as shown in FIG. It is verified whether the candidate sentence ending expression includes a morpheme string representing “Negation” or “Done”. As a result of the collation, if the sentence end expression of the text to be converted to the sentence end expression contains a morpheme string indicating “Negative” or “Complete”, “Negated” or “Completed” of the extracted sentence end expression conversion candidates Only a sentence ending expression including a morpheme string representing “” is included in the conversion candidate list. This is a process to prevent the factuality (whether a certain event has already occurred or did not actually occur) from being changed. However, when not considering the change in fact, it is not necessary to collate morpheme strings representing “denial” and “complete”.

例えば、「富士山に登らない」という文が、文末表現変換対象のテキストとして入力された場合、文末表現は「ら_ない」であり、直前の形態素の品詞は「動詞語幹:ラ行五段」(登)となる。文末表現に含まれる「ない」が「否定」を表す形態素であるため、文末表現の変換候補のうち、「動詞語幹:ラ行五段」に接続することができ、かつ「否定」を表す形態素を含む文末表現のみが、変換候補リストに含まれる(図9参照)。   For example, if the sentence “Do not climb Mt. Fuji” is input as the text to be converted to the sentence ending expression, the sentence ending expression is “ra_no”, and the part of speech of the immediately preceding morpheme is “verb stem: La line five steps”. (Climbing). Since `` None '' included in the sentence end expression is a morpheme representing `` Negation '', among the conversion candidates of the sentence end expression, it can be connected to `` Verb stem: La line 5 Dan '' and morpheme representing `` Negation '' Only the sentence ending expression including “” is included in the conversion candidate list (see FIG. 9).

なお、文末表現変換対象のテキストに「否定」「完了」を表す形態素が含まれなくても、オプションの引数として「否定」または「完了」を与えることができるようにしてもよい。例えば、指定された対話行為の種類(「自己開示_経験」)とオプションとしての引数(「否定」、「完了」)が入力された場合には、「否定」、「完了」を表す形態素を含む「自己開示_経験」の文末表現のみから構成される、上記図9のような変換候補リストを作成するようにしてもよい。   It should be noted that “negative” or “complete” may be given as an optional argument even if a morpheme indicating “negative” or “complete” is not included in the text to be converted to the sentence end expression. For example, when the specified dialogue action type (“self-disclosure_experience”) and optional arguments (“denial”, “complete”) are entered, morphemes representing “denial” and “complete” are entered. The conversion candidate list as shown in FIG. 9 may be created that includes only the sentence ending expression of “self-disclosure_experience”.

文末表現変換部64は、文末表現候補生成部62によって生成された変換候補リストを用いて、文末表現変換対象のテキストに含まれる文末表現を、指定された対話行為の種類を表現するための文末表現に変換する。   The sentence ending expression conversion unit 64 uses the conversion candidate list generated by the sentence ending expression candidate generation unit 62 to convert the sentence ending expression included in the sentence ending expression conversion target text to the specified type of dialogue action. Convert to expression.

具体的には、文末表現変換部64は、指定された対話行為の種類の特徴的文末表現リストに含まれる対数尤度比(スコア)に基づいて、上記図9のような文末表現の変換候補のリストの中から、最も対数尤度比(スコア)が高い文末表現を選択し、変換前の入力テキストの文末表現より前の形態素列と結合して出力する。   Specifically, the sentence ending expression conversion unit 64 is based on the log likelihood ratio (score) included in the characteristic sentence ending expression list of the specified dialogue action type, and the sentence ending expression conversion candidate as shown in FIG. From the list, a sentence ending expression having the highest log likelihood ratio (score) is selected, combined with the morpheme string before the sentence ending expression of the input text before conversion, and output.

例えば、「富士山に登る」という入力テキストを「自己開示_経験」(「否定」「完了」を含む)を表すテキストに変換する場合、上記図9に示される変換候補の中から、対数尤度比(スコア)が最も高い「っ_た_こと_な_いです」という文末表現を選択し、「富士山に登ったことないです」という変換後のテキストを出力する。なお、変換後のテキストを表示する数を指定し、スコアの上位N件までの変換結果を表示してもよい。また、スコアの上位N件までの変換結果の中から、一つの変換結果をランダムに選択し、選択された変換結果を出力するようにしてもよい。   For example, when the input text “Climbing Mt. Fuji” is converted into a text representing “self-disclosure_experience” (including “denial” and “complete”), the log likelihood is selected from the conversion candidates shown in FIG. Select the sentence ending expression “T_______________” with the highest ratio (score), and output the converted text “I have never climbed Mt. Fuji”. Note that the number of display of converted text may be specified, and conversion results up to the top N scores may be displayed. Alternatively, one conversion result may be randomly selected from the conversion results up to the top N scores, and the selected conversion result may be output.

出力部7は、文末表現変換部64によって出力された、文末表現変換後のテキストを結果として出力する。   The output unit 7 outputs the text after the sentence end expression conversion output by the sentence end expression conversion unit 64 as a result.

<文末表現抽出装置の作用>
次に、本実施の形態に係る文末表現抽出装置100の作用について説明する。文末表現抽出装置100に、各々対話行為の種類が付与された複数の対話テキストが入力されると、リスト生成用入力部1によって、入力された複数の対話テキストが、対話行為付与済テキストデータベース20へ格納される。そして、文末表現抽出装置100によって、図10に示すリスト生成処理ルーチンが実行される。
<Operation of sentence end expression extraction device>
Next, the operation of the sentence end expression extraction apparatus 100 according to the present embodiment will be described. When a plurality of dialogue texts each assigned with a type of dialogue action are input to the sentence end expression extraction device 100, the plurality of dialogue texts input by the list generation input unit 1 are converted into a dialogue act-added text database 20. Stored in Then, the list generation processing routine shown in FIG.

まず、ステップS100において、文末表現抽出部24によって、対話行為付与済テキストデータベース20に格納された複数の対話テキストの各々について、当該対話テキストから、文末表現を抽出し、文末表現リストを生成する。また、ステップS100において、文末表現抽出部24によって、対話行為付与済テキストデータベース20に格納された対話テキストに付与されている対話行為の種類に基づいて、各文末表現に対応する対話行為の種類を示す対話行為リストを生成する。   First, in step S100, the sentence end expression extraction unit 24 extracts the sentence end expression from the dialog text for each of the plurality of dialog texts stored in the interactive action granted text database 20, and generates a sentence end expression list. In step S100, the type of conversation act corresponding to each sentence end expression is determined by the sentence end expression extraction unit 24 based on the type of dialogue action assigned to the dialog text stored in the dialogue act-added text database 20. Generate a dialogue action list to show.

ステップS102において、特徴的文末表現抽出部26によって、上記ステップS100で生成された文末表現リストと上記ステップS100で生成された対話行為リストとに基づいて、対話行為の種類毎に、当該対話行為に偏って多く使用される文末表現を抽出し、当該対話行為の種類に対する特徴的文末表現候補リストを生成する。   In step S102, based on the sentence ending expression list generated in step S100 and the dialogue action list generated in step S100, the interactive sentence expression extracting unit 26 executes the dialogue action for each type of dialogue action. An end-of-sentence expression that is heavily used is extracted, and a characteristic end-of-sentence expression candidate list for the type of dialogue action is generated.

ステップS104において、文末表現拡張部28によって、対話行為の種類毎に、上記ステップS102で生成された当該対話行為の種類に対する特徴的文末表現候補リストと、予め用意された動詞・形容詞の活用語尾リストとに基づいて、動詞・形容詞に接続可能な文末表現の各々について、文末表現を拡張して、複数の文末表現を生成し、当該対話行為の種類に対する活用型拡張文末表現リストを生成する。   In step S104, for each type of dialogue action, the sentence ending expression extension unit 28 generates a characteristic sentence ending expression candidate list for the type of dialogue action generated in step S102 and a verb / adjective ending list prepared in advance. Based on the above, for each of the sentence end expressions connectable to the verb / adjective, the sentence end expression is expanded to generate a plurality of sentence end expressions, and a utilization-type extended sentence end expression list for the type of dialogue action is generated.

ステップS106において、不要文末表現フィルタ部30によって、対話行為の種類毎に、上記ステップS104で生成された活用型拡張文末表現リストから、言いさし表現が末尾にくる文末表現や、文脈なしに文意が解釈できない表現は除外し、当該対話行為の種類に対する特徴的文末表現リストを生成する。   In step S106, the unnecessary sentence ending expression filter unit 30 creates a sentence ending expression with the wording expression at the end or a sentence without context from the utilization-type extended sentence ending expression list generated in step S104 for each type of dialogue action. Expressions that cannot be interpreted are excluded, and a characteristic sentence ending expression list for the type of dialogue action is generated.

ステップS108において、上記ステップS106で生成された、対話行為毎の特徴的文末表現リストを、対話行為毎の特徴的文末表現リストデータベース3に格納して、リスト生成処理ルーチンを終了する。   In step S108, the characteristic sentence ending expression list for each dialogue action generated in step S106 is stored in the characteristic sentence ending expression list database 3 for each dialogue action, and the list generation processing routine ends.

<文末表現変換装置の作用>
次に、本実施の形態に係る文末表現変換装置200の作用について説明する。まず、文末表現抽出装置100の対話行為毎の特徴的文末表現リストデータベース3に記憶されている対話行為毎の特徴的文末表現リストが、文末表現変換装置200に入力されると、対話行為毎の特徴的文末表現リストデータベース5に格納される。そして、文末表現変換対象としてのテキストと、当該テキストの発話の意図を表す指定された対話行為の種類とが、文末表現変換装置200に入力されると、文末表現変換装置200によって、図11に示す文末表現変換処理ルーチンが実行される。
<Operation of sentence ending expression converter>
Next, the operation of the sentence ending expression conversion apparatus 200 according to the present embodiment will be described. First, when the characteristic sentence ending expression list for each interactive action stored in the characteristic sentence ending expression list database 3 for each interactive action of the sentence ending expression extraction device 100 is input to the sentence ending expression conversion device 200, It is stored in the characteristic sentence end expression list database 5. Then, when the text as the sentence ending expression conversion target and the specified type of dialogue action indicating the intention of the utterance of the text are input to the sentence ending expression conversion apparatus 200, the sentence ending expression conversion apparatus 200 causes the sentence ending expression conversion apparatus 200 to display FIG. The sentence end expression conversion processing routine shown is executed.

まず、ステップS200において、入力部4によって、文末表現変換対象のテキストと、指定された対話行為の種類を受け付ける。   First, in step S200, the input unit 4 accepts the text to be converted to the sentence ending expression and the specified type of dialogue action.

ステップS202において、文末表現抽出部60によって、上記ステップS200で受け付けた文末表現変換対象のテキストから、文末表現及び当該文末表現の直前に出現する形態素の品詞を抽出する。   In step S202, the sentence ending expression extraction unit 60 extracts the sentence ending expression and the morpheme part of speech that appears immediately before the sentence ending expression from the sentence ending expression conversion target text received in step S200.

ステップS204において、文末表現候補生成部62によって、対話行為毎の特徴的文末表現リストデータベース5に格納された、上記ステップS200で受け付けた対話行為の種類の特徴的文末表現リストにおける、文末表現の直前に出現する形態素の品詞と、上記ステップS202で抽出された文末表現の直前の形態素の品詞とを照合する。そして、ステップS204において、文末表現候補生成部62によって、上記ステップS200で受け付けた対話行為の種類の特徴的文末表現リストから、上記ステップS202で抽出された文末表現の直前の形態素の品詞に対応する、指定された対話行為の種類を表現するための文末表現を、文末表現の変換候補として抽出し、抽出された文末表現からなる変換候補リストを生成する。   In step S204, immediately before the sentence ending expression in the characteristic sentence ending expression list of the type of dialogue action accepted in step S200 stored in the characteristic sentence ending expression list database 5 for each dialogue action by the sentence ending expression candidate generation unit 62. Is compared with the part of speech of the morpheme immediately preceding the sentence end expression extracted in step S202. Then, in step S204, the sentence ending expression candidate generation unit 62 corresponds to the part of speech of the morpheme immediately before the sentence ending expression extracted in step S202 from the characteristic sentence ending expression list of the type of dialogue act accepted in step S200. Then, a sentence end expression for expressing the specified type of dialogue action is extracted as a conversion candidate for the sentence end expression, and a conversion candidate list including the extracted sentence end expressions is generated.

ステップS206によって、文末表現変換部64によって、上記ステップS204で生成された変換候補リストを用いて、文末表現変換対象のテキストに含まれる文末表現を、指定された対話行為の種類を表現するための文末表現に変換する。   In step S206, the sentence end expression conversion unit 64 uses the conversion candidate list generated in step S204 to express the sentence end expression included in the sentence end expression conversion target text to the specified type of dialogue action. Convert to end of sentence expression.

ステップS208によって、出力部7は、上記ステップS206で出力された、文末表現変換後のテキストを結果として出力する。   In step S208, the output unit 7 outputs the text after the sentence end expression conversion output in step S206 as a result.

以上説明したように、本実施の形態に係る文末表現抽出装置によれば、対話行為の種類毎に、対話行為の種類が付与された対話テキストから抽出された文末表現から、当該対話行為の種類が付与された対話テキストにおける当該文末表現の出現頻度と、異なる対話行為の種類が付与された対話テキストにおける当該文末表現の出現頻度とに基づいて算出される対数尤度比に基づいて、当該対話行為の種類を表現するための文末表現を抽出することにより、対話行為の種類毎に、対話行為の種類に対応する文末表現を抽出することができる。   As described above, according to the sentence end expression extraction device according to the present embodiment, for each type of dialogue action, the type of dialogue action is extracted from the sentence end expression extracted from the dialogue text to which the type of dialogue action is assigned. Based on the log-likelihood ratio calculated based on the appearance frequency of the sentence end expression in the dialogue text to which is given and the appearance frequency of the sentence end expression in the dialogue text to which a different type of dialogue action is assigned. By extracting the sentence end expression for expressing the type of action, the sentence end expression corresponding to the type of dialog action can be extracted for each type of dialog action.

また、本実施の形態に係る文末表現変換装置によれば、指定された対話行為の種類に対して予め求められた、特徴的文末表現リストと、入力されたテキストから抽出された文末表現の直前の形態素の品詞とを照合し、入力されたテキストから抽出された文末表現の直前の形態素の品詞に対応する、対話行為の種類を表現するための文末表現を、文末表現の変換候補として生成し、生成された文末表現の変換候補を用いて、入力されたテキストに含まれる文末表現を、当該対話行為の種類を表現するための文末表現に変換することにより、入力されたテキストの文末表現を、指定された対話行為の種類に対応する文末表現に変換することができる。   Further, according to the sentence ending expression conversion device according to the present embodiment, the characteristic sentence ending expression list obtained in advance for the specified type of dialogue action and immediately before the sentence ending expression extracted from the input text. The sentence ending expression for expressing the type of dialogue action corresponding to the morpheme part of speech immediately before the sentence ending expression extracted from the input text is generated as a sentence ending expression conversion candidate. Using the generated sentence ending expression conversion candidate, the sentence ending expression included in the input text is converted into a sentence ending expression for expressing the type of dialogue action, thereby converting the sentence ending expression of the input text. , Can be converted into a sentence ending expression corresponding to the specified type of dialogue action.

また、従来、人手で予め用意した発話テンプレートを用いた発話生成では、生成できる発話の種類に限りがあったのに対し、本実施の形態で説明した手法を用いると、文末表現の変換によって任意の発話の対話行為を変化させることができるため、より幅広い種類の発話を生成することが可能となる。   Conventionally, in utterance generation using an utterance template prepared in advance by hand, the types of utterances that can be generated are limited. However, if the method described in this embodiment is used, any utterance generation can be performed by converting the sentence end expression Therefore, it is possible to generate a wider variety of utterances.

また、対話行為が予め付与された対話テキスト(コーパス)から自動的に抽出した情報(1.対話行為を特徴づける文末表現のリスト、2.各文末表現の直前に連接可能な形態素のリスト)を利用することにより、対話行為を特徴づけると考えられる文末表現を人手で抽出することなく、日本語としての文法性を確保したうえで、対話行為を表現可能な発話生成のための文末表現変換が可能になる。   Also, automatically extracted information (1. list of sentence end expressions that characterize the dialog action, 2. list of morphemes that can be connected immediately before each sentence end expression) automatically extracted from the dialogue text (corpus) to which the dialogue actions are given in advance. By using it, it is possible to convert the sentence ending expression for generating utterances that can express the dialogue action, without manually extracting the sentence ending expression that is thought to characterize the dialogue action, while ensuring the Japanese grammar. It becomes possible.

また、人間と対話をするコンピュータ(対話システム)の発話生成をより柔軟にすることが可能となる。テンプレートを用いて発話を生成する従来の対話システムでは、予め定められた発話しかできなかったが、本実施の形態で説明した手法を用いると、任意の発話を指定された対話行為らしく変換することが可能となるため、発話の対話行為を文脈に応じて柔軟に変化させ、対話相手(ユーザ)に提示することが可能となる。   In addition, it is possible to make the utterance generation of a computer (dialog system) that interacts with humans more flexible. In a conventional dialogue system that generates a utterance using a template, a predetermined utterance could not be made. However, if the method described in this embodiment is used, an arbitrary utterance can be converted into a designated dialogue act. Therefore, the dialogue action of the utterance can be flexibly changed according to the context and presented to the conversation partner (user).

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   Note that the present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.

例えば、上記実施の形態では、文末表現抽出装置100と文末表現変換装置200とを別々の装置として構成する場合を例に説明したが、文末表現抽出装置100と文末表現変換装置200とを1つの装置として構成してもよい。   For example, in the above-described embodiment, the case where the sentence end expression extracting apparatus 100 and the sentence end expression converting apparatus 200 are configured as separate devices has been described as an example. However, the sentence end expression extracting apparatus 100 and the sentence end expression converting apparatus 200 are combined into one. You may comprise as an apparatus.

また、文末表現抽出装置100は、対話行為付与済テキストデータベース20、及び対話行為毎の特徴的文末表現リストデータベース3を備えている場合について説明したが、例えば対話行為付与済テキストデータベース20、及び対話行為毎の特徴的文末表現リストデータベース3の少なくとも1つが文末表現抽出装置100の外部装置に設けられ、文末表現抽出装置100は、外部装置と通信手段を用いて通信することにより、対話行為付与済テキストデータベース20、及び対話行為毎の特徴的文末表現リストデータベース3の少なくとも1つを参照するようにしてもよい。   Moreover, although the sentence end expression extraction apparatus 100 demonstrated the case where it provided with the dialogue action provided text database 20 and the characteristic sentence end expression list database 3 for every dialog action, for example, the dialogue action added text database 20 and the dialog At least one of the characteristic sentence ending expression list database 3 for each action is provided in an external device of the sentence ending expression extracting apparatus 100, and the sentence ending expression extracting apparatus 100 has already given a dialogue action by communicating with the external device using a communication means. You may make it refer to at least 1 of the text database 20 and the characteristic sentence end expression list database 3 for every dialog action.

また、同様に、文末表現変換装置200は、対話行為毎の特徴的文末表現リストデータベース5を備えている場合について説明したが、例えば対話行為毎の特徴的文末表現リストデータベース5が文末表現変換装置200の外部装置に設けられ、文末表現変換装置200は、外部装置と通信手段を用いて通信することにより、対話行為毎の特徴的文末表現リストデータベース5を参照するようにしてもよい。   Similarly, the sentence ending expression conversion device 200 has been described as including the characteristic sentence ending expression list database 5 for each dialogue action. For example, the characteristic sentence ending expression list database 5 for each dialogue action is the sentence ending expression conversion device 200. The sentence ending expression conversion apparatus 200 provided in the external apparatus 200 may refer to the characteristic sentence ending expression list database 5 for each dialogue action by communicating with the external device using a communication unit.

上述の文末表現抽出装置100及び文末表現変換装置200は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   The above-mentioned sentence end expression extraction apparatus 100 and sentence end expression conversion apparatus 200 have a computer system inside, but if the “computer system” uses a WWW system, a homepage providing environment (or display) Environment).

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   In the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.

1 リスト生成用入力部
2 リスト生成用演算部
3、5 対話行為毎の特徴的文末表現リストデータベース
4 入力部
6 演算部
7 出力部
20 対話行為付与済テキストデータベース
22 リスト生成部
24 文末表現抽出部
26 特徴的文末表現抽出部
28 文末表現拡張部
30 不要文末表現フィルタ部
60 文末表現抽出部
62 文末表現候補生成部
64 文末表現変換部
DESCRIPTION OF SYMBOLS 1 List generation | occurrence | production part 2 List generation | occurrence | production calculation part 3, 5 Characteristic sentence ending expression list database 4 for every dialogue action 4 Input part 6 Calculation part 7 Output part 20 Text action database 22 list generation part 24 sentence ending expression extraction part 26 Characteristic sentence ending expression extraction part 28 sentence ending expression expansion part 30 unnecessary sentence ending expression filter part 60 sentence ending expression extraction part 62 sentence ending expression candidate generation part 64 sentence ending expression conversion part

Claims (7)

発話の意図を表す対話行為の種類が各々付与された複数の対話テキストの各々について、前記対話テキストから、文末表現を抽出する文末表現抽出部と、
前記対話行為の種類毎に、前記対話行為の種類が付与された前記対話テキストから抽出された文末表現から、前記対話行為の種類が付与された前記対話テキストにおける前記文末表現の出現比率と、前記対話行為の種類と異なる対話行為の種類が付与された前記対話テキストにおける前記文末表現の出現比率との比較結果に基づいて、前記対話行為の種類を表現するための文末表現を抽出する特徴的文末表現抽出部と、
前記対話行為の種類毎に、前記特徴的文末表現抽出部によって抽出された前記対話行為の種類を表現するための文末表現の各々に対して、前記文末表現の活用語尾を変化させて、前記対話行為の種類を表現するための文末表現として、活用型が異なる複数の文末表現を生成する文末表現拡張部と、
を含む文末表現抽出装置。
A sentence ending expression extracting unit for extracting a sentence ending expression from the dialogue text for each of a plurality of dialog texts each provided with a type of dialogue act representing an intention of utterance;
For each type of interactive action, from the sentence end expression extracted from the dialog text to which the type of interactive action is assigned, the appearance ratio of the sentence end expression in the dialog text to which the type of interactive action is assigned, and Characteristic sentence ending that extracts a sentence ending expression for expressing the type of dialogue action based on a comparison result with the appearance ratio of the sentence ending expression in the dialogue text to which a different type of dialogue action is given An expression extractor;
For each type of dialogue action, for each of the sentence ending expressions for expressing the type of dialogue action extracted by the characteristic sentence ending expression extraction unit, the ending ending of the sentence ending expression is changed, and the dialogue As a sentence ending expression for expressing the type of action, a sentence ending expression extension that generates multiple sentence ending expressions with different utilization types,
Sentence ending expression extraction device.
前記対話行為の種類毎に、前記対話行為の種類を表現するための文末表現から、予め定められた言いさし表現、及び予め定められた文脈に依存する表現の少なくとも一方を含む文末表現を削除して、前記対話行為の種類を表現するための文末表現を出力する不要文末表現フィルタ部を更に含む
請求項に記載の文末表現抽出装置。
For each type of dialogue action, the sentence ending expression including at least one of a predetermined wording expression and a predetermined context-dependent expression is deleted from the sentence ending expression for expressing the type of dialogue action. The sentence ending expression extraction device according to claim 1 , further comprising an unnecessary sentence ending expression filter unit that outputs a sentence ending expression for expressing the type of the dialogue action.
入力されたテキストから、文末表現及び前記文末表現の直前に出現する形態素の品詞を抽出する文末表現抽出部と、
指定された発話の意図を表す対話行為の種類に対して予め求められた、前記対話行為の種類を表現するための文末表現と前記文末表現の直前に出現する形態素の品詞との組み合わせのリストと、前記文末表現抽出部によって抽出された前記文末表現の直前の形態素の品詞とを照合し、前記文末表現抽出部によって抽出された前記文末表現の直前の形態素の品詞に対応する、前記対話行為の種類を表現するための文末表現を、文末表現の変換候補として生成する文末表現候補生成部と、
前記文末表現候補生成部によって生成された文末表現の変換候補を用いて、前記入力されたテキストに含まれる文末表現を、前記対話行為の種類を表現するための文末表現に変換する文末表現変換部と、
を含む文末表現変換装置。
A sentence end expression extracting unit that extracts a sentence end expression and a morpheme part of speech that appears immediately before the sentence end expression from the input text;
A list of combinations of a sentence end expression for expressing the type of dialogue action and a morpheme part of speech that appears immediately before the sentence end expression, obtained in advance for the type of dialogue action representing the intention of the specified utterance; , Matching the part of speech of the morpheme immediately preceding the sentence end expression extracted by the sentence end expression extracting unit, and corresponding to the part of speech of the morpheme immediately preceding the sentence end expression extracted by the sentence end expression extracting unit. A sentence ending expression generation unit for generating a sentence ending expression for expressing the type as a sentence ending expression conversion candidate;
A sentence ending expression conversion unit that converts a sentence ending expression included in the input text into a sentence ending expression for expressing the type of dialogue action using a sentence ending expression conversion candidate generated by the sentence ending expression candidate generation unit. When,
Sentence ending expression conversion device.
文末表現抽出部、特徴的文末表現抽出部、及び文末表現拡張部を含む文末表現抽出装置における文末表現抽出方法であって、
前記文末表現抽出部によって、発話の意図を表す対話行為の種類が各々付与された複数の対話テキストの各々について、前記対話テキストから、文末表現を抽出するステップと、
前記特徴的文末表現抽出部によって、前記対話行為の種類毎に、前記対話行為の種類が付与された前記対話テキストから抽出された文末表現から、前記対話行為の種類が付与された前記対話テキストにおける前記文末表現の出現比率と、前記対話行為の種類と異なる対話行為の種類が付与された前記対話テキストにおける前記文末表現の出現比率との比較結果に基づいて、前記対話行為の種類を表現するための文末表現を抽出するステップと、
前記文末表現拡張部によって、前記対話行為の種類毎に、前記特徴的文末表現抽出部によって抽出された前記対話行為の種類を表現するための文末表現の各々に対して、前記文末表現の活用語尾を変化させて、前記対話行為の種類を表現するための文末表現として、活用型が異なる複数の文末表現を生成するステップと、
を含む文末表現抽出方法。
Sentence end expression extraction unit, features specific sentence end expression extraction unit, and a sentence end expression extracting method in the sentence end expression extraction device including a sentence end expressions extension,
Extracting a sentence ending expression from the dialogue text for each of a plurality of dialogue texts each provided with a kind of dialogue act representing an intention of speech by the sentence ending expression extraction unit;
In the dialog text to which the type of interactive action is given from the sentence end expression extracted from the dialog text to which the type of interactive action is given by the characteristic sentence ending expression extraction unit for each type of interactive action In order to express the type of dialogue action based on the comparison result between the appearance ratio of the sentence end expression and the appearance ratio of the sentence end expression in the dialogue text to which the type of dialogue action different from the type of dialogue action is given. Extracting the sentence end expression of
For each type of dialogue action by the sentence ending expression extension unit, for each sentence ending expression for expressing the type of dialogue action extracted by the characteristic sentence ending expression extraction unit, the ending ending of the sentence ending expression is used. And generating a plurality of sentence ending expressions having different utilization types as sentence ending expressions for expressing the types of dialogue actions,
Sentence ending expression extraction method.
文末表現抽出部、文末表現候補生成部、及び文末表現変換部を含む文末表現変換装置における文末表現変換方法であって、
前記文末表現抽出部によって、入力されたテキストから、文末表現及び前記文末表現の直前に出現する形態素の品詞を抽出するステップと、
前記文末表現候補生成部によって、指定された発話の意図を表す対話行為の種類に対して予め求められた、前記対話行為の種類を表現するための文末表現と前記文末表現の直前に出現する形態素の品詞との組み合わせのリストと、前記文末表現抽出部によって抽出された前記文末表現の直前の形態素の品詞とを照合し、前記文末表現抽出部によって抽出された前記文末表現の直前の形態素の品詞に対応する、前記対話行為の種類を表現するための文末表現を、文末表現の変換候補として生成するステップと、
前記文末表現変換部によって、前記文末表現候補生成部によって生成された文末表現の変換候補を用いて、前記入力されたテキストに含まれる文末表現を、前記対話行為の種類を表現するための文末表現に変換するステップと、
を含む文末表現変換方法。
A sentence ending expression conversion method in a sentence ending expression conversion device including a sentence ending expression extraction unit, a sentence ending expression candidate generation unit, and a sentence ending expression conversion unit,
A step of extracting from the input text the sentence end expression and the part of speech of the morpheme that appears immediately before the sentence end expression from the input text;
The sentence ending expression for expressing the type of dialogue action and the morpheme appearing immediately before the sentence ending expression, which are obtained in advance by the sentence ending expression candidate generation unit for the type of dialogue action representing the intention of the designated utterance. The list of combinations with the part-of-speech parts is compared with the part-of-speech of the morpheme immediately before the sentence-end expression extracted by the sentence-end expression extraction unit by comparing the list of combinations with the part-of-speech expression extraction unit Generating a sentence ending expression for expressing the type of dialogue action corresponding to
The sentence ending expression for expressing the type of the dialogue act on the sentence ending expression included in the input text by using the sentence ending expression conversion candidate generated by the sentence ending expression candidate generating unit by the sentence ending expression conversion unit. Converting to
Sentence ending expression conversion method including.
コンピュータを、請求項1又は請求項2に記載の文末表現抽出装置の各部として機能させるためのプログラム。 The program for functioning a computer as each part of the sentence end expression extraction apparatus of Claim 1 or Claim 2 . コンピュータを、請求項記載の文末表現変換装置の各部として機能させるためのプログラム。 The program for functioning a computer as each part of the sentence-end expression conversion apparatus of Claim 3 .
JP2013207266A 2013-10-02 2013-10-02 End-of-sentence extraction device, end-of-sentence conversion device, method, and program Active JP5872516B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013207266A JP5872516B2 (en) 2013-10-02 2013-10-02 End-of-sentence extraction device, end-of-sentence conversion device, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013207266A JP5872516B2 (en) 2013-10-02 2013-10-02 End-of-sentence extraction device, end-of-sentence conversion device, method, and program

Publications (2)

Publication Number Publication Date
JP2015072555A JP2015072555A (en) 2015-04-16
JP5872516B2 true JP5872516B2 (en) 2016-03-01

Family

ID=53014888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013207266A Active JP5872516B2 (en) 2013-10-02 2013-10-02 End-of-sentence extraction device, end-of-sentence conversion device, method, and program

Country Status (1)

Country Link
JP (1) JP5872516B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6499555B2 (en) * 2015-09-07 2019-04-10 日本電信電話株式会社 Rewrite rule creation support device, method, and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108568A (en) * 2001-09-26 2003-04-11 Communication Research Laboratory Sentence classifying method and device

Also Published As

Publication number Publication date
JP2015072555A (en) 2015-04-16

Similar Documents

Publication Publication Date Title
US9330659B2 (en) Facilitating development of a spoken natural language interface
US10936664B2 (en) Dialogue system and computer program therefor
US10037758B2 (en) Device and method for understanding user intent
US9740677B2 (en) Methods and systems for analyzing communication situation based on dialogue act information
KR102316063B1 (en) Method and apparatus for identifying key phrase in audio data, device and medium
US20130282381A1 (en) Methods and systems for speech-enabling a human-to-machine interface
TWI698857B (en) Speech recognition system and method thereof, and computer program product
KR101627428B1 (en) Method for establishing syntactic analysis model using deep learning and apparatus for perforing the method
KR101677859B1 (en) Method for generating system response using knowledgy base and apparatus for performing the method
Adel et al. Features for factored language models for code-Switching speech.
Roark et al. Reranking for sentence boundary detection in conversational speech
KR101409413B1 (en) Method for natural language processing using unification grammar
JP5231484B2 (en) Voice recognition apparatus, voice recognition method, program, and information processing apparatus for distributing program
JP5722375B2 (en) End-of-sentence expression conversion apparatus, method, and program
JP5872516B2 (en) End-of-sentence extraction device, end-of-sentence conversion device, method, and program
Yoo et al. Speech-act classification using a convolutional neural network based on pos tag and dependency-relation bigram embedding
JP5954836B2 (en) Ununderstood sentence determination model learning method, ununderstood sentence determination method, apparatus, and program
US20220277732A1 (en) Method and apparatus for training speech recognition model, electronic device and storage medium
CN105895091B (en) ESWFST construction method
Chowdhary Natural language processing
Misu et al. Dialogue strategy to clarify user’s queries for document retrieval system with speech interface
JP2023034235A (en) Text summarization method and text summarization system
KR20120042381A (en) Apparatus and method for classifying sentence pattern of speech recognized sentence
JP2008165718A (en) Intention determination device, intention determination method, and program
TW202119259A (en) Message feedback method for conversational system which greatly increases its richness to have more human nature and can be applied to the demands of various fields

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160113

R150 Certificate of patent or registration of utility model

Ref document number: 5872516

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150