JP2016206894A - Information classification method, device and program - Google Patents

Information classification method, device and program Download PDF

Info

Publication number
JP2016206894A
JP2016206894A JP2015086873A JP2015086873A JP2016206894A JP 2016206894 A JP2016206894 A JP 2016206894A JP 2015086873 A JP2015086873 A JP 2015086873A JP 2015086873 A JP2015086873 A JP 2015086873A JP 2016206894 A JP2016206894 A JP 2016206894A
Authority
JP
Japan
Prior art keywords
user utterance
question sentence
utterance
information
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015086873A
Other languages
Japanese (ja)
Inventor
徹 平野
Toru Hirano
徹 平野
俊朗 牧野
Toshiaki Makino
俊朗 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015086873A priority Critical patent/JP2016206894A/en
Publication of JP2016206894A publication Critical patent/JP2016206894A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To classify accurately, which question sentence category a user utterance replies.SOLUTION: An information extraction part 203 extracts a person attribute which is expressed by a user utterance and a topic of the user utterance based on the input user utterance. A question sentence category classification part 208 selects question sentence categories with which, the extracted person attribute and topic are associated in advance, out of plural question sentence categories, based on the person attribute and topic extracted by the information extraction part 203, as candidates of question sentence categories according to the input user utterance, then, classifies the input user utterance into any one of the candidates of the question sentence categories.SELECTED DRAWING: Figure 1

Description

本発明は、情報分類方法、装置、及びプログラムに関する。   The present invention relates to an information classification method, apparatus, and program.

従来、対話システムのパーソナリティを問う質問に対する発話生成を行うために、ユーザの質問文を分類する装置が存在する(例えば、非特許文献1を参照。)。非特許文献1に記載の装置では、大規模にパーソナリティに関する質問文を収集し、約1000個の質問文カテゴリとしてまとめている。質問文カテゴリの例としては、「名前」「出身地」のようなものだけでなく「好きな野球のチーム」「好きなサッカーのチーム」のようなEntityが含まれたものもある。ユーザの質問文を質問文カテゴリへ分類することによって、対話システムのパーソナリティを適切に返答することを実現している。例えば、ユーザが発話「好きな野球のチームはどこですか?」を発した場合に、対話システムが発話「阪神が好きです。」を発する場合等である。図6に、従来のシステムの一例を示す。   2. Description of the Related Art Conventionally, there is an apparatus that classifies a user's question sentence in order to generate an utterance for a question asking about the personality of a dialogue system (see, for example, Non-Patent Document 1). In the apparatus described in Non-Patent Document 1, question texts related to personality are collected on a large scale and collected as about 1000 question text categories. Examples of question sentence categories include not only “name” and “hometown” but also entities including “favorite baseball team” and “favorite soccer team”. By classifying the user's question sentences into question sentence categories, the personality of the dialogue system is appropriately answered. For example, when the user utters the utterance “Where is your favorite baseball team?”, The dialogue system utters the utterance “I like Hanshin.” FIG. 6 shows an example of a conventional system.

杉山弘晃、目黒豊美、東中竜一郎、南泰浩、「対話システムのパーソナリティを問う質問に対する発話生成」、人工知能学会言語・音声理解と対話処理研究会、p.33−38、2014Hiroaki Sugiyama, Toyomi Meguro, Ryuichiro Higashinaka, Yasuhiro Minami, "Speech Generation for Questions Asking Personality of Dialogue System", Japanese Society for Artificial Intelligence Language, Speech Understanding and Dialogue Processing Study Group, p.33-38, 2014

しかし、従来手法では、対話システムのパーソナリティを問うユーザの質問を質問文カテゴリへ分類することはできるが、ユーザ自身に関するユーザの発話を同じ質問文カテゴリへ分類する(=どの質問文カテゴリへの回答かを分類する)と、正しく分類できないことがあった。それ故に、対話において、ユーザのパーソナリティに対応する対話システムのパーソナリティを発話に盛り込んだ共感する(または対比する)ような発話生成をすることができなかった。   However, in the conventional method, although the user's question asking about the personality of the dialog system can be classified into the question sentence category, the user's utterance about the user himself is classified into the same question sentence category (= answer to which question sentence category) If you classify them), you may not be able to classify correctly. Therefore, in dialogue, it was not possible to generate sympathetic sympathy (or contrast) that incorporates the personality of the dialogue system corresponding to the personality of the user in the utterance.

質問文の分類においては、質問文中に「好きな野球のチームは?」など質問文カテゴリを分類するための単語が多く出現するが、ユーザ自身に関するユーザ発話には、「阪神が好きなんだよね」など、「野球」、「チーム」という単語は出現しないことが多い。   In the question sentence classification, many words for classifying the question sentence category such as “What is your favorite baseball team?” Appear in the question sentence, but the user utterance about the user himself says “I like Hanshin. In many cases, the words “baseball” and “team” do not appear.

また、「好きなサッカーのチーム」「好きなサッカー選手」など同じ「好き」という単語も複数のカテゴリにまたがり分類の重みが低くなるので、「野球が好き」という単語が出現しても、 野球に関連するカテゴリ「野球をしたことがある」に誤って分類されることがある。   In addition, the word “like” like “favorite soccer team” and “favorite soccer player” is divided into multiple categories, and the weight of the classification is low, so even if the word “I like baseball” appears, May be mistakenly classified into the category “I have played baseball”.

本発明は、上記の事情に鑑みてなされたもので、ユーザ発話が、どの質問文カテゴリへの回答であるかを精度よく分類することができる情報分類装置、方法、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and provides an information classification apparatus, method, and program capable of accurately classifying which question sentence category the user utterance is an answer to. Objective.

上記目的を達成するために、第1の発明の情報抽出方法は、情報抽出手段及び質問文カテゴリ分類手段を含み、質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置における情報分類方法であって、前記情報抽出手段が、入力されたユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出するステップと、前記質問文カテゴリ分類手段が、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方に基づいて、前記複数の質問カテゴリのうちの、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方が予め対応付けられた前記質問文カテゴリを、前記入力されたユーザ発話に対応する前記質問文カテゴリの候補として選択し、前記入力されたユーザ発話を、前記質問文カテゴリの候補の何れかに分類するステップと、を含んで構成されている。   To achieve the above object, an information extraction method according to a first aspect of the present invention includes information extraction means and question sentence category classification means, and classifies user utterances into a plurality of predetermined question sentence categories representing a category of a question. An information classification method in an information classification device, wherein the information extraction means extracts at least one of a person attribute represented by the user utterance and a topic of the user utterance for an input user utterance, and the question Sentence category classification means, based on at least one of the person attribute and the topic extracted by the information extraction means, the person attribute and the topic extracted by the information extraction means of the plurality of question categories The question sentence category associated with at least one of the above in advance is added to the input user utterance. Selected as candidates for the question category for response, the input user speech is configured to include the steps of: classifying the one of the candidate of the question categories.

第1の発明の情報分類装置は、質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置であって、入力されたユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出する情報抽出手段と、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方に基づいて、前記複数の質問カテゴリのうちの、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方が予め対応付けられた前記質問文カテゴリを、前記入力されたユーザ発話に対応する前記質問文カテゴリの候補として選択し、前記入力されたユーザ発話を、前記質問文カテゴリの候補の何れかに分類する質問文カテゴリ分類手段と、を含んで構成されている。   An information classification device according to a first aspect of the present invention is an information classification device for classifying user utterances into a plurality of predetermined question sentence categories representing question categories, wherein the user utterances represent the input user utterances. Information extraction means for extracting at least one of a person attribute and a topic of the user utterance, and based on at least one of the person attribute and the topic extracted by the information extraction means, of the plurality of question categories, The question sentence category in which at least one of the person attribute and the topic extracted by the information extraction means is associated in advance is selected as a candidate for the question sentence category corresponding to the input user utterance, and the input Question sentence category classification means for classifying a user utterance made into any of the question sentence category candidates , It is configured to include a.

第2の発明の情報分類方法は、情報抽出手段及び質問文カテゴリ分類手段を含み、質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置における情報分類方法であって、前記情報抽出手段が、入力されたユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出するステップと、前記質問文カテゴリ分類手段が、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方と、前記ユーザ発話の素性とに基づいて、前記入力されたユーザ発話を、前記複数の質問文カテゴリの何れかに分類するステップと、を含んで構成されている。   An information classification method according to a second aspect of the present invention is an information classification method in an information classification apparatus that includes information extraction means and question sentence category classification means, and classifies user utterances into a plurality of predetermined question sentence categories that represent question categories. The information extraction means extracts at least one of a person attribute represented by the user utterance and a topic of the user utterance for the input user utterance; and the question sentence category classification means includes the information Classifying the inputted user utterance into one of the plurality of question sentence categories based on at least one of the person attribute and the topic extracted by the extracting means and the feature of the user utterance; It is comprised including.

第2の発明の情報分類装置は、質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置であって、入力されたユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出する情報抽出手段と、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方と、前記ユーザ発話の素性とに基づいて、前記入力されたユーザ発話を、前記複数の質問文カテゴリの何れかに分類する質問文カテゴリ分類手段と、を含んで構成されている。   An information classification device according to a second invention is an information classification device for classifying user utterances into a plurality of predetermined question sentence categories representing question categories, wherein the user utterance represents the input user utterance. Information extraction means for extracting at least one of a person attribute and a topic of the user utterance, at least one of the person attribute and topic extracted by the information extraction means, and a feature of the user utterance, Question sentence category classification means for classifying the input user utterance into any of the plurality of question sentence categories.

また、本発明は、入力されたユーザ発話について、対話における発話の意図を表す対話行為タイプを推定する対話行為推定手段を更に含み、前記情報抽出手段は、前記対話行為推定手段によって推定された前記対話行為タイプが自己開示に対応する前記対話行為タイプである前記ユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出するようにすることができる。   The present invention further includes a dialogue action estimating means for estimating a dialogue action type representing an intention of the utterance in the dialogue for the input user utterance, and the information extraction means is estimated by the dialogue action estimation means. With respect to the user utterance whose dialogue action type corresponds to the self-disclosure type, at least one of the personal attribute represented by the user utterance and the topic of the user utterance may be extracted.

また、本発明は、前記質問文カテゴリ分類手段によって分類された前記入力されたユーザ発話に対応する前記質問文カテゴリに基づいて、前記ユーザ発話に対する発話を生成する発話生成手段を更に含むようにすることができる。   The present invention further includes speech generation means for generating a speech for the user utterance based on the question sentence category corresponding to the input user utterance classified by the question sentence category classification means. be able to.

本発明に係るプログラムは、本発明の情報分類方法の各ステップをコンピュータに実行させるためのプログラムである。   The program according to the present invention is a program for causing a computer to execute each step of the information classification method of the present invention.

以上説明したように、第1の発明の情報分類方法、装置、及びプログラムによれば、入力されたユーザ発話について、ユーザ発話が表している人物属性及びユーザ発話のトピックの少なくとも一方を抽出し、抽出された人物属性及びトピックの少なくとも一方に基づいて、複数の質問カテゴリのうちの、抽出された人物属性及びトピックの少なくとも一方が予め対応付けられた質問文カテゴリを、入力されたユーザ発話に対応する質問文カテゴリの候補として選択し、入力されたユーザ発話を、質問文カテゴリの候補の何れかに分類することにより、ユーザ発話がどの質問文カテゴリへの回答であるかを精度よく分類することができる、という効果が得られる。   As described above, according to the information classification method, apparatus, and program of the first invention, for the input user utterance, at least one of the personal attribute represented by the user utterance and the topic of the user utterance is extracted, Based on at least one of the extracted person attribute and topic, a question sentence category in which at least one of the extracted person attribute and topic is associated in advance among a plurality of question categories corresponds to the input user utterance The user utterance is classified as one of the question sentence category candidates by classifying the input user utterance as a candidate for the question sentence category to be accurately classified. The effect of being able to be obtained.

また、第2の発明の情報分類方法、装置、及びプログラムによれば、入力されたユーザ発話について、ユーザ発話が表している人物属性及びユーザ発話のトピックの少なくとも一方を抽出し、抽出された人物属性及びトピックの少なくとも一方と、ユーザ発話の素性とに基づいて、入力されたユーザ発話を、複数の質問文カテゴリの何れかに分類することにより、ユーザ発話がどの質問文カテゴリへの回答であるかを精度よく分類することができる、という効果が得られる。   Moreover, according to the information classification method, apparatus, and program of the second invention, for the input user utterance, at least one of the person attribute represented by the user utterance and the topic of the user utterance is extracted, and the extracted person The user utterance is an answer to which question sentence category by classifying the input user utterance into any of a plurality of question sentence categories based on at least one of the attribute and the topic and the feature of the user utterance. The effect that it can classify | categorize accurately is acquired.

本発明の実施の形態に係る情報分類装置の構成の一例を示す図である。It is a figure which shows an example of a structure of the information classification device which concerns on embodiment of this invention. 対話行為タイプの一例を示す図である。It is a figure which shows an example of a dialogue action type. 人物属性とトピックとの一例を示す図である。It is a figure which shows an example of a person attribute and a topic. 本発明の第1の実施の形態に係る情報分類処理ルーチンのフローチャートの一例である。It is an example of the flowchart of the information classification process routine which concerns on the 1st Embodiment of this invention. 本発明の第2の実施の形態に係る情報分類処理ルーチンのフローチャートの一例である。It is an example of the flowchart of the information classification process routine which concerns on the 2nd Embodiment of this invention. 従来技術を説明するための図である。It is a figure for demonstrating a prior art.

<概要>
まず、本発明の実施の形態の概要について説明する。
<Overview>
First, an outline of an embodiment of the present invention will be described.

本発明の実施の形態は、ユーザと対話を行う対話装置に関係し、特にユーザ発話で述べられているユーザ自身に関する情報に対応させて対話装置自身に関する情報を発話するために、ユーザ発話を分類する技術に関するものである。また、本発明の実施の形態では、質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置に本発明を適用させた場合を例に説明する。   Embodiments of the present invention relate to an interactive device that interacts with a user, and in particular classifies user utterances in order to utter information about the interactive devices themselves in correspondence with information about the users themselves described in the user utterances. It is related to the technology. Further, in the embodiment of the present invention, a case where the present invention is applied to an information classification device that classifies user utterances into a plurality of predetermined question sentence categories representing question categories will be described as an example.

本発明の実施の形態に係る情報分類装置は、ユーザ自身に関するユーザ発話が、上記非特許文献1の従来技術で採用されている約1000個の質問文カテゴリの何れに回答しているものかを分類する。   In the information classification device according to the embodiment of the present invention, which of the approximately 1000 question sentence categories employed in the prior art of Non-Patent Document 1 is answered by the user utterance regarding the user himself / herself. Classify.

具体的には、本実施の形態では、従来技術のように約1000個のカテゴリをユーザ発話中の単語から直接分類するのではなく、下記参考文献で示されているトピック分類(43種類)及び人物属性分類(34種類)の推定結果を用いて、候補となる質問文カテゴリを絞り込んで推定する(予め定められた約1000個の各質問文カテゴリに対して、予め人手によってトピック分類及び人物属性分類を対応づけておく)。   Specifically, in the present embodiment, instead of directly classifying about 1000 categories from the words in the user's utterance as in the prior art, topic classification (43 types) and Using the estimation results of the person attribute classification (34 types), the candidate question sentence categories are narrowed down and estimated (for each of about 1000 predetermined question sentence categories, the topic classification and the person attributes are manually set in advance. Classify).

また、本実施の形態では、上記非特許文献1の従来技術のように質問文カテゴリをユーザ発話中の単語のみの手掛りで分類するのではなく、下記参考文献で示されているトピック分類及び人物属性分類の推定結果も手がかりとして利用する。   Further, in the present embodiment, the question sentence category is not classified by the clue only of the word being uttered by the user as in the prior art of Non-Patent Document 1, but the topic classification and person shown in the following references are not classified. The attribute classification estimation result is also used as a clue.

参考文献:平野徹、小林のぞみ、東中竜一郎、牧野俊朗、松尾義博、「ユーザ情報抽出のための自己開示文の人物属性分類」、NLP2015、B1−3 References: Toru Hirano, Nozomi Kobayashi, Ryuichiro Higashinaka, Toshiro Makino, Yoshihiro Matsuo, “Person attribute classification of self-disclosure sentence for user information extraction”, NLP2015, B1-3

本実施の形態では、ユーザ発話に対して、大まかなトピックだけの分類、大まかな人物属性だけの分類を実施することにより、質問文カテゴリの分類に寄与する単語の重みを高くし、質問文カテゴリの高精度な分類を可能とする。また、本実施の形態では、トピックだけ、人物属性だけを考慮した分類器を作ることによって、同時に両方を考慮することの難しさを軽減する。   In the present embodiment, by classifying only a rough topic and only a rough person attribute for a user utterance, the weight of a word contributing to the classification of the question sentence category is increased, and the question sentence category Enables highly accurate classification. In this embodiment, the difficulty of considering both at the same time is reduced by creating a classifier that considers only the topic and only the person attribute.

[第1の実施の形態]
<情報分類装置のシステム構成>
以下、図面を参照して本発明の実施の形態を詳細に説明する。図1は、本発明の第1の実施の形態に係る情報分類装置の構成の一例を示す図である。なお、本発明の実施の形態に係る情報分類装置によって出力された発話は、ユーザと対話を行う対話装置が取得する。対話装置は、取得した発話を用いてユーザと対話を行うものとする。
[First Embodiment]
<System configuration of information classification device>
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a diagram showing an example of the configuration of the information classification apparatus according to the first embodiment of the present invention. Note that the utterance output by the information classification apparatus according to the embodiment of the present invention is acquired by an interactive apparatus that interacts with the user. It is assumed that the dialogue apparatus performs a dialogue with the user using the acquired utterance.

本実施の形態に係る情報分類装置100は、CPUと、RAMと、後述する情報抽出処理ルーチンを実行するためのプログラム及び各種データを記憶したROMとを備えたコンピュータで構成されている。また、記憶手段としてHDDを設けてもよい。   The information classification apparatus 100 according to the present embodiment is configured by a computer that includes a CPU, a RAM, and a ROM that stores a program for executing an information extraction processing routine (to be described later) and various data. Further, an HDD may be provided as a storage means.

このコンピュータは、機能的には、図1に示すように、入力部10、演算部20、及び出力部30を含んだ構成で表わすことができる。   This computer can be functionally represented by a configuration including an input unit 10, a calculation unit 20, and an output unit 30, as shown in FIG.

入力部10は、ユーザ発話の入力を受け付ける。   The input unit 10 receives an input of a user utterance.

演算部20は、形態素解析部200と、対話行為推定部202と、情報抽出部203と、質問文カテゴリ分類部208と、発話生成部210とを備えている。   The calculation unit 20 includes a morphological analysis unit 200, a dialogue action estimation unit 202, an information extraction unit 203, a question sentence category classification unit 208, and an utterance generation unit 210.

形態素解析部200は、入力部10によって受け付けたユーザ発話に対して形態素解析を行う。   The morphological analysis unit 200 performs morphological analysis on the user utterance received by the input unit 10.

対話行為推定部202は、形態素解析部200によって得られたユーザ発話の形態素解析結果に基づいて、入力部10によって受け付けたユーザ発話について、対話における発話の意図を表す対話行為タイプを推定する。対話行為タイプは、ユーザ発話の意味内容を表す。例えば、対話行為推定部202は、予め学習された対話行為付与モデルと、形態素解析部200によって得られた形態素結果とを用いて、ユーザ発話の対話行為タイプを推定する。   Based on the morphological analysis result of the user utterance obtained by the morphological analysis unit 200, the dialogue act estimation unit 202 estimates a dialogue act type representing the intention of the utterance in the dialogue for the user utterance received by the input unit 10. The dialogue action type represents the semantic content of the user utterance. For example, the dialogue act estimation unit 202 estimates the dialogue act type of the user utterance using the dialogue act assignment model learned in advance and the morpheme result obtained by the morpheme analysis unit 200.

具体的には、対話行為推定部202は、ユーザ発話の形態素解析結果が入力されると、図2に示す33種類の対話行為タイプの中から選択された1つを出力する。例えば、対話行為推定部202は、特開2015−001910号公報に記載されている対話行為付与方法に従って、入力部10によって受け付けたユーザ発話について、対話における発話の意図を表す対話行為タイプを推定する。例えば、「巨人が好きです」というユーザ発話に対しては、「自己開示_評価+」が出力される。   Specifically, when the morphological analysis result of the user utterance is input, the dialogue action estimation unit 202 outputs one selected from the 33 kinds of dialogue action types shown in FIG. For example, the dialogue act estimation unit 202 estimates a dialogue act type representing the intention of the utterance in the dialogue for the user utterance accepted by the input unit 10 according to the dialogue act grant method described in JP-A-2015-001910. . For example, “self-disclosure_evaluation +” is output for a user utterance “I like a giant”.

情報抽出部203は、対話行為推定部202によって推定された対話行為タイプが自己開示に対応する対話行為タイプである場合に、入力部10によって受け付けたユーザ発話について、当該ユーザ発話が表している人物属性及び当該ユーザ発話のトピックを抽出する。情報抽出部203は、人物属性分類部204と、トピック分類部206とを備えている。   When the dialogue action type estimated by the dialogue action estimation unit 202 is a dialogue action type corresponding to self-disclosure, the information extraction unit 203 represents a person represented by the user utterance with respect to the user utterance accepted by the input unit 10. The attribute and the topic of the user utterance are extracted. The information extraction unit 203 includes a person attribute classification unit 204 and a topic classification unit 206.

人物属性分類部204は、対話行為推定部202によって推定された対話行為タイプが自己開示に対応する対話行為タイプであるユーザ発話について、当該ユーザ発話の単語素性に基づいて分類される、ユーザ発話が表している人物属性を抽出する。   The person attribute classification unit 204 classifies a user utterance whose dialogue action type estimated by the dialogue action estimation unit 202 is a dialogue action type corresponding to self-disclosure based on a word feature of the user utterance. Extract the person attributes that you represent.

具体的には、人物属性分類部204は、形態素解析部200によって得られたユーザ発話の形態素解析結果を入力として、図3に示す34種類の人物属性から、適切なカテゴリを1つ選択し、人物属性を抽出する。なお、人物属性の各々については、従来の分類カテゴリをベースに予め作成される。図3に示す34種類の人物属性は、対話データ中のユーザ情報を網羅した分類カテゴリである。また、人物属性の分類には、周知の機械学習技術を用いる。   Specifically, the person attribute classification unit 204 receives the morpheme analysis result of the user utterance obtained by the morpheme analysis unit 200, selects one appropriate category from the 34 types of person attributes shown in FIG. Extract person attributes. Each person attribute is created in advance based on a conventional classification category. The 34 types of person attributes shown in FIG. 3 are classification categories that cover user information in the dialog data. A well-known machine learning technique is used for the classification of the person attributes.

また、人物属性抽出のための素性としては、形態素解析結果から得られるユーザ発話の単語の表記、および、各単語に紐づく日本語語彙大系のカテゴリを単語素性として用いる。   In addition, as features for extracting person attributes, notation of words of user utterances obtained from morphological analysis results and Japanese vocabulary large categories associated with each word are used as word features.

例えば、ユーザ発話「巨人が好きです。」に対しては、人物属性は「趣味・嗜好」が選択される。   For example, for the user utterance “I like the giant”, “Hobby / Preference” is selected as the person attribute.

トピック分類部206は、対話行為推定部202によって推定された対話行為タイプが自己開示に対応する対話行為タイプであるユーザ発話の単語素性に基づいて分類される、ユーザ発話のトピックを抽出する。   The topic classification unit 206 extracts topics of user utterances that are classified based on the word features of user utterances in which the dialogue action type estimated by the dialogue action estimation unit 202 is a dialogue action type corresponding to self-disclosure.

具体的には、トピック分類部206は、形態素解析部200によって得られたユーザ発話の形態素解析結果を入力として、図3に示す43種類のトピックから、適切なカテゴリを1つ選択し、トピックを抽出する。なお、トピックの各々については、従来の分類カテゴリをベースに予め作成される。図3に示す43種類のトピックは、対話データ中のユーザ情報を網羅した分類カテゴリである。なお、トピック抽出のための素性としては、人物属性分類部204で用いる素性と同様の素性を用いる。また、トピックの分類には、周知の機械学習技術を用いる。   Specifically, the topic classification unit 206 receives the morphological analysis result of the user utterance obtained by the morphological analysis unit 200 as an input, selects one appropriate category from the 43 types of topics shown in FIG. Extract. Each topic is created in advance based on a conventional classification category. The 43 types of topics shown in FIG. 3 are classification categories covering user information in the dialog data. Note that the same features as those used in the person attribute classification unit 204 are used as features for topic extraction. A well-known machine learning technique is used for topic classification.

例えば、ユーザ発話「巨人が好きです。」に対しては、トピックは「スポーツ」が選択される。   For example, for the user utterance “I like giants”, the topic “sports” is selected.

質問文カテゴリ分類部208は、情報抽出部203によって抽出された人物属性及びトピックに基づいて、複数の質問カテゴリのうちの、抽出された人物属性及びトピックが予め対応付けられた質問文カテゴリを、入力されたユーザ発話に対応する質問文カテゴリの候補として選択する。そして、質問文カテゴリ分類部208は、入力されたユーザ発話を、選択された質問文カテゴリの候補の何れかに分類する。   The question sentence category classification unit 208, based on the person attribute and topic extracted by the information extraction unit 203, a question sentence category in which the extracted person attribute and topic are associated with each other in advance. A question sentence category corresponding to the input user utterance is selected. Then, the question sentence category classification unit 208 classifies the input user utterance into one of the selected question sentence category candidates.

質問文カテゴリ分類部208は、ユーザの自己開示文としてのユーザ発話、トピック分類部206によって得られたトピック分類結果、及び人物属性分類部204によって得られた人物属性分類結果を入力として、予め定められた約1000個の質問文カテゴリから適切なカテゴリを1つ選択する。なお、分類には、周知の機械学習技術によって予め学習された分類器を用いる。また、分類のための素性としては、ユーザ発話の単語の表記、および、各単語に紐づく日本語語彙大系のカテゴリを素性として用いる。   The question sentence category classification unit 208 receives a user utterance as a self-disclosure sentence of the user, a topic classification result obtained by the topic classification unit 206, and a person attribute classification result obtained by the person attribute classification unit 204 as inputs. One appropriate category is selected from the about 1000 question sentence categories. For classification, a classifier previously learned by a known machine learning technique is used. In addition, as features for classification, notation of words of user utterances and Japanese vocabulary large categories associated with each word are used as features.

具体的には、質問文カテゴリ分類部208は、トピック分類部206によって得られたトピック分類結果、及び人物属性分類部204によって得られた人物属性分類結果に基づき、約1000個の質問文カテゴリの中から、候補となる質問文カテゴリを絞り込む。候補となる質問文カテゴリを絞り込む際、各質問文カテゴリには、トピック分類と人物属性分類とが事前に人手で紐付けされており、トピック分類部206によって得られたトピック分類結果、及び人物属性分類部204によって得られた人物属性分類結果の双方が紐付けられている質問文カテゴリを候補として選択する。   Specifically, the question sentence category classification unit 208 includes about 1000 question sentence categories based on the topic classification result obtained by the topic classification unit 206 and the person attribute classification result obtained by the person attribute classification unit 204. Narrow down the candidate question sentence categories. When narrowing down candidate question sentence categories, each question sentence category is manually associated with a topic classification and a person attribute classification in advance, and the topic classification result obtained by the topic classification unit 206 and the person attribute A question sentence category in which both of the person attribute classification results obtained by the classification unit 204 are linked is selected as a candidate.

そして、質問文カテゴリ分類部208は、選択された候補の中から、適切な質問文カテゴリを1つ選択する。なお、分類器の学習時には、従来通り、約1000個のカテゴリを分類するように分類器を学習してもよいし、トピック分類と人物属性分類の組み合わせ(34個×43個)毎に、分類器を作成しても良い。   Then, the question sentence category classification unit 208 selects one appropriate question sentence category from the selected candidates. In addition, when learning the classifier, the classifier may be learned so as to classify about 1000 categories as before, or classified for each combination of topic classification and person attribute classification (34 × 43). A vessel may be created.

発話生成部210は、質問文カテゴリ分類部208によって分類されたユーザ発話に対応する質問文カテゴリに基づいて、ユーザ発話に対する発話を生成する。例えば、発話生成部210は、ユーザ発話が「阪神が好きなんだよね。」である場合に対し、質問文カテゴリ分類部208によって分類されたユーザ発話に対応する質問文カテゴリに応じて、発話「私も阪神好きです。」を生成する。   The utterance generation unit 210 generates an utterance for the user utterance based on the question sentence category corresponding to the user utterance classified by the question sentence category classification unit 208. For example, in the case where the user utterance is “I like Hanshin”, the utterance generation unit 210 utters the utterance “” according to the question sentence category corresponding to the user utterance classified by the question sentence category classification unit 208. I also like Hanshin. ”

出力部30は、発話生成部210によって生成された発話を、結果として出力する。   The output unit 30 outputs the utterance generated by the utterance generation unit 210 as a result.

ユーザと対話する対話装置は、出力部30によって出力された発話を取得し、取得された発話を用いてユーザと対話する。   The dialog device that interacts with the user acquires the utterance output by the output unit 30, and interacts with the user using the acquired utterance.

<情報分類装置の作用>
次に、第1の実施の形態に係る情報分類装置の作用について説明する。まず、ユーザと対話装置との対話が開始されると、情報分類装置100によって、図4に示す情報分類処理ルーチンが実行される。情報分類処理ルーチンは、ユーザ発話が発せられる毎に実行される。
<Operation of information classification device>
Next, the operation of the information classification device according to the first embodiment will be described. First, when the dialogue between the user and the dialogue apparatus is started, the information classification processing routine shown in FIG. The information classification processing routine is executed every time a user utterance is uttered.

まず、ステップS100において、入力部10は、ユーザ発話の入力を受け付ける。   First, in step S100, the input unit 10 receives an input of a user utterance.

次に、ステップS102において、形態素解析部200は、上記ステップS100で受け付けたユーザ発話に対して形態素解析を行う。   Next, in step S102, the morphological analysis unit 200 performs morphological analysis on the user utterance received in step S100.

ステップS104において、対話行為推定部202は、上記ステップS102で得られたユーザ発話の形態素解析結果に基づいて、上記ステップS100で受け付けたユーザ発話について、対話行為タイプを推定する。   In step S104, the dialogue act estimation unit 202 estimates the dialogue act type for the user utterance accepted in step S100, based on the morphological analysis result of the user utterance obtained in step S102.

ステップS106において、上記ステップS104で推定された対話行為タイプが、自己開示に対応する対話行為タイプであるか否かを判定する。上記ステップS104で推定された対話行為タイプが、自己開示に対応する対話行為タイプである場合には、ステップS108へ進む。一方、上記ステップS104で推定された対話行為タイプが、自己開示に対応する対話行為タイプでない場合には、情報分類処理ルーチンを終了する。   In step S106, it is determined whether or not the dialogue action type estimated in step S104 is a dialogue action type corresponding to self-disclosure. When the dialogue action type estimated in step S104 is a dialogue action type corresponding to self-disclosure, the process proceeds to step S108. On the other hand, if the dialogue action type estimated in step S104 is not a dialogue action type corresponding to self-disclosure, the information classification processing routine is terminated.

ステップS108において、人物属性分類部204は、上記ステップS102で得られた形態素解析結果に基づいて、対話行為タイプが自己開示に対応する対話行為タイプであるユーザ発話の単語素性に基づいて分類される、ユーザ発話が表している人物属性を抽出する。   In step S108, the person attribute classification unit 204 is classified based on the word feature of the user utterance whose dialogue action type is the dialogue action type corresponding to self-disclosure based on the morphological analysis result obtained in step S102. The person attribute represented by the user utterance is extracted.

ステップS110において、トピック分類部206は、上記ステップS102で得られた形態素解析結果に基づいて、対話行為タイプが自己開示に対応する対話行為タイプであるユーザ発話の単語素性に基づいて分類される、ユーザ発話のトピックを抽出する。   In step S110, the topic classification unit 206 is classified based on the word feature of the user utterance whose dialogue action type is a dialogue action type corresponding to self-disclosure based on the morphological analysis result obtained in step S102. Extract topics of user utterances.

ステップS112において、質問文カテゴリ分類部208は、上記ステップS108で抽出された人物属性と、上記ステップS110で抽出されたトピックとに基づいて、予め定められた質問文カテゴリの中から、質問文カテゴリの候補を限定する。   In step S112, the question sentence category classification unit 208 selects a question sentence category from predetermined question sentence categories based on the person attributes extracted in step S108 and the topic extracted in step S110. Limit candidates.

ステップS114において、質問文カテゴリ分類部208は、上記ステップS100で受け付けたユーザ発話を、ユーザ発話の素性に基づいて上記ステップS112で限定された質問文カテゴリの候補の何れかに分類する。   In step S114, the question sentence category classification unit 208 classifies the user utterance received in step S100 as one of the question sentence category candidates limited in step S112 based on the feature of the user utterance.

ステップS116において、発話生成部210は、上記ステップS114で分類されたユーザ発話に対応する質問文カテゴリに基づいて、ユーザに対する発話を生成する。   In step S116, the utterance generation unit 210 generates an utterance for the user based on the question sentence category corresponding to the user utterance classified in step S114.

ステップS118において、出力部30は、上記ステップS116で出力された発話を、結果として出力し、情報分類処理ルーチンを終了する。   In step S118, the output unit 30 outputs the utterance output in step S116 as a result, and ends the information classification processing routine.

対話装置は、出力部30によって出力された発話を用いてユーザと対話する。   The dialogue apparatus interacts with the user using the utterance output by the output unit 30.

以上説明したように、本実施の形態に係る情報分類装置100によれば、入力されたユーザ発話について、ユーザ発話が表している人物属性及びユーザ発話のトピックを抽出し、抽出された人物属性及びトピックに基づいて、複数の質問カテゴリのうちの、抽出された人物属性及びトピックが予め対応付けられた質問文カテゴリを、入力されたユーザ発話に対応する質問文カテゴリの候補として選択し、入力されたユーザ発話を、質問文カテゴリの候補の何れかに分類することにより、ユーザ発話がどの質問文カテゴリへの回答であるかを精度よく分類することができる。   As described above, according to the information classification device 100 according to the present embodiment, for the input user utterance, the person attribute represented by the user utterance and the topic of the user utterance are extracted, and the extracted person attribute and Based on the topic, a question sentence category in which extracted person attributes and topics are associated in advance among a plurality of question categories is selected as a candidate for a question sentence category corresponding to the input user utterance and inputted. By classifying the user utterance into any of the question sentence category candidates, it is possible to accurately classify to which question sentence category the user utterance is the answer.

また、対話行為タイプが自己開示に対応する対話行為タイプであるユーザ発話について、質問文カテゴリの候補の何れかに分類することにより、ユーザ自身に関するユーザの発話をどの質問文カテゴリへの回答かを正しく分類することができるようになり、ユーザのパーソナリティに対応する対話装置のパーソナリティを発話に盛り込んだような共感する(または対比する)ような発話の生成をすることができる。   In addition, by classifying user utterances whose dialogue action type is a dialogue action type corresponding to self-disclosure into any of the question sentence category candidates, it is possible to determine which question sentence category the user's utterance regarding the user himself / herself is the answer to. It becomes possible to classify correctly, and it is possible to generate an utterance that sympathizes (or contrasts) that the personality of the interactive device corresponding to the personality of the user is included in the utterance.

例えば、ユーザ発話「阪神が好きなんだよね。」に対し、対話装置の発話「私も阪神好きです。」というような発話を生成することができる。また、ユーザ発話「巨人が好きなんだよね。」に対し、対話装置の発話「私は阪神が好きです。」というような発話を生成することができる。   For example, for a user utterance “I like Hanshin”, an utterance such as “I like Hanshin” can also be generated by the dialogue device. In addition, for the user utterance “I like giants”, it is possible to generate an utterance such as “I like Hanshin.”

[第2の実施の形態]
<情報分類装置のシステム構成>
次に、本発明の第2の実施の形態について説明する。なお、第2の実施の形態に係る対話装置の構成は、第1の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。
[Second Embodiment]
<System configuration of information classification device>
Next, a second embodiment of the present invention will be described. Note that the configuration of the interactive apparatus according to the second embodiment is the same as that of the first embodiment, and thus the same reference numerals are given and description thereof is omitted.

第2の実施の形態では、質問文カテゴリを選択するための素性としてトピック分類結果及び人物属性分類結果を用いる点が、第1の実施の形態と異なっている。   The second embodiment is different from the first embodiment in that a topic classification result and a person attribute classification result are used as features for selecting a question sentence category.

第2の実施の形態に係る質問文カテゴリ分類部208は、情報抽出部203によって抽出された人物属性及びトピックと、入力されたユーザ発話の素性とに基づいて、入力されたユーザ発話を、複数の質問文カテゴリの何れかに分類する。質問文カテゴリ分類部208は、質問文カテゴリの分類のための素性として、ユーザ発話の単語素性に加えて、トピック分類結果及び人物属性分類結果を素性として用いる。   The question sentence category classification unit 208 according to the second embodiment uses a plurality of input user utterances based on the person attributes and topics extracted by the information extraction unit 203 and the input user utterance features. Into any of the question sentence categories. The question sentence category classification unit 208 uses topic classification results and person attribute classification results as features in addition to word features of user utterances as features for question sentence category classification.

なお、分類には、ユーザ発話の単語素性とトピック分類結果及び人物属性分類結果とに基づき周知の機械学習技術によって予め学習された分類器を用いる。   For classification, a classifier previously learned by a well-known machine learning technique based on a word feature of a user utterance, a topic classification result, and a person attribute classification result is used.

<情報分類装置の作用>
次に、第2の実施の形態に係る情報分類装置の作用について説明する。まず、ユーザと対話装置との対話が開始されると、情報分類装置100によって、図5に示す情報分類処理ルーチンが実行される。情報分類処理ルーチンは、ユーザ発話が発せられる毎に実行される。
<Operation of information classification device>
Next, the operation of the information classification device according to the second embodiment will be described. First, when the dialogue between the user and the dialogue apparatus is started, the information classification processing routine shown in FIG. The information classification processing routine is executed every time a user utterance is uttered.

ステップS214において、質問文カテゴリ分類部208は、ステップS108で抽出された人物属性及びステップS110で抽出されたトピックと、上記ステップS100で受け付けたユーザ発話の素性とに基づいて、上記ステップS100で受け付けたユーザ発話を、複数の質問文カテゴリの何れかに分類する。   In step S214, the question sentence category classification unit 208 accepts in step S100 based on the person attribute extracted in step S108, the topic extracted in step S110, and the feature of the user utterance accepted in step S100. The user utterances are classified into any of a plurality of question sentence categories.

なお、第2の実施の形態に係る情報分類装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。   Note that other configurations and operations of the information classification device according to the second embodiment are the same as those of the first embodiment, and thus the description thereof is omitted.

以上説明したように、第2の実施の形態に係る情報分類装置によれば、抽出された人物属性及びトピックと、ユーザ発話の素性とに基づいて、入力されたユーザ発話を、複数の質問文カテゴリの何れかに分類することにより、ユーザ発話をどの質問文カテゴリへの回答であるかを精度よく分類することができる。   As described above, according to the information classification device according to the second embodiment, an input user utterance is divided into a plurality of question sentences based on the extracted person attributes and topics, and user utterance features. By classifying into any of the categories, it is possible to accurately classify to which question sentence category the user utterance is an answer.

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   Note that the present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.

例えば、上記実施の形態では、情報抽出部203は、入力部10によって受け付けたユーザ発話について、当該ユーザ発話が表している人物属性及び当該ユーザ発話のトピックを抽出する場合を例に説明したが、これに限定されるものではなく、例えば、当該ユーザ発話が表している人物属性及び当該ユーザ発話のトピックの何れか一方を抽出してもよい。この場合には、第1の実施の形態では、抽出された人物属性及びトピックの何れか一方に基づいて、複数の質問カテゴリのうちの、抽出された人物属性及びトピックの何れか一方が予め対応付けられた質問文カテゴリを、入力されたユーザ発話に対応する質問文カテゴリの候補として選択する。そして、入力されたユーザ発話を、選択された質問文カテゴリの候補の何れかに分類する。また、第2の実施の形態では、抽出された人物属性及びトピックの何れか一方と、入力されたユーザ発話の素性とに基づいて、入力されたユーザ発話を、複数の質問文カテゴリの何れかに分類する。   For example, in the above-described embodiment, the information extraction unit 203 has been described with respect to the user utterance received by the input unit 10 as an example in which the person attribute represented by the user utterance and the topic of the user utterance are extracted. However, the present invention is not limited to this. For example, any one of the person attribute represented by the user utterance and the topic of the user utterance may be extracted. In this case, in the first embodiment, any one of the extracted person attributes and topics among a plurality of question categories corresponds in advance based on one of the extracted person attributes and topics. The attached question sentence category is selected as a question sentence category candidate corresponding to the input user utterance. Then, the input user utterance is classified into one of the selected question sentence category candidates. In the second embodiment, an input user utterance is assigned to any one of a plurality of question sentence categories based on any one of the extracted person attributes and topics and the input user utterance feature. Classify into:

また、上記実施の形態に係る情報分類装置100は、ユーザ発話について対話における発話の意図を表す対話行為タイプを推定する対話行為推定部202を備え、推定された対話行為タイプが自己開示に対応する対話行為タイプであるユーザ発話について、当該ユーザ発話が表している人物属性及び当該ユーザ発話のトピックを抽出する場合を例に説明したが、これに限定されるものではない。
例えば、上記実施の形態に係る情報分類装置100は、対話行為推定部202を備えずに、入力されたユーザ発話について当該ユーザ発話が表している人物属性及び当該ユーザ発話のトピックを抽出してもよい。
Moreover, the information classification device 100 according to the above embodiment includes a dialogue action estimation unit 202 that estimates a dialogue action type that represents an intention of utterance in a dialogue for a user utterance, and the estimated dialogue action type corresponds to self-disclosure. For the user utterance of the dialogue action type, the case where the person attribute represented by the user utterance and the topic of the user utterance are extracted has been described as an example, but the present invention is not limited to this.
For example, the information classification apparatus 100 according to the above embodiment may extract the person attribute represented by the user utterance and the topic of the user utterance for the input user utterance without including the dialogue action estimation unit 202. Good.

また、第1の実施の形態と第2の実施の形態とを組み合わせて用いてもよい。例えば、質問文カテゴリ分類部208は、複数の質問カテゴリのうちの、抽出された人物属性及びトピックが予め対応付けられた質問文カテゴリを、入力されたユーザ発話に対応する質問文カテゴリの候補として選択した後に、抽出された人物属性及びトピックと入力されたユーザ発話の素性とに基づいて、入力されたユーザ発話を、選択された質問文カテゴリの候補の何れかに分類してもよい。   Moreover, you may use combining 1st Embodiment and 2nd Embodiment. For example, the question sentence category classification unit 208 selects a question sentence category in which extracted person attributes and topics are associated in advance as a candidate for a question sentence category corresponding to the input user utterance from a plurality of question categories. After the selection, the input user utterance may be classified into one of the selected question sentence category candidates based on the extracted person attribute and topic and the input user utterance feature.

また、上記実施の形態では、ユーザ発話の分類処理と発話の生成処理とを1つの装置として構成する場合を例に説明したが、ユーザ発話の分類処理と発話の生成処理とを別々の装置として構成してもよい。   In the above embodiment, the case where the user utterance classification process and the utterance generation process are configured as one apparatus has been described as an example. However, the user utterance classification process and the utterance generation process are configured as separate apparatuses. It may be configured.

また、上述の情報分類装置は、内部にコンピュータシステムを有しているが、コンピュータシステムは、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   Moreover, although the above information classification apparatus has a computer system inside, if the computer system uses a WWW system, it also includes a homepage providing environment (or display environment).

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読取り可能な記録媒体に格納して提供することも可能である。   In the specification of the present application, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.

10 入力部
20 演算部
30 出力部
100 情報分類装置
200 形態素解析部
202 対話行為推定部
203 情報抽出部
204 人物属性分類部
206 トピック分類部
208 質問文カテゴリ分類部
210 発話生成部
DESCRIPTION OF SYMBOLS 10 Input part 20 Operation part 30 Output part 100 Information classification device 200 Morphological analysis part 202 Dialogue action estimation part 203 Information extraction part 204 Person attribute classification part 206 Topic classification part 208 Question sentence category classification part 210 Utterance generation part

Claims (7)

情報抽出手段及び質問文カテゴリ分類手段を含み、質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置における情報分類方法であって、
前記情報抽出手段が、入力されたユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出するステップと、
前記質問文カテゴリ分類手段が、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方に基づいて、前記複数の質問カテゴリのうちの、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方が予め対応付けられた前記質問文カテゴリを、前記入力されたユーザ発話に対応する前記質問文カテゴリの候補として選択し、前記入力されたユーザ発話を、前記質問文カテゴリの候補の何れかに分類するステップと、
を含む情報分類方法。
An information classification method in an information classification device for classifying user utterances into a plurality of predetermined question sentence categories representing question categories, including information extraction means and question sentence category classification means,
The information extraction means for extracting at least one of a person attribute represented by the user utterance and a topic of the user utterance for the input user utterance;
The question sentence category categorizing means, based on at least one of the person attribute extracted by the information extracting means and the topic, the person attribute extracted by the information extracting means of the plurality of question categories and The question sentence category associated with at least one of the topics in advance is selected as the question sentence category candidate corresponding to the input user utterance, and the input user utterance is selected as the question sentence category candidate. A step of classifying any of
Information classification method.
情報抽出手段及び質問文カテゴリ分類手段を含み、質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置における情報分類方法であって、
前記情報抽出手段が、入力されたユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出するステップと、
前記質問文カテゴリ分類手段が、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方と、前記ユーザ発話の素性とに基づいて、前記入力されたユーザ発話を、前記複数の質問文カテゴリの何れかに分類するステップと、
を含む情報分類方法。
An information classification method in an information classification device for classifying user utterances into a plurality of predetermined question sentence categories representing question categories, including information extraction means and question sentence category classification means,
The information extraction means for extracting at least one of a person attribute represented by the user utterance and a topic of the user utterance for the input user utterance;
The question sentence category categorizing means converts the input user utterance into the plurality of question sentences based on at least one of the person attribute and the topic extracted by the information extracting means and the user utterance feature. Categorizing into one of the categories;
Information classification method.
入力されたユーザ発話について、対話における発話の意図を表す対話行為タイプを推定する対話行為推定手段を更に含み、
前記情報抽出手段は、前記対話行為推定手段によって推定された前記対話行為タイプが自己開示に対応する前記対話行為タイプである前記ユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出する
請求項1又は請求項2に記載の情報分類方法。
A dialogue act estimating means for estimating a dialogue act type representing the intention of the utterance in the dialogue for the input user utterance;
The information extraction means includes the person attribute represented by the user utterance and the user utterance of the user utterance in which the interaction action type estimated by the interaction action estimation means is the interaction action type corresponding to self-disclosure. The information classification method according to claim 1 or 2, wherein at least one of the topics is extracted.
前記質問文カテゴリ分類手段によって分類された前記入力されたユーザ発話に対応する前記質問文カテゴリに基づいて、前記ユーザ発話に対する発話を生成する発話生成手段を更に含む
請求項1〜請求項3の何れか1項に記載の情報分類方法。
The speech production | generation means which produces | generates the utterance with respect to the said user utterance further based on the said question sentence category corresponding to the said input user utterance classified by the said question sentence category classification | category means. The information classification method according to claim 1.
質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置であって、
入力されたユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出する情報抽出手段と、
前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方に基づいて、前記複数の質問カテゴリのうちの、前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方が予め対応付けられた前記質問文カテゴリを、前記入力されたユーザ発話に対応する前記質問文カテゴリの候補として選択し、前記入力されたユーザ発話を、前記質問文カテゴリの候補の何れかに分類する質問文カテゴリ分類手段と、
を含む情報分類装置。
An information classification device for classifying user utterances into a plurality of predetermined question sentence categories representing a category of questions,
Information extraction means for extracting at least one of the person attribute represented by the user utterance and the topic of the user utterance for the input user utterance;
Based on at least one of the person attribute and the topic extracted by the information extraction means, at least one of the person attribute and the topic extracted by the information extraction means of the plurality of question categories corresponds in advance. A question sentence that selects the attached question sentence category as a candidate of the question sentence category corresponding to the input user utterance, and classifies the input user utterance into any of the question sentence category candidates A category classification means;
Classification device including
質問のカテゴリを表す予め定められた複数の質問文カテゴリにユーザ発話を分類する情報分類装置であって、
入力されたユーザ発話について、前記ユーザ発話が表している人物属性及び前記ユーザ発話のトピックの少なくとも一方を抽出する情報抽出手段と、
前記情報抽出手段によって抽出された前記人物属性及び前記トピックの少なくとも一方と、前記ユーザ発話の素性とに基づいて、前記入力されたユーザ発話を、前記複数の質問文カテゴリの何れかに分類する質問文カテゴリ分類手段と、
を含む情報分類装置。
An information classification device for classifying user utterances into a plurality of predetermined question sentence categories representing a category of questions,
Information extraction means for extracting at least one of the person attribute represented by the user utterance and the topic of the user utterance for the input user utterance;
A question that classifies the input user utterance into one of the plurality of question sentence categories based on at least one of the person attribute and the topic extracted by the information extracting means and the feature of the user utterance Sentence category classification means;
Classification device including
請求項1〜請求項4の何れか1項に記載の情報分類方法の各ステップをコンピュータに実行させるためのプログラム。   The program for making a computer perform each step of the information classification method of any one of Claims 1-4.
JP2015086873A 2015-04-21 2015-04-21 Information classification method, device and program Pending JP2016206894A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015086873A JP2016206894A (en) 2015-04-21 2015-04-21 Information classification method, device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015086873A JP2016206894A (en) 2015-04-21 2015-04-21 Information classification method, device and program

Publications (1)

Publication Number Publication Date
JP2016206894A true JP2016206894A (en) 2016-12-08

Family

ID=57487797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015086873A Pending JP2016206894A (en) 2015-04-21 2015-04-21 Information classification method, device and program

Country Status (1)

Country Link
JP (1) JP2016206894A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6224857B1 (en) * 2017-03-10 2017-11-01 ヤフー株式会社 Classification device, classification method, and classification program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6224857B1 (en) * 2017-03-10 2017-11-01 ヤフー株式会社 Classification device, classification method, and classification program
JP2018151786A (en) * 2017-03-10 2018-09-27 ヤフー株式会社 Classification device, classification method, and classification program

Similar Documents

Publication Publication Date Title
JP6857581B2 (en) Growth interactive device
CN104598644B (en) Favorite label mining method and device
JP4745094B2 (en) Clustering system, clustering method, clustering program, and attribute estimation system using clustering system
JP6832501B2 (en) Meaning generation method, meaning generation device and program
JP6804763B2 (en) Dialogue system, dialogue device and computer program for it
JP7132090B2 (en) Dialogue system, dialogue device, dialogue method, and program
CN111445898B (en) Language identification method and device, electronic equipment and storage medium
US20180277145A1 (en) Information processing apparatus for executing emotion recognition
JP5221768B2 (en) Translation apparatus and program
JP6450138B2 (en) Information processing apparatus and utterance content output method
KR101534413B1 (en) Method and apparatus for providing counseling dialogue using counseling information
JP2017125921A (en) Utterance selecting device, method and program
JP2016001242A (en) Question sentence creation method, device, and program
JP5612720B1 (en) Dialog control learning apparatus, dialog control apparatus, method and program thereof
JP6165657B2 (en) Information processing apparatus, information processing method, and program
KR20210071713A (en) Speech Skill Feedback System
CN108538292B (en) Voice recognition method, device, equipment and readable storage medium
JP2015219582A (en) Interactive method, interaction device, interactive program, and recording medium
JP5954836B2 (en) Ununderstood sentence determination model learning method, ununderstood sentence determination method, apparatus, and program
JP2018180459A (en) Speech synthesis system, speech synthesis method, and speech synthesis program
CN115357720B (en) BERT-based multitasking news classification method and device
JP2016206894A (en) Information classification method, device and program
CN110099332B (en) Audio environment display method and device
JP2013109738A (en) Semantic label application model learning device, semantic label application device, semantic label application model learning method and program
JP5964916B2 (en) Model learning apparatus, person attribute classification apparatus, method, and program