WO2021255840A1 - Estimation method, estimation device, and program - Google Patents

Estimation method, estimation device, and program Download PDF

Info

Publication number
WO2021255840A1
WO2021255840A1 PCT/JP2020/023644 JP2020023644W WO2021255840A1 WO 2021255840 A1 WO2021255840 A1 WO 2021255840A1 JP 2020023644 W JP2020023644 W JP 2020023644W WO 2021255840 A1 WO2021255840 A1 WO 2021255840A1
Authority
WO
WIPO (PCT)
Prior art keywords
utterance
topic
paragraph
estimation
unit
Prior art date
Application number
PCT/JP2020/023644
Other languages
French (fr)
Japanese (ja)
Inventor
隆明 長谷川
節夫 山田
和之 磯
正之 杉崎
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PCT/JP2020/023644 priority Critical patent/WO2021255840A1/en
Priority to JP2022532313A priority patent/JP7425368B2/en
Priority to PCT/JP2021/012692 priority patent/WO2021256043A1/en
Publication of WO2021255840A1 publication Critical patent/WO2021255840A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

An estimation device (30) according to the present disclosure is provided with a determination unit (32) and a paragraph estimation unit (33). The determination unit (32) uses a binary classification model (1) learned on the basis of teacher data to which a binary label indicating whether a talk is changed or not is given with respect to an utterance which constitutes series data of a dialogue including a plurality of topics or divided units thereof, thereby determining whether the utterance which constitutes the series data to be processed is an utterance of changing the talk or not. On the basis of a result of the determination by the determination unit (32), the paragraph estimation unit (33) estimates a range of paragraphs from a change of the talk to a preceding utterance of the next change or to an utterance at an end of the dialogue in the series data to be processed.

Description

推定方法、推定装置およびプログラムEstimating method, estimation device and program
 本開示は、推定方法、推定装置およびプログラムに関する。 This disclosure relates to an estimation method, an estimation device and a program.
 オペレータがカスタマ(顧客)からの商品あるいはサービスなどについての問い合わせに応対する部門(いわゆる、コンタクトセンタ)では、カスタマが抱えている問題に対する解決のサポートなどが求められる。コンタクトセンタでは、オペレータによるカスタマとの応対の履歴(応対ログ)が作成され、蓄積・共有される。オペレータあるいはコンタクトセンタの管理者などが、蓄積された応対ログを見直すことで、カスタマからの問い合わせを分析したり、カスタマへの応対の質の向上を図ったりすることができる。応対ログを見直し、カスタマとの応対を振り返る際に、オペレータとカスタマとの対話を話題ごとに分割することができれば、応対の振り返りの作業効率を上げることができる。 In the department (so-called contact center) where the operator responds to inquiries about products or services from customers (customers), support for solving problems that customers have is required. In the contact center, the history of customer service by the operator (response log) is created, stored and shared. An operator, a contact center manager, or the like can review the accumulated response log to analyze inquiries from customers and improve the quality of response to customers. When reviewing the response log and looking back on the response with the customer, if the dialogue between the operator and the customer can be divided by topic, the work efficiency of looking back on the response can be improved.
 オペレータとカスタマとの対話は、時間軸に沿った複数の発話から構成された系列データとみなすことができる。一連の系列データに対して、系列データにおける話題を示すラベルを付与した教師データを準備することで、LSTM(Long Short-Term Memory)などのDNN(Deep Neural Network)を用いた機械学習により、対話における話題を分類する分類モデルの学習が可能である(非特許文献1参照)。 The dialogue between the operator and the customer can be regarded as series data composed of multiple utterances along the time axis. By preparing teacher data with a label indicating the topic in the series data for a series of series data, dialogue is performed by machine learning using DNN (Deep Neural Network) such as RSTM (Long Short-Term Memory). It is possible to learn a classification model for classifying topics in (see Non-Patent Document 1).
 一般に、コンタクトセンタで扱うタスクは様々であり、取り扱う商品あるいはサービスの種類によっては、数えられる程度の少数の種類の話題で済む場合もあれば、非常に多くの、数えきれない種類の話題に至る場合もある。対話における話題を、非特許文献1に記載のモデルを用いて、多くの種類の話題に分類しようとすると、少量の教師データでは分類の精度が低下し、精度を上げるために大量の教師データを準備するには、多くのコストがかかってしまう。 In general, contact centers deal with a variety of tasks, depending on the type of product or service they handle, with a small number of topics that can be counted, or a large number of topics that can be counted. In some cases. When trying to classify topics in dialogue into many types of topics using the model described in Non-Patent Document 1, a small amount of teacher data reduces the accuracy of classification, and a large amount of teacher data is used to improve the accuracy. It costs a lot to prepare.
 また、系列データを構成する発話においては、語句が省略されることが比較的多いため、発話の長さ、すなわち、単語数が少なくなる場合がある。また、話題の種類が少なくても、話題同士が類似していたり、話題の出現順序が不定であったりする場合がある。これらの場合にも話題の分類が可能な分類モデルを構築するためには、教師データの準備に多くのコストがかかってしまう。 In addition, since words and phrases are relatively often omitted in utterances that compose series data, the length of the utterance, that is, the number of words may be reduced. Moreover, even if there are few types of topics, the topics may be similar to each other or the order of appearance of the topics may be indefinite. Even in these cases, it takes a lot of cost to prepare teacher data in order to construct a classification model capable of classifying topics.
 複数の話題を含む対話の系列データにおける話題を推定するためには、話の切り替わり(区切り)から次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定することが有効である。話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定することができれば、その段落に含まれる発話に範囲を限定して話題を推定することができるので、話題の推定をより高精度に行うことができる。 In order to estimate a topic in the series data of a dialogue containing multiple topics, it is effective to estimate the range of paragraphs from the utterance immediately before the next switch or the utterance at the end of the dialogue. be. If the range of the paragraph from the change of story to the utterance immediately before the next switch or the utterance at the end of the dialogue can be estimated, the topic can be estimated by limiting the range to the utterances contained in that paragraph. The topic can be estimated with higher accuracy.
 上記のような問題点に鑑みてなされた本開示の目的は、複数の話題を含む対話の系列データにおける、段落の範囲を推定することができる推定方法、推定装置およびプログラムを提供することにある。 An object of the present disclosure made in view of the above problems is to provide an estimation method, an estimation device, and a program capable of estimating a range of paragraphs in a series of dialogue data including a plurality of topics. ..
 上記課題を解決するため、本開示に係る推定方法は、複数の話題を含む対話の系列データを構成する発話または前記発話を分割した分割単位に対して、話の切り替わりであるか否かを示す第1のラベルが付与された第1の教師データに基づいて学習された第1のモデルを用いて、処理対象の系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する判定ステップと、前記判定の結果に基づき、前記処理対象の系列データにおける、話の切り替わりから次の切り替わりの直前の発話または前記対話の終わりの発話までの段落の範囲を推定する段落推定ステップと、を含む。 In order to solve the above problems, the estimation method according to the present disclosure indicates whether or not the utterances constituting the series data of the dialogue including a plurality of topics or the divided units obtained by dividing the utterances are the switching of the utterances. Using the first model trained based on the first teacher data to which the first label is attached, it is determined whether or not the utterances constituting the series data to be processed are utterances of story switching. Judgment step to be performed, and a paragraph estimation step to estimate the range of paragraphs in the series data to be processed from the utterance immediately before the next switch or the utterance at the end of the dialogue based on the result of the determination. ,including.
 また、上記課題を解決するため、本開示に係る推定装置は、複数の話題を含む対話の系列データを構成する発話または前記発話を分割した分割単位に対して、話の切り替わりであるか否かを示す第1のラベルが付与された第1の教師データに基づいて学習された第1のモデルを用いて、処理対象の系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する判定部と、前記判定部による判定の結果に基づき、前記処理対象の系列データにおける、話の切り替わりから次の切り替わりの直前の発話または前記対話の終わりの発話までの段落の範囲を推定する段落推定部と、を備える。 Further, in order to solve the above-mentioned problem, whether or not the estimation device according to the present disclosure switches the utterance to the utterance constituting the series data of the dialogue including a plurality of topics or the divided unit obtained by dividing the utterance. Whether or not the utterances constituting the series data to be processed are the utterances of the switching of the utterances using the first model trained based on the first teacher data to which the first label indicating the above is given. Based on the judgment unit that determines It is provided with a paragraph estimation unit and a paragraph estimation unit.
 また、上記課題を解決するため、本開示に係るプログラムは、上述した推定方法をコンピュータに実行させる。 Further, in order to solve the above-mentioned problems, the program according to the present disclosure causes a computer to execute the above-mentioned estimation method.
 本開示に係る推定方法、推定装置およびプログラムによれば、複数の話題を含む対話の系列データにおける、段落の範囲を推定することができる。 According to the estimation method, estimation device and program according to the present disclosure, it is possible to estimate the range of paragraphs in the series data of the dialogue including a plurality of topics.
二値分類モデルを学習する学習装置の構成例を示す図である。It is a figure which shows the configuration example of the learning apparatus which trains a binary classification model. 多値分類モデルを学習する学習装置の構成例を示す図である。It is a figure which shows the configuration example of the learning apparatus which trains a multi-value classification model. 本開示の一実施形態に係る推定装置の構成の一例を示す図である。It is a figure which shows an example of the structure of the estimation apparatus which concerns on one Embodiment of this disclosure. 本開示の一実施形態に係る推定装置の構成の別の一例を示す図である。It is a figure which shows another example of the structure of the estimation apparatus which concerns on one Embodiment of this disclosure. 本開示の一実施形態に係る推定装置の構成のさらに別の一例を示す図である。It is a figure which shows still another example of the structure of the estimation apparatus which concerns on one Embodiment of this disclosure. 図2に示す多値ラベル補完部の動作の一例を示すフローチャートである。It is a flowchart which shows an example of the operation of the multi-valued label complement part shown in FIG. 図3に示す推定装置の動作の一例を示すフローチャートである。It is a flowchart which shows an example of the operation of the estimation apparatus shown in FIG. 図4に示す推定装置の動作の一例を示すフローチャートである。It is a flowchart which shows an example of the operation of the estimation apparatus shown in FIG. 図5に示す推定装置による段落の範囲の推定の動作の一例を示すフローチャートである。It is a flowchart which shows an example of the operation of the estimation of the paragraph range by the estimation apparatus shown in FIG. 図5に示す推定装置による話題の推定の動作の一例を示すフローチャートである。It is a flowchart which shows an example of the operation of the estimation of a topic by the estimation apparatus shown in FIG. 二値分類モデルおよび多値分類モデルの学習について説明するための図である。It is a figure for demonstrating the learning of a binary classification model and a multi-value classification model. 図3に示す推定装置による話題の推定について説明するための図である。It is a figure for demonstrating the estimation of the topic by the estimation apparatus shown in FIG. 図3に示す推定装置による話題の推定について説明するための図である。It is a figure for demonstrating the estimation of the topic by the estimation apparatus shown in FIG. 図4に示す推定装置による話題の推定について説明するための図である。It is a figure for demonstrating the estimation of the topic by the estimation apparatus shown in FIG. 図5に示す推定装置による話題の推定について説明するための図である。It is a figure for demonstrating the estimation of the topic by the estimation apparatus shown in FIG.
 以下、本開示の実施の形態について図面を参照して説明する。 Hereinafter, embodiments of the present disclosure will be described with reference to the drawings.
 まず、本開示の概要について説明する。 First, the outline of this disclosure will be explained.
 本開示は、オペレータとカスタマとの対話といった、複数の話題を含む対話の系列データにおける、話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲の推定、および、段落における話題の推定に関する。 The present disclosure estimates and estimates the range of paragraphs from one talk switch to the utterance immediately before or at the end of the dialogue in a series of dialogue data involving multiple topics, such as an operator-customer dialogue. Regarding estimation of topics in paragraphs.
 以下では、コンタクトセンタにおけるオペレータとカスタマとの対話を例として考える。オペレータが主導して対話を進めるケースとして、カスタマが抱えている問題を解決するに当たり、オペレータが現在の状況あるいはこれまでの経緯などをカスタマに問診しながら原因を突き止めていくケース、オペレータがカスタマの状況についてインタビューを行いながら業務の手続きに必要な書類を作成するケースなどが存在する。 In the following, the dialogue between the operator and the customer at the contact center will be considered as an example. As a case where the operator takes the initiative in conducting dialogue, when solving the problem that the customer has, the operator asks the customer about the current situation or the history so far to find out the cause, and the operator is the customer. There are cases where documents necessary for business procedures are created while conducting interviews about the situation.
 上述したようなケースの対話では、オペレータが質問している内容の単位を1つの話題と捉えることができる。ただし、多くの話題の種類から最も適切な話題の種類を一意に決定することは難しい。また、上述したような対話における話題はいずれも特定の業務に関連した範囲の話題であり、ある話題と別の話題とが類似していることが多い。そして、類似している話題を区別することは難しい。そのため、対話全体を、話題ごとの一連のまとまりに分割するのは困難である。 In the dialogue in the case described above, the unit of the content that the operator is asking can be regarded as one topic. However, it is difficult to uniquely determine the most appropriate topic type from many topic types. In addition, all the topics in the dialogue as described above are topics in the range related to a specific business, and one topic and another topic are often similar. And it is difficult to distinguish between similar topics. Therefore, it is difficult to divide the entire dialogue into a series of topics.
 しかしながら、オペレータが次の話に移る際には、オペレータは、「このたび」、「では」、「あと」といった、話が切り替わることをカスタマに伝える語句を発することが多い。また、話が終わる際には、オペレータは、カスタマの発話を受けて、「かしこまりました」、「承知いたしました」といった、話が終わることをカスタマに伝える語句を発することが多い。これらの語句は、話の内容に依存しないため、話の切り替わり(話の区切り)を検出する上で有用である。 However, when the operator moves on to the next story, the operator often utters words such as "this time", "in", and "after" to tell the customer that the story will change. In addition, at the end of the talk, the operator often receives the customer's utterance and utters words such as "smart" and "acknowledged" to inform the customer that the talk is over. Since these words do not depend on the content of the story, they are useful for detecting the change of story (break of story).
 本開示においては、例えば、上述した話の切り替わりを示す語句などを利用して、系列データにおける発話が、話の切り替わり発話であるか否かを判定するルールを作成する。そして、本開示においては、作成したルールに基づき、系列データにおける発話が、話の切り替わりの発話であるか否かを判定する。また、本開示においては、例えば、話の切り替わりの発話には、話の切り替わりであることを示すラベルを付与し、その他の発話には、話の切り替わりの発話でないことを示すラベルを付与した教師データに基づき、話の切り替わりの発話であるか否かを判定するモデルを作成し、作成したモデルの判定の結果を用いて、話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定する。また、本開示においては、段落あるいは段落に含まれる発話における話題を推定する。対話に多くの話題あるいは類似した内容の話題が含まれている場合であっても、話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定することができれば、その段落に含まれる発話に絞って話題を推定することができるので、より精度の高い話題の推定が可能となる。 In the present disclosure, for example, a rule for determining whether or not the utterance in the series data is a story switching utterance is created by using the above-mentioned words and phrases indicating the story switching. Then, in the present disclosure, it is determined whether or not the utterance in the series data is the utterance of the switching of the talk, based on the created rule. Further, in the present disclosure, for example, a teacher who assigns a label indicating that the utterance of the story change is a story change utterance and a label indicating that the other utterances are not the story change utterances. Based on the data, create a model that determines whether or not the utterance is a switching utterance, and use the judgment result of the created model to utter the utterance immediately before the next switching or the utterance at the end of the dialogue. Estimate the range of paragraphs up to. In addition, in this disclosure, the topic in the paragraph or the utterance contained in the paragraph is estimated. Even if the dialogue contains many or similar topics, if the paragraph range from the utterance just before the next switch or the utterance at the end of the dialogue can be estimated. , Since the topic can be estimated by focusing on the utterances included in the paragraph, it is possible to estimate the topic with higher accuracy.
 上述したように、本開示においては、教師データに基づき学習されたモデルを用いて、系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する。また、本開示においては、段落における話題の推定に、教師データに基づき学習されたモデルを用いてもよい。まず、これらのモデルの学習について説明する。 As described above, in the present disclosure, using a model learned based on teacher data, it is determined whether or not the utterances constituting the series data are utterances of switching talks. Further, in the present disclosure, a model learned based on teacher data may be used for estimating the topic in the paragraph. First, the learning of these models will be described.
 図1は、系列データを構成する発話が話の切り替わりの発話であるか否かを判定する二値分類モデル1を学習する学習装置10の構成例を示す図である。 FIG. 1 is a diagram showing a configuration example of a learning device 10 for learning a binary classification model 1 for determining whether or not an utterance constituting the series data is an utterance of switching talks.
 図1に示す学習装置10は、入力部11と、二値分類学習部12とを備える。 The learning device 10 shown in FIG. 1 includes an input unit 11 and a binary classification learning unit 12.
 入力部11は、複数の話題を含む対話の系列データが入力される。系列データは、例えば、オペレータおよびカスタマの時系列的な発話が音声認識されたテキストデータである。入力部11に入力される系列データは、発話単位であってもよく、発話を分割した分割単位(例えば、単語単位または文字単位)であってもよい。入力部11は、オンラインで系列データが入力される場合には、対話中の各発話の音声認識により得られたテキストデータが逐次、入力されてよい。入力部11は、オフラインで系列データが入力される場合には、対話中の各発話の開始時刻あるいは終了時刻でソートして、各発話のテキストデータが入力されてよい。 The input unit 11 inputs the series data of the dialogue including a plurality of topics. The series data is, for example, text data in which time-series utterances of an operator and a customer are voice-recognized. The series data input to the input unit 11 may be an utterance unit or a division unit (for example, a word unit or a character unit) in which the utterance is divided. When the series data is input online, the input unit 11 may sequentially input the text data obtained by the voice recognition of each utterance during the dialogue. When the series data is input offline, the input unit 11 may sort the start time or end time of each utterance during the dialogue and input the text data of each utterance.
 また、入力部11は、系列データを構成する発話または発話を分割した分割単位に対して付与された、話の切り替わりであるか否かを示す二値ラベル(第1のラベル)が入力される。二値ラベルは、例えば、「1(話の切り替わりである)」または「0(話の切り替わりでない)」、あるいは、「True(話の切り替わりである)」または「False(話の切り替わりでない)」などのラベルである。また、入力部11は、発話またはその分割単位に対して、話の切り替わりを示す何らかのラベルが付与されていれば、「True(話の切り替わりである)」とみなし、話の切り替わりを示す何らかのラベルが付与されていなければ、「False(話の切り替わりでない)」とみなしてよい。 Further, the input unit 11 inputs a binary label (first label) indicating whether or not the utterance constitutes the series data or the utterance is divided into divided units, indicating whether or not the utterance is switched. .. The binary label is, for example, "1 (switching story)" or "0 (not switching story)", or "True (switching story)" or "False (not switching story)". Labels such as. Further, if the utterance or its division unit is given some label indicating the change of the story, the input unit 11 considers it as "True (change of the story)" and some label indicating the change of the story. If is not given, it may be regarded as "False (not a change of utterance)".
 二値ラベルは系列データを構成する発話またはその分割単位に対して予め人手により付与される。上述したように、話の切り替わりに発せられることが多い語句がある。二値ラベルは、例えば、これらの語句に基づき付与される。なお、例えば、機器の故障を例にすると、機器の故障に関する話題であるか否かを分類したい場合には、原因に関わらず機器の故障に関する発話の話題は「機器の故障」となる。一方、故障の原因に応じて話題を分類したい場合には、故障の原因ごとに異なる話題となる。したがって、分類したい話題の決め方によっては、話に区切りがついても、話題が切り替わっていない場合がある。そのため、二値ラベルの付与にあたっては、ある話題から同じ話題に遷移する発話であっても、話の切り替わりである可能性がある発話またはその分割単位に対して、話の切り替わりであることを示すラベルが付与されることが好ましい。こうすることで、話の切り替わりの発話についての正例を増やし、話の切り替わりの発話の判定の精度を高めることができる。 The binary label is manually attached to the utterances that make up the series data or their division units in advance. As mentioned above, there are words and phrases that are often spoken at the transition of the story. Binary labels are given, for example, based on these terms. For example, taking the failure of a device as an example, when it is desired to classify whether or not the topic is related to the failure of the device, the topic of the utterance regarding the failure of the device is "device failure" regardless of the cause. On the other hand, if you want to classify topics according to the cause of the failure, the topic will be different for each cause of the failure. Therefore, depending on how the topic to be classified is decided, the topic may not be switched even if the story is divided. Therefore, when assigning a binary label, it is shown that even an utterance that transitions from a certain topic to the same topic is a change of story for an utterance that may be a change of story or a division unit thereof. It is preferable that a label is attached. By doing so, it is possible to increase the number of positive examples of the utterance of the story change and improve the accuracy of the determination of the utterance of the story change.
 このように、入力部11は、複数の話題を含む対話の系列データと、系列データを構成する発話またはその分割単位に対して付与された、話の切り替わりであるか否かを示す二値ラベルとが入力される。入力部11は、入力された系列データおよび二値ラベルを二値分類学習部12に出力する。 In this way, the input unit 11 is a binary label indicating whether or not the series data of the dialogue including a plurality of topics and the utterances constituting the series data or the division unit thereof are switched. Is entered. The input unit 11 outputs the input series data and the binary label to the binary classification learning unit 12.
 二値分類学習部12は、入力部11から出力された系列データおよび二値ラベルを教師データとして学習を行い、系列データにおける発話が話の切り替わりの発話であるか否かを判定する二値分類モデル1(第1のモデル)を学習する。したがって、二値分類モデル1は、複数の話題を含む対話の系列データを構成する発話またはその分割単位に対して、話の切り替わりであるか否かを示す二値ラベル(第1のラベル)が付与された教師データ(第1の教師データ)に基づいて学習されたモデルである。モデルの学習には、時系列的なデータの学習に適したLSTMなどを用いることができる。 The binary classification learning unit 12 learns using the series data and the binary label output from the input unit 11 as teacher data, and determines whether or not the utterance in the series data is a talk switching utterance. Learn model 1 (first model). Therefore, in the binary classification model 1, a binary label (first label) indicating whether or not the utterance is switched with respect to the utterance or its division unit constituting the series data of the dialogue including a plurality of topics is provided. It is a model trained based on the given teacher data (first teacher data). For model training, LSTM or the like suitable for learning time-series data can be used.
 上述したように、二値分類モデル1の学習に用いられる教師データにおいては、ある話題から同じ話題に遷移する発話を含めて、話の切り替わりである可能性がある発話またはその分割単位に対して、話の切り替わりであることを示すラベルが付与される。したがって、このような教師データを用いて学習された二値分類モデル1によれば、分類したい話題の決め方によっては、話題が切り替わっておらず、同じ話題に関連する発話が続く区間内の発話であっても、話の切り替わりの発話と判定されることがある。 As described above, in the teacher data used for learning the binary classification model 1, for utterances that may be a change of talk or division units thereof, including utterances that transition from one topic to the same topic. , A label indicating that the story is switched is given. Therefore, according to the binary classification model 1 learned using such teacher data, the topics are not switched depending on how the topic to be classified is determined, and the utterances related to the same topic continue in the section. Even if there is, it may be determined that the utterance is a change of story.
 次に、図2を参照して、話題を分類(推定)する多値分類モデル2を学習する学習装置20の構成について説明する。 Next, with reference to FIG. 2, the configuration of the learning device 20 for learning the multi-value classification model 2 for classifying (estimating) topics will be described.
 図2に示すように、学習装置20は、入力部21と、多値ラベル補完部22と、多値分類学習部23とを備える。 As shown in FIG. 2, the learning device 20 includes an input unit 21, a multi-value label complement unit 22, and a multi-value classification learning unit 23.
 入力部21は、複数の話題を含む対話の系列データが入力される。また、入力部21は、系列データを構成する発話またはその分割単位に対して付与された、話の切り替わりであるか否かを示す二値ラベルが入力される。また、入力部21は、系列データにおける、1つの話題が続く範囲およびその範囲における話題を示す多値ラベルが入力される。系列データおよび二値ラベルは、図1に示す入力部11に入力される系列データおよび二値ラベルと同様である。多値ラベルは人手により付与される。具体的には、系列データにおいて、1つの話題が続く範囲が特定され、複数の話題のラベルの中から、その特定された範囲における話題を示す多値ラベルが付与される。1つの系列データに対する二値ラベルと多値ラベルとは、別々のファイルで入力されてもよいし、1つのファイルでまとめて入力されてもよい。 The input unit 21 inputs the series data of the dialogue including a plurality of topics. Further, the input unit 21 inputs a binary label indicating whether or not the utterance constitutes the series data or the division unit thereof, which indicates whether or not the utterance is switched. Further, the input unit 21 inputs a range in which one topic continues in the series data and a multi-valued label indicating a topic in the range. The series data and the binary label are the same as the series data and the binary label input to the input unit 11 shown in FIG. Multi-valued labels are given manually. Specifically, in the series data, a range in which one topic continues is specified, and a multi-valued label indicating a topic in the specified range is assigned from labels of a plurality of topics. The binary label and the multi-valued label for one series data may be input in separate files, or may be input together in one file.
 入力部21は、入力された、系列データ、二値ラベルおよび多値ラベルを多値ラベル補完部22に出力する。 The input unit 21 outputs the input series data, binary label, and multi-value label to the multi-value label complement unit 22.
 多値ラベル補完部22は、入力部21から入力された系列データ、二値ラベルおよび多値ラベルから、多値分類モデル2を学習するための教師データ(第2の教師データ)を生成する。具体的には、多値ラベル補完部22は、話の切り替わりであることを示すラベルが付与された発話またはその分割単位に対して、その発話が含まれる範囲における話題を示す多値ラベルを付与する。上述したように、教師データとしての二値ラベルの付与においては、ある話題から同じ話題に遷移する発話も含めて、話の切り替わりである可能性がある発話またはその分割単位に対して、話の切り替わりであることを示すラベルが付与される。したがって、例えば、同じ話題に関連する発話が続く範囲内の発話であっても、話の切り替わりであることを示すラベルが付与されることがある。多値ラベル補完部22は、そのような発話またはその分割単位に対しても、その発話が含まれる範囲における話題を示す多値ラベルを付与する。こうすることで、各話題に関連する発話の教師データを増やし、話題の推定の精度向上を図ることができる。 The multi-value label complement unit 22 generates teacher data (second teacher data) for learning the multi-value classification model 2 from the series data, the binary label, and the multi-value label input from the input unit 21. Specifically, the multi-valued label complementing unit 22 assigns a multi-valued label indicating a topic in the range including the utterance to the utterance or the division unit thereof to which the label indicating that the utterance is switched is given. do. As described above, in assigning a binary label as teacher data, for an utterance that may be a change of story or a division unit thereof, including an utterance that transitions from a certain topic to the same topic. A label indicating that it is a switch is given. Therefore, for example, even if the utterances are within the range in which the utterances related to the same topic continue, a label indicating that the utterances are switched may be given. The multi-valued label complementing unit 22 also assigns a multi-valued label indicating a topic in the range including the utterance to such an utterance or a division unit thereof. By doing so, it is possible to increase the teacher data of utterances related to each topic and improve the accuracy of topic estimation.
 多値ラベル補完部22は、多値ラベルを付与した発話またはその分割単位と、その発話または分割単位に付与した多値ラベルとを多値分類学習部23に出力する。 The multi-valued label complementing unit 22 outputs the utterance to which the multi-valued label is attached or the division unit thereof and the multi-valued label assigned to the utterance or the division unit to the multi-value classification learning unit 23.
 多値分類学習部23は、多値ラベル補完部22から出力された、発話またはその分割単位と、その発話または分割単位に付与された多値ラベルとを教師データ(第2の教師データ)として、多値分類モデル2(第2のモデル)を学習する。したがって、多値分類モデル2は、系列データを構成する発話またはその分割単位に対して、その発話が関連する話題を示す多値ラベル(第2のラベル)が付与された教師データ(第2の教師データ)に基づいて学習されたモデルである。多値分類モデル2の学習に用いられる教師データは、話の切り替わりの発話またはその分割単位に対して、話の切り替わりであることを示す二値ラベルが付与されるとともに、話題が続く範囲およびその範囲における話題が特定された系列データにおいて、話の切り替わりであることを示すラベルが付与された発話またはその分割単位に、その発話が含まれる範囲における話題を示す多値ラベルを付与することで生成されたデータである。 The multi-value classification learning unit 23 uses the utterance or its division unit output from the multi-value label complement unit 22 and the multi-value label given to the utterance or division unit as teacher data (second teacher data). , Multi-value classification model 2 (second model) is learned. Therefore, in the multi-value classification model 2, the teacher data (second label) to which the multi-value label (second label) indicating the topic to which the utterance is related is given to the utterance or the division unit thereof constituting the series data. It is a model learned based on teacher data). The teacher data used for learning the multi-valued classification model 2 is given a binary label indicating that the utterance of the story change or its division unit is a story change, and the range in which the topic continues and its division unit. Generated by assigning a multi-valued label indicating a topic in the range including the utterance to the utterance or its division unit to which the label indicating that the utterance is switched is given in the series data in which the topic in the range is specified. It is the data that was made.
 次に、本実施形態に係る推定装置30の構成について、図3を参照して説明する。本実施形態に係る推定装置30は、オペレータとカスタマとの対話といった、複数の話題を含む対話の系列データにおける、話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定し、その段落における話題を推定する。 Next, the configuration of the estimation device 30 according to the present embodiment will be described with reference to FIG. The estimation device 30 according to the present embodiment is a paragraph in a paragraph from one talk change to the utterance immediately before the next switch or the utterance at the end of the dialogue in the series data of the dialogue including a plurality of topics such as the dialogue between the operator and the customer. Estimate the range and estimate the topic in that paragraph.
 図3に示すように、本実施形態に係る推定装置30は、入力部31と、判定部32と、段落推定部33と、話題推定部34と、出力部35とを備える。 As shown in FIG. 3, the estimation device 30 according to the present embodiment includes an input unit 31, a determination unit 32, a paragraph estimation unit 33, a topic estimation unit 34, and an output unit 35.
 入力部31は、複数の話題を含む系列データが入力される。入力部31に入力される系列データは、段落の範囲および段落における話題の推定の対象となる処理対象のデータである。系列データは、例えば、オペレータおよびカスタマの時系列的な発話が音声認識されたテキストデータである。入力部31は、オンラインで系列データが入力される場合には、対話中の各発話の音声認識により得られたテキストデータが逐次、入力されてよい。また、入力部31は、オフラインで系列データが入力される場合には、対話中の各発話の開始時刻あるいは終了時刻でソートして、各発話のテキストデータが入力されてよい。入力部31は、入力された系列データを判定部32に出力する。 The input unit 31 inputs series data including a plurality of topics. The series data input to the input unit 31 is data to be processed that is the target of estimation of the paragraph range and the topic in the paragraph. The series data is, for example, text data in which time-series utterances of an operator and a customer are voice-recognized. When the series data is input online, the input unit 31 may sequentially input the text data obtained by the voice recognition of each utterance during the dialogue. Further, when the series data is input offline, the input unit 31 may sort by the start time or the end time of each utterance during the dialogue and input the text data of each utterance. The input unit 31 outputs the input series data to the determination unit 32.
 判定部32は、二値分類モデル1(第1のモデル)を用いて、入力部31から出力された系列データを構成する発話が、話の切り替わりの発話であるか否かを判定し、判定の結果を段落推定部33に出力する。上述したように、二値分類モデル1は、複数の話題を含む対話の系列データを構成する、発話またはその分割単位に対して、話の切り替わりであるか否かを示す二値ラベル(第1のラベル)が付与された教師データ(第1の教師データ)に基づいて学習されたモデルである。 The determination unit 32 uses the binary classification model 1 (first model) to determine whether or not the utterance constituting the series data output from the input unit 31 is an utterance of switching of the story, and determines. The result of is output to the paragraph estimation unit 33. As described above, the binary classification model 1 is a binary label (first) indicating whether or not the utterance or its division unit constitutes the series data of the dialogue including a plurality of topics. It is a model trained based on the teacher data (first teacher data) to which the label) is given.
 段落推定部33は、判定部32による判定の結果に基づき、系列データにおける、話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定する。具体的には、段落推定部33は、判定部32により話の切り替わりの発話であると判定された発話から、その次に話の切り替わりの発話であると判定された発話の直前の発話までの範囲を、1つの段落と推定する。上述したように、二値モデル1の学習に用いられる教師データにおいては、同じ話題に関連する発話が続く範囲内の発話であっても、話の切り替わりであることを示すラベルが付与されることがある。そのため、段落推定部33は、同じ話題に関連する発話が続く範囲であっても、その範囲を複数の段落に分類することがある。 The paragraph estimation unit 33 estimates the range of paragraphs in the series data from the utterance immediately before the next switch or the utterance at the end of the dialogue in the series data based on the result of the determination by the determination unit 32. Specifically, the paragraph estimation unit 33 ranges from the utterance determined by the determination unit 32 to be the utterance of the switching of the story to the utterance immediately before the utterance determined to be the next utterance of the switching of the story. Estimate the range as one paragraph. As described above, in the teacher data used for learning the binary model 1, even if the utterances are within the range in which the utterances related to the same topic continue, a label indicating that the utterances are switched is given. There is. Therefore, the paragraph estimation unit 33 may classify the range into a plurality of paragraphs even if the utterances related to the same topic continue.
 話題推定部34は、多値分類モデル2(第2のモデル)を用いて、段落推定部33により範囲が推定された、段落または段落に含まれる発話における話題を推定する。上述したように、多値分類モデル2は、系列データを構成する発話またはその分割単位に対して、その発話が関連する話題を示す多値ラベル(第2のラベル)が付与された教師データ(第2の教師データ)に基づいて学習されたモデルである。多値分類モデル2の学習に用いられる教師データは、話の切り替わりの発話またはその分割単位に対して、話の切り替わりであることを二値ラベルが付与されるとともに、話題が続く範囲およびその範囲における話題が特定された系列データを用いて生成される。具体的には、多値分類モデル2の学習に用いられる教師データは、上記の系列データにおいて、話の切り替わりであることを二値ラベルが付与された発話またはその分割単位に、その発話が含まれる範囲における話題を示す多値ラベルを付与することで生成される。 The topic estimation unit 34 uses the multi-value classification model 2 (second model) to estimate the topic in the paragraph or the utterance contained in the paragraph whose range is estimated by the paragraph estimation unit 33. As described above, the multi-value classification model 2 is a teacher data (second label) to which a multi-value label (second label) indicating a topic related to the utterance is attached to the utterance or the division unit thereof constituting the series data. It is a model learned based on the second teacher data). The teacher data used for learning the multi-valued classification model 2 is given a binary label indicating that the utterance of the story change or its division unit is a story change, and the range in which the topic continues and the range thereof. The topic in is generated using the identified series data. Specifically, the teacher data used for learning the multi-valued classification model 2 includes the utterance in the above-mentioned series data in the utterance or the division unit thereof to which the binary label indicates that the utterance is a change of story. It is generated by adding a multi-valued label indicating the topic in the range.
 出力部35は、系列データにおける範囲が推定された段落ごとに、その段落を構成する発話を出力する。また、出力部35は、段落における話題を示す多値ラベル、段落の開示時刻および終了時刻などを出力してもよい。 The output unit 35 outputs the utterances constituting the paragraph for each paragraph whose range is estimated in the series data. Further, the output unit 35 may output a multi-valued label indicating a topic in the paragraph, the disclosure time and the end time of the paragraph, and the like.
 このように本実施形態においては、判定部32は、複数の話題を含む対話の系列データを構成する発話またはその分割単位に対して、話の切り替わりであるか否かを示す二値ラベルが付与された教師データに基づいて学習された二値分類モデル1を用いて、処理対象の系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する。そして、段落推定部33は、判定部32による判定の結果に基づき、処理対象の系列データにおける段落の範囲を推定する。また、話題推定部34は、多値分類モデル2を用いて、段落推定部33により範囲が推定された段落または段落に含まれる発話における話題を推定する。また、出力部35は、範囲が推定された段落ごとの発話、段落における話題を示す多値ラベル、あるいは、段落の開示時刻および終了時刻などを出力する。 As described above, in the present embodiment, the determination unit 32 assigns a binary label indicating whether or not the utterance is switched to the utterance or the division unit thereof constituting the series data of the dialogue including a plurality of topics. Using the binary classification model 1 learned based on the teacher data, it is determined whether or not the utterances constituting the series data to be processed are utterances of switching talks. Then, the paragraph estimation unit 33 estimates the range of paragraphs in the series data to be processed based on the result of the determination by the determination unit 32. Further, the topic estimation unit 34 estimates the topic in the paragraph or the utterance included in the paragraph whose range is estimated by the paragraph estimation unit 33 by using the multi-value classification model 2. Further, the output unit 35 outputs an utterance for each paragraph whose range is estimated, a multi-valued label indicating a topic in the paragraph, a disclosure time and an end time of the paragraph, and the like.
 また、本実施形態においては、学習装置10は、発話またはその分割単位に対して、話の切り替わりであるか否かを示す二値ラベルが付与された教師データを用いることで、系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する二値分類モデル1を生成することができる。また、学習装置20は、系列データを構成する発話または前話を分割した分割単位に対して、その発話が関連する話題を示す多値ラベルが付与された教師データを用いることで、段落または段落に含まれる発話における話題を判定する多値分類モデル2を学習することができる。また、推定装置30は、二値分類モデル1の判定の結果に基づき、系列データにおける段落の範囲を推定することができる。また、推定装置30は、多値分類モデル2を用いて、範囲が推定された段落または段落を構成する発話における話題を推定することができる。したがって、本実施形態に係る推定装置30によれば、複数の話題を含む対話の系列データから、話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定することができる。また、本実施形態に係る推定装置30によれば、系列データにおける段落の範囲を推定することで、段落に含まれる発話に限って話題を推定することができるので、話題の推定の精度向上を図ることができる。また、本実施形態に係る推定装置30によれば、段落を構成する発話に限定して話題を推定することができるので、話題の推定精度の向上を図ることができる。 Further, in the present embodiment, the learning device 10 configures the series data by using the teacher data to which the binary label indicating whether or not the utterance is switched is used for the utterance or the division unit thereof. It is possible to generate a binary classification model 1 for determining whether or not the utterance to be spoken is an utterance of switching talks. Further, the learning device 20 uses the teacher data to which the multi-valued label indicating the topic related to the utterance is given to the divided unit obtained by dividing the utterance or the previous utterance constituting the series data, so that the paragraph or the paragraph can be used. It is possible to learn the multi-value classification model 2 for determining the topic in the utterance included in. Further, the estimation device 30 can estimate the range of paragraphs in the series data based on the result of the determination of the binary classification model 1. In addition, the estimation device 30 can use the multi-value classification model 2 to estimate a paragraph whose range has been estimated or a topic in an utterance constituting the paragraph. Therefore, according to the estimation device 30 according to the present embodiment, the range of paragraphs from the utterance immediately before the next switch or the utterance at the end of the dialogue is estimated from the series data of the dialogue including a plurality of topics. be able to. Further, according to the estimation device 30 according to the present embodiment, by estimating the range of the paragraph in the series data, the topic can be estimated only for the utterances included in the paragraph, so that the accuracy of the estimation of the topic can be improved. Can be planned. Further, according to the estimation device 30 according to the present embodiment, the topic can be estimated only for the utterances constituting the paragraph, so that the estimation accuracy of the topic can be improved.
 図3においては、推定装置30は、多値分類モデル2を用いて話題を推定する例を用いて説明したが、本開示はこれに限られるものではない。上述したように、多値分類モデル2の学習には、系列データにおける1つの話題が連続する範囲およびその範囲における話題が人手により特定された教師データが用いられる。少数の話題を対象とする場合には、このような教師データを準備することも比較的容易である。一方、多数の話題を対象とする場合など、1つの話題が続く範囲、およびその範囲における話題を特定した教師データを、準備することが困難な場合がある。本開示においては、このような場合にも、多値分類モデル2を用いずに、話題を推定することも可能である。 In FIG. 3, the estimation device 30 has been described with an example of estimating a topic using the multi-value classification model 2, but the present disclosure is not limited to this. As described above, in the learning of the multi-value classification model 2, teacher data in which one topic in the series data is continuous and the topic in the range is manually specified is used. It is also relatively easy to prepare such teacher data when targeting a small number of topics. On the other hand, it may be difficult to prepare teacher data that specifies a range in which one topic continues and a topic in that range, such as when a large number of topics are targeted. In the present disclosure, even in such a case, it is possible to estimate the topic without using the multi-value classification model 2.
 図4は、本実施形態に係る、多値分類モデル2を用いずに話題を推定する推定装置30aの構成例を示す図である。図4において、図3と同様の構成には同じ符号を付し、説明を省略する。 FIG. 4 is a diagram showing a configuration example of an estimation device 30a for estimating a topic without using the multi-value classification model 2 according to the present embodiment. In FIG. 4, the same components as those in FIG. 3 are designated by the same reference numerals, and the description thereof will be omitted.
 図4に示すように、推定装置30aは、入力部31と、判定部32と、段落推定部33と、キーワード抽出部36と、話題推定部34aと、出力部35とを備える。図4に示す推定装置30aは、図3に示す推定装置30と比較して、キーワード抽出部36を追加した点と、話題推定部34を話題推定部34aに変更した点とが異なる。 As shown in FIG. 4, the estimation device 30a includes an input unit 31, a determination unit 32, a paragraph estimation unit 33, a keyword extraction unit 36, a topic estimation unit 34a, and an output unit 35. The estimation device 30a shown in FIG. 4 is different from the estimation device 30 shown in FIG. 3 in that the keyword extraction unit 36 is added and the topic estimation unit 34 is changed to the topic estimation unit 34a.
 キーワード抽出部36は、段落推定部33により範囲が推定された段落に含まれる発話から、少なくとも1つのキーワードを抽出する。キーワードを抽出する手法は、任意の手法を用いることができ、例えば、tf-idf(Term Frequency - Inverse Document Frequency)などの既存の手法を用いることができる。キーワード抽出部36が抽出するキーワードの数は、予め所定の数に制限されてもよいし、ユーザが指定してもよい。 The keyword extraction unit 36 extracts at least one keyword from the utterances included in the paragraph whose range is estimated by the paragraph estimation unit 33. Any method can be used as the method for extracting keywords, and for example, an existing method such as tf-idf (Term Frequency-Inverse Document Frequency) can be used. The number of keywords extracted by the keyword extraction unit 36 may be limited to a predetermined number in advance, or may be specified by the user.
 話題推定部34aは、キーワード抽出部36により、段落に含まれる発話から抽出されたキーワードに基づき、その段落または段落に含まれる発話における話題を推定する。話題推定部34aは、例えば、抽出されたキーワードを段落または段落に含まれる発話における話題と推定してよい。また、話題推定部34aは、例えば、予め規定された複数の話題の中から、抽出されたキーワードと類似性の高い話題を、段落または段落に含まれる発話における話題と推定してもよい。 The topic estimation unit 34a estimates the topic in the paragraph or the utterance contained in the paragraph based on the keywords extracted from the utterance included in the paragraph by the keyword extraction unit 36. The topic estimation unit 34a may, for example, estimate the extracted keyword as a paragraph or a topic in an utterance contained in the paragraph. Further, the topic estimation unit 34a may estimate, for example, a topic having a high similarity to the extracted keyword from a plurality of predetermined topics as a paragraph or a topic in the utterance included in the paragraph.
 このように、図4に示す推定装置30aによれば、多値分類モデル2を用いずに、段落または段落に含まれる発話における話題を推定することができる。そのため、話題の範囲およびその範囲における話題が特定された大量の教師データを用意することが困難な場合にも、系列データにおける話題を推定することができる。 As described above, according to the estimation device 30a shown in FIG. 4, it is possible to estimate the topic in the paragraph or the utterance contained in the paragraph without using the multi-value classification model 2. Therefore, even when it is difficult to prepare a range of topics and a large amount of teacher data in which the topics in the range are specified, it is possible to estimate the topics in the series data.
 図5は、本実施形態に係る推定装置30bの構成例を示す図である。図5に示す推定装置30bは、図4に示す推定装置30aと同様に、多値分類モデル2を用いずに話題を推定する。図5において、図4と同様の構成には同じ符号を付し、説明を省略する。 FIG. 5 is a diagram showing a configuration example of the estimation device 30b according to the present embodiment. Like the estimation device 30a shown in FIG. 4, the estimation device 30b shown in FIG. 5 estimates the topic without using the multi-value classification model 2. In FIG. 5, the same components as those in FIG. 4 are designated by the same reference numerals, and the description thereof will be omitted.
 図5に示すように、推定装置30bは、入力部31と、判定部32と、段落推定部33と、クラスタリング部37と、キーワード抽出部36bと、話題推定部34bと、出力部35とを備える。図5に示す推定装置30bは、図4に示す推定装置30aと比較して、クラスタリング部37を追加した点と、キーワード抽出部36をキーワード抽出部36bに変更した点と、話題推定部34aを話題推定部34bに変更した点とが異なる。 As shown in FIG. 5, the estimation device 30b includes an input unit 31, a determination unit 32, a paragraph estimation unit 33, a clustering unit 37, a keyword extraction unit 36b, a topic estimation unit 34b, and an output unit 35. Be prepared. The estimation device 30b shown in FIG. 5 has a point that a clustering unit 37 is added, a point that the keyword extraction unit 36 is changed to a keyword extraction unit 36b, and a topic estimation unit 34a, as compared with the estimation device 30a shown in FIG. It is different from the point changed to the topic estimation unit 34b.
 図5に示す推定装置30bにおいては、少なくとも1以上の系列データが入力される。クラスタリング部37は、入力された1つ以上の系列データについて段落推定部33により範囲が推定された複数の段落を、類似する段落ごとにクラスタリングする。クラスタリングの手法は、既存の任意の手法を用いることができる。クラスタリング部37は、類似する段落からなるクラスタの中で代表の段落を決定する。クラスタリング部37は、例えば、クラスタを構成する段落のうち、クラスタの中心の段落を代表の段落と決定する。また、クラスタリング部37は、例えば、クラスタを構成する段落のうち、任意の段落を代表の段落と決定してもよい。 In the estimation device 30b shown in FIG. 5, at least one or more series data is input. The clustering unit 37 clusters a plurality of paragraphs whose range is estimated by the paragraph estimation unit 33 for one or more input series data for each similar paragraph. As the clustering method, any existing method can be used. The clustering unit 37 determines a representative paragraph in a cluster consisting of similar paragraphs. The clustering unit 37 determines, for example, the paragraph at the center of the cluster as the representative paragraph among the paragraphs constituting the cluster. Further, the clustering unit 37 may determine, for example, any paragraph among the paragraphs constituting the cluster as a representative paragraph.
 キーワード抽出部36bは、クラスタを構成する段落のうち、クラスタリング部37により決定された、代表の段落に含まれる発話からキーワードを抽出する。 The keyword extraction unit 36b extracts keywords from the utterances included in the representative paragraph determined by the clustering unit 37 among the paragraphs constituting the cluster.
 話題推定部34bは、クラスタの代表の段落に含まれる発話から、キーワード抽出部36bにより抽出されたキーワードに基づき、そのクラスタを構成する段落における話題を推定する。具体的には、話題推定部34bは、クラスタの代表の段落に含まれる発話から抽出されたキーワードに基づき推定した話題を、そのクラスタを構成する全ての段落における話題と推定する。 The topic estimation unit 34b estimates the topic in the paragraph constituting the cluster based on the keywords extracted by the keyword extraction unit 36b from the utterances included in the paragraph representing the cluster. Specifically, the topic estimation unit 34b estimates a topic estimated based on a keyword extracted from an utterance included in a paragraph representing a cluster as a topic in all paragraphs constituting the cluster.
 また、図3から図5においては、推定装置30,30a,30bは、コンタクトセンタにおけるオペレータとカスタマとの対話の音声認識の結果を処理する例を用いて説明したが、本開示はこれに限られるものではない。例えば、推定装置30,30a,30bにおいて、テキストチャットに対する形態素解析を行う形態素解析部が入力部31の後段に設けられてもよい。 Further, in FIGS. 3 to 5, the estimation devices 30, 30a, and 30b have been described by using an example of processing the result of voice recognition of the dialogue between the operator and the customer in the contact center, but the present disclosure is limited to this. It is not something that can be done. For example, in the estimation devices 30, 30a, 30b, a morphological analysis unit that performs morphological analysis for text chat may be provided after the input unit 31.
 また、図3から図5においては、複数の発話が時系列的に並ぶ系列データが入力される例を用いて説明したが、本開示はこれに限られるものではない。系列データを構成する発話を1つずつ入力するために、系列データから発話を1つずつ取り出す機能部が入力部31の前段に設けられてもよい。 Further, in FIGS. 3 to 5, the description has been made using an example in which series data in which a plurality of utterances are arranged in chronological order is input, but the present disclosure is not limited to this. In order to input the utterances constituting the series data one by one, a function unit for extracting the utterances one by one from the series data may be provided in front of the input unit 31.
 図6は、図2に示す学習装置20における多値ラベルの補完について説明するためのフローチャートである。 FIG. 6 is a flowchart for explaining the complementation of the multi-valued label in the learning device 20 shown in FIG.
 多値ラベル補完部22は、入力部21に入力された系列データから話題を示す多値ラベル、および、話の切り替わりを示す二値ラベルが付与されている発話を1つずつ読み込む(ステップS11)。なお、多値ラベルは話題を示す範囲の最初の発話のみに付与され、他の発話には付与されていない。話の切り替わりを示す二値ラベルは、話の切り替わりを示す発話のみに付与されており、他の発話には付与されていない。 The multi-valued label complementing unit 22 reads the utterances to which the multi-valued label indicating the topic and the binary label indicating the switching of the talk are attached one by one from the series data input to the input unit 21 (step S11). .. The multi-valued label is given only to the first utterance in the range indicating the topic, and is not given to other utterances. The binary label indicating the change of talk is given only to the utterance showing the change of talk, and is not given to other utterances.
 多値ラベル補完部22は、読み込んだ発話に話題を示す多値ラベルが付与されているか否かを判定する(ステップS12)。 The multi-valued label complementing unit 22 determines whether or not a multi-valued label indicating a topic is attached to the read utterance (step S12).
 多値ラベルが付与されていると判定した場合(ステップS12:Yes)、多値ラベル補完部22は、読み込んだ発話の多値ラベルが分かるように上記発話とは別に、不図示の多値ラベル一時記憶装置にその多値ラベルを記憶する。多値ラベル補完部22は、既に多値ラベル一時記憶装置に記憶している多値ラベルが存在している場合には、記憶している多値ラベルを読み込んだ発話に付与されている多値ラベルに更新して多値ラベル一時記憶装置に記憶する(ステップS13)。 When it is determined that the multi-value label is attached (step S12: Yes), the multi-value label complementing unit 22 separates the multi-value label of the read utterance so that the multi-value label of the read utterance can be understood. Store the multi-valued label in a temporary storage device. When the multi-value label already stored in the multi-value label temporary storage device exists, the multi-value label complementing unit 22 gives the multi-value attached to the speech that reads the stored multi-value label. The label is updated and stored in the multi-value label temporary storage device (step S13).
 多値ラベルが付与されていないと判定した場合(ステップS12:No)、あるいは、読み込んだ発話に付与されている多値ラベルを更新・記憶すると、多値ラベル補完部22は、読み込んだ発話に、話の切り替わりであることを示す二値ラベルが付与されているか否かを判定する(ステップS14)。 When it is determined that the multi-valued label is not attached (step S12: No), or when the multi-valued label attached to the read utterance is updated and stored, the multi-valued label complementing unit 22 adds the read utterance to the read utterance. , It is determined whether or not a binary label indicating that the utterance is switched is attached (step S14).
 話の切り替わりであることを示す二値ラベルが付与されていると判定した場合(ステップS14:Yes)、多値ラベル補完部22は、多値ラベル一時記憶装置に記憶している多値ラベルを読み込んだ発話に付与する(ステップS15)。このように、多値ラベル補完部22は、読み込んだ発話に、対話の切り替わりであることを示す二値ラベルが付与されている場合、系列データにおける、その発話が含まれる範囲の話題を示す多値ラベルを付与する。 When it is determined that the binary label indicating that the utterance is switched is attached (step S14: Yes), the multi-value label complementing unit 22 stores the multi-value label stored in the multi-value label temporary storage device. It is given to the read utterance (step S15). As described above, when the read utterance is given a binary label indicating that the dialogue is switched, the multi-valued label complementing unit 22 indicates a multi-valued topic in the series data in the range including the utterance. Give a value label.
 話の切り替わりであることを示す二値ラベルが付与されていないと判定した場合(ステップS14:No)、あるいは、読み込んだ発話に多値ラベルを付与すると、多値ラベル補完部22は、読み込んだ発話が対話の終わりの発話であるか否かを判定する(ステップS16)。 When it is determined that the binary label indicating that the talk is switched is not given (step S14: No), or when the read utterance is given a multi-value label, the multi-value label complementing unit 22 reads. It is determined whether or not the utterance is the utterance at the end of the dialogue (step S16).
 読み込んだ発話が対話の終わりの発話であると判定した場合(ステップS16:Yes)、多値ラベル補完部22は、処理を終了する。 When it is determined that the read utterance is the utterance at the end of the dialogue (step S16: Yes), the multi-value label complementing unit 22 ends the process.
 読み込んだ発話が対話の終わりの発話でないと判定した場合(ステップS16:No)、多値ラベル補完部22は、ステップS11の処理に戻り、次の発話を読み込む。 When it is determined that the read utterance is not the utterance at the end of the dialogue (step S16: No), the multi-value label complementing unit 22 returns to the process of step S11 and reads the next utterance.
 図6においては、多値ラベルは、話題を示す範囲の最初の発話のみに付与され、他の発話には付与されていない例を用いて説明したが、あらかじめ、話題を示す範囲の全ての発話にその話題の多値ラベルが付与されていてもよい。この場合、話の切り替わりを示す二値ラベルが付与されていない発話から多値ラベルを削除すると、話の切り替わりを示す二値ラベルが付与されている発話のみに話題を示す多値ラベルが付与される。 In FIG. 6, the multi-valued label is given to only the first utterance in the range indicating the topic, and is not given to other utterances. However, all the utterances in the range indicating the topic are given in advance. May be labeled with a multi-valued label for that topic. In this case, if the multi-valued label is deleted from the utterances that are not given the binary label indicating the change of story, the multi-valued label indicating the topic is given only to the utterances that are given the binary label indicating the change of story. Label.
 このように、話の切り替わりの発話に、話題を示す多値ラベルが付与される方法であればどのような方法であっても構わない。 In this way, any method may be used as long as a multi-valued label indicating the topic is attached to the utterance of the change of story.
 次に、図3に示す推定装置30の動作について説明する。図7は、推定装置30の動作の一例を示すフローチャートであり、推定装置30による推定方法を説明するための図である。 Next, the operation of the estimation device 30 shown in FIG. 3 will be described. FIG. 7 is a flowchart showing an example of the operation of the estimation device 30, and is a diagram for explaining an estimation method by the estimation device 30.
 判定部32は、入力部31に入力された処理対象の系列データから1つずつ発話を読み込む(ステップS21)。判定部32は、二値分類モデル1を用いて、読み込んだ発話が話の切り替わりの発話であるか否かを判定する(ステップS22)。 The determination unit 32 reads the utterances one by one from the series data of the processing target input to the input unit 31 (step S21). The determination unit 32 uses the binary classification model 1 to determine whether or not the read utterance is a talk switching utterance (step S22).
 段落推定部33は、読み込まれた発話が、判定部32により話の切り替わりの発話であると判定されたか、または、読み込まれた発話が対話の終わりの発話であるか否かを判定する(ステップS23)。 The paragraph estimation unit 33 determines whether the read utterance is determined by the determination unit 32 to be a switching utterance, or whether the read utterance is an utterance at the end of the dialogue (step). S23).
 読み込まれた発話が話の切り替わりの発話でないと判定され、かつ、読み込まれた発話が対話の終わりの発話でないと判定した場合(ステップS23:No)、段落推定部33は、読み込まれた発話を、段落を構成する発話として蓄積する(ステップS24)。読み込まれた発話が蓄積されると、ステップS21から処理が繰り返される。 When it is determined that the read utterance is not the utterance of the switching of the talk and the read utterance is not the utterance at the end of the dialogue (step S23: No), the paragraph estimation unit 33 determines the read utterance. , Accumulate as utterances constituting the paragraph (step S24). When the read utterances are accumulated, the process is repeated from step S21.
 読み込まれた発話が話の切り替わりの発話であると判定された、あるいは、読み込まれた発話が対話の終わりの発話であると判定した場合(ステップS23:Yes)、段落推定部33は、蓄積した発話があるか否かを判定する(ステップS25)。 When it is determined that the read utterance is the utterance of the switching of the story, or the read utterance is determined to be the utterance at the end of the dialogue (step S23: Yes), the paragraph estimation unit 33 has accumulated. It is determined whether or not there is an utterance (step S25).
 蓄積した発話があると判定した場合(ステップS25:Yes)、段落推定部33は、蓄積した発話の範囲が段落であると推定し、蓄積した発話を、段落を構成する発話として話題推定部34に出力する。話題推定部34は、多値分類モデル2を用いて、段落推定部33により範囲が推定された段落における話題を推定する(ステップS26)。 When it is determined that there are accumulated utterances (step S25: Yes), the paragraph estimation unit 33 estimates that the range of the accumulated utterances is a paragraph, and the accumulated utterances are used as the utterances constituting the paragraph, and the topic estimation unit 34 Output to. The topic estimation unit 34 estimates the topic in the paragraph whose range has been estimated by the paragraph estimation unit 33 using the multi-value classification model 2 (step S26).
 図7においては、多値分類モデル2を用いて、段落ごとに話題を推定する例を用いて説明しているが、本開示はこれに限られるものではない。話題推定部34は、段落に含まれる少なくとも1つ以上の発話単位で、話題を推定してもよい。この場合、話題推定部34は、段落の最初の発話だけを用いて話題を推定してもよいし、段落の最初の発話から予め指定された数の発話を用いて話題を推定してもよい。1つ以上の発話を単位として話題を推定する場合、多値分類モデル2は、話題を推定する単位ごとに多値ラベルが付与された教師データに基づき学習される。 In FIG. 7, the explanation is given using an example of estimating a topic for each paragraph using the multi-value classification model 2, but the present disclosure is not limited to this. The topic estimation unit 34 may estimate the topic in at least one utterance unit included in the paragraph. In this case, the topic estimation unit 34 may estimate the topic using only the first utterance of the paragraph, or may estimate the topic using a predetermined number of utterances from the first utterance of the paragraph. .. When a topic is estimated in units of one or more utterances, the multi-value classification model 2 is learned based on teacher data to which a multi-value label is attached to each unit for estimating a topic.
 話題推定部34は、推定した話題を示す多値ラベルを段落に付与する(ステップS27)。段落推定部33は、発話の蓄積をリセットし(ステップS28)、読み込まれた発話が対話の終わりの発話であるか否かを判定する(ステップS29)。 The topic estimation unit 34 attaches a multi-valued label indicating the estimated topic to the paragraph (step S27). The paragraph estimation unit 33 resets the accumulation of utterances (step S28), and determines whether or not the read utterance is the utterance at the end of the dialogue (step S29).
 読み込まれた発話が対話の終わりの発話でないと判定した場合(ステップS29:No)、段落推定部33は、ステップS24の処理に戻り、読み込まれた発話を蓄積する。こうすることで、読み込まれた発話が新たな段落の最初の発話として蓄積される。 When it is determined that the read utterance is not the utterance at the end of the dialogue (step S29: No), the paragraph estimation unit 33 returns to the process of step S24 and accumulates the read utterance. By doing this, the read utterance is accumulated as the first utterance of a new paragraph.
 読み込まれた発話が対話の終わりの発話であると判定した場合(ステップS29:Yes)、段落推定部33は、処理を終了する。 When it is determined that the read utterance is the utterance at the end of the dialogue (step S29: Yes), the paragraph estimation unit 33 ends the process.
 このように、推定装置30による推定方法は、判定ステップ(ステップS22)と、段落推定ステップ(ステップS23~ステップS25)とを含む。判定ステップでは、複数の話題を含む対話の系列データを構成する発話またはその分割単位に対して、話の切り替わりであるか否かを示す二値ラベル(第1のラベル)が付与された教師データ(第1の教師データ)に基づいて学習された二値分類モデル1(第1のモデル)を用いて、処理対象の系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する。段落推定ステップでは、判定の結果に基づき、処理対象の系列データにおける、話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定する。 As described above, the estimation method by the estimation device 30 includes a determination step (step S22) and a paragraph estimation step (steps S23 to S25). In the determination step, teacher data to which a binary label (first label) indicating whether or not the utterance is switched is given to the utterance or its division unit constituting the series data of the dialogue including a plurality of topics. Using the binary classification model 1 (first model) learned based on (first teacher data), whether or not the utterances constituting the series data to be processed are utterances of switching stories. judge. In the paragraph estimation step, based on the result of the determination, the range of paragraphs in the series data to be processed from the utterance immediately before the next switch or the utterance at the end of the dialogue is estimated.
 発話またはその分割単位に対して、話の切り替わりであるか否かを示す二値ラベルが付与された教師データを用いることで、系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する二値分類モデル1を生成することができる。そして、二値分類モデル1の判定の結果に基づき、処理対象の系列データにおける段落の範囲を推定することができる。したがって、複数の話題を含む対話の系列データにおける段落の範囲を推定することができる。 Whether or not the utterance that constitutes the series data is the utterance of the switching of the story by using the teacher data to which the binary label indicating whether or not the story is switched is attached to the utterance or its division unit. It is possible to generate a binary classification model 1 for determining whether or not. Then, based on the result of the determination of the binary classification model 1, the range of paragraphs in the series data to be processed can be estimated. Therefore, it is possible to estimate the range of paragraphs in the series data of a dialogue containing a plurality of topics.
 また、本実施形態に係る推定方法は、話題推定ステップ(ステップS26)をさらに含んでよい。話題推定ステップでは、系列データを構成する発話またはその分割単位に対して、その発話が関連する話題を示す多値ラベル(第2のラベル)が付与された教師データ(第2の教師データ)に基づいて学習された多値分類モデル2(第2のモデル)を用いて、段落または段落に含まれる発話における話題を推定する。段落の範囲を推定することで、段落に含まれる発話に限定して、話題を推定することができるので、話題の推定精度の向上を図ることができる。 Further, the estimation method according to the present embodiment may further include a topic estimation step (step S26). In the topic estimation step, the teacher data (second teacher data) to which the multi-valued label (second label) indicating the topic to which the utterance is related is given to the utterances constituting the series data or the division unit thereof. Using the multivalued classification model 2 (second model) learned based on the paragraph, the topic in the paragraph or the utterance contained in the paragraph is estimated. By estimating the range of the paragraph, the topic can be estimated only for the utterances included in the paragraph, so that the estimation accuracy of the topic can be improved.
 次に、図4に示す推定装置30aの動作について説明する。図8は、図4に示す推定装置30aの動作の一例を示すフローチャートであり、推定装置30aによる推定方法を説明するための図である。図8において、図7と同様の処理には同じ符号を付し、説明を省略する。 Next, the operation of the estimation device 30a shown in FIG. 4 will be described. FIG. 8 is a flowchart showing an example of the operation of the estimation device 30a shown in FIG. 4, and is a diagram for explaining an estimation method by the estimation device 30a. In FIG. 8, the same processing as in FIG. 7 is designated by the same reference numerals, and the description thereof will be omitted.
 蓄積した発話があると判定した場合(ステップS25:Yes)、段落推定部33は、蓄積した発話の範囲が段落であると推定し、蓄積した発話をキーワード抽出部36に出力する。キーワード抽出部36は、段落推定部33により範囲が推定された段落に含まれる発話からキーワードを抽出する(ステップS31)。話題推定部34aは、段落に含まれる発話からキーワード抽出部36により抽出されたキーワードに基づき、その段落または段落に含まれる発話における話題を推定する(ステップS32)。 When it is determined that there are accumulated utterances (step S25: Yes), the paragraph estimation unit 33 estimates that the range of the accumulated utterances is a paragraph, and outputs the accumulated utterances to the keyword extraction unit 36. The keyword extraction unit 36 extracts keywords from the utterances included in the paragraph whose range is estimated by the paragraph estimation unit 33 (step S31). The topic estimation unit 34a estimates the topic in the paragraph or the utterance included in the paragraph based on the keyword extracted by the keyword extraction unit 36 from the utterance included in the paragraph (step S32).
 このように、推定装置30aによる推定方法は、キーワード抽出ステップ(ステップS31)と、話題推定ステップ(ステップS32)とを含む。キーワード抽出ステップでは、範囲が推定された段落に含まれる発話からキーワードを抽出する。話題推定ステップでは、段落に含まれる発話から抽出されたキーワードに基づき、段落または段落に含まれる発話における話題を推定する。 As described above, the estimation method by the estimation device 30a includes a keyword extraction step (step S31) and a topic estimation step (step S32). In the keyword extraction step, keywords are extracted from the utterances contained in the paragraph whose range is estimated. In the topic estimation step, the topic in the paragraph or the utterance contained in the paragraph is estimated based on the keywords extracted from the utterance contained in the paragraph.
 次に、図5に示す推定装置30bの動作について説明する。図9は、図5に示す推定装置30bによる段落の範囲の推定の動作の一例を示すフローチャートであり、推定装置30bによる推定方法を説明するための図である。図9において、図7と同様の処理には同じ符号を付し、説明を省略する。 Next, the operation of the estimation device 30b shown in FIG. 5 will be described. FIG. 9 is a flowchart showing an example of the operation of estimating the range of the paragraph by the estimation device 30b shown in FIG. 5, and is a diagram for explaining the estimation method by the estimation device 30b. In FIG. 9, the same processing as in FIG. 7 is designated by the same reference numerals, and the description thereof will be omitted.
 推定装置30bにおいては、蓄積した発話があると判定した場合(ステップS25:Yes)、段落推定部33は、蓄積した発話の範囲が段落であると推定する。そして、段落推定部33は、発話の蓄積をリセットする(ステップS28)。 When the estimation device 30b determines that there are accumulated utterances (step S25: Yes), the paragraph estimation unit 33 estimates that the range of the accumulated utterances is a paragraph. Then, the paragraph estimation unit 33 resets the accumulation of utterances (step S28).
 図10は、図5に示す推定装置30bによる話題の推定の動作の一例を示すフローチャートであり、推定装置30bによる推定方法を説明するための図である。 FIG. 10 is a flowchart showing an example of the operation of estimating a topic by the estimation device 30b shown in FIG. 5, and is a diagram for explaining an estimation method by the estimation device 30b.
 クラスタリング部37は、段落推定部33により範囲が推定された段落を読み込む(ステップS41)。クラスタリング部37は、少なくとも1つ以上の系列データに含まれる複数の段落を読み込む。すなわち、クラスタリング部37は、ステップS41の処理を必要な回数だけ繰り返す。 The clustering unit 37 reads the paragraph whose range has been estimated by the paragraph estimation unit 33 (step S41). The clustering unit 37 reads a plurality of paragraphs contained in at least one or more series data. That is, the clustering unit 37 repeats the process of step S41 as many times as necessary.
 クラスタリング部37は、読み込んだ複数の段落を、類似する段落ごとにクラスタリングする(ステップS42)。 The clustering unit 37 clusters a plurality of read paragraphs for each similar paragraph (step S42).
 次に、クラスタリング部37は、未処理のクラスタがないか否かを判定する(ステップS43)。未処理のクラスタとは、クラスタに含まれる段落に対する多値ラベルの付与が行われていないクラスタである。 Next, the clustering unit 37 determines whether or not there are unprocessed clusters (step S43). An unprocessed cluster is a cluster in which paragraphs contained in the cluster are not given multi-value labels.
 未処理のクラスタが存在すると判定した場合(ステップS43:No)、クラスタリング部37は、未処理のクラスタのうちの1つのクラスタを処理対象のクラスタと決定し、処理対象のクラスタに含まれる段落の中から、代表の段落を決定する(ステップS44)。クラスタリング部37は、例えば、クラスタの中心の段落を代表の段落と決定する。 When it is determined that an unprocessed cluster exists (step S43: No), the clustering unit 37 determines one of the unprocessed clusters as the cluster to be processed, and the paragraph included in the cluster to be processed is included. A representative paragraph is determined from the inside (step S44). The clustering unit 37 determines, for example, the paragraph at the center of the cluster as the representative paragraph.
 キーワード抽出部36bは、クラスタリング部37により決定されたクラスタの代表の段落に含まれる発話からキーワードを抽出する(ステップS45)。 The keyword extraction unit 36b extracts keywords from the utterances included in the representative paragraph of the cluster determined by the clustering unit 37 (step S45).
 話題推定部34bは、キーワード抽出部36bにより抽出されたキーワードに基づき、クラスタの代表の段落における話題を推定する(ステップS46)。次に、話題推定部34bは、未処理の段落がないか否かを判定する(ステップS47)。未処理の段落とは、処理対象のクラスタに含まれる段落のうち、多値ラベルが付与されていない段落である。 The topic estimation unit 34b estimates the topic in the paragraph representing the cluster based on the keywords extracted by the keyword extraction unit 36b (step S46). Next, the topic estimation unit 34b determines whether or not there is an unprocessed paragraph (step S47). The unprocessed paragraph is a paragraph included in the cluster to be processed and is not given a multi-value label.
 未処理の段落があると判定した場合(ステップS47:No)、話題推定部34bは、クラスタに含まれる未処理の段落に対して、そのクラスタの代表の段落から抽出したキーワードに基づき推定した話題を示す多値ラベルを付与する(ステップS48)。そして、話題推定部34bは、ステップS47の処理に戻る。 When it is determined that there is an unprocessed paragraph (step S47: No), the topic estimation unit 34b estimates the unprocessed paragraph included in the cluster based on the keyword extracted from the representative paragraph of the cluster. Is given a multi-valued label indicating (step S48). Then, the topic estimation unit 34b returns to the process of step S47.
 話題推定部34bにより未処理の段落がないと判定された場合(ステップS47:Yes)、ステップS43から処理が繰り返される。 When the topic estimation unit 34b determines that there is no unprocessed paragraph (step S47: Yes), the process is repeated from step S43.
 このように、推定装置30bによる推定方法は、クラスタリングステップ(ステップS42)をさらに備える。クラスタリングステップでは、1または複数の系列データに基づき範囲が推定された複数の段落を、類似する段落ごとにクラスタリングする。キーワード抽出ステップでは、類似する段落からなるクラスタに含まれる段落のうち、代表の段落に含まれる発話からキーワードを抽出する。話題推定ステップでは、代表の段落に含まれる発話から抽出されたキーワードに基づき、代表の段落を含むクラスタを構成する段落における話題を推定する。 As described above, the estimation method by the estimation device 30b further includes a clustering step (step S42). In the clustering step, a plurality of paragraphs whose range is estimated based on one or a plurality of series data are clustered for each similar paragraph. In the keyword extraction step, keywords are extracted from the utterances included in the representative paragraph among the paragraphs included in the cluster consisting of similar paragraphs. In the topic estimation step, the topic in the paragraphs constituting the cluster including the representative paragraph is estimated based on the keywords extracted from the utterances included in the representative paragraph.
 次に、モデルの学習(二値分類モデル1および多値分類モデル2)について、図11に示す具体例を用いて説明する。以下では、系列データには、「話題A」、「話題B」、「話題C」、「話題D」および「話題E」の5つの話題が含まれるものとする。 Next, model learning (binary classification model 1 and multi-value classification model 2) will be described using a specific example shown in FIG. In the following, it is assumed that the series data includes five topics, "topic A", "topic B", "topic C", "topic D", and "topic E".
 図11に示すように、教師データとして用いられる系列データにおいて、1つの話題が続く範囲と、その範囲における話題とが人手により特定され、1つの話題が続く範囲それぞれに対して、その範囲における話題を示す多値ラベルが付与される。また、系列データを構成する発話に対して、話の切り替わりであるか否かを示す二値ラベルが人手により付与される。なお、図11においては、図の簡略化のため、話の切り替わりの発話に対してのみ、その発話が話の切り替わりであることを示している。上述したように、1つの話題に関連する発話が続く範囲内であっても、話の切り替わりの発話に対しては、話の切り替わりであることを示す二値フラグが付与される。したがって、図11においては、例えば、話題Aに関連する発話が続く範囲の途中に存在する発話にも、話の切り替わりであることを示す二値ラベルが付与されることがある。 As shown in FIG. 11, in the series data used as teacher data, the range in which one topic continues and the topic in that range are manually specified, and for each range in which one topic continues, the topic in that range. A multi-valued label indicating In addition, a binary label indicating whether or not the utterance is switched is manually attached to the utterances constituting the series data. In addition, in FIG. 11, for the sake of simplification of the figure, it is shown that the utterance is the utterance of the talk change only for the utterance of the talk change. As described above, even within the range in which the utterances related to one topic continue, a binary flag indicating that the utterances are switched is given to the utterances that are switched. Therefore, in FIG. 11, for example, an utterance existing in the middle of the range in which the utterance related to the topic A continues may be given a binary label indicating that the utterance is a change of talk.
 上述した系列データおよび二値ラベルが学習装置10に入力され、入力された系列データおよび二値ラベルに基づき、LSTMなどを用いて、二値分類モデル1が学習される。 The above-mentioned series data and binary label are input to the learning device 10, and the binary classification model 1 is trained using LSTM or the like based on the input series data and binary label.
 また、上述した系列データ、二値ラベルおよび多値ラベルが学習装置20に入力される。学習装置20では、多値ラベルの補完が行われる。すなわち、図11に示すように、話の切り替わりであることを示すラベルが付与された発話に対して、その発話が含まれる系列データの範囲における話題を示す多値ラベルが付与される。こうすることで、系列データを構成する発話に対して、その発話が関連する話題を示す多値ラベルが付与された教師データが作成される。なお、上述したように、系列データを構成する発話の分割単位に対して、その発話が関連する話題を示す多値ラベルが付与されてもよい。 Further, the above-mentioned series data, binary label and multi-value label are input to the learning device 20. In the learning device 20, the multi-valued label is complemented. That is, as shown in FIG. 11, for an utterance to which a label indicating that the utterance is switched is given, a multi-valued label indicating a topic in the range of series data including the utterance is given. By doing so, teacher data is created with a multi-valued label indicating the topic to which the utterance is related to the utterances constituting the series data. As described above, a multi-valued label indicating a topic related to the utterance may be attached to the division unit of the utterance constituting the series data.
 作成された教師データに基づき、LSTMなどを用いて、多値分類モデル2が学習される。多値分類モデル2の学習においては、多値ラベルが付与された発話だけを用いて学習が行われてもよいし、多値ラベルが付与された発話を含む段落全体の発話を用いて学習が行われてもよい。 Based on the created teacher data, the multi-value classification model 2 is learned using LSTM or the like. In the learning of the multi-value classification model 2, the learning may be performed using only the utterances with the multi-value label, or the learning may be performed using the utterances of the entire paragraph including the utterances with the multi-value label. It may be done.
 図12は、図3に示す推定装置30による話題の推定の一例を示す図である。図12においては、多値分類モデル2が発話単位で学習されているものとする。 FIG. 12 is a diagram showing an example of topic estimation by the estimation device 30 shown in FIG. In FIG. 12, it is assumed that the multi-valued classification model 2 is learned in utterance units.
 1つの対話の系列データが推定装置30に入力されると、図12に示すように、二値分類モデル1を用いて、系列データを構成する発話が、話の切り替わりの発話であるか否か判定される。そして、話の切り替わりの発話から、次の話の切り替わりの発話の直前の発話あるいは対話の終わりの発話までの範囲が1つの段落と推定される。 When the series data of one dialogue is input to the estimation device 30, as shown in FIG. 12, whether or not the utterances constituting the series data are the utterances of switching of the talks using the binary classification model 1. It is judged. Then, the range from the utterance of the change of talk to the utterance immediately before the utterance of the change of the next story or the utterance at the end of the dialogue is estimated to be one paragraph.
 次に、図12に示すように、範囲が推定された段落に含まれる発話のうち、話の切り替わりの発話であると判定された発話について、多値分類モデル2により、その発話における話題が推定される。なお、多値分類モデル2は、発話単位でなく、段落単位で学習が行われてもよい。この場合、図13に示すように、多値分類モデル2により、段落単位で、話題が推定される。 Next, as shown in FIG. 12, among the utterances included in the paragraph whose range is estimated, the utterance determined to be the utterance of the switching of the utterance is estimated by the multi-value classification model 2 as the topic in the utterance. Will be done. In the multi-valued classification model 2, learning may be performed not in utterance units but in paragraph units. In this case, as shown in FIG. 13, the topic is estimated in paragraph units by the multi-value classification model 2.
 図14は、図4に示す推定装置30aによる話題の推定の一例を示す図である。 FIG. 14 is a diagram showing an example of topic estimation by the estimation device 30a shown in FIG.
 1つの対話の系列データが推定装置30aに入力されると、図14に示すように、二値分類モデル1を用いて、系列データを構成する発話が、話の切り替わりの発話であるか否か判定される。そして、話の切り替わりの発話から、次の話の切り替わりの発話の直前の発話までの範囲が1つの段落と推定される。 When the series data of one dialogue is input to the estimation device 30a, as shown in FIG. 14, whether or not the utterance constituting the series data is the utterance of switching of the talk using the binary classification model 1. It is judged. Then, the range from the utterance of the change of story to the utterance immediately before the utterance of the change of the next story is estimated to be one paragraph.
 次に、範囲が推定された段落に含まれる発話からキーワードが抽出され、抽出されたキーワードに基づき、その段落の話題が推定され、推定された話題を示す多値ラベルが付与される。このように、多値分類モデル2を用いなくても、段落における話題を推定することができる。そのため、多値分類モデル2の学習に必要な教師データを用意することが難しい場合にも、系列データに含まれる段落の話題を推定することができる。なお、図14においては、各段落に対して異なる多値ラベル(「話題1」~「話題10」)が付与された例を示しているが、これらは必ずしも異なる話題であることを示しているわけではない。 Next, keywords are extracted from the utterances included in the paragraph whose range is estimated, the topic of that paragraph is estimated based on the extracted keywords, and a multi-valued label indicating the estimated topic is given. In this way, the topic in the paragraph can be estimated without using the multi-valued classification model 2. Therefore, even when it is difficult to prepare the teacher data necessary for learning the multi-valued classification model 2, the topic of the paragraph included in the series data can be estimated. Note that FIG. 14 shows an example in which different multi-value labels (“Topic 1” to “Topic 10”) are assigned to each paragraph, but these are necessarily different topics. Do not mean.
 図15は、図5に示す推定装置30bによる話題の推定の一例を示す図である。 FIG. 15 is a diagram showing an example of topic estimation by the estimation device 30b shown in FIG.
 1つ以上の対話の系列データが推定装置30bに入力されると、図15に示すように、二値分類モデル1を用いて、系列データを構成する発話が、話の切り替わりの発話であるか否か判定される。そして、話の切り替わりの発話から、次の話の切り替わりの発話の直前の発話までの範囲が1つの段落と推定される。 When the series data of one or more dialogues is input to the estimation device 30b, as shown in FIG. 15, is the utterance constituting the series data the utterance of the switching of the talks using the binary classification model 1? It is judged whether or not. Then, the range from the utterance of the change of story to the utterance immediately before the utterance of the change of the next story is estimated to be one paragraph.
 次に、図15に示すように、範囲の推定された複数の段落が、類似する段落ごとにクラスタリングされる。類似する段落からなるクラスタから代表の段落が決定され、代表の段落に含まれる発話からキーワードが抽出される。図15においては、太線で示される段落が、代表の段落を示す。 Next, as shown in FIG. 15, a plurality of paragraphs whose range is estimated are clustered for each similar paragraph. A representative paragraph is determined from a cluster of similar paragraphs, and keywords are extracted from the utterances contained in the representative paragraph. In FIG. 15, the paragraph shown by the thick line indicates the representative paragraph.
 次に、クラスタの代表の段落に含まれる発話から抽出されたキーワードに基づき、代表の段落における話題が推定され、推定された話題を示す多値ラベルが代表の段落に付与される。さらに、図15に示すように、クラスタを構成する他の段落にも、クラスタの代表の段落と同じ多値ラベルが付与される。 Next, the topic in the representative paragraph is estimated based on the keywords extracted from the utterances included in the representative paragraph of the cluster, and a multi-valued label indicating the estimated topic is given to the representative paragraph. Further, as shown in FIG. 15, other paragraphs constituting the cluster are also given the same multi-valued label as the representative paragraph of the cluster.
 本開示に係る推定方法(以下、「本手法」と称することがある)の有効性を示すために、実験により従来手法との比較を行った。実験では、モデルの学習用に349通話、検証用に50通話を用いた。話題を示す多値ラベルとして、話題Aから話題H、および、通話の最初の発話から1番目の話の切り替わりまでの固定的な話題Sを示す8種類のラベルを用意した。従来手法とは、発話が話の切り替わりである否かを示す二値ラベルを、多値ラベルが切り替わる発話のみに付与したデータを教師データとして用いて、二値分類モデルを学習し、また、多値ラベルが切り替わる発話のみを教師データとして用いて、多値分類モデルを学習する手法である。 In order to show the effectiveness of the estimation method according to the present disclosure (hereinafter, may be referred to as "the present method"), a comparison with the conventional method was carried out by an experiment. In the experiment, 349 calls were used for learning the model and 50 calls were used for verification. As multi-valued labels indicating a topic, eight types of labels indicating a topic A to a topic H and a fixed topic S from the first utterance of a call to the switching of the first talk are prepared. In the conventional method, a binary classification model is learned by using a binary label indicating whether or not an utterance is a change of story, and data attached only to the utterance in which the multi-value label is switched as teacher data, and also many. This is a method for learning a multi-value classification model by using only the utterances in which the value labels are switched as teacher data.
 まず、二値分類モデルによる、話の切り替わりであるか否かの判定に基づく、段落の範囲の推定精度(系列データの段落単位での分割精度)を比較した。比較結果を表1に示す。 First, we compared the estimation accuracy of the paragraph range (the accuracy of dividing the series data in paragraph units) based on the judgment of whether or not the story was switched by the binary classification model. The comparison results are shown in Table 1.
Figure JPOXMLDOC01-appb-T000001
Figure JPOXMLDOC01-appb-T000001
 上述したように、本手法では、ある話題から同じ話題に遷移する発話についても、話の切り替わり発話に含めて、段落の範囲を推定する。そのため、表1に示すように、本手法では、従来手法と比べて、適合率は下がっている。しかしながら、本手法では、従来手法では検出しきれなかった段落および話の切り替わりの発話を検出することができるようになったため、段落分割の再現率は上がった。 As mentioned above, in this method, the range of paragraphs is estimated by including the utterances that transition from a certain topic to the same topic in the utterances that change the story. Therefore, as shown in Table 1, in this method, the precision rate is lower than that in the conventional method. However, in this method, it has become possible to detect paragraphs and utterances of story switching that could not be detected by the conventional method, so that the recall rate of paragraph division has increased.
 次に、二値分類モデルにより話の切り替わりと判定された発話における、多値分類モデルによる話題の推定の精度について比較した。上述したように、従来手法では、多値ラベルが切り替わる発話のみに、人手によりその発話における話題を示す多値ラベルが付与された教師データを用いて多値分類モデルを学習した。一方、本手法では、話の切り替わりであることを示すラベルが人手により付与された発話に対して、多値ラベルを補完した教師データを用いて多値分類モデル2を学習した。従来手法で学習された多値分類モデルおよび本手法で学習された多値分類モデル2それぞれを用いて、従来手法および本手法で学習された二値分類モデルにより話の切り替わりの発話であると判定された発話における話題を推定し、その発話に対して人手により付与された正解の話題と比較した。比較の結果(適合率)を表2に示す。 Next, we compared the accuracy of topic estimation by the multi-value classification model in utterances that were determined to be story switching by the binary classification model. As described above, in the conventional method, the multi-value classification model is learned using the teacher data in which the multi-value label indicating the topic in the utterance is manually attached only to the utterance in which the multi-value label is switched. On the other hand, in this method, the multi-value classification model 2 was learned using the teacher data supplemented with the multi-value label for the utterance to which the label indicating that the story was switched was manually assigned. Using each of the multi-value classification model learned by the conventional method and the multi-value classification model 2 learned by this method, it is determined that the utterance is a switching utterance by the conventional method and the binary classification model learned by this method. The topic in the utterance was estimated and compared with the topic of the correct answer given manually to the utterance. The results of the comparison (compliance rate) are shown in Table 2.
Figure JPOXMLDOC01-appb-T000002
Figure JPOXMLDOC01-appb-T000002
 表2に示すように、本手法では、ある話題から同じ話題に遷移する発話も含めて、話の切り替わりの発話であると判定された発話における話題を、高い精度で推定できていることが分かった。話題Sについては、話の切り替わりの発話は通話の最初の発話となるため、評価を行わなかった。 As shown in Table 2, it was found that this method can estimate the topic in the utterance determined to be the utterance of the change of the story with high accuracy, including the utterance that transitions from a certain topic to the same topic. rice field. The topic S was not evaluated because the utterance of the change of talk is the first utterance of the call.
 最後に、評価対象とした100通話において、全ての発話の話題の分類の結果(F値)を評価した。この評価は、二値分類モデルによる話の切り替わりの発話の判定と、多値分類モデルによる話題の推定とを総合的に評価したものである。本手法においては、多値分類モデル2により、ある話題から同じ話題に遷移する発話についても、話の切り替わりの発話であると判定されるが、多値分類モデル2により、同じ話題への遷移の発話の多くが正しい話題に分類された。そのため、表3に示すように、従来手法と比べて、本手法の方が、総合的に高い評価結果が得られた。 Finally, the results (F value) of the classification of all utterance topics were evaluated in the 100 calls targeted for evaluation. This evaluation is a comprehensive evaluation of the determination of utterances of story switching by the binary classification model and the estimation of topics by the multi-value classification model. In this method, the multi-value classification model 2 determines that an utterance that transitions from a certain topic to the same topic is also a utterance that switches the story, but the multi-value classification model 2 determines that the transition to the same topic. Many of the utterances were classified as correct topics. Therefore, as shown in Table 3, the overall evaluation result of this method was higher than that of the conventional method.
Figure JPOXMLDOC01-appb-T000003
Figure JPOXMLDOC01-appb-T000003
 このように本実施形態においては、推定装置30は、判定部32と、段落推定部33とを備える。判定部32は、複数の話題を含む対話の系列データを構成する発話またはその分割単位に対して、話の切り替わりであるか否かを示す二値ラベル(第1のラベル)が付与された教師データ(第1の教師データ)に基づいて学習された二値分類モデル1(第1のモデル)を用いて、処理対象の系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する。段落推定部33は、判定部32による判定の結果に基づき、処理対象の系列データにおける、話の切り替わりから次の切り替わりの直前の発話または対話の終わりの発話までの段落の範囲を推定する。 As described above, in the present embodiment, the estimation device 30 includes a determination unit 32 and a paragraph estimation unit 33. The determination unit 32 is a teacher to which a binary label (first label) indicating whether or not the utterance is switched is given to the utterance or its division unit constituting the series data of the dialogue including a plurality of topics. Whether or not the utterances constituting the series data to be processed using the binary classification model 1 (first model) learned based on the data (first teacher data) are utterances of switching stories. To judge. Based on the result of the determination by the determination unit 32, the paragraph estimation unit 33 estimates the range of paragraphs in the series data to be processed from the utterance immediately before the next changeover to the utterance at the end of the dialogue.
 発話またはその分割単位に対して、話の切り替わりであるか否かを示す二値ラベルが付与された教師データを用いることで、系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する二値分類モデル1を生成することができる。そして、二値分類モデル1の判定の結果に基づき、系列データにおける段落の範囲を推定することができる。また、系列データにおける段落の範囲を推定することで、段落に含まれる発話に話題を推定する範囲を限定することができるので、段落における話題の推定の精度の向上を図ることができる。 Whether or not the utterance that constitutes the series data is the utterance of the change of story by using the teacher data to which the binary label indicating whether or not the change of the story is given to the utterance or its division unit. It is possible to generate a binary classification model 1 for determining whether or not. Then, based on the result of the determination of the binary classification model 1, the range of paragraphs in the series data can be estimated. Further, by estimating the range of the paragraph in the series data, the range of estimating the topic can be limited to the utterances included in the paragraph, so that the accuracy of estimating the topic in the paragraph can be improved.
 上述した推定装置30,30a,30bの各部として機能させるためにコンピュータを好適に用いることが可能である。そのようなコンピュータは、推定装置30,30a,30bの各部の機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPU(Central Processing Unit)によってこのプログラムを読み出して実行させることで実現することができる。すなわち、プログラムは、コンピュータを、上述した推定装置30,30a,30bとして機能させることができる。 A computer can be suitably used to function as each part of the above-mentioned estimation devices 30, 30a and 30b. In such a computer, a program describing processing contents that realize the functions of the estimation devices 30, 30a, and 30b is stored in the storage unit of the computer, and this program is stored by the CPU (Central Processing Unit) of the computer. It can be realized by reading and executing. That is, the program can make the computer function as the estimation devices 30, 30a, 30b described above.
 また、このプログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROMなどの記録媒体であってもよい。また、このプログラムは、ネットワークを介して提供することも可能である。 Further, this program may be recorded on a computer-readable medium. It can be installed on a computer using a computer-readable medium. Here, the computer-readable medium on which the program is recorded may be a non-transient recording medium. The non-transient recording medium is not particularly limited, but may be, for example, a recording medium such as a CD-ROM or a DVD-ROM. This program can also be provided via a network.
 本開示は、上述した各実施形態で特定された構成に限定されず、請求の範囲に記載した発明の要旨を逸脱しない範囲内で種々の変形が可能である。例えば、各構成部などに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の構成部などを1つに組み合わせたり、或いは分割したりすることが可能である。 The present disclosure is not limited to the configuration specified in each of the above-described embodiments, and various modifications can be made without departing from the gist of the invention described in the claims. For example, the functions included in each component can be rearranged so as not to be logically inconsistent, and a plurality of components can be combined or divided into one.
 1  二値分類モデル(第1のモデル)
 2  多値分類モデル(第2のモデル)
 10  学習装置
 11  入力部
 12  二値分類学習部
 20  学習装置
 21  入力部
 22  多値ラベル補完部
 23  多値分類学習部
 30,30a,30b  推定装置
 31  入力部
 32  判定部
 33  段落推定部
 34,34a,34b  話題推定部
 35  出力部
 36,36b  キーワード抽出部
 37  クラスタリング部
1 Binary classification model (first model)
2 Multi-value classification model (second model)
10 Learning device 11 Input unit 12 Binary classification learning unit 20 Learning device 21 Input unit 22 Multi-value label complement unit 23 Multi-value classification learning unit 30, 30a, 30b Estimator 31 Input unit 32 Judgment unit 33 Paragraph estimation unit 34, 34a , 34b Topic estimation unit 35 Output unit 36, 36b Keyword extraction unit 37 Clustering unit

Claims (7)

  1.  複数の話題を含む対話の系列データを構成する発話または前記発話を分割した分割単位に対して、話の切り替わりであるか否かを示す第1のラベルが付与された第1の教師データに基づいて学習された第1のモデルを用いて、処理対象の系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する判定ステップと、
     前記判定の結果に基づき、前記処理対象の系列データにおける、話の切り替わりから次の切り替わりの直前の発話または前記対話の終わりの発話までの段落の範囲を推定する段落推定ステップと、を含む推定方法。
    Based on the first teacher data to which the first label indicating whether or not the utterance is switched is attached to the utterance that constitutes the series data of the dialogue including a plurality of topics or the divided unit obtained by dividing the utterance. Using the first model trained in
    An estimation method including a paragraph estimation step for estimating the range of paragraphs from the change of story to the utterance immediately before the next change or the utterance at the end of the dialogue in the series data to be processed based on the result of the determination. ..
  2.  請求項1に記載の推定方法において、
     系列データを構成する発話または前記発話を分割した分割単位に対して、前記発話が関連する話題を示す第2のラベルが付与された第2の教師データに基づいて学習された第2のモデルを用いて、前記段落または前記段落に含まれる発話における話題を推定する話題推定ステップをさらに含む、推定方法。
    In the estimation method according to claim 1,
    A second model trained based on the second teacher data to which the second label indicating the topic to which the utterance is related is given to the utterance constituting the series data or the division unit obtained by dividing the utterance. An estimation method that further comprises a topic estimation step that estimates a topic in the paragraph or the utterance contained in the paragraph.
  3.  請求項2に記載の推定方法において、
     前記第2の教師データは、話の切り替わりの発話または前記発話を分割した分割単位に対して、話の切り替わりであることを示す前記第1のラベルが付与されるとともに、前記話題が続く範囲および前記範囲における話題が特定された系列データにおいて、前記第1のラベルが付与された発話または前記発話を分割した分割単位に、前記発話が含まれる範囲における話題を示す前記第2のラベルを付与することで生成されたデータである、推定方法。
    In the estimation method according to claim 2,
    The second teacher data is given the first label indicating that the utterance is a talk change, and the range in which the topic continues, and the range in which the topic continues, with respect to the utterance of the talk change or the division unit obtained by dividing the utterance. In the series data in which the topic in the range is specified, the utterance to which the first label is attached or the division unit obtained by dividing the utterance is given the second label indicating the topic in the range including the utterance. The estimation method, which is the data generated by.
  4.  請求項1に記載の推定方法において、
     前記段落に含まれる発話からキーワードを抽出するキーワード抽出ステップと、
     前記段落に含まれる発話から抽出されたキーワードに基づき、前記段落または前記段落に含まれる発話における話題を推定する話題推定ステップと、をさらに含む推定方法。
    In the estimation method according to claim 1,
    A keyword extraction step that extracts keywords from the utterances contained in the paragraph,
    An estimation method further comprising a topic estimation step for estimating a topic in the paragraph or the utterance contained in the paragraph, based on keywords extracted from the utterance contained in the paragraph.
  5.  請求項4に記載の推定方法において、
     1以上の処理対象の系列データに基づき前記範囲が推定された複数の段落を、類似する段落ごとにクラスタリングするクラスタリングステップをさらに備え、
     前記キーワード抽出ステップでは、類似する段落からなるクラスタに含まれる段落のうち、代表の段落に含まれる発話からキーワードを抽出し、
     前記話題推定ステップでは、前記代表の段落に含まれる発話から抽出されたキーワードに基づき、前記代表の段落を含むクラスタを構成する段落における話題を推定する、推定方法。
    In the estimation method according to claim 4,
    Further provided with a clustering step of clustering a plurality of paragraphs whose range is estimated based on the series data of one or more processing targets for each similar paragraph.
    In the keyword extraction step, keywords are extracted from the utterances included in the representative paragraph among the paragraphs included in the cluster consisting of similar paragraphs.
    In the topic estimation step, an estimation method for estimating a topic in a paragraph constituting a cluster including the representative paragraph based on a keyword extracted from an utterance included in the representative paragraph.
  6.  複数の話題を含む対話の系列データを構成する発話または前記発話を分割した分割単位に対して、話の切り替わりであるか否かを示す第1のラベルが付与された第1の教師データに基づいて学習された第1のモデルを用いて、処理対象の系列データを構成する発話が、話の切り替わりの発話であるか否かを判定する判定部と、
     前記判定部による判定の結果に基づき、前記処理対象の系列データにおける、話の切り替わりから次の切り替わりの直前の発話または前記対話の終わりの発話までの段落の範囲を推定する段落推定部と、を備える推定装置。
    Based on the first teacher data to which the first label indicating whether or not the utterance is switched is attached to the utterance that constitutes the series data of the dialogue including a plurality of topics or the divided unit obtained by dividing the utterance. Using the first model trained in
    Based on the result of the determination by the determination unit, the paragraph estimation unit that estimates the range of paragraphs in the series data to be processed from the utterance immediately before the next changeover to the utterance at the end of the dialogue. Estimator equipped.
  7.  請求項1から5のいずれか一項に記載の推定方法をコンピュータに実行させるためのプログラム。 A program for causing a computer to execute the estimation method according to any one of claims 1 to 5.
PCT/JP2020/023644 2020-06-16 2020-06-16 Estimation method, estimation device, and program WO2021255840A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2020/023644 WO2021255840A1 (en) 2020-06-16 2020-06-16 Estimation method, estimation device, and program
JP2022532313A JP7425368B2 (en) 2020-06-16 2021-03-25 Estimation device, estimation method, learning device, learning method and program
PCT/JP2021/012692 WO2021256043A1 (en) 2020-06-16 2021-03-25 Estimation device, estimation method, learning device, learning method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/023644 WO2021255840A1 (en) 2020-06-16 2020-06-16 Estimation method, estimation device, and program

Publications (1)

Publication Number Publication Date
WO2021255840A1 true WO2021255840A1 (en) 2021-12-23

Family

ID=79267817

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/JP2020/023644 WO2021255840A1 (en) 2020-06-16 2020-06-16 Estimation method, estimation device, and program
PCT/JP2021/012692 WO2021256043A1 (en) 2020-06-16 2021-03-25 Estimation device, estimation method, learning device, learning method and program

Family Applications After (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/012692 WO2021256043A1 (en) 2020-06-16 2021-03-25 Estimation device, estimation method, learning device, learning method and program

Country Status (2)

Country Link
JP (1) JP7425368B2 (en)
WO (2) WO2021255840A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012247912A (en) * 2011-05-26 2012-12-13 Chubu Electric Power Co Inc Speech signal processing apparatus
JP2018045639A (en) * 2016-09-16 2018-03-22 株式会社東芝 Dialog log analyzer, dialog log analysis method, and program
JP2018128575A (en) * 2017-02-08 2018-08-16 日本電信電話株式会社 End-of-talk determination device, end-of-talk determination method and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010100853A1 (en) 2009-03-04 2010-09-10 日本電気株式会社 Language model adaptation device, speech recognition device, language model adaptation method, and computer-readable recording medium
JP6857581B2 (en) 2017-09-13 2021-04-14 株式会社日立製作所 Growth interactive device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012247912A (en) * 2011-05-26 2012-12-13 Chubu Electric Power Co Inc Speech signal processing apparatus
JP2018045639A (en) * 2016-09-16 2018-03-22 株式会社東芝 Dialog log analyzer, dialog log analysis method, and program
JP2018128575A (en) * 2017-02-08 2018-08-16 日本電信電話株式会社 End-of-talk determination device, end-of-talk determination method and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAKAAKI HASEGAWA: "Automatic Knowledge Assistance System Supporting Operator Responses", NTT TECHNICAL REVIEW, vol. 17, no. 9, 1 September 2019 (2019-09-01), pages 15 - 18, XP055874245 *

Also Published As

Publication number Publication date
JP7425368B2 (en) 2024-01-31
WO2021256043A1 (en) 2021-12-23
JPWO2021256043A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
US11763193B2 (en) Systems and method for performing contextual classification using supervised and unsupervised training
US11734329B2 (en) System and method for text categorization and sentiment analysis
US10311454B2 (en) Customer interaction and experience system using emotional-semantic computing
CN109522556B (en) Intention recognition method and device
CN108153800B (en) Information processing method, information processing apparatus, and recording medium
CN108197282B (en) File data classification method and device, terminal, server and storage medium
WO2020062006A1 (en) Intent and context-aware dialogue based virtual assistance
CN113780007A (en) Corpus screening method, intention recognition model optimization method, equipment and storage medium
WO2019156103A1 (en) Faq consolidation assistance device, faq consolidation assistance method, and program
JP6208794B2 (en) Conversation analyzer, method and computer program
CA3131157A1 (en) System and method for text categorization and sentiment analysis
CN111429157A (en) Method, device and equipment for evaluating and processing complaint work order and storage medium
CN110457454A (en) A kind of dialogue method, server, conversational system and storage medium
CN111611358A (en) Information interaction method and device, electronic equipment and storage medium
CN113987151A (en) Intelligent customer service reply method and device
WO2021255840A1 (en) Estimation method, estimation device, and program
CN113934833A (en) Training data acquisition method, device and system and storage medium
CN114625878A (en) Intention identification method, interactive system and equipment
CN113094471A (en) Interactive data processing method and device
KR102078541B1 (en) Issue interest based news value evaluation apparatus and method, storage media storing the same
US20210182342A1 (en) Major point extraction device, major point extraction method, and non-transitory computer readable recording medium
CN113239164B (en) Multi-round dialogue flow construction method and device, computer equipment and storage medium
US11943392B2 (en) System and method for providing personalized customer experience in interactive communications
Nambiar et al. Discovering customer intent in real-time for streamlining service desk conversations
JP6743108B2 (en) PATTERN RECOGNITION MODEL AND PATTERN LEARNING DEVICE, GENERATION METHOD THEREOF, FAQ EXTRACTION METHOD USING THE SAME, PATTERN RECOGNITION DEVICE, AND PROGRAM

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20941066

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20941066

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP