JP5774459B2 - Discourse summary template creation system and discourse summary template creation program - Google Patents
Discourse summary template creation system and discourse summary template creation program Download PDFInfo
- Publication number
- JP5774459B2 JP5774459B2 JP2011269169A JP2011269169A JP5774459B2 JP 5774459 B2 JP5774459 B2 JP 5774459B2 JP 2011269169 A JP2011269169 A JP 2011269169A JP 2011269169 A JP2011269169 A JP 2011269169A JP 5774459 B2 JP5774459 B2 JP 5774459B2
- Authority
- JP
- Japan
- Prior art keywords
- discourse
- template
- word
- record
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014509 gene expression Effects 0.000 claims description 126
- 238000000034 method Methods 0.000 claims description 70
- 238000012545 processing Methods 0.000 claims description 67
- 230000008569 process Effects 0.000 claims description 53
- 239000013598 vector Substances 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 description 118
- 230000004044 response Effects 0.000 description 49
- 238000005206 flow analysis Methods 0.000 description 42
- 238000010195 expression analysis Methods 0.000 description 34
- 230000009467 reduction Effects 0.000 description 32
- 238000007781 pre-processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 230000010354 integration Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000011946 reduction process Methods 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 235000009508 confectionery Nutrition 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、自然言語処理の技術に関し、特に、音声認識処理により得られた談話データの構造を解析した結果から談話の要約を生成するためのテンプレートを作成する談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラムに適用して有効な技術に関するものである。 The present invention relates to a technology for natural language processing, and in particular, a discourse summary template creation system and a discourse summary template for creating a template for generating a discourse summary from a result of analyzing the structure of discourse data obtained by speech recognition processing. The present invention relates to a technology that is effective when applied to a creation program.
例えば、コールセンター業務において、オペレータやコミュニケータは、電話応対後に応対記録を作成して応対管理システム等へ保存するという一連の業務を行う必要がある。このとき、オペレータ等は、自身の記憶を頼りにして応対記録を作成するため作成に時間がかかるという問題がある。 For example, in a call center operation, an operator or a communicator needs to perform a series of operations such as creating a response record and storing it in a response management system after receiving a call. At this time, there is a problem that it takes time for the operator or the like to create a response record based on his / her memory.
また、各オペレータ等のスキルに応じて品質(内容、統一性、網羅性、簡潔性等)にバラツキが生じる。このように応対記録の品質にバラツキがあったり品質が低かったりすることにより、顧客の声を正確に把握することができなかったり、応対記録の蓄積からテキストマイニング等の技術を利用して新たな知見を得る(例えば、潜在的な問題やニーズを発掘したりFAQの候補を選定したり等)というようなことができなかったりなどの問題も生じる。 Further, quality (content, uniformity, completeness, conciseness, etc.) varies according to the skill of each operator. In this way, the quality of the response records varies or the quality is low, so it is not possible to accurately grasp the customer's voice, or from the accumulation of response records, new technologies such as text mining are used. Problems such as inability to obtain knowledge (for example, finding potential problems and needs, selecting FAQ candidates, etc.) also occur.
このような問題を解決するため、例えば、応対での対話内容を音声データとして録音・記録し、当該データを音声認識の技術を利用してテキスト化して、さらに自然言語処理の技術を適用して内容を要約することで応対記録を自動生成するということも検討されている。これにより、応対記録作成にかかるコストを削減しつつ、統一性、簡潔性を確保することで応対記録の活用性を向上させることが可能である。 In order to solve such problems, for example, the contents of the dialogue at the reception are recorded and recorded as voice data, the data is converted into text by using voice recognition technology, and further, natural language processing technology is applied. It is also considered to automatically generate a response record by summarizing the contents. As a result, it is possible to improve the usability of the service record by ensuring the uniformity and simplicity while reducing the cost for creating the service record.
このような技術として、例えば、非特許文献1には、コールセンターにおける音声対話において、音声データをテキスト化し、過去の対話内容とその営業日報から帰納的学習により再帰的に規則獲得を行い、それらの規則を用いて未知の対話内容に対して重要箇所を決定・抽出し、文体変換を行うことで営業日報を自動生成する技術が記載されている。
As such a technique, for example, in Non-Patent
人の談話を音声認識によりテキスト化したデータ(以下では「談話データ」と記載する場合がある)を活用する場合、談話データ内の文章は通常は話し言葉で記録されているため、正しい文法に則った日本語文や、書き言葉を前提とした既存の自然言語処理の技術ではうまく対応できない場合がある。また、現状の音声認識エンジンの精度では認識ミスを排除することはできず、誤認識による誤字・脱字などのノイズが多い。従って、談話データについて自然言語処理を利用して解析し、有効活用するのは困難である。 When using data obtained by converting a person's discourse into text by speech recognition (hereinafter sometimes referred to as “discourse data”), the sentences in the discourse data are usually recorded in spoken language, so follow the correct grammar. Japanese language sentences and existing natural language processing technology based on written language may not be able to cope well. Moreover, the accuracy of the current speech recognition engine cannot eliminate recognition errors, and there are many noises such as typographical errors and omissions due to erroneous recognition. Therefore, it is difficult to analyze and effectively use discourse data using natural language processing.
一方、非特許文献1の技術では、帰納的学習処理によって得た規則に基づいて対話文書全体を解析して重要文を抽出し、話し言葉から書き言葉への文体変換を行って営業日報を自動生成することができる。しかしながら、非特許文献1の技術では、一般的な要約自動生成の技術と同様に、文書全体から重要文を抽出して文体変換を行うという手順をとるため、対話文書の要約を得ることはできるものの、当該要約にユーザが必要とする項目や内容が含まれるかどうかは不確実であり、必要とする項目が含まれていなかったり、ポイントとすべき内容とは異なる内容について要約がされたりする場合も生じ得る。
On the other hand, in the technology of Non-Patent
これに対して、要約の構造とこれが適用される条件を含む情報を予め要約テンプレートとして定義しておき、要約テンプレートに条件として指定した単語の連接のパターンが談話データ内に含まれる場合に、当該要約テンプレートに談話データ中の対応する単語を当てはめて要約文章を出力するという手法が考えられる。これにより、要約テンプレートに設定した項目や内容を含み、不要な項目を含まない要約を得ることが可能となる。また、談話データの内容および談話構造の解析結果から必要な部分のみを抽出して要約を生成することができるため、他の部分にノイズやノイズによる誤った解析結果が含まれている場合でも、これらからは影響を受けずに要約を生成することができる。 On the other hand, if the information including the structure of the summary and the conditions to which it is applied is defined as a summary template in advance and the pattern of word concatenation specified as the condition in the summary template is included in the discourse data, A method of outputting a summary sentence by applying a corresponding word in discourse data to the summary template is conceivable. As a result, it is possible to obtain a summary including items and contents set in the summary template and not including unnecessary items. In addition, since it is possible to generate a summary by extracting only the necessary parts from the discourse data content and discourse structure analysis results, even if other parts contain noise or incorrect analysis results due to noise, You can generate summaries without being affected by these.
しかしながら、上記のような要約テンプレートを利用した要約の作成手法を実際の業務に適用するに際しては、十分な要約テンプレートを予め作成・定義しておくことが要求されるが、例えば管理者等が実績や経験則などから人手で多数の要約テンプレートを作成するのはなかなか困難であるという課題がある。 However, when applying the summary creation method using the summary template as described above to actual work, it is required to create and define a sufficient summary template in advance. There is a problem that it is difficult to manually create a large number of summary templates based on rules of thumb and rules of thumb.
そこで本発明の目的は、談話データの構造を解析した結果から所望の項目や内容が含まれかつ不要な項目が含まれない形の要約を生成するために用いる要約テンプレートを容易かつ高精度に作成する、もしくはこのような要約テンプレートをユーザが作成することを支援する談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラムを提供することにある。本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。 Therefore, an object of the present invention is to easily and accurately create a summary template used to generate a summary that includes desired items and contents and does not include unnecessary items from the result of analyzing the structure of discourse data. It is another object of the present invention to provide a discourse summary template creation system and a discourse summary template creation program that assists a user in creating such a summary template. The above and other objects and novel features of the present invention will be apparent from the description of this specification and the accompanying drawings.
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、以下のとおりである。 Of the inventions disclosed in this application, the outline of typical ones will be briefly described as follows.
本発明の代表的な実施の形態による談話要約テンプレート作成システムは、談話の内容がテキスト化された談話データに基づいて前記談話についての要約を生成する際に用いられ、前記談話データにおいて所定の内容の発話を行っているものと想定され前記要約に含めるべき部分を特定するための単語の連接のパターンと、前記要約に含める要約文章のひな型との対応のリストが指定され、前記連接のパターンと前記談話データとがマッチした場合に、マッチした前記連接のパターンに対応する前記要約文章のひな型から前記要約文章を生成して前記要約とするために用いられる要約テンプレートを作成するシステムであって、以下の特徴を有するものである。 A discourse summary template creation system according to a representative embodiment of the present invention is used when generating a summary about a discourse based on discourse data in which the content of a discourse is converted into text, and a predetermined content in the discourse data. A list of correspondences between word concatenation patterns for identifying the parts to be included in the summary and a template of summary sentences included in the summary is specified, and When the discourse data matches, a system for creating a summary template used to generate the summary sentence from the template of the summary sentence corresponding to the matched connection pattern and to make the summary, It has the following characteristics.
すなわち、談話要約テンプレート作成システムは、過去の要約である要約記録が蓄積された要約履歴から前記要約記録を取得して類似するものに分類してクラスタ化するクラスタリング部と、前記クラスタ毎に、当該クラスタに含まれる前記要約記録から代表となる要約記録を選択して候補文とする候補文選択部と、前記各候補文について固有表現をパラメータに置換して前記要約文章のひな形とし、前記要約テンプレートを作成するテンプレート化部とを有することを特徴とするものである。 That is, the discourse summary template creation system includes a clustering unit that obtains the summary records from the summary history in which summary records that are past summaries are accumulated, classifies them into similar ones, and clusters them for each cluster. A candidate sentence selection unit that selects a representative summary record from the summary records included in a cluster and sets it as a candidate sentence; and substitutes a specific expression with a parameter for each candidate sentence as a template of the summary sentence, and the summary And a templating unit for creating a template.
また、本発明は、コンピュータを上記のような談話要約テンプレート作成システムとして機能させる談話要約テンプレート作成プログラムにも適用することができる。 The present invention can also be applied to a discourse summary template creation program that causes a computer to function as the above-described discourse summary template creation system.
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。 Among the inventions disclosed in the present application, effects obtained by typical ones will be briefly described as follows.
すなわち、本発明の代表的な実施の形態によれば、談話データの構造を解析した結果から所望の項目や内容が含まれかつ不要な項目が含まれない形の要約を生成するために用いる要約テンプレートを容易かつ高精度に作成する、もしくはこのような要約テンプレートをユーザが作成することを支援することが可能となる。 That is, according to a typical embodiment of the present invention, a summary used to generate a summary that includes desired items and contents and does not include unnecessary items from the result of analyzing the structure of discourse data. It is possible to easily create a template with high accuracy, or to assist the user in creating such a summary template.
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一の符号を付し、その繰り返しの説明は省略する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that components having the same function are denoted by the same reference symbols throughout the drawings for describing the embodiment, and the repetitive description thereof will be omitted.
本発明の一実施の形態である談話要約テンプレート作成システムは、話し言葉を含む談話データについての談話構造の解析結果である談話セマンティクス(談話全体の意味内容を把握するための談話構造に係る情報)に基づいて、予め定義された構造の要約文章を生成するために用いる要約テンプレートを作成するシステムである。後述するように、この要約テンプレートに指定した単語の連接のパターンが談話データに含まれる場合に、当該要約テンプレートに指定した要約文章を出力することで、例えば、コールセンターにおける応対記録などの談話データの要約を生成する談話要約生成システムを実現することができる。 The discourse summary template creation system according to one embodiment of the present invention uses discourse semantics (information related to the discourse structure for grasping the semantic content of the entire discourse), which is the analysis result of the discourse structure for discourse data including spoken words. This is a system for creating a summary template used to generate a summary sentence having a predefined structure based on it. As will be described later, when the discourse data includes the word concatenation pattern specified in the summary template, by outputting the summary text specified in the summary template, It is possible to realize a discourse summary generation system that generates a summary.
ここで、談話セマンティクスとは、例えば、談話データにおける文字列や形態素から意味内容を推測して、談話データ全体について後述するようなフロー、さらには結束性(談話のセグメント)、固有表現、談話簡約などの談話構造の解析を行って得られた解析結果である。この談話セマンティクスは、例えば、後述する談話構造解析システムを用いることによって談話データから生成してもよいし、他の自然言語処理を利用した文章構造の解析システム等を利用して生成してもよい。また、人手によって談話データにタグ付け等を行って作成することも可能である。本実施の形態では、後述する談話構造解析システムを用いて生成するものとして説明する。 Here, discourse semantics means, for example, the meaning content from character strings and morphemes in discourse data, the flow as described later for discourse data, and cohesiveness (discourse segments), proper expressions, discourse reduction It is the analysis result obtained by analyzing the discourse structure such as. This discourse semantics may be generated from discourse data by using a discourse structure analysis system, which will be described later, or may be generated using a sentence structure analysis system using other natural language processing, etc. . It is also possible to manually create a tag by tagging the discourse data. In the present embodiment, description will be made assuming that the generation is performed using a discourse structure analysis system described later.
本実施の形態における談話セマンティクスは、日本語の文章としての内容や構造の厳密な解析結果である必要はなく、例えば、コールセンターにおける応対記録の作成などの実用上支障のないレベルの精度のものであればよい。なお、本明細書において、「談話」とは1人以上の話者による発話行為を指し、例えば、1人で話す講演会でのスピーチ等や、上述したようなコールセンター業務におけるオペレータ等と顧客とのやり取り、複数人での電話会議やテレビ会議、その他の複数人での会話・対話などが含まれる。 The discourse semantics in this embodiment do not have to be the result of strict analysis of the content and structure of Japanese sentences. For example, the discourse semantics have a level of accuracy that does not impede practical use, such as creating a response record at a call center. I just need it. In this specification, “conversation” refers to an utterance action by one or more speakers, for example, a speech at a lecture to be held by one person, an operator in a call center operation as described above, and a customer. Communication, multi-person conference calls and video conferences, and other multi-person conversations and dialogues.
図3は、本実施の形態における談話の例および談話セマンティクスの概念について示した図である。図3の例では、コールセンターのオペレータと顧客とのやり取りからなる談話の例を示している。左側の発話はオペレータの発話であり、右側は顧客の発話を示している。本実施の形態では、各話者の発話1文を「ステートメント」と呼ぶものとする。また、話者毎の連続したステートメントのまとまりを「ブロック」と呼ぶものとする(同一話者の連続したステートメントでも時間的に間隔が空いた場合は別のブロックとなる)。 FIG. 3 is a diagram showing an example of discourse and the concept of discourse semantics in the present embodiment. The example of FIG. 3 shows an example of a discourse consisting of interaction between a call center operator and a customer. The utterance on the left side is the utterance of the operator, and the right side shows the utterance of the customer. In the present embodiment, one sentence of each speaker is called a “statement”. In addition, a group of consecutive statements for each speaker is referred to as a “block” (even if consecutive statements of the same speaker are separated in time, they become different blocks).
図3において、「フロー」とは、各ステートメントの意味内容を端的に示す情報である。この情報をトレースすることによって談話の流れを把握することができる。例えば、図3のオペレータのステートメントにおいて、最初の“はい。”はフローが“挨拶”になっているのに対し、次の“はい。”ではフローが“相槌”となっている。このように、談話の状況(コンテキスト)に応じて、同じ文言のステートメントであってもフローが異なるものとなる場合がある。 In FIG. 3, “flow” is information that simply indicates the semantic content of each statement. By tracing this information, the flow of discourse can be grasped. For example, in the operator statement of FIG. 3, the first “Yes.” Indicates that the flow is “greeting”, while the next “Yes.” Indicates that the flow is “confusion”. In this way, depending on the discourse situation (context), the flow may be different even for statements of the same wording.
また、図3において、「固有表現」とは、談話の内容を個別に特徴付ける表現であり、例えば、図3のコールセンターでのやり取りの談話では、IDや人名、企業名、電話番号、所在地などの固有名詞等が該当する。また、「セグメント」とは、ブロック毎の談話の内容が共通する(結束する)ものをまとめてセグメント化したものである。上記の「フロー」、「固有表現」、「セグメント」についての情報は、談話構造の解析結果として「談話セマンティクス」の構成要素となる。 In FIG. 3, “proprietary expression” is an expression that individually characterizes the content of the discourse. For example, in the discourse of exchange at the call center in FIG. 3, ID, person name, company name, telephone number, location, etc. Applicable to proper nouns. Further, the “segment” is a segmented set of common (united) contents of the discourse for each block. The information about the above “flow”, “specific expression”, and “segment” is a constituent element of “Discourse Semantics” as the analysis result of the discourse structure.
[システム構成(談話構造解析システム)]
図2は、本発明の一実施の形態における談話構造解析システムの構成例の概要について示したブロック図である。談話構造解析システム3は、サーバやPC(Personal Computer)等のコンピュータシステムによって構成され、例えば、ソフトウェアプログラムによって実装される前処理部31、フロー解析部32、形態素解析部34、固有表現解析部35、結束性解析部33、および談話簡約部36の各部と、フロー解析ルール37、および固有表現解析ルール38の各テーブルを有し、音声認識エンジン4によって談話の内容がテキスト化された談話データ51を入力として、談話構造の解析を行って談話セマンティクス57を出力する。
[System configuration (Discourse structure analysis system)]
FIG. 2 is a block diagram showing an outline of a configuration example of the discourse structure analyzing system according to the embodiment of the present invention. The discourse structure analysis system 3 is configured by a computer system such as a server or a PC (Personal Computer). For example, the preprocessing
なお、音声認識エンジン4には既存のものを利用することができる。本実施の形態の談話構造解析システム3は、上述したように、談話データ51のノイズ(音声認識エンジン4による認識ミス等)に強いという特徴を有するが、音声認識エンジン4の認識率が高いほうがより精度の高い談話構造の解析を行うことが可能であることはいうまでもない。 Note that the existing voice recognition engine 4 can be used. As described above, the discourse structure analysis system 3 according to the present embodiment has a feature that it is resistant to noise of the discourse data 51 (such as recognition errors by the speech recognition engine 4), but the recognition rate of the speech recognition engine 4 is higher. Needless to say, it is possible to analyze the discourse structure with higher accuracy.
談話構造解析システム3の前処理部31は、談話データ51の入力を受けて、必要に応じて、他の各部での処理が可能なようにデータのレイアウト変換などの前処理を行う機能を有する。ここでは、例えば、話者毎に連続したステートメントをブロックとしてまとめて、各ブロックおよび各ステートメントに順序を示すシーケンス番号(ID)を割り振ったり、各ブロックの話者のデータを抽出・設定したりなどの処理を行う。なお、談話データ51は、例えば、XML(eXtended Markup Language)などを利用したデータ構造として表される。
The
フロー解析部32は、前処理部31による前処理後の談話データ51に対して、フロー解析ルール37に基づくルールベースでのフローの解析を行い、解析結果としてフロー情報53を出力する機能を有する。フロー情報53は、談話データ51内の各ステートメントのIDとこれに対応するフローの情報を保持し、例えば、XMLなどを利用したデータ構造として表される。
The flow analysis unit 32 has a function of analyzing a rule-based flow based on the
このフロー情報53は、談話構造解析システム3の出力として談話セマンティクス57に含まれ、必須の構成要素となる。すなわち、談話セマンティクス57には、少なくとも談話データ51についてのフローの解析結果としてフロー情報53が含まれる。なお、フロー解析ルール37の内容、およびフロー解析部32での処理の詳細については後述する。
This
形態素解析部34は、前処理部31による前処理後の談話データ51に対して、形態素(言語における意味を持つ最小の単位)の列に分割して品詞を判別するいわゆる形態素解析を行い、解析結果として形態素情報55を出力する機能を有する。形態素情報55は、談話データ51内の各ステートメントのIDとこれに対応する形態素列の情報を保持し、例えば、XMLなどを利用したデータ構造として表される。
The
この形態素情報55は、フロー情報53と同様に、談話構造解析システム3の出力として談話セマンティクス57に含まれるとともに、後述する固有表現解析部35や結束性解析部33に対する入力となる。すなわち、固有表現解析部35による固有表現の解析や、結束性解析部33による結束性の解析(セグメント化)を行わない場合は、形態素解析部34による形態素解析は不要な場合がある。本実施の形態では、後述する談話要約テンプレート作成システムおよび談話要約生成システムにおいて、固有表現解析部35によって解析された固有表現を利用するため、形態素解析部34による形態素解析は必須である。なお、形態素解析部34には既存の形態素解析エンジン(例えば、MeCab(和布蕪)やChaSen(茶筌)など)を利用することができる。
Similar to the
固有表現解析部35は、前処理部31による前処理後の談話データ51と、形態素解析部34から出力された形態素情報55とに基づいて、固有表現解析ルール38に基づくルールベースでの固有表現の解析を行い、解析結果として固有表現情報56を出力する機能を有する。すなわち、固有表現解析部35での解析処理は、少なくとも形態素解析部34による形態素解析が行われていることが前提となる。固有表現情報56は、談話データ51内の各ステートメントIDとこれに対応する固有表現のリストの情報を保持し、例えば、XMLなどを利用したデータ構造として表される。
The specific
この固有表現情報56は、フロー情報53と同様に、談話構造解析システム3の出力として談話セマンティクス57に含まれるが、その後の談話セマンティクス57を利用するアプリケーション等による利用形態や、求められる談話セマンティクスの精度などによって不要な場合もあり得る。従って、固有表現情報56の出力は必須ではなく、出力の有無をユーザが選択可能としてもよい。本実施の形態では、後述する談話要約テンプレート作成システムおよび談話要約生成システムにおいて固有表現情報56を利用するため、固有表現情報56の出力は必須である。なお、固有表現解析ルール38の内容、および固有表現解析部35での処理の詳細については後述する。
Like the
結束性解析部33は、前処理部31による前処理後の談話データ51と、フロー解析部32から出力されたフロー情報53および形態素解析部34から出力された形態素情報55に基づいて、各ブロックの結束性の解析を行ってセグメント化し、解析結果として結束性情報54を出力する機能を有する。すなわち、結束性解析部33での解析処理は、少なくとも形態素解析部34による形態素解析、およびフロー解析部32によるフローの解析が行われていることが前提となる。結束性情報54は、談話データ51内の各ブロックIDと対応するセグメントIDの情報を保持し、例えば、XMLなどを利用したデータ構造として表される。
The
この結束性情報54は、固有表現情報56と同様に、談話構造解析システム3の出力として談話セマンティクス57に含まれるが、その後の談話セマンティクス57を利用するアプリケーション等による利用形態や、求められる談話セマンティクスの精度などによっては不要な場合もあり得る。従って、結束性情報54の出力は必須ではなく、出力の有無をユーザが選択可能としてもよい。本実施の形態では、後述する談話要約テンプレート作成システムおよび談話要約生成システムにおいて結束性情報54を利用する場合があり、その状況に応じて結束性情報54を出力するようにしてもよい。なお、結束性解析部33での処理の詳細については後述する。
This
談話簡約部36は、前処理部31による前処理後の談話データ51と、フロー解析部32から出力されたフロー情報53とに基づいて、談話データ51から不要表現を削除して談話における意味のある部分を抽出し(以下では抽出された談話データ51を「簡約」と記載する場合がある)、処理結果として簡約情報52を出力する機能を有する。すなわち、談話簡約部36での簡約処理は、少なくともフロー解析部32によるフローの解析が行われていることが前提となる。簡約情報52は、例えば、談話データ51から簡約として抽出された各ステートメントのIDと、新たに構成されたブロックや、そのIDの情報を保持し、例えば、XMLなどを利用したデータ構造として表される。
The
この簡約情報52は、フロー情報53と同様に、談話構造解析システム3の出力として談話セマンティクス57に含まれるが、その後の談話セマンティクス57を利用するアプリケーション等による利用形態や、求められる談話セマンティクス57の精度などによっては必要ではない場合もあり得る。従って、簡約情報52の出力は必須ではなく、出力の有無をユーザが選択可能としてもよい。本実施の形態では、後述する談話要約テンプレート作成システムおよび談話要約生成システムにおいて簡約情報52を利用するため、簡約情報52の出力は必須である。なお、談話簡約部36での処理の詳細については後述する。
Similar to the
談話構造解析システム3による解析結果として出力される談話セマンティクス57は、上述したように、フロー情報53や、形態素情報55、固有表現情報56、結束性情報54、簡約情報52を含んで構成される。このとき、単にこれらのデータの集合を談話セマンティクス57として取り扱ってもよいし、例えば、これらのデータをXMLを利容した1つのデータ構造に結合してもよい。
As described above, the
[システム構成(談話要約テンプレート作成システム)]
図1は、本発明の一実施の形態である談話要約テンプレート作成システムの構成例の概要について示したブロック図である。談話要約テンプレート作成システム1は、談話構造解析システム3と同様に、サーバやPC等のコンピュータシステムによって構成され、例えば、ソフトウェアプログラムによって実装されるクラスタリング部11、候補文選択部12、およびテンプレート化部13などの各部を有する。また、クラスタ情報14、および要約テンプレート15などのテーブルもしくはデータベースを有し、過去の談話内容についてのそれぞれの要約が蓄積されたデータベースやファイル等からなる要約履歴61を入力として、要約の表現やパターンとして頻出するものを含む文など、要約としてまとめるべき文を選択し、これに基づいて要約テンプレート15を生成するシステムである。
[System configuration (Discussion summary template creation system)]
FIG. 1 is a block diagram showing an outline of a configuration example of a discourse summary template creation system according to an embodiment of the present invention. Similar to the discourse structure analysis system 3, the discourse summary
ここで、要約履歴61は、例えば本実施の形態では、コールセンターの各オペレータが顧客に対する応対内容を要約して報告するために作成した応対記録(要約記録)が蓄積されたものである。各応対記録は、例えば、オペレータと顧客との間の談話の内容に基づいて図2に示した談話構造解析システム3および図1において後述する談話要約生成システム2によって生成された要約59から作成されたものであってもよいし、オペレータが応対内容を手動で要約して記録したものであってもよい。
Here, for example, in the present embodiment, the
なお、談話構造解析システム3および談話要約生成システム2によって生成された要約59から応対記録を作成した場合は、当該応対記録の基礎となった談話データ51が存在しており、これに対して談話構造解析システム3によって構造が解析され、談話セマンティクス57’が生成されていることになる。オペレータが手動で要約して記録したものである場合はそのようなデータは存在しないことになるが、この場合は、各応対記録から、例えば図2に示した談話構造解析システム3の形態素解析部34や固有表現解析部35などの各部によって、形態素情報55や固有表現情報56などの談話セマンティクス57’を予め生成しておいてもよい。
Note that when a response record is created from the
クラスタリング部11は、要約履歴61に含まれる各要約(応対記録)を取得して、その表現(内容)に基づいて類似するものに分類してクラスタを生成し、その情報をクラスタ情報14に記録する機能を有する。クラスタリングの手法については特に限定されず、文章をクラスタリングする公知の手法を適宜使用することができる。例えば、後述するように、要約履歴61の各応対記録に含まれる各単語について、各応対記録における当該単語の重要度をスコア化して当該スコアを要素とする単語ベクトルを生成し、各応対記録についての単語ベクトル間の距離に基づいてk−means法などによりクラスタリングする。
The
候補文選択部12は、クラスタ情報14に記録されたクラスタの情報に基づいて、各クラスタに含まれる応対記録から代表となる文、すなわちテンプレート化する候補となる文を選択する機能を有する。候補文を選択する手法としては、例えば、クラスタリング部11で要約履歴61内の各応対記録について単語毎に算出した重要度のスコアを合計し、当該合計が最大(最も重要度が高いと考えられる)の応対記録を候補文として選択する。さらに、テンプレート化されることを考慮して、例えば、応対記録の文章の短さや、パラメータ化することが可能な単語(固有名詞等の内容語)の多さなどによりスコアに重み付けを行うようにしてもよい。
The candidate
テンプレート化部13は、候補文選択部12によって各クラスタから選択された候補文に基づいて、後述するような要約テンプレート15を作成する機能を有する。作成された要約テンプレート15をドラフトとして、これに対して管理者等のユーザが内容の修正や追加・削除等の編集を行なって最終的な要約テンプレート15を作成するようにしてもよい。作成された要約テンプレート15は、例えば、談話要約生成システム2に取り込まれ、談話データから要約(応対記録)を生成するために利用される。
The
談話要約生成システム2は、談話要約テンプレート作成システム1と同様に、サーバやPC等のコンピュータシステムによって構成され、例えば、ソフトウェアプログラムによって実装される談話要約部21と、談話要約テンプレート作成システム1によって作成された要約テンプレート15を有し、談話の内容がテキスト化された談話データ58と、談話データ58についての談話構造の解析結果である談話セマンティクス57とを入力として、談話データ58についての要約59を生成して出力する。
The discourse
なお、談話データ58は、上述した談話構造解析システム3の前処理部31によって談話データ51に対して前処理したものと同等のもの、すなわち、例えば、話者毎に連続したステートメントがブロックとしてまとめられ、各ブロックおよび各ステートメントに順序を示すシーケンス番号(ID)が割り振られ、各ブロックの話者のデータが設定されている状態のものである。また、談話セマンティクス57は、例えば、上述した談話構造解析システム3等によって、談話データ58について談話構造(フロー、固有表現、結束性、形態素、および談話簡約)の解析が行われた結果として出力されたものである。
Note that the
なお、本実施の形態では、談話構造解析システム3によって出力された談話構造の解析結果を談話要約生成システム2に入力する構成とし、談話要約生成システム2で用いる要約テンプレート15を談話要約テンプレート作成システム1で作成するものとしているが、このような構成に限らない。例えば、これらのシステムの内の1つ以上を1つのコンピュータシステム上に構成し、作成した要約テンプレート15が要約の際に自動的に用いられるようにしたり、談話構造の解析処理から要約59の生成までの処理を連続的に実行可能としたりしてもよい。
In this embodiment, the analysis result of the discourse structure output by the discourse structure analysis system 3 is input to the discourse
談話要約生成システム2の談話要約部21は、談話セマンティクス57の固有表現情報56、結束性情報54、および簡約情報52とに基づいて、談話データ58に要約テンプレート15に指定した単語の連接のパターンが含まれる場合に、要約テンプレート15に指定した要約文章を生成して出力する機能を有する。要約59は、要約テンプレート15として予め指定された構成・パターンに従って談話データ58の内容をまとめた形式を有し、テキストデータや、XMLなどを利用したデータ構造として表される。要約テンプレート15および要約59の内容、談話要約部21での処理の詳細については後述する。
The
[フロー解析]
以下では、図2に示した談話構造解析システム3のフロー解析部32によるフロー解析の処理の詳細について説明する。図4は、談話データ51におけるフローとコンテキストの例について示した図である。本実施の形態では、コンテキストは談話の各ブロックに対して設定される。図4の例では、最初のブロック(話者:オペレータ)のコンテキストは“開始”であり、次のブロック(話者:顧客)およびその次のブロック(話者:オペレータ)はともに“陳述”となっている。
[Flow analysis]
The details of the flow analysis processing by the flow analysis unit 32 of the discourse structure analysis system 3 shown in FIG. 2 will be described below. FIG. 4 is a diagram showing an example of a flow and context in the
図4の例に示すように、本実施の形態では、原則として、対象のブロックのコンテキストとして、異なる話者の直前のブロックの最後のステートメントに設定されたフローを設定する。なお、談話データ51の先頭のブロックについては直前のブロックがないため、コンテキストとして常に“開始”を設定するものとする。このようにコンテキストを判断することによって、同じ文言のステートメントであっても談話のコンテキストに沿ったフローの解析が可能となる。
As shown in the example of FIG. 4, in this embodiment, in principle, the flow set in the last statement of the block immediately before a different speaker is set as the context of the target block. Since there is no previous block for the head block of the
図5は、談話構造解析システム3のフロー解析ルール37の例について示した図である。フロー解析ルール37は、ファイルやデータベース等に保持されており、ステートメント中におけるフローを判断するための表現(以下では「フロー表現」と記載する場合がある)と、当該フロー表現とマッチする表現を有するステートメントに対してそのコンテキストに応じて設定するフローのパターン(以下では「フロー定義」と記載する場合がある)との対応について予め指定したリストを保持するテーブルである。
FIG. 5 is a diagram showing an example of the
図5の例に示すように、フロー表現は、フローを判断するための手掛かりとなる文字列の正規表現(例えば、“/はい。/”や“/ですか。/”)によって指定する。従って、フロー解析部32もしくは談話構造解析システム3は、例えば、既存の正規表現ライブラリなどを導入することにより正規表現に必要な処理を行うことができるようにしておく必要がある。 As shown in the example of FIG. 5, the flow expression is specified by a regular expression of a character string (for example, “/Yes./” or “/ ?? /”) that serves as a clue for determining the flow. Therefore, the flow analysis unit 32 or the discourse structure analysis system 3 needs to be able to perform processing necessary for regular expressions by introducing, for example, an existing regular expression library.
なお、フロー表現として指定する文字列は、例えば、話し言葉において談話の流れ上特徴的となる文頭の挨拶、返事や、助詞、接続詞、文末表現などを指定するのが望ましく、これらを適用の優先度が高い順に指定する。優先度については、例えば、所定の条件により正規表現の複雑度を計算し、複雑度の降順で優先度を設定するようにしてもよい。なお、指定するフロー表現のパターンは、談話構造解析システム3が対象とする談話の種類(例えば、コールセンターでのやり取りや、企業における定例会議など)に応じて異なる場合がある。 Note that the character string specified as the flow expression should preferably specify, for example, a greeting at the beginning of a sentence, a reply, a particle, a conjunction, a sentence ending expression, etc. Specify in descending order. As for the priority, for example, the complexity of the regular expression may be calculated according to a predetermined condition, and the priority may be set in descending order of the complexity. Note that the flow expression pattern to be specified may differ depending on the type of discourse (for example, exchange at a call center or regular meeting in a company) targeted by the discourse structure analysis system 3.
各フロー表現に対しては、例えば“flow”のラベルによって、フロー定義を指定する。フロー定義では、対象のステートメントのコンテキストと、当該ステートメントに設定するフロー(例えば、“/はい。/”のフロー表現とマッチするステートメントにおいて、コンテキストが“開始”の場合はフローとして“挨拶”を設定する)を指定する。“flow”のラベルによるフロー定義は、各フロー表現において想定されるコンテキストの種類に応じて複数指定することができる。 For each flow expression, for example, a flow definition is specified by a label “flow”. In the flow definition, set “greeting” as the flow if the context is “start” in the statement that matches the context of the target statement and the flow that is set in the statement (for example, “/Yes./”) Specify). A plurality of flow definitions by the label “flow” can be specified according to the type of context assumed in each flow expression.
また、例えば“default”のラベルによって、対象のステートメントのコンテキストがいずれの“flow”のラベルにも該当しなかった場合に設定するフローであるデフォルトフロー(例えば、“/はい。/”のフロー表現とマッチするステートメントにおいて、当該ステートメントのコンテキストがいずれの“flow”のラベルにもマッチしない場合はフローとして“相槌”を設定する)を指定する。なお、デフォルトフローは、各フロー表現において必ず1つ設定するものとする。 In addition, for example, a default flow (for example, a flow expression of “/Yes./”, which is a flow to be set when the context of the target statement does not correspond to any “flow” label by the label “default”. In the statement that matches, if the context of the statement does not match any of the “flow” labels, the flow is set to “contrast”. Note that one default flow is always set in each flow expression.
フロー定義の指定は、談話構造解析システム3が対象とする談話の種類に応じて、一般的な談話の流れのパターンとして主要なものを指定するのが望ましい。例えば、コールセンターでのやり取りにおいては、顧客が“苦情”を発した場合はオペレータは“謝罪”する、などのパターンに基づいて、フロー定義を指定することができる。 For the flow definition, it is desirable to designate a main flow pattern as a general discourse flow according to the type of discourse targeted by the discourse structure analysis system 3. For example, in the exchange at the call center, the flow definition can be specified based on a pattern such as “apology” if the customer makes a “complaint”.
フロー解析ルール37では、上述のように、指定するフロー表現や対応するフロー定義の内容が談話構造解析システム3が対象とする談話の種類に応じて異なる場合があるため、談話の種類に応じて適用するフロー解析ルール37を複数保持して、ユーザが切り換えられるようにするなど、談話の特性に応じて柔軟に対応することも可能である。
In the
なお、上述のように、本実施の形態では、フロー解析ルール37において品詞の指定は行っていない。すなわち、フロー解析部32においては品詞の判断を行わないため、フロー解析部32での解析処理に際して、事前に形態素解析部34による形態素解析を行う必要はない。なお、より精度を上げるために形態素情報55を利用して、例えば、フロー解析ルール37のフロー表現における正規表現を、後述するように形態素情報55の形態素列(品詞の情報も含む)に対して適用するようにして、より詳細な条件でマッチングを行うようすることも可能である。
As described above, in this embodiment, the part of speech is not specified in the
図6は、談話構造解析システム3のフロー解析部32におけるフロー解析処理の流れの例を示したフローチャートである。フロー解析部32は、フロー解析処理を開始すると、まず、前処理部31による前処理後の談話データ51の各ステートメントについて処理を繰り返すループ処理を開始する(S101)。各ステートメントについてのループ処理を開始すると、フロー解析ルール37の各フロー表現について処理を繰り返すループ処理を開始する(S102)。
FIG. 6 is a flowchart showing an example of the flow of the flow analysis process in the flow analysis unit 32 of the discourse structure analysis system 3. When starting the flow analysis process, the flow analysis unit 32 first starts a loop process that repeats the process for each statement of the
各フロー表現についてのループ処理を開始すると、対象のステートメントと対象のフロー表現とがマッチするか否かを判定する(S103)。マッチしない場合は次のフロー表現の処理に移る(S108、S102)。一方、マッチする場合は、まず、対象のステートメントについて、当該ステートメントが属するブロックの直前のブロックにおける最終ステートメントに設定されているフローをコンテキストとして設定する(S104)。このとき、図4で示したように、当該ステートメントが属するブロックが談話データ51の最初のブロックである場合には、コンテキストに“開始”を設定する。
When the loop processing for each flow expression is started, it is determined whether or not the target statement matches the target flow expression (S103). If there is no match, the process proceeds to the next flow expression process (S108, S102). On the other hand, if there is a match, first, for the target statement, the flow set in the last statement in the block immediately before the block to which the statement belongs is set as a context (S104). At this time, as shown in FIG. 4, when the block to which the statement belongs is the first block of the
次に、ステップS104で設定したコンテキストについて、対象のフロー表現におけるフロー定義の“flow”ラベルで指定されたコンテキストとマッチするものがあるか否かを判定する(S105)。マッチするものがある場合には、マッチするフロー定義におけるコンテキストに対応するフローを、対象のステートメントのフローとして設定する(S106)。一方、マッチするものがない場合は、デフォルトフローを対象のステートメントのフローとして設定する(S107)。その後、各フロー表現についてのループ処理を抜ける。 Next, for the context set in step S104, it is determined whether or not there is a context that matches the context specified by the “flow” label of the flow definition in the target flow expression (S105). If there is a match, the flow corresponding to the context in the matching flow definition is set as the flow of the target statement (S106). On the other hand, if there is no match, the default flow is set as the flow of the target statement (S107). Thereafter, the loop processing for each flow expression is exited.
各フロー表現についてのループ処理が終了すると、対象のステートメントにフローが設定されているか否かを判定する(S109)。フローが設定されている場合は何も行わず、また、フローが設定されていない場合は、対象のステートメントに“陳述”のフローを設定して(S110)、次のステートメントの処理に移る(S111、S101)。各ステートメントについてのループ処理が全て終了した場合は、各ステートメントのIDとこれに対応するフローの情報をフロー情報53として出力してフロー解析処理を終了する。
When the loop processing for each flow expression is completed, it is determined whether or not a flow is set in the target statement (S109). If the flow is set, nothing is performed. If the flow is not set, the “statement” flow is set in the target statement (S110), and the process proceeds to the next statement (S111). , S101). When all the loop processes for each statement are completed, the ID of each statement and the flow information corresponding thereto are output as
このように、話し言葉を考慮したフロー表現によって各ステートメントとマッチングし、マッチしたステートメントのコンテキストに応じて適切なフローを設定することで、談話データ51の全体について話し言葉やノイズに影響されにくいフロー解析を行うことができる。
In this way, flow analysis that considers spoken language is used to match each statement, and by setting an appropriate flow according to the context of the matched statement, flow analysis that is less susceptible to spoken language and noise for the
[固有表現解析]
以下では、図2に示した談話構造解析システム3の固有表現解析部35による固有表現解析の処理の詳細について説明する。図7は、談話構造解析システム3の固有表現解析ルール38の例について示した図である。固有表現解析ルール38は、ファイルやデータベース等に保持されており、ステートメント中の固有表現を特定するための正規表現と、当該正規表現とマッチする部分から固有表現を特定して抽出するための規則(以下では「固有表現規則」と記載する場合がある)との対応について予め指定したリストを保持するテーブルである。
[Specific expression analysis]
In the following, details of the specific expression analysis processing by the specific
図7の例に示すように、ステートメント中の固有表現は正規表現によって特定する。従って、固有表現解析部35もしくは談話構造解析システム3は、例えば、既存の正規表現ライブラリなどを導入することにより正規表現に必要な処理を行うことができるようにしておく必要がある。なお、固有表現解析においては、通常の文字列に対する正規表現だけではなく、形態素情報55に保持された各ステートメントの形態素列の表現についても判断する必要があるため、正規表現の処理機能を形態素列の情報を判断することができるよう拡張しておく。
As shown in the example of FIG. 7, the specific expression in the statement is specified by a regular expression. Therefore, the specific
例えば、図7の例では、各正規表現中で形態素列の範囲を“( )”で指定しており、この部分については文字列ではなく形態素列の情報とマッチングするようにする。1つ目の正規表現の例では、“(<f:組織>+)”の部分は、品詞(f)が“組織”であると解析された1つ以上の形態素列を示しており、“(?:の)?”の部分は、表層形が“の”であると解析された0以上1つ以下の品詞を示している。また、“(<f:人名,姓>)”の部分は、品詞が“人名,姓”であると解析された1つの形態素列を示している。この正規表現は、例えば、“AAA商事の鈴木”や、“AAA商事鈴木”などの表現とマッチする。なお、形態素列の表現については、形態素解析部34における形態素解析エンジン等の出力仕様によって異なる場合がある。
For example, in the example of FIG. 7, the range of the morpheme string is specified by “()” in each regular expression, and this part is matched with the information of the morpheme string instead of the character string. In the first regular expression example, the part of “(<f: organization> +)” indicates one or more morpheme sequences analyzed that the part of speech (f) is “organization”. (?: Of)? "Indicates a part of speech of 0 or more and 1 or less analyzed that the surface shape is" no ". The part of “(<f: person name, surname>)” indicates one morpheme string that has been analyzed with the part of speech being “person name, surname”. This regular expression matches expressions such as “AAA Shoji Suzuki” and “AAA Shoji Suzuki”. Note that the representation of the morpheme string may differ depending on the output specifications of the morpheme analysis engine in the
このとき、対応する固有表現規則において、当該形態素列における1番目の要素(品詞が“組織”の形態素列、例えば“AAA商事”)を“企業名”という属性を有する固有表現として特定し、形態素列における2番目の要素(品詞が“人名,姓”の形態素列、例えば“鈴木”)を“人名”という属性を有する固有表現として特定するよう指定している。なお、“(?: )”で囲われた部分(例えば、“の”)については対象の形態素列の要素に含まれないものとして取り扱う。 At this time, in the corresponding specific expression rule, the first element in the morpheme string (the morpheme string whose part of speech is “organization”, for example, “AAA Shoji”) is specified as a specific expression having the attribute “company name”. The second element in the column (the morpheme string whose part of speech is “person name, surname”, for example “Suzuki”) is specified to be specified as a specific expression having the attribute “person name”. It should be noted that a portion (for example, “no”) enclosed by “(?:)” Is treated as not included in the element of the target morpheme string.
図7の2つ目の正規表現の例では、品詞は特に考慮せずに通常の正規表現によって指定しており、“03−1234−5678”などの電話番号の表現にマッチする。このとき、対応する固有表現規則において、当該形態素列における1番目の要素(この例で要素は“03−1234−5678”等の1つしかない)を“電話番号”という属性を有する固有表現として特定するよう指定している。 In the example of the second regular expression of FIG. 7, the part of speech is specified by a normal regular expression without particular consideration, and matches the expression of a telephone number such as “03-1234-5678”. At this time, in the corresponding specific expression rule, the first element in the morpheme string (in this example, there is only one element such as “03-1234-5678”) is defined as a specific expression having the attribute “phone number”. It is specified to be specified.
なお、正規表現によって特定される固有表現の文字列は、例えば、談話の内容を個別に特徴付ける固有名詞や、数値等からなる文字列などを指定するのが望ましい。また、例えば、話者(顧客等)の感情を示す表現(例えば、苦情の表現や感謝の表現など)からなる文字列を指定して、対応する感情の属性を有する固有表現として特定するようにしてもよい。なお、解析結果として、ある文字列が複数の固有表現に含まれるという場合もあり得る。 It is desirable that the character string of the unique expression specified by the regular expression is, for example, a proper noun that individually characterizes the content of the discourse or a character string made up of numerical values. In addition, for example, a character string composed of expressions (for example, complaint expression or gratitude expression) indicating the emotion of a speaker (customer, etc.) is specified and specified as a specific expression having a corresponding emotion attribute. May be. In addition, as a result of analysis, a certain character string may be included in a plurality of unique expressions.
固有表現解析ルール38には、上述のように、固有表現を特定するための正規表現と固有表現規則との対応のリストを予め指定しておくが、フロー解析ルール37と同様に、指定する正規表現や対応する固有表現規則については、談話構造解析システム3が対象とする談話の種類に応じて異なるものを設定したり、談話の種類に応じて適用する固有表現解析ルール38をユーザが切り換えたりなど、談話の特性に応じて柔軟に対応することが可能である。
In the specific
図8は、談話構造解析システム3の固有表現解析部35における固有表現解析処理の流れの例を示したフローチャートである。固有表現解析部35は、固有表現解析処理を開始すると、まず、談話データ51の各ステートメントについて処理を繰り返すループ処理を開始する(S201)。各ステートメントについてのループ処理を開始すると、固有表現解析ルール38の固有表現を特定するための各正規表現について処理を繰り返すループ処理を開始する(S202)。
FIG. 8 is a flowchart showing an example of the flow of the specific expression analysis process in the specific
各正規表現についてのループ処理を開始すると、対象のステートメントに対応する形態素情報55内の各形態素列と、対象の正規表現とがマッチするか否かを判定する(S203)。マッチしない場合は次の正規表現の処理に移る(S205、S202)。一方、マッチする場合は、対象の正規表現に対応する固有表現規則を適用して固有表現を特定して抽出し(S204)、次の正規表現の処理に移る(S205、S202)。
When the loop processing for each regular expression is started, it is determined whether or not each morpheme sequence in the
各正規表現についてのループ処理が全て終了した場合は、次のステートメントの処理に移る(S206、S201)。各ステートメントについてのループ処理が全て終了した場合は、各ステートメントのIDとこれに対応する固有表現のリストの情報を固有表現情報56として出力して固有表現解析処理を終了する。
When all the loop processes for each regular expression are completed, the process proceeds to the next statement (S206, S201). When all of the loop processing for each statement is completed, the ID of each statement and the information on the list of specific expressions corresponding thereto are output as
このように、形態素列の品詞を考慮した正規表現によるマッチングと形態素列の抽出を行うことで、例えば助詞の省略などの話し言葉特有の文法を考慮した固有表現解析を行うことができる。 In this way, by performing matching with a regular expression considering the part of speech of the morpheme string and extracting the morpheme string, it is possible to perform a specific expression analysis considering a grammar peculiar to spoken words such as omission of a particle.
[結束性解析]
以下では、図2に示した談話構造解析システム3の結束性解析部33による結束性解析の処理の詳細について説明する。図9は、談話構造解析システム3での結束性解析の例について示した図である。結束性解析処理では、まず、上段の図に示すように、談話データ51における全てのブロックを1つのセグメントとして設定する。
[Cohesion analysis]
The details of the cohesiveness analysis process by the
その後、まず、セグメントの分割処理を行う。分割処理では、各ステートメントについてフロー情報53において特定の種別のフローが設定されているものを判別し、当該ステートメントが属するブロックにおいてセグメントを分割する。ここで、判別するフローの種別は、談話の切れ目や内容が切り替わる際に出現すると推測されるフローであることが望ましい。
Thereafter, segment division processing is performed first. In the dividing process, it is determined for each statement that a flow of a specific type is set in the
例えば、コールセンターにおけるやり取りを始めとする複数人の談話の場合は、質問とそれに対する回答等の応答によって談話が進む場合が多いため、フローが“質問”のステートメントにおいて内容が切り替わることが多いと考えられる。従って、本実施の形態では、フロー情報53に基づいてフローが“質問”のステートメント(以下では“質問ステートメント”と記載する場合がある)を判別し、図9の中段の図に示すように、質問ステートメントが出現するたびにセグメントを分割するものとする。
For example, in the case of multi-person discourse such as exchanges at a call center, it is often the case that the discourse progresses depending on the response of the question and the response to it, so the content is often switched in the “question” statement of the flow. It is done. Therefore, in the present embodiment, the statement of the flow “question” (hereinafter sometimes referred to as “question statement”) is determined based on the
その後、セグメントの統合処理を行う。統合処理では、各セグメントについて予め定められた統合条件に該当する質問ステートメントを有する場合に、当該質問ステートメントを有するセグメントを直前のセグメントと統合する。ここで、統合条件は、当該質問ステートメントを有するセグメントについて以前のセグメントから内容が継続している(以前のセグメントと結束性が高い)と推測させる表現の指定である。 Thereafter, segment integration processing is performed. In the integration process, when there is a question statement corresponding to a predetermined integration condition for each segment, the segment having the question statement is integrated with the immediately preceding segment. Here, the integration condition is designation of an expression that causes the segment having the question statement to be inferred that the content continues from the previous segment (highly cohesive with the previous segment).
統合条件としては、例えば、当該質問ステートメントについて、直前の質問ステートメントと共通する単語(固有名詞)がある場合や、指示詞を含む場合などが挙げられる。これらの統合条件に該当する質問ステートメントを有するセグメントは以前のセグメントと結束性が高いと判断し、図9の下段の図に示すように、直前のセグメントと統合する。なお、統合処理については、統合可能なセグメントがなくなるまで繰り返すものとする。 Examples of the integration condition include a case where the question statement has a word (proprietary noun) common to the immediately previous question statement or a case where a directive is included. A segment having a question statement corresponding to these integration conditions is determined to be highly cohesive with the previous segment, and is integrated with the immediately preceding segment as shown in the lower diagram of FIG. It should be noted that the integration process is repeated until there are no segments that can be integrated.
図10は、談話構造解析システム3の結束性解析部33における結束性解析処理の流れの例を示したフローチャートである。結束性解析部33は、結束性解析処理を開始すると、まず、談話データ51の全てのブロックを1つのセグメントに設定する(S301)。具体的には、例えば、全てのブロックにセグメントIDの初期値を割り当てるなどによって設定する。その後、セグメントの分割処理として、談話データ51の各ブロックについて処理を繰り返すループ処理を開始する(S302)。
FIG. 10 is a flowchart showing an example of the flow of cohesiveness analysis processing in the
各ブロックについてのループ処理を開始すると、対象のブロックに質問ステートメントが含まれているか否か(フローが“質問”のステートメントがあるか否か)を判定する(S303)。質問ステートメントが含まれている場合は、対象のブロックと直前のブロックとの間でセグメントを分割する(S304)。具体的には、例えば、対象のブロック以降の全てのブロックに次のセグメントIDを割り当てるなどによって分割する。その後、次のブロックの処理に移る(S305、S302)。 When the loop processing for each block is started, it is determined whether or not a question statement is included in the target block (whether or not the flow has a “question” statement) (S303). If a question statement is included, the segment is divided between the target block and the immediately preceding block (S304). Specifically, for example, the next segment ID is assigned to all blocks after the target block. Thereafter, the processing moves to the next block (S305, S302).
各ブロックについてのループ処理(分割処理)が終了した場合は、次に、セグメントの結合処理として、上記の分割処理で分割した各セグメントについて処理を繰り返すループ処理を開始する(S306)。各セグメントについてのループ処理を開始すると、対象のセグメントに上記の統合条件に該当する質問ステートメントがあるか否かを判定する(S307)。 When the loop processing (division processing) for each block is completed, next, loop processing that repeats the processing for each segment divided by the above-described division processing is started as segment combination processing (S306). When the loop processing for each segment is started, it is determined whether or not there is a question statement corresponding to the integration condition in the target segment (S307).
統合条件に該当する質問ステートメントがある場合は、対象のセグメントと直前のセグメントとを統合する(S308)。具体的には、例えば、対象のセグメントに含まれる各ブロックのセグメントIDを直前のセグメントのセグメントIDに更新するなどによって統合する。このとき、以降の各セグメントに含まれる各ブロックのセグメントIDを順次繰り上げてもよい。その後、次のセグメントの処理に移る(S309、S306)。各セグメントについてのループ処理(統合処理)が終了した場合は、各ブロックのIDと対応する(各ブロックが含まれる)セグメントのIDのリストの情報を結束性情報54として出力して、結束性解析処理を終了する。
If there is a question statement corresponding to the integration condition, the target segment and the previous segment are integrated (S308). Specifically, for example, the integration is performed by updating the segment ID of each block included in the target segment to the segment ID of the immediately preceding segment. At this time, the segment ID of each block included in each subsequent segment may be sequentially incremented. Thereafter, the process proceeds to the next segment (S309, S306). When the loop processing (integration processing) for each segment is completed, the information on the list of segment IDs corresponding to the ID of each block (including each block) is output as the
これにより、フロー解析によって得られたフロー情報53に基づいて談話データ51内の各ステートメントをセグメント化し、談話セマンティクス57を利用する種々のアプリケーションに対する有用な情報とすることができる。
Accordingly, each statement in the
[談話簡約]
以下では、図2に示した談話構造解析システム3の談話簡約部36による談話簡約の処理の詳細について説明する。図11は、談話簡約の例について示した図である。談話簡約処理では、フロー解析部32によって解析された各ステートメントのフローの情報に基づいて、談話データ51から相槌や挨拶等の不要表現を削除し、その他の部分を談話における本質的な部分として抽出する。
[Discussion reduction]
In the following, the details of the discourse reduction process by the
図11の例に示すように、上段のフロー解析が行われた談話データ51に対して、フローが“挨拶”、“相槌”、“定型”と判定されたステートメントを不要表現として削除し、さらに、同じ発話者が続くブロックを連結して1つのブロックに再構成することによって、下段に示すような簡約を得ることができる。なお、本実施の形態では不要表現であると判断するフローを“挨拶”、“相槌”、“定型(談話の内容と直接の関わりなく使用される定型的な表現を示すフロー)”と定義しているが、談話の種類に応じて不要表現と判断するフローの定義を適宜変更してもよい。
As shown in the example of FIG. 11, for the
図12は、談話構造解析システム3の談話簡約部36における談話簡約処理の流れの例を示したフローチャートである。談話簡約部36は、談話簡約処理を開始すると、まず、談話データ51の各ステートメントについて処理を繰り返すループ処理を開始する(S401)。各ステートメントについてのループ処理を開始すると、対象のステートメントについてフロー情報53を参照し、フローが“挨拶”、“相槌”、“定型”のいずれかに該当するか否かを判定する(S402)。
FIG. 12 is a flowchart showing an example of the flow of discourse reduction processing in the
フローがいずれにも該当しない場合は、対象のステートメントは不要表現ではないとして、この情報を識別するため対象のステートメントに対して簡約フラグを設定する(S403)。本実施の形態では不要表現ではないステートメントに簡約フラグを設定するものとしているが、逆に、ステップS402において対象のステートメントがいずれかのフローに該当する場合に、不要表現であるとして不要表現フラグを設定するようにしてもよい。その後、次のステートメントの処理に移る(S404、S401)。 If the flow does not correspond to any of them, the target statement is not an unnecessary expression, and a reduction flag is set for the target statement to identify this information (S403). In this embodiment, a reduction flag is set for a statement that is not an unnecessary expression. Conversely, when the target statement corresponds to any flow in step S402, an unnecessary expression flag is set as an unnecessary expression. You may make it set. Thereafter, the processing proceeds to the next statement (S404, S401).
各ステートメントについてのループ処理が終了した場合は、簡約フラグが設定されたステートメント(不要表現を削除した残りのステートメント)によってブロックを再構成する(S405)。ここでは、不要表現が削除されたことにより同じ発話者のブロックが連続することになる場合に、これらを結合して1つのブロックとする(例えば、図11の下段の談話データ51における最終ブロック)。このとき例えば、結合したブロックが所定の長さよりも長くなる場合は、分割して適当な長さの複数のブロックとしてもよい。ブロックを再構成した後、ブロックIDを採番し直すようにしてもよい。その後、簡約フラグが設定された各ステートメントのIDと、再構成したブロックの情報を簡約情報52として出力して談話簡約処理を終了する。
When the loop processing for each statement is completed, the block is reconfigured by a statement in which the reduction flag is set (the remaining statements from which unnecessary expressions are deleted) (S405). Here, when the blocks of the same speaker are continuous due to the deletion of unnecessary expressions, these are combined into one block (for example, the last block in the
これにより、談話データ51の内容をできるだけ忠実に、かつ本質的な部分を漏らさずに圧縮してデータ量を削減することができ、その後の談話セマンティクス57を利用する種々のアプリケーションにおける分析効率や利用効率を向上させることができる。
As a result, the content of the
なお、上述のフロー解析、固有表現解析、結束性解析、談話簡約の各処理によって出力された談話セマンティクス57に含まれるフロー情報53、固有表現情報56、結束性情報54、簡約情報52については、談話構造解析システム3において、ユーザが内容を参照して適宜修正することが可能なインタフェースを設けてもよい。
Note that the
[談話要約]
以下では、図1に示した談話要約生成システム2の談話要約部21による談話要約の処理の詳細について説明する。図13は、談話要約生成システム2での談話要約の例について示した図である。図13の上段は、談話データ58についての談話構造解析の結果の例を示しており、簡約情報52に基づいて談話データ58を簡約した結果の各ステートメントに対して、談話セマンティクス57の各情報(図13の例ではフロー、および“金額”を表す固有表現)を示している。
[Discussion summary]
Hereinafter, the details of the discourse summary processing by the
これらの情報に対して、本実施の形態の談話要約生成システム2では、ブロック内において所定の内容の発話を行っているものと考えられる単語の連接のパターン(図13の例では“解約”、“したい”など)を指定した要約テンプレート15を予め用意しておく。
With respect to these pieces of information, the discourse
例えば、コールセンターでのオペレータの発話などはトークスクリプト等によりある程度定型化されており、顧客に伝える必要がある項目は予め定められている場合が多い。しかしながら、これらの発話内容は毎回全く同じ言い回しになるとは限らず、応対の中で言い回しが若干異なったりする場合があるため、完全なフレーズとのマッチングでは特定できない場合が多い。一方、単なるキーワードとのマッチングでは余計な発話までマッチしてしまう可能性が高くなる。そこで、本実施の形態では、単語の連接のパターンとのマッチングにより、要約として含めるべき対象となる発話を特定する。 For example, the utterance of an operator at a call center is standardized to some extent by a talk script or the like, and items that need to be communicated to customers are often predetermined. However, these utterance contents are not always exactly the same every time, and there are cases where the words are slightly different in the response, and therefore often cannot be specified by matching with a complete phrase. On the other hand, with a simple matching with a keyword, there is a high possibility that an extra utterance will be matched. Therefore, in this embodiment, an utterance to be included as a summary is specified by matching with a word connection pattern.
本実施の形態における単語の連接のパターンとは、図13の例における“解約”、“したい”などのように、特定の内容の発話(当該例では解約の希望・依頼)に含まれると想定されるキーワード的な単語をその出現順序とともに規定したものである。 The word concatenation pattern in the present embodiment is assumed to be included in an utterance having a specific content (desired request / request in this example), such as “cancel” or “want to” in the example of FIG. The keyword-like words to be specified are defined together with their appearance order.
各ブロックについてその談話内容が要約テンプレート15のいずれかに指定された単語の連接のパターンにマッチする場合は、要約テンプレート15にて指定された対応する要約文章(図13の例では“解約をお願いいたします。”など)を、所定の位置(スロット)に時系列で出力することにより、図13の下段に示すように談話データ58についての要約59を得ることができる。
If the discourse content of each block matches the pattern of word concatenation specified in one of the
なお、各ブロックについて要約テンプレート15とのマッチングを行う際、対象のブロック(第1ブロック)とそれに後続する第2のブロックとの対(例えば図13の上段に示すようなブロックの対)を対象としてマッチングする。要約とすべき内容が発話者と相手方による談話の応対関係によって特定される場合があるためである。従って、挨拶や相槌等しか含まないブロックはノイズとなることから除外する必要があるため、ここでは簡約情報52に基づいて談話データ58を簡約した結果(挨拶や相槌等のステートメントを除外した後ブロックを再構成したもの)をマッチングの対象とする。
When matching the
図14は、要約テンプレート15の内容の具体例について示した図である。要約テンプレート15はファイルやデータベース等に保持されており、簡約された談話データ58のブロックから要約とする部分(要約59に含めるべき部分)を特定する際の単語の連接のパターンと、出力する要約文章のひな型との対応について予め指定したリストを保持するテーブルである。
FIG. 14 is a diagram showing a specific example of the contents of the
図14の例に示すように、各テンプレートは“template”ラベルによって区分され、“template”ラベルには要約文章のひな型が指定される。“from”ラベルは、マッチング対象のブロックの対のうち、第1ブロック(元ブロック)を対象として単語の連接のパターンをマッチングすることを示す。“from”ラベルの代わりに“to”ラベルを指定することで第2ブロック(先ブロック)を対象とすることも可能である。 As shown in the example of FIG. 14, each template is classified by a “template” label, and a template for a summary sentence is designated for the “template” label. The “from” label indicates that a pattern of word concatenation is matched with respect to the first block (original block) of the pair of blocks to be matched. It is also possible to target the second block (destination block) by specifying the “to” label instead of the “from” label.
“seqs”ラベルにおいて、ブロック内でマッチングさせる単語の連接のパターンを指定する。ここで指定した単語を指定した順序で含んでいるブロックがある場合に、“template”ラベルで指定した要約文章を要約59として出力する。その際、“slot”ラベルの指定がある場合は、要約59内の該当スロットに対して要約文章を出力する。なお、ブロック内の文章と単語の連接のパターンをマッチングさせる際には、例えば、正規表現など種々の既存のアルゴリズムを利用することができる。
In the “seqs” label, a pattern of word concatenation to be matched in the block is designated. If there is a block containing the specified words in the specified order, the summary text specified by the “template” label is output as the
また、図14における2つ目のテンプレートに示すように、“template”ラベルで指定する要約文章のひな型には可変のパラメータを指定することも可能である。この場合、パラメータ部分は出力時に対象のブロックにおける対応する固有表現によって置き換えられる。また、“by”ラベルによって、マッチング対象のブロックの対のうち、指定した発話者(例えば、オペレータや顧客)が発話しているブロックをマッチングの対象とすることも可能である。 Further, as shown in the second template in FIG. 14, it is also possible to specify a variable parameter for the template of the summary sentence specified by the “template” label. In this case, the parameter part is replaced by the corresponding specific expression in the target block at the time of output. In addition, with the “by” label, it is possible to match a block spoken by a designated speaker (for example, an operator or a customer) out of a pair of blocks to be matched.
上記の要約テンプレート15内の各テンプレートにおける単語の連接のパターンにマッチするブロックについてひな型から要約文章を出力することで要約59を生成する。なお、図14の例における指定内容は、例えば、コールセンターでのやり取りについての要約59である応対記録を作成することを目的とした例であり、要約59を作成する対象の談話の種類に応じて複数のものを予め用意してユーザが対象の業務に応じて切り替えられるようにしてもよい。また、要約テンプレート15の内容をユーザが編集可能とするようなインタフェースを設けてもよい。
A
図15は、談話要約生成システム2の談話要約部21における談話要約処理の流れの例を示したフローチャートである。談話要約部21は、談話要約処理を開始すると、まず、簡約情報52に基づいて談話データ58を簡約した結果の各ブロック(挨拶や相槌等のステートメントを除外した後ブロックを再構成したもの)について処理を繰り返すループ処理を開始する(S501)。各ブロックについてのループ処理を開始すると、まず対象のブロックを第1ブロック(元ブロック)とし、後続の次のブロックを第2ブロック(先ブロック)として設定する(S502)。
FIG. 15 is a flowchart showing an example of the flow of discourse summary processing in the
次に、要約テンプレート15内の各テンプレートについて処理を繰り返すループ処理を開始する(S503)。各テンプレートについてのループ処理を開始すると、対象のテンプレートの“from”ラベルや“by”ラベルなどの指定に対応するブロック(第1もしくは第2ブロック)において、“seqs”ラベルに指定された単語の連接のパターンが含まれるか否かを判定する(S504)。パターンが含まれない場合はそのまま次のテンプレートの処理に移る(S506、S503)。
Next, a loop process for repeating the process for each template in the
ステップS504において単語の連接のパターンが含まれる場合は、対象のテンプレートの“template”ラベルに指定された要約文章のひな型から要約文章を生成して要約59として出力する(S505)。このとき、必要に応じてパラメータ部分を対象のブロックにおける対応する固有表現によって置換する。また、出力の際は生成した要約文章を要約59の末尾に追加するものとし、対象のテンプレートに“slot”ラベルが指定されている場合は、当該ラベルで指定されたスロットの末尾に追加するものとする。対象のスロットが要約59内にない場合は対象のスロットを作成した上で追加する。
If a word concatenation pattern is included in step S504, a summary sentence is generated from the summary sentence template specified in the “template” label of the target template and output as a summary 59 (S505). At this time, the parameter portion is replaced with the corresponding specific expression in the target block as necessary. Also, when outputting, the generated summary text is added to the end of the
各テンプレートについてのループ処理が終了した場合は、次のブロックの処理に移る(S507、S501)。すなわち、直前のブロックについての上記ループ処理で第2ブロックであったブロックが、次のブロックの処理では第1ブロックとなることでブロック対が1ブロックずつ移動していく処理形態となる。各ブロックについてのループ処理が終了した場合は、要約59を出力して談話要約処理を終了する。当該要約59には、スロット毎に要約テンプレート15で指定した項目や内容に係る要約文章が時系列で記録されることになる。
When the loop process for each template is completed, the process proceeds to the next block (S507, S501). In other words, the block that has been the second block in the loop processing for the immediately preceding block becomes the first block in the next block processing, so that the block pair moves one block at a time. When the loop processing for each block ends, a
なお、上述した例では、要約59を生成する際に、簡約情報52に基づいて簡約した談話データ58全体を対象としているが、談話セマンティクス57の結束性情報54に保持された談話データ58のセグメントの情報に基づいて、セグメント毎に上記の処理を繰り返して、セグメント毎に細分化した要約59を生成するようにしてもよい。また、出力された要約59の内容についても、談話セマンティクス57の各内容と同様に、談話要約生成システム2において、ユーザが内容を参照して適宜修正することが可能なインタフェースを設けてもよい。
In the above-described example, when the
以上に説明したように、本実施の形態の談話要約生成システム2によれば、予め設定した要約テンプレート15に指定した単語の連接のパターンが談話データ58内のブロックに含まれる場合に、要約テンプレート15に指定した要約文章を出力することで、要約テンプレート15に設定した項目や内容を含み、不要な項目を含ない要約59を得ることができる。また、談話データ58の内容から必要な部分のみを抽出して要約59を生成するため、他の不要な部分にノイズ等が含まれている場合でも、これらからは影響を受けずに要約59を生成することができる。
As described above, according to the discourse
[談話要約(テンプレート作成)]
以下では、図1に示した談話要約テンプレート作成システム1による談話要約の際に用いられる要約テンプレート15を作成する処理の詳細について説明する。図16は、談話要約テンプレート作成システム1での要約テンプレート15の作成の例について示した図である。本実施の形態では、コールセンターの各オペレータが顧客に対する応対内容の要約として作成した応対記録が蓄積された要約履歴61から、要約テンプレート15を作成する。
[Discussion summary (template creation)]
Below, the detail of the process which produces the
なお、本実施の形態では、要約履歴61に蓄積された各応対記録は、例えば、オペレータと顧客との間の談話の内容に基づいて図2に示した談話構造解析システム3および図1に示した談話要約生成システム2によって生成された要約59から作成されたもの、もしくは、オペレータが手動で談話内容を要約して作成したものであり、予め図2に示した談話構造解析システム3の形態素解析部34などの各部によって解析処理を行ったものであることを前提とする。すなわち、各応対記録(もしくはその基礎となった談話のステートメント等)について既に談話構造解析システム3によって構造が解析され、談話セマンティクス57’が生成されているものとする。
In the present embodiment, each response record accumulated in the
まず、クラスタリング部11により、要約履歴61に蓄積された各応対記録の文をクラスタリングして類似するものに分類し、クラスタ情報14を得る。クラスタ情報14には、類似するものとして分類された1つ以上の応対記録が含まれるクラスタが1つ以上含まれる。上述したように、クラスタリングの手法については特に限定されず、例えば、要約履歴61に蓄積された各応対記録に含まれる各単語について、各応対記録における当該単語の重要度をスコア化して応対記録毎に当該スコアを要素とする単語ベクトルを生成し、単語ベクトル間の距離に基づいてk−means法などによりクラスタリングする。
First, the
なお、単語の重要度をスコア化する手法としては、数値としての評価が可能なものであれば種々のものを用いることができるが、本実施の形態では、例えば、一般的に用いられている指標である、文章における対象の単語の出現頻度であるTF(Term Frequency)値と、全ての文章の中で対象の単語が出現する文章の数の逆数であるIDF(Inverse Document Frequency)値との積であるTF−IDF値を用いる。これにより、TF−IDF値が大きい単語は、応対記録における重要度が高い単語であると判断することができる。また、各応対記録について、各単語のスコアを要素とする単語ベクトルを生成し、ベクトル空間における各単語ベクトルの代数的な距離(もしくは単語ベクトル間のなす角)によって類似の程度を判断することで、各応対記録をクラスタリングすることができる。 As a method for scoring the importance of words, various methods can be used as long as they can be evaluated as numerical values. In the present embodiment, for example, they are generally used. An index is a TF (Term Frequency) value that is an appearance frequency of a target word in a sentence and an IDF (Inverse Document Frequency) value that is an inverse of the number of sentences in which the target word appears in all sentences. The product TF-IDF value is used. Thereby, it is possible to determine that a word having a large TF-IDF value is a word having high importance in the response recording. In addition, for each response record, a word vector whose element is the score of each word is generated, and the degree of similarity is determined by the algebraic distance (or the angle between the word vectors) of each word vector in the vector space. Each response record can be clustered.
得られた各クラスタから、候補文選択部12により、要約テンプレート15とする対象となる応対記録を候補文16として選択する。候補文16は、例えば、対象のクラスタに含まれる各応対記録において要約の表現やパターンとして頻出するものを含む文や、内容をよく表すと考えられる代表的な文である。ここでは、上述したように例えば、各応対記録について単語毎に算出した重要度のスコアを合計し、当該合計が最大の応対記録を候補文16として選択する。応対記録の文章の短さや、パラメータ化することが可能な単語の多さなどによりスコアに重み付けを行うようにしてもよい。
From each of the obtained clusters, the candidate
選択した候補文16に対して、例えば、テンプレート化部13により、固有表現などのいわゆる内容語に該当する単語をパラメータ化(パラメータに置換)し、要約テンプレート15において“template”ラベルによりテンプレートとして設定する。
For the selected
また、クラスタ情報14内の各クラスタについて、各単語について順位付けした単語ランキング17を得る。ここでは例えば、各単語についてクラスタ内の各応対記録における重要度のスコアを合計し、スコアが高い単語から順に順位付けする。この単語ランキング17における上位の所定の数(図16の例では“折り返し”、“電話”、“様”の3つ)の単語に基づいて得られる組み合わせを、要約テンプレート15において“seqs”ラベルにより連接パターンとして設定することで、図14に示したような要約テンプレート15を自動作成する。さらに、必要に応じて、要約テンプレート15の内容をユーザが編集可能とすることで、ユーザが要約テンプレート15を作成(編集)することを支援する。
In addition, for each cluster in the
図17は、談話要約テンプレート作成システム1における要約テンプレート15の作成処理の流れの例を示したフローチャートである。まず、必要に応じて、要約履歴61に蓄積された各応対記録に対して、談話構造解析システム3を利用して談話構造の解析処理を行い、談話セマンティクス57’を取得する(S601)。本実施の形態では、少なくとも形態素解析部33および固有表現解析部35による解析を行い、形態素情報55および固有表現情報56を得ているものとする。上述したように、要約履歴61に蓄積された各応対記録が談話構造解析システム3および談話要約生成システム2によって生成された要約59から作成されたものである場合はステップS601は不要である。
FIG. 17 is a flowchart showing an example of the flow of processing for creating the
次に、クラスタリング部11により、要約履歴61に蓄積された各応対記録に含まれる各単語から固有表現などのいわゆる内容語に該当する単語をクラスタリングのためにいったん除外する(S602)。固有表現等の単語は、テンプレート化する際にパラメータ化されてしまうため、応対記録をクラスタリングする際の類似の判断には含めないものとすることで、テンプレート化を考慮した形でクラスタリングの精度を向上させることができる。
Next, the
次に、残った各単語について、応対記録毎に重要度をスコア化して当該スコアを要素とする応対記録についての単語ベクトルを生成する(S603)。重要度のスコアリングについては、上述したように、例えば各単語についてのTF−IDF値を用いる。その後、各応対記録についての単語ベクトル間の距離に基づいてk−means法などの任意のクラスタリング手法により各応対記録をクラスタリングし、クラスタ情報14を得る(S604)。 Next, for each remaining word, the importance is scored for each reception record, and a word vector for the reception record having the score as an element is generated (S603). For importance scoring, as described above, for example, the TF-IDF value for each word is used. Thereafter, each reception record is clustered by an arbitrary clustering method such as the k-means method based on the distance between the word vectors for each reception record to obtain cluster information 14 (S604).
その後、クラスタ情報14内の各クラスタについて処理を繰り返すループ処理を開始する(S605)。各クラスタについてのループ処理を開始すると、まず、候補文選択部12により、処理対象のクラスタ内の各応対記録についてそれぞれ、必要に応じて所定の重み付けを行った上でスコアを算出し(S606)、スコアが最大の応対記録を候補文16として選択する(S607)。各応対記録のスコアについては、上述したように、例えば、各応対記録について単語毎に算出した重要度のスコアを合計して算出する。その際、応対記録文の長さが短いものや、パラメータ化することが可能な単語(例えば固有表現などの内容語)が多いものほどスコアが大きくなるよう、所定の係数により重み付けを行なうようにしてもよい。
Thereafter, a loop process for repeating the process for each cluster in the
その後、選択された候補文16について、テンプレート化部13により、固有表現などのいわゆる内容語に該当する単語をパラメータ化する(S608)。一方で、処理対象のクラスタ内の単語を対象として、当該クラスタ内での単語ランキング17を生成する(S609)。ここでは、上述したように例えば、各単語について当該クラスタ内の各応対記録における重要度のスコアを合計し、スコアの高い単語から順に順位付けする。
After that, for the selected
その後、ステップS608でパラメータ化を行った候補文16、およびステップS609で生成した単語ランキング17に基づいてテンプレート化を行い、要約テンプレート15を作成して(S610)、次のクラスタの処理に移る(S611、S605)。要約テンプレート15の作成においては、上述したように例えば、パラメータ化を行った候補文16を“template”ラベルによりテンプレートとして設定し、さらに、単語ランキング17における上位の所定の数の単語に基づいて得られる組み合わせを“seqs”ラベルにより連接パターンとして設定する。
Thereafter, template processing is performed based on the
各クラスタについてのループ処理が終了した場合は、その後、必要に応じて要約テンプレート15の内容をユーザが編集し(S612)、要約テンプレート15を完成させて処理を終了する。この要約テンプレート15を、例えば談話要約生成システム2で用いることにより、要約テンプレート15に設定した項目や内容を含み、不要な項目を含ない要約59を得ることができる。
When the loop processing for each cluster is completed, the user edits the contents of the
以上に説明したように、本実施の形態の談話要約テンプレート作成システム1によれば、要約履歴61に蓄積された応対記録の情報を類似するものにクラスタ化し、クラスタ毎に候補文16を選択して、候補文16に対するパラメータ化と連接パターンの生成を行うことができる。これにより、容易かつ高精度に要約テンプレート15を自動で作成し、もしくは管理者等のユーザが要約テンプレート15を作成することを支援することができる。
As described above, according to the discourse summary
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。 As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.
本発明は、音声認識処理により得られた談話データの構造を解析した結果から談話の要約を生成するためのテンプレートを作成する談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラムに利用可能である。 INDUSTRIAL APPLICABILITY The present invention is applicable to a discourse summary template creation system and a discourse summary template creation program for creating a template for generating a summary of a discourse from the result of analyzing the structure of discourse data obtained by speech recognition processing.
1…談話要約テンプレート作成システム、2…談話要約生成システム、3…談話構造解析システム、4…音声認識エンジン、
11…クラスタリング部、12…候補文選択部、13…テンプレート化部、14…クラスタ情報、15…要約テンプレート、16…候補文、17…単語ランキング、
21…談話要約部、
31…前処理部、32…フロー解析部、33…結束性解析部、34…形態素解析部、35…固有表現解析部、36…談話簡約部、37…フロー解析ルール、38…固有表現解析ルール、
51…談話データ、52…簡約情報、53…フロー情報、54…結束性情報、55…形態素情報、56…固有表現情報、57、57’…談話セマンティクス、58…談話データ、59…要約、
61…要約履歴。
DESCRIPTION OF
DESCRIPTION OF
21 ... Discussion summary section,
DESCRIPTION OF
51 ... Discourse data, 52 ... Simple information, 53 ... Flow information, 54 ... Cohesiveness information, 55 ... Morphological information, 56 ... Specific expression information, 57, 57 '... Discourse semantics, 58 ... Discourse data, 59 ... Summary,
61 ... Summary history.
Claims (6)
過去の要約である要約記録が蓄積された要約履歴から前記要約記録を取得して類似するものに分類してクラスタ化するクラスタリング部と、
前記クラスタ毎に、当該クラスタに含まれる前記要約記録から代表となる要約記録を選択して候補文とする候補文選択部と、
前記各候補文について固有表現をパラメータに置換して前記要約文章のひな形とし、前記要約テンプレートを作成するテンプレート化部とを有し、
前記クラスタリング部は、
前記要約履歴内の前記各要約記録に含まれる各単語について、前記各要約記録における各単語の重要度をスコア化し、前記要約記録毎に各単語についての前記スコアを要素とする単語ベクトルを生成し、前記単語ベクトル間の距離に基づいて前記各要約記録をクラスタリングし、
前記テンプレート化部は、
前記クラスタ毎に、各単語について前記スコアにより順位付けを行い、上位の1つ以上の単語からなる組み合わせを、当該クラスタにおける前記候補文から作成された前記要約文章のひな形に対応する前記連接のパターンとして前記要約テンプレートに設定することを特徴とする談話要約テンプレート作成システム。 It is used when generating a summary about the discourse based on the discourse data in which the content of the discourse has been converted into text, and a portion to be included in the summary that is assumed to be a utterance of a predetermined content in the discourse data. When a list of correspondences between word concatenation patterns for identification and templates of summary sentences to be included in the summary is specified, and the concatenation pattern and the discourse data match, A discourse summary template creation system for creating a summary template that is used to generate the summary text from the corresponding summary text template and use it as the summary,
A clustering unit that obtains the summary records from the summary history in which summary records that are past summaries are accumulated, classifies them into similar ones, and clusters them;
For each cluster, a candidate sentence selection unit that selects a representative summary record from the summary records included in the cluster and sets it as a candidate sentence;
Wherein for each candidate sentence and template of the summary sentence by replacing the specific expression parameter, it possesses a template unit for creating the summary template,
The clustering unit includes:
For each word included in each summary record in the summary history, the importance level of each word in each summary record is scored, and a word vector having the score for each word as an element is generated for each summary record. Clustering each summary record based on the distance between the word vectors;
The templating unit
For each cluster, each word is ranked according to the score, and a combination of one or more high-order words is combined with the connected sentence corresponding to the template of the summary sentence created from the candidate sentences in the cluster. A discourse summary template creation system , wherein the summary template is set as a pattern .
前記候補文選択部は、
前記要約記録毎に各単語について算出された前記スコアを合計し、当該合計が最大となる前記要約記録を前記候補文として選択することを特徴とする談話要約テンプレート作成システム。 In the discourse summary template creation system according to claim 1 ,
The candidate sentence selection unit
The discourse summary template creation system characterized by summing up the scores calculated for each word for each summary record, and selecting the summary record that maximizes the sum as the candidate sentence.
前記クラスタリング部は、
前記要約記録に含まれる各単語から固有表現に該当する単語を除外して前記単語ベクトルを生成することを特徴とする談話要約テンプレート作成システム。 In the discourse summary template creation system according to claim 1 ,
The clustering unit
A discourse summary template creation system, wherein the word vector is generated by excluding a word corresponding to a specific expression from each word included in the summary record.
過去の要約である要約記録が蓄積された要約履歴から前記要約記録を取得して類似するものに分類してクラスタ化するクラスタリング部と、
前記クラスタ毎に、当該クラスタに含まれる前記要約記録から代表となる要約記録を選択して候補文とする候補文選択部と、
前記各候補文について固有表現をパラメータに置換して前記要約文章のひな形とし、前記要約テンプレートを作成するテンプレート化部とを有し、
前記クラスタリング部は、
前記要約履歴内の前記各要約記録に含まれる各単語について、前記各要約記録における各単語の重要度をスコア化し、前記要約記録毎に各単語についての前記スコアを要素とする単語ベクトルを生成し、前記単語ベクトル間の距離に基づいて前記各要約記録をクラスタリングし、
前記候補文選択部は、
前記要約記録毎に各単語について算出された前記スコアを合計し、当該合計に対して、前記要約記録における固有表現の数に応じて所定の重み付けを行い、当該合計が最大となる前記要約記録を前記候補文として選択することを特徴とする談話要約テンプレート作成システム。 It is used when generating a summary about the discourse based on the discourse data in which the content of the discourse has been converted into text, and a portion to be included in the summary that is assumed to be a utterance of a predetermined content in the discourse data. When a list of correspondences between word concatenation patterns for identification and templates of summary sentences to be included in the summary is specified, and the concatenation pattern and the discourse data match, A discourse summary template creation system for creating a summary template that is used to generate the summary text from the corresponding summary text template and use it as the summary,
A clustering unit that obtains the summary records from the summary history in which summary records that are past summaries are accumulated, classifies them into similar ones, and clusters them;
For each cluster, a candidate sentence selection unit that selects a representative summary record from the summary records included in the cluster and sets it as a candidate sentence;
A template for creating a summary template by replacing a specific expression with a parameter for each candidate sentence to form a template of the summary sentence;
The clustering unit includes:
For each word included in each summary record in the summary history, the importance level of each word in each summary record is scored, and a word vector having the score for each word as an element is generated for each summary record. Clustering each summary record based on the distance between the word vectors;
The candidate sentence selection unit
Summing the score calculated for each word in each of the summary records, with respect to the total, had a row a predetermined weight according to the number of named entities in the summary record, the summary records the sum is the maximum Is selected as the candidate sentence, and a discourse summary template creation system.
過去の要約である要約記録が蓄積された要約履歴から前記要約記録を取得して類似するものに分類してクラスタ化するクラスタリング部と、
前記クラスタ毎に、当該クラスタに含まれる前記要約記録から代表となる要約記録を選択して候補文とする候補文選択部と、
前記各候補文について固有表現をパラメータに置換して前記要約文章のひな形とし、前記要約テンプレートを作成するテンプレート化部とを有し、
前記クラスタリング部は、
前記要約履歴内の前記各要約記録に含まれる各単語について、前記各要約記録における各単語の重要度をスコア化し、前記要約記録毎に各単語についての前記スコアを要素とする単語ベクトルを生成し、前記単語ベクトル間の距離に基づいて前記各要約記録をクラスタリングし、
前記候補文選択部は、
前記要約記録毎に各単語について算出された前記スコアを合計し、当該合計に対して、前記要約記録の文章の短さに応じて所定の重み付けを行い、当該合計が最大となる前記要約記録を前記候補文として選択することを特徴とする談話要約テンプレート作成システム。 It is used when generating a summary about the discourse based on the discourse data in which the content of the discourse has been converted into text, and a portion to be included in the summary that is assumed to be a utterance of a predetermined content in the discourse data. When a list of correspondences between word concatenation patterns for identification and templates of summary sentences to be included in the summary is specified, and the concatenation pattern and the discourse data match, A discourse summary template creation system for creating a summary template that is used to generate the summary text from the corresponding summary text template and use it as the summary,
A clustering unit that obtains the summary records from the summary history in which summary records that are past summaries are accumulated, classifies them into similar ones, and clusters them;
For each cluster, a candidate sentence selection unit that selects a representative summary record from the summary records included in the cluster and sets it as a candidate sentence;
A template for creating a summary template by replacing a specific expression with a parameter for each candidate sentence to form a template of the summary sentence;
The clustering unit includes:
For each word included in each summary record in the summary history, the importance level of each word in each summary record is scored, and a word vector having the score for each word as an element is generated for each summary record. Clustering each summary record based on the distance between the word vectors;
The candidate sentence selection unit
Summing the score calculated for each word in each of the summary records, with respect to the total, had a row a predetermined weight in accordance with the short text of the summary records, the summary records the sum is the maximum Is selected as the candidate sentence, and a discourse summary template creation system.
過去の要約である要約記録が蓄積された要約履歴から前記要約記録を取得して類似するものに分類してクラスタ化するクラスタリング処理と、
前記クラスタ毎に、当該クラスタに含まれる前記要約記録から代表となる要約記録を選択して候補文とする候補文選択処理と、
前記各候補文について固有表現をパラメータに置換して前記要約文章のひな形とし、前記要約テンプレートを作成するテンプレート化処理とを実行し、
前記クラスタリング処理では、
前記要約履歴内の前記各要約記録に含まれる各単語について、前記各要約記録における各単語の重要度をスコア化し、前記要約記録毎に各単語についての前記スコアを要素とする単語ベクトルを生成し、前記単語ベクトル間の距離に基づいて前記各要約記録をクラスタリングし、
前記テンプレート化処理では、
前記クラスタ毎に、各単語について前記スコアにより順位付けを行い、上位の1つ以上の単語からなる組み合わせを、当該クラスタにおける前記候補文から作成された前記要約文章のひな形に対応する前記連接のパターンとして前記要約テンプレートに設定することを特徴とする談話要約テンプレート作成プログラム。 It is used when generating a summary about the discourse based on the discourse data in which the content of the discourse is converted into text. When a list of correspondences between word concatenation patterns for identification and templates of summary sentences to be included in the summary is specified, and the concatenation pattern and the discourse data match, A discourse summary template creation program that causes a computer to operate as a discourse summary template creation system that creates a summary template used to generate the summary sentences from the corresponding summary sentence template,
A clustering process for acquiring the summary records from the summary history in which summary records that are past summaries are accumulated, classifying them into similar ones, and clustering them;
For each cluster, a candidate sentence selection process that selects a representative summary record from the summary records included in the cluster as a candidate sentence;
For each of the candidate sentences, replace the specific expression with a parameter to form a template of the summary sentence, and execute a template processing for creating the summary template ,
In the clustering process,
For each word included in each summary record in the summary history, the importance level of each word in each summary record is scored, and a word vector having the score for each word as an element is generated for each summary record. Clustering each summary record based on the distance between the word vectors;
In the template processing,
For each cluster, each word is ranked according to the score, and a combination of one or more high-order words is combined with the connected sentence corresponding to the template of the summary sentence created from the candidate sentences in the cluster. A discourse summary template creation program characterized in that the summary template is set as a pattern .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011269169A JP5774459B2 (en) | 2011-12-08 | 2011-12-08 | Discourse summary template creation system and discourse summary template creation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011269169A JP5774459B2 (en) | 2011-12-08 | 2011-12-08 | Discourse summary template creation system and discourse summary template creation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013120547A JP2013120547A (en) | 2013-06-17 |
JP5774459B2 true JP5774459B2 (en) | 2015-09-09 |
Family
ID=48773150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011269169A Active JP5774459B2 (en) | 2011-12-08 | 2011-12-08 | Discourse summary template creation system and discourse summary template creation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5774459B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106959976A (en) * | 2016-01-12 | 2017-07-18 | 腾讯科技(深圳)有限公司 | A kind of search processing method and device |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014208298A1 (en) * | 2013-06-28 | 2014-12-31 | 日本電気株式会社 | Text classification device, text classification method, and recording medium |
JP6078485B2 (en) * | 2014-02-13 | 2017-02-08 | 日本電信電話株式会社 | Operation history analysis apparatus, method, and program |
US10810497B2 (en) | 2016-03-09 | 2020-10-20 | International Business Machines Corporation | Supporting generation of a response to an inquiry |
JP2017167433A (en) | 2016-03-17 | 2017-09-21 | 株式会社東芝 | Summary generation device, summary generation method, and summary generation program |
JP6815184B2 (en) * | 2016-12-13 | 2021-01-20 | 株式会社東芝 | Information processing equipment, information processing methods, and information processing programs |
JP6920104B2 (en) * | 2017-05-16 | 2021-08-18 | 日本放送協会 | Manuscript automatic generator and program |
JP7288293B2 (en) * | 2018-08-31 | 2023-06-07 | 株式会社日立ソリューションズ東日本 | Summary generation device and summary generation method |
JP7135730B2 (en) * | 2018-10-31 | 2022-09-13 | 富士通株式会社 | Summary generation method and summary generation program |
CN110264792B (en) * | 2019-06-17 | 2021-11-09 | 上海元趣信息技术有限公司 | Intelligent tutoring system for composition of pupils |
CN114026557A (en) * | 2019-07-04 | 2022-02-08 | 松下知识产权经营株式会社 | Speech analysis device, speech analysis method, and program |
CN111125221B (en) * | 2019-12-19 | 2023-05-05 | 上海三稻智能科技有限公司 | Excel format-based data extraction system and configuration method |
CN111739536A (en) * | 2020-05-09 | 2020-10-02 | 北京捷通华声科技股份有限公司 | Audio processing method and device |
JP7223469B1 (en) | 2022-09-07 | 2023-02-16 | 株式会社Aces | Utterance information documentation device |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10134066A (en) * | 1996-10-29 | 1998-05-22 | Matsushita Electric Ind Co Ltd | Sentence summarizing up device |
JP4380142B2 (en) * | 2002-11-05 | 2009-12-09 | 株式会社日立製作所 | Search system and search method |
JP4934819B2 (en) * | 2007-03-30 | 2012-05-23 | 国立大学法人九州工業大学 | Information extraction apparatus, method and program thereof |
JP5341732B2 (en) * | 2009-11-30 | 2013-11-13 | 株式会社野村総合研究所 | Discourse summary generation system and discourse summary generation program |
-
2011
- 2011-12-08 JP JP2011269169A patent/JP5774459B2/en active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106959976A (en) * | 2016-01-12 | 2017-07-18 | 腾讯科技(深圳)有限公司 | A kind of search processing method and device |
US10713302B2 (en) | 2016-01-12 | 2020-07-14 | Tencent Technology (Shenzhen) Company Limited | Search processing method and device |
CN106959976B (en) * | 2016-01-12 | 2020-08-14 | 腾讯科技(深圳)有限公司 | Search processing method and device |
Also Published As
Publication number | Publication date |
---|---|
JP2013120547A (en) | 2013-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5774459B2 (en) | Discourse summary template creation system and discourse summary template creation program | |
JP5468474B2 (en) | Talk script usage status calculation system and talk script usage status calculation program | |
CN108364632B (en) | Emotional Chinese text voice synthesis method | |
JP7042693B2 (en) | Interactive business support system | |
US11954140B2 (en) | Labeling/names of themes | |
US10860566B1 (en) | Themes surfacing for communication data analysis | |
JP6618992B2 (en) | Statement presentation device, statement presentation method, and program | |
US20080077869A1 (en) | Conference supporting apparatus, method, and computer program product | |
JP5574842B2 (en) | FAQ candidate extraction system and FAQ candidate extraction program | |
JP5495967B2 (en) | Discourse summary generation system and discourse summary generation program | |
JP5495968B2 (en) | Discourse structure analysis system and discourse structure analysis program | |
Dutrey et al. | A CRF-based approach to automatic disfluency detection in a French call-centre corpus. | |
JP5341732B2 (en) | Discourse summary generation system and discourse summary generation program | |
JP5457284B2 (en) | Discourse breakdown calculation system and discourse breakdown calculation program | |
JP5856198B2 (en) | Discourse summary generation system and discourse summary generation program | |
JP2013120514A (en) | Dialogue summarization system and dialogue summarization program | |
JP2011123565A (en) | Faq candidate extracting system and faq candidate extracting program | |
JP7272531B2 (en) | TEXT ANALYSIS APPARATUS AND METHOD | |
CN111949777A (en) | Intelligent voice conversation method and device based on crowd classification and electronic equipment | |
JP6821542B2 (en) | Dialogue control devices, programs and methods that can carry out multiple types of dialogue in succession. | |
JP5713782B2 (en) | Information processing apparatus, information processing method, and program | |
CN114925179A (en) | Information query method, device, storage medium and terminal | |
US20170270949A1 (en) | Summary generating device, summary generating method, and computer program product | |
Sproat et al. | Applications of lexicographic semirings to problems in speech and language processing | |
KR102069101B1 (en) | Method for extracting major semantic feature from voice of customer data, and data concept classification method using thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140826 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150331 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150529 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20150605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5774459 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |