JP6208794B2 - Conversation analyzer, method and computer program - Google Patents
Conversation analyzer, method and computer program Download PDFInfo
- Publication number
- JP6208794B2 JP6208794B2 JP2016051032A JP2016051032A JP6208794B2 JP 6208794 B2 JP6208794 B2 JP 6208794B2 JP 2016051032 A JP2016051032 A JP 2016051032A JP 2016051032 A JP2016051032 A JP 2016051032A JP 6208794 B2 JP6208794 B2 JP 6208794B2
- Authority
- JP
- Japan
- Prior art keywords
- conversation
- category
- text
- segment
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、対話型テキストを解析する技術に関する。 The present invention relates to a technique for analyzing interactive text.
顧客及び潜在顧客(以下、顧客等)から寄せられる様々な情報は企業にとって有用である。例えば、既存顧客から寄せられた意見などをテキスト化し、このテキストを解析することで将来に起きるかもしれない商品またはサービスに関する問題の予兆を検出する技術がある(例えば、特許文献1)。 Various information received from customers and potential customers (hereinafter referred to as customers) is useful for companies. For example, there is a technique for detecting a sign of a problem relating to a product or service that may occur in the future by converting an opinion received from an existing customer into text and analyzing the text (for example, Patent Document 1).
近年は、インターネット技術の発達及びSNS(ソーシャル・ネットワーク・サービス)の普及などにより、顧客等の声を集める手段が多様化している。しかしながら、顧客等とオペレータとが直接会話をして商品等のトラブルに対応したり、顧客等の疑問に答えたりする電話対応業務は、依然として顧客等の声を集める手段として重要である。オペレータが適切に対応することで、他の手段では得がたい情報を得られる場合もあるからである。そのためには、会話スキルの高いオペレータを養成することが重要である。 In recent years, due to the development of Internet technology and the spread of SNS (Social Network Service), means for collecting customers' voices have been diversified. However, the telephone handling operation in which the customer and the operator talk directly with each other to deal with troubles of the product and answer the questions of the customer is still important as a means of collecting the voice of the customer. This is because the operator may be able to obtain information that cannot be obtained by other means by appropriately responding. To that end, it is important to train operators with high conversation skills.
ところで、顧客等とオペレータとの会話で用いられるのは、通常は口語体(話し言葉)であって書き言葉である文語体の文章に比べて文法が不正確で曖昧であり、かつ、挨拶、相づち、感嘆詞など文脈とは関係のない言葉が大量に含まれるという特徴がある。そのため、顧客等とオペレータとの会話をテキスト化した会話テキストの自動解析技術は実用化されていない。 By the way, conversations between customers and operators are usually used in spoken language (spoken language), and the grammar is inaccurate and ambiguous compared to written sentences. It is characterized by a large amount of words that are not related to the context, such as lyrics. For this reason, automatic analysis technology for conversational text, which is a text conversation between a customer and an operator, has not been put to practical use.
そこで、本発明の目的は、会話テキストを自動解析する技術を提供することである。 Therefore, an object of the present invention is to provide a technique for automatically analyzing a conversation text.
本発明の別の目的は、会話テキストを自動解析して、話者の会話の特徴を抽出することである。 Another object of the present invention is to automatically analyze the conversation text and extract the features of the speaker's conversation.
本発明の一つの実施態様に従う会話分析装置は、少なくとも第1の話者と第2の話者との会話の内容を記述したテキストを含む会話記録データを記憶する手段と、前記会話記録データのテキストを複数のユニットに分割し、前記ユニット同士の類似度に基づいて、前記複数のユニットを複数のセグメントに分割するセグメント分け手段と、前記セグメント分け手段によって形成された複数のセグメントを複数のカテゴリに分類するカテゴリ分け手段と、前記カテゴリ分け手段による分類の結果に基づいて、前記会話に含まれる複数のカテゴリ及び前記会話の中でのカテゴリの遷移を示す会話パターンデータを記憶する手段と、を備える。 According to an embodiment of the present invention, there is provided a conversation analysis apparatus for storing conversation record data including text describing at least the contents of a conversation between a first speaker and a second speaker; Segmenting means for dividing the text into a plurality of units and dividing the plurality of units into a plurality of segments based on the similarity between the units; and the plurality of segments formed by the segmenting means in a plurality of categories Categorizing means for classifying into: and a means for storing conversation pattern data indicating a plurality of categories included in the conversation and a transition of categories in the conversation based on a result of classification by the categorizing means; Prepare.
好適な実施態様では、前記会話パターンデータを記憶する手段に記憶された複数の第1の話者の会話パターンデータを参照して、第1の話者別にカテゴリの遷移の特徴を抽出する会話パターン分析手段を、さらに備えてもよい。 In a preferred embodiment, a conversation pattern for extracting a category transition characteristic for each first speaker with reference to conversation pattern data of a plurality of first speakers stored in the means for storing the conversation pattern data. An analysis means may be further provided.
好適な実施態様では、前記セグメント分け手段は、前記複数のユニットを所定数のクラスタに分離するクラスタリング処理を行い、同一クラスタに属し、かつ、連続している複数のユニットで一つのセグメントを形成してもよい。 In a preferred embodiment, the segmenting means performs a clustering process for separating the plurality of units into a predetermined number of clusters, and forms one segment with a plurality of units belonging to the same cluster and continuous. May be.
好適な実施態様では、前記カテゴリ分け手段による分類の結果に基づいて、前記会話に含まれる各カテゴリに要した時間を算出する手段を、さらに備えてもよい。 In a preferred embodiment, there may be further provided means for calculating a time required for each category included in the conversation based on a result of classification by the categorizing means.
好適な実施態様では、前記会話記録データのテキストから不要語を削除する不要語削除手段を、さらに備え、前記セグメント分け手段は、前記不要語削除手段により不要語が削除されたテキストに基づいてセグメント分けを行ってもよい。 In a preferred embodiment, the apparatus further comprises unnecessary word deleting means for deleting unnecessary words from the text of the conversation record data, and the segmenting means performs segmentation based on the text from which unnecessary words have been deleted by the unnecessary word deleting means. Dividing may be performed.
好適な実施態様では、前記不要語削除手段は、前記複数の発話を複数の処理単位に分割し、概念検索機能を用いて前記処理単位と削除対象語との関連度を求めて前記不要語を特定してもよい。 In a preferred embodiment, the unnecessary word deleting means divides the plurality of utterances into a plurality of processing units, obtains a degree of association between the processing unit and the deletion target word using a concept search function, and determines the unnecessary words. You may specify.
以下、本発明の一実施形態に係る会話分析装置について、図面を参照して説明する。 Hereinafter, a conversation analysis device according to an embodiment of the present invention will be described with reference to the drawings.
図1は、本実施形態にかかる会話分析装置1の機能構成図である。会話分析装置1は、プロセッサ、メモリ及び入出力デバイス等を備える汎用的な情報処理装置に所定のコンピュータプログラムを実行させることで実現されたものであっても良い。
FIG. 1 is a functional configuration diagram of a
会話分析装置1は、同図に示すように、データを記憶する手段として、会話音声データ記憶部31と、会話属性データ記憶部33と、会話記録データ記憶部35と、会話パターンデータ記憶部37と、カテゴリ遷移記憶部39と、を備える。
As shown in the figure, the
会話音声データ記憶部31は、複数の話者が発話した会話の音声データのファイルを記憶する。音声データファイルのファイル名には後述する会話IDが含まれていても良い。
The conversation voice
会話属性データ記憶部33は、会話音声データ記憶部31に保存されている会話音声データの属性を示すデータを記憶する。会話属性データは、例えば、会話を行っている話者、会話が行われた日時及び状況などの情報を含んでも良い。
The conversation attribute
図2は、会話属性データ330の一例を示す図である。 FIG. 2 is a diagram illustrating an example of the conversation attribute data 330.
同図に示すように会話属性データ330は、データ項目として会話ID331と、話者ID333とを有する。
As shown in the figure, the conversation attribute data 330 has a
会話ID331は、会話分析装置1が処理対象としている複数の会話を識別する識別情報である。
The
話者ID333は、会話ID331の会話に参加している話者の識別情報である。参加している人数分の登録が可能である。話者が特定できない場合は、不明としてもよい。
The
図1に戻ると、会話記録データ記憶部35は、複数の話者が発話して行われた会話のテキストのデータを記憶する。例えば、会話記録データ記憶部35は、少なくとも第1の話者と第2の話者の発話とが含まれる会話の内容を記述したテキストを含む会話データのファイルを記憶する。会話テキストデータのファイル名に会話IDが含まれていても良い。会話記録データ記憶部35は、例えば、会話テキスト351及び編集テキスト353を記憶する。
Returning to FIG. 1, the conversation record
図3は、会話テキスト351及び編集テキスト353の一例を示す図である。
FIG. 3 is a diagram illustrating an example of the
同図Aに示すように、会話テキスト351は、テキスト部351Aとタイムコード部351Bとを有する。
As shown in FIG. A, the
テキスト部351Aは、複数(少なくとも二人)の話者の発話を含む会話の内容を記述したテキストである。会話においては、複数の話者の発話が交互にされていてもよい。会話中には、挨拶や相づちなどの文脈を特定するために不要な表現が多数含まれている。後述するように、不要語削除処理部13がこれらの不要な表現を除去するようにしても良い。
The
タイムコード部351Bは、発話毎に、各発話が開始したタイムコード及び終了したタイムコードを有する。タイムコード部351Bは、音声認識処理部11が会話音声データに基づいて音声認識を行う際に生成されて良い。
The
なお、会話テキスト351は、音声認識処理部11で音声データから抽出されたテキスト以外のテキストでもよい。例えば、人が入力したテキストでもよいし、OCR(Optical Character Reader)等で画像から抽出したテキストでもよい。
The
同図Bは編集テキスト353を示す。編集テキスト353は、後述する不要語削除処理によって会話テキスト351から不要語が削除されたテキストのデータである。編集テキスト353は、テキスト部353Aとタイムコード部353Bと有する。
FIG. 5B shows the
図1に戻ると、会話パターンデータ記憶部37は、会話テキスト351の分析によって明らかになった会話パターンを示すデータを記憶する。会話パターンデータは、例えば、会話に含まれる複数のカテゴリ及び前記会話の中でのカテゴリの遷移を示すものでも良い。
Returning to FIG. 1, the conversation pattern
図4は、会話パターンデータ370の一例を示す図である。 FIG. 4 is a diagram illustrating an example of the conversation pattern data 370.
同図に示すように、会話パターンデータ370は、データ構造として会話ID371と、セグメント373と、時間374と、カテゴリ375とを有する。
As shown in the figure, the conversation pattern data 370 has a
セグメント373は、会話テキスト351を複数に分割して形成されたセグメントの識別情報である。ここでは、各セグメントは、会話に登場した順に、一つの会話ID371に対してユニークな連番が振られている。
The
時間374は、各セグメントが継続した時間である。セグメントの継続時間については後述する。
カテゴリ375は各セグメントに割り当てられるカテゴリである。一つのセグメントに割り当てられるカテゴリ375は複数あっても良い。
A
会話パターンデータ370では、セグメント373の番号は会話内でカテゴリが登場した順序に対応する。例えば、図4の会話ID「1001」の会話では、セグメント373の番号順に、カテゴリA→カテゴリBまたはC→カテゴリC→カテゴリDまたはAの順にカテゴリが遷移したことを示す。
In the conversation pattern data 370, the number of the
図1に戻ると、カテゴリ遷移記憶部39は、会話内でのカテゴリ遷移の特徴を示すデータを記憶する。例えば、カテゴリ遷移記憶部39は、話者別のカテゴリの遷移の特徴を示す統計データを記憶しても良い。
Returning to FIG. 1, the category
図5は、カテゴリ遷移データ390の一例を示す図である。 FIG. 5 is a diagram illustrating an example of the category transition data 390.
同図に示すように、カテゴリ遷移データ390は、データ項目として、カテゴリ391と、話者ID392と、件数393と、時間394と、遷移カテゴリ395とを有する。件数393は、カテゴリ391及び話者ID392別の件数でよい。時間394は、各カテゴリ391に割り当てられた、話者ID392別のセグメントの継続時間の総和である。遷移カテゴリ395は、カテゴリ391から遷移した遷移先のカテゴリである。遷移カテゴリ395は、さらに、カテゴリ名、件数及び確率をデータ項目として有する。遷移カテゴリ395は、カテゴリ391から直接遷移したカテゴリ、つまりカテゴリ391の次に登場するカテゴリを対象としてカウントするだけでなく、カテゴリ391から他のカテゴリを経由して遷移したカテゴリ、つまり、カテゴリ391の次の次に登場するカテゴリを対象としてカウントしても良い。
As shown in the figure, the category transition data 390 includes, as data items, a
図1を改めて参照すると、会話分析装置1は、音声認識処理部11と、不要語削除処理部13と、セグメント処理部15と、カテゴライズ処理部17と、会話パターン分析処理部19と、を有する。
Referring back to FIG. 1, the
音声認識処理部11は、音声データを認識してテキスト抽出する音声認識処理を行う。音声認識処理部11は、例えば、会話音声データ記憶部31に保存されている会話の音声ファイルの音声認識を行って、会話の内容を記述したテキストを含む会話テキスト351を生成する。会話テキスト351のデータは会話記録データ記憶部35に保存される。
The speech
音声認識処理部11は、例えば、音声認識により会話音声データからテキストを抽出し、会話を発話単位で区切ったテキストを含むテキスト部315Aを生成する。さらに音声認識処理部11は、会話音声データにおける発話の開始及び終了のタイムコードを特定し、テキスト部351Aのテキストと対応させたタイムコード部351Bを生成する。
For example, the voice
音声認識処理部11は、音声認識によって、それぞれの発話がどの話者によってなされているのかを識別してもよい。さらに、音声認識処理部11は、識別された話者の特定が可能であれば、特定された話者IDを会話属性データ330に登録してもよい。
The voice
不要語削除処理部13は、会話テキスト351から不必要な語を削除する。例えば、不要語削除処理部13は、概念検索機能を用いて会話記録データ記憶部35に保存されている会話テキスト351のテキスト部351Aに含まれる語や文のうち、不要語を特定しても良い。不要語削除処理部13は、例えば不要語辞書を有し、この辞書を参照して削除対象の不要語を特定するようにしても良い。
The unnecessary word
図6は、不要語辞書510の一例を示す図である。 FIG. 6 is a diagram illustrating an example of the unnecessary word dictionary 510.
同図に示すように、不要語辞書510は、挨拶などの定型句の種類別に、削除対象の表現例及び削除しない表現例を有してもよい。 As shown in the figure, the unnecessary word dictionary 510 may have an expression example to be deleted and an expression example not to be deleted for each type of fixed phrase such as greetings.
不要語削除処理部13は、会話テキスト351のテキストを、例えば形態素に区切り、概念検索により不要語辞書510に登録されている表現との関連度を算出するようにしても良い。不要語削除処理部13は、概念検索の関連度が所定以上である処理単位のテキストを不要語として会話テキスト351から削除しても良い。不要語削除処理部13は、会話テキスト351から不要語を削除して編集テキスト353を生成する。なお、概念検索は、任意の概念検索のアルゴリズムを用いて行ってもよい。
The unnecessary word
テキスト部351Aのテキストにおいて、一つの発話の中の一部が不要語として削除された場合でも、その発話に対応するタイムコードは変更しなくてよい。例えば、ある発話から不要語が削除され、その発話に対応するテキストが短くなったときでも、その発話に対応するタイムコード部351Bのタイムコードを変更せずに、タイムコード部353Bを生成してもよい。
Even when a part of one utterance is deleted as an unnecessary word in the text of the
なお、会話テキスト351に対して不要語削除処理を適用することが必須ではない。例えば、チャットを記録した会話テキストには不要語削除処理を適用しなくてもよい。
Note that it is not essential to apply the unnecessary word deletion process to the
セグメント処理部15は、編集テキスト353を複数のセグメントに分割する。例えば、セグメント処理部15は、テキストを所定の処理単位であるユニットに区切って処理を行っても良い。セグメント処理部15は、各ユニットの時間を計測してもよい。さらに、セグメント処理部15は、そのユニット同士の類似度に基づいて、会話中の複数のユニットを複数のセグメントに分類してもよい。セグメント処理部15は、一人の話者が話し始めてから他の話者が話を始めるまでの間に続いた発話のテキスト部分を一つのユニットとしてもよいし、句読点で区切れる範囲を一つのユニットとしても良いし、一文を一つのユニットとしても良い。
The
セグメント処理部15は、さらに、セグメントが継続した時間を算出してもよい。例えば、セグメント処理部15は、同一セグメントに割り当てられた発話の時間を、タイムコード部353Bを参照して特定し、それらの時間を足し合わせてセグメントの継続時間としてもよい。
The
セグメント処理部15は、会話テキスト351を対象として複数のセグメントに分割してもよい。
The
セグメント処理部15は、会話に含まれる多数のユニットをクラスタリング処理によって所定数のクラスタに分類してもよい。クラスタリング処理によって分類されるクラスタ数は任意に定めることができる。いずれのクラスタにも分類されないユニットは「その他」に分類しても良い。セグメント処理部15は、任意のクラスタリングアルゴリズムを用いることができる。
The
セグメント処理部15は、テキストの構文解析または意味解析などを行うことなく、ユニット同士の類似度に着目してクラスタリングを行うようにしてもよい。
The
セグメント処理部15は、クラスタリングの結果に基づいて複数のユニットを複数のセグメントに分割する。
The
図7は、クラスタリングされた会話テキストのユニットとセグメントの関係を示す図である。 FIG. 7 is a diagram illustrating the relationship between clustered conversation text units and segments.
同図では、編集テキスト353が区切られた複数のユニット420に項番410が振られている。さらに、クラスタ430は4つのクラスタ(C1〜C4)及びその他を含み、各ユニット420が割り当てられたクラスタを示す。
In the figure, an item number 410 is assigned to a plurality of units 420 in which the
ここで、セグメント処理部15は、同一クラスタに属し、かつ、連続している複数のユニットを一つのセグメントとしてもよい。一つのセグメントには一つ以上のユニットが割り当てられる。同図の例では、一つに囲まれた項番1−2、項番3−6、項番7、・・・、項番25−27、項番28−29及び項番30が、それぞれ一つのセグメントになる。
Here, the
図1を参照すると、カテゴライズ処理部17は、セグメント処理部15によって形成された複数のセグメントを複数のカテゴリに分類してもよい。例えば、カテゴライズ処理部17は、カテゴリ辞書を有していて、カテゴリ辞書を参照しながら、各セグメントを予め定められた複数のカテゴリのうちのいずれかに分類しても良い。カテゴリは、例えば、会話で話題になり得るトピックを示す分類でよい。
Referring to FIG. 1, the
図8は、カテゴリ辞書530の一例を示す図である。カテゴリ辞書530は、項目としてカテゴリ531と、模範文533と、重要単語535とを有する。
FIG. 8 is a diagram illustrating an example of the category dictionary 530. The category dictionary 530 includes a
カテゴライズ処理部17は、各セグメントに分類されているユニット420とカテゴリ辞書530の模範文533または重要単語535とを比較して、各セグメントにいずれかのカテゴリを割り当てる。一つのセグメントに二つ以上のカテゴリが割り当てられることもある。カテゴライズ処理部17が、各セグメントにカテゴリを割り当てた会話パターンデータ370(図4参照)を生成し、会話パターンデータ記憶部37に保存する。
The
会話パターン分析処理部19は、会話パターンデータを分析して、会話の特徴を抽出する。
The conversation pattern
会話パターン分析処理部19は、例えば、複数の第1の話者の会話パターンデータを参照して、第1の話者別にカテゴリの遷移の特徴を抽出してもよい。例えば、会話パターンデータ記憶部37に、多数のオペレータがさまざまな顧客等に対応したときの会話テキスト351を処理して得られた会話パターンデータ370が保存されているとき、会話パターン分析処理部19は、オペレータ別に、会話内でのあるカテゴリから別のカテゴリへの遷移回数をカウントしてもよいし、遷移する確率を算出しても良い。算出された確率は、カテゴリ遷移データ390の遷移先カテゴリ395に保存されてもよい。
The conversation pattern
また、会話パターン分析処理部19は、会話パターンデータに基づいて、第1の話者別に各カテゴリに要した時間を算出してもよい。例えば、会話パターン分析処理部19は、オペレータ別カテゴリ別に時間374を積算して、オペレータ毎に各カテゴリに要した時間を算出してもよい。算出された時間は、カテゴリ遷移データ390の時間394に保存されてもよい。
The conversation pattern
会話パターン分析処理部19は、カテゴリ遷移の算出結果として、カテゴリ遷移データ390(図5参照)を生成しても良い。カテゴリ遷移データ390はカテゴリ遷移記憶部39に保存される。
The conversation pattern
これにより、会話で話題にしたカテゴリを抽出できる。さらに、カテゴリの継続時間、及びカテゴリ遷移に着目すると、話者ごとの会話の特徴を抽出できる。例えば、カテゴリの継続時間、カテゴリの出現頻度、特定のカテゴリから別の特定のカテゴリへ遷移する確率等を求めることで、話者別の特徴的な傾向を抽出することも可能である。 This makes it possible to extract categories that are discussed in conversation. Furthermore, focusing on the duration of the category and the category transition, the conversation characteristics for each speaker can be extracted. For example, by determining the duration of a category, the frequency of appearance of a category, the probability of transition from a specific category to another specific category, etc., it is possible to extract a characteristic tendency for each speaker.
特に、オペレータが顧客等に対応したときの会話テキストデータかカテゴリ遷移データを抽出したときには、オペレータごとの顧客応対スキルを可視化することができる。例えば、評価の高いオペレータのカテゴリ遷移の傾向を把握できれば、新人オペレータ教育に活用できる可能性がある。 In particular, when conversation text data or category transition data when an operator corresponds to a customer or the like is extracted, the customer reception skill for each operator can be visualized. For example, if the tendency of category transition of highly evaluated operators can be grasped, there is a possibility that it can be used for new operator education.
上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。 The above-described embodiments of the present invention are examples for explaining the present invention, and are not intended to limit the scope of the present invention only to those embodiments. Those skilled in the art can implement the present invention in various other modes without departing from the gist of the present invention.
1 会話分析装置
11 音声認識処理部
13 不要語削除処理部
15 セグメント処理部
17 カテゴライズ処理部
19 会話パターン分析処理部
31 会話音声データ記憶部
33 会話属性データ記憶部
35 会話記録データ記憶部
37 会話パターンデータ記憶部
39 カテゴリ遷移記憶部
DESCRIPTION OF
Claims (7)
前記会話記録データのテキストを複数のユニットに分割し、前記ユニットの時間を計測し、前記ユニット同士の類似度に基づいて、前記会話記録データのテキストを所定数のクラスタに分離するクラスタリング処理を行い、同一クラスタに属し、かつ、連続している複数のユニットで一つのセグメントを形成するように、前記会話記録データのテキストを複数のセグメントに分割し、同一セグメントのユニットの時間を足し合わせてセグメントの継続時間を算出するセグメント処理手段と、
前記セグメント処理手段によって形成された複数のセグメントを、前記第2の話者の要望あるいは状況に関連する話題をそれぞれ示す複数のカテゴリに分類するカテゴライズ処理手段と、
前記セグメントの継続時間と、前記カテゴライズ処理手段による分類の結果と、を示す会話パターンデータを記憶する記憶手段と、
前記記憶手段に記憶された第1の話者の会話パターンデータを参照して、前記第1の話者の会話に含まれるカテゴリ、該カテゴリに要した時間、およびカテゴリ遷移を抽出する会話パターン分析処理手段と、
を備える会話分析装置。 Means for storing conversation record data including text describing the content of a conversation between a first speaker who is a customer-facing operator and a second speaker including the customer ;
A clustering process is performed for dividing the text of the conversation recording data into a plurality of units, measuring the time of the units, and separating the text of the conversation recording data into a predetermined number of clusters based on the similarity between the units. The text of the conversation recording data is divided into a plurality of segments so as to form one segment with a plurality of continuous units belonging to the same cluster, and the time of the units of the same segment is added to form a segment Segment processing means for calculating the duration of
A category Rise processing means for classifying the plurality of segments formed by the segment processing means, into a plurality of categories respectively indicating topics related to the requirements or conditions of the second speaker,
And the duration of the segment, a storage means for storing the speech pattern data indicating a result of classification by the category rise processing means,
Referring to the conversation pattern data of the first speaker stored in the storage means, the conversation pattern analysis for extracting the category included in the conversation of the first speaker, the time required for the category, and the category transition Processing means;
Conversation analyzer with
前記セグメント処理手段は、前記不要語削除処理手段により不要語が削除されたテキストに基づいてセグメント分けを行う、請求項1〜3のいずれかに記載の会話分析装置。 An unnecessary word dictionary in which a deletion target word is registered is held in advance, unnecessary words are identified from the text of the conversation recording data with reference to the unnecessary word dictionary , and further includes unnecessary word deletion processing means for deleting,
The segment processing means, said performing segmentation based on the text of unnecessary words are removed by the unnecessary word deletion section, conversation analysis apparatus according to any one of claims 1-3.
セグメント処理手段が、前記会話記録データのテキストを複数のユニットに分割し、前記ユニットの時間を計測し、前記ユニット同士の類似度に基づいて、前記会話記録データのテキストを所定数のクラスタに分離するクラスタリング処理を行い、同一クラスタに属し、かつ、連続している複数のユニットで一つのセグメントを形成するように、前記会話記録データのテキストを複数のセグメントに分割し、同一セグメントのユニットの時間を足し合わせてセグメントの継続時間を算出するステップと、
カテゴライズ処理手段が、前記セグメント処理手段によって形成された複数のセグメントを、前記第2の話者の要望あるいは状況に関連する話題をそれぞれ示す複数のカテゴリに分類するステップと、
前記セグメントの継続時間と、前記カテゴライズ処理手段による分類の結果と、を示す会話パターンデータを記録するステップと、
会話パターン分析処理手段が、前記記録された複数の第1の話者の会話パターンデータを参照して、前記第1の話者の会話に含まれるカテゴリ、該カテゴリに要した時間、およびカテゴリ遷移を抽出するステップと、
を有する方法。 A conversation analysis method performed by an information processing apparatus including means for storing conversation record data including text describing the contents of a conversation between a first speaker who is a customer-facing operator and a second speaker including the customer There,
Segment processing means divides the text of the conversation recording data into a plurality of units, measures the time of the units, and separates the text of the conversation recording data into a predetermined number of clusters based on the similarity between the units. The conversation recording data text is divided into a plurality of segments so that a plurality of continuous units belonging to the same cluster and a plurality of continuous units form one segment. To calculate the duration of the segment by adding together ,
Category Rise processing means, a step of classifying a plurality of segments formed by the segment processing means, into a plurality of categories respectively indicating topics related to the requirements or conditions of the second speaker,
And recording the duration of the segment, the speech pattern data indicating a result of classification by the category rise processing means,
The conversation pattern analysis processing means refers to the recorded conversation pattern data of the plurality of first speakers, the category included in the conversation of the first speaker, the time required for the category, and the category transition Extracting the
Having a method.
前記情報処理装置に実行されると、
セグメント処理手段が、前記会話記録データのテキストを複数のユニットに分割し、前記ユニットの時間を計測し、前記ユニット同士の類似度に基づいて、前記会話記録データのテキストを所定数のクラスタに分離するクラスタリング処理を行い、同一クラスタに属し、かつ、連続している複数のユニットで一つのセグメントを形成するように、前記会話記録データのテキストを複数のセグメントに分割し、同一セグメントのユニットの時間を足し合わせてセグメントの継続時間を算出するステップと、
カテゴライズ処理手段が、前記セグメント処理手段によって形成された複数のセグメントを、前記第2の話者の要望あるいは状況に関連する話題をそれぞれ示す複数のカテゴリに分類するステップと、
前記セグメントの継続時間と、前記カテゴライズ処理手段による分類の結果と、を示す会話パターンデータを記録するステップと、
会話パターン分析処理手段が、前記記録された複数の第1の話者の会話パターンデータを参照して、前記第1の話者の会話に含まれるカテゴリ、該カテゴリに要した時間、およびカテゴリ遷移を抽出するステップと、が行われるコンピュータプログラム。 In order to perform conversation analysis in an information processing apparatus comprising means for storing conversation record data including text describing the contents of a conversation between a first speaker who is a customer-facing operator and a second speaker including the customer Computer program,
When executed on the information processing apparatus,
Segment processing means divides the text of the conversation recording data into a plurality of units, measures the time of the units, and separates the text of the conversation recording data into a predetermined number of clusters based on the similarity between the units. The conversation recording data text is divided into a plurality of segments so that a plurality of continuous units belonging to the same cluster and a plurality of continuous units form one segment. To calculate the duration of the segment by adding together ,
Category Rise processing means, a step of classifying a plurality of segments formed by the segment processing means, into a plurality of categories respectively indicating topics related to the requirements or conditions of the second speaker,
And recording the duration of the segment, the speech pattern data indicating a result of classification by the category rise processing means,
The conversation pattern analysis processing means refers to the recorded conversation pattern data of the plurality of first speakers, the category included in the conversation of the first speaker, the time required for the category, and the category transition And a step of extracting a computer program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016051032A JP6208794B2 (en) | 2016-03-15 | 2016-03-15 | Conversation analyzer, method and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016051032A JP6208794B2 (en) | 2016-03-15 | 2016-03-15 | Conversation analyzer, method and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017167726A JP2017167726A (en) | 2017-09-21 |
JP6208794B2 true JP6208794B2 (en) | 2017-10-04 |
Family
ID=59913839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016051032A Active JP6208794B2 (en) | 2016-03-15 | 2016-03-15 | Conversation analyzer, method and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6208794B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460435A (en) * | 2018-03-02 | 2018-08-28 | 欧阳军 | A kind of information processing unit, system and method |
JP6567128B1 (en) * | 2018-05-08 | 2019-08-28 | ベクスト株式会社 | Conversation support system and conversation support method |
JP7266225B1 (en) | 2021-10-14 | 2023-04-28 | ベクスト株式会社 | TEXT ANALYSIS APPARATUS, METHOD AND PROGRAM |
JP7272531B2 (en) * | 2021-10-14 | 2023-05-12 | ベクスト株式会社 | TEXT ANALYSIS APPARATUS AND METHOD |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008250664A (en) * | 2007-03-30 | 2008-10-16 | Advanced Telecommunication Research Institute International | System for managing nursing necessity degree |
JP5468474B2 (en) * | 2010-06-21 | 2014-04-09 | 株式会社野村総合研究所 | Talk script usage status calculation system and talk script usage status calculation program |
US9232063B2 (en) * | 2013-10-31 | 2016-01-05 | Verint Systems Inc. | Call flow and discourse analysis |
-
2016
- 2016-03-15 JP JP2016051032A patent/JP6208794B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017167726A (en) | 2017-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112804400B (en) | Customer service call voice quality inspection method and device, electronic equipment and storage medium | |
US10950242B2 (en) | System and method of diarization and labeling of audio data | |
US10642889B2 (en) | Unsupervised automated topic detection, segmentation and labeling of conversations | |
US8676586B2 (en) | Method and apparatus for interaction or discourse analytics | |
US9792905B2 (en) | Apparatus and method for analysis of language model changes | |
US8412530B2 (en) | Method and apparatus for detection of sentiment in automated transcriptions | |
CN111128223B (en) | Text information-based auxiliary speaker separation method and related device | |
CN107305541A (en) | Speech recognition text segmentation method and device | |
US10860566B1 (en) | Themes surfacing for communication data analysis | |
JP6208794B2 (en) | Conversation analyzer, method and computer program | |
CN111639484A (en) | Method for analyzing seat call content | |
JP5385677B2 (en) | Dialog state dividing apparatus and method, program and recording medium | |
CN111785275A (en) | Voice recognition method and device | |
CN113626573B (en) | Sales session objection and response extraction method and system | |
CN112966082A (en) | Audio quality inspection method, device, equipment and storage medium | |
CN111010484A (en) | Automatic quality inspection method for call recording | |
Jia et al. | A deep learning system for sentiment analysis of service calls | |
CN113642334B (en) | Intention recognition method, device, electronic equipment and storage medium | |
CN114120425A (en) | Emotion recognition method and device, electronic equipment and storage medium | |
Chandramouli et al. | Unsupervised paradigm for information extraction from transcripts using BERT | |
JP7425368B2 (en) | Estimation device, estimation method, learning device, learning method and program | |
CN116340511B (en) | Public opinion analysis method combining deep learning and language logic reasoning | |
JP6743108B2 (en) | PATTERN RECOGNITION MODEL AND PATTERN LEARNING DEVICE, GENERATION METHOD THEREOF, FAQ EXTRACTION METHOD USING THE SAME, PATTERN RECOGNITION DEVICE, AND PROGRAM | |
Liu et al. | A fast-training approach using ELM for satisfaction analysis of call centers | |
Ikbal et al. | Intent focused summarization of caller-agent conversations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170907 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6208794 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |