JP2014106551A - トークスクリプト抽出装置、方法、及びプログラム - Google Patents

トークスクリプト抽出装置、方法、及びプログラム Download PDF

Info

Publication number
JP2014106551A
JP2014106551A JP2012256644A JP2012256644A JP2014106551A JP 2014106551 A JP2014106551 A JP 2014106551A JP 2012256644 A JP2012256644 A JP 2012256644A JP 2012256644 A JP2012256644 A JP 2012256644A JP 2014106551 A JP2014106551 A JP 2014106551A
Authority
JP
Japan
Prior art keywords
utterance
symbol
talk script
speech
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012256644A
Other languages
English (en)
Other versions
JP5882183B2 (ja
Inventor
Chiaki Miyazaki
千明 宮崎
Ryuichiro Higashinaka
竜一郎 東中
Toshiaki Makino
俊朗 牧野
Yoshihiro Matsuo
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012256644A priority Critical patent/JP5882183B2/ja
Publication of JP2014106551A publication Critical patent/JP2014106551A/ja
Application granted granted Critical
Publication of JP5882183B2 publication Critical patent/JP5882183B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】対話のテキストデータから所定の目的に応じたトークスクリプトを自動的に抽出する。
【解決手段】発話シンボル変換部22が、成功対話集合及び失敗対話集合の各対話から抽出された各発話について、代表単語候補DB32を参照して、発話内の代表単語を発話シンボルとして選定し、各発話を発話シンボルに変換し、特徴発話シンボル列抽出部23が、各発話が発話シンボルに変換された発話シンボル列を用いて、成功対話集合及び失敗対話集合の各々に特徴的な対話の流れをモデル化し、各発話シンボルがいずれの対話集合に特徴的に出現するかを判定し、特定の対話集合に特徴的に出現すると判定された連続する複数の発話シンボル列を抽出し、トークスクリプト出力部24が、抽出された特定の対話集合に特徴的な発話シンボル列の各発話シンボルに対応する発話により構成される発話系列を、トークスクリプトとして出力する。
【選択図】図1

Description

本発明は、トークスクリプト抽出装置、方法、及びプログラムに関する。
従来、コンタクトセンタ(コールセンタ、お客様センタ等)の運営において、オペレータが話すべき内容を記述したトークスクリプトは、コンタクトセンタの業務内容や取り扱う商品またはサービスに詳しいスタッフが、手作業によって準備していた。
また、コンタクトセンタの運営の効率化を目的とし、トークスクリプトと関連がある技術として、オペレータの応対内容の監視に関わる技術が提案されている。例えば、コンタクトセンタ運営者側が、オペレータの応対内容を監視するために有用な技術として、トークスクリプトとして定められた内容を、オペレータが顧客との対話の中で実際に伝達したことを検出する技術が提案されている(例えば、非特許文献1参照)。
堀 宣男、竹原 一彰、"NRI NEWS 対話要約で実現する「顧客の声」活用"、知的資産創造、18(10)、98−101、2010.
しかしながら、手作業によりトークスクリプトを準備することは、労力や時間を要する。また、例えば、売上や顧客満足度を向上させるために、どのような話し方をすればよいか等の知識は、個々のオペレータが応対経験の中で培っていくものであり、その知識をトークスクリプトに自動的に反映するという技術はこれまでに見られなかった。
また、非特許文献1に記載の技術では、トークスクリプトは事前に準備されていることが前提となっており、トークスクリプトを自動的に抽出することは想定されていない。
本発明は、上記の事情を鑑みてなされたものであり、対話のテキストデータから所定の目的に応じたトークスクリプトを自動的に抽出することができるトークスクリプト抽出装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明のトークスクリプト抽出装置は、複数の話者の各々の発話を含む所定の目的を持った複数の対話であって、前記所定の目的に対する評価が異なる複数の対話の各々を示すテキストデータと、前記所定の目的を持った対話で使用されている頻度及び品詞に応じて予め定めた複数の代表単語候補とに基づいて、前記複数の対話の各々に含まれる各発話を、該発話の各々に含まれる前記代表単語候補と同一の単語から選定した代表単語で表される発話シンボルに変換する発話シンボル変換手段と、各対話に含まれる各発話が前記発話シンボル変換手段により発話シンボルに変換された発話シンボル列と、該発話シンボル列に対応する対話の前記評価との対応付けにより、前記評価毎の対話の特徴をモデル化し、該モデルに基づいて、各発話シンボルがいずれの評価の対話に特徴的に出現するかを判定し、特定の評価と判定された連続する複数の発話シンボル列を抽出する特徴発話シンボル列抽出手段と、前記特徴発話シンボル列抽出手段により抽出された発話シンボル列の各発話シンボルに対応する発話により構成される発話系列を、前記所定の目的を持った対話における前記特定の評価のトークスクリプトとして出力するトークスクリプト出力手段と、を含んで構成されている。
本発明のトークスクリプト抽出装置によれば、入力として、複数の話者の各々の発話を含む所定の目的を持った複数の対話であって、所定の目的に対する評価が異なる複数の対話の各々を示すテキストデータを用いる。また、所定の目的を持った対話で使用されている頻度及び品詞に応じて予め定めた複数の代表単語候補を用意しておく。そして、発話シンボル変換手段が、複数の対話の各々に含まれる各発話を、発話の各々に含まれる代表単語候補と同一の単語から選定した代表単語で表される発話シンボルに変換する。
そして、特徴発話シンボル列抽出手段が、各対話に含まれる各発話が発話シンボル変換手段により発話シンボルに変換された発話シンボル列と、発話シンボル列に対応する対話の評価との対応付けにより、評価毎の対話の特徴をモデル化する。また、特徴発話シンボル列抽出手段が、モデルに基づいて、各発話シンボルがいずれの評価の対話に特徴的に出現するかを判定し、特定の評価と判定された連続する複数の発話シンボル列を抽出する。
さらに、トークスクリプト出力手段が、特徴発話シンボル列抽出手段により抽出された発話シンボル列の各発話シンボルに対応する発話により構成される発話系列を、所定の目的を持った対話における特定の評価のトークスクリプトとして出力する。
このように、所定の目的を持った複数の対話であって、所定の目的に対する評価が異なる複数の対話を用いて、各対話の各発話を代表単語で表される発話シンボルに変換して、各評価の対話の特徴をモデル化し、このモデルに基づいて、特定の評価に対応した発話系列をトークスクリプトとして出力することで、対話のテキストデータから所定の目的に応じたトークスクリプトを自動的に抽出することができる。
また、前記トークスクリプト出力手段は、前記特徴発話シンボル列抽出手段により抽出された各発話シンボルに応じた重みに基づく重要度が高い順に、前記発話系列を出力することができる。これにより、出力されたトークスクリプトがより利用し易いものとなる。
また、本発明のトークスクリプト抽出方法は、発話シンボル変換手段と、特徴発話シンボル列抽出手段と、トークスクリプト出力手段とを含むトークスクリプト抽出装置におけるトークスクリプト抽出方法であって、前記発話シンボル変換手段が、複数の話者の各々の発話を含む所定の目的を持った複数の対話であって、前記所定の目的に対する評価が異なる複数の対話の各々を示すテキストデータと、前記所定の目的を持った対話で使用されている頻度及び品詞に応じて予め定めた複数の代表単語候補とに基づいて、前記複数の対話の各々に含まれる各発話を、該発話の各々に含まれる前記代表単語候補と同一の単語から選定した代表単語で表される発話シンボルに変換し、前記特徴発話シンボル列抽出手段が、各対話に含まれる各発話が前記発話シンボル変換手段により発話シンボルに変換された発話シンボル列と、該発話シンボル列に対応する対話の前記評価との対応付けにより、前記評価毎の対話の特徴をモデル化し、該モデルに基づいて、各発話シンボルがいずれの評価の対話に特徴的に出現するかを判定し、特定の評価と判定された連続する複数の発話シンボル列を抽出し、前記トークスクリプト出力手段が、前記特徴発話シンボル列抽出手段により抽出された発話シンボル列の各発話シンボルに対応する発話により構成される発話系列を、前記所定の目的を持った対話における前記特定の評価のトークスクリプトとして出力する方法である。
また、本発明のトークスクリプト抽出方法において、前記トークスクリプト出力手段が、前記特徴発話シンボル列抽出手段により抽出された各発話シンボルに応じた重みに基づく重要度が高い順に、前記発話系列を出力することができる。
また、本発明のトークスクリプト抽出プログラムは、コンピュータを、上記のトークスクリプト抽出装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明のトークスクリプト抽出装置、方法、及びプログラムによれば、所定の目的を持った複数の対話であって、所定の目的に対する評価が異なる複数の対話を用いて、各対話の各発話を代表単語で表される発話シンボルに変換して、各評価の対話の特徴をモデル化し、このモデルに基づいて、特定の評価に対応した発話系列をトークスクリプトとして出力することで、対話のテキストデータから所定の目的に応じたトークスクリプトを自動的に抽出することができる、という効果が得られる。
本実施の形態に係るトークスクリプト抽出装置の機能的な構成例を示すブロック図である。 発話列の一例を示すイメージ図である。 代表単語候補DBの一例を示すイメージ図である。 発話の発話シンボルへの変換の一例を示すイメージ図である。 特徴的な発話シンボル列の一例を示すイメージ図である。 トークスクリプトとして出力される発話系列の一例を示すイメージ図である。 トークスクリプトとして出力される発話系列の他の例を示すイメージ図である。 本実施の形態におけるトークスクリプト抽出処理を示すフローチャートである。
以下、図面を参照して、本発明の実施の形態を詳細に説明する。なお、本実施の形態では、商品またはサービスの販売に関するコンタクトセンタにおけるオペレータとユーザとの対話(例えば、通話)の音声認識結果を入力とし、商品またはサービスの販売勧奨に有効なトークスクリプトを抽出するトークスクリプト抽出装置に本発明を適用した場合を例に説明する。
本実施の形態に係るトークスクリプト抽出装置10は、CPUと、RAMと、後述するトークスクリプト抽出処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成される。このコンピュータは、機能的には、図1に示すように、トークスクリプト抽出部20と代表単語候補生成部30とを含んだ構成で表すことができる。さらに、トークスクリプト抽出部20は、発話列抽出部21と、発話シンボル変換部22と、特徴発話シンボル列抽出部23と、トークスクリプト出力部24とを含んだ構成で表すことができる。また、代表単語候補生成部30は、発話列抽出部21と、代表単語候補抽出部31とを含んだ構成で表すことができる。なお、発話列抽出部21は、トークスクリプト抽出部20及び代表単語候補生成部30の両方に共通の機能部である。以下、各部について詳述する。
発話列抽出部21は、複数の対話の音声認識結果(テキストファイル)からなる対話集合を入力として受け付け、各対話の音声認識結果から発話に該当する部分(テキストデータ)のみを抽出し、連続する複数の発話を発話列として出力する。音声認識結果には、発話を示すテキストデータ以外にも、時間情報や認識精度の情報など多様な情報が含まれているため、後段の処理で必要な情報のみを抽出するものである。
また、発話列抽出部21は、ポーズ(無音区間)の長さを利用するなどして、発話区切りの単位を調整してもよい。音声認識結果の発話区切りのままでは一発話が長過ぎる場合には、後述する発話シンボル変換部22において、一発話の意味内容を一シンボルで表すことが困難になるためである。また、発話列抽出部21は、音声認識結果から各発話の話者を示す情報が得られる場合は、この話者の情報を利用して話者毎に発話を区別してもよい。
発話列抽出部21により抽出された発話列の一例を図2に示す。図2の例では、抽出した発話列には、各発話列に含まれる各発話に順番に付与した発話番号、各発話の話者を示す情報、及び各発話の内容が含まれる。
ここで、発話列抽出部21がトークスクリプト抽出部20の機能部として機能する場合には、発話列抽出部21は、入力として成功対話集合及び失敗対話集合を受け付ける。成功対話集合は、商品またはサービスの販売勧奨に成功した際の対話の集合であり、失敗対話集合は、商品またはサービスの販売勧奨に失敗した際の対話の集合である。なお、本実施の形態では、成功対話集合及び失敗対話集合という2つの対話集合を用いる場合について説明するが、これに限定されない。対象とする2つの対話集合は、成功と失敗とに限らず、所望の目的に応じて抽出するトークスクリプトとして望ましい対話集合と望ましくない対話集合であればよく、どのようなものを利用してもよい。また、対象とする対話集合の数も2つに限定されず、目的に応じて3つ以上の対話集合を用いてもよい。すなわち、所定の目的を持った対話集合であって、その目的に対する評価(レベル)が異なる対話集合を用いればよい。
一方、発話列抽出部21が代表単語候補生成部30の機能部として機能する場合には、発話列抽出部21は、入力として通常対話集合を受け付ける。通常対話集合は、成功対話集合と失敗対話集合との両方を包含する上位の対話集合を利用することができる。ただし、通常対話集合としては、トークスクリプト抽出の対象とする成功対話集合及び失敗対話集合を必ずしも包含する必要はない。後述する代表単語候補抽出部31で通常対話集合から抽出される代表単語候補は、後述する発話シンボル変換部22において、各発話をその発話に出現する代表単語一語で置き換えて表現するために利用されるものである。従って、対象の対話集合(成功対話通話及び失敗対話集合)と出現単語の傾向(単語とその出現頻度)が類似した対話集合であれば、どのような対話集合を利用してもよい。例えば、コンタクトセンタAの販売勧奨の対話集合からトークスクリプトを抽出する際に、コンタクトセンタBの販売勧奨の対話集合を通常対話集合として使用してもよい。いずれの対話集合も「販売勧奨」という目的が共通しているため、出現単語の傾向が類似すると考えられる。
代表単語候補抽出部31は、発話列抽出部21により通常対話集合から抽出された発話列を受け取り、受け取った各発話列を形態素解析することにより、各発話列を単語に分割すると共に、分割された各単語にその単語の品詞を示す情報を付与する。代表単語候補抽出部31は、受け取った複数の発話列に出現した単語の中から、各単語の品詞や通常対話集合内における出現頻度などの情報を利用して代表単語候補を抽出する。
例えば、予め定めた品詞(例えば、名詞と独立詞)の単語を代表単語候補として抽出することができる。また、対話内での出現頻度が高過ぎても低過ぎても、代表単語としての意味をなさないため、出現頻度の上限値及び下限値を定め、その上限値と下限値との範囲内となる出現頻度の単語を代表単語候補として抽出することができる。代表単語候補を抽出する際の単語の品詞や出現頻度の上限値及び下限値は、通常対話集合の性質に合わせて調整してもよい。
代表単語候補抽出部31は、抽出した代表単語候補を代表単語候補データベース(DB)32に登録する。図3に、代表単語候補DB32のイメージの一例を示す。図3の例では、代表単語候補DB32内の代表単語候補のうち、出現頻度が上位10件の単語を表示している。
発話シンボル変換部22は、発話列抽出部21により成功対話集合及び失敗対話集合の各々から抽出された発話列を受け取り、各発話列に含まれる各発話について、その発話内に出現した代表単語を発話シンボルとして選定し、各発話を選定した発話シンボルに変換する。より具体的には、発話シンボル変換部22は、代表単語候補DB32を参照して、発話に含まれる代表単語候補を検出する。発話に含まれる代表単語候補が1つの場合には、検出された代表単語候補を代表単語として選定する。また、発話に代表単語候補が複数含まれる場合には、代表単語候補DB32に定められた出現頻度が最も低い代表単語候補等、検出された複数の代表単語候補の中から1つの代表単語を選定する。このようにして選定した代表単語を発話シンボルとし、各発話を発話シンボルに変換する。発話に1つも代表単語候補が含まれていない場合には、その発話を「その他」という発話シンボルに変換する。
図4に、発話の発話シンボルへの変換の一例を示す。図4では、発話内容のうち、斜体で示されている単語が代表単語候補である。発話番号1の発話(以下、「発話1」のように表記する)には、「解約」の1つしか代表単語候補が含まれていないため、発話1は発話シンボル「解約」に変換される。発話2には、「お客様」及び「お名前」という2つの代表単語候補が含まれており、このうち代表単語候補DB32に定められた出現頻度が低い「お客様」の方が代表単語、すなわち発話シンボルとして選定される。従って、発話2は発話シンボル「お客様」に変換される。発話3は、1つも代表単語候補が含まれていないため、発話シンボル「その他」に変換される。
特徴発話シンボル列抽出部23は、発話シンボル変換部22により抽出された成功対話集合の発話シンボル列及び失敗対話集合の発話シンボル列を受け取り、成功対話集合及び失敗対話集合のそれぞれに特徴的な対話の流れ(特徴)をモデル化し、特定の対話集合に特徴的な発話シンボル列を抽出する。
例えば、各対話集合に特徴的な対話の流れをモデル化する手法としては、CSHMM(Class Speaker HMM)と呼ばれる技術(特開2012−37797号公報参照)を利用することができる。CSHMMとは、複数ドメインのデータを入力とし、話者交代を考慮して、各ドメインに特徴的な対話の流れ、及びいずれのドメインにも共通して出現する対話の流れをモデル化する技術である。また、特定の対話集合に特徴的な発話シンボル列の抽出には、CSHMMにより得られたモデルに基づいて、ビタビアルゴリズムを利用することができる。
なお、特定の対話集合に特徴的な発話シンボル列を抽出する手法としては、CSHMM及びビタビアルゴリズムに限定されず、発話シンボル列(発話シンボルN−gram)の各ドメインにおける偏り具合を、カイ二乗検定などを用いて判定するなど、複数ドメインのデータから特定ドメインに特徴的な発話シンボル列を抽出できる手法であれば、どのような手法を利用してもよい。また、CSHMMのように、各ドメインに特徴的な対話の流れに加え、いずれのドメインにも共通して出現する対話の流れをモデル化する手法である必要はなく、少なくとも各ドメインに特徴的な対話の流れをモデル化する手法であればよい。
図5に各対話集合に特徴的な発話シンボル列のイメージの一例を示す。特徴発話シンボル列抽出部23は、図5の「特徴的な発話」の列に示すように、入力された2つの対話集合に含まれる各対話の各発話を示す各発話シンボルが成功対話集合と失敗対話集合とのどちらに特徴的な発話であるか、またはどちらにも共通して出現する発話であるかを判定する。そして、特徴発話シンボル列抽出部23は、特定の対話集合である成功対話集合に特徴的であると判定された連続する複数の発話シンボルを、成功対話集合に特徴的な発話シンボル列として抽出する。図5の例では、「基本−料金−お得」が、成功対話集合に特徴的な発話シンボル列として抽出される。同様に、特定の対話集合を失敗対話集合とした場合には、失敗対話集合に特徴的であると判定された連続する複数の発話シンボルを、失敗対話集合に特徴的な発話シンボル列として抽出することもできる。
なお、特徴発話シンボル列抽出部23では、発話列抽出部21で抽出された発話列が話者の情報を含む場合には、この話者の情報を利用することで、同じ「はい」という発話シンボルであっても、オペレータの「はい」とユーザの「はい」とは別の発話シンボルであるとみなして処理を行うことができる。
トークスクリプト出力部24は、特徴発話シンボル列抽出部23により抽出された特徴的な発話シンボル列の各発話シンボルに対応する発話により構成される発話系列を、トークスクリプトとして出力する。出力されたトークスクリプトは、表示装置に表示したり、印刷装置によりプリントアウトしたりすることができる。トークスクリプト出力部24は、特徴発話シンボル列抽出部23で抽出された成功対話集合に特徴的な発話シンボル列の各発話シンボルに対応する発話により構成される発話系列(成功対話集合に特徴的な発話系列)を、優良トークスクリプトとして出力することもできるし、失敗対話集合に特徴的な特徴発話シンボル列の各発話シンボルに対応する発話により構成される発話系列(失敗対話集合に特徴的な発話系列)を、失敗トークスクリプトとして出力することもできる。
また、トークスクリプト出力部24は、出力するトークスクリプトの見易さ、目的、使用した対話集合の性質等に応じて、トークスクリプトとして出力される各発話系列の発話系列長を設定することができる。発話系列長とは、1つの発話系列に含まれる発話の数である。例えば、最小値を3発話、最大値を15発話のように発話系列長を設定することができる。図6に、トークスクリプトとして出力される発話系列の一例を示す。図6の例では、トークスクリプトとして出力される各発話系列の発話系列番号、その発話系列に含まれる各発話の発話番号、話者、発話シンボル、及び発話内容を出力する例を示している。
図6に示すように、抽出された発話系列を抽出された順番で、抽出された数だけ出力してもよいが、出力された発話系列の数が多過ぎる場合、全てを目視して分析等を行うのは手間がかかるという問題が起こりうる。この問題を解決するために、各発話系列の重要度を計算し、重要度に基づいてトークスクリプトとして出力される発話系列の順番をソートしたり、ある一定の重要度以上の発話系列のみをトークスクリプトとして出力したりすることができる。
例えば、発話系列dの重要度のスコアを下記(1)式に示すように算出する。ここで、uは発話系列dに含まれる各発話シンボルを指し、weight(u)は各発話シンボルに付与する重みを指す。
Figure 2014106551
構成する発話数が多い発話系列の重要度が高くなり過ぎるのを防ぐために、単純に、ある一定数以上の発話で構成される発話系列はトークスクリプトとして出力しないようにしてもよい(最大発話系列長の調整)。また、下記(2)式に示すように、(1)式の発話系列の重要度を発話数で割ったもの(平均値)を、発話系列の重要度として利用してもよい。ここで、|d|は各発話系列dを構成する発話数を指す。
Figure 2014106551
各発話シンボルの重みについては、手作業による設定など、どのような方法で設定してもよい。例えば、出力される成功対話集合に特徴的な発話系列の集合内における、各発話シンボルの出現回数を重みとして利用することができる。このとき、図6の発話シンボル「その他」のように、発話系列集合内に頻出し過ぎる発話シンボルの重みはゼロとしてもよい。
図6を例に、発話系列(001)の重要度の算出方法を説明する。ここでは、上記(2)式の重要度(平均値利用)を用いるものとする。各発話シンボル(基本、料金、お得)の発話系列集合内での出現回数は、順に1回、1回、4回であるため、各発話シンボルuの重みweight(u)は、順に1、1、4となる。その重みに、各発話シンボルの発話系列(001)内での出現回数を掛け、発話系列(001)を構成する発話数3で割ると、発話系列(001)の重要度は、Score(001)=((1×1)+(1×1)+(4×1))/3=2となる。
図7に、図6の全発話系列に対して、上記の発話系列(001)と同様の方法で重要度を算出し、発話系列を重要度の降順でソートした場合のトークスクリプトの抽出結果の一例を示す。なお、図7の例では、発話シンボル「その他」の重みはゼロとした。
次に、本実施の形態に係るトークスクリプト抽出装置10の作用について説明する。トークスクリプト抽出装置10に通常対話集合が入力されると、代表単語候補生成部30において代表単語候補DB32が生成される。代表単語候補DB32が生成された状態で、トークスクリプト抽出装置10に成功対話集合及び失敗対話集合が入力されると、トークスクリプト抽出装置10において、図8に示すトークスクリプト抽出処理ルーチンが実行される。ここでは、成功対話集合に特徴的な発話系列を優良トークスクリプトとして抽出する場合を例に説明する。
ステップ100で、発話列抽出部21が、成功対話集合及び失敗対話集合に含まれる各対話の音声認識結果から発話列を抽出する。
次に、ステップ102で、発話シンボル変換部22が、上記ステップ100で抽出された各発話列に含まれる各発話について、代表単語候補DB32を参照して、その発話内に出現した代表単語を発話シンボルとして選定し、各発話を選定した発話シンボルに変換する。
次に、ステップ104で、特徴発話シンボル列抽出部23が、上記ステップ102で各発話が発話シンボルに変換された成功対話集合の発話シンボル列及び失敗対話集合の発話シンボル列を受け取り、成功対話集合及び失敗対話集合のそれぞれに特徴的な対話の流れ(特徴)をモデル化する。そして、そのモデルに基づいて、入力された2つの対話集合に含まれる各対話の各発話を示す各発話シンボルがいずれの対話集合に特徴的に出現するか、またはどちらにも共通して出現するかを判定し、成功対話集合に特徴的に出現すると判定された連続する複数の発話シンボル列を抽出する。
次に、ステップ106で、トークスクリプト出力部24が、上記ステップ104で抽出された成功対話集合に特徴的な発話シンボル列の各発話シンボルに対応する発話により構成される発話系列を、トークスクリプトとして出力し、トークスクリプト抽出処理ルーチンを終了する。
以上説明したように、本実施の形態に係るトークスクリプト抽出装置によれば、所定の目的の対話集合として、目的に対する評価が異なる2つの対話集合(望ましい対話集合(成功対話集合)と望ましくない対話集合(失敗対話集合))とを用意し、特定の評価の対話集合に特徴的な発話系列を抽出することで、対話のテキストデータから所定の目的に応じたトークスクリプトを自動的に抽出することができる。
これにより、これまでは人間が手作業で用意するしかなかった、コンタクトセンタのオペレータの応対マニュアル等に記載するトークスクリプト作成の手間を削減することができる。また、これまでは個々のオペレータが経験の中で培った、属人的なノウハウでしかなかった優良トークを自動的に抽出することで、既存のトークスクリプトの拡充や改善のヒントを効率的に収集することができる。
さらに、抽出された特定の評価の対話集合に特徴的な発話系列の重要度に基づいて、発話系列をソートしたり、出力する発話系列数を制限したりすることにより、出力されるトークスクリプトをより利用し易くすることができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記実施の形態では、成功対話集合及び失敗対話集合という2つの対話集合を用いる場合について説明したが、これに限定されない。対象とする2つの対話集合は、成功と失敗とに限らず、所定の目的を持った対話集合であって、その目的に対して望ましい対話集合と望ましくない対話集合のように、目的に対する評価が異なる対話集合であればよく、どのようなものを利用してもよい。
例えば、望ましい対話集合として、販売勧奨の成功率が高いオペレータAさんの対話集合を用い、望ましくない対話集合として、販売勧奨の成功率が低いオペレータBさんの対話集合を用いることで、優良オペレータに特徴的なトークスクリプトまたは成功率が低いオペレータに特徴的なトークスクリプトを抽出することができる。このように抽出されたトークスクリプトを利用することにより、優良オペレータと成功率が低いオペレータとを比較することが容易となる。また、望ましい対話集合として、優良オペレータAさんの成功対話集合を用い、望ましくない対話集合として、オペレータBさんの成功対話集合及びオペレータCさんの成功対話集合を用い、優良オペレータAさんに特徴的なトークスクリプトを抽出することで、その他のオペレータとは違う優良オペレータAさん独自の成功に結び付く優良トークを抽出することもできる。
また、上記各施の形態では、対象とする対話集合を2つ用いる場合、すなわち目的に対する評価が2段階の場合について説明したが、目的に応じて3つ以上の対話集合を用いてもよい。例えば、望ましい対話と望ましくない対話との間を、評価(例えば、A、B、C、D、Eの5段階)に応じて複数に分割し、各評価に応じた複数の対話集合を用いることができる。この場合、評価Aのトークスクリプト、評価Bのトークスクリプト、・・・のように、各評価のトークスクリプトを抽出することができる。
また、上記実施の形態では、所定の目的の対話を、商品またはサービスの販売勧奨に関するオペレータとユーザとの対話とする場合について説明したが、これに限定されない。例えば、所定の目的を一般的なユーザ対応とした場合、対話中にクレームが発生した対話集合とクレームが発生していない対話集合を用いることができる。このように、抽出したいトークスクリプトの目的に応じた対話集合を用いて、各対話集合に特徴的な発話系列を抽出することにより、商品またはサービスの販売勧奨成功に特徴的なオペレータの優良トークや、クレーム発生に特徴的な失敗トークなどのトークスクリプトを自動で収集することができる。
また、対話は、システム対人間による対話でも、人間対人間による対話でもよく、複数の話者による発話のやりとりであればよい。また、対話のテキストデータは、上記実施の形態のように対話の音声認識結果に限定されず、対話を書き起こしたものでもよいし、対話自体がテキストチャットの場合にはそのログを用いてもよく、文字化(テキスト化)された対話であればよい。
また、上記実施の形態では、トークスクリプト抽出部と代表単語候補生成部とが同一のコンピュータで構成される場合について説明したが、別々のコンピュータで構成するようにしてもよい。この場合、代表単語生成部を構成するコンピュータにより生成された代表単語候補DBを、トークスクリプト抽出部を構成するコンピュータで読み込んで、上記のトークスクリプト抽出処理を実行するようにするとよい。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 トークスクリプト抽出装置
20 トークスクリプト抽出部
21 発話列抽出部
22 発話シンボル変換部
23 特徴発話シンボル列抽出部
24 トークスクリプト出力部
30 代表単語候補生成部
31 代表単語候補抽出部
32 代表単語候補DB

Claims (5)

  1. 複数の話者の各々の発話を含む所定の目的を持った複数の対話であって、前記所定の目的に対する評価が異なる複数の対話の各々を示すテキストデータと、前記所定の目的を持った対話で使用されている頻度及び品詞に応じて予め定めた複数の代表単語候補とに基づいて、前記複数の対話の各々に含まれる各発話を、該発話の各々に含まれる前記代表単語候補と同一の単語から選定した代表単語で表される発話シンボルに変換する発話シンボル変換手段と、
    各対話に含まれる各発話が前記発話シンボル変換手段により発話シンボルに変換された発話シンボル列と、該発話シンボル列に対応する対話の前記評価との対応付けにより、前記評価毎の対話の特徴をモデル化し、該モデルに基づいて、各発話シンボルがいずれの評価の対話に特徴的に出現するかを判定し、特定の評価と判定された連続する複数の発話シンボル列を抽出する特徴発話シンボル列抽出手段と、
    前記特徴発話シンボル列抽出手段により抽出された発話シンボル列の各発話シンボルに対応する発話により構成される発話系列を、前記所定の目的を持った対話における前記特定の評価のトークスクリプトとして出力するトークスクリプト出力手段と、
    を含むトークスクリプト抽出装置。
  2. 前記トークスクリプト出力手段は、前記特徴発話シンボル列抽出手段により抽出された各発話シンボルに応じた重みに基づく重要度が高い順に、前記発話系列を出力する請求項1記載のトークスクリプト抽出装置。
  3. 発話シンボル変換手段と、特徴発話シンボル列抽出手段と、トークスクリプト出力手段とを含むトークスクリプト抽出装置におけるトークスクリプト抽出方法であって、
    前記発話シンボル変換手段が、複数の話者の各々の発話を含む所定の目的を持った複数の対話であって、前記所定の目的に対する評価が異なる複数の対話の各々を示すテキストデータと、前記所定の目的を持った対話で使用されている頻度及び品詞に応じて予め定めた複数の代表単語候補とに基づいて、前記複数の対話の各々に含まれる各発話を、該発話の各々に含まれる前記代表単語候補と同一の単語から選定した代表単語で表される発話シンボルに変換し、
    前記特徴発話シンボル列抽出手段が、各対話に含まれる各発話が前記発話シンボル変換手段により発話シンボルに変換された発話シンボル列と、該発話シンボル列に対応する対話の前記評価との対応付けにより、前記評価毎の対話の特徴をモデル化し、該モデルに基づいて、各発話シンボルがいずれの評価の対話に特徴的に出現するかを判定し、特定の評価と判定された連続する複数の発話シンボル列を抽出し、
    前記トークスクリプト出力手段が、前記特徴発話シンボル列抽出手段により抽出された発話シンボル列の各発話シンボルに対応する発話により構成される発話系列を、前記所定の目的を持った対話における前記特定の評価のトークスクリプトとして出力する
    トークスクリプト抽出方法。
  4. 前記トークスクリプト出力手段が、前記特徴発話シンボル列抽出手段により抽出された各発話シンボルに応じた重みに基づく重要度が高い順に、前記発話系列を出力する請求項3記載のトークスクリプト抽出方法。
  5. コンピュータを、請求項1または請求項2記載のトークスクリプト抽出装置を構成する各手段として機能させるためのトークスクリプト抽出プログラム。
JP2012256644A 2012-11-22 2012-11-22 トークスクリプト抽出装置、方法、及びプログラム Expired - Fee Related JP5882183B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012256644A JP5882183B2 (ja) 2012-11-22 2012-11-22 トークスクリプト抽出装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012256644A JP5882183B2 (ja) 2012-11-22 2012-11-22 トークスクリプト抽出装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014106551A true JP2014106551A (ja) 2014-06-09
JP5882183B2 JP5882183B2 (ja) 2016-03-09

Family

ID=51028025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012256644A Expired - Fee Related JP5882183B2 (ja) 2012-11-22 2012-11-22 トークスクリプト抽出装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5882183B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5933863B1 (ja) * 2015-05-22 2016-06-15 株式会社Ubic データ分析システム、制御方法、制御プログラム、および記録媒体
JP2018045639A (ja) * 2016-09-16 2018-03-22 株式会社東芝 対話ログ分析装置、対話ログ分析方法およびプログラム
JP2021149200A (ja) * 2020-03-16 2021-09-27 Kddi株式会社 応対評価装置、応対評価方法及びコンピュータプログラム
WO2023100378A1 (ja) * 2021-12-03 2023-06-08 日本電信電話株式会社 発話区間抽出装置、発話区間抽出方法、及び発話区間抽出プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008009552A (ja) * 2006-06-27 2008-01-17 Nippon Telegr & Teleph Corp <Ntt> インデクス生成装置、インデクス生成方法およびインデクス生成プログラム
JP2008286921A (ja) * 2007-05-16 2008-11-27 Nippon Telegr & Teleph Corp <Ntt> キーワード抽出装置、キーワード抽出方法及びそのプログラム、記録媒体
US20100088323A1 (en) * 2008-10-06 2010-04-08 Nice Systems Ltd. Method and apparatus for visualization of interaction categorization
JP2011081108A (ja) * 2009-10-06 2011-04-21 Toshiba Corp プラント運用訓練システム
JP2012037797A (ja) * 2010-08-10 2012-02-23 Nippon Telegr & Teleph Corp <Ntt> 対話学習装置、要約装置、対話学習方法、要約方法、プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008009552A (ja) * 2006-06-27 2008-01-17 Nippon Telegr & Teleph Corp <Ntt> インデクス生成装置、インデクス生成方法およびインデクス生成プログラム
JP2008286921A (ja) * 2007-05-16 2008-11-27 Nippon Telegr & Teleph Corp <Ntt> キーワード抽出装置、キーワード抽出方法及びそのプログラム、記録媒体
US20100088323A1 (en) * 2008-10-06 2010-04-08 Nice Systems Ltd. Method and apparatus for visualization of interaction categorization
JP2011081108A (ja) * 2009-10-06 2011-04-21 Toshiba Corp プラント運用訓練システム
JP2012037797A (ja) * 2010-08-10 2012-02-23 Nippon Telegr & Teleph Corp <Ntt> 対話学習装置、要約装置、対話学習方法、要約方法、プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6015039966; 東中竜一郎: '共通状態と連結学習を用いたHMMによるコールセンタ対話の要約' 言語処理学会第17回年次大会発表論文集 第17回, 20110331, P.920-923, 言語処理学会 *
JPN6015039968; 遠山義洋: '話題構造の抽出と変形による対話録の自動要約' 200年度 人工知能学会全国大会(第14回)論文集 2000年度, 20000703, P.157-160, 社団法人人口知能学会 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5933863B1 (ja) * 2015-05-22 2016-06-15 株式会社Ubic データ分析システム、制御方法、制御プログラム、および記録媒体
WO2016189606A1 (ja) * 2015-05-22 2016-12-01 株式会社Ubic データ分析システム、制御方法、制御プログラム、および記録媒体
JP2018045639A (ja) * 2016-09-16 2018-03-22 株式会社東芝 対話ログ分析装置、対話ログ分析方法およびプログラム
JP2021149200A (ja) * 2020-03-16 2021-09-27 Kddi株式会社 応対評価装置、応対評価方法及びコンピュータプログラム
JP7209663B2 (ja) 2020-03-16 2023-01-20 Kddi株式会社 応対評価装置、応対評価方法及びコンピュータプログラム
WO2023100378A1 (ja) * 2021-12-03 2023-06-08 日本電信電話株式会社 発話区間抽出装置、発話区間抽出方法、及び発話区間抽出プログラム

Also Published As

Publication number Publication date
JP5882183B2 (ja) 2016-03-09

Similar Documents

Publication Publication Date Title
US10616414B2 (en) Classification of transcripts by sentiment
KR102151681B1 (ko) 언어 모델용 대화 상태들 결정
CN108737667B (zh) 语音质检方法、装置、计算机设备及存储介质
US8401847B2 (en) Speech recognition system and program therefor
US9742912B2 (en) Method and apparatus for predicting intent in IVR using natural language queries
US20190080687A1 (en) Learning-type interactive device
CN111739559B (zh) 一种话语预警方法、装置、设备及存储介质
CN107305541A (zh) 语音识别文本分段方法及装置
CN106484131B (zh) 一种输入纠错方法和输入法装置
JP2009175336A (ja) コールセンターのデータベースシステム、その情報管理方法及び情報管理プログラム
JP5506738B2 (ja) 怒り感情推定装置、怒り感情推定方法およびそのプログラム
JP5882183B2 (ja) トークスクリプト抽出装置、方法、及びプログラム
JP6576968B2 (ja) 話し終わり判定装置、話し終わり判定方法およびプログラム
JP4587854B2 (ja) 感情解析装置、感情解析プログラム、プログラム格納媒体
JP2009175943A (ja) コールセンターのデータベースシステム、データベースの情報管理方法及びデータベースの情報管理プログラム
US20160005421A1 (en) Language analysis based on word-selection, and language analysis apparatus
JP6233867B2 (ja) 音声認識用辞書登録システム、音声認識システム、音声認識サービスシステム、方法およびプログラム
CN116564286A (zh) 语音录入方法、装置、存储介质及电子设备
KR20180121120A (ko) 음성, 텍스트, 시각적 인터페이스를 결합하여 모바일 기기로 물건을 구매할 수 있는 머신러닝 기반 음성 주문 시스템
JP6594577B1 (ja) 評価システム、評価方法、及びコンピュータプログラム。
JP5596869B2 (ja) 音声認識装置
JP6615803B2 (ja) 用件判定装置、用件判定方法およびプログラム
JP6078402B2 (ja) 音声認識性能推定装置とその方法とプログラム
JP6179509B2 (ja) 言語モデル生成装置、音声認識装置、言語モデル生成方法およびプログラム記憶媒体
JP2017199283A (ja) 情報抽出装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160203

R150 Certificate of patent or registration of utility model

Ref document number: 5882183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees