JPWO2014069120A1 - 分析対象決定装置及び分析対象決定方法 - Google Patents

分析対象決定装置及び分析対象決定方法 Download PDF

Info

Publication number
JPWO2014069120A1
JPWO2014069120A1 JP2014544378A JP2014544378A JPWO2014069120A1 JP WO2014069120 A1 JPWO2014069120 A1 JP WO2014069120A1 JP 2014544378 A JP2014544378 A JP 2014544378A JP 2014544378 A JP2014544378 A JP 2014544378A JP WO2014069120 A1 JPWO2014069120 A1 JP WO2014069120A1
Authority
JP
Japan
Prior art keywords
specific
section
conversation
utterance
specific utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014544378A
Other languages
English (en)
Other versions
JP6358093B2 (ja
Inventor
岡部 浩司
浩司 岡部
祥史 大西
祥史 大西
真 寺尾
真 寺尾
真宏 谷
真宏 谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2014069120A1 publication Critical patent/JPWO2014069120A1/ja
Application granted granted Critical
Publication of JP6358093B2 publication Critical patent/JP6358093B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • G10L15/05Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Telephonic Communication Services (AREA)

Abstract

分析対象決定装置は、会話の音声に対応するデータから、当該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出する検出部と、検出部により検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、を有する。

Description

本発明は、会話の分析技術に関する。
会話を分析する技術の一例として、通話データを分析する技術がある。例えば、コールセンタ、コンタクトセンタなどと呼ばれる部署で行われる通話のデータが分析される。以降、このような、商品やサービスに関する問い合わせや苦情や注文といった顧客からの電話に応対する業務を専門的に行う部署をコンタクトセンタと表記する。
コンタクトセンタに寄せられる顧客の声には、顧客ニーズや満足度などが反映されている場合が多く、顧客との通話からそのような顧客の感情やニーズを抽出することは、リピータ顧客を増加させるために企業にとって大変重要である。このように通話者の感情等を抽出することが望まれる対象通話は、コンタクトセンタにおける通話だけに留まらない。
下記特許文献1には、通話の音声から店員発話区間を特定し、店員発話区間ごとに感情認識を行うことで、店員発話区間ごとに従業員満足度を算出し、算出された従業員満足度に基づいて総合的な満足度を算出する手法が提案されている。下記特許文献2には、接客の録音データに対する音声認識により、店員の話し掛け区間から音声キーワードを抽出し、この音声キーワードに関連付けられた収集タイミングに基づいて、顧客の話し掛け区間を特定し、この特定された顧客の話し掛け区間の音声データを対象に感情認識を行う手法が提案されている。
特開2011−237957号公報 特開2011−210100号公報
しかしながら、上述のような各提案手法では、店員発話区間や店員の話し掛け区間と所定の時間関係にある顧客の話し掛け区間が特定されるが、会話(通話)内ではこれら区間は多数存在する可能性が高い。例えば、顧客の怒りの感情のみに制限したとしても、顧客が不満を感じた会話において、その顧客の怒りを表す発話区間は、多数存在することが多い。
従って、上述のような各提案手法では、或る会話における、会話に参加する者(以降、会話参加者と表記する)の特定感情又は特定行動に関する原因を分析したい場合に、上述のように特定された多数の区間を分析対象とする必要があるため、分析効率が悪い。
本発明は、このような事情に鑑みてなされたものであり、会話における会話参加者の特定感情又は特定行動に関する原因分析の効率化を実現する技術を提供する。
本発明の各態様では、上述した課題を解決するために、それぞれ以下の構成を採用する。
第1の態様は、分析対象決定装置に関する。第1態様に係る分析対象決定装置は、会話の音声に対応するデータから、当該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出する検出部と、検出部により検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、を有する。
第2の態様は、少なくとも1つのコンピュータにより実行される分析対象決定方法に関する。第2態様に係る分析対象決定方法は、会話の音声に対応するデータから、当該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出し、検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する、ことを含む。
なお、本発明の他の態様としては、上記第1の態様における各構成を少なくとも1つのコンピュータに実現させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。
上記各態様によれば、会話における会話参加者の特定感情又は特定行動に関する原因分析の効率化を実現する技術を提供することができる。
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
第1実施形態におけるコンタクトセンタシステムの構成例を示す概念図である。 第1実施形態における通話分析サーバの処理構成例を概念的に示す図である。 第1実施形態における原因分析対象区間の決定の例を概念的に示す図である。 第1実施形態における原因分析対象区間の決定の例を概念的に示す図である。 第1実施形態における通話分析サーバの動作例を示すフローチャートである。 実施例1における分析画面の一例を示す図である。 実施例1における分析画面の一例を示す図である。 実施例1における分析画面の一例を示す図である。 実施例1における通話内容確認画面の例を示す図である。
以下、本発明の実施の形態について説明する。なお、以下に挙げる各実施形態はそれぞれ例示であり、本発明は以下の各実施形態の構成に限定されない。
本実施形態に係る分析対象決定装置は、会話の音声に対応するデータから、当該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出する検出部と、検出部により検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、を有する。
本実施形態に係る分析対象決定方法は、少なくとも1つのコンピュータにより実行され、会話の音声に対応するデータから、当該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出し、検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する、ことを含む。
ここで、会話とは、2以上の話者が、言語の発声などによる意思表示によって、話をすることを意味する。会話には、銀行の窓口や店舗のレジ等のように、会話参加者が直接、話をする形態もあれば、通話機を用いた通話やテレビ会議等のように、離れた位置にいる会話参加者同士が話をする形態もあり得る。また、会話の音声中、一人の会話参加者が声を発している連続領域を発話又は発話区間と表記する。例えば、発話区間は、会話参加者の音声波形において所定値以上の振幅が継続している区間として検出される。通常の会話は、各会話参加者の発話区間、無声区間などから形成される。ここで、音声には、人間が発する声に加えて、人間以外の物から生じる音も含まれる。よって、発話及び発話区間は、音の区間であってもよい。
本実施形態では、会話の音声に対応するデータから、複数の特定発話区間が検出される。検出される複数の特定発話区間は、当該会話を形成する複数の発話区間の中の、当該会話の1人の会話参加者の1つの特定事象、又は、当該会話の1人の会話参加者の複数の特定事象、若しくは、当該会話の複数の会話参加者の複数の特定事象を表す発話区間である。ここで、特定事象とは、原因分析の対象となる会話参加者の特定事象、及び、その特定事象に関連するその会話参加者又は他の会話参加者の特定事象である。更に具体的には、特定事象とは、会話参加者の特定感情又は特定行動、若しくは、その会話参加者のその特定感情又はその特定行動に伴って他の会話参加者が持つ(行う)特定感情又は特定行動である。
ここで、特定感情とは、例えば、怒り、不満、満足感、興味、感動などのような人間が抱く心的状態の中の少なくとも1つである。特定行動とは、謝罪をする、通話を切断する、机を叩く、舌打ちをするなどといった上記特定感情に伴い行われかつ音声を生じさせる人間の動作の中の少なくとも1つである。上記特定発話区間の一例として、或る会話参加者が興味を表す発話区間が例示され、例えば、会話参加者の高いトーンでの「本当ですか」という発声区間が特定発話区間として検出される。また、他の例として、会話参加者の謝罪を表す発話区間が例示され、例えば、会話参加者が「申し訳ございません」と発声した区間が特定発話区間として検出される。なお、本実施形態において上記特定感情及び上記特定行動は制限されない。
このような特定発話区間は、会話参加者が特定事象を引き起こす会話内に、複数存在する場合が多い。従って、このように検出された全ての特定発話区間を分析対象とするのでは、効率が悪い。そこで、本実施形態では、このように検出された複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間が決定される。複数の特定発話区間からそれよりも数の少ない原因分析対象区間を決める方法は、後述する詳細実施形態及び実施例で示すように複数存在し得るため、後述の複数の方法や他の周知の手法を用いて、原因分析対象区間を決めることができる。
このように、本実施形態によれば、全ての特定発話区間を分析対象とするのではなく、それらの特定発話区間から推定される当該原因が存在する可能性が高い部分のみを分析対象とすることができるため、原因分析の効率を向上させることができる。
以下、上述の実施形態について更に詳細を説明する。以下には、詳細実施形態として、第1実施形態を例示する。以下の実施形態は、上述の分析対象決定装置及び分析対象決定方法をコンタクトセンタシステムに適用した場合の例である。よって、以下の詳細実施形態では、コンタクトセンタにおける、顧客とオペレータとの間の通話が、分析対象の会話に設定される例が示される。これにより、会話参加者は、通話者であり、顧客とオペレータである。また、以下の詳細実施形態では、顧客の不満(怒り)が、原因分析の対象の特定感情に設定される。但し、本実施形態は、原因分析の対象の特定感情を制限しない。例えば、顧客の満足感、顧客の関心度、オペレータのストレス感など他の特定感情が原因分析の対象に設定されてもよい。
また、上述の分析対象決定装置及び分析対象決定方法は、通話データを扱うコンタクトセンタシステムへの適用に限定されるものではなく、会話データを扱う様々な態様に適用可能である。例えば、それらは、コンタクトセンタ以外の社内の通話管理システムや、個人が所有する、PC(Personal Computer)、固定電話機、携帯電話機、タブレット端末、スマートフォン等の通話端末などに適用することも可能である。更に、会話データとしては、例えば、銀行の窓口や店舗のレジにおける、担当者と顧客の会話を示すデータなどが例示できる。以下、通話とは、或る通話者と或る通話者とがそれぞれ持つ通話機間が呼接続されてから呼切断されるまでの間の呼を意味する。
[第1実施形態]
〔システム構成〕
図1は、第1実施形態におけるコンタクトセンタシステム1の構成例を示す概念図である。第1実施形態におけるコンタクトセンタシステム1は、交換機(PBX)5、複数のオペレータ電話機6、複数のオペレータ端末7、ファイルサーバ9、通話分析サーバ10等を有する。通話分析サーバ10は、上述の実施形態における分析対象決定装置に相当する構成を含む。
交換機5は、通信網2を介して、顧客により利用される、PC、固定電話機、携帯電話機、タブレット端末、スマートフォン等の通話端末(顧客電話機)3と通信可能に接続されている。通信網2は、インターネットやPSTN(Public Switched Telephone Network)等のような公衆網、無線通信ネットワーク等である。更に、交換機5は、コンタクトセンタの各オペレータが用いる各オペレータ電話機6とそれぞれ接続される。交換機5は、顧客からの呼を受け、その呼に応じたオペレータのオペレータ電話機6にその呼を接続する。
各オペレータは、オペレータ端末7をそれぞれ用いる。各オペレータ端末7は、コンタクトセンタシステム1内の通信網8(LAN(Local Area Network)等)に接続される、PC等のような汎用コンピュータである。例えば、各オペレータ端末7は、各オペレータと顧客との間の通話における顧客の音声データ及びオペレータの音声データをそれぞれ録音する。顧客の音声データとオペレータの音声データとは、混合状態から所定の音声処理により分離されて生成されてもよい。なお、本実施形態は、このような音声データの録音手法及び録音主体を限定しない。各音声データの生成は、オペレータ端末7以外の他の装置(図示せず)により行われてもよい。
ファイルサーバ9は、一般的なサーバコンピュータにより実現される。ファイルサーバ9は、顧客とオペレータとの間の各通話の通話データを、各通話の識別情報と共にそれぞれ格納する。各通話データには、時間情報、顧客の音声データとオペレータの音声データとのペアなどがそれぞれ含まれる。各音声データには、顧客及びオペレータの声に加えて、顧客電話機3及びオペレータ端末7から入力される音も含まれてもよい。ファイルサーバ9は、顧客及びオペレータの各音声を録音する他の装置(各オペレータ端末7等)から、顧客の音声データとオペレータの音声データとを取得する。
通話分析サーバ10は、ファイルサーバ9に格納される各通話データをそれぞれ分析し、ユーザの要求に応じた分析結果を出力する。通話分析サーバ10は、自身が持つ表示装置に表示させてもよいし、WEBサーバ機能により当該分析結果をユーザ端末上のブラウザに表示させるようにしてもよい。
通話分析サーバ10は、図1に示されるように、ハードウェア構成として、CPU(Central Processing Unit)11、メモリ12、入出力インタフェース(I/F)13、通信装置14等を有する。メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスク、可搬型記憶媒体等である。入出力I/F13は、キーボード、マウス等のようなユーザ操作の入力を受け付ける装置、表示装置やプリンタ等のようなユーザに情報を提供する装置などと接続される。通信装置14は、通信網8を介して、ファイルサーバ9などと通信を行う。なお、通話分析サーバ10のハードウェア構成は制限されない。
〔処理構成〕
図2は、第1実施形態における通話分析サーバ10の処理構成例を概念的に示す図である。第1実施形態における通話分析サーバ10は、通話データ取得部20、条件取得部21、検出部22、特定部23、対象決定部24、表示処理部25等を有する。これら各処理部は、例えば、CPU11によりメモリ12に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD(Compact Disc)、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力I/F13を介してインストールされ、メモリ12に格納されてもよい。
通話データ取得部20は、ファイルサーバ9から、分析対象となる複数通話の通話データを各通話の識別情報と共にそれぞれ取得する。それら複数の通話データは、通話分析サーバ10とファイルサーバ9との間の通信により取得されてもよいし、可搬型記録媒体を介して取得されてもよい。
条件取得部21は、分析対象の通話を絞り込むための条件(以降、通話条件と表記する)、及び、特定発話区間を特定するための条件(以降、区間条件と表記する)の少なくとも一方を表示処理部25から取得する。但し、区間条件は、特定発話区間が検出されない通話を除外するための条件としても作用する。特定発話区間とは、各通話を形成する複数の発話区間の中の、顧客の不満分析の対象区間を決める上での元となる発話区間である。
通話条件及び区間条件はいずれも複数指定されてもよい。各通話条件には、例えば、キーワード、表現、通話者の特定行動に伴う音などの1つがそれぞれ指定される。各区間条件には、上述の実施形態における、1人の通話者の1つの特定事象がそれぞれ指定される。言い換えれば、各区間条件には、特定感情又は特定行動、及び、それらの主体がそれぞれ指定される。本実施形態では、原因分析の対象が顧客の不満であるため、通話条件には、顧客の不満を表す各種事象が指定され、区間条件には、顧客の怒り(不満)感情、オペレータの謝罪行動などが指定される。但し、本実施形態は、通話条件自体及び区間条件自体を制限しない。
検出部22は、条件取得部21により通話条件が取得されている場合には、通話データ取得部20により取得された複数の通話データの中から、全ての通話条件に合致する通話データを分析対象として抽出する。更に、検出部22は、条件取得部21により区間条件が取得されている場合には、全ての通話条件に合致する各通話データにおいて、各区間条件に応じた特定発話区間をそれぞれ検出し、この特定発話区間を含まない通話データを分析対象から除外する。
検出部22は、音声認識部27、特定表現テーブル28、感情認識部29等を有する。これら各処理部についても、他の処理部と同様に、プログラムの実行により実現される。検出部22は、音声認識部27及び感情認識部29の少なくとも一方を実行することにより、通話条件に合致する通話データの抽出、区間条件に応じた特定発話区間の検出などを行う。
検出部22は、音声認識部27及び感情認識部29の少なくとも一方を実行する前に、通話データに含まれるオペレータ及び顧客の各音声データから、オペレータ及び顧客の各発話区間をそれぞれ検出するようにしてもよい。この検出により、検出部22は、各発話区間の始端時間及び終端時間を取得する。本実施形態は、発話区間の具体的検出方法を制限しない。発話区間は、音声認識部27の音声認識処理によって検出されてもよい。また、通話データ取得部20が、通話データと共に、その通話データの発話区間の情報を取得するようにしてもよい。また、オペレータの発話区間には、オペレータ端末7により入力された音も含まれ、顧客の発話区間には、顧客電話機3により入力された音も含まれてもよい。
音声認識部27は、通話データに含まれるオペレータ及び顧客の各音声データの各発話区間に対して音声認識処理をそれぞれ行う。これにより、音声認識部27は、当該通話データから、オペレータ音声及び顧客音声に対応する各音声テキストデータ及び各発声時間データをそれぞれ取得する。ここで、音声テキストデータとは、顧客又はオペレータにより発された声がテキスト化された文字データである。各発声時間データは、各音声テキストデータの発声時間をそれぞれ示し、各音声テキストデータが得られた各発話区間の始端時間及び終端時間をそれぞれ含む。なお、本実施形態では、この音声認識処理には、周知な手法が利用されればよく、その音声認識処理自体及びその音声認識処理で利用される各種音声認識パラメータを制限しない。
また、音声認識部27は、特定行動音検出部31を有するようにしてもよい。特定行動音検出部31は、途中で通話が切断された事象や、所定音量以上の通話切断音等、通話条件として指定され得る、顧客の不満を表す事象を認識する。特定行動音検出部31は、切断音の音声特徴情報を予め保持し、この情報を用いて切断音を認識するようにしてもよいし、通話データと共に送られる通話切断時間のデータに基づいて、途中で通話が切断された事象を認識するようにしてもよい。
また、音声認識部27は、周知の手法を用いて、音声データを用いて顧客の不満を表す通話データを特定するようにしてもよい。本実施形態は、音声認識部27による音声認識処理自体を制限しない。
特定表現テーブル28は、通話条件及び区間条件で指定され得る特定表現データを保持する。特定表現データは、文字データとして保持される。また、特定表現テーブル28は、お礼表現データ及び謝罪表現データをお礼表現と謝罪表現とに区別され得る態様で特定表現データとして保持する。
感情認識部29は、条件取得部21により取得される区間条件に基づいて、通話データに含まれるオペレータ及び顧客の少なくとも一方の音声データの各発話区間に対して感情認識処理をそれぞれ行う。感情認識部29は、各発話区間における音声から韻律的特徴情報を取得し、この韻律的特徴情報を用いて、各発話区間が当該区間条件で指定される特定事象を表すか否かを判定する。韻律的特徴情報としては、例えば、基本周波数や音声パワー等が利用される。なお、本実施形態では、この感情認識処理には、周知な手法が利用されればよく(以下の参考例を参照)、感情認識処理自体は制限されない。
参考例:野本済央ほか、「韻律情報と発話の時間的関係性を用いた対話音声からの怒り感情推定」、日本音響学会講演論文集、89から92頁、2010年3月
感情認識部29は、SVM(Support Vector Machine)の識別モデルを用いて、各発話区間が当該区間条件で指定される通話者の特定事象を表すか否かを判定するようにしてもよい。具体的には、当該区間条件として「顧客の怒り」が指定され得る場合、感情認識部29は、「怒り」と「平常」の発話区間の韻律的特徴情報を学習データとして与え、「怒り」と「平常」とを識別するように学習された識別モデルを予め保持するようにしてもよい。また、当該区間条件として「オペレータの通常謝罪」と「オペレータの深謝」とが指定され得る場合、感情認識部29は、「オペレータの通常謝罪」と「オペレータの深謝」の発話区間の韻律的特徴情報を学習データとして与え、それらを識別するように学習された識別モデルを予め保持するようにしてもよい。感情認識部29は、取得された区間条件に対応する識別モデルを選択し、この選択された識別モデルに、各発話区間の韻律的特徴情報を与えることにより、各発話区間が当該区間条件で指定される通話者の特定事象を表すか否かを判定する。
検出部22は、例えば、通話条件として「顧客のお礼なし」が与えられた場合、音声認識部27の実行により得られた、顧客の各発話区間の音声テキストデータに、特定表現テーブル28に保持されるお礼表現データが含まれない通話データを、通話条件に合致する通話データとして抽出する。また、検出部22は、通話条件として「途中で通話が切断された事象」が与えられた場合、顧客の音声データに対する音声認識部27の上述のような処理により、各通話に関しその事象の有無を判定し、その事象を含む通話データを分析対象として抽出する。また、検出部22は、区間条件として「顧客の怒り」が与えられた場合、顧客の音声データに関し感情認識部29により「怒り」を表すと判定された各発話区間を特定発話区間としてそれぞれ特定すると共に、特定発話区間が検出されなかった通話データを分析対象から除外する。
特定部23は、検出部22により検出された各通話の特定発話区間に関し、特定発話区間が表す少なくとも1つの特定事象に応じた手法により、少なくとも1つの基準時間を特定する。例えば、特定部23は、区間条件毎に決められた基準時間の特定手法をそれぞれ持つ。
特定部23は、複数の特定発話区間が検出されるような区間条件については、次のような特定方法を実行する。特定部23は、1人の通話者の1つの特定事象を表す複数の第1特定発話区間における、隣接する第1特定発話区間の間の時間幅が所定時間より短い第1特定発話区間の各ペアが結合されてなる区間内の中から、少なくとも1つの基準時間を特定する。
一方、特定部23は、他の区間条件に応じて検出部22により検出された特定発話区間については、その特定発話区間をそのまま用いて、基準時間を特定する。基準時間の特定では、上記所定時間が区間条件毎に切り換えられてもよい。所定時間が0(ゼロ)や値無し(NULL)に設定されていれば、検出部22により検出された特定発話区間がそのまま用いられて、基準時間が特定されるようにしてもよい。
本発明者らは、1つの区間条件を満たす第1特定発話区間、即ち、1人の会話参加者(通話者)の1つの特定事象を表す特定発話区間が、連続的に生じている場合に、その全ての特定発話区間にその特定事象に関する原因が存在するわけではないことを見出した。本発明者らは、連続的に生じている複数の特定発話区間の中の或る時間の周辺に、その特定事象に関する原因が存在する可能性が高いことを導出した。例えば、会話参加者である顧客の不満を表す発話区間が連続的に生じている場合に、その全ての発話区間の周辺に顧客の不満の原因が存在するわけではなく、その連続的に生じている不満を表す複数の発話区間の中の先頭周辺に、その不満の原因が存在する可能性が高いことが導出された。また、連続的に生じている怒りを表す複数の発話区間の中の終端周辺に、満足感の原因が存在する可能性がある。
更に、本発明者らは、頻出することは少ないが、その前後に、原因分析の対象となる特定事象の原因が存在する可能性が高い発話区間があることを見出した。例えば、会話参加者の謝罪を表す発話区間がこのような特性を持つことが導出された。更に、会話参加者の謝罪にも、軽い謝罪と深謝とが存在し、深謝を表す発話区間のほうが、軽い謝罪を表す発話区間よりも、上述のような特性傾向が強いことが見出された。そこで、本実施形態では、上述のように、特定部23は、区間条件毎に、基準時間の特定方法を切り替える。例えば、特定部23は、顧客の不満やオペレータの軽い謝罪を表す特定発話区間については上述の第1特定発話区間と同様の特定方法を用いて基準時間を特定し、オペレータの深謝を表す特定発話区間については上述の第2特定発話区間と同様の特定方法を用いて基準時間を特定する。第1特定発話区間が顧客の不満を表す場合、隣接する第1特定発話区間の間の時間幅が所定時間より短い第1特定発話区間の各ペアが結合されてなる区間内の先頭に位置する第1特定発話区間に基づいて、少なくとも1つの基準時間が特定される。なお、基準時間の特定方法の切り替えは、顧客の怒りとオペレータの謝罪との関係のみに制限されない。
本実施形態では、第1特定発話区間又は第2特定発話区間を用いた基準時間の特定手法は制限されない。例えば、特定発話区間の始端時間又は終端時間が基準時間に設定されてもよいし、特定発話区間内のいずれか1つの時間が基準時間に設定されてもよい。また、特定発話区間内のいずれか1つの時間に或る所定時間を加算した時間が基準時間に設定されてもよい。また、特定発話区間の始端時間が基準時間A、終端時間が基準時間Bといったように、特定発話区間内の複数の時間が複数種類の基準時間に設定されてもよい。
対象決定部24は、特定部23により特定される基準時間を基準とする所定時間範囲を顧客の不満の原因分析対象区間に決定する。原因分析対象区間は、基準時間を始端とした所定時間範囲に決定されてもよいし、基準時間を終端とした所定時間範囲に決定されてもよいし、基準時間を中心点とした所定範囲に決定されてもよい。また、原因分析対象区間は、複数種類の基準時間が設定された場合、基準時間Aの所定時間だけ前の時刻を始端とし、基準時間Bの所定時間だけ後の時刻を終端とする範囲に決定されてもよい。
対象決定部24は、複数の区間条件が指定されている場合、各区間条件から得られる各基準時間に基づいて決定される複数の原因分析対象区間で重複する範囲を、最終的に、その通話の顧客の不満の原因分析対象区間に決定する。原因分析対象区間を決めるための上記所定時間範囲は、区間条件毎に異なる値に設定されてもよいし、同値に設定されてもよい。対象決定部24は、検出部22により抽出された各通話データの中で、対象決定部24により最終的な原因分析の対象区間が設定されなかった通話データを分析対象から除外する。
図3は、第1実施形態における原因分析対象区間の決定の例を概念的に示す図である。図3では、基準時間を特定するために用いられる上記所定時間幅がxで示されており、原因分析対象区間を決定するために用いられる上記所定時間範囲が(a+b)で示される。図3の例によれば、結合されてなる区間内の先頭の特定発話区間の始端時間が基準時間に決定され、その基準時間を中心時点として、前a秒、後ろb秒の範囲が原因分析対象区間に決定される。なお、本実施形態は、原因分析対象区間の決定方法をこのような方法に制限しない。時間幅a及びbを同一値にしてもよい。
図4は、第1実施形態における原因分析対象区間の決定の例を概念的に示す図である。図4の例では、顧客(CU)の怒りとオペレータ(OP)の深謝との2つの区間条件に関し、複数の特定発話区間がそれぞれ検出され、かつ、基準時間がそれぞれ特定されている。更に、図4の例によれば、顧客の怒りについては、基準時間を中心に前a秒、後ろb秒の時間範囲が原因分析対象区間に決定され、オペレータの深謝については、基準時間を中心に前m秒、後ろn秒の時間範囲が原因分析対象区間に決定される。最終的に、顧客の怒り及びオペレータの深謝に対応する各対象区間が重複する範囲が、顧客の不満に関する原因分析対象区間に決定される。
表示処理部25は、検出部22により検出される複数の特定発話区間を個別に表わす複数の第1描画要素、及び、対象決定部24により決定される原因分析の対象区間を表す第2描画要素が、分析対象として抽出された各通話に関し、通話内の時系列に応じてそれぞれ並ぶ描画データを生成する。表示処理部25は、この描画データに基づいて分析結果画面を通話分析サーバ10に入出力I/F13を介して接続される表示装置に表示させる。また、表示処理部25は、WEBサーバ機能を持ち、この描画データをWEBクライアント装置に表示させるようにしてもよい。更に、表示処理部25は、通話条件及び区間条件をユーザに指定させるための入力画面を表示させる。これにより、条件取得部21は、この入力画面を介してユーザに指定された通話条件及び区間条件を取得する。
〔動作例〕
以下、第1実施形態における分析対象決定方法について図5を用いて説明する。図5は、第1実施形態における通話分析サーバ10の動作例を示すフローチャートである。ここで、通話分析サーバ10は、複数の通話データを既に取得している。例えば、通話分析サーバ10は、ファイルサーバ9に格納される複数の通話データを取得している。
通話分析サーバ10は、通話条件及び区間条件の少なくとも一方を取得する(S50)。通話分析サーバ10は、入力画面を表示装置に表示させることにより、この入力画面を介して入力される通話条件及び区間条件の少なくとも一方を取得する。
通話分析サーバ10は、(S50)で取得された通話条件及び区間条件に基づいて、音声認識処理の要否を判定する(S51)。通話分析サーバ10は、予め、各通話条件及び各区間条件について音声認識処理が必要か否かの情報をそれぞれ保持する。
通話分析サーバ10は、(S51)の判定に応じて(S51;YES)、取得されている複数の通話データに対して音声認識処理を実行する(S53)。この音声認識処理は、上述したように、各発話区間の音声データから音声テキストデータを取得する処理、途中で通話が切断された事象、所定音量以上の通話切断音等を音声データから検出する処理などを含む。通話分析サーバ10は、(S50)で取得された条件に基づいて、具体的な音声認識処理を決定する。
通話分析サーバ10は、(S52)の音声認識処理の結果に基づいて、(S52)で音声認識処理の対象とされた各通話データに関し、(S50)で取得された区間条件により示される通話者の特定事象を表わす特定発話区間を検出する(S53)。(S50)において、音声認識処理を必要とする区間条件が取得されていない場合には、(S53)は実行されない。
通話分析サーバ10は、(S52)の音声認識処理の結果に基づいて、(S52)で音声認識処理の対象とされた複数の通話データの中で、(S50)で取得された条件を満たさない通話データ、及び、(S53)の実行により特定発話区間が検出されなかった通話データを分析対象から除外する(S54)。
続いて、通話分析サーバ10は、(S50)で取得された条件に基づいて、感情認識処理の要否を判定する(S55)。通話分析サーバ10は、予め、各通話条件及び各区間条件について感情認識処理が必要か否かの情報をそれぞれ保持する。
通話分析サーバ10は、(S55)の判定に応じて(S55;YES)、予め取得されていた複数の通話データ、又は、(S54)で分析対象として抽出された通話データに対して、感情認識処理を実行する(S56)。感情認識処理は、上述したように、各発話区間が(S50)で取得された条件に対応する通話者の特定事象を表すか否かを判定する。例えば、通話分析サーバ10は、(S50)で取得された条件に対応する識別モデルを選択し、この選択された識別モデルを用いて感情認識処理を行う。
通話分析サーバ10は、(S56)の感情認識処理の結果に基づいて、(S56)で感情認識処理の対象とされた各通話データに関し、区間条件に対応する通話者の特定事象を表す特定発話区間をそれぞれ検出する(S57)。通話分析サーバ10は、(S57)の検出結果に基づいて、通話データを絞り込む(S58)。言い換えれば、通話分析サーバ10は、(S57)で特定発話区間が検出されなかった通話データを分析対象から除外する。
通話分析サーバ10は、ここまでの処理で、検出された特定発話区間が存在するか否かを判定する(S59)。通話分析サーバ10は、特定発話区間が存在する場合(S59;YES)、各区間条件に関し、その区間条件に応じた特定手法を用いて、各通話の特定発話区間から少なくとも1つの基準時間をそれぞれ特定する(S60)。具体的特定手法については、上述のとおりである。
通話分析サーバ10は、各通話の各基準時間に基づいて、各通話に関し、顧客の不満の原因分析対象区間をそれぞれ決定する(S61)。このとき、複数の区間条件が取得されている場合、通話分析サーバ10は、各区間条件に対応する各原因分析対象区間で重複する区間を最終的な不満の原因分析対象区間に決定する。
通話分析サーバ10は、ここまでの処理で分析対象として抽出された各通話データ、又は、予め取得されていた各通話データに対応する各通話に関し、(S53)及び(S57)の少なくとも一方で検出された特定発話区間を個別に表わす複数の第1描画要素、及び、(S61)で決定された原因分析対象区間を表す第2描画要素が通話内の時系列に応じてそれぞれ並ぶ描画データを生成する。通話分析サーバ10は、この描画データに基づいて分析結果画面を表示装置に表示させる(S62)。
なお、図5に例示されるフローチャートでは、複数の工程(処理)が順番に記載されているが、本実施形態で実行される工程の実行順序は、その記載の順番に制限されない。例えば、複数の区間条件が取得された場合には、各区間条件に関し、工程(S52)から工程(S54)と、工程(S56)から工程(S58)とを並行に実行してもよい。
〔第1実施形態の作用及び効果〕
上述したように第1実施形態では、取得された各区間条件について、その区間条件が示す1人の通話者の1つの特定事象を表す特定発話区間がそれぞれ検出される。このような特定発話区間は、通話者が特定事象を引き起こす通話内に、複数存在する場合が多い。従って、このように検出された全ての特定発話区間を分析対象とするのでは、効率が悪い。そこで、第1実施形態では、区間条件毎、即ち、通話者の特定事象毎に予め決められている特定手法により、当該複数の特定発話区間から少なくとも1つの基準時間が特定される。これにより、顧客の怒りのような連続的に生じる複数の特定発話区間については、それらが結合されてなる区間内の或る時間の周辺(顧客の怒りの場合には先頭周辺)が基準点(基準時間)とされ、オペレータの深謝のような頻出しないが顧客の不満の原因を示す箇所に近い可能性が高い特定発話区間については、それら個々が基準点(基準時間)とされる。そして、この基準時間を基準とする所定時間範囲が、顧客の不満の原因分析対象区間に決定される。
このように、第1実施形態によれば、通話者の特定事象を表す全ての特定発話区間を分析対象とするのではなく、顧客の不満に関する原因が存在する可能性が高い部分のみを分析対象とすることができるため、原因分析の効率を向上させることができる。
更に、第1実施形態では、原因分析対象区間を決めるにあたり、上述した、顧客の怒りやオペレータの深謝のような通話者の特定事象の発生特性が反映された情報処理が実行される。更に、複数の区間条件が指定されている場合には、各区間条件に対応する各特定発話区間から決定される原因分析対象区間が重複する範囲が最終的な原因分析対象区間に決定される。
これにより、第1実施形態によれば、決定された原因分析対象区間に顧客の不満の原因となる事象が含まれる可能性を高めることが出来る。
更に、第1実施形態では、各通話に関し、少なくとも1人の通話者の少なくとも1つの特定事象を表す複数の特定発話区間、及び、これら複数の特定発話区間から得られた顧客の不満の原因分析対象区間が共にそれぞれ出力される。従って、第1実施形態によれば、各通話に関し、通話者の特定事象を表す特定発話区間の分布を確認しつつ、顧客の不満に関する原因分析対象区間の位置を同時に確認することができるため、顧客の不満に関する通話全体の概要やその原因分析対象区間周辺の発話状況を把握し易くすることができる。更に、第1実施形態によれば、どの通話者のどの特定事象がより顧客の不満の原因箇所の特定に役立つのかといった分析もし易くなる。
以下に実施例を挙げ、上述の第1実施形態を更に詳細に説明する。但し、本発明は以下の実施例から何ら制限を受けない。
《画面例》
図6、図7及び図8は、実施例1における分析画面の一例をそれぞれ示す図である。図6から図8に示される分析画面は、上述の第1実施形態における表示処理部25により表示される分析結果画面、及び、通話条件及び区間条件の入力画面を含む。この分析画面は、通話条件の指定部G51、区間条件の指定部G52、分析実行ボタンG53、分析結果表示部G55などを含む。要素G51、G52及びG53が上記入力画面に相当し、要素G55が上記分析結果画面に相当する。
通話条件の指定部G51及び区間条件の指定部G52では、分析属性として、各条件が、音声テキストデータのみを用いて判定されるか、音声データを用いて判定されるかが区別可能に表わされている。この分析属性に応じて、通話条件における「キーワード」及び「CUお礼なし」、区間条件における「OP謝罪(「申し訳」表現)」については、音声テキストデータのみを用いて判定される。また、通話条件における「CU怒り(「電話切断音」振る舞い)」、区間条件における「OP謝罪(深謝)」及び「CU怒り(「怒り」感情)」については、音声データを用いて判定される。ここで、CUは顧客を示し、OPはオペレータを示す。
分析結果表示部G55は、通話データ取得部20により取得された複数の通話データの中の、検出部22により分析対象として抽出された各通話データが示す各通話を行毎に表わす。分析結果表示部G55の各通話欄の左端には、各通話が行われた日時が表示され、各通話の時系列が紙面の左から右方向に表わされる。更に、分析結果表示部G55内の各通話を示す欄には、各区間条件に関しそれぞれ検出された各特定発話区間、及び、通話条件として与えられるキーワードを含む発話区間が、各行に分かれてそれぞれ表わされる。図6では、キーワードを含む発話区間を示す領域が、各通話欄の最上位行に、着色されて表わされている(図6の符号G55−1)。図7では、キーワードを含む発話区間を示す領域(図6の符号G55−1)に加えて、「CU怒り(「怒り」感情)」を表す特定発話区間を示す領域が、各通話欄の最下位行に、着色されて表わされている(図7の符号G55−2)。図8では、キーワードを含む発話区間を示す領域(図6の符号G55−1)、及び、「CU怒り(「怒り」感情)」を表す特定発話区間を示す領域(図7の符号G55−2)に加えて、「OP謝罪(「深謝」状況)」を表す特定発話区間を示す領域が、各通話欄の下位から2行目に、着色されて表わされている(図8の符号G55−3)。
更に、図7及び図8に示されるように、分析結果表示部G55内の各通話欄には、対象決定部24により決定された顧客の不満に関する原因分析対象区間が、その時間範囲を示すようにそれぞれ表示されている(G55−5)。更に、各通信欄に表わされる原因分析対象区間には、通話の時系列順に、原因分析対象区間を識別するための識別情報(図7及び図8の例では数値)が設定されている。
このように、実施例1において表示される分析結果画面では、各通話に関し、区間条件に合致する特定発話区間と同時に、その特定発話区間に基づいて決められる原因分析の対象区間が表示される。従って、実施例1によれば、各通話に関し、通話者の特定事象を表す特定発話区間の分布を確認しつつ、その特定感情に関する原因分析対象区間の位置を同時に確認することができるため、顧客の不満に関する通話全体の概要やその原因発生区間周辺の発話状況を把握し易くなる。
表示処理部25は、図6から図8に示される分析画面に加えて、図9に示されるような、更に通話内容を具体的に確認するための画面を表示させるようにしてもよい。図9は、実施例1における通話内容確認画面の例を示す図である。例えば、表示処理部25は、図6から図8に示される分析画面において或る通話が選択されると、その選択された通話に関し、この通話内容確認画面を表示させる。
図9の例では、画面上部にその通話が行われた日時及び問い合わせ内容が示される。問い合わせ内容は、例えば、オペレータ端末7を用いてオペレータにより入力されたデータであり、各通話データと共に通話データ取得部20により取得される。更に、通話内容確認画面は、発話情報表示部G81を含む。発話情報表示部G81は、各発話区間を各行に表わし、各発話区間に関し、始端時間G81−1、発声元の通話者(OPかCUか)G81−2、音声テキストデータG81−3をそれぞれ表示する。音声テキストデータG81−3は、上述の音声認識部27により取得されるデータである。発話情報表示部G81は、全ての発話区間の情報が表示しきれない場合には、画面スクロールにより全ての発話区間の情報が表示されるように形成される。
更に、対象決定部24により決定された顧客の不満に関する原因分析対象区間に含まれる発話区間は、他の発話区間と区別可能に表示される。図9の例では、その発話区間は、太枠表示されている(G81−5)。また、図9には表れていないが、各区間条件に対応する各特定発話区間がそれぞれ区別可能に着色されて表示される。これにより、ユーザは、原因分析対象区間及びその周辺の実際の発声内容を確認することにより、容易に、顧客を不満にさせた具体的な原因を特定することができる。更に、この通話内容確認画面には、対象決定部24により決定された顧客の不満に関する原因分析対象区間の識別情報が列挙されている(符号G82)。表示処理部25は、識別情報の選択操作を検出し、選択された識別情報により特定される原因分析対象区間に含まれる発話区間が表示されるように、発話情報表示部G81を自動スクロールさせる。更に、発話情報表示部G81の各行が選択されると、その選択された行に対応する発話区間の音声が再生されるようにすることも可能である。これにより、ユーザは、通話分析サーバ10により顧客の不満の原因となると推定された発話区間及びその周辺の発話内容を即座に確認することができ、効率よく原因分析作業を行なうことができる。
以下、図6、図7及び図8の各々について、分析結果表示部G55、即ち、分析結果画面を表示させるための通話分析サーバ10の動作例をそれぞれ説明する。
図6では、「キーボード」というキーワードが通話条件として指定されている(通話条件の指定部G51)。これにより、通話分析サーバ10は、「キーボード」というキーワードを通話条件として取得する。続いて、通話分析サーバ10は、音声認識部27の実行により得られた、顧客の各発話区間の音声テキストデータの中に、そのキーワード「キーボード」が含まれる通話データを、通話条件に合致する通話データとして抽出する。これにより、分析結果表示部G55には、そのキーワードを含む発話区間を持つ通話のみが表示される。このとき、通話分析サーバ10は、そのキーワードを含む発話区間を特定し(特定発話区間とは呼ばない)、これら各通話に関し、そのキーワードを含む発話区間を示す領域を着色して表示させる。
図7では、図6の通話条件(キーワード「キーボード」)に加えて、「CU怒り(「怒り」感情)」が区間条件として指定されている(区間条件の指定部G52)。これにより、通話分析サーバ10は、通話条件(キーワード「キーボード」)、及び、区間条件「CU怒り(「怒り」感情)」を取得する。通話分析サーバ10は、音声認識部27の実行により得られた、顧客の各発話区間の音声テキストデータの中に、そのキーワード「キーボード」が含まれる通話データを、通話条件に合致する通話データとして抽出する。更に、通話分析サーバ10は、抽出された各通話データの顧客の各発話区間に関し感情認識部29により「怒り」を表すと判定された各発話区間を特定発話区間としてそれぞれ特定すると共に、特定発話区間が検出されなかった通話データを抽出対象から除外する。通話分析サーバ10は、顧客の怒りを表す特定発話区間から基準時間を特定し、その基準時間を基準に顧客の不満に関する原因分析対象区間を決定する。顧客の怒りを表す特定発話区間は連続的に発生している箇所もあるため、通話分析サーバ10は、その箇所の先頭の特定発話区間を用いて基準時間を特定する。
図8では、図7の通話条件(キーワード「キーボード」)及び区間条件(CU怒り)に加えて、「OP謝罪(「深謝」状況)」が区間条件として指定されている(区間条件の指定部G52)。これにより、通話分析サーバ10は、通話条件(キーワード「キーボード」)、区間条件「CU怒り(「怒り」感情)」、及び、区間条件「OP謝罪(「深謝」状況)」を取得する。「OP謝罪(「深謝」状況)」の区間条件については、次のように処理される。まず、通話分析サーバ10は、音声認識部27の実行により得られた、オペレータの音声テキストデータに基づいて、特定表現テーブル28に保持される謝罪表現データを含むオペレータの発話区間を特定する。通話分析サーバ10は、この特定された各発話区間に関し感情認識部29により「深謝」を表すと判定された発話区間を、この区間条件に合致する特定発話区間として特定する。そして、通話分析サーバ10は、顧客の怒りを表す特定発話区間の基準時間から得られる原因分析対象区間と、オペレータの深謝を表す特定発話区間の基準時間から得られる原因分析対象区間との重複範囲を、顧客の不満に関する原因分析対象区間に決定する。
図7及び図8を比較すれば分かるように、実施例1によれば、区間条件、即ち、通話者の特定事象を増やすことにより、原因分析対象区間の数をより少なくすることが出来る。これは、区間条件を増やすことで、原因分析対象区間を決めるための材料を増やすことができ、結果として、原因分析対象区間が実際に顧客の不満の原因となる事象を含む確率を上げることができるからである。これにより、通話における通話者の特定事象に関する原因分析の効率を向上することができる。
[補足]
上述の第1実施形態及び実施例1では、図3及び図4に示されるように、連続的に生じている、1人の通話者の1つの特定事象を表す特定発話区間については、その一部(先頭)から原因分析対象区間が決定された。しかしながら、第1実施形態及び実施例1は、指定された区間条件、即ち、通話者の特定事象によっては、特定発話区間が連続的に生じている場合でも、それら各特定発話区間からそれぞれ原因分析対象区間が決定される形態を排除するものではない。この場合には、指定された複数の区間条件に基づいて決定される複数の原因分析対象区間で重複する範囲を、最終的に、その通話の顧客の不満の原因分析対象区間に決定することにより、全ての特定発話区間の中から原因分析対象区間を絞ることができる。
[変形例]
上述の第1実施形態及び実施例1では、複数の区間条件が指定されている場合、各区間条件から得られる各基準時間に基づいて決定される複数の原因分析対象区間で重複する範囲が、最終的に、その通話の顧客の不満の原因分析対象区間に決定された。しかしながら、重複する範囲に制限せず、各区間条件から決定される全ての原因分析対象区間を原因分析対象区間に決めるようにしてもよい。この場合でも、連続的に生じている特定発話区間については基準時間の特定により原因分析対象区間が絞られるため、全ての発話区間又は特定発話区間を分析するよりは、分析効率を上げることができる。
また、上述の通話分析サーバ10は、複数のコンピュータにより実現されてもよい。例えば、検出部22が少なくとも1つの他のコンピュータ上で実現されてもよい。この場合、通話分析サーバ10は、通話条件や区間条件の情報を検出部22に与え、検出部22から、特定発話区間に関する始端時間及び終端時間を取得するようにしてもよい。
[他の実施形態]
上述の実施形態及び実施例では、通話データが扱われたが、上述の分析対象決定装置及び分析対象決定方法は、通話以外の会話データを扱う装置やシステムに適用されてもよい。この場合、例えば、分析対象となる会話を録音する録音装置がその会話が行われる場所(会議室、銀行の窓口、店舗のレジなど)に設置される。また、会話データが複数の会話参加者の声が混合された状態で録音される場合には、その混合状態から所定の音声処理により会話参加者毎の音声データに分離される。
また、上述の実施形態及び変形例は、内容が相反しない範囲で組み合わせることができる。
上記の各実施形態及び各変形例の一部又は全部は、以下の付記のようにも特定され得る。但し、各実施形態及び各変形例が以下の記載に限定されるものではない。
(付記1)
会話の音声に対応するデータから、該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出する検出部と、
前記検出部により検出される複数の特定発話区間に基づいて、前記会話の会話参加者の特定事象に関する原因分析対象区間であって、該複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、
を備える分析対象決定装置。
(付記2)
前記検出部により検出される複数の特定発話区間が表す少なくとも1つの特定事象に応じた少なくとも1つの手法により、該複数の特定発話区間から少なくとも1つの基準時間を特定する特定部を更に備え、
前記対象決定部は、前記特定部により特定される前記少なくとも1つの基準時間を基準とする所定時間範囲を前記原因分析対象区間に決定する、
付記1に記載の分析対象決定装置。
(付記3)
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記会話の1人の会話参加者の1つの特定事象を表す複数の第1特定発話区間が含まれている場合、該複数の第1特定発話区間における、隣接する第1特定発話区間の間の時間幅が所定時間より短い第1特定発話区間の各ペアが結合されてなる区間内の中から、前記少なくとも1つの基準時間を特定する、
付記2に記載の分析対象決定装置。
(付記4)
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記複数の第1特定発話区間と共に、前記複数の第1特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第2特定発話区間が更に含まれる場合、該第2特定発話区間をそのまま用いて基準時間を更に特定し、
前記対象決定部は、前記第2特定発話区間から得られる基準時間を基準とする所定時間範囲を、前記原因分析対象区間に更に決定する、
付記3に記載の分析対象決定装置。
(付記5)
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記会話の1人の会話参加者の1つの特定事象を表す第1特定発話区間と、該第1特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第2特定発話区間とが含まれる場合、該第1特定発話区間及び該第2特定発話区間をそのまま用いて前記基準時間を特定し、
前記対象決定部は、前記第1特定発話区間及び前記第2特定発話区間からそれぞれ得られる各基準時間を基準とする所定時間範囲をそれぞれ、前記原因分析対象区間に決定する、
付記2に記載の分析対象決定装置。
(付記6)
前記対象決定部は、前記第1特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間と前記第2特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間とが重複する区間を、前記原因分析対象区間に決定する付記4又は5に記載の分析対象決定装置。
(付記7)
前記検出部は、第1会話参加者の不満を表す前記複数の第1特定発話区間と、第2会話参加者の謝罪を表す前記第2特定発話区間とを検出し、
前記対象決定部は、前記第1会話参加者の不満に関する前記原因分析対象区間を決定する、
付記4又は6に記載の分析対象決定装置。
(付記8)
前記検出部により検出される複数の特定発話区間を個別に表わす複数の第1描画要素、及び、前記対象決定部により決定される前記原因分析対象区間を表す第2描画要素が、前記会話内の時系列に応じて並ぶ描画データを生成する描画データ生成部、
を更に備える付記1から7のいずれか1つに記載の分析対象決定装置。
(付記9)
前記描画データ生成部は、前記会話の複数の発話区間に関する複数の音声テキストデータが、発話区間毎に前記会話内の時系列に沿って表示され、前記原因分析対象区間に含まれる発話区間の音声テキストデータが他と区別可能に表示され、前記原因分析対象区間の識別情報が表示される描画データを生成し、該描画データに基づく表示画面上での該識別情報に対するユーザ操作に応じて、該識別情報で特定される原因分析対象区間に含まれる発話区間の音声テキストデータが表示されるような画面遷移を可能とする、
付記8に記載の分析対象決定装置。
(付記10)
少なくとも1つのコンピュータにより実行される分析対象決定方法において、
会話の音声に対応するデータから、該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出し、
前記検出される複数の特定発話区間に基づいて、前記会話の会話参加者の特定事象に関する原因分析対象区間であって、該複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する、
ことを含む分析対象決定方法。
(付記11)
前記検出される複数の特定発話区間が表す少なくとも1つの特定事象に応じた少なくとも1つの手法により、該複数の特定発話区間から少なくとも1つの基準時間を特定し、
前記特定される少なくとも1つの基準時間を基準とする所定時間範囲を前記原因分析対象区間に決定する、
ことを更に含む付記10に記載の分析対象決定方法。
(付記12)
前記基準時間の特定は、前記検出される複数の特定発話区間に、前記会話の1人の会話参加者の1つの特定事象を表す複数の第1特定発話区間が含まれている場合、該複数の第1特定発話区間における、隣接する第1特定発話区間の間の時間幅が所定時間より短い第1特定発話区間の各ペアが結合されてなる区間内の中から、前記少なくとも1つの基準時間を特定する、
付記11に記載の分析対象決定方法。
(付記13)
前記基準時間の特定は、前記検出される複数の特定発話区間に、前記複数の第1特定発話区間と共に、前記複数の第1特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第2特定発話区間が更に含まれる場合、該第2特定発話区間をそのまま用いて基準時間を更に特定し、
前記原因分析対象区間の決定は、前記第2特定発話区間から得られる基準時間を基準とする所定時間範囲を、前記原因分析対象区間に更に決定する、
付記12に記載の分析対象決定方法。
(付記14)
前記基準時間の特定は、前記検出される複数の特定発話区間に、前記会話の1人の会話参加者の1つの特定事象を表す第1特定発話区間と、該第1特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第2特定発話区間とが含まれる場合、該第1特定発話区間及び該第2特定発話区間をそのまま用いて前記基準時間を特定し、
前記原因分析対象区間の決定は、前記第1特定発話区間及び前記第2特定発話区間からそれぞれ得られる各基準時間を基準とする所定時間範囲をそれぞれ、前記原因分析対象区間に決定する、
付記11に記載の分析対象決定方法。
(付記15)
前記原因分析対象区間の決定は、前記第1特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間と前記第2特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間とが重複する区間を、前記原因分析対象区間に決定する付記13又は14に記載の分析対象決定方法。
(付記16)
前記特定発話区間の検出は、第1会話参加者の不満を表す前記複数の第1特定発話区間と、第2会話参加者の謝罪を表す前記第2特定発話区間とを検出し、
前記原因分析対象区間の決定は、前記第1会話参加者の不満に関する前記原因分析対象区間を決定する、
付記13又は15に記載の分析対象決定方法。
(付記17)
前記検出される複数の特定発話区間を個別に表わす複数の第1描画要素、及び、前記決定される前記原因分析対象区間を表す第2描画要素が、前記会話内の時系列に応じて並ぶ描画データを生成する、
ことを更に含む付記10から16のいずれか1つに記載の分析対象決定方法。
(付記18)
前記描画データの生成は、前記会話の複数の発話区間に関する複数の音声テキストデータが、発話区間毎に前記会話内の時系列に沿って表示され、前記原因分析対象区間に含まれる発話区間の音声テキストデータが他と区別可能に表示され、前記原因分析対象区間の識別情報が表示される描画データを生成し、該描画データに基づく表示画面上での該識別情報に対するユーザ操作に応じて、該識別情報で特定される原因分析対象区間に含まれる発話区間の音声テキストデータが表示されるような画面遷移を可能とする、
付記17に記載の分析対象決定方法。
(付記19)
少なくとも1つのコンピュータに、付記10から18のいずれか1つに記載の分析対象決定方法を実行させるプログラム。
(付記20)
付記19に記載のプログラムを記録したコンピュータが読み取り可能な記録媒体。
この出願は、2012年10月31日に出願された日本出願特願2012−240742号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (15)

  1. 会話の音声に対応するデータから、該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出する検出部と、
    前記検出部により検出される複数の特定発話区間に基づいて、前記会話の会話参加者の特定事象に関する原因分析対象区間であって、該複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、
    を備える分析対象決定装置。
  2. 前記検出部により検出される複数の特定発話区間が表す少なくとも1つの特定事象に応じた少なくとも1つの手法により、該複数の特定発話区間から少なくとも1つの基準時間を特定する特定部を更に備え、
    前記対象決定部は、前記特定部により特定される前記少なくとも1つの基準時間を基準とする所定時間範囲を前記原因分析対象区間に決定する、
    請求項1に記載の分析対象決定装置。
  3. 前記特定部は、前記検出部により検出される複数の特定発話区間に、前記会話の1人の会話参加者の1つの特定事象を表す複数の第1特定発話区間が含まれている場合、該複数の第1特定発話区間における、隣接する第1特定発話区間の間の時間幅が所定時間より短い第1特定発話区間の各ペアが結合されてなる区間内の中から、前記少なくとも1つの基準時間を特定する、
    請求項2に記載の分析対象決定装置。
  4. 前記特定部は、前記検出部により検出される複数の特定発話区間に、前記複数の第1特定発話区間と共に、前記複数の第1特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第2特定発話区間が更に含まれる場合、該第2特定発話区間をそのまま用いて基準時間を更に特定し、
    前記対象決定部は、前記第2特定発話区間から得られる基準時間を基準とする所定時間範囲を、前記原因分析対象区間に更に決定する、
    請求項3に記載の分析対象決定装置。
  5. 前記特定部は、前記検出部により検出される複数の特定発話区間に、前記会話の1人の会話参加者の1つの特定事象を表す第1特定発話区間と、該第1特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第2特定発話区間とが含まれる場合、該第1特定発話区間及び該第2特定発話区間をそのまま用いて前記少なくとも1つの基準時間を特定し、
    前記対象決定部は、前記第1特定発話区間及び前記第2特定発話区間からそれぞれ得られる各基準時間を基準とする所定時間範囲をそれぞれ、前記原因分析対象区間に決定する、
    請求項2に記載の分析対象決定装置。
  6. 前記対象決定部は、前記第1特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間と前記第2特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間とが重複する区間を、前記原因分析対象区間に決定する請求項4又は5に記載の分析対象決定装置。
  7. 前記検出部は、第1会話参加者の不満を表す前記複数の第1特定発話区間と、第2会話参加者の謝罪を表す前記第2特定発話区間とを検出し、
    前記対象決定部は、前記第1会話参加者の不満に関する前記原因分析対象区間を決定する、
    請求項4又は6に記載の分析対象決定装置。
  8. 前記検出部により検出される複数の特定発話区間を個別に表わす複数の第1描画要素、及び、前記対象決定部により決定される前記原因分析対象区間を表す第2描画要素が、前記会話内の時系列に応じて並ぶ描画データを生成する描画データ生成部、
    を更に備える請求項1から7のいずれか1項に記載の分析対象決定装置。
  9. 前記描画データ生成部は、前記会話の複数の発話区間に関する複数の音声テキストデータが、発話区間毎に前記会話内の時系列に沿って表示され、前記原因分析対象区間に含まれる発話区間の音声テキストデータが他と区別可能に表示され、前記原因分析対象区間の識別情報が表示される描画データを生成し、該描画データに基づく表示画面上での該識別情報に対するユーザ操作に応じて、該識別情報で特定される原因分析対象区間に含まれる発話区間の音声テキストデータが表示されるような画面遷移を可能とする、
    請求項8に記載の分析対象決定装置。
  10. 少なくとも1つのコンピュータにより実行される分析対象決定方法において、
    会話の音声に対応するデータから、該会話の1人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、該会話の1人の会話参加者の1つの特定事象を表す、複数の特定発話区間を検出し、
    前記検出される複数の特定発話区間に基づいて、前記会話の会話参加者の特定事象に関する原因分析対象区間であって、該複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する、
    ことを含む分析対象決定方法。
  11. 前記検出される複数の特定発話区間が表す少なくとも1つの特定事象に応じた少なくとも1つの手法により、該複数の特定発話区間から少なくとも1つの基準時間を特定し、
    前記特定される少なくとも1つの基準時間を基準とする所定時間範囲を前記原因分析対象区間に決定する、
    ことを更に含む請求項10に記載の分析対象決定方法。
  12. 前記基準時間の特定は、前記検出される複数の特定発話区間に、前記会話の1人の会話参加者の1つの特定事象を表す複数の第1特定発話区間が含まれている場合、該複数の第1特定発話区間における、隣接する第1特定発話区間の間の時間幅が所定時間より短い第1特定発話区間の各ペアが結合されてなる区間内の中から、前記少なくとも1つの基準時間を特定する、
    請求項11に記載の分析対象決定方法。
  13. 前記基準時間の特定は、前記検出される複数の特定発話区間に、前記複数の第1特定発話区間と共に、前記複数の第1特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第2特定発話区間が更に含まれる場合、該第2特定発話区間をそのまま用いて基準時間を更に特定し、
    前記原因分析対象区間の決定は、前記第2特定発話区間から得られる基準時間を基準とする所定時間範囲を、前記原因分析対象区間に更に決定する、
    請求項12に記載の分析対象決定方法。
  14. 前記原因分析対象区間の決定は、前記第1特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間と前記第2特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間とが重複する区間を、前記原因分析対象区間に決定する請求項13に記載の分析対象決定方法。
  15. 少なくとも1つのコンピュータに、請求項10から14のいずれか1項に記載の分析対象決定方法を実行させるプログラム。
JP2014544378A 2012-10-31 2013-09-19 分析対象決定装置及び分析対象決定方法 Active JP6358093B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012240742 2012-10-31
JP2012240742 2012-10-31
PCT/JP2013/075242 WO2014069120A1 (ja) 2012-10-31 2013-09-19 分析対象決定装置及び分析対象決定方法

Publications (2)

Publication Number Publication Date
JPWO2014069120A1 true JPWO2014069120A1 (ja) 2016-09-08
JP6358093B2 JP6358093B2 (ja) 2018-07-18

Family

ID=50627036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014544378A Active JP6358093B2 (ja) 2012-10-31 2013-09-19 分析対象決定装置及び分析対象決定方法

Country Status (3)

Country Link
US (1) US10083686B2 (ja)
JP (1) JP6358093B2 (ja)
WO (1) WO2014069120A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2014069076A1 (ja) * 2012-10-31 2016-09-08 日本電気株式会社 会話分析装置及び会話分析方法
JP6213476B2 (ja) * 2012-10-31 2017-10-18 日本電気株式会社 不満会話判定装置及び不満会話判定方法
JP6341092B2 (ja) * 2012-10-31 2018-06-13 日本電気株式会社 表現分類装置、表現分類方法、不満検出装置及び不満検出方法
US9645994B2 (en) * 2014-12-09 2017-05-09 Conduent Business Services, Llc Methods and systems for automatic analysis of conversations between customer care agents and customers
US10367855B2 (en) * 2015-01-27 2019-07-30 Tevnos LLC Switch controller for separating multiple portions of call
JP2017010309A (ja) 2015-06-23 2017-01-12 トヨタ自動車株式会社 意思決定支援装置および意思決定支援方法
JP2017009826A (ja) * 2015-06-23 2017-01-12 トヨタ自動車株式会社 グループ状態判定装置およびグループ状態判定方法
EP3185523B1 (en) * 2015-12-21 2018-10-10 Wipro Limited System and method for providing interaction between a user and an embodied conversational agent
US9934784B2 (en) 2016-06-30 2018-04-03 Paypal, Inc. Voice data processor for distinguishing multiple voice inputs
JP7080029B2 (ja) * 2017-04-10 2022-06-03 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報提供装置、情報提供方法及びコンピュータープログラム
JP6522695B2 (ja) * 2017-07-13 2019-05-29 本田技研工業株式会社 ライフログ活用システム、方法及びプログラム
US11399096B2 (en) * 2017-11-29 2022-07-26 Afiniti, Ltd. Techniques for data matching in a contact center system
JP7057229B2 (ja) * 2018-06-14 2022-04-19 ヤフー株式会社 評価装置、評価方法および評価プログラム
JP7144217B2 (ja) * 2018-06-29 2022-09-29 エヌ・ティ・ティ・コミュニケーションズ株式会社 分析装置、分析方法及びコンピュータープログラム
US11887622B2 (en) * 2018-09-14 2024-01-30 United States Department Of Veteran Affairs Mental health diagnostics using audio data
CN109192207A (zh) * 2018-09-17 2019-01-11 顺丰科技有限公司 语音通信装置、语音通信方法及系统、设备、存储介质
US11854575B1 (en) * 2019-09-30 2023-12-26 Amazon Technologies, Inc. System for presentation of sentiment data
US11521642B2 (en) * 2020-09-11 2022-12-06 Fidelity Information Services, Llc Systems and methods for classification and rating of calls based on voice and text analysis
JPWO2022249462A1 (ja) * 2021-05-28 2022-12-01

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11119791A (ja) * 1997-10-20 1999-04-30 Hitachi Ltd 音声感情認識システムおよび方法
JP2004037989A (ja) * 2002-07-05 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> 音声受付システム
WO2010041507A1 (ja) * 2008-10-10 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 会話における特定状況を抽出するシステムおよび方法
JP2010134233A (ja) * 2008-12-05 2010-06-17 Fujitsu Ltd 対話選別プログラム、対話選別装置、および対話選別方法
US20100332287A1 (en) * 2009-06-24 2010-12-30 International Business Machines Corporation System and method for real-time prediction of customer satisfaction
JP2012090337A (ja) * 2012-01-13 2012-05-10 Toshiba Corp 電子機器および表示処理方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7222075B2 (en) * 1999-08-31 2007-05-22 Accenture Llp Detecting emotions using voice signal analysis
JP3728172B2 (ja) * 2000-03-31 2005-12-21 キヤノン株式会社 音声合成方法および装置
JPWO2003107326A1 (ja) * 2002-06-12 2005-10-20 三菱電機株式会社 音声認識方法及びその装置
TWI255412B (en) * 2004-09-29 2006-05-21 Inventec Corp System and method for displaying an image according to audio signals
US20070067174A1 (en) * 2005-09-22 2007-03-22 International Business Machines Corporation Visual comparison of speech utterance waveforms in which syllables are indicated
US20070118372A1 (en) * 2005-11-23 2007-05-24 General Electric Company System and method for generating closed captions
KR20100028312A (ko) * 2008-09-04 2010-03-12 삼성전자주식회사 휴대 단말기의 파일 편집 방법 및 장치
US8843368B2 (en) * 2009-08-17 2014-09-23 At&T Intellectual Property I, L.P. Systems, computer-implemented methods, and tangible computer-readable storage media for transcription alignment
WO2011112640A2 (en) * 2010-03-08 2011-09-15 Vumanity Media Llc Generation of composited video programming
JP2011210100A (ja) 2010-03-30 2011-10-20 Seiko Epson Corp 接客データ記録装置、接客データ記録方法およびプログラム
JP2011237957A (ja) 2010-05-10 2011-11-24 Seiko Epson Corp 満足度算出装置、満足度算出方法およびプログラム
US9105042B2 (en) * 2013-02-07 2015-08-11 Verizon Patent And Licensing Inc. Customer sentiment analysis using recorded conversation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11119791A (ja) * 1997-10-20 1999-04-30 Hitachi Ltd 音声感情認識システムおよび方法
JP2004037989A (ja) * 2002-07-05 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> 音声受付システム
WO2010041507A1 (ja) * 2008-10-10 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 会話における特定状況を抽出するシステムおよび方法
JP2010134233A (ja) * 2008-12-05 2010-06-17 Fujitsu Ltd 対話選別プログラム、対話選別装置、および対話選別方法
US20100332287A1 (en) * 2009-06-24 2010-12-30 International Business Machines Corporation System and method for real-time prediction of customer satisfaction
JP2012090337A (ja) * 2012-01-13 2012-05-10 Toshiba Corp 電子機器および表示処理方法

Also Published As

Publication number Publication date
US20150287402A1 (en) 2015-10-08
WO2014069120A1 (ja) 2014-05-08
JP6358093B2 (ja) 2018-07-18
US10083686B2 (en) 2018-09-25

Similar Documents

Publication Publication Date Title
JP6358093B2 (ja) 分析対象決定装置及び分析対象決定方法
WO2014069076A1 (ja) 会話分析装置及び会話分析方法
JP6341092B2 (ja) 表現分類装置、表現分類方法、不満検出装置及び不満検出方法
US8494149B2 (en) Monitoring device, evaluation data selecting device, agent evaluation device, agent evaluation system, and program
JP2017508188A (ja) 適応型音声対話のための方法
JP2010113167A (ja) 有害顧客検知システム、その方法及び有害顧客検知プログラム
JP6213476B2 (ja) 不満会話判定装置及び不満会話判定方法
EP4086903A1 (en) System with post-conversation evaluation, electronic device, and related methods
JP6327252B2 (ja) 分析対象決定装置及び分析対象決定方法
JP6365304B2 (ja) 会話分析装置及び会話分析方法
JP5691174B2 (ja) オペレータ選定装置、オペレータ選定プログラム、オペレータ評価装置、オペレータ評価プログラム及びオペレータ評価方法
US10924611B2 (en) Voice recognition system and call evaluation setting method
JP2023076430A (ja) プログラム、情報処理システム及び情報処理方法
WO2014069443A1 (ja) 不満通話判定装置及び不満通話判定方法
WO2022208711A1 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
WO2023162009A1 (ja) 感情情報活用装置、感情情報活用方法及びプログラム
JP5679005B2 (ja) 会話異常検知装置、会話異常検知方法、及び会話異常検知プログラム
WO2014069444A1 (ja) 不満会話判定装置及び不満会話判定方法
KR20180034927A (ko) 통화 음성을 분석하는 통신 단말기
CN110784595A (zh) 一种来电信息的处理方法以及相关装置
JP2010008765A (ja) 音声認識方法、音声認識システム、および音声認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180604

R150 Certificate of patent or registration of utility model

Ref document number: 6358093

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150