JPWO2014069120A1

JPWO2014069120A1 - 分析対象決定装置及び分析対象決定方法

Info

Publication number: JPWO2014069120A1
Application number: JP2014544378A
Authority: JP
Inventors: 岡部　浩司; 浩司岡部; 祥史大西; 真寺尾; 真宏谷
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2012-10-31
Filing date: 2013-09-19
Publication date: 2016-09-08
Anticipated expiration: 2033-09-19
Also published as: US20150287402A1; WO2014069120A1; JP6358093B2; US10083686B2

Abstract

分析対象決定装置は、会話の音声に対応するデータから、当該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出する検出部と、検出部により検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、を有する。

Description

本発明は、会話の分析技術に関する。

会話を分析する技術の一例として、通話データを分析する技術がある。例えば、コールセンタ、コンタクトセンタなどと呼ばれる部署で行われる通話のデータが分析される。以降、このような、商品やサービスに関する問い合わせや苦情や注文といった顧客からの電話に応対する業務を専門的に行う部署をコンタクトセンタと表記する。

コンタクトセンタに寄せられる顧客の声には、顧客ニーズや満足度などが反映されている場合が多く、顧客との通話からそのような顧客の感情やニーズを抽出することは、リピータ顧客を増加させるために企業にとって大変重要である。このように通話者の感情等を抽出することが望まれる対象通話は、コンタクトセンタにおける通話だけに留まらない。

下記特許文献１には、通話の音声から店員発話区間を特定し、店員発話区間ごとに感情認識を行うことで、店員発話区間ごとに従業員満足度を算出し、算出された従業員満足度に基づいて総合的な満足度を算出する手法が提案されている。下記特許文献２には、接客の録音データに対する音声認識により、店員の話し掛け区間から音声キーワードを抽出し、この音声キーワードに関連付けられた収集タイミングに基づいて、顧客の話し掛け区間を特定し、この特定された顧客の話し掛け区間の音声データを対象に感情認識を行う手法が提案されている。

特開２０１１−２３７９５７号公報特開２０１１−２１０１００号公報

しかしながら、上述のような各提案手法では、店員発話区間や店員の話し掛け区間と所定の時間関係にある顧客の話し掛け区間が特定されるが、会話（通話）内ではこれら区間は多数存在する可能性が高い。例えば、顧客の怒りの感情のみに制限したとしても、顧客が不満を感じた会話において、その顧客の怒りを表す発話区間は、多数存在することが多い。

従って、上述のような各提案手法では、或る会話における、会話に参加する者（以降、会話参加者と表記する）の特定感情又は特定行動に関する原因を分析したい場合に、上述のように特定された多数の区間を分析対象とする必要があるため、分析効率が悪い。

本発明は、このような事情に鑑みてなされたものであり、会話における会話参加者の特定感情又は特定行動に関する原因分析の効率化を実現する技術を提供する。

本発明の各態様では、上述した課題を解決するために、それぞれ以下の構成を採用する。

第１の態様は、分析対象決定装置に関する。第１態様に係る分析対象決定装置は、会話の音声に対応するデータから、当該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出する検出部と、検出部により検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、を有する。

第２の態様は、少なくとも１つのコンピュータにより実行される分析対象決定方法に関する。第２態様に係る分析対象決定方法は、会話の音声に対応するデータから、当該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出し、検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する、ことを含む。

なお、本発明の他の態様としては、上記第１の態様における各構成を少なくとも１つのコンピュータに実現させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。

上記各態様によれば、会話における会話参加者の特定感情又は特定行動に関する原因分析の効率化を実現する技術を提供することができる。

上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。

第１実施形態におけるコンタクトセンタシステムの構成例を示す概念図である。第１実施形態における通話分析サーバの処理構成例を概念的に示す図である。第１実施形態における原因分析対象区間の決定の例を概念的に示す図である。第１実施形態における原因分析対象区間の決定の例を概念的に示す図である。第１実施形態における通話分析サーバの動作例を示すフローチャートである。実施例１における分析画面の一例を示す図である。実施例１における分析画面の一例を示す図である。実施例１における分析画面の一例を示す図である。実施例１における通話内容確認画面の例を示す図である。

以下、本発明の実施の形態について説明する。なお、以下に挙げる各実施形態はそれぞれ例示であり、本発明は以下の各実施形態の構成に限定されない。

本実施形態に係る分析対象決定装置は、会話の音声に対応するデータから、当該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出する検出部と、検出部により検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、を有する。

本実施形態に係る分析対象決定方法は、少なくとも１つのコンピュータにより実行され、会話の音声に対応するデータから、当該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、当該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出し、検出される複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する、ことを含む。

ここで、会話とは、２以上の話者が、言語の発声などによる意思表示によって、話をすることを意味する。会話には、銀行の窓口や店舗のレジ等のように、会話参加者が直接、話をする形態もあれば、通話機を用いた通話やテレビ会議等のように、離れた位置にいる会話参加者同士が話をする形態もあり得る。また、会話の音声中、一人の会話参加者が声を発している連続領域を発話又は発話区間と表記する。例えば、発話区間は、会話参加者の音声波形において所定値以上の振幅が継続している区間として検出される。通常の会話は、各会話参加者の発話区間、無声区間などから形成される。ここで、音声には、人間が発する声に加えて、人間以外の物から生じる音も含まれる。よって、発話及び発話区間は、音の区間であってもよい。

本実施形態では、会話の音声に対応するデータから、複数の特定発話区間が検出される。検出される複数の特定発話区間は、当該会話を形成する複数の発話区間の中の、当該会話の１人の会話参加者の１つの特定事象、又は、当該会話の１人の会話参加者の複数の特定事象、若しくは、当該会話の複数の会話参加者の複数の特定事象を表す発話区間である。ここで、特定事象とは、原因分析の対象となる会話参加者の特定事象、及び、その特定事象に関連するその会話参加者又は他の会話参加者の特定事象である。更に具体的には、特定事象とは、会話参加者の特定感情又は特定行動、若しくは、その会話参加者のその特定感情又はその特定行動に伴って他の会話参加者が持つ（行う）特定感情又は特定行動である。

ここで、特定感情とは、例えば、怒り、不満、満足感、興味、感動などのような人間が抱く心的状態の中の少なくとも１つである。特定行動とは、謝罪をする、通話を切断する、机を叩く、舌打ちをするなどといった上記特定感情に伴い行われかつ音声を生じさせる人間の動作の中の少なくとも１つである。上記特定発話区間の一例として、或る会話参加者が興味を表す発話区間が例示され、例えば、会話参加者の高いトーンでの「本当ですか」という発声区間が特定発話区間として検出される。また、他の例として、会話参加者の謝罪を表す発話区間が例示され、例えば、会話参加者が「申し訳ございません」と発声した区間が特定発話区間として検出される。なお、本実施形態において上記特定感情及び上記特定行動は制限されない。

このような特定発話区間は、会話参加者が特定事象を引き起こす会話内に、複数存在する場合が多い。従って、このように検出された全ての特定発話区間を分析対象とするのでは、効率が悪い。そこで、本実施形態では、このように検出された複数の特定発話区間に基づいて、当該会話の会話参加者の特定事象に関する原因分析対象区間であって、それら複数の特定発話区間の数よりも少ない数の原因分析対象区間が決定される。複数の特定発話区間からそれよりも数の少ない原因分析対象区間を決める方法は、後述する詳細実施形態及び実施例で示すように複数存在し得るため、後述の複数の方法や他の周知の手法を用いて、原因分析対象区間を決めることができる。

このように、本実施形態によれば、全ての特定発話区間を分析対象とするのではなく、それらの特定発話区間から推定される当該原因が存在する可能性が高い部分のみを分析対象とすることができるため、原因分析の効率を向上させることができる。

以下、上述の実施形態について更に詳細を説明する。以下には、詳細実施形態として、第１実施形態を例示する。以下の実施形態は、上述の分析対象決定装置及び分析対象決定方法をコンタクトセンタシステムに適用した場合の例である。よって、以下の詳細実施形態では、コンタクトセンタにおける、顧客とオペレータとの間の通話が、分析対象の会話に設定される例が示される。これにより、会話参加者は、通話者であり、顧客とオペレータである。また、以下の詳細実施形態では、顧客の不満（怒り）が、原因分析の対象の特定感情に設定される。但し、本実施形態は、原因分析の対象の特定感情を制限しない。例えば、顧客の満足感、顧客の関心度、オペレータのストレス感など他の特定感情が原因分析の対象に設定されてもよい。

また、上述の分析対象決定装置及び分析対象決定方法は、通話データを扱うコンタクトセンタシステムへの適用に限定されるものではなく、会話データを扱う様々な態様に適用可能である。例えば、それらは、コンタクトセンタ以外の社内の通話管理システムや、個人が所有する、ＰＣ（Personal Computer）、固定電話機、携帯電話機、タブレット端末、スマートフォン等の通話端末などに適用することも可能である。更に、会話データとしては、例えば、銀行の窓口や店舗のレジにおける、担当者と顧客の会話を示すデータなどが例示できる。以下、通話とは、或る通話者と或る通話者とがそれぞれ持つ通話機間が呼接続されてから呼切断されるまでの間の呼を意味する。

［第１実施形態］
〔システム構成〕
図１は、第１実施形態におけるコンタクトセンタシステム１の構成例を示す概念図である。第１実施形態におけるコンタクトセンタシステム１は、交換機（ＰＢＸ）５、複数のオペレータ電話機６、複数のオペレータ端末７、ファイルサーバ９、通話分析サーバ１０等を有する。通話分析サーバ１０は、上述の実施形態における分析対象決定装置に相当する構成を含む。

交換機５は、通信網２を介して、顧客により利用される、ＰＣ、固定電話機、携帯電話機、タブレット端末、スマートフォン等の通話端末（顧客電話機）３と通信可能に接続されている。通信網２は、インターネットやＰＳＴＮ（Public Switched Telephone Network）等のような公衆網、無線通信ネットワーク等である。更に、交換機５は、コンタクトセンタの各オペレータが用いる各オペレータ電話機６とそれぞれ接続される。交換機５は、顧客からの呼を受け、その呼に応じたオペレータのオペレータ電話機６にその呼を接続する。

各オペレータは、オペレータ端末７をそれぞれ用いる。各オペレータ端末７は、コンタクトセンタシステム１内の通信網８（ＬＡＮ（Local Area Network）等）に接続される、ＰＣ等のような汎用コンピュータである。例えば、各オペレータ端末７は、各オペレータと顧客との間の通話における顧客の音声データ及びオペレータの音声データをそれぞれ録音する。顧客の音声データとオペレータの音声データとは、混合状態から所定の音声処理により分離されて生成されてもよい。なお、本実施形態は、このような音声データの録音手法及び録音主体を限定しない。各音声データの生成は、オペレータ端末７以外の他の装置（図示せず）により行われてもよい。

ファイルサーバ９は、一般的なサーバコンピュータにより実現される。ファイルサーバ９は、顧客とオペレータとの間の各通話の通話データを、各通話の識別情報と共にそれぞれ格納する。各通話データには、時間情報、顧客の音声データとオペレータの音声データとのペアなどがそれぞれ含まれる。各音声データには、顧客及びオペレータの声に加えて、顧客電話機３及びオペレータ端末７から入力される音も含まれてもよい。ファイルサーバ９は、顧客及びオペレータの各音声を録音する他の装置（各オペレータ端末７等）から、顧客の音声データとオペレータの音声データとを取得する。

通話分析サーバ１０は、ファイルサーバ９に格納される各通話データをそれぞれ分析し、ユーザの要求に応じた分析結果を出力する。通話分析サーバ１０は、自身が持つ表示装置に表示させてもよいし、ＷＥＢサーバ機能により当該分析結果をユーザ端末上のブラウザに表示させるようにしてもよい。

通話分析サーバ１０は、図１に示されるように、ハードウェア構成として、ＣＰＵ（Central Processing Unit）１１、メモリ１２、入出力インタフェース（Ｉ／Ｆ）１３、通信装置１４等を有する。メモリ１２は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、ハードディスク、可搬型記憶媒体等である。入出力Ｉ／Ｆ１３は、キーボード、マウス等のようなユーザ操作の入力を受け付ける装置、表示装置やプリンタ等のようなユーザに情報を提供する装置などと接続される。通信装置１４は、通信網８を介して、ファイルサーバ９などと通信を行う。なお、通話分析サーバ１０のハードウェア構成は制限されない。

〔処理構成〕
図２は、第１実施形態における通話分析サーバ１０の処理構成例を概念的に示す図である。第１実施形態における通話分析サーバ１０は、通話データ取得部２０、条件取得部２１、検出部２２、特定部２３、対象決定部２４、表示処理部２５等を有する。これら各処理部は、例えば、ＣＰＵ１１によりメモリ１２に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、ＣＤ（Compact Disc）、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力Ｉ／Ｆ１３を介してインストールされ、メモリ１２に格納されてもよい。

通話データ取得部２０は、ファイルサーバ９から、分析対象となる複数通話の通話データを各通話の識別情報と共にそれぞれ取得する。それら複数の通話データは、通話分析サーバ１０とファイルサーバ９との間の通信により取得されてもよいし、可搬型記録媒体を介して取得されてもよい。

条件取得部２１は、分析対象の通話を絞り込むための条件（以降、通話条件と表記する）、及び、特定発話区間を特定するための条件（以降、区間条件と表記する）の少なくとも一方を表示処理部２５から取得する。但し、区間条件は、特定発話区間が検出されない通話を除外するための条件としても作用する。特定発話区間とは、各通話を形成する複数の発話区間の中の、顧客の不満分析の対象区間を決める上での元となる発話区間である。

通話条件及び区間条件はいずれも複数指定されてもよい。各通話条件には、例えば、キーワード、表現、通話者の特定行動に伴う音などの１つがそれぞれ指定される。各区間条件には、上述の実施形態における、１人の通話者の１つの特定事象がそれぞれ指定される。言い換えれば、各区間条件には、特定感情又は特定行動、及び、それらの主体がそれぞれ指定される。本実施形態では、原因分析の対象が顧客の不満であるため、通話条件には、顧客の不満を表す各種事象が指定され、区間条件には、顧客の怒り（不満）感情、オペレータの謝罪行動などが指定される。但し、本実施形態は、通話条件自体及び区間条件自体を制限しない。

検出部２２は、条件取得部２１により通話条件が取得されている場合には、通話データ取得部２０により取得された複数の通話データの中から、全ての通話条件に合致する通話データを分析対象として抽出する。更に、検出部２２は、条件取得部２１により区間条件が取得されている場合には、全ての通話条件に合致する各通話データにおいて、各区間条件に応じた特定発話区間をそれぞれ検出し、この特定発話区間を含まない通話データを分析対象から除外する。

検出部２２は、音声認識部２７、特定表現テーブル２８、感情認識部２９等を有する。これら各処理部についても、他の処理部と同様に、プログラムの実行により実現される。検出部２２は、音声認識部２７及び感情認識部２９の少なくとも一方を実行することにより、通話条件に合致する通話データの抽出、区間条件に応じた特定発話区間の検出などを行う。

検出部２２は、音声認識部２７及び感情認識部２９の少なくとも一方を実行する前に、通話データに含まれるオペレータ及び顧客の各音声データから、オペレータ及び顧客の各発話区間をそれぞれ検出するようにしてもよい。この検出により、検出部２２は、各発話区間の始端時間及び終端時間を取得する。本実施形態は、発話区間の具体的検出方法を制限しない。発話区間は、音声認識部２７の音声認識処理によって検出されてもよい。また、通話データ取得部２０が、通話データと共に、その通話データの発話区間の情報を取得するようにしてもよい。また、オペレータの発話区間には、オペレータ端末７により入力された音も含まれ、顧客の発話区間には、顧客電話機３により入力された音も含まれてもよい。

音声認識部２７は、通話データに含まれるオペレータ及び顧客の各音声データの各発話区間に対して音声認識処理をそれぞれ行う。これにより、音声認識部２７は、当該通話データから、オペレータ音声及び顧客音声に対応する各音声テキストデータ及び各発声時間データをそれぞれ取得する。ここで、音声テキストデータとは、顧客又はオペレータにより発された声がテキスト化された文字データである。各発声時間データは、各音声テキストデータの発声時間をそれぞれ示し、各音声テキストデータが得られた各発話区間の始端時間及び終端時間をそれぞれ含む。なお、本実施形態では、この音声認識処理には、周知な手法が利用されればよく、その音声認識処理自体及びその音声認識処理で利用される各種音声認識パラメータを制限しない。

また、音声認識部２７は、特定行動音検出部３１を有するようにしてもよい。特定行動音検出部３１は、途中で通話が切断された事象や、所定音量以上の通話切断音等、通話条件として指定され得る、顧客の不満を表す事象を認識する。特定行動音検出部３１は、切断音の音声特徴情報を予め保持し、この情報を用いて切断音を認識するようにしてもよいし、通話データと共に送られる通話切断時間のデータに基づいて、途中で通話が切断された事象を認識するようにしてもよい。

また、音声認識部２７は、周知の手法を用いて、音声データを用いて顧客の不満を表す通話データを特定するようにしてもよい。本実施形態は、音声認識部２７による音声認識処理自体を制限しない。

特定表現テーブル２８は、通話条件及び区間条件で指定され得る特定表現データを保持する。特定表現データは、文字データとして保持される。また、特定表現テーブル２８は、お礼表現データ及び謝罪表現データをお礼表現と謝罪表現とに区別され得る態様で特定表現データとして保持する。

感情認識部２９は、条件取得部２１により取得される区間条件に基づいて、通話データに含まれるオペレータ及び顧客の少なくとも一方の音声データの各発話区間に対して感情認識処理をそれぞれ行う。感情認識部２９は、各発話区間における音声から韻律的特徴情報を取得し、この韻律的特徴情報を用いて、各発話区間が当該区間条件で指定される特定事象を表すか否かを判定する。韻律的特徴情報としては、例えば、基本周波数や音声パワー等が利用される。なお、本実施形態では、この感情認識処理には、周知な手法が利用されればよく（以下の参考例を参照）、感情認識処理自体は制限されない。
参考例：野本済央ほか、「韻律情報と発話の時間的関係性を用いた対話音声からの怒り感情推定」、日本音響学会講演論文集、８９から９２頁、２０１０年３月

感情認識部２９は、ＳＶＭ（Support Vector Machine）の識別モデルを用いて、各発話区間が当該区間条件で指定される通話者の特定事象を表すか否かを判定するようにしてもよい。具体的には、当該区間条件として「顧客の怒り」が指定され得る場合、感情認識部２９は、「怒り」と「平常」の発話区間の韻律的特徴情報を学習データとして与え、「怒り」と「平常」とを識別するように学習された識別モデルを予め保持するようにしてもよい。また、当該区間条件として「オペレータの通常謝罪」と「オペレータの深謝」とが指定され得る場合、感情認識部２９は、「オペレータの通常謝罪」と「オペレータの深謝」の発話区間の韻律的特徴情報を学習データとして与え、それらを識別するように学習された識別モデルを予め保持するようにしてもよい。感情認識部２９は、取得された区間条件に対応する識別モデルを選択し、この選択された識別モデルに、各発話区間の韻律的特徴情報を与えることにより、各発話区間が当該区間条件で指定される通話者の特定事象を表すか否かを判定する。

検出部２２は、例えば、通話条件として「顧客のお礼なし」が与えられた場合、音声認識部２７の実行により得られた、顧客の各発話区間の音声テキストデータに、特定表現テーブル２８に保持されるお礼表現データが含まれない通話データを、通話条件に合致する通話データとして抽出する。また、検出部２２は、通話条件として「途中で通話が切断された事象」が与えられた場合、顧客の音声データに対する音声認識部２７の上述のような処理により、各通話に関しその事象の有無を判定し、その事象を含む通話データを分析対象として抽出する。また、検出部２２は、区間条件として「顧客の怒り」が与えられた場合、顧客の音声データに関し感情認識部２９により「怒り」を表すと判定された各発話区間を特定発話区間としてそれぞれ特定すると共に、特定発話区間が検出されなかった通話データを分析対象から除外する。

特定部２３は、検出部２２により検出された各通話の特定発話区間に関し、特定発話区間が表す少なくとも１つの特定事象に応じた手法により、少なくとも１つの基準時間を特定する。例えば、特定部２３は、区間条件毎に決められた基準時間の特定手法をそれぞれ持つ。

特定部２３は、複数の特定発話区間が検出されるような区間条件については、次のような特定方法を実行する。特定部２３は、１人の通話者の１つの特定事象を表す複数の第１特定発話区間における、隣接する第１特定発話区間の間の時間幅が所定時間より短い第１特定発話区間の各ペアが結合されてなる区間内の中から、少なくとも１つの基準時間を特定する。

一方、特定部２３は、他の区間条件に応じて検出部２２により検出された特定発話区間については、その特定発話区間をそのまま用いて、基準時間を特定する。基準時間の特定では、上記所定時間が区間条件毎に切り換えられてもよい。所定時間が０（ゼロ）や値無し（ＮＵＬＬ）に設定されていれば、検出部２２により検出された特定発話区間がそのまま用いられて、基準時間が特定されるようにしてもよい。

本発明者らは、１つの区間条件を満たす第１特定発話区間、即ち、１人の会話参加者（通話者）の１つの特定事象を表す特定発話区間が、連続的に生じている場合に、その全ての特定発話区間にその特定事象に関する原因が存在するわけではないことを見出した。本発明者らは、連続的に生じている複数の特定発話区間の中の或る時間の周辺に、その特定事象に関する原因が存在する可能性が高いことを導出した。例えば、会話参加者である顧客の不満を表す発話区間が連続的に生じている場合に、その全ての発話区間の周辺に顧客の不満の原因が存在するわけではなく、その連続的に生じている不満を表す複数の発話区間の中の先頭周辺に、その不満の原因が存在する可能性が高いことが導出された。また、連続的に生じている怒りを表す複数の発話区間の中の終端周辺に、満足感の原因が存在する可能性がある。

更に、本発明者らは、頻出することは少ないが、その前後に、原因分析の対象となる特定事象の原因が存在する可能性が高い発話区間があることを見出した。例えば、会話参加者の謝罪を表す発話区間がこのような特性を持つことが導出された。更に、会話参加者の謝罪にも、軽い謝罪と深謝とが存在し、深謝を表す発話区間のほうが、軽い謝罪を表す発話区間よりも、上述のような特性傾向が強いことが見出された。そこで、本実施形態では、上述のように、特定部２３は、区間条件毎に、基準時間の特定方法を切り替える。例えば、特定部２３は、顧客の不満やオペレータの軽い謝罪を表す特定発話区間については上述の第１特定発話区間と同様の特定方法を用いて基準時間を特定し、オペレータの深謝を表す特定発話区間については上述の第２特定発話区間と同様の特定方法を用いて基準時間を特定する。第１特定発話区間が顧客の不満を表す場合、隣接する第１特定発話区間の間の時間幅が所定時間より短い第１特定発話区間の各ペアが結合されてなる区間内の先頭に位置する第１特定発話区間に基づいて、少なくとも１つの基準時間が特定される。なお、基準時間の特定方法の切り替えは、顧客の怒りとオペレータの謝罪との関係のみに制限されない。

本実施形態では、第１特定発話区間又は第２特定発話区間を用いた基準時間の特定手法は制限されない。例えば、特定発話区間の始端時間又は終端時間が基準時間に設定されてもよいし、特定発話区間内のいずれか１つの時間が基準時間に設定されてもよい。また、特定発話区間内のいずれか１つの時間に或る所定時間を加算した時間が基準時間に設定されてもよい。また、特定発話区間の始端時間が基準時間Ａ、終端時間が基準時間Ｂといったように、特定発話区間内の複数の時間が複数種類の基準時間に設定されてもよい。

対象決定部２４は、特定部２３により特定される基準時間を基準とする所定時間範囲を顧客の不満の原因分析対象区間に決定する。原因分析対象区間は、基準時間を始端とした所定時間範囲に決定されてもよいし、基準時間を終端とした所定時間範囲に決定されてもよいし、基準時間を中心点とした所定範囲に決定されてもよい。また、原因分析対象区間は、複数種類の基準時間が設定された場合、基準時間Ａの所定時間だけ前の時刻を始端とし、基準時間Ｂの所定時間だけ後の時刻を終端とする範囲に決定されてもよい。

対象決定部２４は、複数の区間条件が指定されている場合、各区間条件から得られる各基準時間に基づいて決定される複数の原因分析対象区間で重複する範囲を、最終的に、その通話の顧客の不満の原因分析対象区間に決定する。原因分析対象区間を決めるための上記所定時間範囲は、区間条件毎に異なる値に設定されてもよいし、同値に設定されてもよい。対象決定部２４は、検出部２２により抽出された各通話データの中で、対象決定部２４により最終的な原因分析の対象区間が設定されなかった通話データを分析対象から除外する。

図３は、第１実施形態における原因分析対象区間の決定の例を概念的に示す図である。図３では、基準時間を特定するために用いられる上記所定時間幅がｘで示されており、原因分析対象区間を決定するために用いられる上記所定時間範囲が（ａ＋ｂ）で示される。図３の例によれば、結合されてなる区間内の先頭の特定発話区間の始端時間が基準時間に決定され、その基準時間を中心時点として、前ａ秒、後ろｂ秒の範囲が原因分析対象区間に決定される。なお、本実施形態は、原因分析対象区間の決定方法をこのような方法に制限しない。時間幅ａ及びｂを同一値にしてもよい。

図４は、第１実施形態における原因分析対象区間の決定の例を概念的に示す図である。図４の例では、顧客（ＣＵ）の怒りとオペレータ（ＯＰ）の深謝との２つの区間条件に関し、複数の特定発話区間がそれぞれ検出され、かつ、基準時間がそれぞれ特定されている。更に、図４の例によれば、顧客の怒りについては、基準時間を中心に前ａ秒、後ろｂ秒の時間範囲が原因分析対象区間に決定され、オペレータの深謝については、基準時間を中心に前ｍ秒、後ろｎ秒の時間範囲が原因分析対象区間に決定される。最終的に、顧客の怒り及びオペレータの深謝に対応する各対象区間が重複する範囲が、顧客の不満に関する原因分析対象区間に決定される。

表示処理部２５は、検出部２２により検出される複数の特定発話区間を個別に表わす複数の第１描画要素、及び、対象決定部２４により決定される原因分析の対象区間を表す第２描画要素が、分析対象として抽出された各通話に関し、通話内の時系列に応じてそれぞれ並ぶ描画データを生成する。表示処理部２５は、この描画データに基づいて分析結果画面を通話分析サーバ１０に入出力Ｉ／Ｆ１３を介して接続される表示装置に表示させる。また、表示処理部２５は、ＷＥＢサーバ機能を持ち、この描画データをＷＥＢクライアント装置に表示させるようにしてもよい。更に、表示処理部２５は、通話条件及び区間条件をユーザに指定させるための入力画面を表示させる。これにより、条件取得部２１は、この入力画面を介してユーザに指定された通話条件及び区間条件を取得する。

〔動作例〕
以下、第１実施形態における分析対象決定方法について図５を用いて説明する。図５は、第１実施形態における通話分析サーバ１０の動作例を示すフローチャートである。ここで、通話分析サーバ１０は、複数の通話データを既に取得している。例えば、通話分析サーバ１０は、ファイルサーバ９に格納される複数の通話データを取得している。

通話分析サーバ１０は、通話条件及び区間条件の少なくとも一方を取得する（Ｓ５０）。通話分析サーバ１０は、入力画面を表示装置に表示させることにより、この入力画面を介して入力される通話条件及び区間条件の少なくとも一方を取得する。

通話分析サーバ１０は、（Ｓ５０）で取得された通話条件及び区間条件に基づいて、音声認識処理の要否を判定する（Ｓ５１）。通話分析サーバ１０は、予め、各通話条件及び各区間条件について音声認識処理が必要か否かの情報をそれぞれ保持する。

通話分析サーバ１０は、（Ｓ５１）の判定に応じて（Ｓ５１；ＹＥＳ）、取得されている複数の通話データに対して音声認識処理を実行する（Ｓ５３）。この音声認識処理は、上述したように、各発話区間の音声データから音声テキストデータを取得する処理、途中で通話が切断された事象、所定音量以上の通話切断音等を音声データから検出する処理などを含む。通話分析サーバ１０は、（Ｓ５０）で取得された条件に基づいて、具体的な音声認識処理を決定する。

通話分析サーバ１０は、（Ｓ５２）の音声認識処理の結果に基づいて、（Ｓ５２）で音声認識処理の対象とされた各通話データに関し、（Ｓ５０）で取得された区間条件により示される通話者の特定事象を表わす特定発話区間を検出する（Ｓ５３）。（Ｓ５０）において、音声認識処理を必要とする区間条件が取得されていない場合には、（Ｓ５３）は実行されない。

通話分析サーバ１０は、（Ｓ５２）の音声認識処理の結果に基づいて、（Ｓ５２）で音声認識処理の対象とされた複数の通話データの中で、（Ｓ５０）で取得された条件を満たさない通話データ、及び、（Ｓ５３）の実行により特定発話区間が検出されなかった通話データを分析対象から除外する（Ｓ５４）。

続いて、通話分析サーバ１０は、（Ｓ５０）で取得された条件に基づいて、感情認識処理の要否を判定する（Ｓ５５）。通話分析サーバ１０は、予め、各通話条件及び各区間条件について感情認識処理が必要か否かの情報をそれぞれ保持する。

通話分析サーバ１０は、（Ｓ５５）の判定に応じて（Ｓ５５；ＹＥＳ）、予め取得されていた複数の通話データ、又は、（Ｓ５４）で分析対象として抽出された通話データに対して、感情認識処理を実行する（Ｓ５６）。感情認識処理は、上述したように、各発話区間が（Ｓ５０）で取得された条件に対応する通話者の特定事象を表すか否かを判定する。例えば、通話分析サーバ１０は、（Ｓ５０）で取得された条件に対応する識別モデルを選択し、この選択された識別モデルを用いて感情認識処理を行う。

通話分析サーバ１０は、（Ｓ５６）の感情認識処理の結果に基づいて、（Ｓ５６）で感情認識処理の対象とされた各通話データに関し、区間条件に対応する通話者の特定事象を表す特定発話区間をそれぞれ検出する（Ｓ５７）。通話分析サーバ１０は、（Ｓ５７）の検出結果に基づいて、通話データを絞り込む（Ｓ５８）。言い換えれば、通話分析サーバ１０は、（Ｓ５７）で特定発話区間が検出されなかった通話データを分析対象から除外する。

通話分析サーバ１０は、ここまでの処理で、検出された特定発話区間が存在するか否かを判定する（Ｓ５９）。通話分析サーバ１０は、特定発話区間が存在する場合（Ｓ５９；ＹＥＳ）、各区間条件に関し、その区間条件に応じた特定手法を用いて、各通話の特定発話区間から少なくとも１つの基準時間をそれぞれ特定する（Ｓ６０）。具体的特定手法については、上述のとおりである。

通話分析サーバ１０は、各通話の各基準時間に基づいて、各通話に関し、顧客の不満の原因分析対象区間をそれぞれ決定する（Ｓ６１）。このとき、複数の区間条件が取得されている場合、通話分析サーバ１０は、各区間条件に対応する各原因分析対象区間で重複する区間を最終的な不満の原因分析対象区間に決定する。

通話分析サーバ１０は、ここまでの処理で分析対象として抽出された各通話データ、又は、予め取得されていた各通話データに対応する各通話に関し、（Ｓ５３）及び（Ｓ５７）の少なくとも一方で検出された特定発話区間を個別に表わす複数の第１描画要素、及び、（Ｓ６１）で決定された原因分析対象区間を表す第２描画要素が通話内の時系列に応じてそれぞれ並ぶ描画データを生成する。通話分析サーバ１０は、この描画データに基づいて分析結果画面を表示装置に表示させる（Ｓ６２）。

なお、図５に例示されるフローチャートでは、複数の工程（処理）が順番に記載されているが、本実施形態で実行される工程の実行順序は、その記載の順番に制限されない。例えば、複数の区間条件が取得された場合には、各区間条件に関し、工程（Ｓ５２）から工程（Ｓ５４）と、工程（Ｓ５６）から工程（Ｓ５８）とを並行に実行してもよい。

〔第１実施形態の作用及び効果〕
上述したように第１実施形態では、取得された各区間条件について、その区間条件が示す１人の通話者の１つの特定事象を表す特定発話区間がそれぞれ検出される。このような特定発話区間は、通話者が特定事象を引き起こす通話内に、複数存在する場合が多い。従って、このように検出された全ての特定発話区間を分析対象とするのでは、効率が悪い。そこで、第１実施形態では、区間条件毎、即ち、通話者の特定事象毎に予め決められている特定手法により、当該複数の特定発話区間から少なくとも１つの基準時間が特定される。これにより、顧客の怒りのような連続的に生じる複数の特定発話区間については、それらが結合されてなる区間内の或る時間の周辺（顧客の怒りの場合には先頭周辺）が基準点（基準時間）とされ、オペレータの深謝のような頻出しないが顧客の不満の原因を示す箇所に近い可能性が高い特定発話区間については、それら個々が基準点（基準時間）とされる。そして、この基準時間を基準とする所定時間範囲が、顧客の不満の原因分析対象区間に決定される。

このように、第１実施形態によれば、通話者の特定事象を表す全ての特定発話区間を分析対象とするのではなく、顧客の不満に関する原因が存在する可能性が高い部分のみを分析対象とすることができるため、原因分析の効率を向上させることができる。

更に、第１実施形態では、原因分析対象区間を決めるにあたり、上述した、顧客の怒りやオペレータの深謝のような通話者の特定事象の発生特性が反映された情報処理が実行される。更に、複数の区間条件が指定されている場合には、各区間条件に対応する各特定発話区間から決定される原因分析対象区間が重複する範囲が最終的な原因分析対象区間に決定される。

これにより、第１実施形態によれば、決定された原因分析対象区間に顧客の不満の原因となる事象が含まれる可能性を高めることが出来る。

更に、第１実施形態では、各通話に関し、少なくとも１人の通話者の少なくとも１つの特定事象を表す複数の特定発話区間、及び、これら複数の特定発話区間から得られた顧客の不満の原因分析対象区間が共にそれぞれ出力される。従って、第１実施形態によれば、各通話に関し、通話者の特定事象を表す特定発話区間の分布を確認しつつ、顧客の不満に関する原因分析対象区間の位置を同時に確認することができるため、顧客の不満に関する通話全体の概要やその原因分析対象区間周辺の発話状況を把握し易くすることができる。更に、第１実施形態によれば、どの通話者のどの特定事象がより顧客の不満の原因箇所の特定に役立つのかといった分析もし易くなる。

以下に実施例を挙げ、上述の第１実施形態を更に詳細に説明する。但し、本発明は以下の実施例から何ら制限を受けない。

《画面例》
図６、図７及び図８は、実施例１における分析画面の一例をそれぞれ示す図である。図６から図８に示される分析画面は、上述の第１実施形態における表示処理部２５により表示される分析結果画面、及び、通話条件及び区間条件の入力画面を含む。この分析画面は、通話条件の指定部Ｇ５１、区間条件の指定部Ｇ５２、分析実行ボタンＧ５３、分析結果表示部Ｇ５５などを含む。要素Ｇ５１、Ｇ５２及びＧ５３が上記入力画面に相当し、要素Ｇ５５が上記分析結果画面に相当する。

通話条件の指定部Ｇ５１及び区間条件の指定部Ｇ５２では、分析属性として、各条件が、音声テキストデータのみを用いて判定されるか、音声データを用いて判定されるかが区別可能に表わされている。この分析属性に応じて、通話条件における「キーワード」及び「ＣＵお礼なし」、区間条件における「ＯＰ謝罪（「申し訳」表現）」については、音声テキストデータのみを用いて判定される。また、通話条件における「ＣＵ怒り（「電話切断音」振る舞い）」、区間条件における「ＯＰ謝罪（深謝）」及び「ＣＵ怒り（「怒り」感情）」については、音声データを用いて判定される。ここで、ＣＵは顧客を示し、ＯＰはオペレータを示す。

分析結果表示部Ｇ５５は、通話データ取得部２０により取得された複数の通話データの中の、検出部２２により分析対象として抽出された各通話データが示す各通話を行毎に表わす。分析結果表示部Ｇ５５の各通話欄の左端には、各通話が行われた日時が表示され、各通話の時系列が紙面の左から右方向に表わされる。更に、分析結果表示部Ｇ５５内の各通話を示す欄には、各区間条件に関しそれぞれ検出された各特定発話区間、及び、通話条件として与えられるキーワードを含む発話区間が、各行に分かれてそれぞれ表わされる。図６では、キーワードを含む発話区間を示す領域が、各通話欄の最上位行に、着色されて表わされている（図６の符号Ｇ５５−１）。図７では、キーワードを含む発話区間を示す領域（図６の符号Ｇ５５−１）に加えて、「ＣＵ怒り（「怒り」感情）」を表す特定発話区間を示す領域が、各通話欄の最下位行に、着色されて表わされている（図７の符号Ｇ５５−２）。図８では、キーワードを含む発話区間を示す領域（図６の符号Ｇ５５−１）、及び、「ＣＵ怒り（「怒り」感情）」を表す特定発話区間を示す領域（図７の符号Ｇ５５−２）に加えて、「ＯＰ謝罪（「深謝」状況）」を表す特定発話区間を示す領域が、各通話欄の下位から２行目に、着色されて表わされている（図８の符号Ｇ５５−３）。

更に、図７及び図８に示されるように、分析結果表示部Ｇ５５内の各通話欄には、対象決定部２４により決定された顧客の不満に関する原因分析対象区間が、その時間範囲を示すようにそれぞれ表示されている（Ｇ５５−５）。更に、各通信欄に表わされる原因分析対象区間には、通話の時系列順に、原因分析対象区間を識別するための識別情報（図７及び図８の例では数値）が設定されている。

このように、実施例１において表示される分析結果画面では、各通話に関し、区間条件に合致する特定発話区間と同時に、その特定発話区間に基づいて決められる原因分析の対象区間が表示される。従って、実施例１によれば、各通話に関し、通話者の特定事象を表す特定発話区間の分布を確認しつつ、その特定感情に関する原因分析対象区間の位置を同時に確認することができるため、顧客の不満に関する通話全体の概要やその原因発生区間周辺の発話状況を把握し易くなる。

表示処理部２５は、図６から図８に示される分析画面に加えて、図９に示されるような、更に通話内容を具体的に確認するための画面を表示させるようにしてもよい。図９は、実施例１における通話内容確認画面の例を示す図である。例えば、表示処理部２５は、図６から図８に示される分析画面において或る通話が選択されると、その選択された通話に関し、この通話内容確認画面を表示させる。

図９の例では、画面上部にその通話が行われた日時及び問い合わせ内容が示される。問い合わせ内容は、例えば、オペレータ端末７を用いてオペレータにより入力されたデータであり、各通話データと共に通話データ取得部２０により取得される。更に、通話内容確認画面は、発話情報表示部Ｇ８１を含む。発話情報表示部Ｇ８１は、各発話区間を各行に表わし、各発話区間に関し、始端時間Ｇ８１−１、発声元の通話者（ＯＰかＣＵか）Ｇ８１−２、音声テキストデータＧ８１−３をそれぞれ表示する。音声テキストデータＧ８１−３は、上述の音声認識部２７により取得されるデータである。発話情報表示部Ｇ８１は、全ての発話区間の情報が表示しきれない場合には、画面スクロールにより全ての発話区間の情報が表示されるように形成される。

更に、対象決定部２４により決定された顧客の不満に関する原因分析対象区間に含まれる発話区間は、他の発話区間と区別可能に表示される。図９の例では、その発話区間は、太枠表示されている（Ｇ８１−５）。また、図９には表れていないが、各区間条件に対応する各特定発話区間がそれぞれ区別可能に着色されて表示される。これにより、ユーザは、原因分析対象区間及びその周辺の実際の発声内容を確認することにより、容易に、顧客を不満にさせた具体的な原因を特定することができる。更に、この通話内容確認画面には、対象決定部２４により決定された顧客の不満に関する原因分析対象区間の識別情報が列挙されている（符号Ｇ８２）。表示処理部２５は、識別情報の選択操作を検出し、選択された識別情報により特定される原因分析対象区間に含まれる発話区間が表示されるように、発話情報表示部Ｇ８１を自動スクロールさせる。更に、発話情報表示部Ｇ８１の各行が選択されると、その選択された行に対応する発話区間の音声が再生されるようにすることも可能である。これにより、ユーザは、通話分析サーバ１０により顧客の不満の原因となると推定された発話区間及びその周辺の発話内容を即座に確認することができ、効率よく原因分析作業を行なうことができる。

以下、図６、図７及び図８の各々について、分析結果表示部Ｇ５５、即ち、分析結果画面を表示させるための通話分析サーバ１０の動作例をそれぞれ説明する。

図６では、「キーボード」というキーワードが通話条件として指定されている（通話条件の指定部Ｇ５１）。これにより、通話分析サーバ１０は、「キーボード」というキーワードを通話条件として取得する。続いて、通話分析サーバ１０は、音声認識部２７の実行により得られた、顧客の各発話区間の音声テキストデータの中に、そのキーワード「キーボード」が含まれる通話データを、通話条件に合致する通話データとして抽出する。これにより、分析結果表示部Ｇ５５には、そのキーワードを含む発話区間を持つ通話のみが表示される。このとき、通話分析サーバ１０は、そのキーワードを含む発話区間を特定し（特定発話区間とは呼ばない）、これら各通話に関し、そのキーワードを含む発話区間を示す領域を着色して表示させる。

図７では、図６の通話条件（キーワード「キーボード」）に加えて、「ＣＵ怒り（「怒り」感情）」が区間条件として指定されている（区間条件の指定部Ｇ５２）。これにより、通話分析サーバ１０は、通話条件（キーワード「キーボード」）、及び、区間条件「ＣＵ怒り（「怒り」感情）」を取得する。通話分析サーバ１０は、音声認識部２７の実行により得られた、顧客の各発話区間の音声テキストデータの中に、そのキーワード「キーボード」が含まれる通話データを、通話条件に合致する通話データとして抽出する。更に、通話分析サーバ１０は、抽出された各通話データの顧客の各発話区間に関し感情認識部２９により「怒り」を表すと判定された各発話区間を特定発話区間としてそれぞれ特定すると共に、特定発話区間が検出されなかった通話データを抽出対象から除外する。通話分析サーバ１０は、顧客の怒りを表す特定発話区間から基準時間を特定し、その基準時間を基準に顧客の不満に関する原因分析対象区間を決定する。顧客の怒りを表す特定発話区間は連続的に発生している箇所もあるため、通話分析サーバ１０は、その箇所の先頭の特定発話区間を用いて基準時間を特定する。

図８では、図７の通話条件（キーワード「キーボード」）及び区間条件（ＣＵ怒り）に加えて、「ＯＰ謝罪（「深謝」状況）」が区間条件として指定されている（区間条件の指定部Ｇ５２）。これにより、通話分析サーバ１０は、通話条件（キーワード「キーボード」）、区間条件「ＣＵ怒り（「怒り」感情）」、及び、区間条件「ＯＰ謝罪（「深謝」状況）」を取得する。「ＯＰ謝罪（「深謝」状況）」の区間条件については、次のように処理される。まず、通話分析サーバ１０は、音声認識部２７の実行により得られた、オペレータの音声テキストデータに基づいて、特定表現テーブル２８に保持される謝罪表現データを含むオペレータの発話区間を特定する。通話分析サーバ１０は、この特定された各発話区間に関し感情認識部２９により「深謝」を表すと判定された発話区間を、この区間条件に合致する特定発話区間として特定する。そして、通話分析サーバ１０は、顧客の怒りを表す特定発話区間の基準時間から得られる原因分析対象区間と、オペレータの深謝を表す特定発話区間の基準時間から得られる原因分析対象区間との重複範囲を、顧客の不満に関する原因分析対象区間に決定する。

図７及び図８を比較すれば分かるように、実施例１によれば、区間条件、即ち、通話者の特定事象を増やすことにより、原因分析対象区間の数をより少なくすることが出来る。これは、区間条件を増やすことで、原因分析対象区間を決めるための材料を増やすことができ、結果として、原因分析対象区間が実際に顧客の不満の原因となる事象を含む確率を上げることができるからである。これにより、通話における通話者の特定事象に関する原因分析の効率を向上することができる。

［補足］
上述の第１実施形態及び実施例１では、図３及び図４に示されるように、連続的に生じている、１人の通話者の１つの特定事象を表す特定発話区間については、その一部（先頭）から原因分析対象区間が決定された。しかしながら、第１実施形態及び実施例１は、指定された区間条件、即ち、通話者の特定事象によっては、特定発話区間が連続的に生じている場合でも、それら各特定発話区間からそれぞれ原因分析対象区間が決定される形態を排除するものではない。この場合には、指定された複数の区間条件に基づいて決定される複数の原因分析対象区間で重複する範囲を、最終的に、その通話の顧客の不満の原因分析対象区間に決定することにより、全ての特定発話区間の中から原因分析対象区間を絞ることができる。

［変形例］
上述の第１実施形態及び実施例１では、複数の区間条件が指定されている場合、各区間条件から得られる各基準時間に基づいて決定される複数の原因分析対象区間で重複する範囲が、最終的に、その通話の顧客の不満の原因分析対象区間に決定された。しかしながら、重複する範囲に制限せず、各区間条件から決定される全ての原因分析対象区間を原因分析対象区間に決めるようにしてもよい。この場合でも、連続的に生じている特定発話区間については基準時間の特定により原因分析対象区間が絞られるため、全ての発話区間又は特定発話区間を分析するよりは、分析効率を上げることができる。

また、上述の通話分析サーバ１０は、複数のコンピュータにより実現されてもよい。例えば、検出部２２が少なくとも１つの他のコンピュータ上で実現されてもよい。この場合、通話分析サーバ１０は、通話条件や区間条件の情報を検出部２２に与え、検出部２２から、特定発話区間に関する始端時間及び終端時間を取得するようにしてもよい。

［他の実施形態］
上述の実施形態及び実施例では、通話データが扱われたが、上述の分析対象決定装置及び分析対象決定方法は、通話以外の会話データを扱う装置やシステムに適用されてもよい。この場合、例えば、分析対象となる会話を録音する録音装置がその会話が行われる場所（会議室、銀行の窓口、店舗のレジなど）に設置される。また、会話データが複数の会話参加者の声が混合された状態で録音される場合には、その混合状態から所定の音声処理により会話参加者毎の音声データに分離される。

また、上述の実施形態及び変形例は、内容が相反しない範囲で組み合わせることができる。

上記の各実施形態及び各変形例の一部又は全部は、以下の付記のようにも特定され得る。但し、各実施形態及び各変形例が以下の記載に限定されるものではない。

（付記１）
会話の音声に対応するデータから、該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出する検出部と、
前記検出部により検出される複数の特定発話区間に基づいて、前記会話の会話参加者の特定事象に関する原因分析対象区間であって、該複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、
を備える分析対象決定装置。

（付記２）
前記検出部により検出される複数の特定発話区間が表す少なくとも１つの特定事象に応じた少なくとも１つの手法により、該複数の特定発話区間から少なくとも１つの基準時間を特定する特定部を更に備え、
前記対象決定部は、前記特定部により特定される前記少なくとも１つの基準時間を基準とする所定時間範囲を前記原因分析対象区間に決定する、
付記１に記載の分析対象決定装置。

（付記３）
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記会話の１人の会話参加者の１つの特定事象を表す複数の第１特定発話区間が含まれている場合、該複数の第１特定発話区間における、隣接する第１特定発話区間の間の時間幅が所定時間より短い第１特定発話区間の各ペアが結合されてなる区間内の中から、前記少なくとも１つの基準時間を特定する、
付記２に記載の分析対象決定装置。

（付記４）
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記複数の第１特定発話区間と共に、前記複数の第１特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第２特定発話区間が更に含まれる場合、該第２特定発話区間をそのまま用いて基準時間を更に特定し、
前記対象決定部は、前記第２特定発話区間から得られる基準時間を基準とする所定時間範囲を、前記原因分析対象区間に更に決定する、
付記３に記載の分析対象決定装置。

（付記５）
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記会話の１人の会話参加者の１つの特定事象を表す第１特定発話区間と、該第１特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第２特定発話区間とが含まれる場合、該第１特定発話区間及び該第２特定発話区間をそのまま用いて前記基準時間を特定し、
前記対象決定部は、前記第１特定発話区間及び前記第２特定発話区間からそれぞれ得られる各基準時間を基準とする所定時間範囲をそれぞれ、前記原因分析対象区間に決定する、
付記２に記載の分析対象決定装置。

（付記６）
前記対象決定部は、前記第１特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間と前記第２特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間とが重複する区間を、前記原因分析対象区間に決定する付記４又は５に記載の分析対象決定装置。

（付記７）
前記検出部は、第１会話参加者の不満を表す前記複数の第１特定発話区間と、第２会話参加者の謝罪を表す前記第２特定発話区間とを検出し、
前記対象決定部は、前記第１会話参加者の不満に関する前記原因分析対象区間を決定する、
付記４又は６に記載の分析対象決定装置。

（付記８）
前記検出部により検出される複数の特定発話区間を個別に表わす複数の第１描画要素、及び、前記対象決定部により決定される前記原因分析対象区間を表す第２描画要素が、前記会話内の時系列に応じて並ぶ描画データを生成する描画データ生成部、
を更に備える付記１から７のいずれか１つに記載の分析対象決定装置。

（付記９）
前記描画データ生成部は、前記会話の複数の発話区間に関する複数の音声テキストデータが、発話区間毎に前記会話内の時系列に沿って表示され、前記原因分析対象区間に含まれる発話区間の音声テキストデータが他と区別可能に表示され、前記原因分析対象区間の識別情報が表示される描画データを生成し、該描画データに基づく表示画面上での該識別情報に対するユーザ操作に応じて、該識別情報で特定される原因分析対象区間に含まれる発話区間の音声テキストデータが表示されるような画面遷移を可能とする、
付記８に記載の分析対象決定装置。

（付記１０）
少なくとも１つのコンピュータにより実行される分析対象決定方法において、
会話の音声に対応するデータから、該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出し、
前記検出される複数の特定発話区間に基づいて、前記会話の会話参加者の特定事象に関する原因分析対象区間であって、該複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する、
ことを含む分析対象決定方法。

（付記１１）
前記検出される複数の特定発話区間が表す少なくとも１つの特定事象に応じた少なくとも１つの手法により、該複数の特定発話区間から少なくとも１つの基準時間を特定し、
前記特定される少なくとも１つの基準時間を基準とする所定時間範囲を前記原因分析対象区間に決定する、
ことを更に含む付記１０に記載の分析対象決定方法。

（付記１２）
前記基準時間の特定は、前記検出される複数の特定発話区間に、前記会話の１人の会話参加者の１つの特定事象を表す複数の第１特定発話区間が含まれている場合、該複数の第１特定発話区間における、隣接する第１特定発話区間の間の時間幅が所定時間より短い第１特定発話区間の各ペアが結合されてなる区間内の中から、前記少なくとも１つの基準時間を特定する、
付記１１に記載の分析対象決定方法。

（付記１３）
前記基準時間の特定は、前記検出される複数の特定発話区間に、前記複数の第１特定発話区間と共に、前記複数の第１特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第２特定発話区間が更に含まれる場合、該第２特定発話区間をそのまま用いて基準時間を更に特定し、
前記原因分析対象区間の決定は、前記第２特定発話区間から得られる基準時間を基準とする所定時間範囲を、前記原因分析対象区間に更に決定する、
付記１２に記載の分析対象決定方法。

（付記１４）
前記基準時間の特定は、前記検出される複数の特定発話区間に、前記会話の１人の会話参加者の１つの特定事象を表す第１特定発話区間と、該第１特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第２特定発話区間とが含まれる場合、該第１特定発話区間及び該第２特定発話区間をそのまま用いて前記基準時間を特定し、
前記原因分析対象区間の決定は、前記第１特定発話区間及び前記第２特定発話区間からそれぞれ得られる各基準時間を基準とする所定時間範囲をそれぞれ、前記原因分析対象区間に決定する、
付記１１に記載の分析対象決定方法。

（付記１５）
前記原因分析対象区間の決定は、前記第１特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間と前記第２特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間とが重複する区間を、前記原因分析対象区間に決定する付記１３又は１４に記載の分析対象決定方法。

（付記１６）
前記特定発話区間の検出は、第１会話参加者の不満を表す前記複数の第１特定発話区間と、第２会話参加者の謝罪を表す前記第２特定発話区間とを検出し、
前記原因分析対象区間の決定は、前記第１会話参加者の不満に関する前記原因分析対象区間を決定する、
付記１３又は１５に記載の分析対象決定方法。

（付記１７）
前記検出される複数の特定発話区間を個別に表わす複数の第１描画要素、及び、前記決定される前記原因分析対象区間を表す第２描画要素が、前記会話内の時系列に応じて並ぶ描画データを生成する、
ことを更に含む付記１０から１６のいずれか１つに記載の分析対象決定方法。

（付記１８）
前記描画データの生成は、前記会話の複数の発話区間に関する複数の音声テキストデータが、発話区間毎に前記会話内の時系列に沿って表示され、前記原因分析対象区間に含まれる発話区間の音声テキストデータが他と区別可能に表示され、前記原因分析対象区間の識別情報が表示される描画データを生成し、該描画データに基づく表示画面上での該識別情報に対するユーザ操作に応じて、該識別情報で特定される原因分析対象区間に含まれる発話区間の音声テキストデータが表示されるような画面遷移を可能とする、
付記１７に記載の分析対象決定方法。

（付記１９）
少なくとも１つのコンピュータに、付記１０から１８のいずれか１つに記載の分析対象決定方法を実行させるプログラム。

（付記２０）
付記１９に記載のプログラムを記録したコンピュータが読み取り可能な記録媒体。

この出願は、２０１２年１０月３１日に出願された日本出願特願２０１２−２４０７４２号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

会話の音声に対応するデータから、該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出する検出部と、
前記検出部により検出される複数の特定発話区間に基づいて、前記会話の会話参加者の特定事象に関する原因分析対象区間であって、該複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する対象決定部と、
を備える分析対象決定装置。
前記検出部により検出される複数の特定発話区間が表す少なくとも１つの特定事象に応じた少なくとも１つの手法により、該複数の特定発話区間から少なくとも１つの基準時間を特定する特定部を更に備え、
前記対象決定部は、前記特定部により特定される前記少なくとも１つの基準時間を基準とする所定時間範囲を前記原因分析対象区間に決定する、
請求項１に記載の分析対象決定装置。
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記会話の１人の会話参加者の１つの特定事象を表す複数の第１特定発話区間が含まれている場合、該複数の第１特定発話区間における、隣接する第１特定発話区間の間の時間幅が所定時間より短い第１特定発話区間の各ペアが結合されてなる区間内の中から、前記少なくとも１つの基準時間を特定する、
請求項２に記載の分析対象決定装置。
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記複数の第１特定発話区間と共に、前記複数の第１特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第２特定発話区間が更に含まれる場合、該第２特定発話区間をそのまま用いて基準時間を更に特定し、
前記対象決定部は、前記第２特定発話区間から得られる基準時間を基準とする所定時間範囲を、前記原因分析対象区間に更に決定する、
請求項３に記載の分析対象決定装置。
前記特定部は、前記検出部により検出される複数の特定発話区間に、前記会話の１人の会話参加者の１つの特定事象を表す第１特定発話区間と、該第１特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第２特定発話区間とが含まれる場合、該第１特定発話区間及び該第２特定発話区間をそのまま用いて前記少なくとも１つの基準時間を特定し、
前記対象決定部は、前記第１特定発話区間及び前記第２特定発話区間からそれぞれ得られる各基準時間を基準とする所定時間範囲をそれぞれ、前記原因分析対象区間に決定する、
請求項２に記載の分析対象決定装置。
前記対象決定部は、前記第１特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間と前記第２特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間とが重複する区間を、前記原因分析対象区間に決定する請求項４又は５に記載の分析対象決定装置。
前記検出部は、第１会話参加者の不満を表す前記複数の第１特定発話区間と、第２会話参加者の謝罪を表す前記第２特定発話区間とを検出し、
前記対象決定部は、前記第１会話参加者の不満に関する前記原因分析対象区間を決定する、
請求項４又は６に記載の分析対象決定装置。
前記検出部により検出される複数の特定発話区間を個別に表わす複数の第１描画要素、及び、前記対象決定部により決定される前記原因分析対象区間を表す第２描画要素が、前記会話内の時系列に応じて並ぶ描画データを生成する描画データ生成部、
を更に備える請求項１から７のいずれか１項に記載の分析対象決定装置。
前記描画データ生成部は、前記会話の複数の発話区間に関する複数の音声テキストデータが、発話区間毎に前記会話内の時系列に沿って表示され、前記原因分析対象区間に含まれる発話区間の音声テキストデータが他と区別可能に表示され、前記原因分析対象区間の識別情報が表示される描画データを生成し、該描画データに基づく表示画面上での該識別情報に対するユーザ操作に応じて、該識別情報で特定される原因分析対象区間に含まれる発話区間の音声テキストデータが表示されるような画面遷移を可能とする、
請求項８に記載の分析対象決定装置。
少なくとも１つのコンピュータにより実行される分析対象決定方法において、
会話の音声に対応するデータから、該会話の１人の会話参加者又は複数の会話参加者における複数の特定事象、若しくは、該会話の１人の会話参加者の１つの特定事象を表す、複数の特定発話区間を検出し、
前記検出される複数の特定発話区間に基づいて、前記会話の会話参加者の特定事象に関する原因分析対象区間であって、該複数の特定発話区間の数よりも少ない数の原因分析対象区間を決定する、
ことを含む分析対象決定方法。
前記検出される複数の特定発話区間が表す少なくとも１つの特定事象に応じた少なくとも１つの手法により、該複数の特定発話区間から少なくとも１つの基準時間を特定し、
前記特定される少なくとも１つの基準時間を基準とする所定時間範囲を前記原因分析対象区間に決定する、
ことを更に含む請求項１０に記載の分析対象決定方法。
前記基準時間の特定は、前記検出される複数の特定発話区間に、前記会話の１人の会話参加者の１つの特定事象を表す複数の第１特定発話区間が含まれている場合、該複数の第１特定発話区間における、隣接する第１特定発話区間の間の時間幅が所定時間より短い第１特定発話区間の各ペアが結合されてなる区間内の中から、前記少なくとも１つの基準時間を特定する、
請求項１１に記載の分析対象決定方法。
前記基準時間の特定は、前記検出される複数の特定発話区間に、前記複数の第１特定発話区間と共に、前記複数の第１特定発話区間が表わす会話参加者の特定事象とは異なる該会話参加者の他の特定事象、又は、他の会話参加者の特定事象を表す第２特定発話区間が更に含まれる場合、該第２特定発話区間をそのまま用いて基準時間を更に特定し、
前記原因分析対象区間の決定は、前記第２特定発話区間から得られる基準時間を基準とする所定時間範囲を、前記原因分析対象区間に更に決定する、
請求項１２に記載の分析対象決定方法。
前記原因分析対象区間の決定は、前記第１特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間と前記第２特定発話区間から得られる前記基準時間に基づいて決定される前記原因分析対象区間とが重複する区間を、前記原因分析対象区間に決定する請求項１３に記載の分析対象決定方法。
少なくとも１つのコンピュータに、請求項１０から１４のいずれか１項に記載の分析対象決定方法を実行させるプログラム。