JP2015094811A - 通話録音可視化システムおよび通話録音可視化方法 - Google Patents

通話録音可視化システムおよび通話録音可視化方法 Download PDF

Info

Publication number
JP2015094811A
JP2015094811A JP2013232943A JP2013232943A JP2015094811A JP 2015094811 A JP2015094811 A JP 2015094811A JP 2013232943 A JP2013232943 A JP 2013232943A JP 2013232943 A JP2013232943 A JP 2013232943A JP 2015094811 A JP2015094811 A JP 2015094811A
Authority
JP
Japan
Prior art keywords
call recording
call
recording data
voice
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013232943A
Other languages
English (en)
Inventor
藤田 雄介
Yusuke Fujita
雄介 藤田
信尾 額賀
Nobuo Nukaga
信尾 額賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2013232943A priority Critical patent/JP2015094811A/ja
Publication of JP2015094811A publication Critical patent/JP2015094811A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】通話音声の確認を行うために、関連する通話を自動的に分類したい。
【解決手段】通話録音可視化システムは、複数の通話録音データを保持する記憶部と、前記複数の通話録音データから、前記通話録音データに含まれる音声の個人性に関する音響特徴量を抽出する個人性抽出部と、前記抽出された音響特徴量に基づいて、指定された通話録音データに含まれる音声の話者の組と同一の組によって発声された音声を含む一つ以上の通話録音データを特定する話者組特定部と、前記特定された一つ以上の通話録音データを識別する情報を出力する出力部と、を有する。
【選択図】図1

Description

本発明は、通話録音可視化システムおよび通話録音可視化方法に関する。
現在、多くのコールセンタにおいて、オペレータと顧客が話している内容は通話録音装置で録音されており、通話録音のデータ量は年々増加を続けている。通話録音データから、その内容を自動的に抽出することができれば、コールセンタ業務の品質および効率の向上、マーケティングへの活用に繋がると期待される。
ところで、コールセンタにおいて、一つの問合せ案件が、一回の通話で完了しないことは珍しくない。例えば、まず受付担当者が、顧客の用件を聞き、後ほど専門担当者から顧客へ折り返しの電話を行うようなケースがある。その間には、受付担当者と専門担当者の間での引き継ぎの内線通話や、専門担当者間で対応を議論するための内線通話がある。
このように、複数の通話で構成される問合せ案件の内容を効率的に確認するためには、それぞれの通話が誰と誰による通話であったかを分かりやすく表示することが求められる。例えば、確認対象の問合せ案件を構成する通話を、「受付担当者と顧客」、「受付担当者と専門担当者」、「顧客と専門担当者」、「専門担当者同士」といった形に分類することができると、各分類に応じて異なる観点からの通話内容確認を効率的に行うことが可能となる。例えば、顧客の最初の用件のみを確認したい場合は、「受付担当者と顧客」に分類される通話を確認すればよく、また、専門担当者の顧客への応対態度を確認したいときは、「顧客と専門担当者」に分類される通話のみを確認すればよい。
従来、このような分類を実現するためには、電話終了後に、問合せ案件を管理するデータベースに人手で入力する必要があった。
あるいは、話者を特定する手段を用いてこれらの分類を自動的に決定する方法が考えられる。例えば、通話録音が送信用と受信用の2回線であることを利用して、それぞれの回線に話者を割り当て、その回線を識別する電話番号等の情報と結びつけることによって、話者を特定する方法がある(特許文献1)。
また、別の方法として、話者認識技術が挙げられる。話者認識では、音声に含まれる特徴量を抽出し、2つの音声の特徴量間の類似度を算出し、閾値によって、2つの音声の話者が同一であるか否かを判定する方法が用いられる。
特開2007−68044号公報
しかしながら、従来の方法では、通話が2人で行われていることを想定し、2人の話者組について分類し、その結果を表示する方法はなかった。回線識別による方法では、電話で実際に話している話者が同一であるかを識別することができない。顧客側、コールセンタ側ともに、同じ回線を複数人が共有するケースがあり、また一方では、同一の話者が異なる電話番号を用いるケースもあるためである。また、話者認識による方法では、話者に関する情報をあらかじめ登録しておかない限り、同一と判定された話者の分類(例えば受付担当者か専門担当者か顧客か)を判断できない。また、通話の中の一人だけが同一だと判定されるだけでは、通話録音の確認対象を十分に絞り込めない。
一方、通話に関わる二人の話者がともに同一と判定される場合は、同じ分類に属する通話録音であることが明らかとなるため、そのような判定結果は確認対象の絞込みにとって有用である。
本発明は、このような点に鑑みてなされたものであり、その目的は、複数の通話が格納された通話録音データベースから、通話に含まれる2人の話者の組合せに関する同一性に基づいて分類し、その結果を表示することで、通話録音を確認する作業の効率化を可能とする通話録音可視化システムおよび方法を提供することにある。
上記の課題を解決するために、本発明は、複数の通話録音データを保持する記憶部と、前記複数の通話録音データから、前記通話録音データに含まれる音声の個人性に関する音響特徴量を抽出する個人性抽出部と、前記抽出された音響特徴量に基づいて、指定された通話録音データに含まれる音声の話者の組と同一の組によって発声された音声を含む一つ以上の通話録音データを特定する話者組特定部と、前記特定された一つ以上の通話録音データを識別する情報を出力する出力部と、を有することを特徴とする。
本発明によれば、指定された通話と同一の話者の組によって発話された音声を含む通話を表示することで、内容を確認する通話を効率的に絞り込むことができる。
上記以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
実施例1の通話録音可視化システムおよびその周辺のシステムからなるシステム全体の構成を示すブロック図である。 実施例1の通話録音可視化システムおよびその周辺のシステムからなるシステム全体のハードウェア構成を示すブロック図である。 実施例1の通話録音可視化システムによる通話検索DB作成動作を示すフローチャートである。 実施例1の通話録音可視化システムが保持する通話録音DBの例を説明する図である。 実施例1の通話録音可視化システムが保持する通話検索DBの例を説明する図である。 実施例1の通話録音可視化システムによる通話可視化動作を示すフローチャートである。 実施例1のディスプレイに表示される検索画面の例を示す説明図である。 実施例1のディスプレイに表示される結果表示画面の例を示す説明図である。 実施例2の通話録音可視化システムおよびその周辺のシステムからなるシステム全体の構成を示す機能ブロック図である。 実施例2の通話録音可視化システムによる通話可視化動作を示すフローチャートである。 実施例2のディスプレイに表示される結果表示画面の例を示す説明図である。
以下、実施例を、図面を用いて説明する。
本発明による通話録音可視化システムの例を説明する。
図1は、実施例1の通話録音可視化システムおよびその周辺のシステムからなるシステム全体の構成を示す機能ブロック図である。
通話録音可視化システム1は、コールセンタ5における顧客61とオペレータ51の間の通話音声を録音する通話録音装置2と、その通話録音の内容をクエリによって検索可能とする通話検索装置3とを備え、通話録音可視化端末装置4を用いて、利用者が通話録音の確認に利用できるように構成される。
通話録音装置2は、顧客61とオペレータ51とがそれぞれ顧客電話62およびオペレータ電話52を用いて行う通話を録音する通話録音部21と、通話録音がオペレータの発話(送信)であるか顧客の発話(受信)であるかを決定する送受信種別取得部22と、通話録音と送受信種別を対応付けて管理する通話録音DB23と、外部からの要求を受け付けて通話録音DB23の情報を送信する通話録音DB管理部24と、を備える。
通話検索装置3は、通話録音装置2に保存された通話録音を取得する通話録音取得部31と、通話録音中の音声区間を検出する音声区間検出部33と、通話録音中の個人性を抽出する個人性抽出部34と、音声区間検出および個人性抽出の結果を管理する通話検索DB35と、外部からクエリを受けつけるクエリ受付部36と、受け付けたクエリに基づいて通話検索DB35から検出対象となる通話録音を検索する通話録音検索部37と、検出対象となる通話録音の個人性抽出の結果に基づいて、通話録音に含まれる音声を発声した話者の組を特定する話者組特定部38と、話者組を特定した結果を送信する結果送信部39と、を備える。
通話録音可視化端末装置4は、通話録音を特定するためのクエリを通話検索装置3に送信するクエリ送信部41と、話者組特定結果に基づく表示を行う結果表示部42と、を備える。通話録音可視化システム1の利用者は、通話録音可視化端末装置4を操作して、クエリを入力し、結果表示部42によって表示された内容を参照する。この利用者は、例えば、オペレータ51による通話内容をチェックするスーパーバイザ43である。なお、通話録音可視化端末装置4が通話録音可視化システム1に含まれてもよい。
図2は、実施例1の通話録音可視化システムおよびその周辺のシステムからなるシステム全体のハードウェア構成を示すブロック図である。
本システムは、VoIP(Voice over Internet Protocol)ゲートウェイ201、IP(Internet Protocol)交換機202、複数のIP電話機203、およびIPネットワーク中継装置204を備え、公衆電話回線網200の先の電話機(例えば図1の顧客電話62)を用いる顧客と、コールセンタ内のIP電話機203(例えば図1のオペレータ電話52に相当)を用いるオペレータとが通話できるように構成されている。
通話録音装置2は、CPU205、メモリ206、HDD(Hard Disk Drive)207、および、IPネットワーク中継装置204と接続する通信部208を備える。メモリ206には、それぞれが通話録音部21、送受信種別取得部22および通話録音DB管理部24の処理を行うプログラムが格納され、HDD207には通話録音DB23が格納される。以下に説明する通話録音部21、送受信種別取得部22および通話録音DB管理部24の処理は、CPU205がメモリ206に格納されたプログラムを実行することによって実現される。
通話検索装置3は、CPU215、メモリ216、HDD217、および、IPネットワーク中継装置204と接続する通信部218を備える。メモリ216には、それぞれが通話録音取得部31、音声区間検出部33、個人性抽出部34、クエリ受付部36、通話録音検索部37、話者組特定部38および結果送信部39の処理を行うプログラムが格納され、HDD217には、通話検索DB35が格納される。以下に説明する通話録音取得部31、音声区間検出部33、個人性抽出部34、クエリ受付部36、通話録音検索部37、話者組特定部38および結果送信部39の処理は、CPU215がメモリ216に格納されたプログラムを実行することによって実現される。
通話録音可視化端末装置4は、CPU225、メモリ226、HDD227、IPネットワーク中継装置204と接続する通信部228、キーボード229、ディスプレイ230、マウス231、スピーカ232とを備える。メモリ206には、それぞれがクエリ送信部41および結果表示部42の処理を行うプログラムが格納される。以下に説明するクエリ送信部41および結果表示部42の処理は、CPU225がメモリ226に格納されたプログラムを実行することによって実現される。
なお、図2には通話録音可視化システム1を構成する通話録音装置2、通話検索装置3およびそれに接続される通話録音可視化端末装置4がそれぞれ独立した計算機によって構成される例を示したが、これらのうち任意の二つ又は三つ全てが一つの計算機によって構成されてもよい。例えば、メモリ206にさらに通話録音取得部31〜結果送信部39の処理を行うプログラムを格納し、HDD207にさらに通話検索DB35を格納することで、通話録音装置2および通話検索装置3の機能を有する計算機(すなわち通話録音可視化システム1の全ての機能を有する計算機)が実現される。この計算機に、さらに、ディスプレイ230等を追加し、メモリ206にクエリ送信部41および結果表示部42の処理を行うプログラムを追加することによって、通話録音可視化端末装置4の機能をさらに有する計算機が実現される。また、メモリ206〜メモリ226、HDD207およびHDD217は、いずれもそれぞれの用途に適した任意の種類の記憶装置によって置き換えることができる。
次に、上記のように構成される、本実施例による通話録音可視化システム1の動作を説明する。
本システムの動作は、通話検索DB作成動作と、通話DB検索動作とに分けられる。
まず、図3〜図5を参照して、通話検索DB作成動作を説明する。
図3は、実施例1の通話録音可視化システム1による通話検索DB作成動作を示すフローチャートである。また、図4は、実施例1の通話録音可視化システム1が保持する通話録音DB23の例を説明する図である。
通話録音DB23は、通話録音部21および送受信種別取得部22によって追加および更新されるレコードを含むデータベースであり、公知のリレーショナルデータベースを用いて構築できる。通話録音DB23のレコードは、録音ID401、案件ID402、オペレータID403、電話番号404、録音時刻405、送信音声406、および受信音声407からなる。
録音ID401は、一つの通話に関する音声の録音を一意に識別する。案件ID402は、それぞれの通話に関する案件を識別する。一つの案件に関する複数の通話が行われた場合は、それらの通話の録音について同一の案件ID402が与えられる。
オペレータID403は、それぞれの通話を行ったオペレータ51を識別する。このオペレータ51は、例えば、顧客61からの電話を最初に受けて応対する受付担当者であってもよいし、それぞれの案件に関する専門的な知識を有する専門担当者であってもよい。なお、一般に、専門担当者はコールセンタ5の外にいる場合もあるが、本実施例ではそのような場合も含めて、顧客61と通話する者をオペレータ51と記載する。
オペレータID403は、例えばそれぞれのオペレータ51が通話に使用したオペレータ電話52の番号であってもよいし、後述するようにオペレータ51自身によって入力されてもよい。ただし、実際には一人のオペレータ51が複数のオペレータ電話52を使い分けたり、複数のオペレータが一つのオペレータ電話52を共用したりする場合があるため、ある通話録音に含まれる音声を実際に発声した話者が、その通話録音に関するオペレータID403によって識別されるオペレータ51であるとは限らない。
電話番号404は、それぞれの通話においてオペレータ51が通話した相手先の電話番号である。すなわち、電話番号404は、オペレータ51が顧客61と通話した場合には顧客電話62の番号、オペレータ51が別のオペレータ51と通話した場合(例えば受付担当者が専門担当者と通話した場合、又は専門担当者が別の専門担当者と通話した場合)にはその通話相手のオペレータ電話52の番号である。
録音時刻405は、通話録音が行われた時刻である。
送信音声406および受信音声407には、通話を録音することによって作成された音声データを含む実際の音声ファイルの保存場所を示すファイルパスが保存される。送信音声406によって特定される音声ファイルには、送信音声、すなわち、オペレータによって発声された音声のデータが含まれる。受信音声407によって特定される音声ファイルには、受信音声、すなわち、オペレータ51の通話相手によって発声された音声のデータが含まれる。
通話録音DB23は、オペレータのIP電話機203の操作に従って、案件ID402およびオペレータID403を決定・修正することができるように構成される。
まず、通話録音取得部31は、通話録音装置2に新規の通話録音が存在するか問い合わせる(ステップS301)。このとき、通話録音DB管理部24は、新規の通話録音が存在するかの問い合わせを受け付け、所定の時刻よりあとに録音された通話録音があれば、その録音IDを通話録音取得部31に返す。通話録音がない場合は、通話録音取得部31は所定の時間待機する(ステップS302)。
通話録音が存在する場合、通話録音取得部31は、通話録音装置2から新規の録音ID401に対応する通話録音の送信音声406および受信音声407のそれぞれによって特定される音声ファイルを取得する(ステップS303)。
次に、音声区間検出部33は、取得した音声ファイルに含まれる送信音声および受信音声における音声区間を検出する(ステップS304)。音声区間を検出する方法は公知の技術により実現できる。例えば、音声パワーの閾値に基づく方法、または、音響特徴量のパタン識別に基づく方法などがある。通話音声中には、人間の発声のほか、無音区間、保留音などがあるが、音声区間検出によって、人間の発声部分のみを取り出す。音声区間検出部33は、送信音声と受信音声それぞれから検出した音声区間の開始時刻と終了時刻から、音声開始時刻系列504および音声終了時刻系列505を構成し、通話検索テーブル500に追加する。ここで、通話検索DB35に含まれる通話検索テーブル500について説明する。
図5は、実施例1の通話録音可視化システム1が保持する通話検索DB35の例を説明する図である。
通話検索DB35は、通話検索テーブル500を含む。通話検索テーブル500の各レコードは、各録音に含まれる送信音声または受信音声の一方に対応し、それぞれ、録音ID501、案件ID502、種別503、音声開始時刻系列504、音声終了時刻系列505および個人性特徴ファイル506を含む。
録音ID501および案件ID502は、それぞれ通話録音DB23の録音ID401および案件ID402に対応する識別情報である。
種別503は、各レコードが送信音声または受信音声のいずれに対応するかを示す。音声開始時刻系列504および音声終了時刻系列505は、ステップS304において検出された音声区間を示す。個人性特徴ファイル506は、後述する手順で抽出される個人性特徴の情報を含むファイルを示す。
例えば、図5に例示する通話検索テーブル500の先頭のレコードは、案件ID「A001」および録音ID「1234」によって識別される通話録音に含まれる送信音声から、2.11秒から4.50秒まで、9.10秒から14.9秒まで、および、16.1秒から20.0秒までの三つの区間が音声区間として検出され、それらの音声区間から抽出された個人性の情報の保存場所のファイルパスが1234_send.modelであることを示している。
次に、個人性抽出部34は、送信音声と受信音声における個人性を抽出する(ステップS305)。音声から個人性を抽出する方法としては、例えば混合ガウスモデルに基づく方法がある。この方法では、まず、通話検索テーブル500を参照して、音声区間を取得し、音声区間のみの音響特徴量を抽出する。音響特徴量としては、メル周波数ケプストラム係数を用いる。抽出した音響特徴量が混合ガウス分布からの標本であると仮定し、期待値最大化法を用いて混合ガウス分布を学習する。個人性抽出部34は、こうして学習された混合ガウス分布を個人性特徴ファイルとして通話検索テーブル500に追加する。図5の個人性特徴ファイル506には、ステップS305で追加された実際の個人性特徴ファイルの保存場所を示すファイルパスが保存される。
ここで、個人性抽出部34は、全ての音声区間を用いて個人性を抽出するのではなく、一部の音声区間のみから抽出するように構成することもできる。送信音声と受信音声には、おおむねそれぞれ1人の話者によって発声された音声が含まれると想定されるが、実際には、送信音声と受信音声のいずれかまたは両方に、話者の交代または機械音声による保留などに起因する、主たる話者以外の発声による音声区間が含まれる可能性がある。このような区間は、個人性抽出において誤りを生じる可能性があるため、あらかじめ音声区間から取り除いておくことが望ましい。例えば、混合ガウス分布を学習する前に、それぞれの音声区間を音響特徴量に基づいてクラスタリングし、最も出現頻度の高いクラスタに所属する区間のみを用いて混合ガウス分布を学習することで、主たる話者(言い換えると、当該送信音声又は受信音声において最も長時間発声した話者)のみの音声区間に基づいて個人性が抽出される。
また、個人性抽出部34では、送信音声と受信音声の構成によっては、通話者の分離を行って2人の話者の音声区間を同定し、それぞれの区間の個人性を抽出するように構成することもできる。例えば、受信音声が全て無音、あるいは存在しない場合が考えられる。ここでは、通話録音装置に接続される電話機等の構成によって、送信音声と受信音声が分離できないまま録音されるケース、言い換えると、ステップS304によって音声区間が検出された時点で、それぞれの音声区間が送信音声または受信音声のいずれを含んでいるかが特定されていないケースを想定している。
例えば、一般に、図2に示すようなIP電話に本発明を適用する場合には、送信音声と受信音声が分離して取得されるが、従来の電話交換機を用いたアナログの電話網に本発明を適用する場合には、送信音声と受信音声を分離できず、それらが混在する一つの音声ファイルが取得される。ここでは、例として、例えば送信音声ファイルに送信音声と受信音声の両方が含まれ、受信音声ファイルに音声が含まれないかまたは受信音声ファイル自体が存在しない場合を例として説明する。
このようなときは、個人性抽出部34は、送信音声ファイルに含まれる音声区間を、音響特徴量に基づくクラスタリングによって2つのクラスタに分割し、それぞれのクラスタに所属する区間を用いて混合ガウス分布を学習することで、送信音声のみから通話を行った2人の話者の音声に関する2つの個人性特徴を抽出することができる。なお、本実施例では送信音声の話者と受信音声の話者の組を特定できれば十分であり、それぞれの話者が送信音声または受信音声のいずれの話者であるかを特定する必要はない。
上記のように、送信音声ファイルに送信音声と受信音声の両方が含まれる場合において、さらに、送信音声と受信音声の少なくとも一方に、話者の交代または機械音声による保留などに起因する、主たる話者以外の発声による音声区間が含まれる可能性がある。この場合、個人性抽出部34は、送信音声ファイルに含まれる音声区間を、音響特徴量に基づくクラスタリングによって3つ以上のクラスタに分割し、出現頻度の高さの順に、上位2つのクラスタに所属する区間を用いて混合ガウス分布を学習してもよい。これによって、送信音声と受信音声が分離されていない場合であって、かつ、3人以上の話者の音声が通話録音に含まれる場合であっても、通話を行った主たる2人の話者の個人性特徴を抽出することができる。
なお、上記の音声区間のクラスタリングは、例えば、音声区間を十分に短い所定の時間の区間に分割し、それぞれの区間の音響特徴量をクラスタリングすることによって実行されてもよい。上記の区間の総数に対する、それぞれのクラスタに所属すると推定される区間の数の割合が、それぞれのクラスタの出現頻度に相当する。クラスタリングの具体的な方法としては、任意の公知の方法を用いることができる。
以上の通話検索DB作成動作によって、通話録音に含まれる2人の話者によって発声された音声のそれぞれに対応する個人性特徴が付与される。
次に、図6〜図8を参照して、通話可視化動作を説明する。
図6は、実施例1の通話録音可視化システム1による通話可視化動作を示すフローチャートである。また、図7は、実施例1のディスプレイ230に表示される検索画面701の例を示す説明図である。
まず、クエリ送信部41は、利用者(例えば、スーパーバイザ43)が入力したクエリを送信する(ステップS601)。ここでクエリ送信部41は、利用者にクエリの入力を促すために、図7のような検索画面701をディスプレイ230に表示する。利用者は、ディスプレイ230上に表示されるクエリ入力ボックス702をマウス231で選択し、キーボード229を用いてクエリを入力する。最後に検索実行ボタン703をマウス231でクリックすると、クエリ送信部41が通話検索装置3に対してクエリを送信する。ここでは、一例として、録音IDが1234である通話を指定するクエリを入力した場合について説明する。
次に、クエリ受付部36は、クエリを受信する(ステップS602)。
次に、通話録音検索部37は、受け付けたクエリの録音IDの1234に対応する通話録音を通話検索DB35から検索する(ステップS603)。
次に、話者組特定部38は、指定された通話録音の話者組と同一の話者組である通話録音を特定する(ステップS604)。
ここで、話者組特定部38は、録音IDが1234である通話録音に対し、案件IDが同一でかつ別の録音IDを持つ通話録音を比較対象とする。例えば、ここでは通話検索テーブル500中の、録音IDが2345の通話録音と録音IDが3456の通話録音を対象とする。
ここで、比較をするために、話者組特定部38は、個人性特徴ファイルを取得する。個人性特徴ファイルは混合ガウス分布を保存したものであるため、モデル間の比較は、例えば、カルバックライブラー距離などを用いて行う。例えば、指定された通話録音の送信音声の個人性特徴をx_send.model、比較対象の通話録音の送信音声の個人性特徴をy_send.model、それらの間で算出した個人性特徴間の距離をD_send(x,y)と記載し、同様に、指定された通話録音の受信音声の個人性特徴をx_recv.model、比較対象の通話録音の受信音声の個人性特徴をy_recv.model、それらの間で算出した個人性特徴間の距離をD_recv(x,y)と記載する場合、話者組の同一性は、あらかじめ設定した閾値Tを用いて次の式(1)の条件で判定することができる。すなわち、式(1)の条件が満たされる場合、指定された通話録音に含まれる音声の話者の組と、比較対象の通話録音に含まれる音声の話者の組とが同一であると判定される。
D_send(x,y) + D_recv(x,y) < T ・・・(1)
なお、既に説明したように一つの通話録音に含まれるそれぞれの音声区間の音声が送信音声であるか受信音声であるか特定できない場合には、それらの一方が送信音声であると仮定した場合とそれが受信音声であると仮定した場合について式(1)の条件を判定し、いずれかの場合に条件が満たされれば話者の組が同一であると判定することができる。
次に、結果送信部39は、話者組特定部の判定結果を通話録音可視化端末装置4に送信する(ステップS605)。判定結果は、例えば(2345, false)(3456, true)のように録音IDと判定結果(false:同一でない、true:同一である)の組を符号化したものである。
次に、結果表示部42は、受信した判定結果に基づいて、結果をディスプレイ230に表示する(ステップS606)。
図8は、実施例1のディスプレイ230に表示される結果表示画面801の例を示す説明図である。
結果表示部42は、通話録音DB23への問い合わせによって、案件ID402、オペレータID403、電話番号404および録音時刻405を検索した結果803を同時に結果表示画面801に表示する。また、結果表示部42は、音声ファイルを取得し、音声再生を制御するためのプレイヤー802を表示する。さらに、結果表示部42は、取得した音声ファイルを音声認識し、その結果804(例えばテキスト情報)を表示する。続いて、結果表示部42は、関連通話リスト805として、通話録音DBの別の録音IDに関する情報も表示する。
例えば、図8に示すように、結果表示部42は、指定された録音IDの通話録音と同一の案件IDが与えられた通話録音の録音IDのリストを関連通話リスト805として表示し、さらに、話者組特定結果に基づいて、指定された録音IDの通話録音と同一の話者組の音声を含むと判定された通話録音の録音IDを、その前にチェックマークを表示することで、強調表示する。利用者がいずれかの録音IDをクリックすることによって、その録音IDをクエリとして通話を可視化することができる。
例えば、利用者が録音ID「3456」をクリックすると、クエリ送信部41がその録音IDをクエリとして通話録音可視化システム1に送信し、通話録音可視化システム1が録音ID「3456」の通話録音の音声認識結果を通話録音可視化端末装置4に送信し、結果表示部42が受信した音声認識結果(例えばテキスト情報)を結果表示画面801に表示してもよい。
なお、上記のチェックマークの表示は、強調表示の方法の一例であり、複数の通話録音のうち、指定された通話録音と同一の話者組の音声を含む通話録音を、それ以外の通話録音と区別可能に表示する方法である限り、どのような方法が使用されてもよい。例えば、チェックマーク以外の付加的な表示によって区別されてもよいし、表示される文字の形状、大きさ、色彩、または文字の背景の色彩等によって区別されてもよい。
こうして、利用者は、話者組判定結果を利用して、同じ分類の通話を簡単に発見し、その通話の内容を可視化することによって、通話内容の確認を効率的に行うことが可能となる。例えば、録音ID「1234」の通話録音の内容を確認する場合に、さらにそれと同一の話者組による他の通話録音の内容も確認する必要が生じる場合があるが、本実施例によれば同一の話者組による他の通話録音が区別可能に表示されるため、利用者はそれらを容易に選択して内容を確認することができる。
次に、本発明による話者組が属する属性を特定する話者組属性特定部を有する通話録音可視化システムの例を説明する。以下に説明する相違点を除き、実施例2の通話録音可視化システムの各部は、図1〜図8に示された実施例1の同一の符号を付された各部と同一の機能を有するため、それらの説明は省略する。
図9は、実施例2の通話録音可視化システムおよびその周辺のシステムからなるシステム全体の構成を示す機能ブロック図である。
図9に示す通話録音可視化システム1は、実施例1の構成に加え、話者組属性特定部901を有する。話者組属性特定部901は、話者組特定部38による特定結果と通話検索DB35とを用いて、話者組の属性を特定する。
実施例2の通話録音可視化システム1のハードウェア構成は、メモリ216に話者組属性特定部901の処理を行うプログラムが格納される点を除いて、実施例1(図2)と同様であるので、説明を省略する。
次に、上記のように構成される、本実施例による通話録音可視化システム1の動作を説明する。ここで、通話検索DB作成動作は、実施例1(図3〜図5)と同一であるので説明を省略する。
図10は、実施例2の通話録音可視化システム1による通話可視化動作を示すフローチャートである。
話者組特定部38が話者組を特定するまでの処理、すなわちステップS601からステップS604までは実施例1と同一であるので説明を省略する。
話者組を特定したのち、話者組属性特定部901は、話者組の属性を付与する(ステップS1005)。話者組の属性は、話者組が同一である複数の通話に共通に付与できる属性であり、話者組属性特定部901は、通話録音DB23および通話検索DB35に保存されている情報から取得した属性を付与する。
図10の例では、指定された通話の電話番号404と、その通話と同一の話者組による通話であると判定された通話の電話番号404との組から、それらの通話が外線通話であるか内線通話であるかを判定する。それらの通話の話者組が同一であれば、それらが外線通話であるか内線通話であるかが決定できる。ここでは、録音ID「1234」と録音ID「3456」に対応する電話番号404がともに0から開始していることから、これらの録音IDの通話はいずれも外線通話であると判定される。また、この例ではオペレータID403も同一であるため、オペレータID403の情報(この例では「AAA」)も付与できる。一方、録音ID「2345」に対応する電話番号404が4桁の内線番号であることから、録音ID「2345」の通話が内線通話であると判定される。
なお、上記のように、通話録音DB23は、それぞれの通話録音の属性に関する情報を含み、話者組属性特定部901は、その情報に基づいて、話者組の属性を特定することができる。例えば、オペレータID403および電話番号404は通話録音の属性に関する情報として扱うことができ、話者組属性特定部901は、これらに基づいて、それぞれの話者組による通話が外線通話または内線通話のいずれであるかを特定することができる。
さらに、通話録音可視化システム1は、通話録音DB23の一部として、またはそれとは別の情報として、より詳細な属性に関する情報をHDD207等に保持してもよい。例えば、電話番号404の値と、それが外線番号または内線番号のいずれであるかを示す情報をと対応付ける情報が保持されてもよいし、電話番号404が内線番号である場合に、その内線番号をそれが属する部署と対応付ける情報が保持されてもよい。前者の場合、話者組属性特定部901は、保持された情報に基づいて、それぞれの話者組による通話が外線通話または内線通話のいずれであるかを、話者組属性として特定することができる。後者の場合、話者組属性特定部901は、保持された情報に基づいて、それぞれの話者組の少なくとも一方の話者の所属を、話者組属性として特定することができる。
次に、結果送信部39は、話者組特定部38による判定結果に話者組属性特定部901によって特定された属性を加えて通話録音可視化端末装置4に送信する(ステップS605)。送信される判定結果は、例えば(2345, false, 外線;オペレータAAA)(3, true,内線)といったように録音IDと判定結果と話者組の属性を符号化したものである。
次に、結果表示部42は、受信した判定結果に基づいて、結果をディスプレイ230に表示する(ステップS606)。
図11は、実施例2のディスプレイ230に表示される結果表示画面1101の例を示す説明図である。
結果表示部42は、結果表示画面1101内に、関連通話リスト1102として、通話録音DB23に格納された別の録音IDに関する情報も表示する。ここで、結果表示部42は、話者組判定結果に基づいて、同一の話者組と判定された録音ID同士を同一の色または形で表示するなどして、確認対象の分類を強調する。また、結果表示部42は、指定された録音IDと同一の話者組と判定された録音IDの前に丸印を表示してさらに強調する。実施例1の場合と同様に、利用者がいずれかの録音IDをクリックすることによって、その録音IDをクエリとして通話を可視化することができる。さらに、結果表示部42は、話者組属性判定結果に基づいて、関連通話の話者組属性を表示する。
図11の例において、関連通話リスト1102に表示されている録音ID「1234」、「2345」および「3456」は、いずれも、同一の案件IDが与えられた通話録音の録音IDである。これらのうち、録音ID「1234」は、利用者によって指定された通話録音のIDであり、録音ID「3456」は、指定された通話録音について特定された話者組と同一の話者組による音声を含む通話録音のIDである。このため、録音ID「1234」および「3456」は、それらの左側の丸印によって強調表示される。さらに、これらの話者組に共通する属性として、通話録音DB23から抽出された「外線、オペレータAAA」が、それぞれの録音IDに関連付けて表示される。
一方、録音ID「2345」によって識別される通話録音は、指定された通話録音と同一の案件IDが与えられているという点では、指定された通話録音と関連しているが、その話者の少なくとも一人が指定された通話録音の話者と異なるという点で、指定された通話録音との関連性が低い。この場合、録音ID「2345」は強調表示されないが、録音ID「2345」の通話録音の話者組の属性として、通話録音DB23から抽出された「内線」が、録音ID「2345」に関連付けて表示される。
さらに、図11の例では、関連通話リスト1102が各録音IDに関連する属性に応じて分類して表示される。図11では録音ID「2345」およびそれに関連する属性が斜体字によって表示されているが、実際には、例えばそれらの文字色または背景色を属性に応じて決定するなど、任意の方法で分類表示することができる。
図11の関連通話リスト1102には、指定された通話録音と同一の案件IDが与えられているが話者組が異なる通話録音のIDとして「2345」一つのみを表示しているが、そのような通話録音が複数個存在する場合には、それらの録音IDが関連通話リスト1102に含めて表示される。それらの通話録音についても、同様に、例えば「内線」または「外線」のような属性が特定され、通話録音のIDがそれぞれの属性に応じて文字色等によって分類表示される。
上記のように、話者組判定結果に加えて話者組属性判定結果を利用して、指定された通話に関連する通話の分類が可視化されることで、利用者は、確認すべき通話録音を効率的に選択可能となる。例えば、指定された通話録音と同一の案件IDが与えられた通話録音であって、指定された通話録音とは異なる話者組による通話録音のうち、内線通話の録音は確認する必要がないが、外線通話の録音は確認したい、という場合、利用者は、強調表示されていない録音IDのうち、話者組属性として「内線」が与えられたものを、関連通話リスト1102を参照して容易に選択して、その内容を確認することができる。
なお、上述した実施例では、各サーバのCPU上で実行されるプログラムにより、音声検索システムの各種機能を実現しているが、それらの一部又は全部が、例えば集積回路等の電子部品を用いたハードウェアにより実現されてもよい。
本発明は上述した実施形態に限定されるものではなく、様々な変形例が含まれる。本実施例では、コールセンタにおける通話録音装置と連携した問題発話検索システムを想定したが、例えば、多拠点ビデオ会議における拠点間の通話録音に基づく議事録検索システム、または、放送録画における番組検索システムなど、様々なシステムに適用することが出来る。
また、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
上記の各機能を実現するプログラム、テーブル、ファイル等の情報は、不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
また、図面には、実施形態を説明するために必要と考えられる制御線及び情報線を示しており、必ずしも、本発明が適用された実際の製品に含まれる全ての制御線及び情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
1 通話録音可視化システム
2 通話録音装置
3 通話検索装置
4 通話可視化端末装置
5 コールセンタ

Claims (12)

  1. 複数の通話録音データを保持する記憶部と、
    前記複数の通話録音データから、前記通話録音データに含まれる音声の個人性に関する音響特徴量を抽出する個人性抽出部と、
    前記抽出された音響特徴量に基づいて、指定された通話録音データに含まれる音声の話者の組と同一の組によって発声された音声を含む一つ以上の通話録音データを特定する話者組特定部と、
    前記特定された一つ以上の通話録音データを識別する情報を出力する出力部と、を有することを特徴とする通話録音可視化システム。
  2. 請求項1に記載の通話録音可視化システムであって、
    前記出力部は、前記複数の通話録音データを識別する情報を表示し、前記特定された一つ以上の通話録音データを識別する情報を区別可能に表示することを特徴とする通話録音可視化システム。
  3. 請求項1に記載の通話録音可視化システムであって、
    前記各通話録音データに含まれる音声の話者の組の属性を特定する属性特定部をさらに有し、
    前記出力部は、前記複数の通話録音データを識別する情報を、前記特定された属性に基づいて分類して表示することを特徴とする通話録音可視化システム。
  4. 請求項3に記載の通話録音可視化システムであって、
    前記記憶部は、前記各通話録音データに対応する属性情報を保持し、
    前記属性特定部は、前記属性情報に基づいて、前記各通話録音データに含まれる音声の話者の組の属性を特定することを特徴とする通話録音可視化システム。
  5. 請求項1に記載の通話録音可視化システムであって、
    前記各通話録音データは、一つの通話に関する送信側録音データおよび受信側録音データを含み、
    前記個人性抽出部は、前記各通話録音データに含まれる前記送信側録音データおよび前記受信側録音データの各々に含まれる音声の音響特徴量に基づいて、前記送信側録音データおよび前記受信側録音データの少なくとも一方に含まれる、複数の話者によって発声された音声のうち、発声時間が最も長い話者の音声の個人性に関する音響特徴量を抽出することを特徴とする通話録音可視化システム。
  6. 請求項1に記載の通話録音可視化システムであって、
    前記各通話録音データは、一つの通話における複数の話者の音声の録音データを含み、
    前記個人性抽出部は、前記各通話録音データに含まれる音声の音響特徴量に基づいて、第1の話者の音声の区間と、第2の話者の音声の区間と、を特定し、前記特定されたそれぞれの音声の区間の音響特徴量を抽出することを特徴とする通話録音可視化システム。
  7. プロセッサと、前記プロセッサに接続される記憶装置と、を有する通話録音可視化システムが実行する通話録音可視化方法であって、
    前記記憶装置は、複数の通話録音データを保持し、
    前記通話録音可視化方法は、
    前記複数の通話録音データから、前記通話録音データに含まれる音声の個人性に関する音響特徴量を抽出する個人性抽出手順と、
    前記抽出された音響特徴量に基づいて、指定された通話録音データに含まれる音声の話者の組と同一の組によって発声された音声を含む一つ以上の通話録音データを特定する話者組特定手順と、
    前記特定された一つ以上の通話録音データを識別する情報を出力する出力手順と、を含むことを特徴とする通話録音可視化方法。
  8. 請求項7に記載の通話録音可視化方法であって、
    前記出力手順は、前記複数の通話録音データを識別する情報を表示し、前記特定された一つ以上の通話録音データを識別する情報を区別可能に表示する手順を含むことを特徴とする通話録音可視化方法。
  9. 請求項7に記載の通話録音可視化方法であって、
    前記各通話録音データに含まれる音声の話者の組の属性を特定する属性特定手順をさらに有し、
    前記出力手順は、前記複数の通話録音データを識別する情報を、前記特定された属性に基づいて分類して表示する手順を含むことを特徴とする通話録音可視化方法。
  10. 請求項9に記載の通話録音可視化方法であって、
    前記記憶装置は、前記各通話録音データに対応する属性情報を保持し、
    前記属性特定手順は、前記属性情報に基づいて、前記各通話録音データに含まれる音声の話者の組の属性を特定する手順を含むことを特徴とする通話録音可視化方法。
  11. 請求項7に記載の通話録音可視化方法であって、
    前記各通話録音データは、一つの通話に関する送信側録音データおよび受信側録音データを含み、
    前記個人性抽出手順は、前記各通話録音データに含まれる前記送信側録音データおよび前記受信側録音データの各々に含まれる音声の音響特徴量に基づいて、前記送信側録音データおよび前記受信側録音データの少なくとも一方に含まれる、複数の話者によって発声された音声のうち、発声時間が最も長い話者の音声の個人性に関する音響特徴量を抽出する手順を含むことを特徴とする通話録音可視化方法。
  12. 請求項7に記載の通話録音可視化方法であって、
    前記各通話録音データは、一つの通話における複数の話者の音声の録音データを含み、
    前記個人性抽出手順は、前記各通話録音データに含まれる音声の音響特徴量に基づいて、第1の話者の音声の区間と、第2の話者の音声の区間と、を特定し、前記特定されたそれぞれの音声の区間の音響特徴量を抽出する手順を含むことを特徴とする通話録音可視化方法。
JP2013232943A 2013-11-11 2013-11-11 通話録音可視化システムおよび通話録音可視化方法 Pending JP2015094811A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013232943A JP2015094811A (ja) 2013-11-11 2013-11-11 通話録音可視化システムおよび通話録音可視化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013232943A JP2015094811A (ja) 2013-11-11 2013-11-11 通話録音可視化システムおよび通話録音可視化方法

Publications (1)

Publication Number Publication Date
JP2015094811A true JP2015094811A (ja) 2015-05-18

Family

ID=53197259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013232943A Pending JP2015094811A (ja) 2013-11-11 2013-11-11 通話録音可視化システムおよび通話録音可視化方法

Country Status (1)

Country Link
JP (1) JP2015094811A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10089061B2 (en) 2015-08-28 2018-10-02 Kabushiki Kaisha Toshiba Electronic device and method
JP2018182475A (ja) * 2017-04-10 2018-11-15 三菱電機ビルテクノサービス株式会社 監視システム
JPWO2019003395A1 (ja) * 2017-06-29 2020-06-11 株式会社オプティム コールセンター会話内容表示システム、方法及びプログラム
US10770077B2 (en) 2015-09-14 2020-09-08 Toshiba Client Solutions CO., LTD. Electronic device and method
KR20220050342A (ko) * 2020-10-16 2022-04-25 (주)디테일컴 음성 합성 서비스를 제공하는 장치, 단말기 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008160530A (ja) * 2006-12-25 2008-07-10 Canon It Solutions Inc 通話データ記録装置、通話データ記録方法、通話データ記録システム及びプログラム
JP2009237353A (ja) * 2008-03-27 2009-10-15 Fujitsu Ltd 関連付け装置、関連付け方法及びコンピュータプログラム
JP2011199615A (ja) * 2010-03-19 2011-10-06 Oki Electric Industry Co Ltd 通話データ管理装置、通話データ管理システム、及び通話データ管理プログラム
JP2011238028A (ja) * 2010-05-11 2011-11-24 Seiko Epson Corp 接客データ記録装置、接客データ記録方法およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008160530A (ja) * 2006-12-25 2008-07-10 Canon It Solutions Inc 通話データ記録装置、通話データ記録方法、通話データ記録システム及びプログラム
JP2009237353A (ja) * 2008-03-27 2009-10-15 Fujitsu Ltd 関連付け装置、関連付け方法及びコンピュータプログラム
JP2011199615A (ja) * 2010-03-19 2011-10-06 Oki Electric Industry Co Ltd 通話データ管理装置、通話データ管理システム、及び通話データ管理プログラム
JP2011238028A (ja) * 2010-05-11 2011-11-24 Seiko Epson Corp 接客データ記録装置、接客データ記録方法およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10089061B2 (en) 2015-08-28 2018-10-02 Kabushiki Kaisha Toshiba Electronic device and method
US10770077B2 (en) 2015-09-14 2020-09-08 Toshiba Client Solutions CO., LTD. Electronic device and method
JP2018182475A (ja) * 2017-04-10 2018-11-15 三菱電機ビルテクノサービス株式会社 監視システム
JPWO2019003395A1 (ja) * 2017-06-29 2020-06-11 株式会社オプティム コールセンター会話内容表示システム、方法及びプログラム
KR20220050342A (ko) * 2020-10-16 2022-04-25 (주)디테일컴 음성 합성 서비스를 제공하는 장치, 단말기 및 방법
KR102574311B1 (ko) * 2020-10-16 2023-09-06 (주)디테일컴 음성 합성 서비스를 제공하는 장치, 단말기 및 방법

Similar Documents

Publication Publication Date Title
CN110235154B (zh) 使用特征关键词将会议与项目进行关联
US11955125B2 (en) Smart speaker and operation method thereof
US8219404B2 (en) Method and apparatus for recognizing a speaker in lawful interception systems
US10489451B2 (en) Voice search system, voice search method, and computer-readable storage medium
WO2022005661A1 (en) Detecting user identity in shared audio source contexts
WO2019000991A1 (zh) 一种声纹识别方法及装置
JP6618992B2 (ja) 発言提示装置、発言提示方法およびプログラム
WO2020238209A1 (zh) 音频处理的方法、系统及相关设备
US10061867B2 (en) System and method for interactive multi-resolution topic detection and tracking
JP6865653B2 (ja) 対話分析システムおよび対話分析プログラム
JP2007212532A (ja) モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム
JP2015094811A (ja) 通話録音可視化システムおよび通話録音可視化方法
CN101867742A (zh) 一种基于声控控制下的电视系统
US20220093103A1 (en) Method, system, and computer-readable recording medium for managing text transcript and memo for audio file
JP2007074175A (ja) 電話業務検査システム及びそのプログラム
JP6664757B1 (ja) 営業支援装置、営業支援方法、営業支援プログラム
KR20210114328A (ko) 통화 녹음 정보 관리방법, 이를 위한 컴퓨터 프로그램
KR102226427B1 (ko) 호칭 결정 장치, 이를 포함하는 대화 서비스 제공 시스템, 호칭 결정을 위한 단말 장치 및 호칭 결정 방법
WO2022143349A1 (zh) 一种确定用户意图的方法及装置
KR102540177B1 (ko) 화자 간 중첩되는 음성을 분리하여 대화록 서비스를 제공하는 방법
KR102291113B1 (ko) 회의록 작성 장치 및 방법
KR20190033750A (ko) 컨퍼런스 시스템 및 상기 시스템에서의 이종 컨퍼런스간 참석자 정보 연계 장치 및 방법
JP2015012463A (ja) 情報処理装置、特定用語通知方法、プログラム、特定用語通知システム、および端末装置
CN115705378A (zh) 一种资源推荐方法、装置及电子设备
EP2874110A1 (en) A method and a system to obtain data from voice analysis in a communication and computer programs products thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180911