JP2017169037A - 通話録音システム及び通話録音方法 - Google Patents

通話録音システム及び通話録音方法 Download PDF

Info

Publication number
JP2017169037A
JP2017169037A JP2016052367A JP2016052367A JP2017169037A JP 2017169037 A JP2017169037 A JP 2017169037A JP 2016052367 A JP2016052367 A JP 2016052367A JP 2016052367 A JP2016052367 A JP 2016052367A JP 2017169037 A JP2017169037 A JP 2017169037A
Authority
JP
Japan
Prior art keywords
recording
call
information
file
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016052367A
Other languages
English (en)
Other versions
JP6680584B2 (ja
Inventor
詳二 富樫
Shoji Togashi
詳二 富樫
杉山 隆司
Takashi Sugiyama
隆司 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Priority to JP2016052367A priority Critical patent/JP6680584B2/ja
Publication of JP2017169037A publication Critical patent/JP2017169037A/ja
Application granted granted Critical
Publication of JP6680584B2 publication Critical patent/JP6680584B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】通話録音システムで生成される録音ファイルに関し、特定音を除去することで、処理量を低減して処理効率を向上させ、TCOを削減させる。【解決手段】電話による通話を録音して録音ファイルを作成する録音装置と、通話イベント・録音情報を取得する通話情報取得装置と、通話・録音情報管理装置とを備え、前記通話イベント・録音情報は、前記通話に関する通話イベントの情報と、前記録音に関する録音情報と、前記通話イベントに関する時間情報及び前記録音に関する時間情報とを含んでおり、前記通話イベント情報、前記録音情報及び前記時間情報に基づき、前記一次録音ファイルに含まれる録音データから特定音に相当する削除イベントと削除時間長の情報とを抽出し、抽出された前記削除イベントと前記削除時間長の情報とに基づき前記削除イベントに関する前記録音データを前記一次録音ファイルから削除して二次録音ファイルとして生成する。【選択図】図9

Description

本発明は、通話録音システム及び通話録音方法に係り、特に、コールセンタやオフィス等における顧客等との通話の内容を録音した録音ファイルの処理技術に関する。
コールセンタやオフィスにおける、顧客との電話対応時の通話を録音ファイルに記録するために、通話録音システムが用いられている。蓄積した録音ファイルを有効活用するために、音声データを、音声認識技術により分析することでテキストとして通話内容を可視化して活用することが行われている。この種の通話録音システムでは、例えば、録音ファイルを検索するインデックスとして、通話情報(通話開始時間、通話終了時間、通話識別ID、内線番号)と録音情報(通話開始時間、通話終了時間、録音ファイル)をデータベースにより管理する。これにより、システムの利用者は、通話情報をキーとして検索し、録音ファイルを再生できる。
特許文献1には、コールセンタやオフィスで生成される電話の通話録音ファイルや監視カメラ等で取得される画像ファイルの管理に関する技術が記載されている。特許文献1によれば、呼制御サーバが、CTIリンク(呼制御用インタファース(I/F))を介して電話システムから、この電話システムのPBXと内部の電話機との間でやり取りされる呼制御情報(電話の着信、発信元電話番号、相手先電話番号等)、この電話システムにおいて端末を操作するオペレータの情報、この電話システムの状態情報、及び端末の情報を取得して管理する。
また、特許文献2には、音声データに含まれる非音声音を判定し、不要な音声パターンに一致する音を識別して、音声認識エンジン内で除外する処理を行うことで、音声認識の精度を向上させる技術が記載されている。
特開2014−116893号公報 特開2014−119536号公報
音声認識装置では、通話録音である録音ファイルを入力として、認識結果を出力する。しかし、録音ファイルには、呼出音や保留音等の特定音が通話音声と共に録音される。録音ファイルに呼出音や保留音等の特定音が含まれる場合、これらの特定音は、実際の通話音声ではないため、音声認識装置による音声認識結果に不要な情報になる。さらに、呼出音および保留音等の特定音の量に比例して、音声認識の処理量が増加し、TCO(Total Cost of Ownership)が増加する。
特許文献1には、録音ファイルの音声認識に関する記載はない。
特許文献2に記載の発明では、非音声音データベースに予め設定された非音声音の特徴データに一致する特徴量データを検索することで不要な非音声音を除外している。この方式では、比較対象の非音声音の特徴量を記憶したデータベースが必要になる。さらに、非音声音の除外処理において、音声の量が多いほど、音声認識処理に要する時間は増大する。
本発明の目的は、通話録音システムで生成される一次録音ファイルに関して、この一次録音ファイルに関連して生成されるイベント情報を用いて特定音の除去処理を行った二次録音ファイルを生成することで、比較対象のデータベースの検索を不要とし、音声認識における処理効率を向上させ、TCOを削減することにある。
本願において開示される発明のうち、代表的なものの概要を説明すれば、下記のとおりである。通話録音システムは、電話による通話を録音して録音ファイルを作成する録音装置と、前記通話及び前記録音に関係する通話イベント・録音情報を取得する通話情報取得装置と、前記録音ファイルを管理する通話・録音情報管理装置とを備え、前記通話イベント・録音情報は、前記通話に関する通話イベントの情報と、前記録音に関する録音情報と、前記通話イベントに関する時間情報及び前記録音に関する時間情報とを含んでおり、前記通話・録音情報管理装置は、前記録音ファイルから特定音の削除処理を行う音声ファイル処理部を有し、前記音声ファイル処理部は、前記録音データの中の前記特定音に対応して、前記通話イベント及び前記録音情報の中で削除可能な削除イベントの情報を取得する機能と、前記録音ファイルを処理対象の一次録音ファイルとし、前記通話イベント情報、前記録音情報及び前記時間情報に基づき、前記一次録音ファイルに含まれる録音データから前記削除イベントと該削除イベントの削除時間長の情報とを抽出し、抽出された前記削除イベントと前記削除時間長の情報とに基づき前記削除イベントに関する前記録音データを前記一次録音ファイルから削除して二次録音ファイルとして生成する機能とを有することを特徴とする。
本発明によれば、一次録音ファイルに関連して生成された通話に関するイベント情報を利用して、一次録音ファイルから特定音の削除処理を行って二次録音ファイルを生成するので、比較対象の特殊なデータベースの検索が不要である。また、音声認識システムにおいて音声認識処理の対象となる処理量が低減するため処理効率が向上し、TCOを削減させることができる。
本発明の実施例1に係る通話録音システムを適用したコールセンタシステムの構成例を示す図。 本発明の実施例1に係る通話録音システムの構成例を示す図。 実施例1における、音声ファイル処理部の機能ブロックの例を示す図。 実施例1における、通話イベント情報テーブルのフォーマットの例を示す図。 実施例1における、録音情報テーブルの構成例を示す図。 実施例1における、音声ファイル処理部への入力情報の一例を示すタイムチャート。 実施例1における、通話録音システムの動作を示すフローチャート。 実施例1における、一次録音ファイルから二次録音ファイルを生成する動作を示すシーケンス図。 実施例1における、通話録音システムの動作を示す模式図。 実施例1における、二次録音ファイルの生成過程の説明図。 本発明の実施例2に対応する、一次録音ファイルの例を示す説明図。 本発明の実施例3に対応する、一次録音ファイルの例を示す説明図。
以下、本発明の実施の形態を、図面に基づいて詳細に説明する。
まず、本発明の実施例1について、図1−図10を参照しながら説明する。
図1は、実施例1に係る通話録音システムを適用したコールセンタシステムの構成例を示す図である。
コールセンタシステムでは、顧客等の架電者(電話をかける者)の顧客側電話機10から公衆網11を介して接続されるIP−PBX(Internet Protocol−Private Branch exchange、IP回線対応構内交換機)12が、ネットワーク接続部13を介して、オペレータ側IP電話機14と接続されている。IP−PBX12は、顧客の顧客側電話機10からの呼を受けて、通話のプロトコル変換、発着信の呼制御などを行う。オペレータ側IP電話機14は、顧客の顧客側電話機10と公衆網11を介した外線による通話をするための装置である。架電者とオペレータとの通話は、通話録音システム100により通話・録音情報として記録・保持される。オペレータ(又は管理者)は、PC端末15を介して、通話録音システム100にアクセスできる。16は呼制御サーバであり、IP−PBX12とオペレータ側IP電話機14との間でやり取りされる通話の呼制御情報(電話の着信、発信元電話番号、相手先電話番号等)、オペレータ側IP電話機14を操作するオペレータの情報、IP−PBX12の状態情報、及びオペレータ側IP電話機14やそれを操作する通話端末(図示略)の情報を取得して管理する。これらの情報はインタフェースを介してネットワーク接続部13に転送される。
通話録音システム100は、例えばサーバ装置で構成され、通話情報取得装置110、録音装置120、音声ファイル処理部(以下では、音声ファイル編集処理部と記載する場合もある)140を含む通話・録音情報管理装置130、及び、音声認識装置160としての機能を備えている。通話情報取得装置110は、通話に関係する通話イベント情報と、録音に関する録音情報とを、各々対応する時間情報と共に、前記通話イベント・録音情報として記録する通話情報取得機能を有している。例えば、IP−PBX12や呼制御サーバ16から、「通話開始」や「通話終了」といった通話イベントに関する情報(通話時刻、内線番号)などを取得する。
録音装置120は、架電者とオペレータの通話音声を通話パケットとして取得し録音ファイルを作成する録音機能を有する。すなわち、顧客側電話機10とオペレータ側IP電話機14、または、オペレータ側IP電話機14同士で通話を行うと、生成される音声パケット(RTPパケット)をキャプチャして録音ファイルを生成する。このRTPパケットに呼出音、保留音が含まれると、その部位も録音ファイルとして生成する。すなわち、録音装置120は、電話機間でやりとりされる通話のデータストリームを、録音データとして録音ファイルに記録する。オペレータ側IP電話機14での通話は、IP網でのRTP(Real−time Transport Protocol)によるものであり、録音装置120に送られ、一定時間ごと等に分割された録音ファイルとして保存される。
通話・録音情報管理装置130は、録音ファイルを管理する機能を有し、IP−PBX12や呼制御サーバ16から取得した録音ファイルに関連する付加的な通話情報(通話イベント情報・録音情報等)に基づき、録音装置120で生成された録音ファイル(本発明では、一次録音ファイルと定義する)153から編集済の録音ファイル(本発明では、二次録音ファイル若しくは編集済録音ファイルと定義する)154を生成し、通話イベント・録音情報管理DB150に保持する機能を有している。すなわち、IP−PBX12とオペレータ側IP電話機14との間でやり取りされる通話用パケット(例えば音声パケット)を取得し、一次録音ファイル153を管理するために、通話の基本属性情報を取得して録音情報テーブル152を作成すると共に、一次録音ファイルの通話に付加的なイベント情報を取得して通話イベント情報テーブル151を作成する。作成された通話イベント情報テーブル151、録音情報テーブル152、及び、一次録音ファイル153は、通話イベント・録音情報管理DB150に記憶される。
通話・録音情報管理装置130において、一次録音ファイル153から編集済の二次録音ファイル154を生成する処理は、音声ファイル編集処理140で実行される。一次録音ファイル153の録音データは、通話音声に関するデータと、通話音声以外の非通話音の音声データとを含んでいる。音声ファイル編集処理部140は、一次録音ファイル153から不要な音声(非通話音)を削除して、編集済録音ファイル154を生成し、バッファメモリ155に記録する。通話・録音情報管理装置130や音声ファイル編集処理部140は、データベースとして、通話・録音情報管理DB150をアクセスする。バッファメモリ155に一時的に格納された編集済録音ファイル154は、音声認識装置160へ転送される。音声認識装置160は、編集済録音ファイル154の音声データである録音データをテキストデータに変換して認識ファイルを生成する機能を有する。音声認識装置160は、データベースとして、音声認識管理DB170をアクセスする。
PC端末15は、入出力部及びプロセッサ(処理手段)を備えた管理者用端末であり、オペレータIP電話機14の稼働状況やオペレータの作業状況を監視する機能を有する。オペレータは、PC端末15から通話録音システム100を操作することにより、必要な通話・録音情報を取得することができる。
なお、録音ファイル(一次録音ファイル153及び編集済録音ファイル154)は、架電者等の通話者とオペレータの間で交わされた通話音から成るファイルであり、例えば、商品注文やサービスの要求・変更、苦情(クレーム)、顧客からの契約内容の確認、等々に関する音声があげられる。録音情報テーブル152として構成される属性情報は、通話(即ち録音ファイル)ごとに特徴的な情報であり、通話パケットから取得される、オペレータと話者間で交わされる通話の開始時刻及び終了時刻、送信元IPアドレス(PBXの内線側のポートIPアドレス)及び宛先IPアドレス(内線電話機のIPアドレス)等が含まれる。
次に、図2を参照しながら、通話・録音情報管理装置130の構成について、より詳細に説明する。
通話・録音情報管理装置130は、通話情報登録部131、録音情報登録部132、検索画面部133、削除判定条件設定部135、録音転送部136、及び、音声ファイル編集処理部140等を備えている。オペレータがPC端末15から検索画面部133を操作して入力した情報に基づき、通話・録音情報管理DB150から音声認識の対象となる一次録音ファイル1530を検索・抽出するための処理がなされる。オペレータが抽出した一次録音ファイル1530の通話IDが認識対象キュー134に入力され、入力順に音声認識の対象となる(Firs−In,First−Out)。また、音声データの特定音(不要音)の削除処理を行うのに必要な削除判定条件が、予め、オペレータにより、PC端末15から削除判定条件設定部135を介して設定される。削除対象となる特定音(不要音)の判定条件の例としては、「保留音声」、「呼出音声」、「自動応答音声」等がある。
音声認識に先行して、音声ファイル編集処理部140において、認識対象キュー134に蓄積された通話IDに対応する一次録音ファイル1530の音声データの削除処理が行われる。一次録音ファイル153から、判定条件に対応する不要な音声データが削除されて、編集済録音ファイル1540が生成される。この編集済録音ファイル1540が、音声認識の対象として、音声認識装置160へ転送される。
音声認識装置160は、録音受付部161、音声認識部162、及び、認識結果DB170を備えている。認識結果DB170には、業務情報・認識情報対応テーブル171や認識結果ファイル172が保持される。なお、認識結果DB170は、通話録音システム100の外部、例えばクラウド上に設けても良い。
音声認識部162は、音声認識エンジン(図示略)により、録音データをテキストデータに変換する。業務情報・認識情報対応テーブルは、コールセンタにおける業務情報に関する録音データの音声認識に使用する認識エンジンを対応付けるテーブルである。
通話・録音情報管理装置130のハードウェア構成は示していないが、プログラムを実行するプロセッサ、データ及び実行予定のプログラムを格納するメモリ等を有し、上記各部は、サーバのプロセッサでプログラムが実行されることでそれらの機能が実現される。
図3に、プログラムが実行されることで実現される音声ファイル編集処理部140の機能ブロックの例を示す。音声ファイル編集処理部140は、認識対象キュー(通話ID)を取得する機能1400、一次録音ファイルの通話データ取得機能1410、録音情報・通話イベント情報取得機能1420、削除対象イベント抽出・削除時間決定処理機能1430、削除判定条件取得機能1440、不要音声削除処理機能1450、編集済録音ファイル処理機能1460、編集済録音ファイル転送機能1470、及び、I/O1480を備えている。
音声ファイル編集処理部140は、通話イベント情報及び録音情報から、通話音声以外の音声(特定音)のデータに対応して予め削除可能に設定されている削除イベントの情報を取得し、通話IDに対応した一次録音ファイル1530を処理対象とする。さらに、この一次録音ファイルに対応した通話イベント情報テーブル151及び録音情報テーブル152から、各イベント情報と各イベントの時間情報とを取得する。そして、一次録音ファイル1530の録音データに含まれる削除イベントとこの削除イベントに対応する削除時間情報とを抽出し、削除時間情報に基づき削除イベントに関する録音データを一次録音ファイルから削除して、編集済録音ファイル154として生成する。この編集済録音ファイル1540は、録音転送部136により、音声認識装置160へ転送される。
図4は、通話イベント情報テーブル151のフォーマットの例を示す図である。
通話イベント情報テーブル151は一次録音ファイルの通話に付加的な属性情報を含んで構成される。すなわち、録音ファイルを識別する通話ID、話者との録音等のイベントを開始した時刻を示すイベント時刻(年月日時分秒)、内線(内線電話機のIPアドレス)、録音開始等のイベントの種別を示すイベント、通話先の外線番号や内線電話番号を示す相手先電話番号、コールセンタで対応するオペレータを識別するオペレータID、電話機からの発信か着信かの種別を示す発着信種別、着信番号、呼識別ID、の各情報を含んでいる。内線や相手先の電話番号は、呼制御用のパケットを監視したり或いはIP−PBXが保持する情報を取得する等の方法で得られる。なお、この例では、イベント「録音開始」と同期してイベント「呼出音」が発生し、イベント「呼出音」の終了とイベント「通話音声」の開始とが同期しているものとする。
この例の通話イベント情報テーブル151によれば、通話ID10000として記録された一連の通話は、内線「1000」から、オペレータOP1000と外線番号「0901122XXXX」の話者との通話であり(呼識別ID=AAAAA)、10時10分00秒に通話が開始されたことがわかる。この通話は、10時15分30秒に一旦保留となり、10時15分45秒に再開され、10時16分30秒に終了している。
図5は、図4の通話イベント情報テーブル151に対応する、録音情報テーブル152の構成例を示す図である。録音情報テーブル152は、一次録音ファイルの基本属性情報を含んで構成される。すなわち、話者との録音を開始した時刻を示す録音開始時刻(年月日時分秒)、同じく録音を終了した時刻を示す録音終了時刻(年月日時分秒)、通話元の内線電話番号を示す内線番号、録音ファイルの送信元IPアドレス(PBXの内線側のポートIPアドレス)IP1及び宛先IPアドレス(内線電話機のIPアドレス)IP2、対応する通話ID、及び、一次録音ファイルの格納場所を示す録音ファイルパス、の各情報を含んでいる。一次録音ファイルは、例として、音声パケットが送信された状態を録音の開始とし、音声パケットが一定期間送信されてない状態を終了と判定して、録音の開始時刻から終了時刻までの音声パケットから生成する。
なお、送信元IPアドレスIP1や宛先IPアドレスIP2は、通話パケットのヘッダ部から取得される。録音ファイルパスは、録音ファイルが格納されているストレージ内ディレクトリ等の情報である。また、通話元の電話番号は、呼制御用のパケットを監視する等の方法で得られる。
この例の録音情報テーブル152によれば、通話ID10000として記録された一連の通話は、10時09分50秒に録音が開始され、10時16分30秒に録音が終了している。
音声ファイル編集処理部140には、認識対象キュー134にある通話ID1400に基づいて取得された一次録音ファイルの通話イベント情報1510及び録音情報1520に関する情報が入力される。図6は、音声ファイル編集処理部140への入力情報600の一例を示す、タイムチャートである。
入力情報600によれば、通話ID10000に対応する一次録音ファイル1530の先頭にはヘッダ1531が付与されている。このヘッダには、一次録音ファイルのファイルサイズや記憶レート(Byte/sec)の情報等が含まれている。一次録音ファイル1530はさらに、録音に関するイベント(録音開始Y1,録音終了Y2)の間で連続した録音ファイルとなっている。通話イベントの(a)呼出音1532は、この例では、録音開始Y1と同期している。通話イベントの通話開始(E1)に伴い通話音声1533が記録され、保留(E2)に伴い通話が一旦保留となり、その間、(b)保留音1534が流れ、通話再開(E3)に伴う通話音声1535が記録され、通話終了(E4)と同期して録音終了(Y2)になっている。
次に、図7−図10を参照しながら、本実施例の通話録音システム100における不要音声データの削除処理の動作を説明する。図7は通話録音システムの動作を示すフローチャート、図8は、一次録音ファイルから編集済録音ファイルを生成する動作を示すシーケンス図、図9は、通話録音システムの動作を示す模式図、図10は、編集済録音ファイルの生成過程の説明図である。
最初に、編集処理対象となる音声ファイル1530を特定するために、認識対象キュー134の検索を行い、処理対象の通話IDを取得する(図7:S701)。すなわち、図8に示すように、オペレータが端末15を介して通話・録音情報管理装置130を起動し、その検索画面133を介して通話情報を要求する。これに対して、通話・録音情報管理装置130は、通話・録音情報管理DB150にアクセスし、通話情報を返信する。端末15のオペレータは、認識処理の対象となる少なくとも1つの一次録音ファイルの通話IDを選択する。選択された通話IDは、認識キュー134に入力され、入力順に音声認識の対象となる。音声ファイル編集処理部140は、認識キュー134を検索して、最初に編集処理を行うべき一次録音ファイルの通話ID1400を取得する。
なお、一次録音ファイルの通話IDの取得は、オペレータが随時行っても良いが、予め編集処理の対象をオペレータが通話・録音情報管理装置130に設定し、所定の時間ごとに定期的に検索処理が実行され、認識キュー134に入力され、さらに、音声認識の処理がなされるようにしても良い。
次に、通話ID1400を基に、通話イベント情報テーブル151から、対応する通話イベント情報1510を取得し(図7:S702)、録音情報テーブル152から、通話ID1400に対応する録音情報1520を取得し(S703)、録音情報1520の録音ファイルパスより、処理対象の一次録音ファイル1530を取得する(S704)。さらに、一次録音ファイルのヘッダ1531から、この一次録音ファイル1530の記憶レート(Byte/sec)を取り出す(S705)。
次に、通話イベント情報1510から、一次録音ファイル1530の各通話イベント(E1,−,Ez)と対応する各イベント開始時刻(Te1,-)を取得する(S706)。また、録音情報1520から、他の通話イベント(録音開始に伴う呼出(Y1))、録音終了(Y2))と、各対応の開始時刻(Ty1)、終了時刻(Ty2)を取得する(S707)。さらに、音声データの削除の判定処理を行うのに必要な、一次録音ファイルのイベント削除条件135を取得する(S708)。
すなわち、図9に示したように、通話・録音情報管理装置130は、通話ID1400に対応する、通話イベント情報151、録音情報152、一次録音ファイル、及び、不要音削除判定条件をそれぞれ取得する。
次に、図7のS706、S707で取得した通話イベントの中から、イベント削除条件135に該当する削除対象の通話イベント(Y1,E2,−)を抽出し、これら各削除対象の各イベントの開始時刻(Ty1,Te2,−)を取得する(S709)。また、削除対象のイベント(録音開始)の時刻(Ty1)と次の非削除イベント(通話開始)の時刻(Te1)の差分時間、すなわち削除時間長(t1)を取得する(S710)。
すなわち、音声データの削除の判定処理の結果、図10のテーブル1000に示したように、音声ファイル編集処理部140において、削除イベント「(a)呼出音」1532と、この削除イベントに対応する削除時間長の情報(t1)とが抽出される。
次に、一次録音ファイル1530から、最初の削除対象のイベント、ここでは、録音開始時刻(Ty1)を始点に、「差分時間(t1)×記憶レート」のバイト数n1を削除する(S711)。すなわち、図10に示したように、一次録音ファイル1530から、通話イベントの「(a)呼出音」1532に対応する録音ファイル部分が削除される。
さらに、削除対象の他のイベントがあるか判定を行う(S712)。削除対象の他のイベントがある場合、削除対象のイベントと次の非削除イベントの開始時刻の差分時間、すなわち削除時間長を取得し(S716)、一次録音ファイルから、削除イベントの開始時刻を始点に、「差分時間×記憶レート」のバイト数nnを削除する(S717)。例えば、図10の例では、判定条件に該当する「(b)保留音」1534と、この削除イベントに対応する削除時間長の情報(t2)とが抽出される。そして、一次録音ファイル1530のデータから、通話イベントの「(b)保留音」1534に対応する録音ファイル部分のデータが削除される。このようにして、一次録音ファイル1530は、図10の「削除済録音ファイル」のような、通話音声1533、1535部分のみを有するデータとなる。
なお、削除イベントに対応する削除時間長(tn)の求め方は、S710、(S716)に記載の方法に限定されるものではない。差分時間(t1、t2、−)として必要なのは、あくまでも、不要音が記録されている削除対象のイベント自体の録音期間であり、削除対象のイベント自体の開始時刻や終了時刻を直接、あるいは間接的に取得することで、差分時間(t1、t2、−)を算出しても良い。
一方、削除対象の他のイベントがない場合、一次録音ファイル1530の非削除ファイル部分(例えば、図6の通話音声1533,1535)のファイルサイズの情報を取得する(図7:S713)。そして、非削除ファイル部分に新サイズ情報を設定した音声ヘッダ1541と通話IDとを付与して、編集済録音ファイル1540を生成する(S714)。すなわち、図10に示したように、編集済録音ファイル1540は、ファイル全体の音声ヘッダ1541、通話音声1533とそれに対応する音声ヘッダ1542,通話音声1535とそれに対応する音声ヘッダ1544、及び通話ID(図示略)で構成される。
このようにして、音声認識要求対象となった一次録音ファイル1530から、呼出音・保留音等の、音声認識に不要な情報である不要音声データが削除された、ファイルのサイズを小さくした新たな編集済録音ファイル1540が生成され、バッファメモリ155に一時的に格納される。
音声ファイル編集処理部140は、認識キュー134を検索して、他に処理すべき一次録音ファイルが存在する場合、その通話IDを取得し、以下、同様の処理を繰り返す。
認識キュー134内の全ての通話IDの処理が完了すると、音声ファイル編集処理部140は、図8、図9に示すように、編集済録音ファイル154を音声認識装置160へ転送する(図7:S715)。音声認識装置160では、転送された編集済録音ファイル154を保持すると共にその音声認識処理を行って、編集済録音ファイル154の音声データである録音データをテキストデータに変換し、その結果を認識結果DB170に保持する。
本実施例によれば、除外すべき特定音の特徴量を記憶した特殊なデータベースは不要であり、通話録音システムで一次録音ファイルと共に生成されるイベント情報を用いることで、容易に保留音・呼出音等の特定音の除去処理を行い、二次録音ファイルを生成することができる。また、音声認識装置160に入力される二次録音ファイルが、音声認識に不要な特定音を予め除外したファイルであり、ファイルサイズが小さくなる。そのため、音声認識装置160が処理する録音ファイルの処理量が減少し、音声認識装置の処理効率を向上させることができる。また、二次録音ファイルのサイズが小さくなるため、認識結果DB170に保持される音声認識されたテキストデータのファイルサイズも小さくなり、コールセンタシステムなどにおけるTCOが削減される。
架電者とオペレータとの通話が同じであったと仮定しても、録音装置等の機能の差異や、コールセンタシステム等の構成の差異によって、一次録音ファイルの音声データや対応するイベント情報が異なったものとなる。
図11は、本発明の実施例2に対応する、一次録音ファイルの例を示す図である。図11の(A)の例では、一連の通話(通話ID1400)の途中で通話音声の無い状態が所定の期間続したため、一次録音ファイル1100が、「(a)呼出音」1532と通話音声1533を含む一次録音ファイル(1)と、通話音声1535のみの一次録音ファイル(2)の2個のファイルとして記録されている。この例では、図7のS710−S711とは異なり、「(b)保留音」1534の削除処理が不要である。一次録音ファイル(1)から呼出音1532を除外した、新たな編集済録音ファイル1540が生成される。
なお、実施例1及び図11の(A)の例では、「(a)呼出音」のイベント開始とイベント「録音開始」とが同期し、「(a)呼出音」のイベント終了と通話開始のイベントE1とが同期しているが、これらが、異なるイベント情報のパターンとして取得される場合もある。例えば、図11の(B)の例では、一連の通話(通話ID1400)を記録した一次録音ファイル1110が、「(a)呼出音」のみの一次録音ファイル(1)、通話音声1のみの一次録音ファイル(2)、通話音声のみの一次録音ファイル(3)の、3個のファイルとして記録されている。イベント「呼出音」の開始と、イベント「録音開始」、イベント「呼出音」の終了と通話開始のイベントとは同期していない。図11の(B)の例では、「(a)呼出音」のイベント開始やイベント終了の情報が、呼制御サーバの情報などからイベント情報として取得される(図示略)。実施例1に関して図7のS710−S711、S716−S717で述べた処理とは異なり、削除対象のイベント「(a)呼出音」1532の開始時刻とその終了時刻との差分時間(t1)が取得される。そして、「(a)呼出音」の開始時刻を始点に、「差分時間(t1)×記憶レート」のバイト数n1を削除する。削除対象の他のイベントに関しても同様である。この例でも、実施例1と同様にして、一次録音ファイル(1)の呼出音を除外した、新たな編集済録音ファイル1540が生成される。本実施例でも、実施例1と同様な効果がある。
コールセンタ業務において、架電者とオペレータとの一連の通話の形態として、架電者が同じでオペレータが複数になる場合もある。
図12は、本発明の実施例3に対応する、一次録音ファイルの例を示す図である。この例では、架電者が同じであり(呼識別ID=AAA)、通話が内線1000のオペレータから内線2000のオペレータに引継がれており、通話ID=10000の一次録音ファイル(1)と通話ID=10001の一次録音ファイル(2)とが記録されている。コールセンタ業務においては、同じ架電者からの一連の会話は、1つの一次録音ファイル1530として管理し、音声認識処理できることが望ましい。このような例では、実施例1と同様にして、通話ID毎に管理可能な編集済録音ファイルを生成すると共に、呼識別ID単位で管理できる、1つの編集済録音ファイル1530として管理することもできる。
本実施例でも、実施例1と同様な効果がある。
以上、本発明をコールセンタシステムに適用した例について述べたが、本発明は、架電者とオペレータとの間で行われた通話の応対情報を録音装置や録画装置に記録し、そのデータを再利用する他のシステム、例えばヘルプデスク支援システム等にも適用できる。
10…顧客側電話機、11…公衆網、12…IP−PBX(Internet Protocol−Private Branch exchange、IP回線対応構内交換機)、13…ネットワーク接続部、14…オペレータ側IP電話機、15…PC端末、16…呼制御サーバ、100…通話録音システム、110…通話情報取得装置、120…録音装置、130…通話・録音情報管理装置、131…通話情報登録部、132…録音情報登録部、133…検索画面部、134…処理対象キュー、135…削除判定条件、136…録音転送部、140…音声ファイル編集処理部、150…通話イベント・録音情報管理DB、151…通話イベント情報テーブル、152…録音情報テーブル、153…一次録音ファイル、154…二次録音ファイル(編集済録音ファイル)、155…バッファメモリ、160…音声認識装置、161…録音受付部、162…音声認識部、170…音声認識管理DB、171…業務情報・認識情報対応テーブル、172…認識ファイル、600…音声ファイル編集処理部への入力情報、1000…テーブル、1400…処理対象キュー(通話ID)取得機能、1410…一次録音ファイルの通話データ取得機能、1420…録音情報・通話イベント情報取得機能、1430…削除対象イベント抽出・削除時間決定処理機能、1440…削除判定条件取得機能、1450…不要音声削除処理機能、1460…編集済録音ファイル処理機能、1470…編集済録音ファイル処理機能、1480…I/O、1510…イベン情報、1520…録音情報、1530…処理対象の一次録音ファイル、1531…音声ヘッダ、1532…呼出音、1533…通話音声、1534…保留音、1535…通話音声、1540…編集済録音ファイル、1541…音声ヘッダ、1542…音声ヘッダ、1544…音声ヘッダ。

Claims (10)

  1. 電話による通話を録音し録音ファイルを作成する録音装置と、
    前記通話及び前記録音に関係する通話イベント・録音情報を取得する通話情報取得装置と、
    前記録音ファイルを管理する通話・録音情報管理装置とを備え、
    前記通話イベント・録音情報は、前記通話に関する通話イベントの情報と、前記録音に関する録音情報と、前記通話イベントに関する時間情報及び前記録音に関する時間情報とを含んでおり、
    前記通話・録音情報管理装置は、前記録音ファイルから特定音の削除処理を行う音声ファイル処理部を有し、
    前記音声ファイル処理部は、
    前記録音データの中の前記特定音に対応して、前記通話イベント及び前記録音情報の中で削除可能な削除イベントの情報を取得する機能と、
    前記録音ファイルを処理対象の一次録音ファイルとし、前記通話イベント情報、前記録音情報及び前記時間情報に基づき、前記一次録音ファイルに含まれる録音データから前記削除イベントと該削除イベントの削除時間長の情報とを抽出し、抽出された前記削除イベントと前記削除時間長の情報とに基づき前記削除イベントに関する前記録音データを前記一次録音ファイルから削除して二次録音ファイルとして生成する機能とを有する
    ことを特徴とする通話録音システム。
  2. 請求項1において、
    前記音声ファイル処理部は、
    前記一次録音ファイルのヘッダから、当該一次録音ファイルの記憶レート(Byte/sec)を取得する機能と、
    前記一次録音ファイルから、前記削除イベントの開始時刻を始点に、前記削除時間長×前記記憶レートのバイト数nを削除し、前記二次録音ファイルとして生成する機能とを有する
    ことを特徴とする通話録音システム。
  3. 請求項2において、
    前記通話イベント情報は、前記通話のパケットから取得される情報であり、通話IDと、通話開始・保留・再開・通話終了を含む通話種別と、前記通話種別の各通話時刻の情報を含んでおり、
    前記録音情報は、前記録音装置による録音開始とその時刻、録音終了とその時刻、録音ファイルパス及び前記通話IDを含んでいる
    ことを特徴とする通話録音システム。
  4. 請求項3において、
    前記削除イベントは、呼出及び保留を含んでおり、
    前記音声ファイル処理部は、
    前記録音開始の時刻から前記通話開始の時刻までを前記呼出に関する前記削除時間長として取得し、
    前記保留の時刻から前記再開の時刻までを前記保留に関する前記削除時間長として取得する
    ことを特徴とする通話録音システム。
  5. 請求項3において、
    前記音声ファイル処理部は、
    前記一次録音ファイルの非削除ファイル部分のファイルサイズの情報を取得し、前記非削除ファイル部分に新たなサイズ情報を設定した音声ヘッダと通話IDとを付与して、前記二次録音ファイルを生成する機能を有する
    ことを特徴とする通話録音システム。
  6. 請求項5において、
    さらに、音声認識装置を備えており、
    前記一次録音ファイルは、音声認識の対象として前記通話IDにより前記録音情報から選択されたものであり、
    前記音声ファイル処理部は、前記二次録音ファイルを前記音声認識装置へ転送する機能を有し、
    前記音声認識装置は、前記二次録音ファイルの前記録音データをテキストデータに変換する機能を有する
    ことを特徴とする通話録音システム。
  7. 請求項6において、
    前記通話・録音情報管理装置は、
    認識処理の対象となる前記一次録音ファイルの前記通話IDをオペレータが選択するための検索画面と、
    選択された前記通話IDを入力する認識キューを有し、
    前記音声ファイル処理部は、前記認識キューを検索して、前記通話IDを基に前記音声認識の対象となる前記一次録音ファイルを取得する
    ことを特徴とする通話録音システム。
  8. 電話による通話を録音し録音ファイルを作成する通話録音方法であって、
    前記通話に関する通話イベント情報と、前記録音に関する録音情報と、前記通話イベントに関する時間情報及び前記録音に関する時間情報とを記録し、
    前記録音ファイルから特定音を削除する削除判定条件を取得し、
    前記削除判定条件に基づき、前記通話イベント及び前記録音情報の中で削除可能に設定されている削除イベントの情報を取得し、
    前記録音ファイルを処理対象の一次録音ファイルとし、前記通話イベント情報、前記録音情報及び前記時間情報に基づき、前記一次録音ファイルに含まれる録音データから前記削除イベントと該削除イベントの削除時間長の情報とを抽出し、抽出された前記削除イベントと前記削除時間長の情報とに基づき前記削除イベントに関する前記録音データを前記一次録音ファイルから削除して二次録音ファイルとして生成する
    ことを特徴とする通話録音方法。
  9. 請求項8において、
    前記一次録音ファイルのヘッダから、当該一次録音ファイルの記憶レート(Byte/sec)を取得し、
    前記一次録音ファイルから、前記削除イベントの開始時刻を始点に、前記削除時間長×前記記憶レートのバイト数nを削除し、前記二次録音ファイルとして生成する
    ことを特徴とする通話録音方法。
  10. 請求項9において、
    前記一次録音ファイルの非削除ファイル部分のファイルサイズの情報を取得し、前記非削除ファイル部分に新たなサイズ情報を設定した音声ヘッダと通話IDとを付与して、前記二次録音ファイルを生成する
    ことを特徴とする通話録音方法。
JP2016052367A 2016-03-16 2016-03-16 通話録音システム及び通話録音方法 Active JP6680584B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016052367A JP6680584B2 (ja) 2016-03-16 2016-03-16 通話録音システム及び通話録音方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016052367A JP6680584B2 (ja) 2016-03-16 2016-03-16 通話録音システム及び通話録音方法

Publications (2)

Publication Number Publication Date
JP2017169037A true JP2017169037A (ja) 2017-09-21
JP6680584B2 JP6680584B2 (ja) 2020-04-15

Family

ID=59909187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016052367A Active JP6680584B2 (ja) 2016-03-16 2016-03-16 通話録音システム及び通話録音方法

Country Status (1)

Country Link
JP (1) JP6680584B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019176222A (ja) * 2018-03-27 2019-10-10 株式会社日立情報通信エンジニアリング 通話録音システム、録音通話再生方法
JP2020078000A (ja) * 2018-11-08 2020-05-21 株式会社日立情報通信エンジニアリング 通話録音システムおよび通話録音方法
JP2021179639A (ja) * 2019-11-12 2021-11-18 ティ・アイ・エル株式会社 音声認識装置、管理システム、管理プログラム及び音声認識方法
JP2022141541A (ja) * 2021-03-15 2022-09-29 株式会社ナカヨ 通話録音システム、主装置、音声認識依頼端末、プログラム、および電話機の通話録音方法
WO2023058256A1 (ja) * 2021-10-04 2023-04-13 Nttテクノクロス株式会社 情報処理装置、情報処理方法及びプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019176222A (ja) * 2018-03-27 2019-10-10 株式会社日立情報通信エンジニアリング 通話録音システム、録音通話再生方法
US10855837B2 (en) 2018-03-27 2020-12-01 Hitachi Information & Telecommunication Engineering, Ltd. Call recording system and method of reproducing recorded call
JP7075797B2 (ja) 2018-03-27 2022-05-26 株式会社日立情報通信エンジニアリング 通話録音システム、録音通話再生方法
JP2020078000A (ja) * 2018-11-08 2020-05-21 株式会社日立情報通信エンジニアリング 通話録音システムおよび通話録音方法
JP7227739B2 (ja) 2018-11-08 2023-02-22 株式会社日立情報通信エンジニアリング 通話録音システムおよび通話録音方法
JP2021179639A (ja) * 2019-11-12 2021-11-18 ティ・アイ・エル株式会社 音声認識装置、管理システム、管理プログラム及び音声認識方法
JP7288701B2 (ja) 2019-11-12 2023-06-08 ティ・アイ・エル株式会社 音声認識装置
JP2022141541A (ja) * 2021-03-15 2022-09-29 株式会社ナカヨ 通話録音システム、主装置、音声認識依頼端末、プログラム、および電話機の通話録音方法
JP7380620B2 (ja) 2021-03-15 2023-11-15 株式会社ナカヨ 通話録音システム、主装置、音声認識依頼端末、プログラム、および電話機の通話録音方法
WO2023058256A1 (ja) * 2021-10-04 2023-04-13 Nttテクノクロス株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP6680584B2 (ja) 2020-04-15

Similar Documents

Publication Publication Date Title
JP6680584B2 (ja) 通話録音システム及び通話録音方法
US7751538B2 (en) Policy based information lifecycle management
US8588377B2 (en) Method and system for grouping voice messages
US7330536B2 (en) Message indexing and archiving
JP5645441B2 (ja) 音声メッセージシステムによる発呼者の認識
US8391445B2 (en) Caller identification using voice recognition
US7457396B2 (en) Automated call management
US20090110156A1 (en) Method and apparatus for the storage of recorded audio and retrieval from an associated URL
US8842660B2 (en) VoIP variable metadata
JP4747573B2 (ja) 音声情報加工システム、音声情報加工方法及び音声情報加工プログラム
CN110943938A (zh) 一种ims交换网电话终端实时录音方法和系统
US10334101B2 (en) System and method for generating metadata for a recorded session
US9344559B2 (en) Method and device for the legally secure archiving of telephone contents
JP2009218775A (ja) コールセンタシステム
JP2017067881A (ja) 音声認識装置、音声認識システムおよび音声認識方法
EA007138B1 (ru) Способ передачи звукового сообщения с мобильного терминала, в том числе не имеющего доступа к сети интернет, в любой адрес электронной почты
JP4716902B2 (ja) 内線電話システム
JP6213716B2 (ja) 電話装置および通話音声録音方法
JP6881212B2 (ja) 電話装置
TW201233130A (en) Automatic call transfer system and method allowing online editing
US8103873B2 (en) Method and system for processing auditory communications
JP2015076808A (ja) 通話録音システム及び録音ファイル処理方法
JP2017163198A (ja) 音声認識システム、コネクト装置および音声認識方法
JP4152243B2 (ja) 公衆網接続方法および公衆網接続プログラム
JP7033426B2 (ja) 音声録音再生システム及び音声録音再生方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200319

R150 Certificate of patent or registration of utility model

Ref document number: 6680584

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250