JP5860085B2 - Call recording server, call data management system, and call data management method - Google Patents
Call recording server, call data management system, and call data management method Download PDFInfo
- Publication number
- JP5860085B2 JP5860085B2 JP2014053355A JP2014053355A JP5860085B2 JP 5860085 B2 JP5860085 B2 JP 5860085B2 JP 2014053355 A JP2014053355 A JP 2014053355A JP 2014053355 A JP2014053355 A JP 2014053355A JP 5860085 B2 JP5860085 B2 JP 5860085B2
- Authority
- JP
- Japan
- Prior art keywords
- call
- voice
- data
- server
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 46
- 238000013523 data management Methods 0.000 title claims description 30
- 238000004891 communication Methods 0.000 claims description 58
- 238000007726 management method Methods 0.000 claims description 50
- 238000012806 monitoring device Methods 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 19
- 230000004044 response Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 description 25
- 238000012544 monitoring process Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2281—Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1083—In-session procedures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42221—Conversation recording systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M7/00—Arrangements for interconnection between switching centres
- H04M7/006—Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Technology Law (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、IP電話網における通話音声のデータを記録して管理する、通話録音サーバ、通話データ管理システム、および通話データ管理方法に関する。 The present invention relates to a call recording server, a call data management system, and a call data management method for recording and managing call voice data in an IP telephone network.
従来、コールセンターにおけるサービス品質の向上等の様々な目的で、通話内容を確認あるいは監視(以下「監視」という)することが行われている。また、近年、VoIP(Voice over Internet Protocol)技術を使用したIP電話の普及が進んでいる。このため、IP電話網における通話音声のデータを記録して管理するための様々な技術が存在している(例えば、特許文献1参照)。 Conventionally, confirmation or monitoring (hereinafter referred to as “monitoring”) of call contents has been performed for various purposes such as improvement of service quality in a call center. In recent years, IP telephones using VoIP (Voice over Internet Protocol) technology have been spreading. For this reason, there are various techniques for recording and managing call voice data in an IP telephone network (see, for example, Patent Document 1).
特許文献1に記載の技術(以下「従来技術」という)において、コールセンターのオペレータ端末は、電話対応が終了した後にオペレータによって作成される業務履歴情報と、通話音声の音声データに対する音声認識処理の結果である音声認識情報とを、サーバに送信する。管理者の端末は、業務履歴情報および音声認識情報を取得し、管理者に提示する。 In the technique described in Patent Document 1 (hereinafter referred to as “prior art”), the call center operator terminal is the result of voice recognition processing on the work history information created by the operator after completion of the telephone correspondence and the voice data of the call voice. Is transmitted to the server. The administrator's terminal acquires the business history information and the voice recognition information and presents them to the administrator.
かかる従来技術によれば、IP電話網における通話音声に対する音声認識結果を、通話が終了した後に管理者が確認することができる。すなわち、従来技術を用いることにより、IP電話の通話内容を監視することができる。 According to such a conventional technique, the administrator can confirm the voice recognition result for the call voice in the IP telephone network after the call is finished. That is, by using the prior art, it is possible to monitor the contents of the IP telephone call.
しかしながら、各通話が終了した後に、確認が必要な通話をピックアップし、ピックアップされた通話の音声データを検索して、蓄積された音声認識結果や音声データを確認するといった作業は、手間が掛かる。大規模なコールセンターのようにIP電話機の個数が多い場合、サーバに蓄積される上記業務履歴情報および音声認識情報の量も多くなり、かかる作業は、非常に煩雑なものとなる。したがって、従来技術は、監視対象となるIP電話機の個数が多いケースに適用することが難しい。 However, it takes time and effort to pick up a call that needs to be confirmed after each call is finished, to search the voice data of the picked-up call, and to check the stored voice recognition results and voice data. When the number of IP telephones is large as in a large-scale call center, the amount of the business history information and voice recognition information stored in the server increases, and this work becomes very complicated. Therefore, it is difficult to apply the conventional technique to a case where the number of IP telephones to be monitored is large.
本発明の目的は、より簡単に多数のIP電話機の通話内容を監視することを可能にする、通話録音サーバ、通話データ管理システム、および通話データ管理方法を提供することである。 An object of the present invention is to provide a call recording server, a call data management system, and a call data management method that make it possible to more easily monitor call contents of a large number of IP telephones.
本開示の通話録音サーバは、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録する音声記録制御部と、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、取得された前記通話開始タイミングの直後に、記録された前記音声データに対する音声認識処理を開始させる音声認識制御部と、を有する。 The call recording server of the present disclosure is based on a voice recording control unit that sequentially acquires and records voice data of a call transmitted over the IP telephone network in a memory, and control information associated with the acquired voice data, A call start acquisition unit that acquires a call start timing at which the call is started; and a voice recognition control unit that starts a voice recognition process for the recorded voice data immediately after the acquired call start timing. .
本開示の通話データ管理システムは、IP電話網で伝送される通話の音声データを記録する通話録音サーバと、記録された前記音声データに対する音声認識処理を行い、前記音声認識処理の結果であるテキストデータを生成する音声認識サーバと、記録された前記音声データと生成された前記テキストデータとを、対応付けて提示するモニタリング装置と、を有する通話データ管理システムであって、前記通話録音サーバは、IP電話網から前記音声データを順次取得してメモリに記録する音声記録制御部と、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、記録された前記音声データを前記音声認識サーバへ出力し、前記音声認識サーバに対して、取得された前記通話開始タイミングの直後に、前記音声データに対する音声認識処理を開始させる音声認識制御部と、を有する。 The call data management system according to the present disclosure includes a call recording server that records voice data of a call transmitted over an IP telephone network, a voice recognition process for the recorded voice data, and a text that is a result of the voice recognition process. A call data management system comprising: a voice recognition server that generates data; and a monitoring device that presents the recorded voice data and the generated text data in association with each other, wherein the call recording server includes: A voice recording control unit that sequentially acquires the voice data from the IP telephone network and records it in a memory, and a call that acquires a call start timing at which the call is started based on control information that accompanies the acquired voice data A start acquisition unit and the recorded voice data are output to the voice recognition server, and acquired by the voice recognition server. Immediately after the call start timing was, having a voice recognition control section to start the speech recognition process on the voice data.
本開示の通話データ管理方法は、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録するステップと、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得するステップと、取得された前記通話開始タイミングの直後に、記録された前記音声データに対する音声認識処理を開始させるステップと、を有する。 The call data management method according to the present disclosure includes a step of sequentially acquiring voice data of a call transmitted over an IP telephone network and recording the voice data in a memory, and the call based on control information associated with the acquired voice data. And a step of acquiring a voice recognition process for the recorded voice data immediately after the acquired call start timing.
本開示によれば、IP電話網で伝送される通話の音声データに対する音声認識処理を、通話開始タイミングの直後から開始するので、音声認識結果を、通話の最中に、ほぼリアルタイムに提示することができる。したがって、本開示によれば、より簡単に多数のIP電話機の通話内容を監視することを可能にする。 According to the present disclosure, since voice recognition processing for voice data of a call transmitted over the IP telephone network is started immediately after the call start timing, the voice recognition result can be presented almost in real time during the call. Can do. Therefore, according to the present disclosure, it is possible to more easily monitor the call contents of a large number of IP telephones.
以下、本発明の一実施の形態について、図面を参照して詳細に説明する。本実施の形態は、本発明を、多数のIP電話機を配置したコールセンターの通話監視システムに適用した場合の、具体的態様の一例である。 Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings. This embodiment is an example of a specific mode when the present invention is applied to a call center call monitoring system in which a large number of IP telephones are arranged.
<システム構成>
まず、本実施の形態に係る通話データ管理システムを含む通信システムの構成について説明する。
<System configuration>
First, the configuration of a communication system including a call data management system according to the present embodiment will be described.
図1は、本実施の形態に係る通話データ管理システムを含む通信システムの構成の一例を示すシステム構成図である。 FIG. 1 is a system configuration diagram showing an example of a configuration of a communication system including a call data management system according to the present embodiment.
図1において、通信システム100は、外線網200、内線網300、および通話管理網400を有する。
In FIG. 1, the
外線網200は、インターネット等の公共網であり、コールセンターの顧客が使用するIP端末(図示せず)が接続された通信ネットワークである。すなわち、外線網200は、コールセンターが形成するIP電話網の一部を構成する。
The
内線網300は、コールセンターに構築されたLAN(Local Area Network)等の通信ネットワークの一部である。内線網300は、第1〜第Nの電話機3101〜310N、ネットワーク機器320、およびPBX(Private Branch eXchange)装置330を有する。
The
各電話機310は、顧客対応を行うオペレータが使用するIP電話機である。第1〜第Nの電話機3101〜310Nは、ネットワーク機器320を介してそれぞれPBX(Private Branch eXchange)装置330に接続されている。
Each telephone 310 is an IP telephone used by an operator who handles customers. The first to Nth telephones 310 1 to 310 N are connected to a PBX (Private Branch eXchange) device 330 via a
ネットワーク機器320は、各電話機310とPBX330との間で、IPパケットの転送を行う中継装置であり、例えば、スイッチングハブ、TAPボックス、あるいはルータである。但し、ネットワーク機器320は、ポートミラーリング等の機能により、転送するIPパケットの複製を、通話管理網400へ送信する。
The
PBX装置330は、構内交換機であり、外線網200に接続されている。PBX装置330は、第1〜第Nの電話機3101〜310Nを宛先とするIPパケットを外線網200から受信し、ネットワーク機器320へ転送する。また、PBX装置330は、外線網200のIP電話機(図示せず)を宛先とするIPパケットをネットワーク機器320から受信し、外線網200へ転送する。
The PBX device 330 is a private branch exchange and is connected to the
すなわち、内線網300は、IP電話網の一部を構成し、コールセンターで行われる多数の通話のIPパケットを伝送しつつ、伝送するIPパケットの複製を通話管理網400へ送信する。
That is, the
通話管理網400は、例えば、コールセンターに構築されたLAN等の通信ネットワークの一部であり、本発明の通話データ管理システムに対応する部分である。通話管理網400は、通話録音サーバ410、管理サーバ420、音声認識サーバ430、およびモニタリング装置440を有する。
The
なお、各装置の接続関係は、図1に示す接続線に限定されない。各装置は、例えば、LANにそれぞれ接続されており、どの装置の間でも通信が可能となっている。 In addition, the connection relationship of each apparatus is not limited to the connection line shown in FIG. Each device is connected to a LAN, for example, and can communicate with any device.
通話録音サーバ410は、内線網300のネットワーク機器320に接続されている。通話録音サーバ410は、ネットワーク機器320から送信されるIPパケットを受信し、受信したIPパケットから通話の音声データを抽出して、記録する。すなわち、通話録音サーバ410は、IP電話網で伝送される通話の音声データを記録する。
The
図2は、通話録音サーバ410の構成の一例を示すブロック図である。
FIG. 2 is a block diagram illustrating an example of the configuration of the
図2において、通話録音サーバ410は、電話網通信部411、管理網通信部412、メモリ413、音声記録制御部414、通話開始取得部415、および音声認識制御部416を有する。
In FIG. 2, the
電話網通信部411は、内線網300の通信ネットワークに接続するための通信インタフェースであり、ネットワーク機器320に接続されている。電話網通信部411は、ネットワーク機器320から送信されるIPパケットを受信し、受信したIPパケットを、逐次、音声記録制御部414および通話開始取得部415へ出力する。
The telephone network communication unit 411 is a communication interface for connecting to the communication network of the
管理網通信部412は、通話管理網400の通信ネットワークに接続するための通信インタフェースであり、管理サーバ420、音声認識サーバ430、およびモニタリング装置440に接続されている。
The management
メモリ413は、ハードディスク等の記録媒体であり、音声記録制御部414から格納される情報を、読み出し可能に保持する。
The
音声記録制御部414は、入力されたIPパケットを解析し、IPパケットのそれぞれから、音声データ(通話音声信号)および制御情報(通信制御信号)を抽出する。そして、音声記録制御部414は、抽出した音声データを、制御情報等の音声データを特定する情報と対応付けて、逐次、メモリ413に格納させる。すなわち、音声記録制御部414は、IP電話網から音声データを順次取得して、メモリ413に記録する。
The voice
音声データは、通話における双方の話者の発話音声を含む音響データである。制御情報は、音声データに付随する情報であり、通話識別情報、話者識別情報、および時刻情報を含む。通話識別情報は、通話を識別するための情報である。話者識別情報は、音声データに含まれる発話音声の話者(IP電話機)を識別するための情報である。時刻情報は、音声データが対応する時刻を示す情報である。制御情報は、IPパケットのヘッダ部分から取得されてもよいし、IPパケットのペイロード部分から取得されてもよい。 The voice data is acoustic data including the voices of both speakers in a call. The control information is information attached to the voice data, and includes call identification information, speaker identification information, and time information. The call identification information is information for identifying a call. The speaker identification information is information for identifying the speaker (IP telephone) of the uttered voice included in the voice data. The time information is information indicating the time corresponding to the audio data. The control information may be acquired from the header portion of the IP packet or may be acquired from the payload portion of the IP packet.
通話開始取得部415は、入力されたIPパケットを解析し、IPパケットのそれぞれから、通話識別情報を含む制御情報を抽出する。通話開始取得部415は、抽出した制御情報に基づいて、通話毎に、電話網通信部411が当該通話のIPパケットを最初に受信したタイミングを特定する。通話開始取得部415は、特定された前記タイミングを、当該通話が開始されたタイミング(以下「通話開始タイミング」という)として取得する。そして、通話開始取得部415は、通話開始タイミングを取得する毎に、通話開始タイミングである事を、対応する通話の制御情報と共に、音声認識制御部416へ通知する。
The call
なお、通話開始取得部415は、制御情報に、通話開始時刻を示す情報等、通話開始タイミングを直接的に示す情報が含まれている場合、かかる情報から通話開始タイミングを取得してもよい。
When the control information includes information directly indicating the call start timing, such as information indicating the call start time, the call start acquiring
また、IPパケットからの音声データおよび制御情報の抽出は、電話網通信部411で行われてもよい。 Further, extraction of voice data and control information from the IP packet may be performed by the telephone network communication unit 411.
音声認識制御部416は、通話開始タイミングである事を通知されると、音声データ管理網通信部412を介して、管理サーバ420に対し、通話開始タイミングである事を示す通話開始通知を送信する。通話開始通知には、例えば、制御情報が含まれる。
When notified that the call start timing is reached, the voice
また、音声認識制御部416は、音声データ管理網通信部412を介して、音声データの送信の要求(以下「音声送信要求」という)を受信すると、メモリ413に記録された、要求の対象となる音声データを、要求元へ返信する。音声送信要求には、制御情報等の音声データを特定する情報が含まれる。また、音声送信要求は、例えば、音声認識サーハ゛430およびモニタリング装置440から送信される。音声送信要求は、例えば、通話識別情報を指定して、対応する通話の音声データが格納され次第、当該音声データを逐次返信することを要求する内容である。
When the voice
後述するが、通話開始通知が送信されると、管理サーバ420の管理機能により、音声認識サーバ430は、通話録音サーバ410に対して音声データを要求し、返信された音声データに対する音声認識処理を開始する。
As will be described later, when a call start notification is transmitted, the management function of the
すなわち、音声認識制御部416は、通話開始通知の送信の結果、記録された音声データを音声認識サーバ430へ出力し、通話開始タイミングの直後に、メモリ413に記録された音声データに対する音声認識サーバ430の音声認識処理を、開始させる。
That is, the voice
図1の管理サーバ420は、通話録音サーバ410から送信された通話開始通知を受信することにより、通話開始タイミングを取得する。そして、管理サーバ420は、取得された通話開始タイミングに基づいて、通話録音サーバ410、音声認識サーバ430、およびモニタリング装置440のそれぞれの動作タイミングを制御する。
The
より具体的には、管理サーバ420は、通話開始通知を受信すると、通話開始通知に含まれる制御情報に基づいて、通話開始通知が示す通話の音声データに対して、音声認識処理を行うか否かを決定する。
More specifically, when the
そして、管理サーバ420は、音声認識を行うと判断した場合、音声認識サーバ430に対して、通話録音サーバ410に記録された音声データに対する音声認識処理の開始の要求(以下「認識開始要求」という)を送信する。認識開始要求には、制御情報等の音声データを特定する情報が含まれる。
If the
また、管理サーバ420は、音声認識を行うと判断した場合、モニタリング装置440に対して、通話開始通知を転送する。更に、管理サーバ420は、音声認識サーバ430から、音声認識処理が開始された旨の通知(以下「認識開始通知」という)を受信すると、当該認識開始通知を、モニタリング装置へ転送する。認識開始通知には、制御情報等の音声データを特定する情報が含まれる。
In addition, when the
音声認識サーバ430は、認識開始要求を受信すると、通話録音サーバ410に対して、認識開始要求と同一の音声データを対象とした、音声送信要求を送信する。そして、音声認識サーバ430は、通話録音サーバ410から返信された音声データに対する音声認識処理を行い、音声認識処理の結果であるテキストデータを生成し、音声認識サーバ430のメモリ(図示)に格納する。
Upon receiving the recognition start request, the
音声認識サーバ430は、公知の音声認識技術による音声認識処理を行う。例えば、音声認識サーバは、音声認識データベース、音響分析部、および認識デコーダ部を有する(いずれも図示せず)。
The
音声認識データベースは、音響モデル、辞書、および言語モデルを予め格納している。音響モデルは、音声の特徴量と発音記号との確率的な対応付けをデータ化したものである。辞書は、音声認識処理による音声認識結果の候補群として、複数のテキスト配列を記述したものである。言語モデルは、辞書に記述されたテキスト配列のそれぞれについて、出現確率や接続確率をデータ化したものである。 The speech recognition database stores an acoustic model, a dictionary, and a language model in advance. The acoustic model is obtained by converting a stochastic association between a feature amount of a voice and a phonetic symbol into data. The dictionary describes a plurality of text arrays as a candidate group of speech recognition results by speech recognition processing. The language model is obtained by converting the appearance probability and connection probability into data for each text array described in the dictionary.
音響分析部は、音声信号に対してフレーム処理を行い、フレームごとにフーリエ解析を含む所定の処理を行って、音声特徴量を抽出する。そして、音響分析部は、解析結果から、発話音声が含まれている音声区間を検出し、音声区間の音声特徴量のみによる時系列データを生成する。 The acoustic analysis unit performs frame processing on the audio signal, performs predetermined processing including Fourier analysis for each frame, and extracts the audio feature amount. Then, the acoustic analysis unit detects a speech section including the speech voice from the analysis result, and generates time-series data based only on the speech feature amount of the speech section.
認識デコーダ部は、音響分析部が生成した音声特徴量の時系列データに基づき、音声認識データベースの音響モデル、辞書、および言語モデルを参照して、音声認識結果を決定する。 The recognition decoder unit determines a speech recognition result by referring to the acoustic model, dictionary, and language model of the speech recognition database based on the time series data of the speech feature amount generated by the acoustic analysis unit.
なお、音声認識結果には、音声認識が成功した場合、発話音声をテキスト化したテキストデータが含まれる。すなわち、音声認識サーバ430は、通話録音サーバ410に記録された音声データに対する音声認識処理を行い、音声認識処理の結果であるテキストデータを生成する。
Note that the speech recognition result includes text data obtained by converting the uttered speech into text when speech recognition is successful. That is, the
また、音声認識サーバ430は、モニタリング装置440から、テキストデータ送信の要求(以下「認識結果送信要求」という)を受信すると、保存された、要求の対象となる音声データの音声認識結果を、モニタリング装置440へ返信する。認識結果送信要求には、基の音声データの制御情報等の音声データを特定する情報が含まれる。認識結果送信要求は、例えば、通話識別情報を指定して、対応する通話の音声認識結果が生成され次第、当該音声認識結果を逐次返信することを要求する内容である。
When the
モニタリング装置440は、コールセンターの各通話を監視する管理者が使用するパーソナルコンピュータのうち、ウェブブラウザとして機能する部分である。モニタリング装置440は、管理サーバ420から通話開始通知を受信すると、通話録音サーバ410に対して音声送信要求を送信し、音声認識サーバ430に対して認識結果送信要求を送信する。
The
そして、モニタリング装置440は、通話録音サーバ410から返信された音声データと、音声認識サーバ430から返信された音声認識結果のうち少なくともテキストデータとを、液晶ディスプレイ等の表示部に対応付けて表示する。すなわち、モニタリング装置440は、通話開始タイミングの直後から、音声データとその音声認識結果(テキストデータ)とを、管理者に対し、対応付けて提示する。
The
なお、通話録音サーバ410、管理サーバ420、音声認識サーバ430、およびモニタリング装置440のそれぞれは、図示しないが、例えば、CPU(Central Processing Unit)、制御プログラムを格納したROM(Read Only Memory)等の記憶媒体、RAM(Random Access Memory)等の作業用メモリ、および通信回路等を有する。この場合、上記した各装置および各部の機能は、CPUが制御プログラムを実行することにより実現される。
Although not shown, each of the
このような通信システム100において、通話録音サーバ410は、IP電話網で伝送される通話の音声データを、ストリーミングで音声認識サーバ430に提供することができる。そして、音声認識サーバ430は、音声データに対する音声認識結果を、ストリーミングでモニタリング装置440に提供することができる。
In such a
すなわち、通信システム100は、音声認識処理および音声認識結果の提示を、通話開始タイミングの直後から開始することができるので、音声認識結果を、通話の最中にほぼリアルタイムに提示することができる。
That is, since the
<通話録音サーバの動作>
次に、通話録音サーバの動作について説明する。
<Operation of call recording server>
Next, the operation of the call recording server will be described.
図3は、通話録音サーバ410の動作の一例を示すフローチャートである。
FIG. 3 is a flowchart showing an example of the operation of the
まず、ステップS1100において、電話網通信部411は、外線網200からIPパケットを受信したか否かを判断する。電話網通信部411は、IPパケットを受信した場合(S1100:YES)、処理をステップS1200へ進める。また、電話網通信部411は、IPパケットを受信していない場合(S1100:NO)、処理を後述のステップS1500へ進める。
First, in step S 1100, the telephone network communication unit 411 determines whether an IP packet has been received from the
ステップS1200において、音声記録制御部414は、IPパケットから音声データを抽出し、音声データを、制御情報等の音声データを特定する情報と対応付けて、メモリ413に記録する。また、通話開始取得部415は、IPパケットから制御情報を抽出する。
In step S1200, the voice
そして、ステップS1300において、通話開始取得部415は、制御情報に基づき、通話開始タイミングであるか否かを判断する。通話開始取得部415は、通話開始タイミングである場合(S1300:YES)、処理をステップS1400へ進める。また、通話開始取得部415は、通話開始タイミングではない場合(S1300:NO)、処理を後述のステップS1500へ進める。
In step S1300, the call
ステップS1400において、音声認識制御部416は、管理網通信部412を介して、通話開始通知を管理サーバ420へ送信する。
In step S <b> 1400, the voice
そして、ステップS1500において、音声認識制御部416は、管理網通信部412を介して、音声送信要求を受信したか否かを判断する。音声認識制御部416は、音声送信要求を受信した場合(S1500:YES)、処理をステップS1600へ進める。また、音声認識制御部416は、音声送信要求を受信していない場合(S1500:NO)、処理を後述のステップS1700へ進める。
In step S1500, the speech
ステップS1600において、音声認識制御部416は、音声送信要求の送信元(要求元)への音声データの転送を開始する。
In step S1600, the voice
そして、ステップS1700において、音声認識制御部416は、管理者の操作等により、通話データを監視する処理の終了を指示されたか否かを判断する。音声認識制御部416は、処理の終了を指示されていない場合(S1700:NO)、処理をステップS1100へ戻す。また、音声認識制御部416は、処理の終了を指示された場合(S1700:YES)、一連の処理を終了する。
In step S1700, the voice
このような動作により、通話録音サーバ410は、IP電話網で伝送される通話の通話開始タイミングを取得し、通話開始タイミングの直後に、IP電話網で伝送される通話の音声データに対する音声認識処理を開始させることができる。
With such an operation, the
<システム全体の動作>
次に、通信システム100全体の動作の流れの一例について説明する。
<Operation of the entire system>
Next, an example of the operation flow of the
図4は、通信システム100の動作の流れの一例を示すシーケンス図である。
FIG. 4 is a sequence diagram illustrating an example of the operation flow of the
まず、モニタリング装置440は、音声認識処理の対象となる音声データの条件を、管理サーバ420へ送信して予め設定しておく(S2010)。かかる条件は、例えば、話者識別情報、通話の時間帯、通話に所定の単語が含まれることである。すなわち、モニタリング装置440は、音声認識処理の対象を、予め、管理サーバ420に登録する。そして、通話が開始されると、ネットワーク機器320は、IPパケットの通話録音サーバ410への送信を開始する(S2020)。
First, the
通信録音サーバ410は、送られてくるIPパケットのそれぞれから音声データおよび制御情報を抽出する処理と音声データの記録とを開始すると共に(S2030)、通話開始通知を管理サーバ420へ送信する(S2040)。この時点で、通話録音サーバ410には、少なくとも通話の最初の部分の音声データが格納されている。
The
管理サーバ420は、通話開始通知に含まれる制御情報と、S2010で設定された条件とに基づいて、音声データに対する音声認識を行うか否かを判断する(S2050)。管理サーバ420は、音声認識を行うと判断した場合、認識開始要求を音声認識サーバ430へ送信すると共に(S2060)、通話開始通知をモニタリング装置440へ送信する(S2070)。音声認識サーバ430は、認識開始要求を受けて、音声送信要求を通話録音サーバ410へ送信する(S2080)。
The
上述の通り、通話録音サーバ410には、通話の最初の部分の音声データが、少なくとも格納されている。したがって、通話録音サーバ410は、音声送信要求を受けて、格納している音声データを音声認識サーバ430へ返信する(S2090)。なお、高精度な音声認識結果が得られるように、音声認識サーバ430へ送信される音声データは、IPパケットから抽出された音声データの品質が維持されていることが望ましい。
As described above, the
このようにして、音声認識サーバ430は、通話録音サーバ410に格納された音声データに対する音声認識処理を開始する(S2100)。この時点で、音声認識サーバ430には、少なくとも通話の最初の部分の音声認識結果が格納されている。また、音声認識サーバ430は、認識開始通知を管理サーバ420へ送信する(S2110)。
In this way, the
かかる認識開始通知が行われることにより、ウェブブラウザのようにプル型の動作によって表示対象を取得するモニタリング装置440であっても、音声データおよび音声認識結果をリアルタイムに取得して表示することが可能となる。
With this recognition start notification, even the
管理サーバ420は、音声認識サーバ430から受信した認識開始通知を、モニタリング装置440へ転送する(S2120)。なお、かかる認識開始通知、あるいは、ステップ2070で送信される通話開始通知には、音声認識結果の取得先を示す情報として、音声認識サーバ430の識別情報が含まれていることが望ましい。モニタリング装置440は、認識開始通知を受けて、認識結果送信要求を音声認識サーバ430へ送信する(S2130)。
The
上述の通り、音声認識サーバ430には、少なくとも通話の最初の部分の音声認識結果が格納されている。したがって、音声認識サーバ430は、認識結果送信要求を受けて、格納している音声認識結果をモニタリング装置440へ送信する(S2140)。
As described above, the
モニタリング装置440は、更に、音声送信要求を通話録音サーバ410へ送信し(S2150)、通話録音サーバ410から音声データを受信する(S2160)。なお、通話録音サーバ410は、音声認識制御部416において、モニタリング装置440へ送信される音声データを、ウェブブラウザで出力可能な形式の音声データに変換することが望ましい。そして、モニタリング装置440は、受信した音声データおよび音声認識結果を、対応付けて表示する(S2170)。
The
モニタリング装置440は、例えば、監視対象となる通話が複数同時に行われている場合、各音声データの制御情報に含まれる通話識別情報あるいは話者識別情報に基づいて、これら複数の通話についての音声認識結果を、通話毎に取得することができる。この場合、モニタリング装置440は、これら複数の通話についての音声認識結果を、1つのウェブブラウザ画面に同時表示することが望ましい。
For example, when a plurality of calls to be monitored are simultaneously performed, the
このような動作により、通信システム100は、音声認識の対象を必要なものに絞りつつ、音声認識処理および音声認識結果の提示を、通話開始タイミングの直後から開始することができる。また、通信システム100は、ウェブブラウザにおいて、通話の音声データおよび音声認識結果をリアルタイムに表示することができる。
With such an operation, the
なお、通信システム100で送信される各種要求は、1回の要求で通話全体のデータに対する処理を要求するものであってもよいし、パケット、フレーム、あるいは一まとまりの音声認識結果等を単位として、通話の一部のデータ毎に処理を要求するものであってもよい。後者の場合、例えば、フレーム番号や音声認識結果のイベント番号等を、処理対象を指定する識別情報として用いることができる。
Note that the various requests transmitted by the
<本実施の形態の効果>
以上のように、本実施の形態に係る通話データ管理システムを含む通信システム100によれば、IP電話網を形成する内線網300で伝送される通話の音声データに対する音声認識処理を、通話開始タイミングの直後から開始する。これにより、通信システム100は、IP電話網の通話の音声データに対する音声認識結果を、通話の最中に、ほぼリアルタイムに提示することができる。
<Effects of the present embodiment>
As described above, according to the
上述の通り、各通話が終了した後に、確認が必要な通話をピックアップし、通話の音声データを検索して、蓄積された音声認識結果や音声データを確認するといった作業は、IP電話機の個数が膨大な場合、非常に煩雑なものとなる。 As described above, after each call is completed, a call that needs to be confirmed is picked up, voice data of the call is searched, and the accumulated voice recognition result and voice data are confirmed. When it is enormous, it becomes very complicated.
この点、本実施の形態に係る通信システム100は、管理者に対して、各通話の内容をリアルタイムに提示するので、このような煩雑な作業を回避しつつ、各通話を効率良く監視することが可能となる。したがって、本実施の形態に係る通信システム100によれば、より簡単に、多数のIP電話機の通話内容をリアルタイムに監視することができる。
In this regard, since the
また、管理者がオペレータにアドバイスを与える等のアクションを行う場合、従来技術のように、通話が終了してから通話内容を確認すると、かかるアクションが適切なタイミングから遅れてしまう。この点、本実施の形態にかかる通信システム100は、各IP電話機の通話内容をリアルタイムに監視することができるので、通話内容に応じたアクションを的確なタイミングで行うことを可能にする。
Further, when an administrator performs an action such as giving an advice to an operator, the action is delayed from an appropriate timing when the call content is confirmed after the call is ended as in the prior art. In this regard, since the
また、本実施の形態に係る通信システム100は、管理サーバ420において、制御情報に基づいて、通話毎に、通話録音サーバ410、音声認識サーバ430、およびモニタリング装置440のそれぞれの動作タイミングを制御する。これにより、本実施の形態に係る通信システム100は、通話録音サーバ410、音声認識サーバ430、およびモニタリング装置440が独立した装置であっても、これらの装置に対する最小限の改変により、これらを連携して動作させ、上記効果を得ることができる。
In
また、本実施の形態に係る通信システム100において、モニタリング装置440は、音声認識サーバ430から、音声認識サーバ430に格納された音声認識結果を取得して提示する。したがって、本実施の形態に係る通信システム100は、複数のモニタリング装置440が存在する場合であっても、各モニタリング装置440で独立して音声認識結果を提示することができる。
Further, in
また、本実施の形態に係る通信システム100は、音声認識の対象となる音声データ(通話、IP電話機、あるいは話者等)を動的に選択することができるので、多数のIP電話機の通話内容の監視を、更に効率良く行うことを可能にする。
In addition, the
また、本実施の形態に係る通信システム100は、IP電話網から通話の音声データを取得するので、各通話の音声データを高品質にかつ効率良く取得することができる。例えば、各IP電話機に音声データ取得のための設備を設ける場合に比べて、本実施の形態に係る通信システム100は、必要な設備コストおよび設備スペースを低減することができる。また、本実施の形態に係る通信システム100は、送話音声と受話音声とが完全に分離録音された高品質な音声データを取得することができるため、精度の高いテキストデータを音声認識結果として得ることができ、より高い信頼性を実現することができる。
Further, since
なお、IP電話網で伝送される通話の音声データの取得の仕方は、上述の例に限定されない。例えば、通話録音サーバ410は、各通話の音声データの伝送路上に配置されている場合、音声データを転送する際にその複製を取得してもよい。
Note that the method of acquiring voice data of a call transmitted over the IP telephone network is not limited to the above example. For example, when the
また、管理サーバ420の機能、音声認識サーバ430、およびモニタリング装置440の機能の、一部または全部が、通話録音サーバ410に配置されていてもよい。
Further, part or all of the functions of the
例えば、通話録音サーバ410は、取得され制御情報に基づいて、記録された記音声データに対して音声認識処理を行うか否かを決定する、処理対象決定部、を有してもよい。この場合、音声認識対象の絞り込みを、通話録音サーバ410で行うことができ、通話開始通知の送信回数を低減することができる。
For example, the
また、本発明の適用は、コールセンターに限定されるものではない。本発明は、公官庁あるいは企業における、受付および営業等の各種窓口代表電話や、社内内線電話網等、複数の通話が行われ得る各種のIP電話網に適用することが可能である。 The application of the present invention is not limited to a call center. The present invention can be applied to various types of IP telephone networks in which a plurality of calls can be made, such as various telephone representative telephones for reception and sales, in-house extension telephone networks, etc. in public offices or companies.
本開示の通話録音サーバは、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録する音声記録制御部と、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、取得された前記通話開始タイミングの直後に、記録された前記音声データに対する音声認識処理を開始させる音声認識制御部と、を有する。 The call recording server of the present disclosure is based on a voice recording control unit that sequentially acquires and records voice data of a call transmitted over the IP telephone network in a memory, and control information associated with the acquired voice data, A call start acquisition unit that acquires a call start timing at which the call is started; and a voice recognition control unit that starts a voice recognition process for the recorded voice data immediately after the acquired call start timing. .
なお、上記通話録音サーバは、取得された前記制御情報に基づいて、記録された前記音声データに対して前記音声認識処理を行うか否かを決定する処理対象決定部、を有してもよい。 The call recording server may include a processing target determining unit that determines whether or not to perform the voice recognition process on the recorded voice data based on the acquired control information. .
また、上記通話録音サーバは、前記IP電話網から、前記音声データを格納し前記通話の識別情報を含む前記制御情報が付与されたパケットを受信する電話網通信部、を有し、前記通話開始取得部は、前記制御情報に基づいて、前記電話網通信部が前記通話の前記パケットを最初に受信したタイミングを特定し、特定された前記タイミングを、前記通話開始タイミングとして取得してもよい。 In addition, the call recording server includes a telephone network communication unit that stores the voice data from the IP telephone network and receives the packet to which the control information including the call identification information is added, and starts the call The acquisition unit may specify a timing at which the telephone network communication unit first receives the packet of the call based on the control information, and acquire the specified timing as the call start timing.
また、上記通話録音サーバにおいて、前記音声認識制御部は、前記制御情報に基づいて、前記通話毎に、前記音声認識処理の結果であるテキストデータを、記録された前記音声データと対応付けて管理してもよい。 In the call recording server, the voice recognition control unit manages the text data, which is the result of the voice recognition process, in association with the recorded voice data for each call based on the control information. May be.
本開示の通話データ管理システムは、IP電話網で伝送される通話の音声データを記録する通話録音サーバと、記録された前記音声データに対する音声認識処理を行い、前記音声認識処理の結果であるテキストデータを生成する音声認識サーバと、記録された前記音声データと生成された前記テキストデータとを、対応付けて提示するモニタリング装置と、を有する通話データ管理システムであって、前記通話録音サーバは、IP電話網から前記音声データを順次取得してメモリに記録する音声記録制御部と、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、記録された前記音声データを前記音声認識サーバへ出力し、前記音声認識サーバに対して、取得された前記通話開始タイミングの直後に、前記音声データに対する音声認識処理を開始させる音声認識制御部と、を有してもよい。 The call data management system according to the present disclosure includes a call recording server that records voice data of a call transmitted over an IP telephone network, a voice recognition process for the recorded voice data, and a text that is a result of the voice recognition process. A call data management system comprising: a voice recognition server that generates data; and a monitoring device that presents the recorded voice data and the generated text data in association with each other, wherein the call recording server includes: A voice recording control unit that sequentially acquires the voice data from the IP telephone network and records it in a memory, and a call that acquires a call start timing at which the call is started based on control information that accompanies the acquired voice data A start acquisition unit and the recorded voice data are output to the voice recognition server, and acquired by the voice recognition server. And immediately after the call start timing, the voice recognition control section to start the speech recognition process on the voice data, may have.
なお、上記通話データ管理システムにおいて、前記音声認識制御部は、前記モニタリング装置からの要求に応じて、記録された前記音声データを前記モニタリング装置へ出力し、前記音声認識サーバは、前記モニタリング装置からの要求に応じて、生成された前記テキストデータを、前記モニタリング装置へ出力し、前記通話録音サーバから、前記通話開始タイミングを取得し、取得された前記通話開始タイミングに基づいて、前記通話録音サーバ、前記音声認識サーバ、および前記モニタリング装置のそれぞれの動作タイミングを制御する管理サーバ、を有してもよい。 In the call data management system, the voice recognition control unit outputs the recorded voice data to the monitoring device in response to a request from the monitoring device, and the voice recognition server receives from the monitoring device. In response to the request, the generated text data is output to the monitoring device, the call start timing is acquired from the call recording server, and the call recording server is acquired based on the acquired call start timing. And a management server that controls the operation timing of each of the voice recognition server and the monitoring device.
また、上記通話データ管理システムにおいて、前記通話録音サーバは、前記IP電話網から、前記音声データを格納し前記通話の識別情報を含む前記制御情報が付与されたパケットを受信する電話網通信部、を有し、前記管理サーバは、前記制御情報に基づいて、前記通話毎に、前記通話録音サーバ、前記音声認識サーバ、および前記モニタリング装置のそれぞれの動作タイミングを制御してもよい。 Further, in the call data management system, the call recording server is a telephone network communication unit that receives the packet to which the voice data is stored and the control information including the identification information of the call is added from the IP telephone network. The management server may control operation timings of the call recording server, the voice recognition server, and the monitoring apparatus for each call based on the control information.
また、上記通話データ管理システムにおいて、前記管理サーバは、前記制御情報に基づいて、前記通話録音サーバに通話記録された前記音声データに対して前記音声認識処理を行うか否かを決定してもよい。 In the call data management system, the management server may determine whether to perform the voice recognition process on the voice data recorded in the call recording server based on the control information. Good.
本開示の通話データ管理方法は、IP電話網で伝送される通話の音声データを、順次取得してメモリに記録するステップと、取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得するステップと、取得された前記通話開始タイミングの直後に、記録された前記音声データに対する音声認識処理を開始させるステップと、を有してもよい。 The call data management method according to the present disclosure includes a step of sequentially acquiring voice data of a call transmitted over an IP telephone network and recording the voice data in a memory, and the call based on control information associated with the acquired voice data. There may be included a step of acquiring a call start timing at which is started, and a step of starting a voice recognition process for the recorded voice data immediately after the acquired call start timing.
本発明は、より簡単に多数のIP電話機の通話内容を監視することを可能にする、通話録音サーバ、通話データ管理システム、および通話データ管理方法として有用である。 INDUSTRIAL APPLICABILITY The present invention is useful as a call recording server, a call data management system, and a call data management method that make it possible to more easily monitor call contents of a large number of IP telephones.
100 通信システム
200 外線網
300 内線網
310 電話機
320 ネットワーク機器
330 PBX装置
400 通話管理網
410 通話録音サーバ
411 電話網通信部
412 管理網通信部
413 メモリ
414 音声記録制御部
415 通話開始取得部
416 音声認識制御部
420 管理サーバ
430 音声認識サーバ
440 モニタリング装置
DESCRIPTION OF
Claims (9)
取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得する通話開始取得部と、
前記通話開始タイミングが取得されたとき、記録された前記音声データに対する音声認識処理および前記音声認識処理の結果であるテキストデータの記録を開始させる音声認識制御部と、
前記音声データの記録および前記テキストデータの記録が開始されたとき、記録された前記音声データおよび前記テキストデータをプル型の動作により取得して提示するモニタリング装置に対して、前記通話の前記音声データおよび前記テキストデータの取得が可能となったことを示す通知を行う管理部と、を有する、
通話録音サーバ。 A voice recording control unit that sequentially acquires voice data of calls transmitted over the IP telephone network and records them in a memory;
A call start acquisition unit for acquiring a call start timing at which the call is started based on control information accompanying the acquired voice data;
A voice recognition control unit for starting the voice recognition process for the recorded voice data and the recording of text data as a result of the voice recognition process when the call start timing is acquired;
When the recording of the voice data and the recording of the text data is started, the voice data of the call is sent to the monitoring device that acquires and presents the recorded voice data and the text data by a pull-type operation. And a management unit that performs notification indicating that the text data can be acquired,
Call recording server.
請求項1に記載の通話録音サーバ。 A processing target determining unit that determines whether or not to perform the voice recognition process on the recorded voice data based on the acquired control information;
The call recording server according to claim 1.
前記通話開始取得部は、
前記制御情報に基づいて、前記電話網通信部が前記通話の前記パケットを最初に受信したタイミングを特定し、特定された前記タイミングを、前記通話開始タイミングとして取得する、
請求項1に記載の通話録音サーバ。 A telephone network communication unit that stores the voice data from the IP telephone network and receives the packet to which the control information including the call identification information is added;
The call start acquisition unit
Based on the control information, specify the timing when the telephone network communication unit first received the packet of the call, and acquire the specified timing as the call start timing,
The call recording server according to claim 1.
前記制御情報に基づいて、前記通話毎に、前記音声認識処理の結果であるテキストデータを、記録された前記音声データと対応付けて管理する、
請求項1に記載の通話録音サーバ。 The voice recognition control unit
Based on the control information, for each call, the text data as a result of the voice recognition process is managed in association with the recorded voice data.
The call recording server according to claim 1.
前記通話録音サーバは、
IP電話網から前記IP電話網で伝送される通話の音声データを順次取得してメモリに記録し、取得された前記音声データに付随する制御情報に基づいて前記通話が開始された通話開始タイミングを取得し、
前記音声認識サーバは、
前記通話開始タイミングが取得されたとき、記録された前記音声データに対する音声認識処理および前記音声認識処理の結果であるテキストデータの記録を開始し、
前記管理サーバは、
前記音声データの記録および前記テキストデータの記録が開始されたとき、前記モニタリング装置に対して、前記通話の前記音声データおよび前記テキストデータの取得が可能となったことを示す通知を行い、
前記モニタリング装置は、
記録された前記音声データおよび前記テキストデータをプル型の動作により取得して提示する、
通話データ管理システム。 A call data management system having a call recording server, a voice recognition server, a management server, and a monitoring device,
The call recording server
Voice data of a call transmitted over the IP telephone network from the IP telephone network is sequentially acquired and recorded in a memory, and a call start timing at which the call is started based on control information attached to the acquired voice data is determined. Acquired,
The voice recognition server
When the call start timing is acquired, the voice recognition process for the recorded voice data and the recording of text data as a result of the voice recognition process are started,
The management server
When the recording of the voice data and the recording of the text data is started, the monitoring device is notified that the voice data and the text data of the call can be acquired,
The monitoring device includes:
The recorded voice data and the text data are obtained and presented by a pull-type operation.
Call data management system.
前記モニタリング装置からの要求に応じて、記録された前記音声データを前記モニタリング装置へ出力し、
前記音声認識サーバは、
前記モニタリング装置からの要求に応じて、記録された前記テキストデータを前記モニタリング装置へ出力し、
前記管理サーバは、
前記通話録音サーバから、前記通話開始タイミングを取得し、取得された前記通話開始タイミングに基づいて、前記通話録音サーバ、前記音声認識サーバ、および前記モニタリング装置のそれぞれの動作タイミングを制御する、
請求項5に記載の通話データ管理システム。 The call recording server
In response to a request from the monitoring device, the recorded audio data is output to the monitoring device,
The voice recognition server
In response to a request from the monitoring device, the recorded text data is output to the monitoring device,
The management server
Acquiring the call start timing from the call recording server, and controlling each operation timing of the call recording server, the voice recognition server, and the monitoring device based on the acquired call start timing;
The call data management system according to claim 5.
前記IP電話網から、前記音声データを格納し前記通話の識別情報を含む前記制御情報が付与されたパケットを受信し、
前記管理サーバは、
前記制御情報に基づいて、前記通話毎に、前記通話録音サーバ、前記音声認識サーバ、および前記モニタリング装置のそれぞれの動作タイミングを制御する、
請求項6に記載の通話データ管理システム。 The call recording server
From the IP telephone network, receiving the packet to which the voice data is stored and the control information including the identification information of the call is attached,
The management server
Based on the control information, for each call, control the operation timing of the call recording server, the voice recognition server, and the monitoring device,
The call data management system according to claim 6.
前記制御情報に基づいて、前記通話録音サーバに通話記録された前記音声データに対して前記音声認識処理を行うか否かを決定する、
請求項6に記載の通話データ管理システム。 The management server
Based on the control information, determine whether or not to perform the voice recognition processing on the voice data recorded in the call recording server,
The call data management system according to claim 6.
通話開始取得部が、前記音声記録制御部により取得された前記音声データに付随する制御情報に基づいて、前記通話が開始された通話開始タイミングを取得するステップと、
音声認識制御部が、前記通話開始取得部により前記通話開始タイミングが取得されたとき、前記音声記録制御部により記録された前記音声データに対する音声認識処理および前記音声認識処理の結果であるテキストデータの記録を開始させるステップと、
管理部が、前記音声記録制御部による前記音声データの記録および前記音声認識制御部による前記テキストデータの記録が開始されたとき、記録された前記音声データおよび前記テキストデータをプル型の動作により取得して提示するモニタリング装置に対して、前記通話の前記音声データおよび前記テキストデータの取得が可能となったことを示す通知を行うステップと、を有する、
通話データ管理方法。 A step in which a voice recording control unit sequentially acquires voice data of a call transmitted over the IP telephone network and records it in a memory;
A call start obtaining unit obtaining a call start timing at which the call is started based on control information attached to the voice data obtained by the voice recording control unit ;
When the voice recognition control unit acquires the call start timing by the call start acquisition unit, the voice recognition processing for the voice data recorded by the voice recording control unit and the text data as a result of the voice recognition processing Starting the recording;
When the recording unit starts recording the voice data by the voice recording control unit and recording the text data by the voice recognition control unit , the management unit acquires the recorded voice data and the text data by a pull-type operation. And providing a notification indicating that the voice data and the text data of the call can be acquired to the monitoring device to be presented.
Call data management method.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014053355A JP5860085B2 (en) | 2014-03-17 | 2014-03-17 | Call recording server, call data management system, and call data management method |
PCT/JP2015/001338 WO2015141189A1 (en) | 2014-03-17 | 2015-03-11 | Call recording server, call-data management system, and call-data management method |
KR1020167022114A KR20160100412A (en) | 2014-03-17 | 2015-03-11 | Call Recording Server, Call-Data Management System, and Call-Data Management Method |
KR1020177024362A KR101826918B1 (en) | 2014-03-17 | 2015-03-11 | Call Recording Server, Call-Data Management System, and Call-Data Management Method |
CN201580012625.2A CN106068641B (en) | 2014-03-17 | 2015-03-11 | Communicating data manages system |
TW104108398A TWI569619B (en) | 2014-03-17 | 2015-03-17 | Message recording server, message data management system and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014053355A JP5860085B2 (en) | 2014-03-17 | 2014-03-17 | Call recording server, call data management system, and call data management method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015177411A JP2015177411A (en) | 2015-10-05 |
JP5860085B2 true JP5860085B2 (en) | 2016-02-16 |
Family
ID=54144173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014053355A Active JP5860085B2 (en) | 2014-03-17 | 2014-03-17 | Call recording server, call data management system, and call data management method |
Country Status (5)
Country | Link |
---|---|
JP (1) | JP5860085B2 (en) |
KR (2) | KR20160100412A (en) |
CN (1) | CN106068641B (en) |
TW (1) | TWI569619B (en) |
WO (1) | WO2015141189A1 (en) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6767796B2 (en) | 2016-07-08 | 2020-10-14 | 株式会社日立情報通信エンジニアリング | Call management system and its voice recognition control method |
JP6875905B2 (en) * | 2017-03-29 | 2021-05-26 | 株式会社日立情報通信エンジニアリング | Call control system and call control method |
JP6927614B2 (en) * | 2017-04-07 | 2021-09-01 | 株式会社Widsley | Call system, call method and program |
JP6749645B2 (en) * | 2017-04-07 | 2020-09-02 | 株式会社Widsley | Call system, call method and program |
JP6433003B1 (en) | 2017-09-04 | 2018-12-05 | Necプラットフォームズ株式会社 | Call recording system, call recording method and call recording program |
TWI672690B (en) * | 2018-03-21 | 2019-09-21 | 塞席爾商元鼎音訊股份有限公司 | Artificial intelligence voice interaction method, computer program product, and near-end electronic device thereof |
KR101952730B1 (en) * | 2018-06-20 | 2019-05-22 | (주)넥타르소프트 | Radio Communication Systems capable of Voice Recognition with Voting Technology for Communication Contents |
CN108833727A (en) * | 2018-07-04 | 2018-11-16 | 广东商路信息科技有限公司 | Sound record management method and system based on telephone exchange |
JP7355996B2 (en) * | 2019-05-17 | 2023-10-04 | アイコム株式会社 | Relay equipment and voice communication recording method |
CN112822249A (en) * | 2020-12-31 | 2021-05-18 | 盐城数智科技有限公司 | WebRTC-based real-time voice acquisition method |
KR102241532B1 (en) | 2021-01-15 | 2021-04-16 | (주)두타위즈 | Intelligent callbot server and unmanned counsel systeim using thereof |
JP7380620B2 (en) * | 2021-03-15 | 2023-11-15 | 株式会社ナカヨ | Call recording system, main device, voice recognition request terminal, program, and telephone call recording method |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4662861B2 (en) * | 2006-02-07 | 2011-03-30 | 日本電気株式会社 | Monitoring device, evaluation data selection device, respondent evaluation device, respondent evaluation system and program |
JP2008060785A (en) | 2006-08-30 | 2008-03-13 | Oki Electric Ind Co Ltd | Ip telephone communication recording system |
JP4773946B2 (en) * | 2006-12-28 | 2011-09-14 | 富士通株式会社 | MONITOR CONTROL SYSTEM, MONITOR DEVICE, MONITOR CONTROL METHOD, AND MONITOR CONTROL PROGRAM |
JP2008211271A (en) | 2007-02-23 | 2008-09-11 | Nomura Research Institute Ltd | Call center management system, call center managing method, program, and recording medium |
CN101247432B (en) * | 2007-07-18 | 2011-12-07 | 北京九合创胜网络科技有限公司 | VoIP voice data real-time monitoring method and device |
US8463606B2 (en) * | 2009-07-13 | 2013-06-11 | Genesys Telecommunications Laboratories, Inc. | System for analyzing interactions and reporting analytic results to human-operated and system interfaces in real time |
WO2011074260A1 (en) * | 2009-12-17 | 2011-06-23 | 日本電気株式会社 | Voice recognition system |
CN101834931B (en) * | 2010-05-06 | 2012-11-28 | 沈阳帝信通信股份有限公司 | IP (Internet Protocol) centralized dictation system and method |
JP2012120120A (en) * | 2010-12-03 | 2012-06-21 | Toshiba Corp | Call center system and escalation notification method |
CN102364925A (en) * | 2011-08-31 | 2012-02-29 | 北京天和恒力科技发展有限公司 | Method for automatically recording call content and selectively storing content at mobile phone terminal and system |
CN103260152B (en) * | 2012-02-20 | 2016-08-03 | 东南大学常州研究院 | The equipment of a kind of mobile terminal sound communication safety supervision and method |
JP5957249B2 (en) * | 2012-03-08 | 2016-07-27 | 株式会社日立情報通信エンジニアリング | Call recording system |
JP2014042128A (en) | 2012-08-22 | 2014-03-06 | Hitachi Ltd | Speech communication recording system |
-
2014
- 2014-03-17 JP JP2014053355A patent/JP5860085B2/en active Active
-
2015
- 2015-03-11 CN CN201580012625.2A patent/CN106068641B/en active Active
- 2015-03-11 KR KR1020167022114A patent/KR20160100412A/en active Search and Examination
- 2015-03-11 WO PCT/JP2015/001338 patent/WO2015141189A1/en active Application Filing
- 2015-03-11 KR KR1020177024362A patent/KR101826918B1/en active IP Right Grant
- 2015-03-17 TW TW104108398A patent/TWI569619B/en active
Also Published As
Publication number | Publication date |
---|---|
TW201540041A (en) | 2015-10-16 |
KR20160100412A (en) | 2016-08-23 |
JP2015177411A (en) | 2015-10-05 |
CN106068641B (en) | 2018-05-29 |
KR20170102394A (en) | 2017-09-08 |
CN106068641A (en) | 2016-11-02 |
KR101826918B1 (en) | 2018-02-07 |
TWI569619B (en) | 2017-02-01 |
WO2015141189A1 (en) | 2015-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5860085B2 (en) | Call recording server, call data management system, and call data management method | |
US10194029B2 (en) | System and methods for analyzing online forum language | |
US9699307B2 (en) | Method and system for automatically routing a telephonic communication | |
TWI249923B (en) | Method and apparatus for implementing call processing in packet telephony networks | |
US20070265990A1 (en) | Multi-party information analysis in a VoIP system | |
US11758053B2 (en) | Method and system for managing routing across multiple networks with separate routing masters | |
RU2317645C1 (en) | Method for servicing voice calls in a communication network | |
JP2017163198A (en) | Voice recognition system, connection device, and voice recognition method | |
WO2006001200A1 (en) | Communication device, communication method, and communication program | |
JP2017098699A (en) | Voice recognition system and voice recognition method | |
JP2001268135A (en) | System and method for acquiring information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5860085 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |