JP2023161739A - Telephone conversation recording system and telephone conversation recording method - Google Patents

Telephone conversation recording system and telephone conversation recording method Download PDF

Info

Publication number
JP2023161739A
JP2023161739A JP2022072262A JP2022072262A JP2023161739A JP 2023161739 A JP2023161739 A JP 2023161739A JP 2022072262 A JP2022072262 A JP 2022072262A JP 2022072262 A JP2022072262 A JP 2022072262A JP 2023161739 A JP2023161739 A JP 2023161739A
Authority
JP
Japan
Prior art keywords
call
session
feature information
telephone
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022072262A
Other languages
Japanese (ja)
Inventor
明弘 大森
Akihiro Omori
歩 永井
Ayumu Nagai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NextGen Inc
Original Assignee
NextGen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NextGen Inc filed Critical NextGen Inc
Priority to JP2022072262A priority Critical patent/JP2023161739A/en
Publication of JP2023161739A publication Critical patent/JP2023161739A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

To acquire an outside line telephone number and an inside line telephone number of a telephone conversation to be recorded.SOLUTION: A telephone conversation recording system 100 comprises a detection device and a recording device. The detection device includes an outline processing part for generating first feature information by processing sound data on a telephone conversation obtained by collecting a packet of a first session flowing through an outline network 150 to which an outline telephone machine is connected in a predetermined algorithm. The recording device includes a storage part that stores recording data obtained by corresponding a mating station telephone number acquired from a calling control packet of the first session and an inside line telephone number acquired on the basis of the calling control packet of the second session to the sound data on the telephone conversation transmitted in the first session or the second session, in the case where the sound data on the telephone conversation obtained by collecting the packet of the second session flowing through an own station inside network 110 to which an inside telephone machine and a private branch exchange are connected is processed by a predetermined algorism, and an inside processing part generating second feature information and the first feature information and second feature information are matched while satisfying a predetermined condition.SELECTED DRAWING: Figure 1

Description

本発明は、通話録音システムおよび通話録音方法に関する。 The present invention relates to a call recording system and a call recording method.

企業等では、構内で複数の電話機を利用する場合に、内線電話機同士の接続および内線電話機と公衆電話網に繋がる外線との接続などの構内の通話を管理する構内交換機(PBX:Private Branch eXchange)が設置される。 In companies, etc., when multiple telephones are used within the premises, a Private Branch eXchange (PBX) is used to manage calls within the premises, such as connecting extension telephones to each other and connecting extension telephones to outside lines connected to the public telephone network. will be installed.

また、通話の内容を録音するための通話録音装置が知られている。通話録音装置では、例えば、通話内容に加えて、通話の発信元の電話番号、着信先の電話番号、通話開始時刻、通話終了時刻等などの情報の記録も行われる。 Also, a call recording device for recording the contents of a call is known. In addition to the contents of the call, the call recording device also records information such as the telephone number of the originator of the call, the telephone number of the destination, the call start time, the call end time, and the like.

これに関し、通話の録音に関連する技術が知られている(例えば、特許文献1)。また、通話中の音声認識処理に関連する技術も知られている(例えば、特許文献2)。 In this regard, techniques related to recording of telephone calls are known (for example, Patent Document 1). Furthermore, techniques related to voice recognition processing during a call are also known (for example, Patent Document 2).

特開2004-328277号公報Japanese Patent Application Publication No. 2004-328277 特開2001-094665号公報Japanese Patent Application Publication No. 2001-094665

しかしながら、内線網に接続する電話機と外線網に接続する電話機との通話では、ゲートウェイや構内交換機を通る際、電話番号の管理が変わってしまうため、通話録音装置で通話の発信元の電話番号および着信先の電話番号の双方を取得することが難しいことがある。通話における発信元および着信先の2つの電話番号の情報を得るために、通話録音装置を構内交換機と連携させて、構内交換機から電話番号の情報を取得することも行われている(いわゆるCTI連携、構内交換機連携)。しかしながら、構内交換機と連携可能な通話録音装置が既存に無いことがある。そして、新たに自社で利用する構内交換機と連携可能な通話録音装置を作成する場合、高コスト化が避けられない。そのため、録音する通話の外線電話番号および内線番号を取得するための更なる技術の提供が望まれている。 However, when a call is made between a telephone connected to an internal network and a telephone connected to an external network, the management of telephone numbers changes when passing through a gateway or private branch exchange. Sometimes it is difficult to obtain both sides of the destination phone number. In order to obtain information on the two telephone numbers of the originator and destination in a call, a call recording device is linked with a private branch exchange to obtain telephone number information from the private branch exchange (so-called CTI cooperation). , private branch exchange). However, there are cases where there is no existing call recording device that can cooperate with a private branch exchange. When creating a new call recording device that can be linked to a private branch exchange used by the company, high costs are unavoidable. Therefore, it is desired to provide a further technique for obtaining the external phone number and extension number of the call to be recorded.

1つの側面では、本発明は、録音する通話の外線電話番号および内線番号を取得することを目的とする。 In one aspect, the present invention aims to obtain an external phone number and an extension number of a call to be recorded.

本発明の一つの態様の通話録音システムは、外線電話機が接続される外線網を流れる第1のセッションのパケットを収集して得た通話の音声データを所定のアルゴリズムで処理して第1の特徴情報を生成する外線処理部と、内線電話機および構内交換機が接続される自局の内線網を流れる第2のセッションのパケットを収集して得た通話の音声データを所定のアルゴリズムで処理して第2の特徴情報を生成する内線処理部と、第1の特徴情報と第2の特徴情報とが所定の条件を満たして合致する場合、第1のセッションの呼制御パケットから取得された相手局の電話番号と、第2のセッションの呼制御パケットに基づき取得された内線番号とを、第1のセッションまたは第2のセッションで伝送される通話の音声データと対応づけた録音データを記憶部に保存する保存部と、を含む。 A call recording system according to one aspect of the present invention processes voice data of a call obtained by collecting packets of a first session flowing through an outside line network to which an outside line telephone is connected using a predetermined algorithm. An outside line processing unit that generates information, and a predetermined algorithm processes the voice data of the call obtained by collecting packets of the second session flowing through the extension network of the local office to which the extension telephone and private branch exchange are connected. If the first characteristic information and the second characteristic information meet and meet a predetermined condition, the extension processing unit generates the second characteristic information, and the extension processing unit generates the second characteristic information. Recording data in which the telephone number and the extension number obtained based on the call control packet of the second session are associated with the audio data of the call transmitted in the first session or the second session is stored in the storage unit. and a storage section for storing the information.

録音する通話の外線電話番号および内線番号を取得することができる。 You can obtain the external telephone number and extension number of the call to be recorded.

実施形態に係る通話録音システムのシステム構成を例示する図である。1 is a diagram illustrating a system configuration of a call recording system according to an embodiment. 実施形態に係る録音装置のブロック構成を例示する図である。FIG. 1 is a diagram illustrating a block configuration of a recording device according to an embodiment. 実施形態に係る検出装置のブロック構成を例示する図である。1 is a diagram illustrating a block configuration of a detection device according to an embodiment. 実施形態に係る録音データの保存処理の動作フローを示す図である。FIG. 3 is a diagram illustrating an operational flow of recording data storage processing according to the embodiment. 例示的な内線番号情報示す図である。FIG. 3 is a diagram illustrating exemplary extension number information. 実施形態に係る連続特徴情報生成処理の動作フローを例示する図である。FIG. 3 is a diagram illustrating an operation flow of continuous feature information generation processing according to the embodiment. 実施形態に係る連続した特徴情報の生成を例示する図である。FIG. 6 is a diagram illustrating generation of continuous feature information according to the embodiment. 実施形態に係る通話チャネル情報を例示する図である。FIG. 3 is a diagram illustrating call channel information according to the embodiment. 実施形態に係る問い合わせ応答処理の動作フローを例示する図である。FIG. 3 is a diagram illustrating an operational flow of inquiry response processing according to the embodiment. 特徴情報の合致の判定を説明する図である。FIG. 6 is a diagram illustrating determination of matching of feature information. 一実施形態に係る特徴情報生成処理の動作フローを例示する図である。FIG. 3 is a diagram illustrating an operational flow of feature information generation processing according to an embodiment. 音声データからの特徴情報の生成を説明する図である。FIG. 3 is a diagram illustrating generation of feature information from audio data. 一実施形態に係る連続する特徴情報の生成処理の動作フローを例示する図である。FIG. 3 is a diagram illustrating an operational flow of continuous feature information generation processing according to an embodiment. 一実施形態に係るチャンクハッシュ情報を例示する図である。FIG. 3 is a diagram illustrating chunk hash information according to an embodiment. 実施形態の録音データ保存処理の流れを説明するシーケンスを例示する図である。FIG. 3 is a diagram illustrating a sequence for explaining the flow of recorded data storage processing according to the embodiment. 実施形態に係る録音装置および検出装置を実現するためのコンピュータのハードウェア構成を例示する図である。1 is a diagram illustrating a hardware configuration of a computer for realizing a recording device and a detection device according to an embodiment. 実施形態に係る通話録音システムにおける外線網の別の例を示す図である。FIG. 7 is a diagram showing another example of an outside line network in the call recording system according to the embodiment.

以下、図面を参照しながら、本発明のいくつかの実施形態について詳細に説明する。なお、複数の図面において対応する要素には同一の符号を付す。 Hereinafter, some embodiments of the present invention will be described in detail with reference to the drawings. Note that the same reference numerals are given to corresponding elements in a plurality of drawings.

上述のように、外線網と内線網との間にはゲートウェイ(GW)がある。また、内線網においては構内交換機が各内線電話機の通話に介在する。そして、ゲートウェイや構内交換機の働きにより、外線網に接続された外線電話機と自局の内線網に接続された内線電話機との間の通話におけるそれぞれの電話番号が隠蔽されてしまい、取得できないことがある。 As mentioned above, there is a gateway (GW) between the external line network and the internal line network. Furthermore, in the extension network, a private branch exchange intervenes in calls between each extension telephone. Due to the functions of gateways and private branch exchanges, the telephone numbers of calls between external telephones connected to the external network and internal telephones connected to the local office's own internal network are hidden, making it impossible to obtain them. be.

例えば、外線網で流通する電話番号は、自局、相手局ともゲートウェイで認識することは可能だが、通常の場合、内線網で実際に通話している内線電話機の情報は、内線番号も含めてゲートウェイでは認識できない。また、内線電話機が発信する場合は、外線上の相手先の電話番号を指定するので、内線電話機の電話番号と、外線上の相手局の電話番号を内線網で取得することが可能である。しかしながら、外線から着信があった場合には、ゲートウェイまたは構内交換機が外線を管理するため、外線の電話番号は内線網では流通しない。 For example, it is possible for the gateway to recognize the telephone number distributed on an external network, both the local station and the other party's station, but in normal cases, the information on the extension telephone that is actually making the call on the internal network, including the extension number, is It cannot be recognized by the gateway. Furthermore, when making a call from an extension telephone, the telephone number of the other party on the outside line is specified, so it is possible to obtain the telephone number of the extension telephone and the telephone number of the other party on the outside line through the extension network. However, when a call is received from an outside line, the gateway or private branch exchange manages the outside line, so the telephone number of the outside line is not distributed over the extension network.

そのため、上述のように、いわゆるCTI連携、構内交換機連携といった技術を用いて内線番号や外線の電話番号の情報を得ることが行われているが、利用している構内交換機と連携可能な通話録音装置が既存に無いことがあり、また、新たに自社で利用する構内交換機と連携可能な通話録音装置を作成にはコストがかかる。 Therefore, as mentioned above, information on extension numbers and external telephone numbers is obtained using technologies such as so-called CTI coordination and private branch exchange coordination, but call recording that can be linked with the private branch exchange being used In some cases, the device does not already exist, and it is costly to create a new call recording device that can be linked with the private branch exchange used by the company.

そのため、構内交換機に依存せず、個々の通話における外線電話番号および内線番号の取得を可能にする技術の提供が望まれている。 Therefore, it is desired to provide a technology that enables acquisition of external phone numbers and extension numbers for individual calls without relying on private branch exchanges.

本願の発明者は、通話において流れる音声は、内線網と外線網とで共通していることに着目した。そこで、以下で述べる実施形態では、例えば、内線網と外線網とのそれぞれに、通話の音声データを収集する装置を設置する。そして、内線網に設置した装置で収集したパケットから取得した通話の音声データと、外線網に設置した装置で収集したパケットから収集した通話の音声データとが所定の条件を満たして合致する場合に、それらを同じ通話と見なす。続いて、内線網に設置した装置で収集したパケットの情報に基づいて取得した内線番号と、外線網に設置した装置で収集したパケットから取得した外線の電話番号とを、通話における発信元および着信先の2つの電話番号として特定する。即ち、実施形態によれば、構内交換機に依存せずに、内線番号と外線の電話番号とを対応づけることができる。それにより、通話を録音した録音データに、発信元および着信先の2つの電話番号を対応づけて保存することが可能になる。以下、実施形態を更に詳細に説明する。 The inventor of the present application has focused on the fact that the voice heard during a call is common between an internal line network and an external line network. Therefore, in the embodiment described below, for example, a device for collecting voice data of telephone calls is installed in each of the internal line network and the external line network. Then, if the voice data of the call obtained from the packets collected by the device installed on the internal line network and the voice data of the call collected from the packets collected by the device installed on the external line network meet the predetermined conditions, , consider them the same call. Next, the extension number obtained based on the packet information collected by the device installed on the internal line network and the external phone number obtained from the packet information collected by the device installed on the external line network are used to identify the originating and incoming call in the call. Identify as the previous two phone numbers. That is, according to the embodiment, it is possible to associate an extension number and an outside telephone number without depending on a private branch exchange. As a result, it becomes possible to store the recorded data of a telephone call in association with the two telephone numbers of the calling party and the receiving party. Hereinafter, embodiments will be described in more detail.

図1は、実施形態に係る通話録音システム100のシステム構成を例示する図である。図1に示すように、通話録音システム100では、自局の構内通信網である内線網110と、外部の通信網である外線網150とが、ゲートウェイ(GW)101を介して接続されている。内線網110には、複数の内線電話機111(例えば、内線電話機111a~内線電話機111c)と、構内交換機120とが含まれている。構内交換機120は、例えば、IP-PBX(Internet Protocol Private Branch eXchange)であってよい。構内交換機120は、例えば、かかってきた外線を内線電話機111につなぐ機能、および構内の各内線電話機111を外線につなぐ機能を有しており、複数の内線電話機111a~111cの発着信を制御してよい。 FIG. 1 is a diagram illustrating a system configuration of a call recording system 100 according to an embodiment. As shown in FIG. 1, in the call recording system 100, an internal network 110, which is a local communication network, and an external network 150, which is an external communication network, are connected via a gateway (GW) 101. . The extension network 110 includes a plurality of extension telephones 111 (for example, extension telephones 111a to 111c) and a private branch exchange 120. Private branch exchange 120 may be, for example, an IP-PBX (Internet Protocol Private Branch eXchange). The private branch exchange 120 has, for example, a function of connecting an incoming outside line to the extension telephone 111, and a function of connecting each extension telephone 111 in the premises to an outside line, and controls the incoming and outgoing calls of the plurality of extension telephones 111a to 111c. It's fine.

また、図1の外線網150では、ゲートウェイ101は、光回線終端装置(ONU:Optical Network Unit)151を介して電話会社が構築するIP(Internet Protocol)電話網160と接続されている。光回線終端装置151は、例えば、電気信号と光信号との変換を行う装置である。 Further, in the outside line network 150 of FIG. 1, the gateway 101 is connected to an IP (Internet Protocol) telephone network 160 constructed by a telephone company via an optical network unit (ONU) 151. The optical line termination device 151 is, for example, a device that converts an electrical signal and an optical signal.

そして、IP電話網160に接続している外部の電話機170(以下、外線電話機170と呼ぶことがある)が、例えば、構内交換機120に設定されている自局の代表電話番号に発信した場合、構内交換機120は内線電話機111につなぐ。 For example, when an external telephone 170 (hereinafter referred to as an outside line telephone 170) connected to the IP telephone network 160 makes a call to its own representative telephone number set in the private branch exchange 120, Private branch exchange 120 is connected to extension telephone 111.

また、図1では、ハブ(HUB)152を介して検出装置180が外線網150に接続されている。検出装置180は、例えば、外線網150を流れるパケットを監視する。そして、検出装置180は、外線網を流れる内線電話機111と外線電話機170との間の通話のパケットを検出すると、パケットから音声データを収集し、音声データから所定のアルゴリズムに従って第1の特徴情報を生成する。なお、外線側のSIPメッセージおよびRTPパケットは暗号化されることがある。例えば、SIPメッセージがTLS(Transport Layer Security)等により暗号化されている場合や音声パケットがsRTP(Secure Real time Transport Protocol)等により暗号化されている場合は、B2BUA(Back to back User Agent)方式のセッションボーターコントローラ(SBC)がハブ152の代わりに配置されてよい。そして、SBCは、復号して得たSIPメッセージの内容(外線電話番号)と復号して得た音声パケット(RTP)とを検出装置に送信してもよい。 Further, in FIG. 1, a detection device 180 is connected to an outside line network 150 via a hub (HUB) 152. The detection device 180 monitors packets flowing through the external line network 150, for example. When the detection device 180 detects a packet of a call between the extension telephone 111 and the extension telephone 170 flowing through the outside line network, the detection device 180 collects voice data from the packet and extracts first characteristic information from the voice data according to a predetermined algorithm. generate. Note that SIP messages and RTP packets on the outside line may be encrypted. For example, if the SIP message is encrypted using TLS (Transport Layer Security), etc., or the voice packet is encrypted using sRTP (Secure Real time Transport Protocol), etc., the B2BUA (Back to back User Agent) method is used. A session voter controller (SBC) may be placed in place of hub 152. Then, the SBC may transmit the contents of the decoded SIP message (external telephone number) and the decoded voice packet (RTP) to the detection device.

また、図1では、ハブ122を介して録音装置130が内線網110に接続されている。録音装置130は、例えば、内線網を流れるパケットを監視する。そして、録音装置130は、内線網を流れる内線電話機111と外線電話機170との間の通話のパケットを検出すると、パケットから通話の音声データを収集し、検出装置180において用いられるアルゴリズムと同じ所定のアルゴリズムに従って音声データから第2の特徴情報を生成する。なお、内線電話機111と外線電話機170との間の通話のパケットには、例えば、呼制御のための呼制御情報を含む呼制御パケットが含まれている。そのため、パケットの種類や呼制御情報に含まれる宛先のアドレス等の情報に基づいて、録音装置130および検出装置180は、内線電話機111と外線電話機170との間の通話のパケットを検出することができる。 Further, in FIG. 1, the recording device 130 is connected to the extension network 110 via the hub 122. For example, the recording device 130 monitors packets flowing through the extension network. When the recording device 130 detects a packet of a call between the extension telephone 111 and the outside telephone 170 flowing through the extension network, the recording device 130 collects audio data of the call from the packet, and uses the same predetermined algorithm as that used in the detection device 180. Second feature information is generated from the audio data according to an algorithm. Note that the packet of the call between the extension telephone 111 and the outside telephone 170 includes, for example, a call control packet containing call control information for call control. Therefore, based on information such as the packet type and the destination address included in the call control information, the recording device 130 and the detection device 180 can detect the packet of the call between the extension telephone 111 and the outside telephone 170. can.

録音装置130は、通信線155を介して検出装置180と通信可能に接続されており、生成した第2の特徴情報を含む問い合わせを検出装置180に通信線155を介して送信し、検出装置180に外線情報を問い合わせる。外線情報は、例えば、通話における相手局の外線電話機170の電話番号を含んでよい。 The recording device 130 is communicably connected to the detection device 180 via a communication line 155, and transmits an inquiry including the generated second characteristic information to the detection device 180 via the communication line 155. to inquire about outside line information. The outside line information may include, for example, the telephone number of the outside line telephone 170 of the other party in the call.

検出装置180は、録音装置130から第2の特徴情報を受信すると、受信した第2の特徴情報と、検出装置180にて生成した第1の特徴情報とを比較する。そして、第1の特徴情報と第2の特徴情報とが、所定の条件を満たして合致したとする。この場合、第1の特徴情報と第2の特徴情報の生成に用いられた音声データを伝送するそれぞれのパケットは同じ通話の音声を伝送するパケットであると見なすことができる。そのため、検出装置180は、第1の特徴情報の生成に用いた音声データを伝送するセッションの呼制御パケットから、外線電話機170の電話番号を取得し、外線電話機170の電話番号を含む外線情報を通信線155を介して録音装置130に通知する。 Upon receiving the second feature information from the recording device 130, the detection device 180 compares the received second feature information with the first feature information generated by the detection device 180. It is assumed that the first feature information and the second feature information match by satisfying a predetermined condition. In this case, each packet that transmits the audio data used to generate the first feature information and the second feature information can be considered to be a packet that transmits the audio of the same call. Therefore, the detection device 180 acquires the telephone number of the outside line telephone 170 from the call control packet of the session transmitting the voice data used to generate the first characteristic information, and extracts the outside line information including the telephone number of the outside line telephone 170. The recording device 130 is notified via the communication line 155.

録音装置130は、検出装置180から外線情報を受信すると、第2の特徴情報の生成に用いた音声データを伝送するセッションの呼制御パケットの呼制御情報に基づき内線電話機111の内線番号を取得する。そして、録音装置130は、そのセッションで伝送される音声データと、外線情報に含まれる外線電話機170の電話番号と、取得した内線電話機111の内線番号とを対応づけた録音データを生成し、記憶装置に記憶する。そのため、通話録音システム100を利用するユーザは、例えば、録音データの通話の音声が、どの電話間で行われた通話であるのかを知ることができる。なお、録音データは、更に通話の開始時刻および終了時刻などその他の情報を含んでもよい。 Upon receiving the outside line information from the detection device 180, the recording device 130 acquires the extension number of the extension telephone 111 based on the call control information of the call control packet of the session that transmits the audio data used to generate the second characteristic information. . Then, the recording device 130 generates recorded data that associates the audio data transmitted in the session, the telephone number of the outside telephone 170 included in the outside line information, and the extension number of the acquired extension telephone 111, and stores it. Store in the device. Therefore, the user who uses the call recording system 100 can know, for example, which telephones the voice of the call in the recorded data was made between. Note that the recorded data may further include other information such as the start time and end time of the call.

以下、検出装置180と、録音装置130とによる録音データの保存処理を更に詳細に説明する。なお、呼制御パケットは、例えば、SIP(Session Initiation Protocol)パケットであってよく、或いは、H.323プロトコル等のパケットであってもよい。以下では、SIPパケットを例に説明を行う。 The recording data storage process performed by the detection device 180 and the recording device 130 will be described in more detail below. Note that the call control packet may be, for example, a SIP (Session Initiation Protocol) packet, or an H. The packet may be a packet based on the H.323 protocol or the like. In the following, an explanation will be given using a SIP packet as an example.

図2は、実施形態に係る録音装置130のブロック構成を例示する図である。録音装置130は、例えば、制御部201、記憶部202、および通信部203を含む。録音装置130の制御部201は、例えば内線処理部211および保存部212などを含む。録音装置130の記憶部202は、例えば、後述する内線番号情報500、通話の内線番号、外線情報、および録音データなどを記憶してよい。通信部203は、例えば、制御部201の指示に従って内線網に接続し、内線網を流れるパケットを収集する。また、通信部203は、例えば、制御部201の指示に従って、検出装置180と通信する。これらの各部の詳細および記憶部202に格納されている情報の詳細については後述する。 FIG. 2 is a diagram illustrating a block configuration of the recording device 130 according to the embodiment. The recording device 130 includes, for example, a control section 201, a storage section 202, and a communication section 203. The control unit 201 of the recording device 130 includes, for example, an extension processing unit 211 and a storage unit 212. The storage unit 202 of the recording device 130 may store, for example, extension number information 500, a call extension number, outside line information, and recorded data, which will be described later. The communication unit 203 connects to the extension network according to instructions from the control unit 201, for example, and collects packets flowing through the extension network. Further, the communication unit 203 communicates with the detection device 180, for example, according to instructions from the control unit 201. The details of each of these units and the information stored in the storage unit 202 will be described later.

図3は、実施形態に係る検出装置180のブロック構成を例示する図である。検出装置180は、例えば、制御部301、記憶部302、および通信部303を含む。検出装置180の制御部301は、例えば外線処理部311などを含む。検出装置180の記憶部302は、例えば、後述する通話チャネル情報800およびチャンクハッシュ情報1400などを記憶してよい。通信部303は、例えば、制御部301の指示に従って外線網に接続し、外線網を流れるパケットを収集する。また、通信部303は、例えば、制御部301の指示に従って、録音装置130と通信する。これらの各部の詳細および記憶部302に格納されている情報の詳細については後述する。 FIG. 3 is a diagram illustrating a block configuration of the detection device 180 according to the embodiment. The detection device 180 includes, for example, a control section 301, a storage section 302, and a communication section 303. The control unit 301 of the detection device 180 includes, for example, an outside line processing unit 311. The storage unit 302 of the detection device 180 may store, for example, call channel information 800 and chunk hash information 1400, which will be described later. For example, the communication unit 303 connects to an external line network according to instructions from the control unit 301, and collects packets flowing through the external line network. Further, the communication unit 303 communicates with the recording device 130, for example, according to instructions from the control unit 301. The details of each of these units and the information stored in the storage unit 302 will be described later.

続いて、実施形態に係る録音装置130の制御部201が実行する録音データの保存処理を説明する。 Next, a recording data storage process executed by the control unit 201 of the recording device 130 according to the embodiment will be described.

図4は、実施形態に係る録音装置130の制御部201が実行する録音データの保存処理の動作フローを示す図である。録音装置130の制御部201は、録音処理の実行指示が入力されると図4の動作フローを開始してよい。 FIG. 4 is a diagram illustrating an operational flow of recording data storage processing executed by the control unit 201 of the recording device 130 according to the embodiment. The control unit 201 of the recording device 130 may start the operation flow shown in FIG. 4 when an instruction to execute the recording process is input.

S401において録音装置130の制御部201は、ハブ122を介して内線網を流れるパケットを取り込む。 In S401, the control unit 201 of the recording device 130 captures packets flowing through the extension network via the hub 122.

S402において制御部201は、取り込んだパケットがSIPパケットであるか否かを判定する。なお、パケットの種別は、例えば、パケットのヘッダなどの情報から判定することができる。取り込んだパケットがSIPパケットである場合(S402がYES)、フローはS403に進む。 In S402, the control unit 201 determines whether the captured packet is a SIP packet. Note that the type of the packet can be determined from information such as the packet header, for example. If the captured packet is a SIP packet (YES in S402), the flow advances to S403.

S403において制御部201は、SIPパケットがセッション開始のパケットであるか否かを判定する。S403においてSIPパケットがセッション開始のパケットでない場合(S403がNO)、フローはS405に進む。一方、SIPパケットがセッション開始のパケットである場合(S403がYES)、フローはS404に進む。 In S403, the control unit 201 determines whether the SIP packet is a session start packet. If the SIP packet is not a session start packet in S403 (NO in S403), the flow advances to S405. On the other hand, if the SIP packet is a session start packet (YES in S403), the flow advances to S404.

S404において制御部201は、SIPパケットに含まれるアドレス情報に基づいて内線番号を取得する。一例として、録音装置130の記憶部202には、構内電話機に割り付けられたIPアドレスと内線番号とを対応づける内線番号情報500が記憶されていてよい。図5は、例示的な内線番号情報500を示す図である。制御部201は、例えば、内線番号情報500を参照して、SIPパケットに含まれるIPアドレスと対応する内線番号を特定してよい。なお、実施形態はこれに限定されるものではない。例えば、別の実施形態では、録音装置130は、SIPパケットのアドレス情報に基づいて、構内交換機120から内線番号の情報を取得してもよい。そして、制御部201は、内線番号を記憶部202に記憶し、フローはS405に進む。 In S404, the control unit 201 acquires the extension number based on the address information included in the SIP packet. As an example, the storage unit 202 of the recording device 130 may store extension number information 500 that associates an IP address assigned to a private telephone with an extension number. FIG. 5 is a diagram illustrating example extension number information 500. For example, the control unit 201 may refer to the extension number information 500 to identify the extension number corresponding to the IP address included in the SIP packet. Note that the embodiment is not limited to this. For example, in another embodiment, recording device 130 may obtain extension number information from private branch exchange 120 based on address information in the SIP packet. Then, the control unit 201 stores the extension number in the storage unit 202, and the flow advances to S405.

S405において制御部201は、SIPパケットがセッション終了のパケットであるか否かを判定する。SIPパケットがセッション終了のパケットでない場合(S405がNO)、フローはS401に戻り、新たなパケットについて処理を繰り返す。 In S405, the control unit 201 determines whether the SIP packet is a session end packet. If the SIP packet is not a session end packet (NO in S405), the flow returns to S401 and repeats the process for a new packet.

また、S402において取り込んだパケットがSIPパケットでない場合(S402がNO)、フローはS407に進む。 Further, if the captured packet in S402 is not a SIP packet (NO in S402), the flow advances to S407.

S407において制御部201は、取り込んだパケットが、SIPパケットで確立したセッションの音声データを伝送するRTP(Real-time Transport Protocol)パケットであるか否かを判定する。なお、上述のセッション開始のSIPパケットには、例えば、SDP(Session Description Protocol)プロトコルなどを用いて、セッション内で伝送するRTPパケットのアドレス情報などが含まれている。一例では、制御部201は、その情報に基づいて、取り込んだパケットが、SIPパケットで確立したセッションの音声データを伝送するRTPパケットであるか否かを判定してよい。取り込んだパケットがSIPパケットで確立したセッションの音声データを伝送するRTPパケットでない場合(S407がNO)、フローはS401に戻り、新たなパケットについて処理を繰り返す。一方、取り込んだパケットがSIPパケットで確立したセッションの音声データを伝送するRTPパケットである場合(S407がYES)、フローはS408に進む。なお、ここでは、音声データを伝送するパケットとしてRTPパケットを例示しているが、実施形態はこれに限定されるものではなく、その他の音声データを伝送するパケットであってもよい。 In S407, the control unit 201 determines whether the captured packet is an RTP (Real-time Transport Protocol) packet that transmits audio data of a session established using a SIP packet. Note that the above-mentioned session start SIP packet includes address information of an RTP packet to be transmitted within the session using, for example, SDP (Session Description Protocol) protocol. In one example, the control unit 201 may determine, based on the information, whether the captured packet is an RTP packet that transmits audio data of a session established using a SIP packet. If the captured packet is not an RTP packet that transmits audio data for a session established using a SIP packet (S407 is NO), the flow returns to S401 and the process is repeated for a new packet. On the other hand, if the captured packet is an RTP packet that transmits audio data of a session established using a SIP packet (YES in S407), the flow advances to S408. Although an RTP packet is exemplified here as a packet for transmitting audio data, the embodiment is not limited to this, and may be a packet for transmitting other audio data.

S408において制御部201は、取り込んだRTPパケットから音声データを収集する。そして、S409において制御部201は、収集した音声データを記憶部202に記憶する。 In S408, the control unit 201 collects audio data from the captured RTP packets. Then, in S409, the control unit 201 stores the collected audio data in the storage unit 202.

S410において制御部201は、現在処理しているセッションと対応する相手局の外線電話機170の電話番号を含む外線情報を既に記憶部202に記憶済みか否かを判定する。なお、外線情報は、後述するS414の処理で記憶部202に記憶される。外線情報を記憶部202に記憶済みである場合(S410がYES)、フローはS401に戻る。一方、外線情報を記憶部202に記憶済みでない場合(S410がNO)、フローはS411に進む。 In S410, the control unit 201 determines whether the storage unit 202 has already stored outside line information including the telephone number of the outside line telephone 170 of the partner station corresponding to the session currently being processed. Note that the outside line information is stored in the storage unit 202 in the process of S414, which will be described later. If the outside line information has already been stored in the storage unit 202 (S410: YES), the flow returns to S401. On the other hand, if the outside line information has not been stored in the storage unit 202 (NO in S410), the flow advances to S411.

S411において制御部201は、S409で記憶部202に記憶した音声データを所定のアルゴリズムを用いて処理し、音声データの特徴を表す特徴情報を生成する特徴情報生成処理を実行する。なお、音声データの特徴を表す特徴情報としては、一例では音声データから生成したハッシュ値や音声フィンガープリント(例えば、Landmark-based fingerprinting)を用いることができる。音声データのハッシュ値等を比較に用いることで、音声の比較におけるデータ量および計算量を削減することができる。しかしながら、別の実施形態では、特徴情報は、記憶部202に記憶した音声データの一部を切り出した音声データであってもよい。また、特徴情報は、音声データから生成される声紋データであってもよい。また、声紋データは他の音声の比較(例えば、ハッシュ値等の比較)と組み合わせて用いられても良い。特徴情報の生成の更なる例示については、図11から図14を参照して後述する。 In S411, the control unit 201 processes the audio data stored in the storage unit 202 in S409 using a predetermined algorithm, and executes feature information generation processing to generate feature information representing the characteristics of the audio data. Note that as the characteristic information representing the characteristics of the audio data, for example, a hash value generated from the audio data or an audio fingerprint (for example, landmark-based fingerprinting) can be used. By using the hash value of audio data for comparison, it is possible to reduce the amount of data and calculation amount for comparing audio. However, in another embodiment, the feature information may be audio data extracted from a part of the audio data stored in the storage unit 202. Further, the feature information may be voiceprint data generated from audio data. Furthermore, voiceprint data may be used in combination with other voice comparisons (for example, comparisons of hash values, etc.). Further examples of generating feature information will be described below with reference to FIGS. 11-14.

S412において制御部201は、生成した特徴情報を用いて検出装置180に外線情報の問い合わせを行う。なお、外線情報は、例えば、ゲートウェイ101の内側では取得できない相手局の外線電話機170の電話番号を含んでよい。また更に、外線情報は、例えば、ゲートウェイ101の内側では取得できない自局の電話番号(外線)を含んでもよい。 In S412, the control unit 201 uses the generated feature information to inquire of the detection device 180 about outside line information. Note that the outside line information may include, for example, the telephone number of the outside line telephone 170 of the partner station, which cannot be obtained inside the gateway 101. Furthermore, the outside line information may include, for example, the telephone number (external line) of the own station that cannot be obtained inside the gateway 101.

なお、検出装置180は、例えば、外線網においてパケットを監視し、パケットから収集した音声データから、その音声データの特徴を表す特徴情報を生成している。そして、検出装置180は、生成した特徴情報に、録音装置130からの問い合わせで通知された特徴情報と所定の条件を満たして合致する特徴情報がある場合に、特徴情報の生成に用いた音声データが伝送されるセッションの呼制御パケットから、相手局の外線電話機170の電話番号や自局の電話番号(外線)を取得し、相手局の外線電話機170の電話番号および自局の電話番号(外線)を含む外線情報を録音装置130に返信してよい。また、検出装置180は、録音装置130からの問い合わせで通知された特徴情報と所定の条件を満たして合致する特徴情報がない場合、異常終了を返信してよい。検出装置180の実行する処理の更なる詳細は、図6を参照して後述する。 Note that the detection device 180, for example, monitors packets in an outside line network, and generates characteristic information representing the characteristics of the voice data from the voice data collected from the packets. Then, when the generated feature information includes feature information that satisfies predetermined conditions and matches the feature information notified in response to the inquiry from the recording device 130, the detection device 180 detects the audio data used to generate the feature information. The telephone number of the outside line telephone 170 of the other station and the telephone number of the own station (external line) are acquired from the call control packet of the session in which the ) may be sent back to the recording device 130. Furthermore, if there is no feature information that satisfies and matches the feature information notified by the inquiry from the recording device 130, the detection device 180 may return an abnormal end. Further details of the processing executed by the detection device 180 will be described later with reference to FIG.

S413において制御部201は、問い合わせの結果、検出装置180から外線情報を受信したか否かを判定する。検出装置180から異常終了の通知を受けた場合(S413がNO)、フローはS401に戻る。一方、検出装置180から外線情報を受信した場合(S413がYES)、フローはS414に進む。 In S413, the control unit 201 determines whether or not outside line information has been received from the detection device 180 as a result of the inquiry. If a notification of abnormal termination is received from the detection device 180 (NO in S413), the flow returns to S401. On the other hand, if outside line information is received from the detection device 180 (S413: YES), the flow advances to S414.

S414において制御部201は、外線情報を記憶部202に記憶し、フローはS401に戻る。 In S414, the control unit 201 stores the outside line information in the storage unit 202, and the flow returns to S401.

そして、S405においてSIPパケットがセッション終了のパケットである場合(S405がYES)、フローはS406に進む。S406では制御部201は、S404で取得した内線番号と、S414で記憶部202に記憶した外線情報に含まれる相手局の外線電話機170の電話番号および自局の電話番号(外線)と、S409で記憶部202に記憶した通話の音声データとを対応づけた録音データを生成し、録音データを記憶部202に記憶し、フローはS401に戻る。 If the SIP packet is a session end packet in S405 (YES in S405), the flow advances to S406. In S406, the control unit 201 retrieves the extension number acquired in S404, the telephone number of the outside line telephone 170 of the partner station and the telephone number (external line) of the own station included in the outside line information stored in the storage unit 202 in S414, and the telephone number (external line) of the own station in S409. Recorded data is generated in association with the voice data of the call stored in the storage unit 202, the recorded data is stored in the storage unit 202, and the flow returns to S401.

以上で述べたように、音声データの特徴を表す特徴情報の比較により、内線網と外線網とで同じ通話の音声データを伝送するセッションを特定し、そのセッションの呼制御パケットの情報に基づき内線番号と外線電話機170の電話番号とを対応づけることができる。その結果、構内交換機に依存せずに、通話の発着信が行われた内線番号と外線電話機170の電話番号の情報を録音データに付すことができる。また、上述の実施形態では、外線網における自局の電話番号も取得しているため、例えば、代表番号が複数設定されている場合に、どの代表番号が用いられたかを特定することもできる。しかしながら、実施形態において外線網における自局の電話番号は取得されなくてもよい。 As described above, by comparing feature information representing the characteristics of voice data, a session in which voice data of the same call is transmitted between an extension network and an external network can be identified, and the extension The number can be associated with the telephone number of the outside telephone 170. As a result, information on the extension number where the call was made and the telephone number of the outside line telephone 170 can be added to the recorded data without depending on the private branch exchange. Furthermore, in the above-described embodiment, since the telephone number of the own station in the outside line network is also obtained, for example, if a plurality of representative numbers are set, it is also possible to specify which representative number was used. However, in the embodiment, the telephone number of the own station in the outside line network may not be acquired.

続いて、検出装置180が実行する処理について説明する。 Next, the processing executed by the detection device 180 will be explained.

図6は、実施形態に係る検出装置180の制御部301が実行する特徴情報の生成処理の動作フローを例示する図である。 FIG. 6 is a diagram illustrating an operational flow of feature information generation processing executed by the control unit 301 of the detection device 180 according to the embodiment.

なお、図6においてS601~S603、S605、S607~S608の処理は、それぞれ図4のS401~S403、S405、S407~S408の処理と対応しており、例えば、S401~S403、S405、S407~S408と同様の処理が実行されてよい。ただし、検出装置180は、図1に示すように外線網150に設置されており、S601では制御部301は、外線網を流れるパケットを取り込む。そして、S604では制御部301は、呼制御パケットから外線情報(例えば、相手局の外線電話機170の電話番号、および自局の電話番号(外線))を記憶する。 Note that the processes in S601 to S603, S605, and S607 to S608 in FIG. 6 correspond to the processes in S401 to S403, S405, and S407 to S408 in FIG. Processing similar to may be performed. However, the detection device 180 is installed in the outside line network 150 as shown in FIG. 1, and in S601, the control unit 301 captures a packet flowing through the outside line network. Then, in S604, the control unit 301 stores outside line information (for example, the telephone number of the outside line telephone 170 of the partner station and the telephone number (external line) of the own station) from the call control packet.

また更に、S609では制御部301は、S608で収集した音声データから開始位置をずらして複数の音声データを取得し、それぞれの音声データから連続する特徴情報を生成する連続特徴情報生成処理を実行する。 Furthermore, in S609, the control unit 301 acquires a plurality of pieces of audio data by shifting the starting position from the audio data collected in S608, and executes continuous feature information generation processing that generates continuous feature information from each piece of audio data. .

図7は、実施形態に係る連続した特徴情報の生成を例示する図である。図7(a)は、セッションを流れるRTPパケットのストリームを並べたものである。そして、制御部301は、S608の処理でRTPパケットから音声データを収集し、S609で収集した音声データを所定の長さ(例えば、10ms)のチャンク(Chunk)に分割し、連続した複数のチャンクを作成する(図7(b))。そして、制御部301は、特徴情報の生成に用いるチャンクの開始位置をずらしながら、所定の数のチャンク(図7では5つ)の音声データを用いて複数の特徴情報を生成する。なお、このように、複数の開始位置にて特徴情報を生成することで、例えば、録音装置130からの問い合わせで通知される特徴情報の生成に用いられた音声データが、どの位置から開始しているのかが分からなくても、生成した複数の特徴情報のそれぞれと、問い合わせで通知される特徴情報とが合致するかを探索することで、対応する特徴情報を見つけることができる。また、検出装置180が生成する特徴情報の数や、どの範囲の音声データを特徴情報の生成に用いるのか等の設定は、例えば、録音装置130で検出されたパケットと同じデータを伝送するパケットが検出装置180で検出されるまでにかかる時間等の通話録音システム100の構成や環境などに応じて決定することができる。そして、S609の処理では制御部301は、開始位置をずらしながら生成した複数の特徴情報を、通話チャネル情報800に登録してよい。 FIG. 7 is a diagram illustrating generation of continuous feature information according to the embodiment. FIG. 7(a) shows a stream of RTP packets flowing through a session. Then, the control unit 301 collects audio data from the RTP packets in the process of S608, divides the audio data collected in S609 into chunks of a predetermined length (for example, 10 ms), and divides the audio data into consecutive chunks. (Figure 7(b)). Then, the control unit 301 generates a plurality of pieces of feature information using a predetermined number of chunks (five in FIG. 7) of audio data while shifting the starting positions of the chunks used to generate the feature information. Note that by generating feature information at a plurality of starting positions in this way, for example, it is possible to determine from which position the audio data used to generate the feature information notified in response to an inquiry from the recording device 130 starts. Even if you do not know whether there is a user, you can find the corresponding feature information by searching to see if each of the generated feature information matches the feature information notified in the inquiry. In addition, settings such as the number of feature information generated by the detection device 180 and the range of audio data to be used for generating the feature information can be changed, for example, by determining whether a packet transmitting the same data as a packet detected by the recording device 130 is The time required for detection by the detection device 180 can be determined depending on the configuration and environment of the call recording system 100, etc. Then, in the process of S609, the control unit 301 may register a plurality of pieces of characteristic information generated while shifting the starting positions in the call channel information 800.

図8は、実施形態に係る通話チャネル情報800を例示する図である。通話チャネル情報800には、例えば、通話チャネル、外線情報、および複数の特徴情報が登録されている。通話チャネルは、通話に用いられている回線を識別する情報である。また、外線情報は、S604の処理で外線情報(例えば、相手局の外線電話機170の電話番号および自局の電話番号(外線))が登録されてよい。特徴情報には、RTPパケットストリームの並び順に従って複数の特徴情報が登録されてよい。図8の例では、上段に登録されている特徴情報ほど先頭側に配置されたRTPパケットの音声データから生成されており、下段に登録されている特徴情報ほど末尾側に配置されたRTPパケットの音声データから生成されているものとする。通話チャネル情報800は、S603の処理で検出される通話のセッションごとに生成されてよい。 FIG. 8 is a diagram illustrating call channel information 800 according to the embodiment. In the call channel information 800, for example, call channels, outside line information, and a plurality of pieces of characteristic information are registered. The call channel is information that identifies the line used for the call. Further, as the outside line information, outside line information (for example, the telephone number of the outside line telephone 170 of the partner station and the telephone number (external line) of the own station) may be registered in the process of S604. A plurality of pieces of feature information may be registered in the feature information according to the order of the RTP packet streams. In the example of FIG. 8, the feature information registered in the upper row is generated from the audio data of the RTP packet located at the beginning, and the feature information registered in the lower row is generated from the audio data of the RTP packet located at the end. It is assumed that it is generated from audio data. The call channel information 800 may be generated for each call session detected in the process of S603.

以上で述べた図8の動作フローにより、検出装置180の制御部301は、外線網150を流れるパケットから、検出したセッションごとに通話チャネル情報800を生成することができる。 According to the operation flow shown in FIG. 8 described above, the control unit 301 of the detection device 180 can generate call channel information 800 for each detected session from packets flowing through the outside line network 150.

続いて、実施形態に係る検出装置180が実行する問い合わせ応答処理を説明する。図9は、実施形態に係る検出装置180の制御部301が実行する問い合わせ応答処理の動作フローを例示する図である。例えば、検出装置180の制御部301は、上述のS412の処理による録音装置130からの外線情報の問い合わせを受信すると、図9の動作フローを開始してよい。 Next, inquiry response processing executed by the detection device 180 according to the embodiment will be described. FIG. 9 is a diagram illustrating an operational flow of inquiry response processing executed by the control unit 301 of the detection device 180 according to the embodiment. For example, the control unit 301 of the detection device 180 may start the operation flow of FIG. 9 upon receiving the inquiry for outside line information from the recording device 130 through the process of S412 described above.

S901において検出装置180の制御部301は、現在継続中のセッションに対して生成された通話チャネル情報800のうちから、未選択の通話チャネル情報800を選択する。 In S901, the control unit 301 of the detection device 180 selects unselected call channel information 800 from the call channel information 800 generated for the currently ongoing session.

S902において制御部301は、選択した通話チャネル情報800から未選択の特徴情報を選択する。 In S902, the control unit 301 selects unselected feature information from the selected call channel information 800.

S903において制御部301は、録音装置130からの問い合わせに含まれる特徴情報と、通話チャネル情報800から選択した特徴情報とが所定の条件を満たして合致するか否かを判定する。所定の条件は、例えば、特徴情報として用いる値に応じて設定されてよい。例えば、特徴情報として、音声データに基づき取得したハッシュ値を用いる場合には、所定の条件は、2つの特徴情報が一致することであってよい。また、例えば、特徴情報として、音声データから切り出した所定長の音声データを用いる場合には、所定の条件は、2つの特徴情報が所定の誤差範囲内で類似していることであってよい。また、所定の条件は、例えば、声紋データ比較により所定の誤差範囲内で類似していることであってもよい。このように、S903の処理は、利用する特徴情報の性質に応じて、所定の誤差を許容するように判定を行ってもよいし、完全一致するか否かを判定してもよい。特徴情報が合致しない場合(S903がNO)、フローはS905に進む。 In S903, the control unit 301 determines whether the feature information included in the inquiry from the recording device 130 and the feature information selected from the call channel information 800 match by satisfying a predetermined condition. The predetermined condition may be set, for example, depending on the value used as the feature information. For example, when using a hash value acquired based on audio data as the feature information, the predetermined condition may be that two pieces of feature information match. Further, for example, when using audio data of a predetermined length cut out from audio data as the feature information, the predetermined condition may be that the two pieces of feature information are similar within a predetermined error range. Further, the predetermined condition may be, for example, that voiceprint data are similar within a predetermined error range by comparison. In this way, in the process of S903, depending on the nature of the feature information to be used, the determination may be made to allow a predetermined error, or it may be determined whether there is a complete match. If the feature information does not match (NO in S903), the flow advances to S905.

S905において制御部301は、選択した通話チャネル情報800に含まれる全ての特徴情報との合致の確認が完了したか否かを判定する。まだ、未選択の特徴情報がある場合(S905がNO)、フローはS902に戻り、未選択の特徴情報を選択して処理を繰り返す。一方、通話チャネル情報800に含まれる全ての特徴情報との合致の確認が完了した場合(S905がYES)、フローはS906に進む。 In S905, the control unit 301 determines whether or not confirmation of matching with all feature information included in the selected call channel information 800 has been completed. If there is still unselected feature information (NO in S905), the flow returns to S902, selects the unselected feature information, and repeats the process. On the other hand, if the confirmation of matching with all the characteristic information included in the call channel information 800 is completed (S905 is YES), the flow advances to S906.

S906において制御部301は、現在継続中のセッションに対して生成された通話チャネル情報800のうちで、未選択の通話チャネル情報800があるか否かを判定する。まだ、未選択の通話チャネル情報800がある場合(S906がNO)、フローはS901に戻り、未選択の通話チャネル情報800を選択して処理を繰り返す。一方、現在継続中のセッションに対して生成された通話チャネル情報800の全てを処理し終わっている場合(S906がYES)、フローはS907に進む。 In S906, the control unit 301 determines whether there is any unselected call channel information 800 among the call channel information 800 generated for the currently ongoing session. If there is still unselected call channel information 800 (NO in S906), the flow returns to S901, selects the unselected call channel information 800, and repeats the process. On the other hand, if all of the call channel information 800 generated for the currently ongoing session has been processed (YES in S906), the flow advances to S907.

S907において制御部301は、特徴情報が合致する通話チャネル情報800を特定できなかったため、異常終了を録音装置130に返信し、本動作フローは終了する。 In step S907, since the control unit 301 could not identify the call channel information 800 with which the characteristic information matches, it returns abnormal termination to the recording device 130, and this operation flow ends.

また、S903において特徴情報が合致する場合(S903がYES)、フローはS904に進む。この場合、問い合わせで通知された特徴情報の生成に用いられた通話の音声データと、通話チャネル情報800の特徴情報の生成に用いられた通話の音声データとは同じ通話であると見なすことができる。そのため、S904では制御部301は、合致した特徴情報が登録されている通話チャネル情報800の外線情報(例えば、相手局の外線電話機170の電話番号および自局の電話番号(外線))を含む応答を録音装置130に送信し、本動作フローは終了する。 Further, if the feature information matches in S903 (YES in S903), the flow advances to S904. In this case, the voice data of the call used to generate the feature information notified in the inquiry and the voice data of the call used to generate the feature information of the call channel information 800 can be considered to be the same call. . Therefore, in S904, the control unit 301 responds with a response that includes the outside line information (for example, the telephone number of the outside line telephone 170 of the other party and the telephone number (external line) of the own station) of the call channel information 800 in which the matching feature information is registered. is transmitted to the recording device 130, and this operation flow ends.

以上の図9の動作フローによれば、検出装置180の制御部301は、問い合わせで通知された特徴情報と合致する特徴情報を含む通話チャネル情報800を特定することで、外線情報を録音装置130に提供することができる。また、検出装置180の制御部301は、合致する特徴情報を特定できない場合には、異常終了を返すことで、合致する特徴情報が見つけられなかったことを通知することができる。 According to the operation flow shown in FIG. 9, the control unit 301 of the detection device 180 transmits outside line information to the recording device 130 by specifying the call channel information 800 that includes feature information that matches the feature information notified in the inquiry. can be provided to Furthermore, when the matching feature information cannot be identified, the control unit 301 of the detection device 180 can notify that matching feature information was not found by returning an abnormal end.

なお、図10は、以上の図9の動作フローで実行される特徴情報の合致の判定を説明する図である。図10には、検出装置180の制御部301が検出したセッションを伝送されるRTPパケットのストリーム(RTP1~RTPn)が示されている(図10(a))。そして、実施形態では、制御部301は、RTPパケットのストリームで伝送される音声データを、所定の長さ(例えば、10ms)のチャンクに分割し、連続した複数のチャンクを作成する(図10(b))。 Note that FIG. 10 is a diagram illustrating the determination of whether the feature information matches, which is executed in the operation flow of FIG. 9 above. FIG. 10 shows a stream of RTP packets (RTP1 to RTPn) that transmit a session detected by the control unit 301 of the detection device 180 (FIG. 10(a)). In the embodiment, the control unit 301 divides the audio data transmitted in the stream of RTP packets into chunks of a predetermined length (for example, 10 ms), and creates a plurality of consecutive chunks (FIG. 10( b)).

そして、制御部301は、開始位置をずらしながら、所定の数のチャンクをまとめた音声データから複数の特徴情報を生成する(図10(c))。例えば、図10の例では、5つのチャンクをまとめた音声データから特徴情報が生成されており、開始位置を1チャンクずつずらして複数の特徴情報(例えば、特徴情報1~特徴情報5)が生成されている。そして、制御部301は、生成した複数の特徴情報を、録音装置130から受信した特徴情報Xと比較する。ここで、生成した複数の特徴情報のいずれかと、録音装置130から受信した特徴情報Xとが所定の条件を満たして合致したとする。例えば、図10の例では、特徴情報4と特徴情報Xとが合致している。この場合、制御部301は、特徴情報4と特徴情報Xとが取得された音声データの通話を同じ通話と特定することができる。 Then, the control unit 301 generates a plurality of pieces of feature information from the audio data that is a predetermined number of chunks while shifting the starting position (FIG. 10(c)). For example, in the example shown in FIG. 10, feature information is generated from audio data that is a collection of five chunks, and multiple pieces of feature information (for example, feature information 1 to feature information 5) are generated by shifting the starting position one chunk at a time. has been done. Then, the control unit 301 compares the generated plural pieces of feature information with the feature information X received from the recording device 130. Here, it is assumed that any one of the plurality of generated feature information and the feature information X received from the recording device 130 meet a predetermined condition. For example, in the example of FIG. 10, feature information 4 and feature information X match. In this case, the control unit 301 can identify the calls of the voice data for which the feature information 4 and the feature information X have been acquired as the same call.

なお、図10(c)では、特徴情報の生成に用いる音声データの開始位置を徐々にずらしながら連続する複数の特徴情報を生成している。それにより、図10(d)の録音装置130において特徴情報Xの生成に用いられる音声データの開始位置と、検出装置180で収集した音声データのどの位置が対応するのかが分からない場合にも、合致する位置を探索することで同じ通話か否かを判定することができる。 Note that in FIG. 10C, a plurality of consecutive pieces of feature information are generated while gradually shifting the start position of the audio data used to generate the feature information. Thereby, even if it is not known which position of the audio data collected by the detection device 180 corresponds to the starting position of the audio data used to generate the feature information X in the recording device 130 of FIG. 10(d), By searching for matching positions, it is possible to determine whether the calls are the same or not.

以上に述べたように、実施形態によれば、通話の音声データに、内線網で取得した内線番号と、外線網で取得した外線電話機170の電話番号および自局の電話番号(外線)を対応づけて、録音データを保存することができる。従って、実施形態によれば、通話の発信元と、着信先とを、録音データから特定することが可能になる。 As described above, according to the embodiment, the extension number obtained from the extension network, the telephone number of the external telephone 170 obtained from the external network, and the telephone number of the own station (external line) are included in the voice data of the call. You can save the recorded data by attaching it. Therefore, according to the embodiment, it is possible to identify the originator and destination of the call from the recorded data.

(特徴情報の生成例)
続いて、実施形態に係る特徴情報の生成の一例を以下に示す。以下の例では、上述の音声データの分割で得られたチャンクのハッシュ値を計算し、得られた複数のチャンクのハッシュ値から更にハッシュ値を取得して得られたストリームハッシュを、特徴情報として用いる。
(Example of feature information generation)
Next, an example of generation of feature information according to the embodiment will be shown below. In the example below, the hash value of the chunk obtained by dividing the audio data described above is calculated, and the stream hash obtained by further obtaining hash values from the hash values of the obtained multiple chunks is used as the feature information. use

図11は、一実施形態に係る録音装置130が実行する特徴情報生成処理の動作フローを例示する図である。また、図12は、音声データからの特徴情報の生成を説明する図である。一実施形態においては、録音装置130の制御部201は、例えば、S411において図11の動作フローを実行してよい。 FIG. 11 is a diagram illustrating an operational flow of feature information generation processing performed by the recording device 130 according to an embodiment. Further, FIG. 12 is a diagram illustrating generation of feature information from audio data. In one embodiment, the control unit 201 of the recording device 130 may execute the operation flow of FIG. 11 in S411, for example.

S1001において制御部201は、S409の処理で記憶部202に保存されている音声データのうちから、RTPパケットと対応する所定期間の音声データを読み出し、音声データを複数のチャンクに分割する(図12の(a)および(b))。一実施形態においては、読み出される所定期間の音声データは、直近のS407の処理の実行で受信されたRTPパケットに含まれる音声データを含んでよい。 In S1001, the control unit 201 reads audio data for a predetermined period corresponding to the RTP packet from the audio data stored in the storage unit 202 in the process of S409, and divides the audio data into a plurality of chunks (Fig. 12 (a) and (b)). In one embodiment, the audio data for the predetermined period that is read may include audio data included in the RTP packet received in the most recent execution of the process of S407.

S1002において制御部201は、分割により得られた複数のチャンクのうちから、所定数のチャンクのハッシュ値をそれぞれ生成する。図12(c)の例では、連続する5つのチャンクのそれぞれから5つのハッシュ値が生成されている。なお、以下では、チャンクから生成したハッシュ値をチャンクハッシュと呼ぶことがある。また、ハッシュ値の生成は、例えば、FNV-1およびCRC-32などの様々なハッシュアルゴリズムを用いて実行することができる。 In S1002, the control unit 201 generates hash values for a predetermined number of chunks from among the plurality of chunks obtained by the division. In the example of FIG. 12(c), five hash values are generated from each of five consecutive chunks. Note that hereinafter, a hash value generated from a chunk may be referred to as a chunk hash. Also, generation of hash values can be performed using various hash algorithms such as, for example, FNV-1 and CRC-32.

S1003において制御部201は、生成した所定数のチャンクハッシュを用いてストリームハッシュを生成する。図12(d)の例では、制御部201は、連続する5つのチャンクハッシュに対してハッシュアルゴリズムを適用し、ハッシュ値を生成する。なお、この複数の連続するチャンクハッシュから生成したハッシュ値を、以下では、ストリームハッシュと呼ぶことがある。ストリームハッシュを生成すると図11の動作フローは終了し、フローはS412に進んでよい。なお、S412では制御部201は、生成したストリームハッシュを特徴情報として問い合わせ実行し、外線情報を問い合わせてよい。 In S1003, the control unit 201 generates a stream hash using the generated predetermined number of chunk hashes. In the example of FIG. 12(d), the control unit 201 applies a hash algorithm to five consecutive chunk hashes to generate a hash value. Note that the hash value generated from the plurality of consecutive chunk hashes may hereinafter be referred to as a stream hash. Once the stream hash is generated, the operational flow of FIG. 11 ends, and the flow may proceed to S412. Note that in S412, the control unit 201 may inquire about outside line information by using the generated stream hash as feature information.

続いて、図11の録音装置130の特徴情報生成処理と対応する検出装置180による連続する特徴情報の生成処理を説明する。 Next, continuous feature information generation processing by the detection device 180, which corresponds to the feature information generation processing by the recording device 130 in FIG. 11, will be described.

図13は、一実施形態に係る連続する特徴情報の生成処理の動作フローを例示する図である。例えば、検出装置180の制御部301は、図6のS609に進むと、図13の動作フローを開始してよい。 FIG. 13 is a diagram illustrating an operational flow of continuous feature information generation processing according to an embodiment. For example, the control unit 301 of the detection device 180 may start the operation flow of FIG. 13 after proceeding to S609 of FIG.

S1301において制御部301は、S608の処理で収集した音声データを複数のチャンクに分割する。S1302において制御部301は、生成した複数のチャンクの先頭から順にチャンクを1つ選択する。 In S1301, the control unit 301 divides the audio data collected in the process of S608 into multiple chunks. In S1302, the control unit 301 selects one chunk sequentially from the top of the plurality of generated chunks.

S1303において制御部301は、選択したチャンクからチャンクハッシュを生成する。S1304において制御部301は、生成したチャンクハッシュでチャンクハッシュ情報1400を更新する。なお、S1303の処理において制御部301は、例えば、チャンクハッシュ情報1400に登録されているチャンクハッシュの数が、所定数に満たない場合には、登録されているチャンクハッシュの末尾に、生成したチャンクハッシュを登録してよい。一方、制御部301は、例えば、チャンクハッシュ情報1400に所定数のチャンクハッシュが既に登録されている場合には、最も古くにチャンクハッシュ情報1400に登録された先頭のチャンクハッシュを削除する。そして、制御部301は、S1303で新たに生成したチャンクハッシュをチャンクハッシュ情報1400の末尾に追加してチャンクハッシュ情報1400を更新してよい。 In S1303, the control unit 301 generates a chunk hash from the selected chunk. In S1304, the control unit 301 updates the chunk hash information 1400 with the generated chunk hash. Note that in the process of S1303, for example, if the number of chunk hashes registered in the chunk hash information 1400 is less than a predetermined number, the control unit 301 adds the generated chunk to the end of the registered chunk hashes. You can register hashes. On the other hand, if a predetermined number of chunk hashes are already registered in the chunk hash information 1400, the control unit 301 deletes the first chunk hash that was registered in the chunk hash information 1400 the oldest. Then, the control unit 301 may update the chunk hash information 1400 by adding the newly generated chunk hash in S1303 to the end of the chunk hash information 1400.

図14は、一実施形態に係るチャンクハッシュ情報1400を例示する図である。チャンクハッシュ情報1400には、通話チャネル、外線情報、および所定数のチャンクハッシュが登録されている。通話チャネルは、通話に用いられている回線を識別する情報である。また、外線情報には、S604の処理で外線情報(例えば、相手局の外線電話機170の電話番号および自局の電話番号(外線))が登録されてよい。チャンクハッシュには、チャンクハッシュの生成に用いられた音声データを伝送するRTPパケットストリームの並び順に従って所定数のチャンクハッシュが登録されてよい。図14の例では、上段に登録されているチャンクハッシュほど先頭側に配置されたRTPパケットの音声データから生成されており、下段に登録されているチャンクハッシュほど末尾側に配置されたRTPパケットの音声データから生成されているものとする。チャンクハッシュ情報1400は、S603で検出される通話のセッションごとに生成されてよい。 FIG. 14 is a diagram illustrating chunk hash information 1400 according to one embodiment. In the chunk hash information 1400, a call channel, outside line information, and a predetermined number of chunk hashes are registered. The call channel is information that identifies the line used for the call. In addition, outside line information (for example, the telephone number of the outside line telephone 170 of the partner station and the telephone number (external line) of the own station) may be registered in the outside line information in the process of S604. A predetermined number of chunk hashes may be registered in the chunk hash according to the order of the RTP packet streams that transmit the audio data used to generate the chunk hashes. In the example of FIG. 14, the chunk hash registered in the upper row is generated from the audio data of the RTP packet located at the beginning, and the chunk hash registered in the lower row is generated from the audio data of the RTP packet located at the end. It is assumed that it is generated from audio data. The chunk hash information 1400 may be generated for each call session detected in S603.

そして、S1305の処理では、制御部301は、例えば、チャンクハッシュ情報1400に登録されているチャンクハッシュの数が、所定数に達しているか否かを判定する。なお、一実施形態においては、所定数は、ストリームハッシュの生成に用いるチャンクハッシュの数に設定されていてよい。チャンクハッシュ情報1400に登録されているチャンクハッシュの数が所定数に満たない場合(S1305がNO)、フローはS1308に進む。一方、チャンクハッシュ情報1400に所定数のチャンクハッシュが登録されている場合(S1305がYES)、フローはS1306に進む。 In the process of S1305, the control unit 301 determines, for example, whether the number of chunk hashes registered in the chunk hash information 1400 has reached a predetermined number. Note that in one embodiment, the predetermined number may be set to the number of chunk hashes used to generate the stream hash. If the number of chunk hashes registered in the chunk hash information 1400 is less than the predetermined number (NO in S1305), the flow advances to S1308. On the other hand, if a predetermined number of chunk hashes are registered in the chunk hash information 1400 (YES in S1305), the flow advances to S1306.

S1306において制御部301は、チャンクハッシュ情報1400に登録されているチャンクハッシュを先頭のチャンクハッシュから順に並べてハッシュアルゴリズムを適用し、ストリームハッシュを生成する。 In S1306, the control unit 301 arranges the chunk hashes registered in the chunk hash information 1400 in order from the first chunk hash and applies a hash algorithm to generate a stream hash.

S1307において制御部301は、生成したストリームハッシュを特徴情報として通話チャネル情報800に登録して、通話チャネル情報800を更新する。なお、通話チャネル情報800には、生成されたストリームハッシュが順次追加されてよい。或いは、図14のチャンクハッシュ情報1400の例で述べたように、新しく生成されたストリームハッシュから順に所定数のストリームハッシュが通話チャネル情報800に登録されるように更新が行われてもよい。 In S1307, the control unit 301 registers the generated stream hash as feature information in the call channel information 800, and updates the call channel information 800. Note that the generated stream hashes may be sequentially added to the call channel information 800. Alternatively, as described in the example of chunk hash information 1400 in FIG. 14, updating may be performed such that a predetermined number of stream hashes are registered in call channel information 800 in order from the newly generated stream hash.

S1308において制御部301は、S1301の分割で生成したチャンクを全て処理したか否かを判定する。未処理のチャンクがある場合(S1308がNO)、フローはS1302に戻る。一方、全てのチャンクの処理が完了している場合(S1308がYES)、本動作フローは終了し、フローはS601に戻ってよい。 In S1308, the control unit 301 determines whether all the chunks generated by the division in S1301 have been processed. If there is an unprocessed chunk (NO in S1308), the flow returns to S1302. On the other hand, if the processing of all chunks has been completed (YES in S1308), this operational flow may end and the flow may return to S601.

以上の図13の動作フローにより、通話チャネル情報800に特徴情報としてストリームハッシュを格納することができる。なお、図11から図14を参照して述べた、ストリームハッシュは、特徴情報の一例であり、実施形態に係る特徴情報は、これに限定されるものではない。例えば、特徴情報には、音声フィンガープリントを用いることができるし、或いは、図11から図14の処理で生成した複数のチャンクハッシュを所定数並べて、特徴情報として用いてもよい。 With the above-described operational flow of FIG. 13, it is possible to store the stream hash as feature information in the call channel information 800. Note that the stream hash described with reference to FIGS. 11 to 14 is an example of feature information, and the feature information according to the embodiment is not limited to this. For example, an audio fingerprint can be used as the feature information, or a predetermined number of chunk hashes generated in the processes of FIGS. 11 to 14 may be arranged and used as the feature information.

図15は、実施形態の録音データ保存処理の流れを説明するシーケンスを例示する図である。図15に示すように、録音装置130は、通話が開始すると、通話の音声の録音を開始し、また、通話のパケットに基づき内線番号を取得する(図15の1501a)。なお、録音装置130は、内線網に接続されているため、外線網で流通する相手局の電話番号および自局の外線の電話番号は取得されない。 FIG. 15 is a diagram illustrating a sequence for explaining the flow of recorded data storage processing according to the embodiment. As shown in FIG. 15, when the call starts, the recording device 130 starts recording the voice of the call, and also acquires the extension number based on the packet of the call (1501a in FIG. 15). Note that since the recording device 130 is connected to the extension network, the telephone number of the other party's office and the telephone number of the own office's external line, which are distributed over the external line network, are not acquired.

続いて、録音装置130は、通話の音声から特徴情報を生成する(図15の1502a)。録音装置130は、生成した特徴情報を含む問い合わせを検出装置180に送信する(図15の1503a)。 Subsequently, the recording device 130 generates characteristic information from the audio of the call (1502a in FIG. 15). The recording device 130 transmits an inquiry including the generated feature information to the detection device 180 (1503a in FIG. 15).

一方、検出装置180も、通話が開始すると、通話のパケットから通話の相手局の電話番号および自局の外線の電話番号を取得する(図15の1501b)。なお、検出装置180は、外線網に接続されているため、内線網で流通する内線番号は取得されない。 On the other hand, when the call starts, the detection device 180 also acquires the telephone number of the other party and the outside line telephone number of the own station from the packet of the call (1501b in FIG. 15). Note that since the detection device 180 is connected to the external line network, the extension number distributed on the internal line network is not acquired.

続いて、検出装置180は、通話の音声から取得した開始位置の異なる複数の音声データを用いて、連続する複数の特徴情報を生成する(図15の1502b)。 Subsequently, the detection device 180 generates a plurality of consecutive pieces of feature information using a plurality of pieces of audio data having different starting positions obtained from the speech of the call (1502b in FIG. 15).

録音装置130から問い合わせを受信すると、検出装置180は、通話中の音声データから得た複数の特徴情報のうちのいずれかと、問い合わせの特徴情報が合致するか探索する。例えば、図15では、通話Aから得た特徴情報とは、問い合わせの特徴情報が合致していない(図15の1503b)。しかし、通話Bから得た特徴情報とは、問い合わせの特徴情報が合致している(図15の1504b)。 When receiving an inquiry from the recording device 130, the detection device 180 searches whether the characteristic information of the inquiry matches any of the plurality of characteristic information obtained from the voice data during the call. For example, in FIG. 15, the feature information obtained from call A does not match the feature information of the inquiry (1503b in FIG. 15). However, the characteristic information of the inquiry matches the characteristic information obtained from call B (1504b in FIG. 15).

そのため、検出装置180は、通話Bの外線情報(例えば、相手局の電話番号および自局の外線の電話番号)を、録音装置130に通知する(図15の1505b)。そのため、録音装置130は、問い合わせた通話の外線情報(例えば、相手局の電話番号および自局の外線の電話番号)を取得することができる。 Therefore, the detection device 180 notifies the recording device 130 of the outside line information (for example, the telephone number of the partner station and the outside line telephone number of the own station) of the call B (1505b in FIG. 15). Therefore, the recording device 130 can acquire the outside line information of the inquired call (for example, the telephone number of the partner station and the outside line telephone number of the own station).

続いて、通話が終了すると、録音装置130は、通話を録音した録音ファイルに、通話の内線番号と、検出装置180から受信した外線情報に含まれる相手局の電話番号および自局の外線の電話番号を対応づけた録音データを出力する(図15の1504a)。例えば、録音装置130は、録音データを記憶部202に記憶してよい。それによって、記憶部202に記憶した録音データから通話の発信元と着信先の情報や、通話に用いられた自局の代表番号の情報を特定することが可能になる。 Subsequently, when the call ends, the recording device 130 adds the extension number of the call, the telephone number of the partner station included in the outside line information received from the detection device 180, and the outside line telephone number of the own station to the recording file in which the call was recorded. The recorded data associated with the numbers is output (1504a in FIG. 15). For example, the recording device 130 may store recorded data in the storage unit 202. This makes it possible to specify information on the originator and destination of the call, as well as information on the representative number of the own station used for the call, from the recorded data stored in the storage unit 202.

以上において、実施形態を例示したが、実施形態はこれに限定されるものではない。例えば、上述の動作フローは例示であり、実施形態はこれに限定されるものではない。可能な場合には、動作フローは、処理の順番を変更して実行されてもよく、別に更なる処理を含んでもよく、または、一部の処理が省略されてもよい。 Although the embodiments have been illustrated above, the embodiments are not limited thereto. For example, the above-described operational flow is an example, and the embodiments are not limited thereto. If possible, the operational flow may be executed by changing the order of processing, may include additional processing, or may omit some processing.

また、上述の実施形態では、IP-PBXを構内交換機120の例として示しており、また、外部の電話機との接続にIP電話網160を介する例を示している。しかしながら、実施形態はこれに限定されるものではない。例えば、外線網がISDN(Integrated Services Digital Network)である場合にも、プロトコルの規定に基づきISDNの通話データから電話番号の情報を取得することができる。また、例えば、アナログ回線を介する通話であっても、アナログ-デジタル変換を行いデジタル信号として処理することで、上述の実施形態を適用することができる。 Further, in the above-described embodiment, an IP-PBX is shown as an example of the private branch exchange 120, and an example is shown in which connection with an external telephone is via the IP telephone network 160. However, embodiments are not limited thereto. For example, even when the external line network is an ISDN (Integrated Services Digital Network), telephone number information can be obtained from ISDN call data based on protocol regulations. Furthermore, for example, the above-described embodiments can be applied even to a phone call via an analog line by performing analog-to-digital conversion and processing it as a digital signal.

また、上述の実施形態では、録音装置130が内線網に配置されており、検出装置180が外線網に配置される場合を例示している。この場合、録音装置130は、内線電話機111同士の内線の通話と、外部との通話の全てを録音することができる。しかしながら、実施形態はこれに限定されるものではない。例えば、別の実施形態では、録音装置130を外線網に配置し、検出装置180を内線網に配置してもよい。この場合、検出装置180が内線番号を取得して録音装置130に通知してよく、それにより、録音装置130は、取得した相手局番号および自局番号(外線)に、受信した内線番号を対応づけて録音データを保存することができる。また、例えば、録音装置130を外線網に接続することで、外線と繋がる電話のみを効率的に録音することができる。 Furthermore, in the above-described embodiment, a case is exemplified in which the recording device 130 is placed in an extension network, and the detection device 180 is placed in an outside line network. In this case, the recording device 130 can record all extension calls between the extension telephones 111 and calls with outside parties. However, embodiments are not limited thereto. For example, in another embodiment, the recording device 130 may be located in the external network and the detection device 180 may be located in the internal network. In this case, the detection device 180 may acquire the extension number and notify it to the recording device 130, so that the recording device 130 can match the received extension number to the acquired partner station number and own station number (external line). You can save recorded data with Furthermore, for example, by connecting the recording device 130 to an outside line network, it is possible to efficiently record only telephone calls connected to outside lines.

また、上述の実施形態では録音装置130と検出装置180とが、通信線155で直接接続されている例を示しており、通信線155を介して特徴情報や外線情報をやり取りする例が示されている。しかしながら、実施形態はこれに限定されるものではない。例えば、別の実施形態では、音声透かしの技術などを用いて、RTPパケットの音声データに、特徴情報や外線情報などを含めて通知してもよい。 Further, in the above-described embodiment, an example is shown in which the recording device 130 and the detection device 180 are directly connected through the communication line 155, and an example is shown in which characteristic information and outside line information are exchanged via the communication line 155. ing. However, embodiments are not limited thereto. For example, in another embodiment, feature information, outside line information, etc. may be included in the audio data of the RTP packet and notified using audio watermarking technology or the like.

また、上述の実施形態では検出装置180を1つの装置として示しているが、実施形態はこれに限定されるものではない。例えば、録音装置130が内線網に設置される場合には、検出装置180はゲートウェイ101に組み込まれてもよい。また、例えば、録音装置130が外線網に設置される場合には、検出装置180は構内交換機120に組み込まれてもよい。 Moreover, although the detection device 180 is shown as one device in the above-mentioned embodiment, the embodiment is not limited to this. For example, if the recording device 130 is installed in an extension network, the detection device 180 may be incorporated into the gateway 101. Furthermore, for example, when the recording device 130 is installed in an outside line network, the detection device 180 may be incorporated into the private branch exchange 120.

また、例えば、ゲートウェイ101や構内交換機120を跨いで内線網110で流通する内線番号や、外線網150で流通する相手局の電話番号などを取得するための手法として、内線電話機111に内線番号の音声信号を発信するアダプタを接続し、音声で内線番号を通知することも考えられる。しかしながら、この場合、内線電話機111のそれぞれにアダプタを接続したり、アダプタに個別の内線番号の音声信号を発信するように設定を行ったりする必要がある。しかしながら、上述の実施形態によれば、内線の電話機に個別にアダプタなどを設置しなくてもよい。また、例えば、内線網を流れるパケットと、外線網を流れるパケットとを監視すれば、アダプタに個別の内線番号の音声信号を発信するような設定を行わなくても、内線網で流通する内線番号や、外線網で流通する相手局の電話番号を取得することができる。 For example, as a method for acquiring an extension number that is distributed over the extension network 110 across the gateway 101 and the private branch exchange 120, or a telephone number of a partner station that is distributed over the external network 150, it is possible to transmit the extension number to the extension telephone 111. It is also possible to connect an adapter that transmits voice signals and notify the extension number by voice. However, in this case, it is necessary to connect an adapter to each of the extension telephones 111, and to configure the adapter to transmit audio signals for individual extension numbers. However, according to the above-described embodiment, there is no need to separately install an adapter or the like in the extension telephone. For example, if you monitor the packets flowing through the extension network and the packets flowing through the external network, you can check the extension numbers circulating on the extension network without having to configure the adapter to send audio signals for individual extension numbers. You can also obtain the telephone number of the other party's station on the outside line network.

また、上述のように、例えば、外線側のSIPメッセージおよびRTPパケットは暗号化されることがある。例えば、SIPメッセージがTLS(Transport Layer Security)等により暗号化されている場合や音声パケットがsRTP(Secure Real time Transport Protocol)等により暗号化されている場合は、B2BUA(Back to back User Agent)方式のセッションボーターコントローラ(SBC)がハブ152の代わりに配置されてよい。 Also, as described above, for example, SIP messages and RTP packets on the outside line may be encrypted. For example, if the SIP message is encrypted using TLS (Transport Layer Security), etc., or the voice packet is encrypted using sRTP (Secure Real time Transport Protocol), etc., the B2BUA (Back to back User Agent) method is used. A session voter controller (SBC) may be placed in place of hub 152.

図17は、図1の通話録音システム100における外線網150の別の例を示す図である。図17では、ハブ152の代わりにSBC1701が配置されている。SBC1701は、例えば、B2BUA方式のセッションボーターコントローラであり、暗号化されたSIPメッセージ(TLS等)と音声パケット(sRTP等)を復号することができる。そして、SBCは、復号して得たSIPメッセージの内容(外線電話番号)と復号して得た音声パケット(RTP)とを検出装置に送信する。例えば、SBC1701は、外部の電話機から、IP-PBXなどの構内交換機120に対して発呼があった場合、ユーザエージェントサーバ(User Agent Sever)として動作し、ユーザエージェント1(User Agent1)がSIP/RTPを終端し、ユーザエージェント2(User Agent2)に受け渡す。即ち、SBC1701は、端的に、IP-PBX(本構成ではGW)のふりをする。また、IP-PBXなどの構内交換機120側から発呼があった場合も同様にユーザエージェント2が終端し、ユーザエージェント1に受け渡す。 FIG. 17 is a diagram showing another example of the outside line network 150 in the call recording system 100 of FIG. 1. In FIG. 17, an SBC 1701 is placed in place of the hub 152. The SBC 1701 is, for example, a B2BUA session voter controller, and can decrypt encrypted SIP messages (TLS, etc.) and voice packets (sRTP, etc.). Then, the SBC transmits the contents of the decoded SIP message (external telephone number) and the decoded voice packet (RTP) to the detection device. For example, when a call is made from an external telephone to the private branch exchange 120 such as an IP-PBX, the SBC 1701 operates as a user agent server, and the user agent 1 Terminates RTP and passes it to User Agent 2. That is, the SBC 1701 simply pretends to be an IP-PBX (GW in this configuration). Furthermore, when a call is made from the private branch exchange 120 side such as an IP-PBX, the user agent 2 similarly terminates the call and hands it over to the user agent 1.

そして、外部の電話機との通信が暗号化されている場合、SBC1701のユーザエージェント1で暗号化および複合化が行われる。従って、SBC1701によれば、暗号化されていないSIPメッセージおよび音声パケットを検出装置に分配することが可能となる。 If communication with an external telephone is encrypted, the user agent 1 of the SBC 1701 performs encryption and decryption. Therefore, SBC 1701 allows unencrypted SIP messages and voice packets to be distributed to detection devices.

なお、上述の実施形態において、例えば、S411、図11の処理、および1502aにおいて、録音装置130の制御部201は、内線処理部211として動作する。また、例えば、S406の処理では、録音装置130の制御部201は、保存部212として動作する。例えば、S609、図13の処理、および1502bにおいて、検出装置180の制御部301は、外線処理部311として動作する。 Note that in the above-described embodiment, the control unit 201 of the recording device 130 operates as the extension processing unit 211, for example, in S411, the process of FIG. 11, and 1502a. Further, for example, in the process of S406, the control unit 201 of the recording device 130 operates as the storage unit 212. For example, in S609, the process of FIG. 13, and 1502b, the control unit 301 of the detection device 180 operates as the outside line processing unit 311.

図16は、実施形態に係る録音装置130および検出装置180を実現するためのコンピュータ1600のハードウェア構成を例示する図である。図16の録音装置130および検出装置180を実現するためのハードウェア構成は、例えば、プロセッサ1601、メモリ1602、記憶装置1603、通信インタフェース1606(例えば、1606aおよび1606b)、および入出力インタフェース1607を備える。なお、プロセッサ1601は、メモリ1602、記憶装置1603、通信インタフェース1606、入出力インタフェース1607と、例えば、バス1610を介して接続されている。 FIG. 16 is a diagram illustrating the hardware configuration of a computer 1600 for realizing the recording device 130 and the detection device 180 according to the embodiment. A hardware configuration for realizing the recording device 130 and the detection device 180 in FIG. 16 includes, for example, a processor 1601, a memory 1602, a storage device 1603, a communication interface 1606 (for example, 1606a and 1606b), and an input/output interface 1607. . Note that the processor 1601 is connected to a memory 1602, a storage device 1603, a communication interface 1606, and an input/output interface 1607 via, for example, a bus 1610.

プロセッサ1601は、例えば、シングルプロセッサであっても、マルチプロセッサやマルチコアであってもよい。プロセッサ1601は、メモリ1602を利用して例えば上述の動作フローの手順を記述したプログラムを実行することにより、上述した各部の一部または全部の機能を提供する。例えば、録音装置130のプロセッサ1601は、記憶装置1603に格納されているプログラムを読み出して実行することで、制御部201、内線処理部211、および保存部212として動作する。また、例えば、検出装置180のプロセッサ1601は、記憶装置1603に格納されているプログラムを読み出して実行することで、制御部301、および外線処理部311として動作する。 The processor 1601 may be, for example, a single processor, a multiprocessor, or a multicore. The processor 1601 provides some or all of the functions of each unit described above by using the memory 1602 to execute, for example, a program that describes the procedure of the operation flow described above. For example, the processor 1601 of the recording device 130 operates as the control unit 201, the extension processing unit 211, and the storage unit 212 by reading and executing a program stored in the storage device 1603. Further, for example, the processor 1601 of the detection device 180 operates as the control unit 301 and the outside line processing unit 311 by reading and executing a program stored in the storage device 1603.

メモリ1602は、例えば半導体メモリであり、RAM領域およびROM領域を含んでよい。記憶装置1603は、例えばハードディスク、フラッシュメモリ等の半導体メモリ、または外部記憶装置である。なお、RAMは、Random Access Memoryの略称である。また、ROMは、Read Only Memoryの略称である。 Memory 1602 is, for example, a semiconductor memory and may include a RAM area and a ROM area. The storage device 1603 is, for example, a hard disk, a semiconductor memory such as a flash memory, or an external storage device. Note that RAM is an abbreviation for Random Access Memory. Further, ROM is an abbreviation for Read Only Memory.

上述の記憶部202および記憶部302は、例えばメモリ1602および記憶装置1603を含む。例えば、録音装置130の記憶装置1603には、内線番号情報500、通話の内線番号、外線情報、および録音データなどの情報が格納されてよい。また、例えば、検出装置180の記憶装置1603には、通話チャネル情報800およびチャンクハッシュ情報1400などの情報が格納されてよい。なお、録音装置130は、通話の録音データを蓄積していくため、記憶装置1603を備えていることが好ましい。一方、検出装置180は、通話の録音データの蓄積をしなくてもよく、一実施形態においては、記憶装置1603を含まなくてもよい。 The storage unit 202 and storage unit 302 described above include, for example, a memory 1602 and a storage device 1603. For example, the storage device 1603 of the recording device 130 may store information such as extension number information 500, a call extension number, outside line information, and recorded data. Further, for example, the storage device 1603 of the detection device 180 may store information such as call channel information 800 and chunk hash information 1400. Note that the recording device 130 preferably includes a storage device 1603 in order to accumulate recorded data of telephone calls. On the other hand, detection device 180 may not store call recordings and, in one embodiment, may not include storage device 1603.

通信インタフェース1606は、プロセッサ1601の指示に従って他の装置とデータを送受信する。なお、通信インタフェース1606aは、例えば、ハブ122またはハブ152と接続するためのインタフェースであってよい。また、通信インタフェース1606bは、検出装置180と録音装置130との間の通信で用いられてよい。なお、一実施形態においては、通信インタフェース1606bは含まれていなくてもよい。その場合にも、特徴情報や外線情報は、例えば、特徴情報や外線情報などを表すDTMF(Dual-Tone Multi-Frequency)を生成し、RTPパケットの音声データに含めることで通知することができる。 Communication interface 1606 transmits and receives data to and from other devices according to instructions from processor 1601. Note that the communication interface 1606a may be an interface for connecting to the hub 122 or the hub 152, for example. Additionally, the communication interface 1606b may be used for communication between the detection device 180 and the recording device 130. Note that in one embodiment, the communication interface 1606b may not be included. In that case as well, the feature information and outside line information can be notified by, for example, generating DTMF (Dual-Tone Multi-Frequency) representing the feature information, outside line information, etc., and including it in the audio data of the RTP packet.

入出力インタフェース1607は、例えば、入力装置および出力装置との間のインタフェースであってよい。入力装置は、例えばユーザからの指示を受け付けるキーボードやマウスなどのデバイスである。出力装置は、例えばディスプレーなどの表示装置、およびスピーカなどの音声装置である。 Input/output interface 1607 may be, for example, an interface between an input device and an output device. The input device is, for example, a device such as a keyboard or mouse that receives instructions from a user. The output device is, for example, a display device such as a display, and an audio device such as a speaker.

実施形態に係る各プログラムは、例えば、下記の形態で録音装置130および検出装置180に提供される。
(1)記憶装置1603に予めインストールされている。
(2)プログラムサーバなどのサーバから提供される。
Each program according to the embodiment is provided to the recording device 130 and the detection device 180 in the following format, for example.
(1) Installed in the storage device 1603 in advance.
(2) Provided by a server such as a program server.

なお、図16を参照して述べた録音装置130および検出装置180を実現するためのコンピュータ1600のハードウェア構成は、例示であり、実施形態はこれに限定されるものではない。例えば、上述の機能部の一部が、置換されても、または削除されてもよく、或いは、新たな構成要素が追加されてもよい。また、別の実施形態では、例えば、上述の各部の一部または全部の機能がFPGAおよびSoCなどによるハードウェアとして実装されてもよい。なお、FPGAは、Field Programmable Gate Arrayの略称である。SoCは、System-on-a-chipの略称である。 Note that the hardware configuration of the computer 1600 for realizing the recording device 130 and the detection device 180 described with reference to FIG. 16 is an example, and the embodiment is not limited thereto. For example, some of the functional units described above may be replaced or deleted, or new components may be added. In another embodiment, for example, some or all of the functions of the above-described units may be implemented as hardware such as FPGA and SoC. Note that FPGA is an abbreviation for Field Programmable Gate Array. SoC is an abbreviation for System-on-a-chip.

以上において、いくつかの実施形態が説明される。しかしながら、実施形態は上記の実施形態に限定されるものではなく、上述の実施形態の各種変形形態および代替形態を包含するものとして理解されるべきである。例えば、各種実施形態は、その趣旨および範囲を逸脱しない範囲で構成要素を変形して具体化できることが理解されよう。また、前述した実施形態に開示されている複数の構成要素を適宜組み合わせることにより、種々の実施形態が実施され得ることが理解されよう。更には、実施形態に示される全構成要素からいくつかの構成要素を削除してまたは置換して、或いは実施形態に示される構成要素にいくつかの構成要素を追加して種々の実施形態が実施され得ることが当業者には理解されよう。 Above, several embodiments are described. However, the embodiments are not limited to the embodiments described above, but should be understood to include various modifications and alternative forms of the embodiments described above. For example, it will be understood that the various embodiments can be embodied by changing the components without departing from the spirit and scope thereof. Furthermore, it will be understood that various embodiments can be implemented by appropriately combining the plurality of components disclosed in the embodiments described above. Furthermore, various embodiments can be implemented by deleting or replacing some components from all the components shown in the embodiments, or adding some components to the components shown in the embodiments. Those skilled in the art will understand that this can be done.

100 :通話録音システム
101 :ゲートウェイ
110 :内線網
111 :内線電話機
120 :構内交換機
122 :ハブ
130 :録音装置
150 :外線網
151 :光回線終端装置
152 :ハブ
155 :通信線
160 :IP電話網
170 :外線電話機
180 :検出装置
201 :制御部
202 :記憶部
203 :通信部
211 :内線処理部
212 :保存部
301 :制御部
302 :記憶部
303 :通信部
311 :外線処理部
1600 :コンピュータ
1601 :プロセッサ
1602 :メモリ
1603 :記憶装置
1606 :通信インタフェース
1607 :入出力インタフェース
1610 :バス


100: Call recording system 101: Gateway 110: Extension network 111: Extension telephone 120: Private branch exchange 122: Hub 130: Recording device 150: External line network 151: Optical line termination device 152: Hub 155: Communication line 160: IP telephone network 170 : External line telephone 180 : Detection device 201 : Control unit 202 : Storage unit 203 : Communication unit 211 : Extension processing unit 212 : Storage unit 301 : Control unit 302 : Storage unit 303 : Communication unit 311 : External line processing unit 1600 : Computer 1601 : Processor 1602: Memory 1603: Storage device 1606: Communication interface 1607: Input/output interface 1610: Bus


Claims (5)

外線電話機が接続される外線網を流れる第1のセッションのパケットを収集して得た通話の音声データを所定のアルゴリズムで処理して第1の特徴情報を生成する外線処理部と、
内線電話機および構内交換機が接続される自局の内線網を流れる第2のセッションのパケットを収集して得た通話の音声データを前記所定のアルゴリズムで処理して第2の特徴情報を生成する内線処理部と、
前記第1の特徴情報と前記第2の特徴情報とが所定の条件を満たして合致する場合、前記第1のセッションの呼制御パケットから取得された相手局の電話番号と、前記第2のセッションの呼制御パケットに基づき取得された内線番号とを、前記第1のセッションまたは前記第2のセッションで伝送される通話の音声データと対応づけた録音データを記憶部に保存する保存部と、
を含む、通話録音システム。
an outside line processing unit that processes voice data of a call obtained by collecting packets of a first session flowing through an outside line network to which the outside line telephone is connected using a predetermined algorithm to generate first characteristic information;
an extension that generates second feature information by processing voice data of a call obtained by collecting packets of a second session flowing through the extension network of the local office to which the extension telephone and the private branch exchange are connected, using the predetermined algorithm; a processing section;
If the first feature information and the second feature information match by satisfying a predetermined condition, the telephone number of the partner station acquired from the call control packet of the first session and the second session a storage unit that stores in a storage unit recorded data in which the extension number obtained based on the call control packet is associated with voice data of the call transmitted in the first session or the second session;
Call recording system, including:
前記録音データでは、更に、前記第1のセッションの呼制御パケットから取得された自局の電話番号が対応づけられている、請求項1に記載の通話録音システム。 2. The call recording system according to claim 1, wherein the recorded data is further associated with a telephone number of the own station acquired from a call control packet of the first session. 前記外線処理部は、前記第1のセッションのパケットを収集して得た通話の音声データから開始位置の異なる複数の音声データを抽出して、前記複数の音声データのそれぞれから前記第1の特徴情報を生成し、
前記保存部は、前記複数の音声データのそれぞれから生成した前記第1の特徴情報のいずれかと、前記第2の特徴情報とが所定の条件を満たして合致する場合、前記録音データを前記記憶部に保存する、請求項1または請求項2に記載の通話録音システム。
The outside line processing unit extracts a plurality of voice data having different starting positions from the voice data of the call obtained by collecting packets of the first session, and extracts the first characteristic from each of the plurality of voice data. generate information,
The storage unit stores the recorded data in the storage unit when any of the first feature information generated from each of the plurality of audio data and the second feature information meet a predetermined condition. 3. The call recording system according to claim 1 or 2, wherein the call recording system stores the call recording system.
前記内線処理部は、前記第2のセッションのパケットを収集して得た通話の音声データから開始位置の異なる複数の音声データを抽出して、前記複数の音声データのそれぞれから前記第2の特徴情報を生成し、
前記保存部は、前記複数の音声データのそれぞれから生成した前記第2の特徴情報のいずれかと、前記第1の特徴情報とが所定の条件を満たして合致する場合、前記録音データを前記記憶部に保存する、請求項1または請求項2に記載の通話録音システム。
The extension processing unit extracts a plurality of voice data having different starting positions from the voice data of the call obtained by collecting packets of the second session, and extracts the second characteristic from each of the plurality of voice data. generate information,
The storage unit stores the recorded data in the storage unit when any of the second feature information generated from each of the plurality of audio data and the first feature information meet a predetermined condition. 3. The call recording system according to claim 1 or 2, wherein the call recording system stores the call recording system.
外線電話機が接続される外線網を流れる第1のセッションのパケットを収集して得た通話の音声データを所定のアルゴリズムで処理して第1の特徴情報を生成し、
内線電話機および構内交換機が接続される自局の内線網を流れる第2のセッションのパケットを収集して得た通話の音声データを前記所定のアルゴリズムで処理して第2の特徴情報を生成し、
前記第1の特徴情報と前記第2の特徴情報とが所定の条件を満たして合致する場合、前記第1のセッションの呼制御パケットから取得された相手局の電話番号と、前記第2のセッションの呼制御パケットに基づき取得された内線番号とを、前記第1のセッションまたは前記第2のセッションで伝送される通話の音声データと対応づけた録音データを記憶装置に保存する、
ことを含む、通話録音方法。


generating first feature information by processing voice data of a call obtained by collecting packets of a first session flowing through an outside line network to which the outside line telephone is connected using a predetermined algorithm;
generating second feature information by processing voice data of a call obtained by collecting packets of a second session flowing through the extension network of the local office to which the extension telephone and the private branch exchange are connected, using the predetermined algorithm;
If the first feature information and the second feature information match by satisfying a predetermined condition, the telephone number of the partner station acquired from the call control packet of the first session and the second session storing in a storage device recorded data in which the extension number obtained based on the call control packet is associated with voice data of the call transmitted in the first session or the second session;
How to record calls, including:


JP2022072262A 2022-04-26 2022-04-26 Telephone conversation recording system and telephone conversation recording method Pending JP2023161739A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022072262A JP2023161739A (en) 2022-04-26 2022-04-26 Telephone conversation recording system and telephone conversation recording method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022072262A JP2023161739A (en) 2022-04-26 2022-04-26 Telephone conversation recording system and telephone conversation recording method

Publications (1)

Publication Number Publication Date
JP2023161739A true JP2023161739A (en) 2023-11-08

Family

ID=88650483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022072262A Pending JP2023161739A (en) 2022-04-26 2022-04-26 Telephone conversation recording system and telephone conversation recording method

Country Status (1)

Country Link
JP (1) JP2023161739A (en)

Similar Documents

Publication Publication Date Title
US7881471B2 (en) Systems and methods for recording an encrypted interaction
US6700964B2 (en) Encapsulation, compression and encryption of PCM data
US8427981B2 (en) System and method for recording and monitoring communications using a media server
US20200344350A1 (en) Method and apparatus for threat identification through analysis of communications signaling events, and participants
US9407759B2 (en) Telephonic communication redirection and compliance processing
JP2008545345A (en) Telephone redirection and mirroring
JP5197746B2 (en) Method, modem, and server for bridging telephone calls to Internet calls
US20080052535A1 (en) Systems and Methods for Recording Encrypted Interactions
KR20080084716A (en) Fast authentication over slow channels
US20110235631A1 (en) Method and apparatus for automatic verification of telephone number mapping
EP1981239B1 (en) Securing multimedia network communication
US20080151873A1 (en) Virtual internet protocol interconnection service
JP2017169037A (en) Telephone conversation recording system and telephone conversation recording method
CN110943938A (en) Real-time recording method and system for IMS switching network telephone terminal
JP2023161739A (en) Telephone conversation recording system and telephone conversation recording method
WO2003096662A1 (en) System and method for recording telephonic communications
JP2009213018A (en) Call center system
JP7458602B1 (en) Network determination device, network determination method, network determination program, and connected network information providing system
US8023625B2 (en) Communication system and voice mail apparatus
US20070160084A1 (en) Audio device, system and method for archiving audio files based on distributed audio phone data received over a data network in encrypted or non-encrypted form
JP6013991B2 (en) Call control apparatus and method for identifying outside line number
TWI232657B (en) Communicating tone information in a network
JP5952113B2 (en) Media gateway, call information storage method
KR100908388B1 (en) Remote Diagnosis Device of Voice Over Internet Protocol Trunk Gateway and Its Method
KR20020046449A (en) Virtual number service method using AICPS.LiTE

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20231113