JP2008236286A - Communication device and program - Google Patents

Communication device and program Download PDF

Info

Publication number
JP2008236286A
JP2008236286A JP2007071868A JP2007071868A JP2008236286A JP 2008236286 A JP2008236286 A JP 2008236286A JP 2007071868 A JP2007071868 A JP 2007071868A JP 2007071868 A JP2007071868 A JP 2007071868A JP 2008236286 A JP2008236286 A JP 2008236286A
Authority
JP
Japan
Prior art keywords
communication
call
voice
recording
protocol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007071868A
Other languages
Japanese (ja)
Inventor
Naoto Toda
尚登 遠田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2007071868A priority Critical patent/JP2008236286A/en
Publication of JP2008236286A publication Critical patent/JP2008236286A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To transmit and receive excellent voice data in response to an application, and to achieve a superior call recording. <P>SOLUTION: In a communication device having an IP telephone function, a call-recording terminal 100A and a call-opposite terminal 100B conduct a voice call through a packet switching network IN by an IP telephone function by a connection-less type communication using a connection-less type protocol such as a UDP. When such a voice call is recorded at the call-recording terminal 100A, the call-recording terminal 100A requires the addition of a connection type communication using a connection type protocol such as a TCP to the call-opposite terminal 100B in the connection type communication established for a call. The call-opposite terminal 100B transmits a transmitting voice to the call-recording terminal 100A even in the connection type communication. The call-recording terminal 100A synthesizes voice data transmitted by the connection type communication and voice data transmitted from the call-recording terminal 100A, and records a synthesized value as the recording data of the call recording. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、通信装置およびプログラムに関し、特に、通話録音に好適な通信装置およびプログラムに関する。   The present invention relates to a communication device and a program, and more particularly, to a communication device and a program suitable for call recording.

携帯電話などの移動体通信端末では、音声通話機能にかかる音声通話を録音する機能が搭載されていることが一般的である(例えば、特許文献1)。   A mobile communication terminal such as a mobile phone is generally equipped with a function for recording a voice call related to a voice call function (for example, Patent Document 1).

一方で、移動体通信においても、インターネットなどのIP網(IP:Internet Protocol)を介したパケット交換により音声通話をおこなう方式(いわゆる、IP電話)が実用化されつつある。   On the other hand, also in mobile communication, a method (so-called IP phone) for making a voice call by packet exchange via an IP network (IP: Internet Protocol) such as the Internet is being put into practical use.

音声通話ではリアルタイム性が要求されるので、IP電話方式では、RTP(Real-time Transmission Protocol:リアルタイム・データ転送プロトコル)やUDP(User Datagram Protocol)などといったコネクションレス型の通信プロトコルを用いることが一般的である。このようなコネクションレス型のプロトコルは、信頼性を保証しないことでリアルタイム性を実現している。このため、パケットロスが発生しても、TCP(Transmission Control Protocol)などのコネクション型プロトコルがおこなうような再送処理がないので、音声通話においては無音部分が生じることになる。   Since real-time performance is required for voice calls, it is common to use connectionless communication protocols such as RTP (Real-time Transmission Protocol) and UDP (User Datagram Protocol) in IP telephone systems. Is. Such a connectionless protocol achieves real-time performance by not guaranteeing reliability. For this reason, even if packet loss occurs, there is no retransmission processing that is performed by a connection-type protocol such as TCP (Transmission Control Protocol), so a silent part occurs in a voice call.

ここで、通話中にこのような音切れが発生した場合は、通話者が聞き返すことで会話を維持することができるが、上述したような録音機能を用いた通話録音中にパケットロスが生じると、録音された音声に無音部分が含まれることになり、後で再生した際に録音内容を把握できないという不都合がある。
特開平9−233160号公報
Here, when such a sound interruption occurs during a call, the conversation can be maintained by listening back to the caller, but if a packet loss occurs during call recording using the recording function as described above In other words, the recorded sound includes a silent part, and there is a disadvantage that the recorded content cannot be grasped when played back later.
JP-A-9-233160

本発明は、上記実状に鑑みてなされたものであり、用途に応じて良好な音声データを送受することができる通信装置およびプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and an object thereof is to provide a communication device and a program capable of transmitting and receiving good audio data according to usage.

上記目的を達成するため、本発明の第1の観点に係る通信装置は、
IP電話機能を有する通信装置において、
コネクションレス型プロトコルで前記IP電話機能の音声通信をおこなう音声通信手段と、
前記音声通信手段による音声通信の録音が指示されたことを契機に、前記音声通信手段が通信している相手装置に、前記コレクションレス型プロトコルでの音声データ送信とコネクション型プロトコルでの音声データ送信とを要求する要求手段と、
前記要求手段による要求に応じて前記コネクション型プロトコルで送信された音声データを用いて録音データを生成する録音データ生成手段と、
前記録音データ生成手段が生成した録音データを格納する録音データ格納手段と、
を備えることを特徴とする。
In order to achieve the above object, a communication device according to the first aspect of the present invention provides:
In a communication device having an IP telephone function,
Voice communication means for performing voice communication of the IP telephone function using a connectionless protocol;
When the recording of voice communication by the voice communication means is instructed, voice data transmission using the collectionless protocol and voice data transmission using the connection protocol are transmitted to the counterpart device with which the voice communication means is communicating. Request means for requesting, and
Recording data generation means for generating recording data using voice data transmitted by the connection type protocol in response to a request by the request means;
Recording data storage means for storing the recording data generated by the recording data generation means;
It is characterized by providing.

上記通信装置において、
前記録音データ格納手段は、
前記通信装置からの送話音声データを一時格納する送話バッファと、
前記相手装置から前記コネクション型プロトコルで送信された受話音声データを一時格納する受話バッファと、をさらに備えていることが望ましく、この場合、
前記録音データ生成手段は、前記送話バッファに一時格納された送話音声データと、前記受話バッファに一時格納された受話音声データとを合成して前記録音データを生成することが望ましい。
In the communication device,
The recorded data storage means includes
A transmission buffer for temporarily storing transmission voice data from the communication device;
It is desirable to further include a reception buffer for temporarily storing received voice data transmitted from the counterpart apparatus using the connection-type protocol.
Preferably, the recording data generating means generates the recording data by synthesizing the transmission voice data temporarily stored in the transmission buffer and the reception voice data temporarily stored in the reception buffer.

上記通信装置は、移動体通信端末であることが望ましい。   The communication device is preferably a mobile communication terminal.

上記目的を達成するため、本発明の第2の観点にかかる通信装置は、
IP電話機能を有する通信装置において、
前記IP電話機能の音声通信をコネクションレス型プロトコルでおこなうコネクションレス型通信手段と、
前記コネクションレス型通信手段が通信している相手装置からの要求に応じて、前記コネクションレス型通信手段が送信する音声データを、前記コネクションレス型プロトコルとコネクション型プロトコルで前記相手装置に送信するコネクション型通信手段と、
を備えることを特徴とする。
In order to achieve the above object, a communication apparatus according to the second aspect of the present invention provides:
In a communication device having an IP telephone function,
A connectionless communication means for performing voice communication of the IP telephone function using a connectionless protocol;
A connection for transmitting voice data transmitted by the connectionless communication unit to the partner device using the connectionless protocol and a connection protocol in response to a request from the partner device with which the connectionless communication unit is communicating. Type communication means;
It is characterized by providing.

上記通信装置において、
前記コネクション型通信手段は、
前記相手装置で通話録音が実行されたことを契機に送信された要求に応じて前記コネクション型プロトコルでの音声データ送信を開始し、
前記通話録音が終了したことを契機に前記相手装置から送信された要求に応じて前記コネクション型プロトコルでの音声データ送信を終了することが望ましい。
In the communication device,
The connection type communication means includes:
In response to a request transmitted when call recording is executed in the partner device, voice data transmission in the connection type protocol is started,
It is desirable that voice data transmission by the connection-type protocol is terminated in response to a request transmitted from the partner apparatus upon completion of the call recording.

上記通信装置は、移動体通信端末であることが望ましい。   The communication device is preferably a mobile communication terminal.

上記目的を達成するため、本発明の第3の観点にかかるプログラムは、
IP電話機能を有する通信装置を制御するコンピュータに、
コネクションレス型プロトコルで前記IP電話機能の音声通信をおこなう機能と、
前記音声通信の録音が指示されたことを契機に、前記音声通信をおこなっている相手装置に、前記コレクションレス型プロトコルでの音声データ送信とコネクション型プロトコルでの音声データ送信とを要求する機能と、
前記要求に応じて前記コネクション型プロトコルで送信された音声データを用いて録音データを生成する機能と、
生成した録音データを記憶装置に格納する機能と、
を実現させることを特徴とする。
In order to achieve the above object, a program according to the third aspect of the present invention is:
A computer that controls a communication device having an IP telephone function;
A function of performing voice communication of the IP telephone function using a connectionless protocol;
A function for requesting voice data transmission in the collectionless protocol and voice data transmission in the connection-type protocol to the counterpart device performing the voice communication in response to an instruction to record the voice communication; ,
A function of generating recording data using voice data transmitted by the connection-type protocol in response to the request;
A function to store the generated recording data in a storage device;
It is characterized by realizing.

上記目的を達成するため、本発明の第4の観点にかかるプログラムは、
IP電話機能を有する通信装置を制御するコンピュータに、
前記IP電話機能の音声通信をコネクションレス型プロトコルでおこなう機能と、
前記音声通信をおこなっている相手装置からの要求に応じて、前記相手装置に送信する音声データを、前記コネクションレス型プロトコルとコネクション型プロトコルで前記相手装置に送信する機能と、
を実現させることを特徴とするプログラム。
In order to achieve the above object, a program according to the fourth aspect of the present invention is:
A computer that controls a communication device having an IP telephone function;
A function for performing voice communication of the IP telephone function using a connectionless protocol;
A function of transmitting voice data to be transmitted to the counterpart device in response to a request from the counterpart device performing the voice communication to the counterpart device using the connectionless protocol and a connection type protocol;
A program characterized by realizing.

本発明によれば、用途に応じて良好な音声データを得ることができる。   According to the present invention, good audio data can be obtained according to the application.

本発明にかかる実施形態を、図面を参照して説明する。図1は、本実施形態にかかる音声通信システムを示す図である。本実施形態では、移動体通信端末間で、例えば、VoIP(Voice over Internet Protocol)などを用いたIP電話機能によって音声通話(音声通信)をおこなう場合を想定する。この場合、本実施形態では、図1に示すような、複数の移動体通信端末100が通信するための音声通信システム1を構成する。   Embodiments according to the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing an audio communication system according to the present embodiment. In the present embodiment, it is assumed that voice communication (voice communication) is performed between mobile communication terminals by using an IP phone function using, for example, VoIP (Voice over Internet Protocol). In this case, in the present embodiment, a voice communication system 1 for communicating with a plurality of mobile communication terminals 100 as shown in FIG. 1 is configured.

音声通信システム1においてIP電話通信をおこなう各移動体通信端末100は、図示するように、移動体通信事業者によって設置される基地局BSと無線通信をおこなう。各基地局BSは、当該移動体通信事業者による移動体通信網MN(セルラ網)に接続されている。   As shown in the figure, each mobile communication terminal 100 that performs IP telephone communication in the voice communication system 1 performs radio communication with a base station BS installed by a mobile communication provider. Each base station BS is connected to a mobile communication network MN (cellular network) by the mobile communication operator.

ここで、IP電話機能での呼制御をおこなうプロトコル(シグナリング・プロトコル)として、本実施形態では、SIP(Session Initiation Protocol)が用いられるものとする。この場合、図1に示すように、各移動体通信網MNは、プロキシ機能、リダイレクト機能、登録機能などを備えたSIPサーバなどの呼制御装置SSを介してインターネットなどのIP網であるパケット交換網INに接続されることで、パケット交換網INを介した音声伝送のための呼制御がおこなわれる。   Here, in this embodiment, SIP (Session Initiation Protocol) is used as a protocol (signaling protocol) for performing call control with the IP telephone function. In this case, as shown in FIG. 1, each mobile communication network MN is a packet switch that is an IP network such as the Internet via a call control device SS such as an SIP server having a proxy function, a redirect function, a registration function, and the like. By being connected to the network IN, call control for voice transmission via the packet switching network IN is performed.

このようなSIPを用いてIP電話機能を実現した場合、各移動体通信端末100はいわゆるユーザ・エージェント(User Agent:UA)として機能する。そして、UAである各移動体通信端末100からのリクエストやレスポンスを呼制御装置SSが中継することで、移動体通信端末100間のIP電話接続が実現されているものとする。   When the IP telephone function is realized using such SIP, each mobile communication terminal 100 functions as a so-called user agent (User Agent: UA). It is assumed that the IP telephone connection between the mobile communication terminals 100 is realized by the call control device SS relaying requests and responses from the mobile communication terminals 100 that are UAs.

このようなIP電話による音声通信では、通常、コネクションレス型プロトコルを用いて音声伝送がおこなわれる。本実施形態においては、インターネットプロトコル群のうち、インターネットワーク層ではIP(Internet Protocol)、トランスポート層ではUDP(User Datagram Protocol)、UDPの上位プロトコルのRTP(Real-time Transmission Protocol:リアルタイム・データ転送プロトコル)を用いることでコネクションレス型通信をおこなうものとする。このようなコネクションレス型通信では、損失パケットの再送などといった信頼性を保証する動作をおこなわないことで、音声通信に求められるリアルタイム性を実現している。   In such voice communication using an IP phone, voice transmission is usually performed using a connectionless protocol. In the present embodiment, in the Internet protocol group, IP (Internet Protocol) is used in the internetwork layer, UDP (User Datagram Protocol) is used in the transport layer, and RTP (Real-time Transmission Protocol: real-time data transfer) of the upper protocol of UDP. Protocol) is used for connectionless communication. In such connectionless communication, the real-time property required for voice communication is realized by not performing operations such as retransmission of lost packets to guarantee reliability.

本実施形態にかかる移動体通信端末100の構成を、図面を参照して以下説明する。まず、図2を参照して、移動体通信端末100のハードウェア構成を説明する。図示するように、移動体通信端末100は、制御部110、通信制御部120、操作部130、表示部140、音声処理部150、記憶部160、などから構成される。   The configuration of the mobile communication terminal 100 according to the present embodiment will be described below with reference to the drawings. First, the hardware configuration of the mobile communication terminal 100 will be described with reference to FIG. As illustrated, the mobile communication terminal 100 includes a control unit 110, a communication control unit 120, an operation unit 130, a display unit 140, a voice processing unit 150, a storage unit 160, and the like.

制御部110は、例えば、CPU(Central Processing Unit:中央演算処理装置)やワークエリアとなるRAM(Random Access Memory)などから構成され、所定の動作プログラムを実行することで移動体通信端末100の各部を制御する。すなわち、移動体通信端末100の各構成は制御部110によって制御されるとともに、各構成間の情報伝達などは制御部110を介しておこなわれる。   The control unit 110 includes, for example, a CPU (Central Processing Unit), a RAM (Random Access Memory) serving as a work area, and the like, and each unit of the mobile communication terminal 100 by executing a predetermined operation program. To control. That is, each component of the mobile communication terminal 100 is controlled by the control unit 110, and information transmission between the components is performed via the control unit 110.

通信制御部120は、例えば、移動体通信用の無線通信デバイスなどから構成され、基地局BSと無線通信するためのアンテナ121による電波送受信を制御することで、基地局BSとの無線通信をおこなう。   The communication control unit 120 includes, for example, a wireless communication device for mobile communication, and performs wireless communication with the base station BS by controlling radio wave transmission / reception by the antenna 121 for wireless communication with the base station BS. .

操作部130は、移動体通信端末100の外面上に構成されたボタンやキーなどから構成され、移動体通信端末100のユーザによって操作される。入力部150は、各ボタンやキーなどと接続された入力回路などを備え、ユーザの操作に応じた入力信号を生成して制御部110に入力する。   The operation unit 130 includes buttons and keys configured on the outer surface of the mobile communication terminal 100 and is operated by the user of the mobile communication terminal 100. The input unit 150 includes an input circuit connected to each button, key, and the like, and generates an input signal according to a user operation and inputs the input signal to the control unit 110.

ここで、本実施形態では、図1に示した2つの移動体通信端末100との間でIP電話通信をするものとするが、少なくとも一方の移動体通信端末100には、IP電話通信での通話内容を録音する機能(通話録音機能)を備えているものとする。本実施形態では、通話録音機能を有する移動体通信端末100を「通話録音端末100A」とし、この通話録音端末100Aの操作部130には、通話録音の開始と終了を指示するためのボタンが含まれているものとする。   Here, in this embodiment, it is assumed that IP telephone communication is performed between the two mobile communication terminals 100 shown in FIG. 1, but at least one of the mobile communication terminals 100 is configured to perform IP telephone communication. It is assumed that a call recording function (call recording function) is provided. In the present embodiment, the mobile communication terminal 100 having a call recording function is referred to as “call recording terminal 100A”, and the operation unit 130 of the call recording terminal 100A includes buttons for instructing the start and end of call recording. It shall be assumed.

なお、通話録音端末100AとIP電話通信をおこなう他方の移動体通信端末100を、以下「通話相手端末100B」とする。以下の説明において、参照符号の末尾に符号「A」が付加されているものは、移動体通信端末100を通話録音端末100Aとして機能させるために必要な構成であることを示し、符号「B」が付加されているものは、移動体通信端末100を通話相手端末100Bとして機能させるために必要な構成であることを示す。また、いずれの符号も付加されていないものは、通話録音端末100Aおよび通話相手端末100Bのいずれにも共通の構成であることを示す。   The other mobile communication terminal 100 that performs IP telephone communication with the call recording terminal 100A is hereinafter referred to as a “call partner terminal 100B”. In the following description, what is added with the reference sign “A” at the end of the reference sign indicates a configuration necessary for the mobile communication terminal 100 to function as the call recording terminal 100A, and the reference sign “B”. What is added indicates that the configuration is necessary for the mobile communication terminal 100 to function as the call partner terminal 100B. Also, those to which no symbol is added indicate that the configuration is common to both the call recording terminal 100A and the call partner terminal 100B.

表示部140は、例えば、液晶表示装置などから構成された表示出力装置であり、制御部110の制御によって画像等を表示出力する。   The display unit 140 is a display output device configured by, for example, a liquid crystal display device, and displays and outputs an image and the like under the control of the control unit 110.

音声処理部150は、例えば、音声入出力用のスピーカ151やマイクロフォン152、コーデック回路などから構成され、移動体通信端末100の通話機能などにかかる音声の処理をおこなう。本実施形態の場合、IP電話機能によって受信したデジタル音声データをアナログ音声信号に変換してスピーカ151から出力する受話動作や、マイクロフォン152から入力されたユーザの発話音声をデジタル音声データに変換して送出する送話動作などをおこなう。   The voice processing unit 150 includes, for example, a voice input / output speaker 151, a microphone 152, a codec circuit, and the like, and performs voice processing related to the call function of the mobile communication terminal 100. In the case of the present embodiment, the digital voice data received by the IP telephone function is converted into an analog voice signal and output from the speaker 151, or the user's voice input from the microphone 152 is converted into digital voice data. Perform the transmission operation to send out.

記憶部160は、例えば、ROM(Read Only Memory)やフラッシュメモリなどの記憶装置から構成され、制御部110が実行する動作プログラムを格納する他、本発明を実現するために必要な種々のデータを格納する。本実施形態では、図2に示すように、複数の記憶領域が記憶部160に構成され、各記憶領域に所定のデータが格納される。図示するように、記憶部160には、受話バッファ領域161A、送話バッファ領域162A、送話バッファ領域162B、録音データ格納領域163A、プログラム格納領域164、などの記憶領域が構成される。   The storage unit 160 includes, for example, a storage device such as a ROM (Read Only Memory) or a flash memory, stores an operation program executed by the control unit 110, and stores various data necessary for realizing the present invention. Store. In the present embodiment, as shown in FIG. 2, a plurality of storage areas are configured in the storage unit 160, and predetermined data is stored in each storage area. As shown in the figure, the storage unit 160 includes storage areas such as a reception buffer area 161A, a transmission buffer area 162A, a transmission buffer area 162B, a recording data storage area 163A, and a program storage area 164.

受話バッファ161Aは、通話録音端末100Aが通話録音機能を実行中に通話相手端末100Bから受信する音声データ(受話音声データ)を一時格納するバッファ領域である。上述したように、本実施形態では、通常のIP電話通信を、コネクションレス型プロトコルを用いておこなうが、通話録音端末100Aが通話録音をおこなっている間は、コネクション型プロトコルで送信された音声データを受信する(詳細後述)。このため、受話バッファ領域161Aには、コネクション型プロトコルで受信した音声データが受話音声データとして一時格納される。   The reception buffer 161A is a buffer area for temporarily storing voice data (received voice data) received from the call partner terminal 100B while the call recording terminal 100A is executing the call recording function. As described above, in this embodiment, normal IP telephone communication is performed using the connectionless protocol. However, while the call recording terminal 100A is recording a call, the voice data transmitted using the connection protocol is used. Is received (details will be described later). For this reason, voice data received by the connection-type protocol is temporarily stored in the reception buffer area 161A as reception voice data.

送話バッファ領域162Aは、通話録音端末100Aが通話録音機能を実行中に通話録音端末100Aから通話相手端末100Bに送信する音声データ(送話音声データ)を録音するために一時格納するバッファ領域である。   The transmission buffer area 162A is a buffer area for temporarily storing voice data (transmission voice data) transmitted from the call recording terminal 100A to the call partner terminal 100B while the call recording terminal 100A is executing the call recording function. is there.

送話バッファ領域162Bは、通話録音端末100Aが通話録音をおこなっている間、通話相手端末100Bがコネクションレス型通信で送信している送話音声の音声データを、コネクション型通信でも送信するために一時格納するバッファ領域である。   The transmission buffer area 162B is used for transmitting the voice data of the transmission voice transmitted by the communication partner terminal 100B by the connectionless communication while the call recording terminal 100A is recording the call by the connection communication. This is a buffer area for temporary storage.

録音データ格納領域163Aは、通話録音端末100Aが受話バッファ領域161Aと送話バッファ領域162Aに一時格納した受話音声データと送話音声データとが合成された録音データを格納する。つまり、通話録音端末100Aからの送話音声と、通話相手端末100Bからの受話音声とが合成されることで、通話相手端末100Bとの通話内容を示す音声データとなり、通話録音の録音データとして格納される。   The recording data storage area 163A stores recording data obtained by combining the received voice data and the transmitted voice data temporarily stored in the reception buffer area 161A and the transmission buffer area 162A by the call recording terminal 100A. That is, by synthesizing the transmitted voice from the call recording terminal 100A and the received voice from the call partner terminal 100B, the voice data indicating the content of the call with the call partner terminal 100B is obtained and stored as the recording data of the call recording. Is done.

プログラム格納領域164は、制御部110が実行するプログラムを格納するための領域である。プログラム格納領域164には、移動体通信端末100全体の動作を制御するための基本ソフトウェア(いわゆる、OS)や、移動体通信端末100の種々の機能を実現するためのアプリケーションソフトウェアなどが格納される。   The program storage area 164 is an area for storing a program executed by the control unit 110. The program storage area 164 stores basic software (so-called OS) for controlling the operation of the entire mobile communication terminal 100, application software for realizing various functions of the mobile communication terminal 100, and the like. .

本実施形態では、制御部110がプログラム格納領域164に格納されているプログラムを実行することで、本実施形態にかかる処理をおこなうための機能構成が実現される。制御部110によって実現される機能構成を以下説明する。ここでは、移動体通信端末100によってIP電話通信をおこなう際に必要となる機能構成を説明する。なお、この場合に実現される機能構成は、通話録音端末100Aと通話相手端末100Bで異なる。以下、通話録音端末100Aの機能構成を図3を参照して説明し、通話相手端末100Bの機能構成を図4を参照して説明する。   In the present embodiment, the control unit 110 executes a program stored in the program storage area 164, thereby realizing a functional configuration for performing processing according to the present embodiment. A functional configuration realized by the control unit 110 will be described below. Here, a functional configuration necessary for performing IP telephone communication by the mobile communication terminal 100 will be described. Note that the functional configuration realized in this case differs between the call recording terminal 100A and the call partner terminal 100B. Hereinafter, the functional configuration of the call recording terminal 100A will be described with reference to FIG. 3, and the functional configuration of the call partner terminal 100B will be described with reference to FIG.

まず、図3を参照して、通話録音端末100Aの機能構成を説明する。図3は、制御部110によって実現される通話録音端末100Aの機能構成を示す機能ブロック図である。図示するように、制御部110は、IP電話処理部111、受話音声処理部112、送話音声処理部113、通話録音処理部114A、プロトコル制御要求部115A、録音用受話音声処理部116A、録音データ生成部117A、などとして機能する。   First, the functional configuration of the call recording terminal 100A will be described with reference to FIG. FIG. 3 is a functional block diagram showing a functional configuration of the call recording terminal 100A realized by the control unit 110. As shown in the figure, the control unit 110 includes an IP telephone processing unit 111, a received voice processing unit 112, a transmitted voice processing unit 113, a call recording processing unit 114A, a protocol control request unit 115A, a recording received voice processing unit 116A, and a recording. It functions as the data generation unit 117A.

IP電話処理部111は、移動体通信端末100のIP電話機能にかかる処理をおこなうものであり、操作部130からの入力に応じて、SIPでの呼制御(セッションの確立や切断など)や音声データ伝送にかかる処理をおこなう。   The IP telephone processing unit 111 performs processing related to the IP telephone function of the mobile communication terminal 100. In response to input from the operation unit 130, SIP call control (session establishment, disconnection, etc.) and voice Performs processing related to data transmission.

受話音声処理部112は、通信制御部120や音声処理部150との協働により、IP電話処理部111によって確立されたIP電話セッションにおいて、通話相手端末100Bから送信された音声データを取得して処理する。受話音声処理部112は主に、通話相手端末100Bからコネクションレス型通信で送信された音声データを通話時の受話音声として出力するための処理をおこなう。   The received voice processing unit 112 acquires voice data transmitted from the call partner terminal 100B in the IP phone session established by the IP phone processing unit 111 in cooperation with the communication control unit 120 and the voice processing unit 150. Process. The received voice processing unit 112 mainly performs processing for outputting voice data transmitted from the counterpart terminal 100B by connectionless communication as received voice during a call.

ここでは、受信した音声データパケットのRTPヘッダに記述されているシーケンス番号の順で受信パケットを順次音声処理部150に供することで、通話相手端末100Bからの送話音声をスピーカ151から出力させる。上述したように、トランスポート層のプロトコルとして本実施形態ではUDPを用いているので、受信パケットの確認応答などはおこなわない。   Here, the received packets are sequentially supplied to the voice processing unit 150 in the order of the sequence numbers described in the RTP header of the received voice data packet, so that the transmitted voice from the call partner terminal 100B is output from the speaker 151. As described above, since UDP is used as a transport layer protocol in this embodiment, confirmation of a received packet is not performed.

なお、通話録音端末100Aの受話音声処理部112は、通話録音の実行に伴って確立したコネクション型通信(詳細後述)によって通話相手端末100Bから送信された音声データを、後述する録音用受話音声処理部116Aに送出する。ここでは、受信した音声データのヘッダ情報に基づいてコネクションレス型プロトコルのパケットであるかコネクション型プロトコルのパケットであるかを判別する。   Note that the received voice processing unit 112 of the call recording terminal 100A uses the received voice processing for recording, which will be described later, as the voice data transmitted from the call partner terminal 100B by connection-type communication (details will be described later) established with the execution of call recording. To unit 116A. Here, it is determined whether the packet is a connectionless protocol packet or a connection protocol protocol packet based on the header information of the received audio data.

この場合、トランスポート層で使用されているプロトコルを示すプロトコル番号が、下位層(インターネットワーク層)のプロトコルであるIPのヘッダに記述されているので、IPヘッダを参照することで、受信した音声データのトランスポート層でのプロトコルが、コネクションレス型であるかコネクション型であるかを判別することができる。そして、コネクションレス型プロトコルのパケットは音声処理部150へ供し、コネクション型プロトコルのパケットは録音用受話音声処理部116Aに供する。   In this case, since the protocol number indicating the protocol used in the transport layer is described in the IP header, which is the lower layer (internetwork layer) protocol, the received voice is referred to by referring to the IP header. It is possible to determine whether the protocol in the data transport layer is a connectionless type or a connection type. The connectionless protocol packet is provided to the voice processing unit 150, and the connection type protocol packet is provided to the recording reception voice processing unit 116A.

送話音声処理部113は、通信制御部120や音声処理部150との協働により、IP電話処理部111によって確立されたIP電話セッションにおいて、通話録音端末100Aのマイクロフォン152で集音された送話音声の音声データを音声処理部150に供することで、コネクションレス型通信で通話相手端末100Bに送信させる。ここでは、音声処理部150から入力される音声データを順次パケット分割し、RTPヘッダ、UDPヘッダ、IPヘッダ、その他下位プロトコルのヘッダ、を順次付加して通信制御部120に供することで、コネクションレス型通信で送信させる。   The transmitted voice processing unit 113 cooperates with the communication control unit 120 and the voice processing unit 150 to transmit the sound collected by the microphone 152 of the call recording terminal 100A in the IP telephone session established by the IP telephone processing unit 111. By providing the voice data of the spoken voice to the voice processing unit 150, the voice data is transmitted to the call partner terminal 100B by connectionless communication. Here, the voice data input from the voice processing unit 150 is sequentially packet-divided, and the RTP header, UDP header, IP header, and other lower-layer protocol headers are sequentially added to the communication control unit 120, thereby providing connection-less. Type communication.

通話録音処理部114Aは、通話録音端末100Aの通話録音機能にかかる処理をおこなう。ここでは、操作部130の録音ボタンの操作に応じた入力信号がIP電話処理部111を介して入力されることで、通話録音の開始および終了にかかる処理をおこなう。この場合、通話録音の開始または終了を、受話音声処理部112、送話音声処理部113、プロトコル制御要求部115A、録音用受話音声処理部116A、録音データ生成部117Aに通知し、録音の開始または終了にかかる動作の実行を指示する。   The call recording processing unit 114A performs processing related to the call recording function of the call recording terminal 100A. Here, an input signal corresponding to the operation of the recording button of the operation unit 130 is input via the IP telephone processing unit 111, and processing related to the start and end of call recording is performed. In this case, the start or end of call recording is notified to the reception voice processing unit 112, the transmission voice processing unit 113, the protocol control request unit 115A, the recording reception voice processing unit 116A, and the recording data generation unit 117A, and recording starts. Or, it instructs the execution of the operation for termination.

ここで、通話録音の開始時においては、送話音声処理部113で処理している音声データを送話バッファ領域162Aに格納させる。この場合、送話音声処理部113は、処理中の音声データの複製を生成して送話バッファ領域162Aに格納する。また、通話録音開始時に受話音声処理部112が処理している受話音声データのRTPヘッダに記述されているシーケンス番号を、受話音声についての録音開始位置を特定するための情報として取得する。   Here, at the start of call recording, the voice data processed by the transmission voice processing unit 113 is stored in the transmission buffer area 162A. In this case, the transmission voice processing unit 113 generates a copy of the voice data being processed and stores it in the transmission buffer area 162A. Further, the sequence number described in the RTP header of the received voice data processed by the received voice processing unit 112 at the start of call recording is acquired as information for specifying the recording start position for the received voice.

プロトコル制御要求部115Aは、通信制御部120との協働により、確立しているIP電話セッションの通信相手である通話相手端末100Bに対し、現在おこなっているコネクションレス型通信に、コネクション型通信を追加するようなプロトコル制御を要求する。この場合、プロトコル制御要求部115Aは、呼制御プロトコルであるSIPのSIPリクエストを用いてコネクション型通信の追加要求をおこなうものとする。また、要求するコネクション型通信は、トランスポート層のプロトコルとしてTCP(Transmission Control Protocol)を用いるものとする。   The protocol control request unit 115A, in cooperation with the communication control unit 120, performs connection-type communication to the connection-less type communication currently being performed with respect to the communication partner terminal 100B that is the communication partner of the established IP phone session. Request additional protocol control. In this case, it is assumed that the protocol control request unit 115A issues a connection-type communication addition request using a SIP SIP request that is a call control protocol. The requested connection-type communication uses TCP (Transmission Control Protocol) as a transport layer protocol.

録音用受話音声処理部116Aは、通信制御部120や記憶部160との協働により、通話録音の録音データとするための、欠損のない受話音声データを取得する。ここでは、受話音声処理部112がおこなっているコネクションレス型通信での受話音声データの取得と並行して、コネクション型通信で通話相手端末100Bから送信された受話音声データ(TCPセグメント)を受話音声処理部112から取得する。   The received voice processing unit for recording 116A obtains received voice data without a defect to be recorded data for call recording in cooperation with the communication control unit 120 and the storage unit 160. Here, in parallel with the acquisition of received voice data in connectionless communication performed by the received voice processing unit 112, the received voice data (TCP segment) transmitted from the call partner terminal 100B in connection type communication is received voice. Obtained from the processing unit 112.

録音用受話音声処理部116Aは、取得したTCPセグメントを受話バッファ領域161Aに格納するとともに、受信したTCPセグメントについての確認応答を、通信制御部120を介して通話相手端末100Bにおこなう。この確認応答によって通話相手端末100Bからパケット再送がおこなわれた場合、録音用受話音声処理部116Aは、再送されたパケットを受話バッファ領域161Aに格納する。   The reception voice processing unit 116A for recording stores the acquired TCP segment in the reception buffer area 161A, and sends a confirmation response about the received TCP segment to the communication partner terminal 100B via the communication control unit 120. When a packet is retransmitted from the call partner terminal 100B by this confirmation response, the recording reception voice processing unit 116A stores the retransmitted packet in the reception buffer area 161A.

録音データ生成部117Aは、受話バッファ領域161Aに一時格納されている受話音声データと、送話バッファ領域162Aに一時格納されている送話音声データとを合成することで、通話内容を示す録音データを生成し、録音データ格納領域163Aに格納する。   The recorded data generation unit 117A combines the received voice data temporarily stored in the reception buffer area 161A and the transmitted voice data temporarily stored in the transmission buffer area 162A, thereby recording the recorded data indicating the content of the call. Is stored in the recording data storage area 163A.

次に、通話相手端末100BがIP電話通信をおこなう場合に制御部110によって実現される機能構成を、図4を参照して説明する。図示するように、制御部110は、IP電話処理部111、受話音声処理部112、送話音声処理部113、要求判別部114B、プロトコル制御部115B、コネクション型送信処理部116B、誤り訂正処理部117B、などとして機能する。各機能構成を以下に説明するが、IP電話処理部111、受話音声処理部112、および、送話音声処理部113は、通話録音端末100Aのものと同一であるので説明を省略する。   Next, a functional configuration realized by the control unit 110 when the call partner terminal 100B performs IP telephone communication will be described with reference to FIG. As shown in the figure, the control unit 110 includes an IP telephone processing unit 111, a received voice processing unit 112, a transmitted voice processing unit 113, a request determination unit 114B, a protocol control unit 115B, a connection type transmission processing unit 116B, and an error correction processing unit. 117B, etc. Each functional configuration will be described below, but the IP telephone processing unit 111, the received voice processing unit 112, and the transmitted voice processing unit 113 are the same as those of the call recording terminal 100A, and thus description thereof is omitted.

要求判別部114Bは、IP電話セッションの確立している通話録音端末100Aからの要求を判別する。本実施形態では、通話録音端末100Aからコネクション型通信の追加をおこなうためのプロトコル制御が要求されたか否かを判別する。この場合、要求判別部114Bは、通話録音端末100AからのSIPリクエストに基づいて、コネクション型通信の追加が要求されたか判別する。   The request determination unit 114B determines a request from the call recording terminal 100A with which an IP telephone session is established. In the present embodiment, it is determined whether or not protocol control for adding connection-type communication is requested from the call recording terminal 100A. In this case, the request determination unit 114B determines whether addition of connection-type communication has been requested based on the SIP request from the call recording terminal 100A.

プロトコル制御部115Bは、通話録音端末100Aからの追加要求に応じて、通話相手端末100Bが使用するプロトコルを制御するための動作を各部に指示する。本実施形態では、トランスポート層のプロトコルとしてUDPを用いておこなっているコネクションレス型通信と同時に、TCPを用いたコネクション型通信をおこなうための動作を指示する。   The protocol control unit 115B instructs each unit to perform an operation for controlling the protocol used by the call partner terminal 100B in response to an addition request from the call recording terminal 100A. In this embodiment, an operation for performing connection-type communication using TCP is instructed simultaneously with connectionless communication using UDP as a transport layer protocol.

また、プロトコル制御部115Bは、コネクション型通信の追加要求を受信した時点から、送話音声処理部113が処理している送話音声データを、コネクション型通信での送信に用いるために送話バッファ領域162Bに一時格納させる。この場合、送話音声処理部113は、処理中の送話音声データの複製を生成して送話バッファ領域162Bに格納する。   Further, the protocol control unit 115B receives the transmission voice data processed by the transmission voice processing unit 113 from the time when the connection type communication addition request is received, so that the transmission buffer is used for transmission in the connection type communication. Temporary storage is performed in the area 162B. In this case, the transmission voice processing unit 113 generates a copy of the transmission voice data being processed and stores it in the transmission buffer area 162B.

コネクション型送信処理部116Bは、通信制御部120や記憶部160との協働により、通話録音端末100Aからのコネクション型通信の追加要求に応じて、通話録音端末100AとのTCPシーケンスを確立し、送話バッファ領域162Bに一時格納されている送話音声データを、TCPのパケット処理によって通話録音端末100Aに送出する。   The connection-type transmission processing unit 116B, in cooperation with the communication control unit 120 and the storage unit 160, establishes a TCP sequence with the call recording terminal 100A in response to a connection-type communication addition request from the call recording terminal 100A. The transmission voice data temporarily stored in the transmission buffer area 162B is transmitted to the call recording terminal 100A by TCP packet processing.

誤り訂正処理部117Bは、通信制御部120や記憶部160との協働により、コネクション型送信処理部116Bが通話録音端末100Aに送信したTCPセグメントについての確認応答に基づいて、パケットロスの有無を判別し、パケットロスがある場合は、該当パケットを送話バッファ領域162Bから取得して通話録音端末100Aに再送する。本実施形態では、送信したTCPセグメントについての確認応答が所定時間経過しても通話録音端末100Aから得られない場合に、当該TCPセグメントを通話録音端末100Aに再送する。   The error correction processing unit 117B, in cooperation with the communication control unit 120 and the storage unit 160, determines the presence or absence of packet loss based on the confirmation response regarding the TCP segment transmitted to the call recording terminal 100A by the connection-type transmission processing unit 116B. If there is a packet loss, the corresponding packet is acquired from the transmission buffer area 162B and retransmitted to the call recording terminal 100A. In the present embodiment, if a confirmation response for the transmitted TCP segment is not obtained from the call recording terminal 100A even after a predetermined time has elapsed, the TCP segment is retransmitted to the call recording terminal 100A.

これらの機能構成が、移動体通信端末100を通話録音端末100Aおよび通話相手端末100Bとして機能させたときに制御部110によって実現される機能構成である。なお、本実施形態では、制御部110がプログラムを実行することで上述した機能構成が論理的に実現されるものとするが、これらの機能構成を、例えば、ASIC(Application Specific Integrated Circuit:特定用途向け集積回路)などのハードウェアによって物理的に構成してもよい。   These functional configurations are functional configurations realized by the control unit 110 when the mobile communication terminal 100 functions as the call recording terminal 100A and the call partner terminal 100B. In the present embodiment, the above-described functional configuration is logically realized by the control unit 110 executing a program. For example, these functional configurations may be an ASIC (Application Specific Integrated Circuit). May be physically configured by hardware such as an integrated circuit).

以上の構成は、本発明を実現するために必要な構成であり、移動体通信端末としての基本機能や付加機能のために必要なその他の構成については、必要に応じて備えられているものとする。   The above configuration is a configuration necessary for realizing the present invention, and other configurations necessary for basic functions and additional functions as a mobile communication terminal are provided as necessary. To do.

以上のような構成を有する移動体通信端末100でIP電話通信をおこなう際に実行される動作を以下説明する。まず、通話録音端末100Aと通話相手端末100Bとの間でIP電話通信をおこなう際の音声通信システム1での動作概要を、図5に示すシーケンスチャートを参照して説明する。ここでは、通話録音端末100Aから通話相手端末100Bに発呼する場合を例に説明する。なお、通話録音端末100Aと通話相手端末100B間で送受されているリクエストやレスポンスは、音声通信システム1上の呼制御装置SSによって中継されているものとする。   The operation executed when IP telephone communication is performed in the mobile communication terminal 100 having the above configuration will be described below. First, an outline of operation in the voice communication system 1 when IP telephone communication is performed between the call recording terminal 100A and the call partner terminal 100B will be described with reference to a sequence chart shown in FIG. Here, a case where a call is made from the call recording terminal 100A to the call partner terminal 100B will be described as an example. It is assumed that requests and responses transmitted and received between the call recording terminal 100A and the call partner terminal 100B are relayed by the call control device SS on the voice communication system 1.

通話録音端末100Aにおいてユーザが操作部130を操作し、IP電話の発呼可能状態(オフフック)から通話相手端末100BのIP電話番号をダイヤルすると、通話録音端末100Aからは、SIPの発呼リクエスト(INVITE)が通話相手端末100Bに送信される(S10)。   When the user operates the operation unit 130 in the call recording terminal 100A and dials the IP telephone number of the call partner terminal 100B from an IP telephone call ready state (off-hook), the call recording terminal 100A makes a SIP call request ( INVITE) is transmitted to the communication partner terminal 100B (S10).

発呼リクエストを受信した通話相手端末100Bは、着信音鳴動などの呼出動作をおこなうとともに、呼出動作中であることを示す呼出中通知(180 RINGINGレスポンス)を通話録音端末100Aに送信する(S20)。通話相手端末100Bにおいて、ユーザが操作部130を操作してオフフック状態となると、通話相手端末100Bは成功応答(200 OKレスポンス)を通話録音端末100Aに送信する(S30)。   The call partner terminal 100B that has received the call request performs a call operation such as ringing, and transmits a call notification (180 RINGING response) indicating that the call is being performed to the call recording terminal 100A (S20). . In the call partner terminal 100B, when the user operates the operation unit 130 to enter the off-hook state, the call partner terminal 100B transmits a success response (200 OK response) to the call recording terminal 100A (S30).

通話相手端末100Bからの成功応答を受信した通話録音端末100Aが、確認応答(ACKリクエスト)を通話相手端末100Bに送信することで(S40)、通話録音端末100Aと通話相手端末100Bとの間でIP電話通信が確立し、RTP/UDPを用いたコネクションレス型通信による音声データ交換がおこなわれ、音声通話が実現される(S50)。   The call recording terminal 100A that has received the success response from the call partner terminal 100B transmits an acknowledgment (ACK request) to the call partner terminal 100B (S40), so that the call recording terminal 100A and the call partner terminal 100B can communicate with each other. IP telephone communication is established, voice data is exchanged by connectionless communication using RTP / UDP, and voice communication is realized (S50).

そして、通話録音端末100Aのユーザが操作部130を操作し、通話切断(オンフック)を指示すると、通話録音端末100Aは切断要求(BYEリクエスト)を通話相手端末100Bに送信する(S60)。切断要求を受信した通話相手端末100Bでも、操作部130の操作によってオンフックとなると、通話相手端末100Bが成功応答(200 OKレスポンス)を通話録音端末100Aに送信することで、IP電話通信のセッションが終了する。   Then, when the user of the call recording terminal 100A operates the operation unit 130 to give an instruction to disconnect the call (on-hook), the call recording terminal 100A transmits a disconnection request (BYE request) to the call partner terminal 100B (S60). When the other party terminal 100B that has received the disconnection request also goes on-hook by operating the operation unit 130, the other party terminal 100B transmits a success response (200 OK response) to the call recording terminal 100A, so that the IP telephone communication session is completed. finish.

以上が、通話録音端末100Aと通話相手端末100B間でおこなわれる、通常のIP電話通信の手順である。本実施形態では、通話録音機能を有している通話録音端末100Aで通話録音を実行した場合に、コネクションレス型通信による音声通話動作に加え、コネクション型通信を同時におこなうことで、パケット損失(音切れ)のない通話録音をおこなう。   The above is the procedure of normal IP telephone communication performed between the call recording terminal 100A and the call partner terminal 100B. In the present embodiment, when call recording is executed by the call recording terminal 100A having a call recording function, packet loss (sound) is obtained by simultaneously performing connection type communication in addition to voice call operation by connectionless type communication. Record calls without interruption.

この場合の通話録音端末100Aと通話相手端末100B間でおこなわれる動作の概要を、図6および図7に示すシーケンスチャートを参照して説明する。ここでは、図5で説明した通話用音声データ交換(S50)の後に通話録音端末100Aで通話録音が実行されることになる。   An outline of operations performed between the call recording terminal 100A and the call partner terminal 100B in this case will be described with reference to sequence charts shown in FIGS. Here, the call recording terminal 100A performs call recording after the call voice data exchange (S50) described in FIG.

まず、図6を参照して、通話録音開始時の動作概要を説明する。図示するように、通話録音端末100Aにおいて、ユーザが操作部130の録音ボタンを操作して録音開始を指示すると、通話録音端末100Aは、INVITEリクエストの再送信であるRE-INVITEリクエストを用いて、現在おこなっているRTP/UDPのコネクションレス型通信のセッションに、RTP/TCPのコネクション型通信のセッションを追加する要求を通話相手端末100Bに送信する(S51)。   First, referring to FIG. 6, an outline of the operation at the start of call recording will be described. As shown in the figure, in the call recording terminal 100A, when the user operates the recording button of the operation unit 130 to instruct the start of recording, the call recording terminal 100A uses a RE-INVITE request that is a retransmission of the INVITE request, A request to add an RTP / TCP connection-type communication session to the RTP / UDP connection-less communication session currently in progress is transmitted to the call partner terminal 100B (S51).

通話録音端末100AからのRE-INVITEリクエストを受信した通話相手端末100Bは、成功応答(200 OKレスポンス)を通話録音端末100Aに返信する(S52)。これに対し、通話録音端末100Aが確認応答(ACKリクエスト)を通話相手端末100Bに送信すると(S53)、コネクション型プロトコルであるTCPの手順によるセッション確立動作が開始される。   The call partner terminal 100B that has received the RE-INVITE request from the call recording terminal 100A returns a success response (200 OK response) to the call recording terminal 100A (S52). On the other hand, when the call recording terminal 100A transmits an acknowledgment (ACK request) to the call partner terminal 100B (S53), a session establishment operation is started by a TCP procedure which is a connection type protocol.

この場合、TCPの経路確立手順である、いわゆる3ウェイ・ハンドシェイクがおこなわれる。つまり、データ送信をおこなう通話相手端末100Bが、TCPヘッダの制御ビットでSYNフラグをオンにしたTCPセグメントを通話録音端末100Aに送信し(S54)、これに対し通話録音端末100Aが、ACKフラグとSYNフラグをオンにしたTCPセグメントを通話相手端末100Bに返信する(S55)。さらに、通話相手端末100Bが、ACKフラグをオンにしたTCPセグメントを通話録音端末100Aに送信することで(S56)、通話録音端末100Aと通話相手端末100B間で、RTP/TCPによるコネクション型通信が確立する(S57)。   In this case, a so-called 3-way handshake, which is a TCP path establishment procedure, is performed. That is, the call partner terminal 100B that performs data transmission transmits a TCP segment in which the SYN flag is turned on by the control bit of the TCP header to the call recording terminal 100A (S54). The TCP segment with the SYN flag turned on is returned to the call partner terminal 100B (S55). Furthermore, the call partner terminal 100B transmits a TCP segment with the ACK flag turned on to the call recording terminal 100A (S56), so that connection-type communication by RTP / TCP is performed between the call recording terminal 100A and the call partner terminal 100B. Establish (S57).

本実施形態では、既に確立しているRTP/UDPのコネクションレス型通信(S50)と、新たに確立したRTP/TCPのコネクション型通信(S57)とを同時におこなうことで、通話用の音声データ交換をコネクションレス型通信、録音用の音声データ交換をコネクション型通信でおこなう(S50’)。   In the present embodiment, voice data exchange for a call is performed by simultaneously performing already established RTP / UDP connectionless communication (S50) and newly established RTP / TCP connection type communication (S57). Are exchanged by connectionless communication and voice data for recording is exchanged by connection type communication (S50 ').

このようにしてコネクションレス型通信とコネクション型通信とが並行して確立した後の動作概要を、図7に示すシーケンスチャートを参照して説明する。   An outline of the operation after the connectionless communication and the connection communication are established in parallel will be described with reference to the sequence chart shown in FIG.

この状態においては、通常のTCP手順によって、通話相手端末100Bから音声データが通話録音端末100Aに送信される。つまり、通話相手端末100Bからは、TCPセグメントを含んだ音声データが順次通話録音端末100Aに送信され、通話録音端末100Aは、受信したTCPセグメントについての確認応答を随時通話相手端末100Bに返信する。そして、通話録音端末100Aからの確認応答が所定時間以上経過しても通話相手端末100Bに返信されない場合、該当するTCPセグメントを含む音声データを通話録音端末100Aに再送することでパケットロスの補償をおこなう。   In this state, voice data is transmitted from the call partner terminal 100B to the call recording terminal 100A by a normal TCP procedure. That is, the voice data including the TCP segment is sequentially transmitted from the call partner terminal 100B to the call recording terminal 100A, and the call recording terminal 100A returns a confirmation response for the received TCP segment to the call partner terminal 100B as needed. If the confirmation response from the call recording terminal 100A is not returned to the call partner terminal 100B even after a predetermined time has elapsed, the packet loss is compensated by retransmitting the voice data including the corresponding TCP segment to the call recording terminal 100A. Do it.

このような動作を繰り返しおこなうことで、通話録音端末100Aでの通話録音に用いられる音声データが、通話用のコネクションレス型通信と並行して、通話相手端末100Bから通話録音端末100Aに送信される。   By repeating such operations, voice data used for call recording at the call recording terminal 100A is transmitted from the call partner terminal 100B to the call recording terminal 100A in parallel with the connectionless communication for calling. .

ここで、通話録音端末100Aにおいて、ユーザが操作部130の録音ボタンを操作して録音終了を指示すると、コネクション型通信を終了させる手順が実行される。この場合、通話録音端末100Aは、FINフラグをオンしたTCPセグメントを通話相手端末100Bに送信し、TCPセッションの切断を要求する(S51’)。   Here, in the call recording terminal 100A, when the user operates the recording button of the operation unit 130 to instruct the end of recording, a procedure for ending the connection type communication is executed. In this case, the call recording terminal 100A transmits a TCP segment with the FIN flag turned on to the call partner terminal 100B, and requests disconnection of the TCP session (S51 ').

これに対し通話相手端末100Bは、ACKフラグをオンしたTCPセグメントを通話録音端末100Aに送信して確認応答するとともに(S52’)、FINフラグとACKフラグとをオンしたTCPセグメントを通話録音端末100Aに送信してTCPセッションの切断を要求する(S53’)。これに対し、ACKフラグをオンしたTCPセグメントを通話録音端末100Aが返信することで(S54’)、RTP/TCPセッションが終了する。   In response to this, the communication partner terminal 100B transmits a TCP segment with the ACK flag turned on to the call recording terminal 100A for an acknowledgment (S52 '), and sends the TCP segment with the FIN flag and ACK flag turned on to the call recording terminal 100A. To disconnect the TCP session (S53 '). On the other hand, when the call recording terminal 100A returns a TCP segment with the ACK flag turned on (S54 '), the RTP / TCP session is terminated.

このようにして、通話録音端末100Aで通話録音動作をおこなっている間、通常のコネクションレス型通信による音声通話と並行して、コネクション型通信で録音用音声データの転送がおこなわれる。コネクション型通信のセッションが終了した後も、通話が終了するまでは、RTP/UDPによるコネクションレス型通信での音声データ交換(S50)は継続される。   In this way, while the call recording operation is performed at the call recording terminal 100A, the recording voice data is transferred by the connection type communication in parallel with the voice call by the normal connectionless type communication. Even after the connection type communication session is ended, the voice data exchange (S50) in the connectionless type communication by RTP / UDP is continued until the call is ended.

以上のような動作シーケンスをおこなう通話録音端末100Aと通話相手端末100Bそれぞれの動作を以下に詳説する。まず、図8に示すフローチャートを参照して、通話録音端末100Aが実行する通話録音処理を説明する。この通話録音処理は、コネクションレス型通信によって通話相手端末100BとIP電話通信がおこなわれているときに、操作部130の録音ボタンの操作による録音開始指示が制御部110(IP電話処理部111)に入力されたことを契機に開始される。   The operations of the call recording terminal 100A and the call partner terminal 100B that perform the operation sequence as described above will be described in detail below. First, the call recording process executed by the call recording terminal 100A will be described with reference to the flowchart shown in FIG. In this call recording process, when IP telephone communication is performed with the other party terminal 100B by connectionless communication, a recording start instruction by operating the recording button of the operation unit 130 is given by the control unit 110 (IP telephone processing unit 111). It will be triggered by the input to.

処理が開始されると、IP電話処理部111は、録音開始が指示されたことを通話録音処理部114Aに通知する。この通知に応じて、通話録音処理部114Aは、録音開始を受話音声処理部112に通知するとともに、受話音声処理部112が現在処理している受信音声データのヘッダ情報を受話音声処理部112から取得することで録音開始位置を特定する(ステップS101)。ここでは、RTP/UDPによる音声データを受信しているので、RTPヘッダに記述されているシーケンス番号とタイムスタンプ情報を、録音開始位置を示す情報(以下、「録音開始位置情報」とする)として取得する。   When the processing is started, IP telephone processing unit 111 notifies call recording processing unit 114A that recording start is instructed. In response to this notification, the call recording processing unit 114A notifies the reception voice processing unit 112 of the start of recording, and receives the header information of the received voice data currently processed by the reception voice processing unit 112 from the reception voice processing unit 112. The recording start position is specified by acquiring (step S101). Here, since the audio data by RTP / UDP is received, the sequence number and time stamp information described in the RTP header are used as information indicating the recording start position (hereinafter referred to as “recording start position information”). get.

同時に通話録音処理部114Aは、通話録音端末100Aからの送話音声データを送話バッファ領域162Aに一時格納(バッファ)するよう送話音声処理部113に指示する。この指示に応じて、送話音声処理部113は、現在処理している送話音声の音声データを複製し、送話バッファ領域162Aに格納する(ステップS102)。ここでは、RTP/UDPで送話音声を通話相手端末100Bに送信しているので、IP、UDP、RTPの各プロトコルに応じたヘッダを含んだ音声データが送話バッファ領域162Aに格納される。   At the same time, the call recording processing unit 114A instructs the transmission voice processing unit 113 to temporarily store (buffer) the transmission voice data from the call recording terminal 100A in the transmission buffer area 162A. In response to this instruction, the transmission voice processing unit 113 duplicates the voice data of the transmission voice currently being processed and stores it in the transmission buffer area 162A (step S102). Here, since the transmitted voice is transmitted to the other party terminal 100B by RTP / UDP, voice data including a header corresponding to each protocol of IP, UDP, and RTP is stored in the transmission buffer area 162A.

通話録音処理部114Aは、プロトコル制御要求部115Aに録音開始を指示するとともに、ステップS101で取得した録音開始位置情報を通知する。プロトコル制御要求部115Aは、通話録音端末100Aでの通話録音に用いるための音声データ送出を通話相手端末100Bに求めるため、SIPの手順によって、プロトコル制御を通話相手端末100Bに要求する(ステップS103)。ここでは、図6のS51〜S53にかかる動作をおこなうことで、コネクション型通信のセッションを確立し(ステップS104)、現在おこなっているコネクションレス型通信(RTP/UDPセッション)にコネクション型通信(RTP/TCPセッション)を追加させる。   The call recording processing unit 114A instructs the protocol control request unit 115A to start recording and notifies the recording start position information acquired in step S101. The protocol control requesting unit 115A requests the call partner terminal 100B for protocol control according to the SIP procedure in order to request the call partner terminal 100B to transmit voice data to be used for call recording at the call recording terminal 100A (step S103). . Here, a connection type communication session is established by performing the operations in S51 to S53 in FIG. 6 (step S104), and the connection type communication (RTP / UDP session) is performed in the current connectionless type communication (RTP / UDP session). / TCP session).

ここで、プロトコル制御要求部115Aは、通話相手端末100Bにプロトコル制御要求をおこなう際、通話録音処理部114Aから通知された録音開始位置情報を通話相手端末100Bに送信することで、録音開始位置を通話相手端末100Bに通知する。   Here, when making a protocol control request to the call partner terminal 100B, the protocol control request unit 115A transmits the recording start position information notified from the call record processing unit 114A to the call partner terminal 100B, thereby determining the recording start position. The call partner terminal 100B is notified.

これにより、通話相手端末100Bからは、当該録音開始位置からの音声データが、ステップS104で確立したコネクション型通信で順次送信されることになる。ここで、上述したように、通話用のコネクションレス型通信と録音用のコネクション型通信とが並行しておこなわれているので、通話相手端末100Bからは、コネクションレス型プロトコルの音声データ(RTP/UDPデータ)とコネクション型プロトコルの音声データ(RTP/TCPデータ)とが混在して送信されることになる。   As a result, the voice data from the recording start position is sequentially transmitted from the call partner terminal 100B by the connection-type communication established in step S104. Here, as described above, since the connectionless communication for call and the connection communication for recording are performed in parallel, the call partner terminal 100B receives voice data (RTP / UDP data) and connection type protocol voice data (RTP / TCP data) are mixedly transmitted.

このようにして通話相手端末100Bから送信された音声データは、通信制御部120が受信し受話音声処理部112に入力される。受話音声処理部112は、ステップS101で録音開始が通知されているので、これから受信する音声データにRTP/UDPデータとRTP/TCPデータが混在することを認識している。この場合、受話音声処理部112は、受信した音声データのIPヘッダを参照し、取得した音声データパケットが録音用のRTP/TCPデータであるか否かを判別する(ステップS105)。   The voice data transmitted from the other party terminal 100B in this way is received by the communication control unit 120 and input to the received voice processing unit 112. The received voice processing unit 112 has been notified of the start of recording in step S101, and thus recognizes that RTP / UDP data and RTP / TCP data are mixed in voice data to be received. In this case, the received voice processing unit 112 refers to the IP header of the received voice data, and determines whether or not the acquired voice data packet is RTP / TCP data for recording (step S105).

取得した音声データパケットがRTP/TCPデータである場合(ステップS105:Yes)、受話音声処理部112は、そのデータを録音用受話音声処理部116Aに供する。録音用受話音声処理部116Aは、受話音声処理部112から供給されたRTP/TCPの音声データを受話バッファ領域161Aに格納するとともに(ステップS106)、TCPの応答確認を通話相手端末100Bに返信する(ステップS107)。   When the acquired voice data packet is RTP / TCP data (step S105: Yes), the received voice processing unit 112 supplies the data to the received voice processing unit for recording 116A. The recording reception voice processing unit 116A stores the RTP / TCP voice data supplied from the reception voice processing unit 112 in the reception buffer area 161A (step S106), and returns a TCP response confirmation to the call partner terminal 100B. (Step S107).

ステップS105〜ステップS107の動作は、通話録音端末100Aのユーザが操作部130の録音ボタンを操作して録音停止を指示するまで繰り返される(ステップS108:No)。   The operations from step S105 to step S107 are repeated until the user of the call recording terminal 100A operates the recording button of the operation unit 130 to instruct to stop recording (step S108: No).

このようなRTP/TCPでの音声データ取得において、通話相手端末100Bから通話録音端末100Aに送信した音声データパケットが紛失すると、録音用受話音声処理部116Aは、そのパケットについての応答確認を通話相手端末100Bに返信できない。このような場合、TCPの誤り訂正機能により、通話相手端末100Bから該当パケットが再送されることになる。このようにして再送されたパケットを受信した場合、ステップS105〜ステップS107の動作によって、受話バッファ領域161Aに格納されるとともに、応答確認が通話相手端末100Bに返信される。   In such RTP / TCP voice data acquisition, if a voice data packet transmitted from the call partner terminal 100B to the call recording terminal 100A is lost, the received voice processing unit for recording 116A confirms the response to the call partner. A reply cannot be made to terminal 100B. In such a case, the corresponding packet is retransmitted from the communication partner terminal 100B by the TCP error correction function. When the retransmitted packet is received in this manner, the response is returned to the call partner terminal 100B while being stored in the reception buffer area 161A by the operations in steps S105 to S107.

通話録音端末100Aのユーザが操作部130の録音ボタンを操作して録音終了を指示すると(ステップS108:Yes)、その入力信号がIP電話処理部111を介して通話録音処理部114Aに入力される。この場合、通話録音処理部114Aは、受話音声処理部112に録音終了を指示するとともに、受話音声処理部112が現在処理している受信音声データのヘッダ情報を受話音声処理部112から取得することで録音開始位置を特定する。ここでは、ステップS101での処理と同様に、受話音声処理部112が処理しているRTP/UDPデータのRTPヘッダに記述されているシーケンス番号やタイムスタンプを、録音終了位置を特定する情報(以下、「録音終了位置情報」)として取得する。   When the user of the call recording terminal 100A operates the recording button of the operation unit 130 to instruct the end of recording (step S108: Yes), the input signal is input to the call recording processing unit 114A via the IP phone processing unit 111. . In this case, the call recording processing unit 114A instructs the reception voice processing unit 112 to end the recording and obtains header information of the reception voice data currently processed by the reception voice processing unit 112 from the reception voice processing unit 112. Use to specify the recording start position. Here, as in the processing in step S101, the sequence number and time stamp described in the RTP header of the RTP / UDP data processed by the received voice processing unit 112 is used to specify the recording end position (hereinafter referred to as the recording end position). , “Recording end position information”).

通話録音処理部114Aは、録音終了位置情報を取得すると、受話バッファ領域161Aにアクセスし、格納されている受話音声データのRTPヘッダを参照することで、録音終了位置の音声データパケット(最終データパケット)まで格納されているか判別する。ここで、最終データパケットが格納されていない場合、録音用として必要なすべての音声データが取得できていないことになるので(ステップS109:No)、コネクション型通信のセッションを継続する。   When the call recording processing unit 114A obtains the recording end position information, the call recording processing unit 114A accesses the reception buffer area 161A and refers to the RTP header of the received reception voice data, so that the voice data packet (final data packet) at the recording end position is obtained. ) Is stored. Here, when the final data packet is not stored, all the audio data necessary for recording cannot be acquired (step S109: No), and the connection-type communication session is continued.

つまり、TCPによる再送処理などをおこなっていると、RTP/UDPによるリアルタイム通信よりも遅延して音声データを受信する可能性があるため、すべてのデータを受信していなければ、録音終了指示を受けてもコネクション型通信のセッションを終了させない。   In other words, if retransmission processing is performed using TCP, voice data may be received later than real-time communication using RTP / UDP. If all data has not been received, a recording end instruction is received. However, the connection type communication session is not terminated.

また、最終データパケットが受話バッファ領域161Aに格納されていても、途中のパケットが再送対象であると、すべての音声データパケットが格納されていない場合もある。よって、通話録音処理部114Aは、受話バッファ領域161Aに格納されている受話音声データのTCPヘッダに記述されているシーケンス番号をチェックすることでも、すべての音声データパケットが格納されているか否かを判別する(ステップS109)。   Even if the last data packet is stored in the reception buffer area 161A, if the intermediate packet is a retransmission target, not all the voice data packets may be stored. Therefore, the call recording processing unit 114A checks whether or not all voice data packets are stored by checking the sequence number described in the TCP header of the received voice data stored in the reception buffer area 161A. A determination is made (step S109).

通話用のコネクションレス型通信と並行しておこなったコネクション型通信によって取得した受話音声データが、録音期間に対応するすべてのパケットを含んでいる場合(ステップS109:Yes)、通話録音処理部114Aは、コネクションレス型通信の終了をプロトコル制御要求部115Aに指示するとともに、録音データ生成部117Aに録音データの生成を指示する。   When the received voice data acquired by the connection type communication performed in parallel with the connectionless type communication for a call includes all packets corresponding to the recording period (step S109: Yes), the call recording processing unit 114A Then, the end of the connectionless communication is instructed to the protocol control request unit 115A, and the recording data generation unit 117A is instructed to generate the recording data.

プロトコル制御要求部115Aは、図7のS51’〜S54’にかかる動作をおこなうことで、通話相手端末100Bとのコネクション型通信のセッションを終了する(ステップS110)。これにより、通話相手端末100Bとのセッションは、通話用のコネクションレス型通信(RTP/UDP)のみとなる。   The protocol control request unit 115A completes the connection-type communication session with the communication partner terminal 100B by performing the operations according to S51 'to S54' of FIG. 7 (step S110). Thereby, the session with the call partner terminal 100B is only connectionless communication (RTP / UDP) for calls.

また、録音データ生成部117Aは、受話バッファ領域161Aに格納されている受話音声データと、送話バッファ領域162Aに格納されている送話音声データとを合成することで、録音期間の通話内容を示す録音データを生成し、生成した録音データを録音データ格納領域163Aに格納することで(ステップS111)、通話録音処理を終了する。   In addition, the recording data generation unit 117A combines the received voice data stored in the reception buffer area 161A and the transmission voice data stored in the transmission buffer area 162A, so that the content of the call during the recording period can be obtained. The recorded recording data is generated, and the generated recording data is stored in the recording data storage area 163A (step S111), thereby terminating the call recording process.

録音データの生成にあたっては、送話音声データと受話音声データそれぞれのRTPヘッダに記述されているタイムスタンプに基づき、送話音声と受話音声の時間的位置を合わせて合成することで、実際の通話内容を再生できる録音データが生成される。   When generating the recorded data, the actual call is synthesized by combining the time positions of the transmitted voice and the received voice based on the time stamps described in the RTP headers of the transmitted voice data and the received voice data. Recorded data that can be played back is generated.

次に、図9に示すフローチャートを参照して、通話相手端末100Bが実行するプロトコル制御処理を説明する。このプロトコル制御処理は、通話録音端末100Aが送信したプロトコル制御要求を通話相手端末100Bの通信制御部120が受信し、制御部110に入力したことを契機に開始される。すなわち、制御部110に入力されたSIPメッセージが、TCPでのセッション追加を要求するものであると要求判別部114Bが判別したことを契機に処理が開始される。   Next, a protocol control process executed by the communication partner terminal 100B will be described with reference to a flowchart shown in FIG. This protocol control process is started when the communication control unit 120 of the call partner terminal 100B receives the protocol control request transmitted from the call recording terminal 100A and inputs it to the control unit 110. That is, the processing is started when the request determination unit 114B determines that the SIP message input to the control unit 110 is a request for adding a session in TCP.

この場合、要求判別部114Bは、TCPセッションの追加が要求された旨をプロトコル制御部115Bに通知する。プロトコル制御部115Bは、要求判別部114Bからの通知に応じて、現在処理している送話音声データのバッファ開始を送話音声処理部113に指示する。この指示により、送話音声処理部113は、処理している送話音声データの複製を生成し、送話バッファ領域162Bに順次格納する(ステップS201)。   In this case, the request determination unit 114B notifies the protocol control unit 115B that a TCP session addition has been requested. In response to the notification from the request determination unit 114B, the protocol control unit 115B instructs the transmission voice processing unit 113 to start buffering the transmission voice data currently being processed. In response to this instruction, the transmission voice processing unit 113 generates a copy of the transmission voice data being processed, and sequentially stores it in the transmission buffer area 162B (step S201).

ここで、上述したように、通話録音端末100Aからのプロトコル制御要求には、録音開始位置情報が含まれている。プロトコル制御部115Bは、送話バッファ領域162Bにアクセスし、送話音声処理部113が格納した送話音声データのRTPヘッダを参照して、通話録音端末100Aから要求された録音開始位置よりも前の音声部分を示すパケットがあれば削除する。これにより、通話録音端末100Aで録音ボタンが操作された時点からの音声データが送話バッファ領域162Bに一時格納される。   Here, as described above, the protocol control request from the call recording terminal 100A includes the recording start position information. The protocol control unit 115B accesses the transmission buffer area 162B, refers to the RTP header of the transmission voice data stored by the transmission voice processing unit 113, and before the recording start position requested from the call recording terminal 100A. If there is a packet indicating the voice part of, it is deleted. As a result, the voice data from the time when the recording button is operated on the call recording terminal 100A is temporarily stored in the transmission buffer area 162B.

プロトコル制御部115Bは、送話音声処理部113へのバッファ開始指示と同時に、コネクション型送信処理部116Bにコネクション型通信のセッション開始を指示する。コネクション型送信処理部116Bは、図6のS52〜S56にかかる動作をおこなうことで、通話録音端末100Aとの間にコネクション型通信(RTP/TCP)のセッションを確立する(ステップS202)。   The protocol control unit 115B instructs the connection type transmission processing unit 116B to start a session of connection type communication simultaneously with the buffer start instruction to the transmission voice processing unit 113. The connection-type transmission processing unit 116B establishes a connection-type communication (RTP / TCP) session with the call recording terminal 100A by performing the operations according to S52 to S56 of FIG. 6 (step S202).

コネクション型送信処理部116Bは、ステップS201で送話バッファ領域162Bに順次格納されている送話音声データを、確立したRTP/TCPセッションによって通話録音端末100Aに送信する(ステップS203)。ここでは、TCPプロトコルを用いて送信しているので、送信したパケットに対する確認応答が通話録音端末100Aから返信されることになっている。よって、コネクション型送信処理部116Bは、RTP/TCPセッションでパケットを送信すると、随時誤り訂正処理部117Bに通知する。誤り訂正処理部117Bは、コネクション型送信処理部116Bが送信してからの経過時間を計時し、所定時間内に送信パケットについての確認応答が受信されたか判別する(ステップS204)。   The connection-type transmission processing unit 116B transmits the transmission voice data sequentially stored in the transmission buffer area 162B in step S201 to the call recording terminal 100A through the established RTP / TCP session (step S203). Here, since transmission is performed using the TCP protocol, a confirmation response to the transmitted packet is returned from the call recording terminal 100A. Therefore, the connection-type transmission processing unit 116B notifies the error correction processing unit 117B as needed when transmitting a packet in the RTP / TCP session. The error correction processing unit 117B measures the elapsed time since the transmission by the connection-type transmission processing unit 116B, and determines whether an acknowledgment for the transmission packet has been received within a predetermined time (step S204).

所定時間内に応答確認を受信できないパケットがある場合(ステップS204:Yes)、誤り訂正処理部117Bは、TCPの再送手順に従い、該当パケットの再送をおこなう(ステップS205)。なお、所定時間内に確認応答が受信できた場合(ステップS204:No)は、当該パケットを送話バッファ領域162Bから削除する。   If there is a packet that cannot receive a response confirmation within a predetermined time (step S204: Yes), the error correction processing unit 117B retransmits the packet according to the TCP retransmission procedure (step S205). If an acknowledgment is received within a predetermined time (step S204: No), the packet is deleted from the transmission buffer area 162B.

このような動作を、通話録音端末100Aからコネクション型通信の終了要求があるまで繰り返しおこなうことで(ステップS206:No)、通話相手端末100Bのユーザの発話音声を示す送話音声データが、コネクション型通信であるRTP/TCPセッションにより、紛失パケットの再送をおこないながら通話録音端末100Aに送信される。   By repeating such an operation until the end of the connection type communication is requested from the call recording terminal 100A (step S206: No), the transmission voice data indicating the voice of the user of the other party terminal 100B becomes the connection type. The lost packet is retransmitted to the call recording terminal 100A through the RTP / TCP session which is communication.

ここで、通話録音端末100Aにおいて録音ボタンが操作され録音終了が指示されると、通話録音端末100Aからコネクション型通信の終了要求とともに、録音終了位置情報が通話相手端末100Bに送信される。すなわち、通話録音端末100Aからは、TCPの切断要求が通話相手端末100Bに送信される。この場合、要求判別部114Bによって、受信した信号がTCP切断要求であると判別される。(ステップS206:Yes)。   Here, when the recording button is operated and an end of recording is instructed in the call recording terminal 100A, the recording end position information is transmitted from the call recording terminal 100A to the call partner terminal 100B together with a connection type communication end request. That is, the call recording terminal 100A transmits a TCP disconnection request to the call partner terminal 100B. In this case, the request determination unit 114B determines that the received signal is a TCP disconnection request. (Step S206: Yes).

要求判別部114Bがこのように判別すると、プロトコル制御部115Bは、送話音声データのバッファ動作終了を送話音声処理部113に指示する。これにより、送話バッファ領域162Bへの送話音声データの格納が終了すると、プロトコル制御部115Bは、コネクション型通信での音声データ送信の終了動作をコネクション型送信処理部116Bに指示するとともに、通話録音端末100Aから受信した録音終了位置情報をコネクション型送信処理部116Bに通知する。   When the request determination unit 114B determines in this way, the protocol control unit 115B instructs the transmission voice processing unit 113 to end the buffer operation of the transmission voice data. Thus, when the transmission of the transmission voice data to the transmission buffer area 162B is completed, the protocol control unit 115B instructs the connection type transmission processing unit 116B to end the voice data transmission in the connection type communication and The recording end position information received from the recording terminal 100A is notified to the connection type transmission processing unit 116B.

コネクション型送信処理部116Bは、通知された録音終了位置情報に対応するパケット(最終データ)までをコネクション型通信によって通話録音端末100Aに送信し、これに対応する確認応答の受信があるか判別する(ステップS207)。上述したように、確認応答を受信したパケットは送話バッファ領域162Bから削除されるので、ここでは、コネクション型送信処理部116Bが送話バッファ領域162Bにアクセスし、バッファされた送話音声データがすべて削除されたか確認することで、最終データまで確実に通話相手端末100Bに送信されたか否かを判別する。   The connection-type transmission processing unit 116B transmits up to the packet (final data) corresponding to the notified recording end position information to the call recording terminal 100A by connection-type communication, and determines whether or not a confirmation response corresponding to this is received. (Step S207). As described above, since the packet that has received the acknowledgment is deleted from the transmission buffer area 162B, here, the connection-type transmission processing unit 116B accesses the transmission buffer area 162B, and the buffered transmission voice data is By confirming whether all have been deleted, it is determined whether or not the final data has been reliably transmitted to the call partner terminal 100B.

よって、送話バッファ領域162Bにまだ再送対象のデータが残っている場合(ステップS207:No)、当該パケットの再送処理がおこなわれる(ステップS205)。   Therefore, when data to be retransmitted still remains in the transmission buffer area 162B (step S207: No), the packet is retransmitted (step S205).

一方、最終データまでの確認応答が受信できた場合(ステップS207:No)、コネクション型送信処理部116Bは、図7のS52’〜S54’にかかる動作をおこなうことで、通話録音端末100Aとの間のコネクション型通信(RTP/TCP)のセッションを終了し(ステップS208)、処理を終了する。   On the other hand, when the confirmation response up to the final data has been received (step S207: No), the connection-type transmission processing unit 116B performs an operation related to S52 ′ to S54 ′ in FIG. The connection type communication (RTP / TCP) session is terminated (step S208), and the process is terminated.

以上説明したように、本実施形態によれば、IP電話による音声通話をおこなう通信端末間において、リアルタイム性が要求される通話時はコネクションレス型通信のプロトコルを用いるが、通話録音が実行されている間は、コネクション型通信のプロトコルを使用したセッションも追加し、通話時の音声と同じ音声データをコネクション型通信でも転送する。これにより、パケットロスのない録音データを得ることができるので、再生時に音切れが生じることのない通話録音をおこなうことができる。   As described above, according to the present embodiment, a connectionless communication protocol is used between communication terminals that perform a voice call using an IP phone when a real-time call is required. While there is a session, a session using a connection-type communication protocol is also added, and the same voice data as the voice during the call is transferred by the connection-type communication. Thereby, since recording data without packet loss can be obtained, it is possible to perform call recording without interruption of sound during reproduction.

この場合において、録音側装置からの送話音声と、相手装置からコネクション型通信で受信した受話音声とを合成して録音データを生成するので、音声通話における会話内容を、音切れのない音声で録音することができる。   In this case, since the recording data is generated by synthesizing the transmitted voice from the recording side device and the received voice received from the partner device by connection-type communication, the conversation content in the voice call can be expressed with a voice without interruption. You can record.

また、通話録音が実行されている間だけコネクション型通信を追加して録音用の音声データを取得するので、ユーザが所望している録音期間の音声データが取得できるとともに、装置での処理やネットワークに必要以上の負荷をかけることがない。   In addition, since connection-type communication is added and voice data for recording is acquired only while call recording is being performed, voice data for a recording period desired by the user can be acquired, as well as processing in the device and network Do not put more load than necessary.

上記実施形態は一例であり、本発明の適用範囲はこれに限られない。すなわち、種々の応用が可能であり、あらゆる実施の形態が本発明の範囲に含まれる。   The said embodiment is an example and the application range of this invention is not restricted to this. That is, various applications are possible, and all embodiments are included in the scope of the present invention.

例えば、本実施形態の上記説明においては、理解を容易にするため、録音側端末の構成と通話相手側端末の構成とを分けて説明したが、両者の機能を実現する構成を一の装置内に構成していてもよい。   For example, in the above description of the present embodiment, the configuration of the recording side terminal and the configuration of the communication partner side terminal have been described separately for easy understanding. You may comprise.

また、上記実施形態では、移動体通信端末100とパケット交換網INとの間に移動体通信網MNが介在するものとしたが、基地局BSと移動体通信端末100が、例えば、IEEE802.16系の無線IP通信(いわゆる、WiMAXやモバイルWiMAXなど)に対応している場合は、移動体通信網MNを介さずに、当該基地局BSからパケット交換網INに直接アクセスできる構成であってもよい。   In the above embodiment, the mobile communication network MN is interposed between the mobile communication terminal 100 and the packet switching network IN. However, the base station BS and the mobile communication terminal 100 are, for example, IEEE802.16. When supporting wireless IP communication (so-called WiMAX, mobile WiMAX, etc.), the base station BS may be able to directly access the packet switching network IN without going through the mobile communication network MN. .

また、上記実施形態では、通話時の会話内容が再生できるよう、送話音声と受話音声とを合成して録音するようにしたが、このような動作に限られず、例えば、コネクション型通信によって相手側から送信された音声のみを録音するようにしてもよい。このような構成によれば、例えば、音声ガイダンスなどといった相手側からの一方的な音声内容を録音するような場合に、上記実施形態で示したような送話音声と受話音声の合成をおこなわなくてもよいので、より簡易な動作で録音をおこなうことができる。   Further, in the above embodiment, the transmission voice and the reception voice are synthesized and recorded so that the conversation contents at the time of the call can be reproduced. However, the present invention is not limited to such an operation. Only sound transmitted from the side may be recorded. According to such a configuration, for example, when recording one-side audio content from the other party, such as voice guidance, the transmission voice and the reception voice are not synthesized as shown in the above embodiment. Therefore, recording can be performed with a simpler operation.

また、上記実施形態では、移動体通信端末に本発明を適用した例を示したが、IP電話機能を有する通信装置であればよく、例えば、固定式のIP電話機などに本発明を適用してもよい。また、音声情報を処理する情報処理装置などに本発明を適用してもよく、例えば、電話装置から送信された音声を他言語に翻訳し、翻訳後の音声データを送信元の電話装置に返送する翻訳サービスを提供するサーバなどに本発明を適用することもできる。この場合、より正確な翻訳がおこなえるよう、電話装置からサーバへの音声データの送信にはコネクション型プロトコルを用い、翻訳後の音声データは通常の音声通話と同様にコネクションレス型プロトコルを用いるようにプロトコル制御をおこなうことで、用途に応じて良好な音声データを送受することができる。   In the above embodiment, an example in which the present invention is applied to a mobile communication terminal is shown. However, any communication device having an IP telephone function may be used. For example, the present invention is applied to a fixed IP telephone. Also good. In addition, the present invention may be applied to an information processing apparatus that processes voice information. For example, the voice transmitted from the telephone device is translated into another language, and the translated voice data is returned to the transmission source telephone device. The present invention can also be applied to a server that provides a translation service. In this case, a connection type protocol is used for transmission of voice data from the telephone device to the server so that more accurate translation can be performed, and a connectionless type protocol is used for the translated voice data in the same way as a normal voice call. By performing protocol control, it is possible to send and receive good audio data according to the application.

なお、上記実施形態で示した各プロトコルは一例であり、コネクションレス型通信やコネクション型通信を実現できるものであれば、上述したプロトコルに限られず、任意のものを用いてもよい。   In addition, each protocol shown in the said embodiment is an example, and if it can implement | achieve connectionless type communication or connection type communication, it will not be restricted to the protocol mentioned above, You may use arbitrary things.

また、本発明を適用できる通信装置は、上記実施形態に示したような、本発明にかかる機能や構成を予め備えた装置として提供できることはもとより、上述したプログラムと同様のプログラムを適用することで、既存の通信装置を本発明にかかる通信装置として機能させることもできる。   In addition, the communication apparatus to which the present invention can be applied can be provided as an apparatus having the functions and configurations according to the present invention as shown in the above embodiment, and also by applying a program similar to the above-described program. The existing communication device can also function as the communication device according to the present invention.

この場合、上記実施形態の移動体通信端末100で実行されたようなプログラムを、IP電話機能を有する既存の通信装置に適用(インストール)し、当該通信装置を制御するコンピュータ(CPUなど)がこれを実行することで、上述した移動体通信端末100と同様の機能を有する通信装置を実現することができる。   In this case, a computer (CPU or the like) that controls (applies to) an existing communication device having an IP telephone function by applying (installing) the program as executed by the mobile communication terminal 100 of the above embodiment. By executing the above, it is possible to realize a communication device having the same function as the mobile communication terminal 100 described above.

このようなプログラムの配布方法は任意であり、CD−ROMやメモリカードなどの記録媒体に格納して配布可能な他、インターネットなどのネットワークを介して配布してもよい。   Such a program distribution method is arbitrary. In addition to being able to be stored and distributed in a recording medium such as a CD-ROM or a memory card, the program may be distributed via a network such as the Internet.

本発明の実施形態にかかる音声通信システムの構成を示す図である。It is a figure which shows the structure of the audio | voice communication system concerning embodiment of this invention. 図1に示す移動体通信端末のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the mobile communication terminal shown in FIG. 図1に示す通話録音端末の制御部によって実現される機能構成を示すブロック図である。It is a block diagram which shows the function structure implement | achieved by the control part of the call recording terminal shown in FIG. 図1に示す通話相手端末の制御部によって実現される機能構成を示すブロック図である。It is a block diagram which shows the function structure implement | achieved by the control part of the other party terminal shown in FIG. 図1に示す通話録音端末と通話相手端末間の音声通話の手順を説明するためのシーケンスチャートである。It is a sequence chart for demonstrating the procedure of the voice call between the call recording terminal shown in FIG. 1, and a calling party terminal. 図1に示す通話録音端末で通話録音を開始したときの通話録音端末と通話相手端末間の通信手順を説明するためのシーケンスチャートである。It is a sequence chart for demonstrating the communication procedure between a call recording terminal and a call other party terminal when call recording is started with the call recording terminal shown in FIG. 図1に示す通話録音端末で通話録音を終了したときの通話録音端末と通話相手端末間の通信手順を説明するためのシーケンスチャートである。It is a sequence chart for demonstrating the communication procedure between a call recording terminal and a call other party terminal when call recording is complete | finished with the call recording terminal shown in FIG. 図1に示す通話録音端末で実行される「通話録音処理」を説明するためのフローチャートである。3 is a flowchart for explaining “call recording processing” executed by the call recording terminal shown in FIG. 1. 図1に示す通話相手端末で実行される「プロトコル制御処理」を説明するためのフローチャートである。3 is a flowchart for explaining a “protocol control process” executed in the call partner terminal shown in FIG. 1.

符号の説明Explanation of symbols

1…音声通信システム、IN…パケット交換網(IP網)、SS…呼制御装置(SIPサーバ)、MN…移動体通信網(セルラ網)、BS…基地局、100…移動体通信端末、100A…通話録音端末、100B…通話相手端末、110…制御部、111…IP電話処理部、112…受話音声処理部、113…送話音声処理部、114A…通話録音処理部、114B…要求判別部、115A…プロトコル制御要求部、115B…プロトコル制御部、116A…録音用受話音声処理部、116B…コネクション型送信処理部、117A…録音データ生成部、117B…誤り訂正処理部、120…通信制御部、121…アンテナ、130…操作部、140…表示部、150…音声処理部、151…スピーカ、152…マイクロフォン、160…記憶部、161A…受話バッファ領域、162A…送話バッファ領域、162B…送話バッファ領域、163A…録音データ格納領域、164…プログラム格納領域 DESCRIPTION OF SYMBOLS 1 ... Voice communication system, IN ... Packet switching network (IP network), SS ... Call control apparatus (SIP server), MN ... Mobile communication network (cellular network), BS ... Base station, 100 ... Mobile communication terminal, 100A ... Call recording terminal, 100B ... Call partner terminal, 110 ... Control unit, 111 ... IP phone processing unit, 112 ... Received voice processing unit, 113 ... Transmitted voice processing unit, 114A ... Call recording processing unit, 114B ... Request discrimination unit 115A ... Protocol control request unit, 115B ... Protocol control unit, 116A ... Recording received voice processing unit, 116B ... Connection type transmission processing unit, 117A ... Recording data generation unit, 117B ... Error correction processing unit, 120 ... Communication control unit 121 ... Antenna, 130 ... Operation unit, 140 ... Display unit, 150 ... Audio processing unit, 151 ... Speaker, 152 ... Microphone, 160 ... Parts, 161A ... received buffer area, 162A ... sending buffer area, 162B ... sending buffer area, 163A ... recording data storage area, 164 ... program storage area

Claims (8)

IP電話機能を有する通信装置において、
コネクションレス型プロトコルで前記IP電話機能の音声通信をおこなう音声通信手段と、
前記音声通信手段による音声通信の録音が指示されたことを契機に、前記音声通信手段が通信している相手装置に、前記コレクションレス型プロトコルでの音声データ送信とコネクション型プロトコルでの音声データ送信とを要求する要求手段と、
前記要求手段による要求に応じて前記コネクション型プロトコルで送信された音声データを用いて録音データを生成する録音データ生成手段と、
前記録音データ生成手段が生成した録音データを格納する録音データ格納手段と、
を備えることを特徴とする通信装置。
In a communication device having an IP telephone function,
Voice communication means for performing voice communication of the IP telephone function using a connectionless protocol;
When the recording of voice communication by the voice communication means is instructed, voice data transmission using the collectionless protocol and voice data transmission using the connection protocol are transmitted to the counterpart device with which the voice communication means is communicating. Request means for requesting, and
Recording data generation means for generating recording data using voice data transmitted by the connection type protocol in response to a request by the request means;
Recording data storage means for storing the recording data generated by the recording data generation means;
A communication apparatus comprising:
前記録音データ格納手段は、
前記通信装置からの送話音声データを一時格納する送話バッファと、
前記相手装置から前記コネクション型プロトコルで送信された受話音声データを一時格納する受話バッファと、をさらに備え、
前記録音データ生成手段は、前記送話バッファに一時格納された送話音声データと、前記受話バッファに一時格納された受話音声データとを合成して前記録音データを生成する、
ことを特徴とする請求項1に記載の通信装置。
The recorded data storage means includes
A transmission buffer for temporarily storing transmission voice data from the communication device;
A reception buffer for temporarily storing received voice data transmitted from the counterpart apparatus using the connection-type protocol;
The recording data generating means generates the recording data by synthesizing the transmission voice data temporarily stored in the transmission buffer and the reception voice data temporarily stored in the reception buffer.
The communication apparatus according to claim 1.
前記通信装置は、移動体通信端末である、
ことを特徴とする請求項1または2に記載の通信装置。
The communication device is a mobile communication terminal.
The communication apparatus according to claim 1 or 2, wherein
IP電話機能を有する通信装置において、
前記IP電話機能の音声通信をコネクションレス型プロトコルでおこなうコネクションレス型通信手段と、
前記コネクションレス型通信手段が通信している相手装置からの要求に応じて、前記コネクションレス型通信手段が送信する音声データを、前記コネクションレス型プロトコルとコネクション型プロトコルで前記相手装置に送信するコネクション型通信手段と、
を備えることを特徴とする通信装置。
In a communication device having an IP telephone function,
A connectionless communication means for performing voice communication of the IP telephone function using a connectionless protocol;
A connection for transmitting voice data transmitted by the connectionless communication unit to the partner device using the connectionless protocol and a connection protocol in response to a request from the partner device with which the connectionless communication unit is communicating. Type communication means;
A communication apparatus comprising:
前記コネクション型通信手段は、
前記相手装置で通話録音が実行されたことを契機に送信された要求に応じて前記コネクション型プロトコルでの音声データ送信を開始し、
前記通話録音が終了したことを契機に前記相手装置から送信された要求に応じて前記コネクション型プロトコルでの音声データ送信を終了する、
ことを特徴とする請求項4に記載の通信装置。
The connection type communication means includes:
In response to a request transmitted when call recording is executed in the partner device, voice data transmission in the connection type protocol is started,
Ending voice data transmission in the connection-type protocol in response to a request sent from the counterpart device upon completion of the call recording;
The communication apparatus according to claim 4.
前記通信装置は、移動体通信端末である、
ことを特徴とする請求項4または5に記載の通信装置。
The communication device is a mobile communication terminal.
The communication apparatus according to claim 4 or 5, wherein
IP電話機能を有する通信装置を制御するコンピュータに、
コネクションレス型プロトコルで前記IP電話機能の音声通信をおこなう機能と、
前記音声通信の録音が指示されたことを契機に、前記音声通信をおこなっている相手装置に、前記コレクションレス型プロトコルでの音声データ送信とコネクション型プロトコルでの音声データ送信とを要求する機能と、
前記要求に応じて前記コネクション型プロトコルで送信された音声データを用いて録音データを生成する機能と、
生成した録音データを記憶装置に格納する機能と、
を実現させることを特徴とするプログラム。
A computer that controls a communication device having an IP telephone function;
A function of performing voice communication of the IP telephone function using a connectionless protocol;
A function for requesting voice data transmission in the collectionless protocol and voice data transmission in the connection-type protocol to the counterpart device performing the voice communication in response to an instruction to record the voice communication; ,
A function of generating recording data using voice data transmitted by the connection-type protocol in response to the request;
A function to store the generated recording data in a storage device;
A program characterized by realizing.
IP電話機能を有する通信装置を制御するコンピュータに、
前記IP電話機能の音声通信をコネクションレス型プロトコルでおこなう機能と、
前記音声通信をおこなっている相手装置からの要求に応じて、前記相手装置に送信する音声データを、前記コネクションレス型プロトコルとコネクション型プロトコルで前記相手装置に送信する機能と、
を実現させることを特徴とするプログラム。
A computer that controls a communication device having an IP telephone function;
A function for performing voice communication of the IP telephone function using a connectionless protocol;
A function of transmitting voice data to be transmitted to the counterpart device in response to a request from the counterpart device performing the voice communication to the counterpart device using the connectionless protocol and a connection type protocol;
A program characterized by realizing.
JP2007071868A 2007-03-20 2007-03-20 Communication device and program Pending JP2008236286A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007071868A JP2008236286A (en) 2007-03-20 2007-03-20 Communication device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007071868A JP2008236286A (en) 2007-03-20 2007-03-20 Communication device and program

Publications (1)

Publication Number Publication Date
JP2008236286A true JP2008236286A (en) 2008-10-02

Family

ID=39908541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007071868A Pending JP2008236286A (en) 2007-03-20 2007-03-20 Communication device and program

Country Status (1)

Country Link
JP (1) JP2008236286A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011501929A (en) * 2007-10-19 2011-01-13 レベルヴォックス,エルエルシー Method and system for real-time media synchronization over a network

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011501929A (en) * 2007-10-19 2011-01-13 レベルヴォックス,エルエルシー Method and system for real-time media synchronization over a network

Similar Documents

Publication Publication Date Title
JP4422727B2 (en) Handover method and apparatus
US8588174B2 (en) Dual-mode device and method for handover of session from VOIP interface to cellular interface
US8243704B2 (en) Call control device, relay device, call control method, and storage medium
BRPI0614428B1 (en) METHOD FOR ASSOCIATION OF A PHONE CALL TO A CALLER, A METHOD FOR PROVIDING COMPUTER DIALOGUE IN ASSOCIATION WITH A COMPUTER CALL AND A COMPUTER-READABLE MEANS CONTAINING INSTRUCTIONS FOR A FIRST MIRROR
JP2006222822A (en) Handover system
US7496089B2 (en) Network, private branch exchange, and PBX additional service starting method
US20180255182A1 (en) Web Real-Time Client Communication Over a Stimulus Based Network
JP2007142786A (en) Handover server, and mobile communication terminal communcable thereof
US8107948B2 (en) Radio communication system, management server, radio communication terminal, and radio communication method
KR20080050044A (en) Session transfer method for mobile multimedia communications
US20080240088A1 (en) Mobile Body Communication System, Mobile Body Communication Method, and Mobile Body Communication Base Station Device
JP4371874B2 (en) Call holding tone output method and SIP server
JP2008236286A (en) Communication device and program
JP2008113381A (en) Communication system
JP4585480B2 (en) Telephone system and telephone exchange device
JP2006086557A (en) Selecting apparatus, converting apparatus, selecting method, converting method and computer program
JP2009005177A (en) Wireless communication device and server device
CN112866215B (en) Music playing method and equipment
JP6887596B2 (en) IP phone server device, its program and IP phone system
JP2010068087A (en) Group call control server
JP2005269165A (en) Ip phone
JP7340835B2 (en) Program, information processing method, and information processing device
JP2010141811A (en) Communication apparatus, mobile communication terminal, communication system, and method of communication
JP2016149671A (en) Call control processing system and call control processing method
JP2009060508A (en) Mobile telephone system, method of reducing power consumption in mobile telephone system, and external voice input and output device