JP2002374297A - Voice communication terminal and voice communication system - Google Patents

Voice communication terminal and voice communication system

Info

Publication number
JP2002374297A
JP2002374297A JP2001183061A JP2001183061A JP2002374297A JP 2002374297 A JP2002374297 A JP 2002374297A JP 2001183061 A JP2001183061 A JP 2001183061A JP 2001183061 A JP2001183061 A JP 2001183061A JP 2002374297 A JP2002374297 A JP 2002374297A
Authority
JP
Japan
Prior art keywords
data
audio data
feedback
audio
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001183061A
Other languages
Japanese (ja)
Inventor
Masato Yamazaki
真人 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2001183061A priority Critical patent/JP2002374297A/en
Publication of JP2002374297A publication Critical patent/JP2002374297A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephone Function (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a voice communication system that enables a user to be able to grasp conversation timing with the opposite party, even if voice transfer delay occurs and enables the user to be able to make communication with the opposite party by taking into account the voice transfer delay. SOLUTION: A voice communication terminal 1A is provided with a VOCOD ER 101A that encodes voice data XA, a data multiplexer 102A that multiplexes the data XA with feedback voice data FXB to generate multiplexed data MDA, a transmission line modulator 103A that modulates the data MDA and transmits the modulated data, a transmission line demodulator 109A that receives and demodulates multiplexed data MDB, a data distributor 108A that separates the data MDB into voice data XB and feedback voice data FXA, a voice decoder 107A that decodes the data XB, a feedback vocoder 104A, that re-encodes the data XB as the data FXB, a feedback voice decoder 105A that decodes the data FXA, and a gain controller 106A that mixes the data XB and the data FXA in accordance with a set ratio, and the voice communication terminal 1B, having the same configuration as that of the terminal 1A, is connected to the terminal 1A via a transmission line 2.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、VOIP(Voice
Over IP)などの音声通信システムおよびこのシステム
を構成する音声通信端末装置であって、音声の伝送遅延
について対策された音声通信システムおよび音声通信端
末装置(それぞれ、音声遅延対策システム、音声遅延対
策端末装置とも称する)に関する。
[0001] The present invention relates to a VOIP (Voice).
And a voice communication terminal device constituting the system, wherein the voice communication system and the voice communication terminal device are provided with a voice transmission delay countermeasure (a voice delay countermeasure system and a voice delay countermeasure terminal, respectively). Device).

【0002】[0002]

【従来の技術】VOIPシステムとは、従来の電話など
に用いられている一般交換機網(GSTN)ではなく、
コンピュータのネットワークシステムとして広まりつつ
あるインターネットを用い、コンピュータのネットワー
クプロトコル(IP)で音声データを伝送するための技
術である。このVOIPシステムでは、音声をディジタ
ル符号化し、圧縮した音声データをパケットで伝送し、
無音声時は送らないなどの手法を用いることで、通常の
電話に比べて伝送路の使用効率がよいなどのメリットが
ある。
2. Description of the Related Art A VOIP system is not a general exchange network (GSTN) used for conventional telephones and the like.
This is a technique for transmitting voice data using a computer network protocol (IP) using the Internet that is becoming widespread as a computer network system. In this VOIP system, voice is digitally encoded, and compressed voice data is transmitted in packets.
The use of a technique such as not transmitting when there is no voice has advantages such as better use of the transmission path compared to a normal telephone.

【0003】[0003]

【発明が解決しようとする課題】上記のVOIPシステ
ムでは、従来の一般交換機網とは異なり、音声をディジ
タル符号化し、それをパケットとして、インターネット
網を用いて相手側に伝送し、復号して音声に戻すが、イ
ンターネット網は、もともとリアルタイム性を求めない
ネットワークとして発展してきたものであり、ルーティ
ングをユーザー側が選択できないものなので、符号復号
遅延に加えてパケットの伝送遅延が発生し、これにより
かなりの音声転送遅延(話した音声が相手の耳に届くま
での遅延)が発生する。また、伝送路によってはパケッ
トの伝送遅延の揺らぎを生じ、これにより音声転送遅延
に揺らぎが発生することがある。この音声転送遅延によ
り、通常の会話のように相手の音声を瞬間に聞くことが
できず、また自分の音声を相手が聞くタイミングを把握
できないので、音声が遅延してもそれをそれを考慮して
会話することができず、会話をしずらい、あるいは会話
が成立しないという問題があった。このようにVOIP
システムは、利用形態として問題がある音声通信システ
ムであった。
In the above-mentioned VOIP system, unlike the conventional general exchange network, the voice is digitally encoded, transmitted as a packet to the other party using the Internet network, decoded, and decoded. However, since the Internet network was originally developed as a network that does not require real-time properties, and the user side cannot select the routing, packet transmission delays occur in addition to code decoding delays. A voice transfer delay (a delay until the spoken voice reaches the other party's ear) occurs. Also, depending on the transmission path, fluctuations in packet transmission delay may occur, which may cause fluctuations in the voice transfer delay. Because of this voice transfer delay, it is not possible to hear the other party's voice instantly as in a normal conversation, and it is not possible to grasp the timing at which the other party listens to their own voice. There was a problem that it was difficult to have a conversation, or the conversation was not established. Thus VOIP
The system was a voice communication system that had problems in usage.

【0004】本発明は、このような従来の問題を解決す
るためになされたものであり、音声転送遅延が発生して
も相手との会話のタイミングを把握でき、音声転送遅延
を考慮して会話することができる音声通信端末装置およ
び音声通信システムを提供することを目的とするもので
ある。
The present invention has been made to solve such a conventional problem. Even when a voice transfer delay occurs, the timing of a conversation with a partner can be grasped, and the voice transfer is considered in consideration of the voice transfer delay. It is an object of the present invention to provide a voice communication terminal device and a voice communication system that can perform the communication.

【0005】[0005]

【課題を解決するための手段】上記の目的を達成するた
めに本発明の請求項1記載の音声通信端末装置は、入力
された第1の音声データを含む第1の多重化データを生
成して送信するとともに、相手側から送信された含む第
2の多重化データを受信して第2の音声データを出力す
る通信端末装置において、第1の音声データを符号化す
る符号化手段と、符号化された第1の音声データと相手
側にフィードバックするために再符号化された第2の音
声データである第2のフィードバック音声データとを多
重化し、第1の多重化データを生成する多重化手段と、
第1の多重化データを伝送仕様に応じて変調し、送信す
る変調手段と、変調された第2の多重化データを受信し
て復調する復調手段と、復調された第2の多重化データ
を符号化された第2の音声データと符号化された第1の
フィードバック音声データとに分離する分配手段と、分
離された第2の音声データを復号する復号化手段と、復
号された第2の音声データを第2のフィードバック音声
データとして再符号化するフィードバック符号化手段
と、分離された第1のフィードバック音声データを復号
するフィードバック復号化手段と、復号された第2の音
声データと復号された第1のフィードバック音声データ
とを設定された割合に従って混合する混合手段とを備え
たことを特徴とする。
According to a first aspect of the present invention, there is provided a voice communication terminal device for generating first multiplexed data including input first voice data. Encoding means for encoding the first audio data in a communication terminal device for transmitting and transmitting the second audio data and receiving the second multiplexed data including from the other party and outputting the second audio data; Multiplexing the multiplexed first audio data and the second feedback audio data, which is the second audio data re-encoded for feedback to the other party, to generate first multiplexed data Means,
A modulating means for modulating and transmitting the first multiplexed data according to the transmission specification, a demodulating means for receiving and demodulating the modulated second multiplexed data, and a demodulating means for demodulating the second multiplexed data. Distributing means for separating encoded second audio data and encoded first feedback audio data; decoding means for decoding the separated second audio data; Feedback encoding means for re-encoding the audio data as second feedback audio data, feedback decoding means for decoding the separated first feedback audio data, and the decoded second audio data and the decoded second audio data Mixing means for mixing the first feedback voice data with the set feedback ratio.

【0006】請求項2記載の音声通信端末装置は、入力
された第1の音声データを含む第1の多重化データを生
成して送信するとともに、相手側から送信された含む第
2の多重化データを受信して第2の音声データを出力す
る通信端末装置において、入力された第1の音声データ
を符号化する符号化手段と、符号化された第1の音声デ
ータと相手側にフィードバックするために遅延された符
号化された第2の音声データである第2のフィードバッ
ク音声データとを多重化し、第1の多重化データを生成
する多重化手段と、第1の多重化データを伝送仕様に応
じて変調し、送信する変調手段と、変調された第2の多
重化データを受信して復調する復調手段と、復調された
第2の多重化データを符号化された第2の音声データと
符号化された第1のフィードバック音声データとに分離
する分配手段と、分離された第2の音声データを復号す
る復号化手段と、分離された第1のフィードバック音声
データを復号するフィードバック復号化手段と、分離さ
れた第2の音声データを上記復号化手段においての第2
の音声データの復号化遅延量と上記符号化手段において
の第1の音声データの符号化遅延量の合計の遅延量だけ
遅延し、第2のフィードバック音声データとして出力す
る遅延手段と、復号された第2の音声データと復号され
た第1のフィードバック音声データとを設定された割合
に従って混合する混合手段とを備えたことを特徴とす
る。
According to a second aspect of the present invention, the voice communication terminal device generates and transmits first multiplexed data including the input first voice data, and includes the second multiplexed data transmitted from the other party. In a communication terminal device that receives data and outputs second audio data, an encoding unit that encodes the input first audio data, and feeds back the encoded first audio data and the other party. Multiplexing means for multiplexing the second feedback voice data, which is the coded second voice data delayed for generating the first multiplexed data, and transmitting the first multiplexed data to the transmission specification. And demodulation means for receiving and demodulating the modulated second multiplexed data, and second audio data obtained by encoding the demodulated second multiplexed data. The first coded Distribution means for separating the separated feedback audio data; decoding means for decoding the separated second audio data; feedback decoding means for decoding the separated first feedback audio data; Of the second audio data in the decoding means.
Delay means for delaying by a total delay amount of the decoding delay amount of the audio data and the encoding delay amount of the first audio data in the encoding means, and outputting as the second feedback audio data; Mixing means for mixing the second audio data and the decoded first feedback audio data according to a set ratio.

【0007】請求項3記載の音声通信システムは、伝送
路を介して相互に接続される請求項1記載の複数の音声
通信端末装置、あるいは伝送路を介して相互に接続され
る請求項2記載の複数の音声通信端末装置、あるいは伝
送路を介して相互に接続される請求項1記載の1つまた
は複数の音声通信端末装置および請求項2記載の1つま
たは複数の音声通信端末装置を備え、上記第1のフィー
ドバック音声データが、相手側で復号および再符号化さ
れて相手側からフィードバックされた第1の音声データ
であることを特徴とする。
The voice communication system according to claim 3 is connected to each other via a transmission line, and the voice communication terminals are connected to each other via a transmission line. A plurality of voice communication terminal devices, or one or more voice communication terminal devices according to claim 1 and one or more voice communication terminal devices connected to each other via a transmission path. , Wherein the first feedback voice data is first voice data decoded and re-encoded by the other party and fed back from the other party.

【0008】請求項4記載の音声通信端末装置は、入力
された第1の音声データを含む第1の多重化データを生
成して送信するとともに、相手側から送信された含む第
2の多重化データを受信して第2の音声データを出力す
る通信端末装置において、第1の音声データを符号化す
るとともに、その第1の音声データに第1のインデック
スデータを割り当てる符号化手段と、符号化された第1
の音声データと第1のインデックスデータと相手側にフ
ィードバックするために遅延された第2のフィードバッ
クインデックスデータとを多重化し、第1の多重化デー
タを生成する多重化手段と、第1の多重化データを伝送
仕様に応じて変調し、送信する変調手段と、変調された
第2の多重化データを受信して復調する復調手段と、復
調された第2の多重化データを符号化された第2の音声
データと第2のインデックスデータと第1のフィードバ
ックインデックスデータとに分離する分配手段と、分離
された第2の音声データを復号する復号化手段と、分離
された第2のインデックスデータを上記復号化手段にお
いての第2の音声データの復号化遅延量と上記符号化手
段においての第1の音声データの符号化遅延量の合計の
遅延量だけ遅延し、第2のフィードバックインデックス
データとして出力する遅延手段と、分離された第1のフ
ィードバックインデックスデータを上記復号化手段にお
いての第2の音声データの復号化遅延量だけ遅延するフ
ィードバック遅延手段と、第1の音声データおよびその
第1の音声データに割り当てられた第1のインデックス
データを保持しておき、遅延された第1のフィードバッ
クインデックスデータが上記フィードバック遅延手段か
ら出力されるタイミングで、その第1のフィードバック
インデックスデータに相当する第1のインデックスデー
タが割り当てられた第1の音声データを出力するバッフ
ァ手段と、復号された第2の音声データと上記バッファ
手段から出力された第1の音声データとを設定された割
合に従って混合する混合手段とを備えたことを特徴とす
る。
According to a fourth aspect of the present invention, the voice communication terminal device generates and transmits first multiplexed data including the input first voice data, and includes the second multiplexed data transmitted from the other party. A communication terminal device for receiving data and outputting second audio data, encoding means for encoding the first audio data and assigning first index data to the first audio data; The first
Multiplexing means for multiplexing the first audio data, the first index data, and the second feedback index data delayed for feedback to the other party, and generating first multiplexed data; A modulating means for modulating and transmitting the data according to the transmission specification, a demodulating means for receiving and demodulating the modulated second multiplexed data, and a demodulating means for modulating the demodulated second multiplexed data. Distributing means for separating the second audio data, the second index data, and the first feedback index data, decoding means for decoding the separated second audio data, and Delay by a total delay amount of the decoding delay amount of the second audio data in the decoding unit and the encoding delay amount of the first audio data in the encoding unit. Delay means for outputting as second feedback index data, feedback delay means for delaying the separated first feedback index data by a decoding delay amount of the second audio data in the decoding means, The voice data and the first index data allocated to the first voice data are held, and the first feedback index data is output at the timing when the delayed first feedback index data is output from the feedback delay unit. A buffer for outputting first audio data to which first index data corresponding to the index data is assigned; a second decoded audio data and a first audio data output from the buffer; Mixing means for mixing according to the specified ratio. Characterized in that was.

【0009】請求項5記載の音声通信システムは、伝送
路を介して相互に接続される請求項3記載の複数の音声
通信端末装置を備え、上記第1のフィードバックインデ
ックスデータが、相手側において第1の音声データの復
号化遅延量および第2の音声データの符号化遅延量の合
計の遅延量だけ遅延されて相手側からフィードバックさ
れた第1のインデックスデータであり、上記第2のイン
デックスデータが、相手側において第2の音声データに
割り当てられたものであることを特徴とする。
According to a fifth aspect of the present invention, there is provided a voice communication system comprising a plurality of voice communication terminals connected to each other via a transmission path, wherein the first feedback index data is transmitted to the other side on the other side. 1 is the first index data which is delayed by the total delay amount of the decoding delay amount of the audio data and the encoding delay amount of the second audio data and fed back from the other party, and the second index data is , Which is assigned to the second voice data on the other side.

【0010】請求項6記載の音声通信端末装置は、入力
された第1の音声データを含む第1の多重化データを生
成して送信するとともに、相手側から送信された含む第
2の多重化データを受信して第2の音声データを出力す
る通信端末装置において、第1の音声データを符号化す
るとともに、その符号化した第1の音声データに第1の
インデックスデータを割り当てる符号化手段と、符号化
された第1の音声データと第1のインデックスデータと
相手側にフィードバックするために遅延された第2のフ
ィードバックインデックスデータとを多重化し、第1の
多重化データを生成する多重化手段と、第1の多重化デ
ータを伝送仕様に応じて変調し、送信する変調手段と、
変調された第2の多重化データを受信して復調する復調
手段と、復調された第2の多重化データを符号化された
第2の音声データと第2のインデックスデータと第1の
フィードバックインデックスデータとに分離する分配手
段と、分離された第2の音声データを復号する復号化手
段と、分離された第2のインデックスデータを上記復号
化手段においての第2の音声データの復号化遅延量と上
記符号化手段においての第1の音声データの符号化遅延
量の合計の遅延量だけ遅延し、第2のフィードバックイ
ンデックスデータとして出力する遅延手段と、符号化さ
れた第1の音声データおよびその符号化された第1の音
声データに割り当てられた第1のインデックスデータを
保持しておき、第1のフィードバックインデックスデー
タが上記分配手段から出力されるタイミングで、その第
1のフィードバックインデックスデータに相当する第1
のインデックスデータが割り当てられた符号化された第
1の音声データを出力するバッファ手段と、上記バッフ
ァ手段から出力された第1の音声データを復号するフィ
ードバック復号化手段と、復号された第2の音声データ
と復号された第1の音声データとを設定された割合に従
って混合する混合手段とを備えたことを特徴とする。
According to a sixth aspect of the present invention, the voice communication terminal device generates and transmits first multiplexed data including the input first voice data, and includes the second multiplexed data transmitted from the other party. Encoding means for encoding the first audio data and assigning the first index data to the encoded first audio data in a communication terminal device for receiving the data and outputting the second audio data; Multiplexing means for multiplexing the encoded first audio data, the first index data, and the second feedback index data delayed for feedback to the other party to generate first multiplexed data Modulation means for modulating and transmitting the first multiplexed data according to the transmission specification,
Demodulation means for receiving and demodulating the modulated second multiplexed data; second audio data, second index data, and first feedback index obtained by encoding the demodulated second multiplexed data; Distribution means for separating the data into data, decoding means for decoding the separated second audio data, and a decoding delay amount of the second audio data in the decoding means for converting the separated second index data into the second index data Delay means for delaying by a total delay amount of the encoding delay amount of the first audio data in the encoding means, and outputting the result as second feedback index data; The first index data allocated to the encoded first audio data is held, and the first feedback index data is stored in the distribution unit. At a timing et output, first corresponding to the first feedback index data
Buffer means for outputting the encoded first audio data to which the index data is assigned, feedback decoding means for decoding the first audio data output from the buffer means, and the decoded second audio data. Mixing means for mixing the audio data and the decoded first audio data in accordance with a set ratio.

【0011】請求項7記載の音声通信システムは、伝送
路を介して相互に接続される請求項5記載の複数の音声
通信端末装置を備え、上記第1のフィードバックインデ
ックスデータが、相手側において第1の音声データの復
号化遅延量および第2の音声データの符号化遅延量の合
計の遅延量だけ遅延されて相手側からフィードバックさ
れた第1のインデックスデータであり、上記第2のイン
デックスデータが、相手側において符号化された第2の
音声データに割り当てられたものであることを特徴とす
る。
According to a seventh aspect of the present invention, there is provided a voice communication system comprising a plurality of voice communication terminals connected to each other via a transmission path, wherein the first feedback index data is transmitted to a third party on the other end. 1 is the first index data which is delayed by the total delay amount of the decoding delay amount of the audio data and the encoding delay amount of the second audio data and fed back from the other party, and the second index data is , Which is assigned to the encoded second audio data on the other side.

【0012】[0012]

【発明の実施の形態】第1の実施の形態 図1は本発明の第1の実施の形態の音声遅延対策システ
ムを示すブロック構成図である。図1では、端末装置1
Aと端末装置1Bとが伝送路2を介して接続しており、
端末装置1Aと端末装置1Bと伝送路2によって上記の
音声遅延対策システムが構成されている。
DESCRIPTION OF THE PREFERRED EMBODIMENTS First Embodiment FIG. 1 is a block diagram showing a voice delay countermeasure system according to a first embodiment of the present invention. In FIG. 1, the terminal device 1
A and the terminal device 1B are connected via the transmission line 2,
The terminal device 1A, the terminal device 1B, and the transmission line 2 constitute the above-described audio delay countermeasure system.

【0013】端末装置1Aは、音声符号化器101A
と、データ多重化器102Aと、伝送路変調器103A
と、フィードバック音声符号化器104Aと、フィード
バック音声復号化器105Aと、ゲインコントローラ1
06Aと、音声復号化器107Aと、データ分配器10
8Aと、伝送路復調器109Aと、音声データ入力端子
IN1Aと、ゲイン設定データ入力端子IN2Aと、音
声データ出力端子OUTAとを備える。
The terminal device 1A includes a speech encoder 101A.
, A data multiplexer 102A, and a transmission line modulator 103A.
, Feedback speech encoder 104A, feedback speech decoder 105A, and gain controller 1
06A, the speech decoder 107A, and the data distributor 10A.
8A, a transmission line demodulator 109A, an audio data input terminal IN1A, a gain setting data input terminal IN2A, and an audio data output terminal OUTA.

【0014】また、端末装置1Bは、音声符号化器10
1Bと、データ多重化器102Bと、伝送路変調器10
3Bと、フィードバック音声符号化器104Bと、フィ
ードバック音声復号化器105Bと、ゲインコントロー
ラ106Bと、音声復号化器107Bと、データ分配器
108Bと、伝送路復調器109Bと、音声データ入力
端子IN1Bと、ゲイン設定データ入力端子IN2B
と、音声データ出力端子OUTBとを備える。
The terminal device 1B includes a speech encoder 10
1B, the data multiplexer 102B, and the transmission line modulator 10
3B, a feedback speech encoder 104B, a feedback speech decoder 105B, a gain controller 106B, a speech decoder 107B, a data distributor 108B, a transmission path demodulator 109B, and a speech data input terminal IN1B. , Gain setting data input terminal IN2B
And an audio data output terminal OUTB.

【0015】図1の端末装置1Aの構成および動作につ
いて以下に説明する。なお、端末装置1Aと端末装置1
Bは同じ構成である。また、端末装置1Aの音声符号化
器101Aと端末装置1Bの音声符号化器101B、端
末装置1Aのデータ多重化器102Aと端末装置1Bの
データ多重化器102Bなどは同じ構成である。以下の
端末装置1Aの構成および動作の説明において、それぞ
れの符号をかっこ内の符号に置き換えたものは、図1の
端末装置1Bの構成および動作の説明である。
The configuration and operation of the terminal device 1A shown in FIG. 1 will be described below. The terminal device 1A and the terminal device 1
B has the same configuration. The speech encoder 101A of the terminal device 1A and the speech encoder 101B of the terminal device 1B, the data multiplexer 102A of the terminal device 1A and the data multiplexer 102B of the terminal device 1B have the same configuration. In the following description of the configuration and operation of the terminal device 1A, those in which the reference numerals are replaced with those in parentheses are descriptions of the configuration and operation of the terminal device 1B in FIG.

【0016】入力端子IN1A(IN1B)には音声デ
ータXA(XB)が入力され、この音声データXA(X
B)は音声符号化器101A(101A)に入力され
る。
The audio data XA (XB) is input to the input terminal IN1A (IN1B), and the audio data XA (XB)
B) is input to the speech encoder 101A (101A).

【0017】音声符号化器101A(101B)は、入
力された音声データXA(XB)を符号化し、データ多
重化器102A(102B)に出力する。上記の符号化
には、伝送路2を効率的に使用するための音声圧縮など
の処理を含む。
The audio encoder 101A (101B) encodes the input audio data XA (XB) and outputs the encoded data to the data multiplexer 102A (102B). The above-described encoding includes processing such as audio compression for efficiently using the transmission path 2.

【0018】データ多重化器102A(102B)は、
符号化された音声データXA(XB)と、フィードバッ
ク音声符号化器104A(104B)からのフィードバ
ック音声データFXB(FXA)とを多重化し、伝送路
変調器103A(103B)に出力する。
The data multiplexer 102A (102B)
The coded audio data XA (XB) and the feedback audio data FXB (FXA) from the feedback audio encoder 104A (104B) are multiplexed and output to the transmission line modulator 103A (103B).

【0019】伝送路変調器103A(103B)は、多
重されたデータMDA(MDB)をフォーマット変換
し、伝送路2に送出する。上記のフォーマット変換は、
TCP/IPに代表される伝送路2で用いられるフォー
マットに変換するものであり、パケット化などを含む。
The transmission line modulator 103A (103B) converts the format of the multiplexed data MDA (MDB) and sends it out to the transmission line 2. The above format conversion is
It is converted into a format used in the transmission path 2 represented by TCP / IP, and includes packetization and the like.

【0020】伝送路復調器109A(109B)は、端
末装置1B(1A)から伝送路2に送出された多重化さ
れたデータMDB(MDA)を受信し、端末装置1B
(1A)の伝送路変調器103B(103A)でなされ
たフォーマット変換の逆変換を施し、データ分配器10
8A(108B)に出力する。
The transmission line demodulator 109A (109B) receives the multiplexed data MDB (MDA) transmitted to the transmission line 2 from the terminal device 1B (1A), and
The data distributor 10B performs an inverse conversion of the format conversion performed by the transmission line modulator 103B (103A) in (1A).
8A (108B).

【0021】データ分配器108A(108B)は、多
重化されたデータMDB(MDA)を、符号化された音
声データXB(XA)と、符号化されたフィードバック
音声データFXA(FXB)とに分離し、音声データX
B(XA)を音声復号化器107A(107B)に出力
し、フィードバック音声データFXA(FXB)をフィ
ードバック音声復号化器105A(105B)に出力す
る。
The data distributor 108A (108B) separates the multiplexed data MDB (MDA) into coded voice data XB (XA) and coded feedback voice data FXA (FXB). , Audio data X
B (XA) is output to audio decoder 107A (107B), and feedback audio data FXA (FXB) is output to feedback audio decoder 105A (105B).

【0022】音声復号化器107Aは、符号化された音
声データXB(XB)を復号し、ゲインコントローラ1
06A(106B)およびフィードバック音声符号化器
104A(104B)に出力する。
The audio decoder 107A decodes the encoded audio data XB (XB), and
06A (106B) and the feedback speech encoder 104A (104B).

【0023】フィードバック音声符号化器104A(1
04B)は、音声データXB(XA)を再び符号化し、
フィードバック音声データFXB(FXA)としてデー
タ多重化器102A(102B)に出力する。
The feedback speech encoder 104A (1
04B) encodes the audio data XB (XA) again,
The data is output to the data multiplexer 102A (102B) as feedback voice data FXB (FXA).

【0024】フィードバック音声復号化器105A(1
05B)は、符号化されたフィードバック音声データF
XA(FXB)を復号し、ゲインコントローラ106A
(106B)に出力する。
The feedback speech decoder 105A (1
05B) is the encoded feedback audio data F
XA (FXB) is decoded and gain controller 106A is decoded.
(106B).

【0025】入力端子IN2A(IN2B)にはゲイン
設定データrA(rB)が入力され、このゲイン設定デ
ータrA(rB)はゲインコントローラ106A(10
6A)に入力される。
The gain setting data rA (rB) is input to the input terminal IN2A (IN2B), and the gain setting data rA (rB) is input to the gain controller 106A (10
6A).

【0026】ゲインコントローラ106Aは、端末装置
1Bから送信された音声データXB、および端末装置1
Bからフィードバックされた端末装置1Aの音声データ
であるフィードバック音声データFXAを、ゲイン設定
データrAに応じた割合で混合し、例えば出力音声デー
タrA・XB+{(1−rA)FXA}を出力端子OU
TAから出力する。ただし、0≦rA≦1である。な
お、端末装置1Bのゲインコントローラ106Bは、端
末装置1Aから送信された音声データXA、および端末
装置1Aからフィードバックされた端末装置1Bの音声
データであるフィードバック音声データFXBを、ゲイ
ン設定データrBに応じた割合で混合し、例えば出力音
声データrB・XA+{(1−rB)FXB}を出力端
子OUTBから出力する。ただし、0≦rB≦1であ
る。
The gain controller 106A receives the audio data XB transmitted from the terminal device 1B,
Feedback audio data FXA, which is audio data of the terminal device 1A fed back from B, is mixed at a ratio according to the gain setting data rA, and for example, output audio data rA.XB + {(1-rA) FXA} is output to the output terminal OU.
Output from TA. However, 0 ≦ rA ≦ 1. The gain controller 106B of the terminal device 1B converts the audio data XA transmitted from the terminal device 1A and the feedback audio data FXB, which is the audio data of the terminal device 1B fed back from the terminal device 1A, according to the gain setting data rB. The output audio data rB.XA + {(1-rB) FXB} is output from the output terminal OUTB. However, 0 ≦ rB ≦ 1.

【0027】図2はゲインコントローラ106Aの構成
の一例を示す図である。なお、端末装置1Bのゲインコ
ントローラ106Bは、端末装置1Aのゲインコントロ
ーラ106Aと同じ内部構成である。図2のそれぞれの
符号および図2についての以下の説明のそれぞれの符号
をかっこ内の符号に置き換えたものは、ゲインコントロ
ーラ106Bの構成の一例となる。
FIG. 2 is a diagram showing an example of the configuration of the gain controller 106A. The gain controller 106B of the terminal device 1B has the same internal configuration as the gain controller 106A of the terminal device 1A. Each of the reference numerals in FIG. 2 and the following description of FIG. 2 in which each reference numeral is replaced with a reference in parentheses is an example of the configuration of the gain controller 106B.

【0028】図2において、ゲインコントローラ106
A(106B)は、乗算器201,202と、加算器2
03と、入力端子in1,in2と、出力端子outと
を備える。入力端子in1は図1の音声復号化器107
A(107B)の出力に接続され、入力端子in2は図
1のフィードバック音声符号化器104A(104B)
の出力に接続され、入力端子in3は図1のゲイン設定
データ入力端子IN2A(IN2B)に接続され、出力
端子outは図1の音声データ出力端子OUTA(OU
TB)に接続されている。
In FIG. 2, the gain controller 106
A (106B) includes multipliers 201 and 202 and an adder 2
03, input terminals in1 and in2, and an output terminal out. The input terminal in1 is connected to the audio decoder 107 in FIG.
A (107B), and the input terminal in2 is connected to the feedback speech encoder 104A (104B) of FIG.
The input terminal in3 is connected to the gain setting data input terminal IN2A (IN2B) in FIG. 1, and the output terminal out is connected to the audio data output terminal OUTA (OU) in FIG.
TB).

【0029】乗算器201は、端子in1に入力された
端末装置1Bからの音声データXBと、端子in3に入
力されたゲイン設定データrAとを乗算し、rA・XB
を加算器203に出力する。なお、ゲインコントローラ
106Bの乗算器201は、端子in1に入力された端
末装置1Aからの音声データXAと、端子in3に入力
されたゲイン設定データrBとを乗算し、rB・XAを
加算器203に出力する。
The multiplier 201 multiplies the audio data XB from the terminal device 1B input to the terminal in1 by the gain setting data rA input to the terminal in3, and obtains rA · XB
Is output to the adder 203. The multiplier 201 of the gain controller 106B multiplies the audio data XA from the terminal device 1A input to the terminal in1 by the gain setting data rB input to the terminal in3, and adds rB · XA to the adder 203. Output.

【0030】乗算器202は、端子in2に入力された
フィードバック音声データFXAと、(1−rA)とを
乗算し、(1−rA)FXAを加算器203に出力す
る。なお、ゲインコントローラ106Bの乗算器202
は、端子in2に入力されたフィードバック音声データ
FXBと、(1−rB)とを乗算し、(1−rB)FX
Bを加算器203に出力する。
The multiplier 202 multiplies the feedback voice data FXA input to the terminal in2 by (1-rA) and outputs (1-rA) FXA to the adder 203. The multiplier 202 of the gain controller 106B
Multiplies the feedback voice data FXB input to the terminal in2 by (1-rB), and obtains (1-rB) FX
B is output to the adder 203.

【0031】加算器203は、上記のrA・XBと(1
−rA)FXAとを加算し、rA・XB+(1−rA)
FXAを端子outから出力する。このrA・XB+
(1−rA)FXAは、端末装置1Aの音声データ出力
端子OUTAから出力される音声データである。出力音
声データrA・XB+(1−rA)FXAは、rA=1
に設定されたときには、端末装置1Bから送信された音
声データXBのみとなり、rA=0に設定されたときに
は、端末装置1Bからフィードバックされた端末装置1
Aの音声データであるフィードバック音声データFXA
のみとなる。また、0<rA<1に設定された場合は、
そのゲイン設定データrAに応じた割合で音声データX
Bとフィードバック音声データFXAが混合される。な
お、ゲインコントローラ106Bの加算器203は、r
B・XAと(1−rB)FXBとを加算し、rB・XA
+(1−rB)FXBを端子outから出力する。
The adder 203 calculates the above rA · XB and (1
−rA) FXA and add rA · XB + (1−rA)
FXA is output from the terminal out. This rA · XB +
(1-rA) FXA is audio data output from the audio data output terminal OUTA of the terminal device 1A. The output audio data rA · XB + (1−rA) FXA is rA = 1
Is set to only the audio data XB transmitted from the terminal device 1B, and when rA = 0, the terminal device 1B is fed back from the terminal device 1B.
Feedback audio data FXA which is audio data of A
Only. When 0 <rA <1 is set,
The audio data X at a rate corresponding to the gain setting data rA
B and the feedback audio data FXA are mixed. Note that the adder 203 of the gain controller 106B has r
B · XA and (1-rB) FXB are added, and rB · XA
+ (1-rB) FXB is output from the terminal out.

【0032】図1の音声遅延対策システムにおいての音
声データXAおよびXBの流れについて以下に説明す
る。
The flow of audio data XA and XB in the audio delay countermeasure system of FIG. 1 will be described below.

【0033】端末装置1Aに入力された音声データXA
は、符号化器101A、データ多重化器102A、伝送
路変調器103A、伝送路2、伝送路復調器109B、
データ分配器108B、音声復号化器107Bを経由
し、ゲインコントローラ106Bおよびフィードバック
音声符号化器104Bに入力される。ゲインコントロー
ラ106Bに入力された音声データXAは、フィードバ
ック音声データFXBと混合され、出力端子OUTBか
ら出力される。
The audio data XA input to the terminal device 1A
Are an encoder 101A, a data multiplexer 102A, a transmission line modulator 103A, a transmission line 2, a transmission line demodulator 109B,
The data is input to the gain controller 106B and the feedback speech encoder 104B via the data distributor 108B and the speech decoder 107B. The audio data XA input to the gain controller 106B is mixed with the feedback audio data FXB and output from the output terminal OUTB.

【0034】また、フィードバック音声符号化器104
Bに入力された音声データXAは、データ多重化器10
2B、伝送路変調器103B、伝送路2を経由して端末
装置1Aにフィードバックされる。このフィードバック
音声データFXAは、伝送路復調器109A、データ分
配器108A、フィードバック音声復号化器105Aを
経由し、ゲインコントローラ106Aに入力され、音声
データXBと混合され、出力端子OUTAから出力され
る。
Also, the feedback speech encoder 104
B is input to the data multiplexer 10.
2B, the transmission path modulator 103B, and the transmission path 2 are fed back to the terminal device 1A. The feedback audio data FXA is input to the gain controller 106A via the transmission path demodulator 109A, the data distributor 108A, and the feedback audio decoder 105A, mixed with the audio data XB, and output from the output terminal OUTA.

【0035】同じように、端末装置1Bに入力された音
声データXBは、符号化器101B、データ多重化器1
02B、伝送路変調器103B、伝送路2、伝送路復調
器109A、データ分配器108A、音声復号化器10
7Aを経由し、ゲインコントローラ106Aおよびフィ
ードバック音声符号化器104Aに入力される。ゲイン
コントローラ106Aに入力された音声データXBは、
フィードバック音声データFXAと混合され、出力端子
OUTAから出力される。
Similarly, the audio data XB input to the terminal device 1B is encoded by the encoder 101B and the data multiplexer 1B.
02B, transmission path modulator 103B, transmission path 2, transmission path demodulator 109A, data distributor 108A, speech decoder 10
The signal is input to gain controller 106A and feedback speech encoder 104A via 7A. The audio data XB input to the gain controller 106A is
It is mixed with the feedback audio data FXA and output from the output terminal OUTA.

【0036】また、フィードバック音声符号化器104
Aに入力された音声データXBは、データ多重化器10
2A、伝送路変調器103A、伝送路2を経由して端末
装置1Bにフィードバックされる。このフィードバック
音声データFXBは、伝送路復調器109B、データ分
配器108B、フィードバック音声復号化器105Bを
経由し、ゲインコントローラ106Bに入力され、音声
データXAと混合され、出力端子OUTBから出力され
る。
The feedback speech coder 104
The audio data XB input to A is transmitted to the data multiplexer 10.
The signal is fed back to the terminal device 1B via the transmission line modulator 103A and the transmission line modulator 2A. The feedback audio data FXB is input to the gain controller 106B via the transmission path demodulator 109B, the data distributor 108B, and the feedback audio decoder 105B, mixed with the audio data XA, and output from the output terminal OUTB.

【0037】ここで、音声符号化器101A,101
B、フィードバック音声符号化器104A,104Bの
データ入出力遅延時間をいずれもTaとし、データ多重
化器102Aと伝送路変調器103Aの合計のデータ遅
延時間、およびデータ多重化器102Bと伝送路変調器
103Bの合計のデータ遅延時間をいずれもTbとし、
伝送路2のデータ伝送遅延時間をTcとし、伝送路復調
器109Aとデータ分配器108Aの合計のデータ遅延
時間、および伝送路復調器109Bとデータ分配器10
8Bの合計のデータ遅延時間をいずれもTdとし、音声
復号化器107A,107B、フィードバック音声復号
化器105A,105のデータ入出力遅延時間をいずれ
もTeとする。また、Ta+Tb+Tc+Td+Te=
Tとする。
Here, the speech encoders 101A and 101A
B, the data input / output delay time of the feedback speech encoders 104A and 104B is Ta, the total data delay time of the data multiplexer 102A and the transmission line modulator 103A, and the data delay time of the data multiplexer 102B and the transmission line modulation The total data delay time of the device 103B is Tb,
The data transmission delay time of the transmission line 2 is defined as Tc, the total data delay time of the transmission line demodulator 109A and the data distributor 108A, and the transmission line demodulator 109B and the data distributor 10B.
The total data delay time of 8B is Td, and the data input / output delay times of the audio decoders 107A and 107B and the feedback audio decoders 105A and 105 are Te. Also, Ta + Tb + Tc + Td + Te =
Let it be T.

【0038】時刻t=0に端末装置1Aに入力された音
声データXA[0]は、時刻t=Tに端末装置1Bのゲ
インコントローラ106Bおよびフィードバック音声符
号化器104Bに入力され、端末装置1Bから出力され
る。
The voice data XA [0] input to the terminal device 1A at time t = 0 is input to the gain controller 106B and the feedback voice encoder 104B of the terminal device 1B at time t = T, and is output from the terminal device 1B. Is output.

【0039】フィードバック音声符号化器104Bに入
力された音声データXA[0]は、時刻t=T+Taに
フィードバック音声データFXA[0]としてデータ多
重化器102Bに入力される。また、時刻t=Tに端末
装置1Bに入力された音声データXB[T]も、時刻t
=T+Taにデータ多重化器102Bに入力される。
The audio data XA [0] input to the feedback audio encoder 104B is input to the data multiplexer 102B as feedback audio data FXA [0] at time t = T + Ta. The audio data XB [T] input to the terminal device 1B at time t = T also
= T + Ta is input to the data multiplexer 102B.

【0040】フィードバック音声データFXA[0]お
よび音声データXB[T]は、ともに時刻t=T+Ta
+Tbに端末装置1Bから伝送路2に送出され、時刻t
=2Tに端末装置1Aのゲインコントローラ106Aに
入力され、端末装置1Aから出力される。
The feedback voice data FXA [0] and the voice data XB [T] are both at time t = T + Ta
+ Tb from the terminal device 1B to the transmission line 2 at time t
= 2T, the signal is input to the gain controller 106A of the terminal device 1A and output from the terminal device 1A.

【0041】同じように、時刻t=0に端末装置1Bに
入力された音声データXB[0]は、時刻t=Tに端末
装置1Aのゲインコントローラ106Aおよびフィード
バック音声符号化器104Aに入力され、端末装置1A
から出力される。
Similarly, voice data XB [0] input to terminal device 1B at time t = 0 is input to gain controller 106A and feedback voice encoder 104A of terminal device 1A at time t = T, Terminal device 1A
Output from

【0042】フィードバック音声符号化器104Aに入
力された音声データXB[0]は、時刻t=T+Taに
フィードバック音声データFXB[0]としてデータ多
重化器102Aに入力される。また、時刻t=Tに端末
装置1Aに入力された音声データXA[T]も、時刻t
=T+Taにデータ多重化器102Aに入力される。
The voice data XB [0] input to the feedback voice encoder 104A is input to the data multiplexer 102A as feedback voice data FXB [0] at time t = T + Ta. Also, the audio data XA [T] input to the terminal device 1A at time t = T also
= T + Ta is input to the data multiplexer 102A.

【0043】フィードバック音声データFXB[0]お
よび音声データXA[T]は、ともに時刻t=T+Ta
+Tbに端末装置1Aから伝送路2に送出され、時刻t
=2Tに端末装置1Bのゲインコントローラ106Bに
入力され、端末装置1Bから出力される。
Feedback voice data FXB [0] and voice data XA [T] are both at time t = T + Ta
+ Tb is transmitted from the terminal device 1A to the transmission path 2 at time t
= 2T is input to the gain controller 106B of the terminal device 1B and output from the terminal device 1B.

【0044】このように、端末装置1A(1B)から端
末装置1B(1A)に送信した音声データXA[0]
(XA[0])が端末装置1B(1A)から端末装置1
A(1B)にフィードバックされ、そのフィードバック
音声データFXA[0](FIXB[0])は、ゲイン
コントローラ106A(106B)に入力され、端末装
置3B(3A)から送信された音声データXB[T]
(XA[T])と混合され、端末装置3A(3B)から
出力される。
As described above, the audio data XA [0] transmitted from the terminal device 1A (1B) to the terminal device 1B (1A)
(XA [0]) is transmitted from the terminal device 1B (1A) to the terminal device 1
A (1B) is fed back, and the feedback voice data FXA [0] (FIXB [0]) is input to the gain controller 106A (106B), and the voice data XB [T] transmitted from the terminal device 3B (3A).
(XA [T]) and output from the terminal device 3A (3B).

【0045】フィードバック音声データFXA[0]
(FIXB[0])がゲインコントローラ106A(1
06B)に入力されるタイミングは、端末装置1A(1
B)に入力された音声データXA[0](XB[0])
の端末装置1A(1B)および端末装置1B(1A)に
おいての音声符号復号遅延、伝送路遅延、ならびに端末
装置1B(1A)に入力された音声データXB[0]
(XA[0])の端末装置1B(1A)および端末装置
1A(1B)においての音声符号復号遅延を考慮し、こ
れらの合計の遅延量に準じたタイミングである。これに
より、音声データXA[0](XB[0])は、この音
声データXA[0](XB[0])が端末装置1B(1
A)から出力されるときに端末装置1B(1A)に入力
された音声データXB[T](XA[T])と混合さ
れ、端末装置1A(1B)から出力される。
Feedback voice data FXA [0]
(FIXB [0]) is the gain controller 106A (1
06B) is input to the terminal device 1A (1
Audio data XA [0] (XB [0]) input to B)
Code delay and transmission line delay in the terminal device 1A (1B) and the terminal device 1B (1A), and the audio data XB [0] input to the terminal device 1B (1A).
Considering the voice code decoding delay in the terminal device 1B (1A) and the terminal device 1A (1B) of (XA [0]), the timing is based on the total delay amount of these. As a result, the audio data XA [0] (XB [0]) is converted from the audio data XA [0] (XB [0]) to the terminal device 1B (1).
When output from A), it is mixed with audio data XB [T] (XA [T]) input to the terminal device 1B (1A) and output from the terminal device 1A (1B).

【0046】以上説明したように第1の実施の形態によ
れば、端末装置1A(1B)の入力音声を、端末装置1
A(1B)および端末装置1B(1A)においての符号
復号遅延ならびに伝送路遅延を含んだ形で、相手側の端
末装置1B(1A)からの送信音声と混合して、端末装
置1A(1B)において聞くことができる。このことに
より、端末装置1A(1B)のユーザーは、音声転送遅
延およびその揺らぎが発生しても自分の音声の転送遅延
を把握できるので、相手との会話のタイミングを把握す
ることができ、そのタイミングを計りながら会話するこ
とが可能となる。
As described above, according to the first embodiment, the input sound of the terminal device 1A (1B) is
A (1B) and the terminal device 1B (1A) are mixed with the transmission voice from the terminal device 1B (1A) on the other side, including the code decoding delay and the transmission line delay in the terminal device 1B (1A). Can be heard at Accordingly, the user of the terminal device 1A (1B) can grasp the transfer delay of his / her voice even if the voice transfer delay and its fluctuation occur, so that the user can grasp the timing of the conversation with the other party. It becomes possible to talk while measuring the timing.

【0047】また、端末装置1A(1B)の入力音声と
相手側からの送信音声との混合割合を端末装置1A(1
B)において設定することができ、入力音声の混合割合
を0に設定することもできるので、遅延の発生が微量な
場合など、ユーザー自身の音声が耳障りになる場合は、
ユーザー自身の音声を消去することも可能である。
The mixing ratio between the input voice of the terminal device 1A (1B) and the voice transmitted from the other party is determined by the terminal device 1A (1B)
B), and the mixing ratio of the input sound can be set to 0. Therefore, when the user's own sound is annoying, such as when the delay is very small,
It is also possible to delete the user's own voice.

【0048】なお、上記第1の実施の形態の端末装置1
A(1B)において、フィードバック音声符号化器10
4A(104B)に代えて、データ分配器108A(1
08B)で分離された音声データXB(XA)を音声復
号化器107A(107B)においての音声データXB
(XA)の復号遅延および音声符号化器101A(10
1B)においての音声データXA(XB)の符号遅延の
合計の遅延量だけ遅延させてデータ多重化器102A
(102B)に出力するデータバッファあるいは遅延器
などの遅延手段を設けた構成としてもよい。
Note that the terminal device 1 of the first embodiment is
In A (1B), the feedback speech coder 10
4A (104B) instead of the data distributor 108A (1
08B) is separated from the audio data XB (XA) in the audio decoder 107A (107B).
(XA) decoding delay and speech encoder 101A (10
1B), the data multiplexer 102A delays by the total delay amount of the code delay of the audio data XA (XB).
A configuration may be adopted in which a delay means such as a data buffer or a delay unit for outputting to (102B) is provided.

【0049】第2の実施の形態図3は本発明の第2の実
施の形態の音声遅延対策システムを示すブロック構成図
である。なお、図3において、図1と同じものには同じ
符号を付してある。図3では、端末装置3Aと端末装置
3Bとが伝送路2を介して接続しており、端末装置3A
と端末装置3Bと伝送路2によって上記の音声遅延対策
システムが構成されている。
Second Embodiment FIG. 3 is a block diagram showing an audio delay countermeasure system according to a second embodiment of the present invention. In FIG. 3, the same components as those in FIG. 1 are denoted by the same reference numerals. In FIG. 3, the terminal device 3A and the terminal device 3B are connected via the transmission line 2, and the terminal device 3A
The terminal device 3B and the transmission path 2 constitute the above-described audio delay countermeasure system.

【0050】端末装置3Aは、音声符号化器301A
と、データ多重化器302Aと、伝送路変調器303A
と、フレームインデックス遅延器304Aと、フィード
バックフレームインデックス遅延器305Aと、ゲイン
コントローラ306Aと、音声復号化器307Aと、デ
ータ分配器308Aと、伝送路復調器309Aと、音声
データバッファ(FIFOバッファ)310Aと、音声
データ入力端子IN1Aと、ゲイン設定データ入力端子
IN2Aと、音声データ出力端子OUTAとを備える。
The terminal device 3A includes a speech encoder 301A
, A data multiplexer 302A, and a transmission line modulator 303A.
, A frame index delay unit 304A, a feedback frame index delay unit 305A, a gain controller 306A, an audio decoder 307A, a data distributor 308A, a transmission line demodulator 309A, and an audio data buffer (FIFO buffer) 310A. And an audio data input terminal IN1A, a gain setting data input terminal IN2A, and an audio data output terminal OUTA.

【0051】また、端末装置3Bは、音声符号化器30
1Bと、データ多重化器302Bと、伝送路変調器30
3Bと、フレームインデックス遅延器304Bと、フィ
ードバックフレームインデックス遅延器305Bと、ゲ
インコントローラ306Bと、音声復号化器307B
と、データ分配器308Bと、伝送路復調器309B
と、音声データバッファ(FIFOバッファ)310B
と、音声データ入力端子IN1Bと、ゲイン設定データ
入力端子IN2Bと、音声データ出力端子OUTBとを
備える。
Further, the terminal device 3 B
1B, a data multiplexer 302B, and a transmission line modulator 30.
3B, a frame index delay unit 304B, a feedback frame index delay unit 305B, a gain controller 306B, and a speech decoder 307B.
, A data distributor 308B, and a transmission path demodulator 309B.
And audio data buffer (FIFO buffer) 310B
And an audio data input terminal IN1B, a gain setting data input terminal IN2B, and an audio data output terminal OUTB.

【0052】図3の端末装置3Aの構成および動作につ
いて以下に説明する。なお、以下の端末装置3Aと端末
装置3Bは同じ構成である。また、端末装置3Aの音声
符号化器301Aと端末装置3Bの音声符号化器301
B、端末装置3Aのデータ多重化器302Aと端末装置
3Bのデータ多重化器302Bなどは同じ構成である。
以下の端末装置3Aの構成および動作の説明において、
それぞれの符号をかっこ内の符号に置き換えたものは、
図3の端末装置3Bの構成および動作の説明である。
The configuration and operation of the terminal device 3A shown in FIG. 3 will be described below. The following terminal devices 3A and 3B have the same configuration. The speech encoder 301A of the terminal device 3A and the speech encoder 301 of the terminal device 3B
B, the data multiplexer 302A of the terminal device 3A and the data multiplexer 302B of the terminal device 3B have the same configuration.
In the following description of the configuration and operation of the terminal device 3A,
Replace each code with the code in parentheses,
4 is an illustration of the configuration and operation of the terminal device 3B of FIG.

【0053】入力端子IN1A(IN1B)には音声デ
ータXA(XB)が入力され、この音声データXA(X
B)は音声符号化器301A(301B)および音声デ
ータバッファ310A(310B)に入力される。
The audio data XA (XB) is input to the input terminal IN1A (IN1B).
B) is input to the audio encoder 301A (301B) and the audio data buffer 310A (310B).

【0054】音声符号化器301A(301B)は、入
力された音声データXA(XB)を符号化し、データ多
重化器302A(302B)に出力する。上記の符号化
には、伝送路2を効率的に使用するための音声圧縮など
の処理を含む。さらに、音声符号化器301A(301
B)は、音声データXA(XB)に音声フレームインデ
ックスIXA(IXB)を割り振り、その音声フレーム
インデックスデータIXA(IXB)を音声データバッ
ファ310A(310B)およびデータ多重化器302
A(302B)に出力する。
The speech encoder 301A (301B) encodes the inputted speech data XA (XB) and outputs it to the data multiplexer 302A (302B). The above-described encoding includes processing such as audio compression for efficiently using the transmission path 2. Further, the speech encoder 301A (301
B) allocates an audio frame index IXA (IXB) to the audio data XA (XB), and stores the audio frame index data IXA (IXB) in the audio data buffer 310A (310B) and the data multiplexer 302.
A (302B).

【0055】データ多重化器302A(302B)は、
符号化された音声データXA(XB)と、その音声デー
タXA(XB)に割り振られた音声フレームインデック
スデータIXA(IXB)と、フレームインデックス遅
延器304A(304B)からのフィードバック音声フ
レームインデックスデータFIXB(FIXA)とを多
重化し、伝送路変調器303A(303B)に出力す
る。
The data multiplexer 302A (302B)
The encoded audio data XA (XB), the audio frame index data IXA (IXB) allocated to the audio data XA (XB), and the feedback audio frame index data FIXB (FIXB) from the frame index delay unit 304A (304B). FIXA) and outputs the result to the transmission path modulator 303A (303B).

【0056】伝送路変調器303A(303B)は、多
重されたデータMDIA(MDIB)をフォーマット変
換し、伝送路2に送出する。上記のフォーマット変換
は、TCP/IPに代表される伝送路2で用いられるフ
ォーマットに変換するものであり、パケット化などを含
む。
The transmission line modulator 303A (303B) converts the format of the multiplexed data MDIA (MDIB) and sends out the data to the transmission line 2. The above-mentioned format conversion is a conversion to a format used in the transmission path 2 represented by TCP / IP, and includes packetization and the like.

【0057】伝送路復調器309A(309B)は、端
末装置3B(3A)から伝送路2に送出された多重化さ
れたデータMDIB(MDIA)を受信し、端末装置3
B(3A)の伝送路変調器303B(303A)でなさ
れたフォーマット変換の逆変換を施し、データ分配器3
08A(308B)に出力する。
The transmission line demodulator 309A (309B) receives the multiplexed data MDIB (MDIA) transmitted to the transmission line 2 from the terminal device 3B (3A), and
B (3A) performs an inverse conversion of the format conversion performed by the transmission line modulator 303B (303A), and the data distributor 3
08A (308B).

【0058】データ分配器308A(308B)は、多
重化されたデータMDIB(MDIA)を、符号化され
た音声データXB(XA)と、その音声データXB(X
A)に割り振られた音声フレームインデックスデータI
XB(IXA)と、フィードバック音声フレームインデ
ックスデータFIXA(FIXB)とに分離し、音声デ
ータXB(XA)を音声復号化器307A(307B)
に出力し、音声フレームインデックスデータIXB(I
XA)をフレームインデックス遅延器304A(304
B)に出力し、フィードバック音声フレームインデック
スデータFIXA(FIXB)をフィードバックフレー
ムインデックス遅延器305A(305A)に出力す
る。上記のフィードバック音声フレームインデックスデ
ータFIXA(FIXB)は、端末装置1Aから相手側
の端末装置1Bに送信し、端末装置1Bから返信された
音声フレームインデックスデータであり、端末装置1B
に送信した音声データXAにに割り振られたものであ
る。また、上記の音声フレームインデックスデータIX
B(IXA)は、相手側の端末装置1Bから送信された
音声フレームインデックスデータであり、端末装置1B
から送信された音声データXBに割り振られたものであ
る。
The data distributor 308A (308B) converts the multiplexed data MDIB (MDIA) into encoded audio data XB (XA) and the encoded audio data XB (XA).
Audio frame index data I allocated to A)
XB (IXA) and feedback audio frame index data FIXA (FIXB), and the audio data XB (XA) is decoded by the audio decoder 307A (307B).
To the audio frame index data IXB (I
XA) to the frame index delay unit 304A (304).
B), and outputs the feedback voice frame index data FIXA (FIXB) to the feedback frame index delay unit 305A (305A). The feedback voice frame index data FIXA (FIXB) is voice frame index data transmitted from the terminal device 1A to the terminal device 1B on the other side and returned from the terminal device 1B.
Is assigned to the audio data XA transmitted to the user. Also, the above-mentioned audio frame index data IX
B (IXA) is the voice frame index data transmitted from the terminal device 1B on the partner side,
Is assigned to the audio data XB transmitted from the.

【0059】フレームインデックス遅延器304A(3
04B)は、音声フレームインデックスデータIXB
(IXA)を、音声復号化装置307A(307B)の
データ入出力遅延量および音声符号化装置301A(3
01B)のデータ入出力遅延量の合計の遅延量と同じだ
け遅延させ、フィードバック音声フレームインデックス
データFIXB(FIXA)としてデータ多重化器30
2A(302B)に出力する。
The frame index delay unit 304A (3
04B) is the audio frame index data IXB
(IXA) is calculated based on the data input / output delay amount of the audio decoding device 307A (307B) and the audio encoding device 301A (3
01B) is delayed by the same amount as the total amount of data input / output delay amounts, and is used as feedback voice frame index data FIXB (FIXA).
2A (302B).

【0060】音声復号化器307A(307B)は、符
号化された音声データXB(XA)を復号し、ゲインコ
ントローラ306A(306B)に出力する。
The audio decoder 307A (307B) decodes the encoded audio data XB (XA) and outputs it to the gain controller 306A (306B).

【0061】フィードバックフレームインデックス遅延
器305A(305B)は、フィードバックされた音声
フレームインデックスデータFIXA(FIXB)を、
音声復号化器307A(307B)においての音声デー
タXB(XA)の遅延量と同じだけ遅延させ、音声デー
タバッファ310A(310B)に出力する。
The feedback frame index delay unit 305A (305B) converts the fed back voice frame index data FIXA (FIXB) into
It delays by the same amount as the delay amount of the audio data XB (XA) in the audio decoder 307A (307B) and outputs it to the audio data buffer 310A (310B).

【0062】音声データバッファ310A(310B)
は、入力音声データXA(XB)、およびその音声デー
タXA(XB)に割り振られた音声フレームインデック
スデータIXA(IXB)を貯えておき、フィードバッ
ク音声フレームインデックスデータFIXA(FIX
B)がフィードバックフレームインデックス遅延器30
5A(305B)から入力されると、そのフィードバッ
ク音声フレームインデックスデータFIXA(FIX
B)に一致する音声フレームインデックスデータIXA
(IXB)が割り振られた音声データXA(XB)を、
ゲインコントローラ306A(306B)に出力する。
Audio data buffer 310A (310B)
Stores input audio data XA (XB) and audio frame index data IXA (IXB) allocated to the audio data XA (XB), and stores feedback audio frame index data FIXA (FIX
B) is a feedback frame index delay unit 30
5A (305B), the feedback voice frame index data FIXA (FIX
B) Voice frame index data IXA that matches
(IXB) is assigned to the audio data XA (XB),
Output to the gain controller 306A (306B).

【0063】つまり、音声データバッファ310A(3
10B)は、入力されたフィードバック音声フレームイ
ンデックスデータFIXA(FIXB)が割り振られた
音声データXA(XB)をゲインコントローラ306A
(306B)に出力することにより、端末装置3Aの入
力音声データXA(XB)を、符号復号遅延および伝送
路遅延を考慮したタイミングで端末装置3Aから出力さ
せる。音声フレームインデックスデータIXA(IX
B)は、フィードバック音声フレームインデックスデー
タFIXA(FIXB)が割り振られた符号化された音
声データXA(XB)を識別するために、入力音声デー
タXA(XB)とともに音声データバッファ310A
(310B)に貯えられる。
That is, the audio data buffer 310A (3
10B) gains the audio data XA (XB) to which the input feedback audio frame index data FIXA (FIXB) is allocated by the gain controller 306A.
(306B), the input audio data XA (XB) of the terminal device 3A is output from the terminal device 3A at a timing in consideration of the code decoding delay and the transmission path delay. Voice frame index data IXA (IX
B), together with the input audio data XA (XB), the audio data buffer 310A to identify the encoded audio data XA (XB) to which the feedback audio frame index data FIXA (FIXB) is allocated.
(310B).

【0064】入力端子IN2A(IN2B)にはゲイン
設定データrA(rB)が入力され、このゲイン設定デ
ータrA(rB)はゲインコントローラ306A(30
6B)に入力される。
The gain setting data rA (rB) is input to the input terminal IN2A (IN2B), and the gain setting data rA (rB) is input to the gain controller 306A (30).
6B).

【0065】ゲインコントローラ306A(306B)
は、上記第1の実施の形態のゲインコントローラ106
A(106B)と同じ内部構成である。ゲインコントロ
ーラ306Aは、端末装置3Bから送信された音声デー
タXB、および音声データバッファ310Aで遅延され
た端末装置3Aの入力音声データXAを、ゲイン設定デ
ータrAに応じた割合で混合し、出力音声データrA・
XB+{(1−rA)XA}を出力端子OUTAから出
力する。なお、端末装置3Bのゲインコントローラ30
6Bは、端末装置3Aから送信された音声データXA、
および音声データバッファ310Bで遅延された端末装
置3Bの入力音声データXBを、ゲイン設定データrB
に応じた割合で混合し、出力音声データrB・XA+
{(1−rB)XB}を出力端子OUTBから出力す
る。
Gain controller 306A (306B)
Is the gain controller 106 according to the first embodiment.
A (106B) has the same internal configuration. The gain controller 306A mixes the audio data XB transmitted from the terminal device 3B and the input audio data XA of the terminal device 3A delayed by the audio data buffer 310A at a ratio according to the gain setting data rA, and outputs the output audio data. rA
XB + {(1-rA) XA} is output from the output terminal OUTA. The gain controller 30 of the terminal device 3B
6B is the audio data XA transmitted from the terminal device 3A,
The input audio data XB of the terminal device 3B delayed by the audio data buffer 310B and the gain setting data rB
And the output audio data rB · XA +
{(1-rB) XB} is output from the output terminal OUTB.

【0066】図3の音声遅延対策システムにおいての音
声データXAおよびXBならびに音声フレームインデッ
クスデータIXAおよびIXBの流れについて以下に説
明する。
The flow of audio data XA and XB and audio frame index data IXA and IXB in the audio delay countermeasure system of FIG. 3 will be described below.

【0067】端末装置3Aに入力された音声データXA
は、符号化器301Aおよび音声データバッファ310
Aに入力される。符号化器301Aに入力された音声デ
ータXAは、データ多重化器302A、伝送路変調器3
03A、伝送路2、伝送路復調器309B、データ分配
器308B、音声復号化器307Bを経由し、ゲインコ
ントローラ306Bに入力され、遅延された端末装置3
Bの入力音声データXBと混合され、出力端子OUTB
から出力される。
The audio data XA input to the terminal device 3A
Is an encoder 301A and an audio data buffer 310
A is input to A. The audio data XA input to the encoder 301A is transmitted to the data multiplexer 302A and the transmission path modulator 3
03A, the transmission path 2, the transmission path demodulator 309B, the data distributor 308B, and the speech decoder 307B.
B is mixed with the input audio data XB of the output terminal OUTB.
Output from

【0068】音声データバッファ310Aに入力された
音声データXAは、音声データバッファ310Aに一時
貯えられ、端末装置3Bから送信された音声データXB
に同期するタイミングでゲインコントローラ306Aに
出力され、端末装置3Bからの音声データXAと混合さ
れ、出力端子OUTBから出力される。
The audio data XA input to the audio data buffer 310A is temporarily stored in the audio data buffer 310A, and the audio data XB transmitted from the terminal device 3B.
Is output to the gain controller 306A at the timing synchronized with the audio data XA, mixed with the audio data XA from the terminal device 3B, and output from the output terminal OUTB.

【0069】また、端末装置3Aの入力音声データXA
に割り振られた音声フレームインデックスIXAは、音
声符号化器301Aから音声データバッファ310Aお
よびデータ多重化器302Aに入力される。音声データ
バッファ310Aに入力された音声フレームインデック
スIXAは、その音声フレームインデックスIXAが割
り振られた入力音声データXAとともに音声データバッ
ファ310Aに貯えられる。
The input audio data XA of the terminal device 3A
Is input from the audio encoder 301A to the audio data buffer 310A and the data multiplexer 302A. The audio frame index IXA input to the audio data buffer 310A is stored in the audio data buffer 310A together with the input audio data XA to which the audio frame index IXA is allocated.

【0070】データ多重化器302Aに入力された音声
フレームインデックスIXAは、伝送路変調器303
A、伝送路2、伝送路復調器309B、データ分配器3
08B、フレームインデックス遅延器304B、データ
多重化器302B、伝送路変調器303B、伝送路2を
経由して端末装置3Aにフィードバックされる。このフ
ィードバック音声フレームインデックスデータFIXA
は、伝送路復調器309A、データ分配器308A、フ
ィードバックフレームインデックス遅延器305Aを経
由し、音声データバッファ310Aに入力される。
The voice frame index IXA input to the data multiplexer 302 A is
A, transmission path 2, transmission path demodulator 309B, data distributor 3
08B, the frame index delay unit 304B, the data multiplexer 302B, the transmission line modulator 303B, and the feedback to the terminal device 3A via the transmission line 2. This feedback voice frame index data FIXA
Is input to the audio data buffer 310A via the transmission line demodulator 309A, the data distributor 308A, and the feedback frame index delay unit 305A.

【0071】音声データバッファ310Aは、フィード
バック音声フレームインデックスデータFIXAが入力
されたタイミングで、そのフィードバック音声フレーム
インデックスデータFIXAが割り振られた音声データ
XAをゲインコントローラ306Aに出力する。
The audio data buffer 310A outputs the audio data XA to which the feedback audio frame index data FIXA is allocated to the gain controller 306A at the timing when the feedback audio frame index data FIXA is input.

【0072】同じように、端末装置3Bに入力された音
声データXBは、符号化器301Bおよび音声データバ
ッファ310Bに入力される。符号化器301Bに入力
された音声データXBは、データ多重化器302B、伝
送路変調器303B、伝送路2、伝送路復調器309
A、データ分配器308A、音声復号化器307Aを経
由し、ゲインコントローラ306Aに入力され、端末装
置3Aの入力音声データXAと混合され、出力端子OU
TAから出力される。
Similarly, audio data XB input to terminal device 3B is input to encoder 301B and audio data buffer 310B. The audio data XB input to the encoder 301B is transmitted to a data multiplexer 302B, a transmission path modulator 303B, a transmission path 2, and a transmission path demodulator 309.
A, via the data distributor 308A and the audio decoder 307A, input to the gain controller 306A, mixed with the input audio data XA of the terminal device 3A, and output terminal OU
Output from TA.

【0073】音声データバッファ310Bに入力された
音声データXBは、音声データバッファ310Bに一時
貯えられ、端末装置3Aから送信された音声データXA
に同期するタイミングでゲインコントローラ306Bに
出力され、端末装置3Aからの音声データXAと混合さ
れ、出力端子OUTBから出力される。
The audio data XB input to the audio data buffer 310B is temporarily stored in the audio data buffer 310B, and the audio data XA transmitted from the terminal device 3A.
Is output to the gain controller 306B at the timing synchronized with the audio data XA, mixed with the audio data XA from the terminal device 3A, and output from the output terminal OUTB.

【0074】また、端末装置3Bの入力音声データXB
に割り当てられた音声フレームインデックスIXBは、
音声符号化器301Bから音声データバッファ310B
およびデータ多重化器302Bに入力される。音声デー
タバッファ310Bに入力された音声フレームインデッ
クスIXBは、その音声フレームインデックスIXAが
割り振られた入力音声データXAとともに音声データバ
ッファ310Aに貯えられる。
The input voice data XB of the terminal device 3B
Is assigned to the audio frame index IXB.
From the audio encoder 301B to the audio data buffer 310B
And input to the data multiplexer 302B. The audio frame index IXB input to the audio data buffer 310B is stored in the audio data buffer 310A together with the input audio data XA to which the audio frame index IXA is allocated.

【0075】データ多重化器302Bに入力された音声
フレームインデックスIXBは、伝送路変調器303
B、伝送路2、伝送路復調器309A、データ分配器3
08A、フレームインデックス遅延器304A、データ
多重化器302A、伝送路変調器303A、伝送路2を
経由して端末装置3Bにフィードバックされる。このフ
ィードバック音声フレームインデックスデータFIXB
は、伝送路復調器309B、データ分配器308B、フ
ィードバックフレームインデックス遅延器305Bを経
由し、音声データバッファ310Bに入力される。
The voice frame index IXB input to the data multiplexer 302 B is
B, transmission path 2, transmission path demodulator 309A, data distributor 3
08A, the frame index delay unit 304A, the data multiplexer 302A, the transmission line modulator 303A, and the feedback to the terminal device 3B via the transmission line 2. This feedback voice frame index data FIXB
Is input to the audio data buffer 310B via the transmission line demodulator 309B, the data distributor 308B, and the feedback frame index delay unit 305B.

【0076】音声データバッファ310Bは、フィード
バック音声フレームインデックスデータFIXBが入力
されたタイミングで、そのフィードバック音声フレーム
インデックスデータFIXBが割り振られた音声データ
XBをゲインコントローラ306Bに出力する。
The audio data buffer 310B outputs the audio data XB to which the feedback audio frame index data FIXB is allocated to the gain controller 306B at the timing when the feedback audio frame index data FIXB is input.

【0077】ここで、音声符号化器301A,301B
のデータ入出力遅延時間をいずれもTaとし、データ多
重化器302Aと伝送路変調器303Aの合計のデータ
遅延時間、およびデータ多重化器302Bと伝送路変調
器303Bの合計のデータ遅延時間をいずれもTbと
し、伝送路2のデータ伝送遅延時間をTcとし、伝送路
復調器309Aとデータ分配器308Aの合計のデータ
遅延時間、および伝送路復調器309Bとデータ分配器
308Bの合計のデータ遅延時間をいずれもTdとし、
音声復号化器307A,307B、フィードバックフレ
ームインデックス遅延器305A,305Bのデータ入
出力遅延時間をいずれもTeとする。また、フレームイ
ンデックス遅延器304A,304Bのデータ入出力遅
延時間をいずれもTe+Taとする。また、Ta+Tb
+Tc+Td+Te=Tとする。
Here, the speech encoders 301A and 301B
, And the total data delay time of the data multiplexer 302A and the transmission path modulator 303A, and the total data delay time of the data multiplexer 302B and the transmission path modulator 303B. Is also Tb, the data transmission delay time of the transmission line 2 is Tc, the total data delay time of the transmission line demodulator 309A and the data distributor 308A, and the total data delay time of the transmission line demodulator 309B and the data distributor 308B. Are Td,
Let Te be the data input / output delay time of the audio decoders 307A and 307B and the feedback frame index delay units 305A and 305B. In addition, the data input / output delay time of the frame index delay units 304A and 304B is both Te + Ta. Also, Ta + Tb
+ Tc + Td + Te = T.

【0078】時刻t=0に端末装置3Aに入力された音
声データXA[0]は、時刻t=Ta+Tb+Tc+T
dに端末装置3Bの音声復号化器307Bに入力され、
時刻t=Tにゲインコントローラ306Bに入力され、
端末装置3Bから出力される。
The audio data XA [0] input to the terminal device 3A at the time t = 0 is represented by the time t = Ta + Tb + Tc + T
d is input to the audio decoder 307B of the terminal device 3B,
At time t = T, it is input to the gain controller 306B,
Output from the terminal device 3B.

【0079】上記の音声データXA[0]に割り振られ
た音声フレームインデックスデータIXA[0]は、時
刻t=Ta+Tb+Tc+Tdに端末装置3Bのフレー
ムインデックス遅延器304Bに入力され、時刻t=T
+Taにフィードバック音声インデックスデータFIX
A[0]としてデータ多重化器302Bに入力される。
また、時刻t=Tに端末装置3Bに入力された音声デー
タXB[T]、および音声データXB[T]に割り振ら
れた音声フレームインデックスデータIXB[T]も、
時刻t=T+Taにデータ多重化器302Bに入力され
る。
The audio frame index data IXA [0] allocated to the audio data XA [0] is input to the frame index delay unit 304B of the terminal device 3B at time t = Ta + Tb + Tc + Td, and the time t = T
+ Ta is the feedback voice index data FIX
A [0] is input to the data multiplexer 302B.
The audio data XB [T] input to the terminal device 3B at time t = T and the audio frame index data IXB [T] allocated to the audio data XB [T] are also:
At time t = T + Ta, data is input to data multiplexer 302B.

【0080】フィードバック音声フレームインデックス
データFIXA[0]および音声データXB[T]は、
ともに時刻t=T+Ta+Tbに端末装置3Bから伝送
路2に送出され、時刻t=T+Ta+Tb+Tc+Td
に端末装置3Aのデータ分配器308Aから出力され
る。
The feedback voice frame index data FIXA [0] and the voice data XB [T] are
Both are transmitted from the terminal device 3B to the transmission line 2 at time t = T + Ta + Tb, and time t = T + Ta + Tb + Tc + Td.
Is output from the data distributor 308A of the terminal device 3A.

【0081】端末装置3Bから送信された音声データX
B[T]は、時刻t=2Tにゲインコントローラ306
Aに入力され、端末装置3Aから出力される。また、フ
ィードバック音声フレームインデックスデータFIXA
[0]は、時刻t=2Tに音声データバッファ310A
に入力される。これにより、音声データバッファ310
Aに貯えられていた音声データXA[0]は、時刻t=
2Tにゲインコントローラ306Aに入力され、音声デ
ータXB[T]とともに端末装置3Aから出力される。
The audio data X transmitted from the terminal device 3B
B [T] indicates that the gain controller 306 is at time t = 2T.
A and is output from the terminal device 3A. Also, the feedback voice frame index data FIXA
[0] indicates that the audio data buffer 310A at time t = 2T
Is input to Thereby, the audio data buffer 310
The audio data XA [0] stored in A is at time t =
The signal is input to the gain controller 306A at 2T, and is output from the terminal device 3A together with the audio data XB [T].

【0082】同じように、時刻t=0に端末装置3Bに
入力された音声データXB[0]は、時刻t=Ta+T
b+Tc+Tdに端末装置3Aの音声復号化器307A
に入力され、時刻t=Tにゲインコントローラ306A
に入力され、端末装置3Aから出力される。
Similarly, voice data XB [0] input to terminal device 3B at time t = 0 is obtained at time t = Ta + T
The audio decoder 307A of the terminal device 3A is added to b + Tc + Td.
And at time t = T, the gain controller 306A
And output from the terminal device 3A.

【0083】上記の音声データXB[0]に割り振られ
た音声フレームインデックスデータIXB[0]は、時
刻t=Ta+Tb+Tc+Tdに端末装置3Aのフレー
ムインデックス遅延器304Aに入力され、時刻t=T
+Taにフィードバック音声インデックスデータFIX
B[0]としてデータ多重化器302Aに入力される。
また、時刻t=Tに端末装置3Aに入力された音声デー
タXA[T]、および音声データXA[T]に割り振ら
れた音声フレームインデックスデータIXA[T]も、
時刻t=T+Taにデータ多重化器302Aに入力され
る。
The voice frame index data IXB [0] allocated to the voice data XB [0] is input to the frame index delay unit 304A of the terminal device 3A at time t = Ta + Tb + Tc + Td, and the time t = T
+ Ta is the feedback voice index data FIX
The data is input to the data multiplexer 302A as B [0].
The audio data XA [T] input to the terminal device 3A at time t = T and the audio frame index data IXA [T] allocated to the audio data XA [T] are also:
At time t = T + Ta, data is input to data multiplexer 302A.

【0084】フィードバック音声フレームインデックス
データFIXB[0]および音声データXA[T]は、
ともに時刻t=T+Ta+Tbに端末装置3Aから伝送
路2に送出され、時刻t=T+Ta+Tb+Tc+Td
に端末装置3Bのデータ分配器308Bから出力され
る。
The feedback voice frame index data FIXB [0] and the voice data XA [T] are
Both are transmitted from the terminal device 3A to the transmission line 2 at the time t = T + Ta + Tb, and the time t = T + Ta + Tb + Tc + Td.
Is output from the data distributor 308B of the terminal device 3B.

【0085】端末装置3Aから送信された音声データX
A[T]は、時刻t=2Tにゲインコントローラ306
Bに入力され、端末装置3Bから出力される。また、フ
ィードバック音声フレームインデックスデータFIXB
[0]は、時刻t=2Tに音声データバッファ310B
に入力される。これにより、音声データバッファ310
Bに貯えられていた音声データXB[0]は、時刻t=
2Tにゲインコントローラ306Bに入力され、音声デ
ータXA[T]とともに端末装置3Bから出力される。
Voice data X transmitted from terminal device 3A
A [T] indicates that the gain controller 306 is at time t = 2T.
B and output from the terminal device 3B. Also, the feedback voice frame index data FIXB
[0] indicates that the audio data buffer 310B at time t = 2T
Is input to Thereby, the audio data buffer 310
The audio data XB [0] stored in B at time t =
The signal is input to the gain controller 306B at 2T, and output from the terminal device 3B together with the audio data XA [T].

【0086】このように、音声データXA[0](XB
[0])に多重化されて端末装置3A(3B)から端末
装置3B(3A)に送信した音声フレームインデックス
データIXA[0](IXB[0])が端末装置3B
(3A)から端末装置3A(3B)にフィードバックさ
れ、そのフィードバック音声フレームインデックスデー
タFIXA[0](FIXB[0])が音声データバッ
ファ310A(310B)に入力されるタイミングで、
音声データXA[0](XB[0])は、音声データバ
ッファ310A(310B)からゲインコントローラ3
06A(306B)に入力され、端末装置3B(3A)
から送信された音声データXB[T](XA[T])と
混合され、端末装置3A(3B)から出力される。
As described above, the audio data XA [0] (XB
[0]) and transmitted from the terminal device 3A (3B) to the terminal device 3B (3A), the voice frame index data IXA [0] (IXB [0]) is transmitted to the terminal device 3B.
(3A) is fed back to the terminal device 3A (3B), and when the feedback voice frame index data FIXA [0] (FIXB [0]) is input to the voice data buffer 310A (310B),
The audio data XA [0] (XB [0]) is supplied from the audio data buffer 310A (310B) to the gain controller 3A.
06A (306B) and the terminal device 3B (3A)
Is mixed with the audio data XB [T] (XA [T]) transmitted from the terminal device 3A (3B).

【0087】上記のタイミングは、端末装置3A(3
B)に入力された音声データXA[0](XB[0])
の端末装置3A(3B)および端末装置3B(3A)に
おいての音声符号復号遅延、伝送路遅延、ならびに端末
装置3B(3A)に入力された音声データXB[0]
(XA[0])の端末装置3B(3A)および端末装置
3A(3B)においての音声符号復号遅延を考慮し、こ
れらの合計の遅延量に準じたタイミングである。これに
より、音声データXA[0](XB[0])は、この音
声データXA[0](XB[0])が端末装置3B(3
A)から出力されるときに端末装置3B(3A)に入力
された音声データXB[T](XA[T])と混合さ
れ、端末装置3A(3B)から出力される。
The above timing is determined by the terminal device 3A (3
Audio data XA [0] (XB [0]) input to B)
Code decoding delay and transmission path delay in the terminal device 3A (3B) and the terminal device 3B (3A), and the audio data XB [0] input to the terminal device 3B (3A).
Considering the voice code decoding delay in the terminal device 3B (3A) and the terminal device 3A (3B) of (XA [0]), the timing is based on the total delay amount of these. Thus, the audio data XA [0] (XB [0]) is converted from the audio data XA [0] (XB [0]) to the terminal device 3B (3
The audio data XB [T] (XA [T]) input to the terminal device 3B (3A) when output from the terminal device 3A is mixed and output from the terminal device 3A (3B).

【0088】以上説明したように第2の実施の形態によ
れば、端末装置3A(3B)の入力音声を、端末装置3
A(3B)および端末装置3B(3A)においての符号
復号遅延ならびに伝送路遅延を含んだ形で、相手側の端
末装置3B(3A)からの送信音声と混合して、端末装
置3A(3B)において聞くことができる。このことに
より、端末装置3A(3B)のユーザーは、音声転送遅
延およびその揺らぎが発生しても自分の音声の遅延量を
把握できるので、相手との会話のタイミングを把握する
ことができ、そのタイミングを計りながら会話すること
が可能となる。
As described above, according to the second embodiment, the input sound of the terminal device 3A (3B) is
A (3B) and the terminal device 3B (3A), including the code decoding delay and the transmission line delay in the terminal device 3B (3A), are mixed with the transmission sound from the partner terminal device 3B (3A). Can be heard at Thereby, the user of the terminal device 3A (3B) can grasp the delay amount of his / her voice even if the voice transfer delay and its fluctuation occur, so that the user can grasp the timing of the conversation with the other party. It becomes possible to talk while measuring the timing.

【0089】また、端末装置3A(3B)の入力音声と
相手側からの送信音声との混合割合を端末装置3A(3
B)において設定することができ、入力音声の混合割合
を0に設定することもできるので、遅延の発生が微量な
場合など、ユーザー自身の音声が耳障りになる場合は、
ユーザー自身の音声を消去することも可能である。
The mixing ratio of the input voice of the terminal device 3A (3B) and the voice transmitted from the other party is determined by the terminal device 3A (3B).
B), and the mixing ratio of the input sound can be set to 0. Therefore, when the user's own sound is annoying, such as when the delay is very small,
It is also possible to delete the user's own voice.

【0090】さらに、この第2の実施の形態では、音声
データではなく、その音声データに割り当てた音声フレ
ームインデックスデータを相手側に送信し、相手側から
フィードバックさせており、音声フレームインデックス
データのデータ量は一般に符号化された音声データのデ
ータ量よりも少ないので、伝送データ量を上記第1の実
施の形態よりも少なくすることができる。
Further, in the second embodiment, not the audio data but the audio frame index data assigned to the audio data is transmitted to the other party and fed back from the other party. Since the amount is generally smaller than the data amount of the encoded audio data, the amount of transmission data can be made smaller than that of the first embodiment.

【0091】第3の実施の形態図4は本発明の第3の実
施の形態の音声遅延対策システムを示すブロック構成図
である。なお、図4において、図1と同じものには同じ
符号を付してある。図4では、端末装置4Aと端末装置
4Bとが伝送路2を介して接続しており、端末装置4A
と端末装置4Bと伝送路2によって上記の音声遅延対策
システムが構成されている。
Third Embodiment FIG. 4 is a block diagram showing a voice delay countermeasure system according to a third embodiment of the present invention. In FIG. 4, the same components as those in FIG. 1 are denoted by the same reference numerals. In FIG. 4, the terminal device 4A and the terminal device 4B are connected via the transmission line 2, and the terminal device 4A
The terminal device 4B and the transmission path 2 constitute the above-described audio delay countermeasure system.

【0092】端末装置4Aは、音声符号化器401A
と、データ多重化器402Aと、伝送路変調器403A
と、フレームインデックス遅延器404Aと、フィード
バック音声復号化器405Aと、ゲインコントローラ4
06Aと、音声復号化器407Aと、データ分配器40
8Aと、伝送路復調器409Aと、音声データバッファ
(FIFOバッファ)410Aと、音声データ入力端子
IN1Aと、ゲイン設定データ入力端子IN2Aと、音
声データ出力端子OUTAとを備える。
[0092] The terminal device 4A includes a speech coder 401A.
, A data multiplexer 402A, and a transmission line modulator 403A.
, A frame index delay unit 404A, a feedback speech decoder 405A, and a gain controller 4
06A, a speech decoder 407A, and a data distributor 40
8A, a transmission line demodulator 409A, an audio data buffer (FIFO buffer) 410A, an audio data input terminal IN1A, a gain setting data input terminal IN2A, and an audio data output terminal OUTA.

【0093】また、端末装置4Bは、音声符号化器40
1Bと、データ多重化器402Bと、伝送路変調器40
3Bと、フレームインデックス遅延器404Bと、フィ
ードバック音声復号化器405Bと、ゲインコントロー
ラ406Bと、音声復号化器407Bと、データ分配器
408Bと、伝送路復調器409Bと、音声データバッ
ファ(FIFOバッファ)410Bと、音声データ入力
端子IN1Bと、ゲイン設定データ入力端子IN2B
と、音声データ出力端子OUTBとを備える。
[0093] The terminal device 4B includes a speech coder 40.
1B, the data multiplexer 402B, and the transmission line modulator 40
3B, a frame index delay unit 404B, a feedback audio decoder 405B, a gain controller 406B, an audio decoder 407B, a data distributor 408B, a transmission path demodulator 409B, and an audio data buffer (FIFO buffer). 410B, an audio data input terminal IN1B, and a gain setting data input terminal IN2B
And an audio data output terminal OUTB.

【0094】この第3の実施の形態の端末装置4Aおよ
び4Bは、上記第2の実施の形態の端末装置3Aおよび
3B(図2参照)において、符号化された音声データを
音声データバッファに貯えるようにしたものである。
The terminal devices 4A and 4B of the third embodiment store the encoded audio data in the audio data buffer in the terminal devices 3A and 3B of the second embodiment (see FIG. 2). It is like that.

【0095】図4の端末装置4Aの構成および動作につ
いて以下に説明する。なお、以下の端末装置4Aと端末
装置4Bは同じ構成である。また、端末装置4Aの音声
符号化器401Aと端末装置4Bの音声符号化器401
B、端末装置4Aのデータ多重化器402Aと端末装置
4Bのデータ多重化器402Bなどは同じ構成である。
以下の端末装置4Aの構成および動作の説明において、
それぞれの符号をかっこ内の符号に置き換えたものは、
図4の端末装置4Bの構成および動作の説明である。
The configuration and operation of the terminal device 4A shown in FIG. 4 will be described below. The following terminal devices 4A and 4B have the same configuration. Also, the speech encoder 401A of the terminal device 4A and the speech encoder 401 of the terminal device 4B.
B, the data multiplexer 402A of the terminal device 4A and the data multiplexer 402B of the terminal device 4B have the same configuration.
In the following description of the configuration and operation of the terminal device 4A,
Replace each code with the code in parentheses,
5 is a description of the configuration and operation of the terminal device 4B of FIG.

【0096】入力端子IN1A(IN1B)には音声デ
ータXA(XB)が入力され、この音声データXA(X
B)は音声符号化器401A(401B)に入力され
る。
The audio data XA (XB) is input to the input terminal IN1A (IN1B).
B) is input to the speech encoder 401A (401B).

【0097】音声符号化器401A(401B)は、入
力された音声データXA(XB)を符号化し、音声デー
タバッファ410A(410B)およびデータ多重化器
402A(402B)に出力する。上記の符号化には、
伝送路2を効率的に使用するための音声圧縮などの処理
を含む。さらに、音声符号化器401A(401B)
は、音声データXA(XB)に音声フレームインデック
スIXA(IXB)を割り振り、その音声フレームイン
デックスデータIXA(IXB)を音声データバッファ
410A(410B)およびデータ多重化器402A
(402B)に出力する。
The speech encoder 401A (401B) encodes the inputted speech data XA (XB) and outputs it to the speech data buffer 410A (410B) and the data multiplexer 402A (402B). In the above encoding,
Processing such as voice compression for efficiently using the transmission path 2 is included. Further, the speech encoder 401A (401B)
Allocates an audio frame index IXA (IXB) to audio data XA (XB), and stores the audio frame index data IXA (IXB) in an audio data buffer 410A (410B) and a data multiplexer 402A.
(402B).

【0098】データ多重化器402A(402B)は、
符号化された音声データXA(XB)と、その音声デー
タXA(XB)に割り振られた音声フレームインデック
スデータIXA(IXB)と、フレームインデックス遅
延器404A(404B)からのフィードバック音声フ
レームインデックスデータFIXB(FIXA)とを多
重化し、伝送路変調器403A(403B)に出力す
る。
The data multiplexer 402A (402B)
The encoded audio data XA (XB), the audio frame index data IXA (IXB) allocated to the audio data XA (XB), and the feedback audio frame index data FIXB (FIXB) from the frame index delay unit 404A (404B). FIXA) and outputs the result to the transmission line modulator 403A (403B).

【0099】伝送路変調器403A(403B)は、多
重されたデータMDIA(MDIB)をフォーマット変
換し、伝送路2に送出する。上記のフォーマット変換
は、TCP/IPに代表される伝送路2で用いられるフ
ォーマットに変換するものであり、パケット化などを含
む。
The transmission line modulator 403A (403B) converts the format of the multiplexed data MDIA (MDIB) and sends out the data to the transmission line 2. The above-mentioned format conversion is a conversion to a format used in the transmission path 2 represented by TCP / IP, and includes packetization and the like.

【0100】伝送路復調器409A(409B)は、端
末装置4B(4A)から伝送路2に送出された多重化さ
れたデータMDIB(MDIA)を受信し、端末装置4
B(4A)の伝送路変調器403B(403A)でなさ
れたフォーマット変換の逆変換を施し、データ分配器4
08A(408B)に出力する。
The transmission line demodulator 409A (409B) receives the multiplexed data MDIB (MDIA) sent to the transmission line 2 from the terminal device 4B (4A),
B (4A) performs inverse conversion of the format conversion performed by the transmission line modulator 403B (403A), and
08A (408B).

【0101】データ分配器408A(408B)は、入
力されたデータMDIB(MDIA)を、符号化された
音声データXB(XA)と、その音声データXB(X
A)に割り振られた音声フレームインデックスデータI
XB(IXA)と、フィードバック音声フレームインデ
ックスデータFIXA(FIXB)とに分離し、音声デ
ータXB(XA)を音声復号化器407A(407B)
に出力し、音声フレームインデックスデータIXB(I
XA)をフレームインデックス遅延器404A(404
B)に出力し、フィードバック音声フレームインデック
スデータFIXA(FIXB)を音声データバッファ4
10A(410B)に出力する。
The data distributor 408A (408B) converts the input data MDIB (MDIA) into encoded audio data XB (XA) and the encoded audio data XB (XA).
Audio frame index data I allocated to A)
XB (IXA) and feedback audio frame index data FIXA (FIXB), and the audio data XB (XA) is decoded by the audio decoder 407A (407B).
To the audio frame index data IXB (I
XA) to the frame index delay unit 404A (404
B) and outputs the feedback voice frame index data FIXA (FIXB) to the voice data buffer 4.
Output to 10A (410B).

【0102】フレームインデックス遅延器404A(4
04B)は、音声フレームインデックスデータIXB
(IXA)を、音声復号化装置407A(407B)の
データ入出量遅延量および音声符号化装置401A(4
01B)のデータ入出量遅延量の合計の遅延量と同じだ
け遅延させ、フィードバック音声フレームインデックス
データFIXB(FIXA)としてデータ多重化器40
2A(402B)に出力する。
The frame index delay unit 404A (4
04B) is the audio frame index data IXB
(IXA) is calculated based on the data input / output delay amount of the audio decoding device 407A (407B) and the audio encoding device 401A (4
01B) is delayed by the same amount as the total delay amount of the data input / output amounts of the data multiplexer / demultiplexer 40 as feedback voice frame index data FIXB (FIXA).
2A (402B).

【0103】音声復号化器407A(407B)は、符
号化された音声データXB(XA)を復号し、ゲインコ
ントローラ406A(406B)に出力する。
[0103] The audio decoder 407A (407B) decodes the encoded audio data XB (XA) and outputs it to the gain controller 406A (406B).

【0104】音声データバッファ410A(410B)
は、符号化された入力音声データXA(XB)、および
その音声データXA(XB)に割り振られた音声フレー
ムインデックスデータIXA(IXB)を貯えておき、
フィードバック音声フレームインデックスデータFIX
A(FIXB)がデータ配分器408A(408B)か
ら入力されると、そのフィードバック音声フレームイン
デックスデータFIXA(FIXB)に一致する音声フ
レームインデックスデータIXA(IXB)が割り振ら
れた符号化された音声データXA(XB)を、フィード
バック音声復号化器405A(405B)に出力する。
Audio data buffer 410A (410B)
Stores encoded input audio data XA (XB) and audio frame index data IXA (IXB) allocated to the audio data XA (XB),
Feedback voice frame index data FIX
When A (FIXB) is input from the data distributor 408A (408B), the encoded audio data XA to which the audio frame index data IXA (IXB) that matches the feedback audio frame index data FIXA (FIXB) is allocated. (XB) is output to the feedback speech decoder 405A (405B).

【0105】つまり、音声データバッファ410A(4
10B)は、入力されたフィードバック音声フレームイ
ンデックスデータFIXA(FIXB)が割り振られた
符号化された音声データXA(XB)をフィードバック
音声復号化器405A(405B)に出力することによ
り、端末装置3Aの入力音声データXA(XB)を、符
号復号遅延および伝送路遅延を考慮したタイミングで端
末装置4A(4B)から出力させる。
That is, the audio data buffer 410A (4
10B) outputs the encoded audio data XA (XB) to which the input feedback audio frame index data FIXA (FIXB) is allocated, to the feedback audio decoder 405A (405B), so that the terminal device 3A The input audio data XA (XB) is output from the terminal device 4A (4B) at a timing in consideration of the code decoding delay and the transmission path delay.

【0106】フィードバック音声復号化器405A(4
05B)は、音声データバッファ410A(410B)
から入力された符号化された音声データXA(XB)を
復号し、ゲインコントローラ406A(406B)に出
力する。
The feedback speech decoder 405A (4
05B) is an audio data buffer 410A (410B)
, Decodes the encoded audio data XA (XB) input from the controller and outputs it to the gain controller 406A (406B).

【0107】入力端子IN2A(IN2B)にはゲイン
設定データrA(rB)が入力され、このゲイン設定デ
ータrA(rB)はゲインコントローラ406A(40
6B)に入力される。
The gain setting data rA (rB) is input to the input terminal IN2A (IN2B), and the gain setting data rA (rB) is input to the gain controller 406A (40).
6B).

【0108】ゲインコントローラ406A(406B)
は、上記第1の実施の形態のゲインコントローラ106
A(106B)と同じ内部構成である。ゲインコントロ
ーラ406Aは、端末装置4Bから送信された音声デー
タXB、および音声データバッファ410Aで遅延され
た端末装置4Aの入力音声データXAを、ゲイン設定デ
ータrAに応じた割合で混合し、出力音声データrA・
XB+{(1−rA)XA}を出力端子OUTAから出
力する。なお、端末装置4Bのゲインコントローラ40
6Bは、端末装置4Aから送信された音声データXA、
および音声データバッファ410Bで遅延された端末装
置4Bの入力音声データXBを、ゲイン設定データrB
に応じた割合で混合し、出力音声データrB・XA+
{(1−rB)XB}を出力端子OUTBから出力す
る。
Gain controller 406A (406B)
Is the gain controller 106 according to the first embodiment.
A (106B) has the same internal configuration. The gain controller 406A mixes the audio data XB transmitted from the terminal device 4B and the input audio data XA of the terminal device 4A delayed by the audio data buffer 410A at a ratio according to the gain setting data rA, and outputs the output audio data. rA
XB + {(1-rA) XA} is output from the output terminal OUTA. The gain controller 40 of the terminal device 4B
6B is the audio data XA transmitted from the terminal device 4A,
The input audio data XB of the terminal device 4B delayed by the audio data buffer 410B and the gain setting data rB
And the output audio data rB · XA +
{(1-rB) XB} is output from the output terminal OUTB.

【0109】図4の音声遅延対策システムにおいての音
声データXAおよび音声フレームインデックスデータI
XAの流れについて以下に説明する。なお、以下の音声
データXAおよび音声フレームインデックスデータIX
Aの流れの説明において、それぞれの符号をかっこ内の
ものに置き換えたものは、音声データXBおよび音声フ
レームインデックスデータIXBの流れの説明である。
The audio data XA and the audio frame index data I in the audio delay countermeasure system of FIG.
The flow of XA will be described below. The following audio data XA and audio frame index data IX
In the description of the flow of A, the description of the flow of the audio data XB and the audio frame index data IXB is obtained by replacing the respective symbols with those in parentheses.

【0110】端末装置4A(4B)に入力された音声デ
ータXA(XB)は、符号化器401A(301B)で
符号化され、音声データバッファ410A(410B)
およびデータ多重化器402A(402B)に入力され
る。データ多重化器402A(402B)に入力された
音声データXA(XB)は、伝送路変調器303A(3
03B)、伝送路2、伝送路復調器309B(309
A)、データ分配器308B(308A)、音声復号化
器307B(307B)を経由し、ゲインコントローラ
406B(406A)に入力され、遅延された端末装置
4B(4A)の入力音声データXB(XA)と混合さ
れ、出力端子OUTB(OUTA)から出力される。
The audio data XA (XB) input to the terminal device 4A (4B) is encoded by the encoder 401A (301B), and the audio data buffer 410A (410B)
And input to the data multiplexer 402A (402B). The audio data XA (XB) input to the data multiplexer 402A (402B) is transmitted to the transmission line modulator 303A (3
03B), transmission path 2, transmission path demodulator 309B (309
A), via the data distributor 308B (308A) and the audio decoder 307B (307B), input to the gain controller 406B (406A), and delayed input audio data XB (XA) of the terminal device 4B (4A). And output from the output terminal OUTB (OUTA).

【0111】音声データバッファ410A(410B)
に入力された音声データXA(XB)は、音声データバ
ッファ410A(410B)に一時貯えられ、端末装置
4B(4A)から送信された音声データXB(XA)に
同期するタイミングでフィードバック音声復号化器40
5A(405B)に出力され、フィードバック音声復号
化器405A(405B)で復号され、ゲインコントロ
ーラ406A(406B)に入力され、音声復号化器4
07A(407B)で復号された端末装置3B(4A)
からの音声データXB(XA)と混合され、出力端子O
UTB(OUTA)から出力される。
Audio data buffer 410A (410B)
Is temporarily stored in the audio data buffer 410A (410B), and the feedback audio decoder is synchronized with the audio data XB (XA) transmitted from the terminal device 4B (4A). 40
5A (405B), is decoded by the feedback speech decoder 405A (405B), and is inputted to the gain controller 406A (406B).
Terminal device 3B (4A) decoded at 07A (407B)
Is mixed with the audio data XB (XA) from the
Output from UTB (OUTA).

【0112】また、端末装置4A(4B)の入力音声デ
ータXA(XB)に割り振られた音声フレームインデッ
クスIXA(IXB)は、音声符号化器401A(40
1B)から音声データバッファ410A(410B)お
よびデータ多重化器402A(402B)に入力され
る。音声データバッファ410A(410B)に入力さ
れた音声フレームインデックスIXA(IXB)は、そ
の音声フレームインデックスIXA(IXB)が割り振
られた符号化された入力音声データXA(XB)ととも
に音声データバッファ410A(410B)に貯えられ
る。
The audio frame index IXA (IXB) allocated to the input audio data XA (XB) of the terminal device 4A (4B) is stored in the audio encoder 401A (40).
1B) is input to the audio data buffer 410A (410B) and the data multiplexer 402A (402B). The audio frame index IXA (IXB) input to the audio data buffer 410A (410B) is together with the encoded input audio data XA (XB) to which the audio frame index IXA (IXB) is allocated. ).

【0113】データ多重化器402A(402B)に入
力された音声フレームインデックスIXA(IXB)
は、伝送路変調器403A(403B)、伝送路2、伝
送路復調器409B(409A)、データ分配器408
B(408A)、フレームインデックス遅延器404B
(404A)、データ多重化器402B(402A)、
伝送路変調器403B(403A)、伝送路2を経由し
て端末装置4A(4B)にフィードバックされる。この
フィードバック音声フレームインデックスデータFIX
A(FIXB)は、伝送路復調器409A(409
B)、データ分配器408A(408B)を経由し、音
声データバッファ410A(410B)に入力される。
Speech frame index IXA (IXB) input to data multiplexer 402A (402B)
Are transmission path modulators 403A (403B), transmission path 2, transmission path demodulator 409B (409A), data distributor 408
B (408A), frame index delay unit 404B
(404A), the data multiplexer 402B (402A),
The signal is fed back to the terminal device 4A (4B) via the transmission path modulator 403B (403A) and the transmission path 2. This feedback voice frame index data FIX
A (FIXB) is a transmission path demodulator 409A (409
B), and is input to the audio data buffer 410A (410B) via the data distributor 408A (408B).

【0114】音声データバッファ410A(410B)
は、フィードバック音声フレームインデックスデータF
IXA(FIXB)が入力されたタイミングで、そのフ
ィードバック音声フレームインデックスデータFIXA
(FIXB)が割り振られた符号化された音声データX
A(XB)をフィードバック音声復号化器405A(4
05B)に出力する。
Audio data buffer 410A (410B)
Is the feedback voice frame index data F
At the timing when IXA (FIXB) is input, the feedback voice frame index data FIXA
(FIXB) assigned encoded audio data X
A (XB) is converted to a feedback speech decoder 405A (4
05B).

【0115】ここで、音声符号化器401A,401B
のデータ入出力遅延時間をいずれもTaとし、データ多
重化器402Aと伝送路変調器403Aの合計のデータ
遅延時間、およびデータ多重化器402Bと伝送路変調
器403Bの合計のデータ遅延時間をいずれもTbと
し、伝送路2のデータ伝送遅延時間をTcとし、伝送路
復調器409Aとデータ分配器408Aの合計のデータ
遅延時間、および伝送路復調器409Bとデータ分配器
408Bの合計のデータ遅延時間をいずれもTdとし、
音声復号化器407A,407B、フィードバック音声
復号化器405A,405Bのデータ入出力遅延時間を
いずれもTeとする。また、フレームインデックス遅延
器404A,404Bのデータ入出力遅延時間をいずれ
もTe+Taとする。また、Ta+Tb+Tc+Td+
Te=Tとする。
Here, the speech encoders 401A and 401B
, The total data delay time of the data multiplexer 402A and the transmission line modulator 403A, and the total data delay time of the data multiplexer 402B and the transmission line modulator 403B. Is also Tb, the data transmission delay time of the transmission line 2 is Tc, the total data delay time of the transmission line demodulator 409A and the data distributor 408A, and the total data delay time of the transmission line demodulator 409B and the data distributor 408B. Are Td,
Let Te be the data input / output delay time of the audio decoders 407A and 407B and the feedback audio decoders 405A and 405B. Further, the data input / output delay time of the frame index delay units 404A and 404B is Te + Ta. Also, Ta + Tb + Tc + Td +
Let Te = T.

【0116】時刻t=0に端末装置4A(4B)に入力
された音声データXA[0](XA[0])は、時刻t
=Tに端末装置3B(3A)のゲインコントローラ30
6B(306A)に入力され、端末装置4Bから出力さ
れる。
At time t = 0, audio data XA [0] (XA [0]) input to terminal device 4A (4B)
= T, the gain controller 30 of the terminal device 3B (3A)
6B (306A) and output from the terminal device 4B.

【0117】上記の音声データXA[0](XB
[0])に割り振られた音声フレームインデックスデー
タIXA[0](IXB[0])は、時刻t=T+Ta
にフィードバック音声インデックスデータFIXA
[0](FIXB[0])としてデータ多重化器402
B(402A)に入力される。また、時刻t=Tに端末
装置4B(4A)に入力された音声データXB[T]
(XA[T])、および音声データXB[T](XA
[T])に割り振られた音声フレームインデックスデー
タIXB[T](IXA[T])も、時刻t=T+Ta
にデータ多重化器402B(402A)に入力される。
The above audio data XA [0] (XB
The audio frame index data IXA [0] (IXB [0]) allocated to [0]) is at time t = T + Ta
Feedback audio index data FIXA
Data multiplexer 402 as [0] (FIXB [0])
B (402A). The audio data XB [T] input to the terminal device 4B (4A) at time t = T
(XA [T]), and audio data XB [T] (XA
The voice frame index data IXB [T] (IXA [T]) allocated to [T]) is also at time t = T + Ta.
Is input to the data multiplexer 402B (402A).

【0118】フィードバック音声フレームインデックス
データFIXA[0](FIXB[0])および音声デ
ータXB[T](XA[T])は、ともに時刻t=T+
Ta+Tb+Tc+Tdに端末装置4A(4B)のデー
タ分配器408A(408B)から出力される。
Feedback audio frame index data FIXA [0] (FIXB [0]) and audio data XB [T] (XA [T]) are both at time t = T +
The data is output from the data distributor 408A (408B) of the terminal device 4A (4B) at Ta + Tb + Tc + Td.

【0119】端末装置4B(4A)から送信された音声
データXB[T](XA[T])は、時刻t=2Tにゲ
インコントローラ406A(406B)に入力され、端
末装置4A(4B)から出力される。また、フィードバ
ック音声フレームインデックスデータFIXA[0]
(FIXB[0])は、時刻t=2Tに音声データバッ
ファ410A(410B)に入力される。これにより、
音声データバッファ410A(410B)に貯えられて
いた音声データXA[0](XB[0])は、時刻t=
2Tにゲインコントローラ406A(406B)に入力
され、音声データXB[T](XA[T])とともに端
末装置4A(4B)から出力される。
The audio data XB [T] (XA [T]) transmitted from the terminal device 4B (4A) is input to the gain controller 406A (406B) at time t = 2T, and is output from the terminal device 4A (4B). Is done. Also, the feedback voice frame index data FIXA [0]
(FIXB [0]) is input to the audio data buffer 410A (410B) at time t = 2T. This allows
The audio data XA [0] (XB [0]) stored in the audio data buffer 410A (410B) is at time t =
The signal is input to the gain controller 406A (406B) at 2T, and output from the terminal device 4A (4B) together with the audio data XB [T] (XA [T]).

【0120】このように、第3の実施の形態においても
上記第2の実施の形態と同様に、端末装置4A(4B)
に入力された音声データXA[0](XB[0])の端
末装置4A(4B)および端末装置4B(4A)におい
ての音声符号復号遅延、伝送路遅延、ならびに端末装置
4B(4A)に入力された音声データXB[0](XA
[0])の端末装置4B(4A)および端末装置4A
(4B)においての音声符号復号遅延に準じたタイミン
グで、音声データXA[0](XB[0])は、ゲイン
コントローラ406A(406B)に出力され、端末装
置4B(4A)から送信された音声データXB[T]
(XB[T])と混合され、端末装置3A(3B)から
出力される。これにより、音声データXA[0](XB
[0])は、この音声データXA[0](XB[0])
が端末装置4B(4A)から出力されるときに端末装置
4B(4A)に入力された音声データXB[T](XA
[T])と混合され、端末装置4A(4B)から出力さ
れる。
As described above, also in the third embodiment, similarly to the second embodiment, the terminal devices 4A (4B)
Of the audio data XA [0] (XB [0]) input to the terminal device 4A (4B) and the terminal device 4B (4A), and the input to the terminal device 4B (4A). Audio data XB [0] (XA
[0]) Terminal device 4B (4A) and terminal device 4A
At the timing according to the audio code decoding delay in (4B), the audio data XA [0] (XB [0]) is output to the gain controller 406A (406B) and transmitted from the terminal device 4B (4A). Data XB [T]
(XB [T]) and output from the terminal device 3A (3B). Thereby, the audio data XA [0] (XB
[0]) is the audio data XA [0] (XB [0])
Is output from the terminal device 4B (4A), the audio data XB [T] (XA) input to the terminal device 4B (4A).
[T]) and output from the terminal device 4A (4B).

【0121】以上説明したように第3の実施の形態によ
れば、端末装置4A(4B)の入力音声を、端末装置4
A(4B)および端末装置4B(4A)においての符号
復号遅延ならびに伝送路遅延を含んだ形で、相手側の端
末装置3B(3A)からの送信音声と混合して、端末装
置4A(4B)において聞くことができる。このことに
より、端末装置4A(4B)のユーザーは、音声転送遅
延およびその揺らぎが発生しても自分の音声の遅延量を
把握できるので、相手との会話のタイミングを把握する
ことができ、そのタイミングを計りながら会話すること
が可能となる。
As described above, according to the third embodiment, the input sound of the terminal device 4A (4B) is
A (4B) and the terminal device 4B (4A), including the code decoding delay and the transmission line delay in the terminal device 4B (4A), are mixed with the transmission voice from the terminal device 3B (3A) on the other side, and the terminal device 4A (4B) Can be heard at Thereby, the user of the terminal device 4A (4B) can grasp the delay amount of his / her voice even if the voice transfer delay and its fluctuation occur, so that the user can grasp the timing of the conversation with the other party. It becomes possible to talk while measuring the timing.

【0122】また、端末装置4A(4B)の入力音声と
相手側からの送信音声との混合割合を端末装置4A(4
B)において設定することができ、入力音声の混合割合
を0に設定することもできるので、遅延の発生が微量な
場合など、ユーザー自身の音声が耳障りになる場合は、
ユーザー自身の音声を消去することも可能である。
Further, the mixing ratio of the input voice of the terminal device 4A (4B) and the voice transmitted from the other party is determined by the terminal device 4A (4B).
B), and the mixing ratio of the input sound can be set to 0. Therefore, when the user's own sound is annoying, such as when the delay is very small,
It is also possible to delete the user's own voice.

【0123】さらに、この第3の実施の形態では、符号
化された音声データXA(XB)を音声データバッファ
410A(410B)に保持し、この音声データXA
(XB)をフィードバック音声復号化器405A(40
5B)で復号してゲインコントローラ406A(406
B)に入力する構成になっており、符号化された音声デ
ータXA(XB)のデータ量は一般に符号化される前よ
りも圧縮されるので、音声データバッファ410A(4
10B)のデータ容量を上記第2の実施の形態よりも少
なくできる。音声データバッファ410A(410B)
およびフィードバック音声復号化器405A(405
B)を上記第2の実施の形態のフィードバックフレーム
インデックス遅延器305A(305B)および音声デ
ータバッファ310A(310B)よりもコンパクトに
できる場合には第3の実施の形態を採用し、逆の場合に
は上記第2の実施の形態を採用することにより、装置の
コンパクト化を図れる。
Further, in the third embodiment, the encoded audio data XA (XB) is held in the audio data buffer 410A (410B), and the audio data XA (XB) is stored in the audio data buffer 410A (410B).
(XB) is converted to the feedback speech decoder 405A (40
5B) and the gain controller 406A (406
B), and the data amount of the encoded audio data XA (XB) is compressed more than before encoding, so that the audio data buffer 410A (4
The data capacity of 10B) can be smaller than that of the second embodiment. Audio data buffer 410A (410B)
And the feedback speech decoder 405A (405
If B) can be made more compact than the feedback frame index delay unit 305A (305B) and the audio data buffer 310A (310B) of the second embodiment, the third embodiment is adopted. By adopting the second embodiment, the size of the apparatus can be reduced.

【0124】なお、上記第1ないし第3の実施の形態で
は、端末装置をハードウエアで構成した例で説明した
が、端末装置は、ソフトウエアで構成してもよいし、ハ
ードウエアおよびソフトウエアの組合せで構成してもよ
い。
In the first to third embodiments, an example has been described in which the terminal device is configured by hardware. However, the terminal device may be configured by software, or by hardware and software. May be configured.

【0125】[0125]

【発明の効果】以上説明したように本発明によれば、ユ
ーザーは音声転送遅延およびその揺らぎが発生しても自
分の音声の遅延量を把握できるので、相手との会話のタ
イミングを把握することができ、そのタイミングを計り
ながら会話することができるという効果がある。
As described above, according to the present invention, the user can grasp the amount of delay of his / her voice even if the voice transfer delay and its fluctuation occur, so that the user can grasp the timing of conversation with the other party. The effect is that the conversation can be performed while measuring the timing.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の第1の実施の形態の音声遅延対策シ
ステムを示すブロック構成図である。
FIG. 1 is a block diagram showing an audio delay countermeasure system according to a first embodiment of the present invention.

【図2】 図1のゲインコントローラの構成の一例を示
す図である。
FIG. 2 is a diagram illustrating an example of a configuration of a gain controller in FIG. 1;

【図3】 本発明の第2の実施の形態の音声遅延対策シ
ステムを示すブロック構成図である。
FIG. 3 is a block diagram showing an audio delay countermeasure system according to a second embodiment of the present invention.

【図4】 本発明の第3の実施の形態の音声遅延対策シ
ステムを示すブロック構成図である。
FIG. 4 is a block diagram showing an audio delay countermeasure system according to a third embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1A,1B,3A,3B,4A,4B 端末装置、 2
伝送路、 101A,101B,301A,301
B,401A,401B 音声符号化器、 102A,
102B,302A,302B,402A,402B
データ多重化器、103A,103B,303A,30
3B,403A,403B 伝送路変調器、 104
A,104B フィードバック音声符号化器、 105
A,105B,405A,405B フィードバック音
声復号化器、 106A,106B,306A,306
B,406A,406B ゲインコントローラ、 10
7A,107B,307A,307B,407A,40
7B 音声復号化器、 108A,108B,308
A,308B,408A,408B データ分配器、1
09A,109B,309A,309B,409A,4
09B 伝送路復調器、 304A,304B,404
A,404B フレームインデックス遅延器、305
A,305B フィードバックフレームインデックス遅
延器、 310A,310B,410A,410B 音
声データバッファ、 IN1A,IN1B 音声データ
入力端子、 IN2A,IN2B ゲイン設定データ入
力端子、OUTA,OUTB 音声データ出力端子。
1A, 1B, 3A, 3B, 4A, 4B terminal device, 2
Transmission line, 101A, 101B, 301A, 301
B, 401A, 401B speech encoder, 102A,
102B, 302A, 302B, 402A, 402B
Data multiplexer, 103A, 103B, 303A, 30
3B, 403A, 403B Transmission line modulator, 104
A, 104B feedback speech encoder, 105
A, 105B, 405A, 405B Feedback speech decoder, 106A, 106B, 306A, 306
B, 406A, 406B Gain controller, 10
7A, 107B, 307A, 307B, 407A, 40
7B audio decoder, 108A, 108B, 308
A, 308B, 408A, 408B Data distributor, 1
09A, 109B, 309A, 309B, 409A, 4
09B transmission line demodulator, 304A, 304B, 404
A, 404B Frame index delay unit, 305
A, 305B Feedback frame index delay unit, 310A, 310B, 410A, 410B audio data buffer, IN1A, IN1B audio data input terminal, IN2A, IN2B gain setting data input terminal, OUTA, OUTB audio data output terminal.

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 入力された第1の音声データを含む第1
の多重化データを生成して送信するとともに、相手側か
ら送信された含む第2の多重化データを受信して第2の
音声データを出力する通信端末装置において、 入力された第1の音声データを符号化する符号化手段
と、 符号化された第1の音声データと相手側にフィードバッ
クするために再符号化された第2の音声データである第
2のフィードバック音声データとを多重化し、第1の多
重化データを生成する多重化手段と、 第1の多重化データを伝送仕様に応じて変調し、送信す
る変調手段と、 変調された第2の多重化データを受信して復調する復調
手段と、 復調された第2の多重化データを符号化された第2の音
声データと符号化された第1のフィードバック音声デー
タとに分離する分配手段と、 分離された第2の音声データを復号する復号化手段と、 復号された第2の音声データを第2のフィードバック音
声データとして再符号化するフィードバック符号化手段
と、 分離された第1のフィードバック音声データを復号する
フィードバック復号化手段と、 復号された第2の音声データと復号された第1のフィー
ドバック音声データとを設定された割合に従って混合す
る混合手段とを備えたことを特徴とする音声通信端末装
置。
The first audio data including the input first audio data.
A communication terminal device that generates and transmits multiplexed data of the first audio data and receives the second multiplexed data that is transmitted from the other party and outputs the second audio data. And multiplexing the encoded first audio data and the second feedback audio data, which is the second audio data re-encoded for feedback to the other party, Multiplexing means for generating one multiplexed data, modulating means for modulating and transmitting the first multiplexed data according to transmission specifications, and demodulation for receiving and demodulating the modulated second multiplexed data. Means for separating the demodulated second multiplexed data into coded second voice data and coded first feedback voice data; and distributing the separated second voice data. Decrypt Encoding means; feedback encoding means for re-encoding the decoded second audio data as second feedback audio data; feedback decoding means for decoding the separated first feedback audio data; Mixing means for mixing the decoded second audio data and the decoded first feedback audio data in accordance with a set ratio.
【請求項2】 入力された第1の音声データを含む第1
の多重化データを生成して送信するとともに、相手側か
ら送信された含む第2の多重化データを受信して第2の
音声データを出力する通信端末装置において、 入力された第1の音声データを符号化する符号化手段
と、 符号化された第1の音声データと相手側にフィードバッ
クするために遅延された符号化された第2の音声データ
である第2のフィードバック音声データとを多重化し、
第1の多重化データを生成する多重化手段と、 第1の多重化データを伝送仕様に応じて変調し、送信す
る変調手段と、 変調された第2の多重化データを受信して復調する復調
手段と、 復調された第2の多重化データを符号化された第2の音
声データと符号化された第1のフィードバック音声デー
タとに分離する分配手段と、 分離された第2の音声データを復号する復号化手段と、 分離された第1のフィードバック音声データを復号する
フィードバック復号化手段と、 分離された第2の音声データを上記復号化手段において
の第2の音声データの復号化遅延量と上記符号化手段に
おいての第1の音声データの符号化遅延量の合計の遅延
量だけ遅延し、第2のフィードバック音声データとして
出力する遅延手段と、 復号された第2の音声データと復号された第1のフィー
ドバック音声データとを設定された割合に従って混合す
る混合手段とを備えたことを特徴とする音声通信端末装
置。
2. The method according to claim 1, wherein the first audio data includes first audio data.
A communication terminal device that generates and transmits multiplexed data of the first audio data and receives the second multiplexed data that is transmitted from the other party and outputs the second audio data. And multiplexing the encoded first audio data and the second feedback audio data, which is the encoded second audio data delayed for feedback to the other party. ,
Multiplexing means for generating first multiplexed data, modulating means for modulating and transmitting the first multiplexed data according to transmission specifications, and receiving and demodulating the modulated second multiplexed data. Demodulation means; distribution means for separating the demodulated second multiplexed data into coded second voice data and coded first feedback voice data; separated second voice data Decoding means for decoding the separated first feedback sound data; and decoding delay of the second sound data in the decoding means for decoding the separated second sound data. Delay means for delaying by a total delay amount of the first audio data and the encoding delay amount of the first audio data in the encoding means, and outputting as second feedback audio data; Mixing means for mixing the data and the decoded first feedback voice data in accordance with a set ratio.
【請求項3】 伝送路を介して相互に接続される請求項
1記載の複数の音声通信端末装置、あるいは伝送路を介
して相互に接続される請求項2記載の複数の音声通信端
末装置、あるいは伝送路を介して相互に接続される請求
項1記載の1つまたは複数の音声通信端末装置および請
求項2記載の1つまたは複数の音声通信端末装置を備
え、 上記第1のフィードバック音声データが、相手側で復号
および再符号化されて相手側からフィードバックされた
第1の音声データであることを特徴とする音声通信シス
テム。
3. The plurality of voice communication terminal apparatuses according to claim 1, which are connected to each other via a transmission path, or the plurality of voice communication terminal apparatuses according to claim 2, which are connected to each other via a transmission path. Alternatively, the first feedback voice data includes one or more voice communication terminal devices according to claim 1 and one or more voice communication terminal devices according to claim 2, which are connected to each other via a transmission path. Is the first voice data decoded and re-encoded by the other party and fed back from the other party.
【請求項4】 入力された第1の音声データを含む第1
の多重化データを生成して送信するとともに、相手側か
ら送信された含む第2の多重化データを受信して第2の
音声データを出力する通信端末装置において、 入力された第1の音声データを符号化するとともに、そ
の第1の音声データに第1のインデックスデータを割り
当てる符号化手段と、 符号化された第1の音声データと第1のインデックスデ
ータと相手側にフィードバックするために遅延された第
2のフィードバックインデックスデータとを多重化し、
第1の多重化データを生成する多重化手段と、 第1の多重化データを伝送仕様に応じて変調し、送信す
る変調手段と、 変調された第2の多重化データを受信して復調する復調
手段と、 復調された第2の多重化データを符号化された第2の音
声データと第2のインデックスデータと第1のフィード
バックインデックスデータとに分離する分配手段と、 分離された第2の音声データを復号する復号化手段と、 分離された第2のインデックスデータを上記復号化手段
においての第2の音声データの復号化遅延量と上記符号
化手段においての第1の音声データの符号化遅延量の合
計の遅延量だけ遅延し、第2のフィードバックインデッ
クスデータとして出力する遅延手段と、 分離された第1のフィードバックインデックスデータを
上記復号化手段においての第2の音声データの復号化遅
延量だけ遅延するフィードバック遅延手段と、 第1の音声データおよびその第1の音声データに割り当
てられた第1のインデックスデータを保持しておき、遅
延された第1のフィードバックインデックスデータが上
記フィードバック遅延手段から出力されるタイミング
で、その第1のフィードバックインデックスデータに相
当する第1のインデックスデータが割り当てられた第1
の音声データを出力するバッファ手段と、 復号された第2の音声データと上記バッファ手段から出
力された第1の音声データとを設定された割合に従って
混合する混合手段とを備えたことを特徴とする音声通信
端末装置。
4. The first audio data including the input first audio data.
A communication terminal device that generates and transmits multiplexed data of the first audio data and receives the second multiplexed data including the second multiplexed data transmitted from the other party and outputs the second audio data. Encoding means for assigning the first index data to the first audio data, and a delay for feeding back the encoded first audio data, the first index data and the other party to the other party Multiplexed with the second feedback index data,
Multiplexing means for generating first multiplexed data, modulating means for modulating and transmitting the first multiplexed data according to transmission specifications, and receiving and demodulating the modulated second multiplexed data. Demodulating means; distributing means for separating the demodulated second multiplexed data into coded second audio data, second index data, and first feedback index data; A decoding unit for decoding the audio data, a decoding delay amount of the second audio data in the decoding unit, and an encoding of the first audio data in the encoding unit. Delay means for delaying by a total delay amount and outputting as second feedback index data; and decoding means for separating the separated first feedback index data. Delay means for delaying the second audio data by the decoding delay amount, and holding the first audio data and the first index data assigned to the first audio data, and When the first feedback index data is output from the feedback delay means, the first feedback index data is allocated to the first index data corresponding to the first feedback index data.
Buffer means for outputting the second audio data, and mixing means for mixing the decoded second audio data and the first audio data output from the buffer means in accordance with a set ratio. Voice communication terminal device.
【請求項5】 伝送路を介して相互に接続される請求項
4記載の複数の音声通信端末装置を備え、 上記第1のフィードバックインデックスデータが、相手
側において第1の音声データの復号化遅延量および第2
の音声データの符号化遅延量の合計の遅延量だけ遅延さ
れて相手側からフィードバックされた第1のインデック
スデータであり、 上記第2のインデックスデータが、相手側において第2
の音声データに割り当てられたものであることを特徴と
する音声通信システム。
5. The apparatus according to claim 4, further comprising a plurality of voice communication terminals connected to each other via a transmission path, wherein the first feedback index data is a decoding delay of the first voice data on the other side. Quantity and second
Is the first index data which is delayed by the total delay amount of the encoding delay amount of the audio data and fed back from the other party, and the second index data is the second index data at the other party.
An audio communication system characterized in that the audio data is allocated to the audio data.
【請求項6】 入力された第1の音声データを含む第1
の多重化データを生成して送信するとともに、相手側か
ら送信された含む第2の多重化データを受信して第2の
音声データを出力する通信端末装置において、 第1の音声データを符号化するとともに、その符号化し
た第1の音声データに第1のインデックスデータを割り
当てる符号化手段と、 符号化された第1の音声データと第1のインデックスデ
ータと相手側にフィードバックするために遅延された第
2のフィードバックインデックスデータとを多重化し、
第1の多重化データを生成する多重化手段と、 第1の多重化データを伝送仕様に応じて変調し、送信す
る変調手段と、 変調された第2の多重化データを受信して復調する復調
手段と、 復調された第2の多重化データを符号化された第2の音
声データと第2のインデックスデータと第1のフィード
バックインデックスデータとに分離する分配手段と、 分離された第2の音声データを復号する復号化手段と、 分離された第2のインデックスデータを上記復号化手段
においての第2の音声データの復号化遅延量と上記符号
化手段においての第1の音声データの符号化遅延量の合
計の遅延量だけ遅延し、第2のフィードバックインデッ
クスデータとして出力する遅延手段と、 符号化された第1の音声データおよびその符号化された
第1の音声データに割り当てられた第1のインデックス
データを保持しておき、第1のフィードバックインデッ
クスデータが上記分配手段から出力されるタイミング
で、その第1のフィードバックインデックスデータに相
当する第1のインデックスデータが割り当てられた符号
化された第1の音声データを出力するバッファ手段と、 上記バッファ手段から出力された第1の音声データを復
号するフィードバック復号化手段と、 復号された第2の音声データと復号された第1の音声デ
ータとを設定された割合に従って混合する混合手段とを
備えたことを特徴とする音声通信端末装置。
6. A first audio data including the input first audio data.
A communication terminal device that generates and transmits multiplexed data of the first audio data and receives the second multiplexed data including the second multiplexed data transmitted from the other party and outputs the second audio data. Encoding means for allocating the first index data to the encoded first audio data; and a delay for feeding back the encoded first audio data, the first index data, and the other party. Multiplexed with the second feedback index data,
Multiplexing means for generating first multiplexed data, modulating means for modulating and transmitting the first multiplexed data according to transmission specifications, and receiving and demodulating the modulated second multiplexed data. Demodulating means; distributing means for separating the demodulated second multiplexed data into coded second audio data, second index data, and first feedback index data; A decoding unit for decoding the audio data, a decoding delay amount of the second audio data in the decoding unit, and an encoding of the first audio data in the encoding unit. Delay means for delaying by a total delay amount and outputting it as second feedback index data; encoded first audio data and encoded first audio data; And the first index data corresponding to the first feedback index data is allocated at the timing when the first feedback index data is output from the distribution unit. Buffer means for outputting the encoded first audio data, feedback decoding means for decoding the first audio data output from the buffer means, and the decoded second audio data and the decoded second audio data. Mixing means for mixing the first audio data with the first audio data in accordance with a set ratio.
【請求項7】 伝送路を介して相互に接続される請求項
6記載の複数の音声通信端末装置を備え、 上記第1のフィードバックインデックスデータが、相手
側において第1の音声データの復号化遅延量および第2
の音声データの符号化遅延量の合計の遅延量だけ遅延さ
れて相手側からフィードバックされた第1のインデック
スデータであり、 上記第2のインデックスデータが、相手側において符号
化された第2の音声データに割り当てられたものである
ことを特徴とする音声通信システム。
7. A plurality of voice communication terminal devices according to claim 6, which are connected to each other via a transmission line, wherein the first feedback index data is a decoding delay of the first voice data on the other side. Quantity and second
Is the first index data that is delayed by the total delay amount of the encoding delay amount of the audio data and fed back from the other party, and the second index data is the second audio data encoded by the other party. A voice communication system characterized by being assigned to data.
JP2001183061A 2001-06-18 2001-06-18 Voice communication terminal and voice communication system Withdrawn JP2002374297A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001183061A JP2002374297A (en) 2001-06-18 2001-06-18 Voice communication terminal and voice communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001183061A JP2002374297A (en) 2001-06-18 2001-06-18 Voice communication terminal and voice communication system

Publications (1)

Publication Number Publication Date
JP2002374297A true JP2002374297A (en) 2002-12-26

Family

ID=19023062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001183061A Withdrawn JP2002374297A (en) 2001-06-18 2001-06-18 Voice communication terminal and voice communication system

Country Status (1)

Country Link
JP (1) JP2002374297A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005057590A (en) * 2003-08-06 2005-03-03 Matsushita Electric Ind Co Ltd Decoding display device, image pickup unit, and image transmission system equipped with these

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005057590A (en) * 2003-08-06 2005-03-03 Matsushita Electric Ind Co Ltd Decoding display device, image pickup unit, and image transmission system equipped with these

Similar Documents

Publication Publication Date Title
Hersent et al. IP Telephony: Packet-based multimedia communications systems
Chen et al. QoS requirements of network applications on the Internet
US7054820B2 (en) Control unit for multipoint multimedia/audio conference
EP1860851B1 (en) Method for implementing voice over IP through and electronic device connected to a packed switched network
US6944136B2 (en) Two-way audio/video conferencing system
US20100128715A1 (en) Protocol Conversion System in Media Communication between a Packet-Switching Network and Circuit-Switiching Network
WO2005099243A1 (en) Audio communication method and device
EP1178635B1 (en) Method for real time data communication
JP2005318534A (en) Method and apparatus for holding conference for perming stream selection
AU2006283294A1 (en) Method for signaling a device to perform no synchronization or include a syncronization delay on multimedia streams
CN1777152B (en) Data transmission between a media gateway and server
US7280650B2 (en) Method and apparatus to manage a conference
Johanson Supporting video-mediated communication over the Internet
Gong Multipoint audio and video control for packet-based multimedia conferencing
Rudkin et al. Real-time applications on the Internet
JP2005045738A (en) Calling device, calling method, and calling system
JP2002374297A (en) Voice communication terminal and voice communication system
Carôt et al. Fundamentals and principles of musical telepresence
JP2005528828A (en) Method and / or system for transferring / receiving audio and / or video signals and minimizing delay time on the internet network, and associated apparatus
KR100353163B1 (en) Internet Secure Phone System
JP2005045741A (en) Device, method and system for voice communication
JP2005045739A (en) Apparatus, method and system for telephone conversation
US7460671B1 (en) Encryption processing apparatus and method for voice over packet networks
EP3350969B1 (en) Multiplexing data
Francis‐Cobley et al. Voice over IP versus voice over frame relay

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080902