JPS6251844A - Stereo sound transmission system - Google Patents

Stereo sound transmission system

Info

Publication number
JPS6251844A
JPS6251844A JP60191746A JP19174685A JPS6251844A JP S6251844 A JPS6251844 A JP S6251844A JP 60191746 A JP60191746 A JP 60191746A JP 19174685 A JP19174685 A JP 19174685A JP S6251844 A JPS6251844 A JP S6251844A
Authority
JP
Japan
Prior art keywords
transmission
information
circuit
audio
transmitted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60191746A
Other languages
Japanese (ja)
Other versions
JPH0758938B2 (en
Inventor
Shigenobu Minami
重信 南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60191746A priority Critical patent/JPH0758938B2/en
Priority to CA000517216A priority patent/CA1268546A/en
Priority to US06/901,877 priority patent/US4815132A/en
Publication of JPS6251844A publication Critical patent/JPS6251844A/en
Publication of JPH0758938B2 publication Critical patent/JPH0758938B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To transmit stereo sounds of high quality even if a transmission line having a low transmission speed is used, by transmitting additional information which synthesizes the sound signal of one channel with sound signals of the other channels. CONSTITUTION:In the transmission side, sounds of the right channel are transmitted as they are, and a transfer function G(omega) or an impulse response H(k) is estimated in an estimating circuit 22 in accordance with sound signals of right and left channels. In this case, a part of the impulse response is extracted by a part extracting circuit 23 and is transmitted to raise the transmission speed. In the reception side, the received sound signal of the right channel is reproduced as it is and the sound signal of the left channel is synthesized and reproduced in a synthesizing circuit 24 in accordance with the sound signal of the right channel and an approximate transfer function G'(omega) or an approximate impulse response H'(k).

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は音声伝送方式に係わり、特にステレオ音声信号
の伝送方式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Technical Field of the Invention] The present invention relates to an audio transmission system, and particularly to a stereo audio signal transmission system.

[発明の技術的背景とその問題点] 近年、通信技術の進歩に伴い、遠隔地間で通信により会
議を行う遠隔会議システムの需要が増加している。
[Technical Background of the Invention and Problems Therewith] In recent years, with the advancement of communication technology, the demand for remote conference systems that conduct conferences between remote locations by communication has increased.

遠隔会議システムは、一般にテレビ画像、電子黒板、フ
ァックス等の画像情報と音声情報とを遠隔地間でやりと
りするので、これらの情報の伝送コストの低下が望まれ
ている。特に、現在の一般加入者線で伝送可能な64k
bps程度の伝送速度でこれらの情報を伝送できれば、
光ファイバ等を用いた高品質の遠隔会議システムに比較
して、はるかに低コストで遠隔会議システムを実現でき
る。これは一般加入者までデジタル化されるl5DN(
総合サービスデジタルネットワーク)の完成時において
、中規模ないし小規模の企業や一般家庭まで含めた遠隔
会議システムの普及の鍵を握ると考えられる。
Since teleconferencing systems generally exchange image information such as television images, electronic whiteboards, and faxes, and audio information between remote locations, it is desired to reduce the cost of transmitting this information. In particular, 64k that can be transmitted on current general subscriber lines
If this information can be transmitted at a transmission speed of about bps,
A remote conference system can be realized at a much lower cost than a high-quality remote conference system using optical fiber or the like. This is the l5DN (
When the comprehensive service digital network (Comprehensive Service Digital Network) is completed, it is thought to hold the key to the spread of remote conferencing systems, including to medium-sized and small-sized businesses and even ordinary households.

このような低伝送速度、たとえば54kbpsの伝送路
を使用した遠隔会議システムにおいては、会議の運営に
支障を与えない範囲において、画像や音声の多量の情報
を圧縮することが必要となる。
In a remote conference system using a transmission path of such a low transmission speed, for example, 54 kbps, it is necessary to compress a large amount of information such as images and audio to the extent that it does not interfere with the operation of the conference.

第8図は、従来の遠隔会議システムの構成図であり、音
声のマンマシンインターフェイスであるマイク1、スピ
ーカ2と、画像のマンマシンインターフェイスであるテ
レビカメラ3、テレビモニタ4、電子黒板5、ファック
ス6、テレライティング装置7と、音声データを16k
bpsに符号、複号化する音声ユニット8と、後で述べ
る画像ユニットを制御する制御ユニット9と、制御ユニ
ット9への指示を入力する制御バット10と、制御ユニ
ット9により指定された画像信号を48kbpsに符号
、複号化する画像ユニット11と、64kbpSの伝送
路12を介してこれら音声、画像信号の送信および受信
を行う伝送ユニット13より構成されている。
FIG. 8 is a configuration diagram of a conventional teleconferencing system, which includes a microphone 1 and a speaker 2 as an audio man-machine interface, a television camera 3 as an image man-machine interface, a television monitor 4, an electronic whiteboard 5, and a fax machine. 6. Telewriting device 7 and audio data of 16k
an audio unit 8 that encodes and decodes the image signals specified by the control unit 9; It is comprised of an image unit 11 that encodes and decodes at 48 kbps, and a transmission unit 13 that transmits and receives these audio and image signals via a 64 kbps transmission line 12.

このような低伝送速度の伝送路を使用する遠隔会議シス
テムにおいてはモノラル音声でさえ、たとえばADPC
M等の音声データ圧縮処理により、16kbpS等の低
伝送容量に圧縮する必要があり、したがって、通常ステ
レオ音声は用いられていない。
In a remote conference system that uses such a low transmission speed transmission path, even monaural audio can be transmitted using, for example, ADPC
It is necessary to compress the audio data to a low transmission capacity such as 16 kbps through audio data compression processing such as M, and therefore stereo audio is not normally used.

一方、遠隔会議システムにおいては臨場感を出すために
も、相手型の堆力(話しているかを知る話者識別のため
にも、ステレオ音声の採用が望ましいことはよく知られ
ている。
On the other hand, it is well known that it is desirable to employ stereo audio in remote conference systems in order to create a sense of realism and to identify the speaker to know who is speaking.

さて、このような長所を持つステレオ音声を、前述のよ
うな低伝送速度の伝送路を使用する遠隔会議システムに
導入しようとしたとき、従来のステレオ音声伝送方式に
よれば、第9図のようなステレオ音声伝送部が必要とな
る。このステレオ音声伝送部では、音声情報は左右2チ
ャンネルとなり、モノラル時の2倍の伝送容量が必要と
なる。
Now, when attempting to introduce stereo audio, which has these advantages, into a remote conference system that uses a low transmission speed transmission line as described above, according to the conventional stereo audio transmission method, as shown in Figure 9, A stereo audio transmission section is required. In this stereo audio transmission section, audio information is transmitted in two channels, left and right, and requires twice as much transmission capacity as when monaural.

したがって、従来手法で低伝送速度、たとえば64kb
psの伝送路を使用する遠隔会議システムにステレオ音
声を導入する方法としては、(イ)音声の1チヤンネル
の伝送情報量を8kbpsに圧縮する方法 (ロ)画像の伝送情報量を48kbpsから32kbp
sに減らす方法 等が考えられる。
Therefore, with conventional methods, low transmission rates, e.g. 64kb
Methods for introducing stereo audio into a remote conference system that uses a PS transmission path include (a) a method of compressing the amount of information transmitted in one channel of audio to 8 kbps; and (b) a method of compressing the amount of information transmitted of images from 48 kbps to 32 kbps.
One possible method is to reduce the number to s.

しかし、(イ)は音声の品質が劣化するし、(ロ)は画
像の品質の劣化ないしはサービスの低下をきたすという
問題がある。
However, the problem of (a) is that the quality of the audio deteriorates, and the problem of (b) is that the quality of the image or the service deteriorates.

以上のように、従来のステレオ音声伝送方式では、低伝
送速度の伝送路を使用した遠隔会議システムにステレオ
音声を導入することは大変困難であった。
As described above, with the conventional stereo audio transmission method, it is very difficult to introduce stereo audio into a remote conference system that uses a transmission path with a low transmission speed.

[発明の目的コ 本発明は上記の事情に基づいてなされたもので、低伝送
速度の伝送路において使用しても、低コストで高品質の
ステレオ音声の伝送を可能とするステレオ音声伝送方式
を提供するものである。
[Purpose of the Invention] The present invention has been made based on the above circumstances, and provides a stereo audio transmission method that enables transmission of high-quality stereo audio at low cost even when used on a transmission line with a low transmission speed. This is what we provide.

[発明の概要] 本発明は、複数チャンネルの音声信号を伝送するステレ
オ音声伝送方式において、送信側は複数チャンネルの音
声信号のうち少なくとも1つのチャンネルの音声信号よ
りなる主情報と、前記主情  。
[Summary of the Invention] The present invention provides a stereo audio transmission system that transmits audio signals of multiple channels, in which a transmitting side receives main information consisting of an audio signal of at least one channel among the audio signals of multiple channels, and the main information.

報より残りのチャンネルの音声信号を合成するために必
要な付加情報とを符号化した後伝送し、受信側は前記主
情報を送信した各チャンネルの音声信号は複号化により
再現し、残りのチャンネルは前記主情報と前記付加情報
より合成、再現することにより、低伝送速度の伝送路に
おいて使用しても、低コストで高品質のステレオ音声の
伝送を可能とした。
The additional information necessary to synthesize the audio signals of the remaining channels is encoded and transmitted from the information, and the receiving side reproduces the audio signals of each channel from which the main information was transmitted by decoding, and By synthesizing and reproducing the channel from the main information and the additional information, it is possible to transmit high-quality stereo audio at low cost even when using a transmission line with a low transmission speed.

[発明の実施例] 以下、本発明を遠隔会議システムを例として図面を参照
しながら説明する。
[Embodiments of the Invention] Hereinafter, the present invention will be described using a remote conference system as an example with reference to the drawings.

なお、以下の説明では、説明を簡略化するため、伝送方
向は片方向のみ示す。また通常の会議においては、一方
の会議場の複数話者(第9図のA1−A4、Bl〜84
)が同時に話すことはまれであると考えられ、また仮に
一方の会議場の話者が複数同時に話す場合でも、これら
の音声をステレオ伝送する必要性は、1人の話者が話し
ている場合に比べて低いと考えられる。このため以下の
実施例では、会議の大部分を占める単独発言をステレオ
音声伝送する場合のみを説明する。
Note that in the following description, only one transmission direction will be shown to simplify the description. In addition, in a normal conference, multiple speakers in one conference room (A1-A4, Bl-84 in Figure 9)
) speaking at the same time, and even if multiple speakers in one conference room speak at the same time, there is no need to transmit these sounds in stereo because only one speaker is speaking. is considered to be lower than that of For this reason, in the following embodiments, only a case will be described in which stereo audio is transmitted for individual speeches that make up most of the conference.

まず、簡単に本発明の原理の定性的な説明を行なう。First, a qualitative explanation of the principle of the present invention will be briefly given.

最初に単独発言の音声×(ω)が、左右各チャンネルの
マイクへ入力される。ただし、壁等からのエコーは無視
するものとし、ωは各周波数をあられすものとする。
First, the voice ×(ω) of a single utterance is input to the microphones of the left and right channels. However, echoes from walls etc. are ignored, and ω is defined as each frequency.

このとき、左右各チャンネルでの伝達関数をGR(ω)
、GL (ω)とすれば、左右各チャンネルの入力音声
YL (ω)、YR(ω)はYL ((c)) =GL
 ((c)) X (ω) ”” (1)YI! (ω
)=G*  (ω)X (ω)= (2>となる。ざら
に、両式より YL (ω)=(GL(ω)/Gt  (ω))・YR
(ω)   ・・・・・・(3)=G(ω)Yg(ω)
・・・・・・(4)となり、伝達関数G(ω)さえわか
れば、右チャンネルの音声から左チャンネルの音声が再
現できることになる。
At this time, the transfer function for each left and right channel is GR(ω)
, GL (ω), the input audio YL (ω) and YR (ω) of each left and right channel are YL ((c)) = GL
((c)) X (ω) ”” (1) YI! (ω
)=G* (ω)
(ω) ・・・・・・(3)=G(ω)Yg(ω)
(4), and as long as the transfer function G(ω) is known, the left channel sound can be reproduced from the right channel sound.

本発明は、このような解析に基づき、ステレオ伝送の場
合に、両チャンネルの音声を独立に送ることをしなくと
も、一方のチャンネルの音声と、伝達関数を送れば、受
信側で両チャンネルの音声を再現でき、ステレオ伝送が
達成される。しかも、この場合の伝達関数は、単なる遅
延と減衰とで規定されるので、その情報量は音声YL 
 (ω)の情報量よりもはるかに少なく、より少ない伝
送量でステレオ伝送が可能となる。
Based on this analysis, the present invention proposes that in the case of stereo transmission, even if the audio of both channels is not sent independently, if the audio of one channel and the transfer function are sent, the receiving side can transmit the audio of both channels. Audio can be reproduced and stereo transmission can be achieved. Moreover, since the transfer function in this case is defined by mere delay and attenuation, the amount of information is
This is much less than the information amount of (ω), and stereo transmission is possible with a smaller amount of transmission.

第1図は本発明の第1の実施例に係わる伝送方式を実施
するステレオ音声伝送システムの概略構成図である。
FIG. 1 is a schematic diagram of a stereo audio transmission system implementing a transmission method according to a first embodiment of the present invention.

このステレオ音声伝送システムは左右チャンネルのマイ
ク1β、1rとスピーカ2β、2rと、伝達関数G(ω
)を推定する推定回路20と、伝達関数G(ω)と右チ
ャンネルの音声信号YI2(ω)より左チャンネルの音
声信号YL  (ω)を合成する合成回路21より構成
されている。
This stereo audio transmission system consists of left and right channel microphones 1β, 1r, speakers 2β, 2r, and a transfer function G(ω
), and a synthesis circuit 21 that synthesizes the left channel audio signal YL (ω) from the transfer function G(ω) and the right channel audio signal YI2(ω).

同図において、上述したように話者A1が発した音声X
(ω)は右チャンネルのマイク1rには音声信号YR(
ω)として、左チャンネルのマイク1λには音声信号Y
L  (ω)として伝わる。発信側では、右チャンネル
の音声信号YR(ω)はそのまま伝送され、左チャンネ
ルの音声信号YL(ω)は右チャンネルの音声信号YR
(ω)とともに推定回路20に入力され、推定回路20
において G(ω)=YL(ω)/Yt  (ω)より伝達関数G
(ω)が推定された後、このG(ω)が伝送される。
In the figure, the voice X uttered by speaker A1 as described above
(ω) is the audio signal YR (
ω), the left channel microphone 1λ receives an audio signal Y
It is transmitted as L (ω). On the transmitting side, the right channel audio signal YR(ω) is transmitted as is, and the left channel audio signal YL(ω) is transmitted as the right channel audio signal YR.
(ω) is input to the estimation circuit 20, and the estimation circuit 20
From G(ω)=YL(ω)/Yt(ω), the transfer function G
After (ω) is estimated, this G(ω) is transmitted.

受信側では、右チャンネルの音声信号YR(ω)はその
まま再生され、左、チャンネルの音声信号YL (ω)
は、伝達関数G(ω)と右チャンネルの音声信号YR(
ω)を合成回路21に入力し、合成回路21において YL (ω)=G(ω)Y$!(ω) より合成、再現される。
On the receiving side, the right channel audio signal YR (ω) is reproduced as is, and the left channel audio signal YL (ω)
is the transfer function G(ω) and the right channel audio signal YR(
ω) is input to the synthesis circuit 21, and in the synthesis circuit 21, YL (ω)=G(ω)Y$! (ω) Synthesized and reproduced.

このとき、G(ω)は式(3)、(4)より、G(ω)
=GL(ω)/GR(ω)・・・(5)ここでGR(ω
)、GL(ω)は、室内の音声特性、話者の位置により
決まるものであり、音声X(ω)には影響されない。
At this time, from equations (3) and (4), G(ω)
=GL(ω)/GR(ω)...(5) Here, GR(ω)
), GL(ω) are determined by the voice characteristics in the room and the position of the speaker, and are not affected by the voice X(ω).

したがって、式(5)より伝達関数G(ω)は発言者が
変わらないうちは定常であり、この定常状態の継続時間
は数1QQmsec以上が大部分を占めると考えられる
Therefore, from equation (5), it is considered that the transfer function G(ω) is steady as long as the speaker does not change, and that the duration of this steady state is mostly several QQ msec or more.

一方音声X(ω)は非定常であり、式(1)、(2)よ
り左右チャンネルの音声信号YL  (ω)、YR(ω
)もともに非定常となる。よって伝達関数G(ω)が非
常に複雑な場合、すなわち室内の残響時間が長い場合を
除いて、伝達関数G(ω)の情報量の方がYL (ω)
の情報量より少なくなるので、伝達関数G(ω)を伝送
するこの実施例の方が、YL  (ω)を伝送する従来
のステレオ音声伝送方式に比べて有利である。
On the other hand, the audio X(ω) is unsteady, and from equations (1) and (2), the left and right channel audio signals YL(ω) and YR(ω
) are both unsteady. Therefore, unless the transfer function G(ω) is very complex, that is, the reverberation time in the room is long, the amount of information in the transfer function G(ω) is greater than YL (ω).
This embodiment, which transmits the transfer function G(ω), is more advantageous than the conventional stereo audio transmission system which transmits YL(ω).

第2図は本発明の第2の実施例に係る伝送方式を実施す
るステレオ音声伝送システムの概略構成図である。この
ステレオ音声伝送システムは左右チャンネルのマイク1
β、1rと、スピーカ2β、2rと、伝達関数G(ω)
またはインパルス応答1−((k)を推定する推定回路
22と、伝達関数G(ω)またはインパルス応答H(k
)より近似伝達関数G(ω)または近似インパルス応答
1−1 (k)を抽出する部分抽出回路23と、このG
(ω)またはH(k)より左チャンネルの音声信号YL
(ω)を合成する合成回路24とより構成されている。
FIG. 2 is a schematic configuration diagram of a stereo audio transmission system implementing a transmission method according to a second embodiment of the present invention. This stereo audio transmission system has one microphone for the left and right channels.
β, 1r, speakers 2β, 2r, and transfer function G(ω)
or the estimation circuit 22 that estimates the impulse response 1-((k), and the transfer function G(ω) or the impulse response H(k
), a partial extraction circuit 23 extracts the approximate transfer function G(ω) or the approximate impulse response 1-1(k), and
Audio signal YL of the left channel from (ω) or H(k)
(ω).

ただし、伝達関数G(ω)のにサンプル時点のインパル
ス応答をl−1(k)とし、H(k) = (h−M 
(k) 、 h−間++(k)。
However, let the impulse response at the sampling point of the transfer function G(ω) be l-1(k), and H(k) = (h-M
(k), between h-++(k).

・・・・・・、hN(k))’、 王は転置行列を示し、Mho、N>01ho  (k)
をセンタタップとする。
......, hN(k))', Wang indicates the transposed matrix, Mho, N>01ho (k)
is the center tap.

この実施例においては前記実施例と同様に、送信側では
、右チャンネルの音声信号はそのまま伝送され、左右チ
ャンネルの音声信号より伝達関数G(ω)あるいはイン
パルス応答H(k)が推定回路22により推定される。
In this embodiment, as in the previous embodiment, the right channel audio signal is transmitted as is on the transmitting side, and the transfer function G(ω) or impulse response H(k) is determined by the estimation circuit 22 from the left and right channel audio signals. Presumed.

このとき推定されたインパルス応答H(k)は、第3図
(A)に示すような一1000〜+2000サンプル間
継続する形状をしているとし、説明を簡単にするため、
話者は平均500m5ecの開発言を継続しているもの
とする。
It is assumed that the impulse response H(k) estimated at this time has a shape that continues for 11000 to +2000 samples as shown in FIG. 3(A), and for the sake of simplicity,
It is assumed that the speaker continues to speak words with an average length of 500 m5ec.

このとき、各サンプル値を8ビツトで量子化して伝送す
ると、このインパルス応答を伝送するために必要な伝送
速度は、8x3000x 2=48k b p sであ
り、非常に大きな値となる。
At this time, if each sample value is quantized with 8 bits and transmitted, the transmission rate required to transmit this impulse response is 8 x 3000 x 2 = 48 kbps, which is a very large value.

このため、第3図(B)に示すように、インパルス応答
の一部、たとえば−20〜+80サンプルを部分抽出回
路23により抽出して伝送する。
Therefore, as shown in FIG. 3(B), a part of the impulse response, for example, -20 to +80 samples, is extracted by the partial extraction circuit 23 and transmitted.

この場合の伝送速度は1.6kbpsとなり、15kb
pSのADPCMに比較すると、この方式の方が有利で
ある。
In this case, the transmission speed is 1.6kbps, which is 15kbps.
This method is more advantageous than pS ADPCM.

ざらに、ステレオの立体感は、音の位相および遅延によ
り決まることを考えると、第3図(C)のように全タッ
プの中で最大の大きさを持つメインタップの位置と大き
ざのみを抽出し、伝送しても、多少臨場感は劣るが、大
きさに8ビツト、位置に8ビツトとすると32bpsと
なり、伝送容量を大幅に減少させることが可能となる。
Roughly speaking, considering that the three-dimensional effect of stereo is determined by the phase and delay of the sound, the position and size of the main tap, which is the largest of all the taps, is determined as shown in Figure 3 (C). Even if extracted and transmitted, the sense of realism is somewhat inferior, but if the size is set to 8 bits and the position is set to 8 bits, the speed becomes 32 bps, making it possible to significantly reduce the transmission capacity.

受信側では、伝送されてきた右チャンネルの音声信号は
そのまま再生し、この右チャンネルの音声信号と近似伝
達関数G(ω)あるいは近似インパルス応答H(k)と
より合成回路24において、左チャンネルの音声信号を
合成、再現する。
On the receiving side, the transmitted right channel audio signal is reproduced as is, and the left channel audio signal is reproduced in the synthesis circuit 24 from the right channel audio signal and the approximate transfer function G(ω) or the approximate impulse response H(k). Synthesize and reproduce audio signals.

前記実施例で述べたように、伝達関数G(ω)が簡単な
場合、G(ω)を伝送するほうが左チャンネルの音声信
@YL (ω)を伝送するよりも有利であるが、G(ω
)が非常に複雑な場合には、G(ω)を伝送するほうが
不利になる。このため、この実施例では、伝達関数G(
ω)の代りに伝達関数G(ω)あるいはインパルス応答
H(k)の近似情報を伝送することにより、伝送情報量
を減少させている。
As mentioned in the previous embodiment, when the transfer function G(ω) is simple, it is more advantageous to transmit G(ω) than to transmit the left channel audio signal @YL (ω), but G( ω
) is very complex, it becomes disadvantageous to transmit G(ω). Therefore, in this example, the transfer function G(
By transmitting approximation information of the transfer function G(ω) or impulse response H(k) instead of ω), the amount of transmitted information is reduced.

第4図はこの実施例の伝送方式を近似インパルス応答の
伝送により実施する送信側回路(A)と受信側回路(B
)のブロック構成図である。
Figure 4 shows a transmitting side circuit (A) and a receiving side circuit (B) that implement the transmission method of this embodiment by transmitting approximate impulse responses.
) is a block configuration diagram of.

送信側の回路(A>はマイク1λ、1rと、増幅器25
,2.25rと、A/D変換器26Jl、26rと、適
応フィルタ27と遅延回路28f!、、28rと、減算
器29と、近似回路30と、しきい値検出回路31と、
レベル検出回路32a、32bと、レベル比検出回路3
3と、ADPCM回路34と、伝送回路35とにより構
成されている。
Transmitting side circuit (A> is microphone 1λ, 1r, amplifier 25
, 2.25r, A/D converters 26Jl, 26r, adaptive filter 27, and delay circuit 28f! , 28r, the subtracter 29, the approximation circuit 30, the threshold detection circuit 31,
Level detection circuits 32a and 32b and level ratio detection circuit 3
3, an ADPCM circuit 34, and a transmission circuit 35.

また受信側の回路(B)は分離回路36と、ADPCM
回路37と、D/A変換器38β、38rと、増幅器3
9β、39rと、スピーカ2p、2rと、係数作製回路
40と、フィルタ41によって構成されている。
Further, the receiving side circuit (B) includes a separation circuit 36 and an ADPCM
circuit 37, D/A converters 38β, 38r, and amplifier 3
9β and 39r, speakers 2p and 2r, a coefficient generation circuit 40, and a filter 41.

左右各チャンネルの音声信号はマイク1λ、1rより入
力され、適当なレベルに増幅器25J2.25rにより
増幅された俊、サンプリング周波数を8kHzとしたA
/D変換器26ぶ、26rにおいて、それぞれにサンプ
ル時点のデジタル値XL(k) 、XR(k)に変換さ
れる。
The audio signals of each left and right channel were input from microphones 1λ and 1r, and were amplified to an appropriate level by amplifier 25J2.25r.
The /D converters 26 and 26r convert the signals into digital values XL(k) and XR(k) at the sampling time, respectively.

その後、右チャンネルの音声信号xi  (k)は25
6タツプの適応フィルタに入力され、一方左チヤンネル
の音声信号XL (k)は適応フィルタにおけるセンタ
タップの位置を調節するため、遅延回路28でdサンプ
ル遅延され、XL(k−d)として減算器29に入力さ
れる。減算器29は適応フィルタの出力XL  (k)
をXt(k−d)から差引き、誤差信号e(k)を生成
する。適応フィルタはこの誤差信号の電力を評価関数と
し、たとえば良く知られている学理同定法等の手法によ
り、誤差電力を最小にすべくタップ係数を調節する。
After that, the audio signal xi (k) of the right channel is 25
The audio signal XL (k) of the left channel is inputted to a 6-tap adaptive filter, and the left channel audio signal XL (k) is delayed by d samples in a delay circuit 28 to adjust the center tap position in the adaptive filter, and then sent to a subtracter as XL (k-d). 29. The subtracter 29 outputs the adaptive filter output XL (k)
is subtracted from Xt(k-d) to generate an error signal e(k). The adaptive filter uses the power of this error signal as an evaluation function, and adjusts the tap coefficients to minimize the error power using, for example, a well-known method such as the theoretical identification method.

したがって、適応フィルタの学習が進めばXL  (k
−d)=Xt  (k) となり、右チャンネルの音声信号から左チャンネルの音
声信号が合成できる。
Therefore, if learning of the adaptive filter progresses, XL (k
-d)=Xt (k), and the left channel audio signal can be synthesized from the right channel audio signal.

近似回路30は、以上の処理によって得られた適応フィ
ルタのタップ係数の情報量を、伝送速度に合せて圧縮す
る。この近似の手法は第3図に示したように種々考えら
れるが、この実施例においては同図(B)の手法を採用
し、近似回路は適応フィルタのタップ係数fi+  (
k)〜h256(k)の中から、メインタップのタップ
係数、たとえばhloo(k)を探しだし、この実施例
の伝送速度l kbpsにあわせ、h  (k)〜h1
11(k)までの前後23個のタップ係数を8ビツトに
量子化し、8ビツトにコード化されたメインタップの位
置と、一連の情報の最初であることを示す8ビツトのヘ
ッダとともに、第5図に示すようにフレーム化し付加情
報として伝送回路35に送る。
The approximation circuit 30 compresses the information amount of the tap coefficients of the adaptive filter obtained through the above processing in accordance with the transmission speed. Various methods for this approximation can be considered as shown in FIG. 3, but in this embodiment, the method shown in FIG.
Find the tap coefficient of the main tap, for example hloo(k), from k) to h256(k), and calculate h(k) to h1 according to the transmission speed l kbps of this embodiment.
The 23 tap coefficients before and after 11(k) are quantized to 8 bits, and the 5th tap is quantized to 8 bits, along with the main tap position encoded in 8 bits and an 8 bit header indicating the beginning of a series of information. As shown in the figure, it is framed and sent to the transmission circuit 35 as additional information.

なお、適応フィルタによるタップ係数の近似は話者が変
った時点で行えばよく、しきい値検出回路31で誤差e
(k)のレベルがしきい値を超え、その後しきい値以下
になったことにより話者が変わったことを知ることがで
きる。
Note that the approximation of the tap coefficients by the adaptive filter only needs to be performed when the speaker changes, and the threshold value detection circuit 31 detects the error e.
When the level of (k) exceeds the threshold and then falls below the threshold, it can be determined that the speaker has changed.

このことを第6図により、ざらに詳細に説明する。This will be roughly explained in detail with reference to FIG.

同図において、話者が400m5ecの時刻でAからB
へ変化しており、伝達関数はGA(ω)からGe (ω
)へ、インパルス応答はHA(k)からHe (k)に
変化している。このとき適応フィルタはインパルス応答
の変化に追随すべく学習し、タップ係数は変化するため
、一時的にXL(k−d)≠XL  (k)となり、誤
差e (k)のレベルが増加する。したがってe(k)
のレベルが増加し、その後減少し安定した時点、この図
では60Q m5ecの時刻で付加情報の更新を行えば
良い。
In the same figure, the speaker is moving from A to B at a time of 400 m5ec.
The transfer function changes from GA(ω) to Ge(ω
), the impulse response changes from HA(k) to He(k). At this time, the adaptive filter learns to follow changes in the impulse response and the tap coefficients change, so XL(k-d)≠XL(k) temporarily holds, and the level of error e(k) increases. Therefore e(k)
The additional information may be updated at the time when the level increases, then decreases, and becomes stable, which is 60Q m5ec in this figure.

第4図の送信側回路(A>では、適応フィルタの学習時
間を200m5ec以下とし、実際の話者の変化より2
00m5ec後に付加情報を更新している。
In the transmission side circuit (A>) shown in Figure 4, the learning time of the adaptive filter is set to 200 m5ec or less, and the
Additional information is updated after 00m5ec.

このため、遅延回路28rにより主情報の音声信号XR
(k)も2 Q □m5ec遅延させ、付加情報に同期
させている。
Therefore, the delay circuit 28r causes the main information audio signal XR to
(k) is also delayed by 2 Q □m5ec and synchronized with the additional information.

さらにこの付加情報には、適応フィルタのタップ係数の
一部しか含まれていないため、そのまま伝送したのでは
受信側で合成した左チャンネルの^ 音声信@XL (k)のレベルが低くなる。これを防ぐ
ため、レベル検出回路32a、32bとレベル比検出回
路33により、XR(k)とXL  (k)のレベル比
を検出し、近似回路30において近似タップ係数の補正
を行い、XL  (k)のレベルが適正となるようにす
る。この後、伝送速度1kbpsのフレームとして伝送
回路35に送られる。
Furthermore, since this additional information includes only a part of the tap coefficients of the adaptive filter, if it is transmitted as is, the level of the left channel voice signal XL (k) synthesized on the receiving side will be low. To prevent this, the level detection circuits 32a and 32b and the level ratio detection circuit 33 detect the level ratio of XR(k) and XL(k), and the approximation circuit 30 corrects the approximate tap coefficients. ) level is appropriate. Thereafter, it is sent to the transmission circuit 35 as a frame at a transmission rate of 1 kbps.

伝送回路35は、この付加情報と、遅延回路28rから
得られる右チャンネルの音声信号を、ADPCM回路3
4により伝送速度15kbpsのADPCM符号に変換
した主情報とを合せて16kbpsのステレオ音声情報
とし、伝送路を介して受信側の回路(B)へ送信する。
The transmission circuit 35 transmits this additional information and the right channel audio signal obtained from the delay circuit 28r to the ADPCM circuit 3.
4 and the main information converted into an ADPCM code with a transmission rate of 15 kbps to form 16 kbps stereo audio information, which is transmitted to the receiving side circuit (B) via the transmission path.

受信側の回路(B)へ送られてきたこのステレオ音声情
報は、分離回路36で主情報の15kbpsの右チヤン
ネル音声信号と1kbpsの付加情報に分離される。右
チャンネルの音声信号はADPCM回路37で複号化さ
れた後、D/A変換器38rでアナログ変換され、増幅
器39rにより増幅され、スピーカ2rより出力される
This stereo audio information sent to the receiving circuit (B) is separated by the separation circuit 36 into a 15 kbps right channel audio signal of main information and 1 kbps additional information. The right channel audio signal is decoded by the ADPCM circuit 37, then analog-converted by the D/A converter 38r, amplified by the amplifier 39r, and output from the speaker 2r.

一方、付加情報は係数作製回路40で256タツプのタ
ップ係数に変換され、フィルタ41に与えられる。次に
フィルタ41はこの与えられたタップ係数と入力された
右チャンネルの音声信号より、左チャンネルの音声信号
を合成する。合成された左チャンネルの音声信号は右チ
ャンネルの音声信号と同じように、D/A変換器381
.でアナログ変換され、増幅器39β、スピーカ2βを
経て出力される。
On the other hand, the additional information is converted into 256 tap coefficients by the coefficient generation circuit 40 and provided to the filter 41. Next, the filter 41 synthesizes a left channel audio signal from the given tap coefficients and the input right channel audio signal. The synthesized left channel audio signal is sent to the D/A converter 381 in the same way as the right channel audio signal.
.. The signal is converted into an analog signal and output via an amplifier 39β and a speaker 2β.

このように、この実施例は現在の技術で容易に実現でき
、かつ遠隔会議システムにおけるステレオ信号の伝送情
報量を大幅に圧縮することができる。
As described above, this embodiment can be easily implemented using current technology, and can significantly compress the amount of information transmitted in a stereo signal in a teleconferencing system.

なおこの実施例では、適応フィルタ27とフィルタ41
は時間領域処理のトランスバーサル型フィルタとしたが
、これらを周波数領域で処理するフィルタに置き換えて
も、同様の効果を期待できる。
Note that in this embodiment, the adaptive filter 27 and the filter 41
Although transversal type filters are used for time domain processing, similar effects can be expected even if these are replaced with filters that process in the frequency domain.

第7図は本発明の第3の実施例に係わる伝送方式を実施
するステレオ音声伝送システムの概略構成図である。こ
のステレオ音声伝送システムは左右各チャンネルのマイ
ク1,911rと、スピーカ2λ、2rと、伝達関数G
(ω)またはインパルス応答H(k)を推定する推定回
路22と、近似伝達関数G(ω)または近似インパルス
応答H(k)を抽出する部分抽出回路23と、あらかじ
め収集されている近似伝達関数G(ω)または近似イン
パルス応答H(k)のテーブル42a、42bと、コー
ド化回路43と、コード解読回路44と、近似伝達関数
G(ω)または近似インパルス応答’H” (、k )
と右チヤンネル音声信号より左チヤンネル音声信号を合
成する合成回路24とにより構成されている。
FIG. 7 is a schematic configuration diagram of a stereo audio transmission system implementing a transmission method according to a third embodiment of the present invention. This stereo audio transmission system includes a microphone 1,911r for each left and right channel, speakers 2λ, 2r, and a transfer function G.
(ω) or impulse response H(k); a partial extraction circuit 23 that extracts approximate transfer function G(ω) or approximate impulse response H(k); and approximate transfer functions collected in advance. G(ω) or approximate impulse response H(k) tables 42a, 42b, encoding circuit 43, code decoding circuit 44, approximate transfer function G(ω) or approximate impulse response 'H'' (,k)
and a synthesis circuit 24 that synthesizes a left channel audio signal from a right channel audio signal.

この実施例では、送信側はあらかじめ収集した近似伝達
関数G(ω)あるいは近似インパルス応答H(k)のテ
ーブル42aと部分抽出回路23より出力された近似伝
達関数G(ω)あるいは近似インパルス応答H(k)と
のパターン比較をコード化回路43で行い、最も近いパ
ターンのコードqを伝送する。そして受信側において、
コードqとテーブル42bをもとに近似伝達関数G(ω
)または近似インパルス応答H(k)をコード解読回路
44で作成し、これと右チャンネルの音声信号より左チ
ャンネルの音声信号を合成回路24で合成する。このよ
うにこの実施例によれば、会議室の音響特性が既知の場
合には、伝送情報量を減らしつつ、臨場感を保つことが
可能となる。
In this embodiment, the transmitting side uses a table 42a of approximate transfer functions G(ω) or approximate impulse responses H(k) collected in advance and approximate transfer functions G(ω) or approximate impulse responses H output from the partial extraction circuit 23. A pattern comparison with (k) is performed by the encoding circuit 43, and the code q of the closest pattern is transmitted. And on the receiving side,
Approximate transfer function G(ω
) or an approximate impulse response H(k) is created by the code decoding circuit 44, and the synthesis circuit 24 synthesizes this with the left channel audio signal from the right channel audio signal. As described above, according to this embodiment, if the acoustic characteristics of the conference room are known, it is possible to maintain a sense of realism while reducing the amount of transmitted information.

なお、以上の実施例では、2チヤンネルのステレオ音声
伝送方式を説明したが、本発明は3チャンネル以上のス
テレオ音声伝送方式にも適用できる。
In the above embodiments, a two-channel stereo audio transmission system has been described, but the present invention can also be applied to a three-channel or more stereo audio transmission system.

また本発明のステレオ音声伝送方式は遠隔合議システム
に限らず、他のステレオ音声伝送システムに対して適用
することも可能である。
Further, the stereo audio transmission system of the present invention is not limited to remote conference systems, but can also be applied to other stereo audio transmission systems.

[発明の効果] 以上詳細に説明したように本発明によれば、ステレオ音
声伝送において音声信号よりなる主情報とこの主情報よ
り残りのチャンネルの音声信号を再生するのに必要とさ
れる付加情報とを伝送するようにしたので、モノラル音
声伝送時と比べても大幅に情報量を増やすことなく、ス
テレオ音声を伝送することができ、低伝送速度の伝送路
においても低コストで高品質のステレオ音声の伝送が可
能となる。
[Effects of the Invention] As explained in detail above, according to the present invention, main information consisting of an audio signal and additional information required to reproduce the audio signals of the remaining channels from this main information in stereo audio transmission. As a result, stereo audio can be transmitted without significantly increasing the amount of information compared to monaural audio transmission, and high-quality stereo can be transmitted at low cost even on low-speed transmission lines. Audio transmission becomes possible.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の第1の実施例の伝送方法を実施するス
テレオ音声伝送システムの概略構成図、第2図は本発明
の第2の実施例の伝送方法を実施するステレオ音声伝送
システムの概略構成図、第3図はインパルス応答のグラ
フ、第4図は同実施例を実施する回路のブロック構成図
、第5図は同実施例におけるフレーム構成図、第6図は
同実施例におけるタイムチャート図、第7図は本発明の
第3の実施例の伝送方式を実施するステレオ音声伝送シ
ステムの概略構成図、第8図は従来の遠隔会議システム
の構成図、第9図は従来のステレオ音声伝送システムの
概略図である。 20.22・・・推定回路 21.24・・・合成回路 23・・・・・・・・・・・・部分抽出回路43・・・
・・・・・・・・・コード化回路44・・・・・・・・
・・・・コード解読回路出願人     株式会社 東
芝 代理人弁理士  須 山 佐 − 第1図 左←ン狛し       第 2 図 (A) (B) セシヲータツア CC’) 第3図 第4図 第5図 第6図 簿7図
FIG. 1 is a schematic configuration diagram of a stereo audio transmission system that implements the transmission method of the first embodiment of the present invention, and FIG. 2 shows a stereo audio transmission system that implements the transmission method of the second embodiment of the invention. Schematic configuration diagram, Figure 3 is a graph of impulse response, Figure 4 is a block configuration diagram of a circuit implementing the same example, Figure 5 is a frame configuration diagram in the same example, and Figure 6 is a time diagram in the same example. Chart diagram, FIG. 7 is a schematic configuration diagram of a stereo audio transmission system implementing the transmission method of the third embodiment of the present invention, FIG. 8 is a configuration diagram of a conventional remote conference system, and FIG. 9 is a diagram of a conventional stereo audio transmission system. FIG. 1 is a schematic diagram of an audio transmission system. 20.22... Estimation circuit 21.24... Synthesis circuit 23... Partial extraction circuit 43...
...... Encoding circuit 44 ......
...Code decoding circuit applicant: Toshiba Corporation Patent attorney Sa Suyama - Figure 1 Left ← Scroll down Figure 2 (A) (B) Seiwo Tatsua CC') Figure 3 Figure 4 Figure 5 Figure 6 Figure 7

Claims (3)

【特許請求の範囲】[Claims] (1)複数チャンネルの音声信号を伝送するステレオ音
声伝送方式において、送信側から受信側へ前記複数チャ
ンネルの音声信号のうち少なくとも1つのチャンネルの
音声信号よりなる主情報とこの主情報より残りのチャン
ネルの音声信号を合成するために必要な付加情報とを符
号化して伝送し、受信側において前記主情報が送信され
たチャンネルの音声信号を複号化により再現し、残りの
チャンネルの音声信号を前記主情報と前記付加情報より
合成、再現するようにしたことを特徴とするステレオ音
声伝送方式。
(1) In a stereo audio transmission system that transmits audio signals of multiple channels, from the transmitting side to the receiving side, main information consisting of the audio signal of at least one channel among the audio signals of the multiple channels, and the remaining channels based on this main information The additional information necessary to synthesize the audio signals of the main information is encoded and transmitted, and the receiving side reproduces the audio signal of the channel to which the main information was transmitted by decoding, and the audio signals of the remaining channels are encoded and transmitted. A stereo audio transmission system characterized in that main information and the additional information are synthesized and reproduced.
(2)付加情報が、伝達関数またはインパルス応答もし
くはこれらの近似情報である特許請求の範囲第1項記載
のステレオ音声伝送方式。
(2) The stereo audio transmission system according to claim 1, wherein the additional information is a transfer function, an impulse response, or approximate information thereof.
(3)付加情報が、伝達関数またはインパルス応答もし
くはこれらの近似情報のあらかじめ収集、蓄積されたデ
ータを識別する識別情報である特許請求の範囲第1項記
載のステレオ音声伝送方式。
(3) The stereo audio transmission system according to claim 1, wherein the additional information is identification information that identifies data that has been collected and accumulated in advance about a transfer function, an impulse response, or their approximation information.
JP60191746A 1985-08-30 1985-08-30 Stereo signal transmission encoding / decoding method, encoding device and decoding device Expired - Lifetime JPH0758938B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60191746A JPH0758938B2 (en) 1985-08-30 1985-08-30 Stereo signal transmission encoding / decoding method, encoding device and decoding device
CA000517216A CA1268546A (en) 1985-08-30 1986-08-29 Stereophonic voice signal transmission system
US06/901,877 US4815132A (en) 1985-08-30 1986-08-29 Stereophonic voice signal transmission system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60191746A JPH0758938B2 (en) 1985-08-30 1985-08-30 Stereo signal transmission encoding / decoding method, encoding device and decoding device

Publications (2)

Publication Number Publication Date
JPS6251844A true JPS6251844A (en) 1987-03-06
JPH0758938B2 JPH0758938B2 (en) 1995-06-21

Family

ID=16279812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60191746A Expired - Lifetime JPH0758938B2 (en) 1985-08-30 1985-08-30 Stereo signal transmission encoding / decoding method, encoding device and decoding device

Country Status (1)

Country Link
JP (1) JPH0758938B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5555310A (en) * 1993-02-12 1996-09-10 Kabushiki Kaisha Toshiba Stereo voice transmission apparatus, stereo signal coding/decoding apparatus, echo canceler, and voice input/output apparatus to which this echo canceler is applied
JP2008146081A (en) * 1993-06-05 2008-06-26 Robert Bosch Gmbh Redundancy reducing method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5555310A (en) * 1993-02-12 1996-09-10 Kabushiki Kaisha Toshiba Stereo voice transmission apparatus, stereo signal coding/decoding apparatus, echo canceler, and voice input/output apparatus to which this echo canceler is applied
JP2008146081A (en) * 1993-06-05 2008-06-26 Robert Bosch Gmbh Redundancy reducing method
JP4504414B2 (en) * 1993-06-05 2010-07-14 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング Redundancy reduction method

Also Published As

Publication number Publication date
JPH0758938B2 (en) 1995-06-21

Similar Documents

Publication Publication Date Title
US4815132A (en) Stereophonic voice signal transmission system
EP1763241B1 (en) Spatially correlated audio in multipoint videoconferencing
JP4255461B2 (en) Stereo microphone processing for conference calls
US9049339B2 (en) Method for operating a conference system and device for a conference system
JP3493372B2 (en) Method for synchronizing multimedia data and visual telephone terminal
US5555310A (en) Stereo voice transmission apparatus, stereo signal coding/decoding apparatus, echo canceler, and voice input/output apparatus to which this echo canceler is applied
KR100434583B1 (en) Teleconferencing bridge with edgepoint mixing
US20060198542A1 (en) Method for the treatment of compressed sound data for spatialization
US20080004866A1 (en) Artificial Bandwidth Expansion Method For A Multichannel Signal
JP3483086B2 (en) Audio teleconferencing equipment
JP2703405B2 (en) Polyphonic coding
JPH04151953A (en) Voice signal processing method in band split coding system
US8194851B2 (en) Voice processing apparatus, voice processing system, and voice processing program
JP3400064B2 (en) Speech codec, speech coder, and speech decoder
KR101597768B1 (en) Interactive multiparty communication system and method using stereophonic sound
JPS6251844A (en) Stereo sound transmission system
JP3207281B2 (en) Stereo speech encoding / decoding system, stereo speech decoding device, and single speech / multiple simultaneous speech discrimination device
JPS62239631A (en) Stereo sound transmission storage system
JPS6276958A (en) Voice transmission system
JP3207284B2 (en) Stereo audio transmission equipment
JPS6276938A (en) Stereophonic sound transmission system
Yensen et al. Synthetic stereo acoustic echo cancellation structure with microphone array beamforming for VoIP conferences
JPH01303852A (en) Stereo sound transmitting system
JPH07123028A (en) Voice conference equipment
JPH02202235A (en) Pseudo stereo audio signal transmitter

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term