JP3387088B2 - Optical recording medium, audio signal transmission method and audio decoding method - Google Patents

Optical recording medium, audio signal transmission method and audio decoding method

Info

Publication number
JP3387088B2
JP3387088B2 JP2000321501A JP2000321501A JP3387088B2 JP 3387088 B2 JP3387088 B2 JP 3387088B2 JP 2000321501 A JP2000321501 A JP 2000321501A JP 2000321501 A JP2000321501 A JP 2000321501A JP 3387088 B2 JP3387088 B2 JP 3387088B2
Authority
JP
Japan
Prior art keywords
prediction
signal
channel
data
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000321501A
Other languages
Japanese (ja)
Other versions
JP2001188565A (en
Inventor
美昭 田中
昭治 植野
徳彦 渕上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2000321501A priority Critical patent/JP3387088B2/en
Publication of JP2001188565A publication Critical patent/JP2001188565A/en
Application granted granted Critical
Publication of JP3387088B2 publication Critical patent/JP3387088B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声信号を予測符
号化して圧縮するための光記録媒体、音声信号伝送方法
及び音声復号方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical recording medium, a voice signal transmission method and a voice decoding method for predictively encoding and compressing a voice signal.

【0002】[0002]

【従来の技術】音声信号を高能率符号化する方法として
は、例えば特開昭58−75341号公報に示されるよ
うにハフマン符号が知られている。また、音声信号を予
測符号化する方法として、本発明者は先の出願(特願平
9−289159号)において1チャネルの原デジタル
音声信号に対して、特性が異なる複数の予測器により時
間領域における過去の信号から現在の信号の複数の線形
予測値を算出し、原デジタル音声信号とこの複数の線形
予測値から予測器毎の予測残差を算出し、この複数の予
測残差の最小値を選択する方法を提案している。
2. Description of the Related Art A Huffman code is known as a method for encoding a voice signal with high efficiency, as disclosed in, for example, Japanese Patent Laid-Open No. 58-75341. In addition, as a method of predictively encoding a voice signal, the present inventor has proposed that in the previous application (Japanese Patent Application No. 9-289159), a single domain original digital voice signal is processed in a time domain by a plurality of predictors having different characteristics. , A plurality of linear prediction values of the current signal are calculated from past signals, and a prediction residual of each predictor is calculated from the original digital audio signal and the plurality of linear prediction values, and the minimum value of the plurality of prediction residuals is calculated. Suggests a way to choose.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上記方
法では原デジタル音声信号がサンプリング周波数=96
kHz、量子化ビット数=20ビット程度の場合に、あ
る程度の圧縮効果を得ることができるが、近年のDVD
オーディオディスクではこの2倍のサンプリング周波数
(=192kHz)が使用され、また、量子化ビット数
も24ビットが使用される傾向があるので、圧縮率を改
善する必要がある。
However, in the above method, the original digital audio signal has a sampling frequency = 96.
In the case of kHz and the number of quantization bits = about 20 bits, some compression effect can be obtained.
Since the audio disk uses twice the sampling frequency (= 192 kHz) and the quantization bit number also tends to be 24 bits, it is necessary to improve the compression rate.

【0004】ところで、CD再生装置のような簡易機種
と、DVD再生装置のような上位機種の両方の再生装置
が再生可能にするために、例えば特開平9−31206
6号公報に示されるように上位機種のみが再生可能な2
0ビット(又は24ビット)のサンプルデータを、簡易
機種が再生可能な上位16ビットと下位4ビット(又は
8ビット)に分離して伝送する方法が提案されている。
By the way, in order to enable reproduction by both a simple model such as a CD reproducing device and a higher model such as a DVD reproducing device, for example, Japanese Patent Laid-Open No. 9-31206.
As shown in Japanese Patent Publication No. 6, only high-end models can play 2
A method has been proposed in which 0-bit (or 24-bit) sample data is separated into upper 16 bits and lower 4 bits (or 8 bits) that can be reproduced by a simplified model and transmitted.

【0005】そこで本発明は、複数チャネル(チャンネ
ル)の音声信号の各チャネルの上位ビットデータ間には
相関が強く、下位ビットデータ間には相関がないことに
鑑みて、複数チャネルの音声信号を予測符号化する場合
に圧縮率を改善することができる光記録媒体、音声信号
伝送方法及び音声復号方法を提供することを目的とす
る。
Therefore, in the present invention, in view of the fact that the upper bit data of each channel of the audio signals of a plurality of channels (channels) have a strong correlation and the lower bit data have no correlation, the audio signals of a plurality of channels are processed. An object of the present invention is to provide an optical recording medium, an audio signal transmission method, and an audio decoding method capable of improving the compression rate when performing predictive coding.

【0006】[0006]

【課題を解決するための手段】本発明は上記目的を達成
するために、以下の1)〜3)記載の手段よりなる。す
なわち、
In order to achieve the above object, the present invention comprises the following means 1) to 3). That is,

【0007】1)同一のサンプリング周波数であると共
に2つの系統からなる第1の複数チャネルのデジタル音
声信号を所定のマトリクス演算により互いに相関性のあ
る第2の複数チャネルの音声信号に変換するステップ
と、前記変換された第2の複数チャネルの音声信号を、
チャネル毎に入力される音声信号に応答して先頭サンプ
ル値を所定時間のフレーム単位で得ると共に、特性が異
なる複数の線形予測方法により時間領域の過去から現在
の信号の線形予測値がそれぞれ予測され、その予測され
る線形予測値と前記音声信号とから得られる予測残差が
最小となるような線形予測方法を、前記フレームを更に
分割したサブフレーム単位に選択して予測符号化するス
テップと、前記選択された各チャネルの先頭サンプル値
と予測残差と線形予測方法と予測残差のビット数フラグ
を含む予測符号化データをパッキングする場合、前記予
測残差をビット情報に基づいたビット数でパッキングす
ると共に、 前記予測符号化データを、パケットヘッダと
圧縮PCMプライベートヘッダとオーディオ圧縮PCM
データ部とでパケット化されたユザーデータ内の前記オ
ーディオ圧縮PCMデータ部にパッキングするステップ
、からなる音声符号化方法により符号化されたデータ
から元の音声信号を復号する音声復号方法であって、前
記選択された各チャネルの先頭サンプル値と予測残差と
線形予測方法を含む予測符号化データから予測値を算出
するステップと、この算出された予測値から前記第1の
複数チャンネルのデジタル音声信号を復元するステップ
と、からなる音声復号方法。 2)同一のサンプリング周波数であると共に2つの系統
からなる第1の複数チャネルのデジタル音声信号を所定
のマトリクス演算により互いに相関性のある第2の複数
チャネルの音声信号に変換するステップと、前記変換さ
れた第2の複数チャネルの音声信号を、チャネル毎に入
力される音声信号に応答して先頭サンプル値を所定時間
のフレーム単位で得ると共に、特性が異なる複数の線形
予測方法により時間領域の過去から現在の信号の線形予
測値がそれぞれ予測され、その予測される線形予測値と
前記音声信号とから得られる予測残差が最小となるよう
な線形予測方法を、前記フレームを更に分割したサブフ
レーム単位に選択して予測符号化するステップと、前記
選択された各チャネルの先頭サンプル値と予測残差と線
形予測方法と予測残差のビット数フラグを含む予測符号
化データをパッキングする場合、前記予測残差をビット
情報に基づいたビット数でパッキングすると共に、 前記
予測符号化データを、パケットヘッダと圧縮PCMプラ
イベートヘッダとオーディオ圧縮PCMデータ部とでパ
ケット化されたユザーデータ内の前記オーディオ圧縮P
CMデータ部にパッキングするステップと、からなる音
声符号化方法により符号化された音声信号を伝送する音
声信号伝送方法であって、前記選択された各チャネルの
先頭サンプル値と予測残差と線形予測方法を含む予測符
号化データをパケット化して通信回線を介して伝送する
ことを特徴とする音声信号伝送方法。 3)同一のサンプリング周波数であると共に2つの系統
からなる第1の複数チャネルのデジタル音声信号を所定
のマトリクス演算により互いに相関性のある第2の複数
チャネルの音声信号に変換するステップと、前記変換さ
れた第2の複数チャネルの音声信号を、チャネル毎に入
力される音声信号に応答して先頭サンプル値を所定時間
のフレーム単位で得ると共に、特性が異なる複数の線形
予測方法により時間領域の過去から現在の信号の線形予
測値がそれぞれ予測され、その予測される線形予測値と
前記音声信号とから得られる予測残差が最小となるよう
な線形予測方法を、前記フレームを更に分割したサブフ
レーム単位に選択して予測符号化するステップと、前記
選択された各チャネルの先頭サンプル値と予測残差と線
形予測方法と予測残差のビット数フラグを含む予測符号
化データをパッキングする場合、前記予測残差をビット
情報に基づいたビット数でパッキングすると共に、 前記
予測符号化データが、パケットヘッダと圧縮PCMプラ
イベートヘッダとオーディオ圧縮PCMデータ部とでパ
ケット化されたユザーデータ内の前記オーディオ圧縮P
CMデータ部にパッキングされて記録され、前記予測符
号化データは元の音声信号を復元するために用いられる
予測値を算出するためのデータとして記録されているこ
とを特徴とする光記録媒体。
1) converting the digital audio signals of the first plurality of channels having the same sampling frequency and consisting of two systems into the audio signals of the second plurality of channels which are correlated with each other by a predetermined matrix calculation; , The converted second multi-channel audio signal,
The head sample value is obtained in frame units for a predetermined time in response to the audio signal input for each channel, and the linear prediction values of the past to present signal in the time domain are predicted by multiple linear prediction methods with different characteristics. , a linear prediction method, such as prediction residues obtained from the audio signal and the linear prediction value being the predicted is minimized, further said frame
A step of selecting and performing predictive coding in units of divided subframes; a predictive code including a leading sample value of each of the selected channels, a prediction residual, a linear prediction method, and a bit number flag of the prediction residual When packing the encoded data,
Pack the measurement residual with the number of bits based on the bit information
At the same time, the predictive coded data is
Compressed PCM Private Header and Audio Compressed PCM
The data in the user data packetized with the data part
Step of packing in audio compression PCM data section
When, predicted an audio decoding method for decoding the original audio signal from the encoded data by the speech coding method, comprising the top sampled value and the prediction residual and linear prediction method for each channel said it selected consisting of Calculating a prediction value from encoded data, and calculating the first prediction value from the calculated prediction value.
A voice decoding method comprising a step of restoring digital audio signals of a plurality of channels . 2) converting the digital audio signals of the first plurality of channels, which have the same sampling frequency and consist of two systems, into the audio signals of the second plurality of channels which are correlated with each other by a predetermined matrix operation; In response to the audio signal input for each channel, the sampled second multi-channel audio signal is set to the first sample value for a predetermined time.
Of each frame, the linear prediction values of the current signal are predicted from the past in the time domain by a plurality of linear prediction methods having different characteristics, and the prediction residual obtained from the predicted linear prediction value and the speech signal. A linear prediction method that minimizes the difference is used as a subframe obtained by further dividing the frame.
A step of performing predictive coding by selecting in units of rams, and a case of packing predictive coded data including a leading sample value of each selected channel, a prediction residual, a linear prediction method, and a bit number flag of the prediction residual , Bit the prediction residual
With packing the number of bits based on the information, the
Predictive coded data is sent to the packet header and compressed PCM
The header and audio compression PCM data section
The audio compression P in the packetized user data
A voice signal transmission method for transmitting a voice signal encoded by a voice encoding method, which comprises a step of packing in a CM data part, the method comprising: a head sample value of each selected channel, a prediction residual, and a linear prediction. A method for transmitting a voice signal, characterized by packetizing predictive-coded data including the method and transmitting the packet via a communication line. 3) converting the digital audio signals of the first plurality of channels, which have the same sampling frequency and consist of two systems, into the audio signals of the second plurality of channels which are correlated with each other by a predetermined matrix operation; In response to the audio signal input for each channel, the sampled second multi-channel audio signal is set to the first sample value for a predetermined time.
Of each frame, the linear prediction values of the current signal are predicted from the past in the time domain by a plurality of linear prediction methods having different characteristics, and the prediction residual obtained from the predicted linear prediction value and the speech signal. A linear prediction method that minimizes the difference is used as a subframe obtained by further dividing the frame.
A step of performing predictive coding by selecting in units of rams, and a case of packing predictive coded data including a leading sample value of each selected channel, a prediction residual, a linear prediction method, and a bit number flag of the prediction residual , Bit the prediction residual
With packing the number of bits based on the information, the
The predictive coded data contains packet header and compressed PCM
The header and audio compression PCM data section
The audio compression P in the packetized user data
An optical recording medium, which is packed and recorded in a CM data part, and the predictive coded data is recorded as data for calculating a predictive value used for restoring an original audio signal.

【0008】[0008]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は本発明を適用した音声符号
化装置及びそれに対応する音声復号装置の第1の実施形
態を示すブロック図、図2は図1のエンコーダを詳しく
示すブロック図、図3はDVDのパックのフォーマット
を示す説明図、図4はDVDのオーディオパックのフォ
ーマットを示す説明図、図5は図1のデコーダを詳しく
示すブロック図である。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. 1 is a block diagram showing a first embodiment of a voice encoding device and a voice decoding device corresponding to the present invention, FIG. 2 is a block diagram showing the encoder of FIG. 1 in detail, and FIG. 3 is a DVD pack. FIG. 4 is an explanatory diagram showing a format, FIG. 4 is an explanatory diagram showing a format of a DVD audio pack, and FIG. 5 is a block diagram showing the decoder of FIG. 1 in detail.

【0009】図1に示すチャネル相関回路Aは加算回路
1aと減算回路1bを有する。加算回路1aは各チャネ
ル(以下、ch)が例えばサンプリング周波数=192k
Hz、量子化ビット数=24ビットのステレオ2ch信号
L、Rの和信号(L+R)を算出して和ch用1chロスレ
ス・エンコーダ2D1に出力し、減算回路1bは差信号
(L−R)を算出して差ch用1chロスレス・エンコーダ
2D2に出力する。エンコーダ2D1、2D2は図2に
詳しく示すように、それぞれ24ビットの内、上位16
ビットの和信号(L+R)、差信号(L−R)の差分Δ
(L+R)、Δ(L−R)を予測符号化するとともに、
下位8ビットをそのまま記録媒体や通信媒体を介して伝
送する。
The channel correlation circuit A shown in FIG. 1 has an adding circuit 1a and a subtracting circuit 1b. Each channel (hereinafter, ch) of the adder circuit 1a has, for example, a sampling frequency = 192k.
The sum signal (L + R) of the stereo 2ch signals L and R of Hz and the number of quantization bits = 24 bits is calculated and output to the 1ch lossless encoder 2D1 for sum ch, and the subtraction circuit 1b outputs the difference signal (LR). It is calculated and output to the 1ch lossless encoder for difference channel 2D2. As shown in detail in FIG. 2, the encoders 2D1 and 2D2 each have an upper 16 bits out of 24 bits.
Difference Δ between bit sum signal (L + R) and difference signal (L−R)
(L + R), Δ (L-R) are predictively coded, and
The lower 8 bits are transmitted as they are through a recording medium or a communication medium.

【0010】なお、原データが20ビットの場合には上
位ビット数を固定にし、下位ビット数を可変にして上位
16ビットと下位4ビットに分離する。また、原データ
が16ビットの場合には分離することなく16ビットデ
ータを予測符号化する。
When the original data is 20 bits, the number of upper bits is fixed and the number of lower bits is variable to separate the upper 16 bits and the lower 4 bits. If the original data has 16 bits, the 16-bit data is predictively encoded without separation.

【0011】そして、復号側では、図6に詳しく示すよ
うにデコーダ3D1、3D2がそれぞれ各chの上位16
ビット分の予測符号化データを和信号(L+R)、差信
号(L−R)に復号し、この16ビットデータに対して
下位8ビットを付加して元の24ビットデータに復元す
る。次いでチャネル相関回路Bがこの24ビットの和信
号(L+R)、差信号(L−R)をステレオ2ch信号
L、Rに復元する。
On the decoding side, as shown in detail in FIG. 6, the decoders 3D1 and 3D2 are the upper 16 bits of each channel.
The predictive coded data for bits is decoded into a sum signal (L + R) and a difference signal (LR), and lower 16 bits are added to this 16-bit data to restore the original 24-bit data. Then, the channel correlation circuit B restores the 24-bit sum signal (L + R) and difference signal (LR) to the stereo 2ch signals L and R.

【0012】図2を参照してエンコーダ2D1、2D2
について詳しく説明する。和信号(L+R)と差信号
(L−R)は1フレーム毎に1フレームバッファ10に
格納される。そして、1フレームの各上位16ビットの
サンプル値(L+R)、(L−R)がそれぞれ差分演算
回路11D1、11D2に印加され、今回と前回の差分
Δ(L+R)、Δ(L−R)、すなわち差分PCM(D
PCM)データが算出される。また、各フレームの先頭
サンプルの24ビットデータ(L+R)、(L−R)
と、各サンプルの下位8ビットデータ(L+R)、(L
−R)がマルチプレクサ19に印加される。
Referring to FIG. 2, encoders 2D1 and 2D2
Will be described in detail. The sum signal (L + R) and the difference signal (LR) are stored in the one frame buffer 10 for each frame. Then, the upper 16-bit sample values (L + R) and (LR) of one frame are applied to the difference calculation circuits 11D1 and 11D2, respectively, and the difference Δ (L + R), Δ (LR) between the current time and the previous time, That is, the difference PCM (D
PCM) data is calculated. In addition, 24-bit data (L + R) and (LR) of the first sample of each frame
And the lower 8-bit data (L + R), (L
-R) is applied to the multiplexer 19.

【0013】差分演算回路11D1により算出された差
分Δ(L+R)は、予測係数が異なる複数の予測器12
a−1〜12a−nと減算器13a−1〜13a−nに
印加される。そして、予測器12a−1〜12a−nで
はそれぞれ各予測係数に基づいて差分Δ(L+R)の各
予測値が算出され、減算器13a−1〜13b−nでは
それぞれこの各予測値と差分Δ(L+R)の各予測残差
が算出される。バッファ・選択器16D1はこの複数の
予測残差を一時記憶して、選択信号生成器17により指
定されたサブフレーム毎に最小の予測残差を選択し、パ
ッキング回路18に出力する。なお、このサブフレーム
はフレームの数十分の1程度のサンプル長であり、一例
として1フレームを80サブフレームとする。ここで、
予測器12a−1〜12a−nと減算器13a−1〜1
3a−nは和信号chの予測回路15D1を構成し、ま
た、この予測回路15D1とバッファ・選択器16D1
は和信号chの予測符号化回路を構成している。
The difference Δ (L + R) calculated by the difference calculation circuit 11D1 is calculated by a plurality of predictors 12 having different prediction coefficients.
a-1 to 12a-n and subtractors 13a-1 to 13a-n. Then, the predictors 12a-1 to 12a-n calculate the respective predicted values of the difference Δ (L + R) based on the respective prediction coefficients, and the subtractors 13a-1 to 13b-n respectively calculate the respective predicted values and the difference Δ. Each prediction residual of (L + R) is calculated. The buffer / selector 16D1 temporarily stores the plurality of prediction residuals, selects the minimum prediction residual for each subframe designated by the selection signal generator 17, and outputs the selected prediction residual to the packing circuit 18. Note that this subframe has a sample length of about one tenth of the frame, and one frame is 80 subframes as an example. here,
Predictors 12a-1 to 12a-n and subtractors 13a-1 to 1
3a-n form a prediction circuit 15D1 for the sum signal ch, and the prediction circuit 15D1 and the buffer / selector 16D1.
Constitutes a predictive coding circuit for the sum signal ch.

【0014】同様に、差分演算回路11D2により算出
された差分Δ(L−R)は、予測係数が異なる複数の予
測器12b−1〜12b−nと減算器13b−1〜13
b−nに印加される。そして、予測器12b−1〜12
b−nではそれぞれ各予測係数に基づいて差分Δ(L−
R)の各予測値が算出され、減算器13b−1〜13b
−nではそれぞれこの各予測値と差分Δ(L−R)の各
予測残差が算出される。バッファ・選択器16D2はこ
の複数の予測残差を一時記憶して、選択信号生成器17
により指定されたサブフレーム毎に最小の予測残差を選
択し、パッキング回路18に出力する。予測器12b−
1〜12b−nと減算器13b−1〜13b−nは差信
号chの予測回路15D2を構成し、また、この予測回路
15D2とバッファ・選択器16D2は差信号chの予測
符号化回路を構成している。
Similarly, the difference Δ (L−R) calculated by the difference calculation circuit 11D2 includes a plurality of predictors 12b-1 to 12b-n having different prediction coefficients and subtractors 13b-1 to 13b.
applied to b-n. Then, the predictors 12b-1 to 12b-12
In b-n, the difference Δ (L-
R) each predicted value is calculated, and the subtracters 13b-1 to 13b
In −n, the respective prediction residuals of the respective prediction values and the difference Δ (L−R) are calculated. The buffer / selector 16D2 temporarily stores the plurality of prediction residuals, and the selection signal generator 17
The minimum prediction residual is selected for each subframe designated by and is output to the packing circuit 18. Predictor 12b-
1 to 12b-n and subtractors 13b-1 to 13b-n form a prediction circuit 15D2 for the difference signal ch, and the prediction circuit 15D2 and the buffer / selector 16D2 form a prediction coding circuit for the difference signal ch. is doing.

【0015】選択信号生成器17は予測残差のビット数
フラグをパッキング回路18とマルチプレクサ19に対
して印加し、また、予測残差が最小の予測器を示す予測
器選択フラグをマルチプレクサ19に対して印加する。
パッキング回路18はバッファ・選択器16D1、16
D2により選択された2ch分の予測残差を、選択信号生
成器17により指定されたビット数フラグに基づいて指
定ビット数でパッキングする。
The selection signal generator 17 applies the bit number flag of the prediction residual to the packing circuit 18 and the multiplexer 19, and the predictor selection flag indicating the predictor with the minimum prediction residual to the multiplexer 19. To apply.
The packing circuit 18 includes buffers / selectors 16D1 and 16D.
The prediction residuals for 2 channels selected by D2 are packed with the specified number of bits based on the bit number flag specified by the selection signal generator 17.

【0016】続くマルチプレクサ19は1フレーム分の
上位16ビットデータに対して ・フレームヘッダと、 ・元の24ビットデータを上位16ビットと下位8ビッ
トに分離したか否かを示す分離フラグ120と、 ・和信号ch(L+R)の1フレームの先頭サンプル値
と、 ・差信号ch(L−R)の1フレームの先頭サンプル値
と、 ・和信号ch(L+R)のサブフレーム毎の予測器選択
フラグと、 ・差信号ch(L−R)のサブフレーム毎の予測器選択
フラグと、 ・和信号ch(L+R)のサブフレーム毎のビット数フ
ラグと、 ・差信号ch(L−R)のサブフレーム毎のビット数フ
ラグと、 ・和信号ch(L+R)の予測残差データ列(可変ビッ
ト数)と、 ・差信号ch(L−R)の予測残差データ列(可変ビッ
ト数)とを、多重化し、可変レートビットストリームと
して出力する。
Next, the multiplexer 19 responds to the upper 16-bit data for one frame: a frame header, a separation flag 120 indicating whether or not the original 24-bit data is separated into upper 16 bits and lower 8 bits, -The start sample value of one frame of the sum signal ch (L + R) -The start sample value of one frame of the difference signal ch (L-R) -The predictor selection flag for each subframe of the sum signal ch (L + R) A predictor selection flag for each sub-frame of the difference signal ch (LR), a bit number flag for each sub-frame of the sum signal ch (L + R), and a sub-signal of the difference signal ch (L-R) A number-of-bits flag for each frame, a prediction residual data string (variable number of bits) of the sum signal ch (L + R), and a prediction residual data string (variable number of bits) of the difference signal ch (L-R) , Many However, output as a variable rate bit stream.

【0017】また、予測符号化されていない下位8ビッ
トについては、別のビットストリームとして出力する。
このような予測符号化によれば、原信号が例えばサンプ
リング周波数=192kHz、量子化ビット数=24ビ
ット、2チャネルの場合、平均で57%の圧縮率を実現
することができる。
Further, the lower 8 bits which are not predictively coded are output as another bit stream.
According to such predictive coding, when the original signal has, for example, a sampling frequency of 192 kHz and a quantization bit number of 24 bits and two channels, a compression rate of 57% can be realized on average.

【0018】また、この可変レートビットストリームデ
ータをDVDオーディオディスクに記録する場合には、
図3に示す圧縮PCMのオーディオ(A)パックにパッ
キングされる。このパックは2034バイトのユーザデ
ータ(Aパケット、Vパケット)に対して4バイトのパ
ックスタート情報と、6バイトのSCR(System Clock
Reference:システム時刻基準参照値)情報と、3バイ
トのMux レート(rate)情報と1バイトのスタッフィン
グの合計14バイトのパックヘッダが付加されて構成さ
れている(1パック=合計2048バイト)。この場
合、タイムスタンプであるSCR情報を、ACBユニッ
ト内の先頭パックでは「1」として同一タイトル内で連
続とすることにより同一タイトル内のAパックの時間を
管理することができる。
When recording the variable rate bit stream data on a DVD audio disc,
It is packed in the audio (A) pack of the compressed PCM shown in FIG. This pack has pack start information of 4 bytes for user data (A packet, V packet) of 2034 bytes and SCR (System Clock) of 6 bytes.
Reference: System time reference value) information, Mux rate information of 3 bytes, and stuffing of 1 byte, a pack header of 14 bytes in total is added (1 pack = 2048 bytes in total). In this case, the SCR information, which is a time stamp, is set to "1" in the first pack in the ACB unit and is consecutive in the same title, so that the time of the A pack in the same title can be managed.

【0019】Aパケットは図4に詳しく示すように、1
7、9又は14バイトのパケットヘッダと、圧縮PCM
のプライベートヘッダと、上記のフォーマットの1ない
し2011バイトのオーディオ圧縮PCMデータにより
構成され、上位16ビットデータと下位8ビットデータ
は別のAパケットに収容されている。圧縮PCMのプラ
イベートヘッダは、 ・1バイトのサブストリームIDと、 ・2バイトのUPC/EAN−ISRC(Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code)番号、及びUPC/EAN−
ISRCデータと、 ・1バイトのプライベートヘッダ長と、 ・2バイトの第1アクセスユニットポインタと、 ・8バイトのオーディオデータ情報(ADI)と ・0〜7バイトのスタッフィングバイトとに、より構成
されている。
As shown in detail in FIG. 4, the A packet is 1
Packet header of 7, 9 or 14 bytes and compressed PCM
And the compressed audio PCM data of 1 to 2011 bytes in the above format, and the upper 16-bit data and the lower 8-bit data are contained in another A packet. The private header of the compressed PCM includes: 1-byte substream ID, 2-byte UPC / EAN-ISRC (Universal Pr
oduct Code / European Article Number-International S
tandard Recording Code) number and UPC / EAN-
ISRC data, 1-byte private header length, 2-byte first access unit pointer, 8-byte audio data information (ADI), and 0-7 bytes of stuffing bytes. There is.

【0020】次に図5を参照してデコーダD1、D2に
ついて説明する。前述したフォーマットの可変レートビ
ットストリームデータは、デマルチプレクサ21により
フレームヘッダに基づいて分離される。そして、和信号
ch(L+R)及び差信号ch(L−R)の1フレーム
の先頭サンプル値はそれぞれ累積演算回路25a、25
bに印加され、和信号ch(L+R)及び差信号ch
(L−R)の予測器選択フラグはそれぞれ予測器(24
a−1〜24a−n)、(24b−1〜24b−n)の
各選択信号として印加され、和信号ch(L+R)及び
差信号ch(L−R)のビット数フラグと予測残差デー
タ列はアンパッキング回路22に印加される。更に可変
レートビットストリームデータが下位ビットデータを含
む場合には、この下位ビットデータが分離されて加算器
28a、28bに印加され、また、分離フラグは制御信
号として加算器28a、28bに印加される。
Next, the decoders D1 and D2 will be described with reference to FIG. The variable rate bit stream data in the above-mentioned format is separated by the demultiplexer 21 based on the frame header. Then, the leading sample values of one frame of the sum signal ch (L + R) and the difference signal ch (L-R) are respectively accumulated operation circuits 25a and 25a.
applied to the sum signal ch (L + R) and the difference signal ch
The (LR) predictor selection flags are predictor (24
a-1 to 24a-n) and (24b-1 to 24b-n) are applied as selection signals, and the number-of-bits flag and the prediction residual data of the sum signal ch (L + R) and the difference signal ch (LR) are applied. The column is applied to the unpacking circuit 22. Further, when the variable rate bit stream data includes lower bit data, the lower bit data is separated and applied to the adders 28a and 28b, and the separation flag is applied as a control signal to the adders 28a and 28b. .

【0021】ここで、予測器(24a−1〜24a−
n)、(24b−1〜24b−n)はそれぞれ、符号化
側の予測器(12a−1〜12a−n)、(12b−1
〜12b−n)と同一の特性であり、予測器選択フラグ
により同一特性のものが選択される。
Here, the predictors (24a-1 to 24a-
n) and (24b-1 to 24b-n) are predictors (12a-1 to 12a-n) and (12b-1) on the coding side, respectively.
.About.12b-n) and the same characteristic is selected by the predictor selection flag.

【0022】アンパッキング回路22は和信号ch(L
+R)及び差信号ch(L−R)の予測残差データ列を
ビット数フラグ毎に基づいて分離してそれぞれ加算回路
23a、23bに出力する。加算回路23a、23bで
はそれぞれ、アンパッキング回路22からの和信号ch
(L+R)及び差信号ch(L−R)の今回の予測残差
データと、予測器(24a−1〜24a−n)、(24
b−1〜24b−n)の内、予測器選択フラグにより選
択された各1つにより予測された前回の予測値が加算さ
れて今回の予測値が算出される。この今回の予測値は、
図2に示す差分演算回路11D1、11D2によりそれ
ぞれ算出された差分Δ(L+R)、Δ(L−R)すなわ
ちDPCMデータであり、予測器(24a−1〜24a
−n)、(24b−1〜24b−n)と累積演算回路2
5a、25bに印加される。
The unpacking circuit 22 adds the sum signal ch (L
+ R) and the prediction residual data sequence of the difference signal ch (LR) are separated based on each bit number flag and output to the adder circuits 23a and 23b, respectively. In the adder circuits 23a and 23b, respectively, the sum signal ch from the unpacking circuit 22 is added.
(L + R) and the current prediction residual data of the difference signal ch (LR) and the predictors (24a-1 to 24a-n) and (24
b-1 to 24b-n), the previous predicted value predicted by each one selected by the predictor selection flag is added to calculate the current predicted value. This forecast value is
Differences Δ (L + R) and Δ (LR) calculated by the difference calculation circuits 11D1 and 11D2 shown in FIG. 2, that is, DPCM data, and predictors (24a-1 to 24a).
-N), (24b-1 to 24b-n) and the cumulative operation circuit 2
5a, 25b.

【0023】累積演算回路25a、25bはそれぞれ、
1フレームの先頭サンプル値に対して差分Δ(L+
R)、Δ(L−R)をサンプル毎に累積加算して和信号
ch(L+R)、差信号ch(L−R)の各PCMデー
タ(上位16ビットデータ)をそれぞれ加算器28a、
28bに出力する。加算器28a、28bは分離フラグ
が「分離有り」の場合にはこの和信号ch(L+R)、
差信号ch(L−R)の各上位16ビットPCMデータ
と、デマルチプレクサ21により分離された下位ビット
PCMデータを加算して出力し、他方、分離フラグが
「分離無し」の場合には上位16ビットPCMデータを
そのまま出力する。
The cumulative operation circuits 25a and 25b are respectively
Difference Δ (L +
R) and Δ (L-R) are cumulatively added for each sample, and the PCM data (upper 16-bit data) of the sum signal ch (L + R) and the difference signal ch (L-R) are respectively added by an adder 28a,
28b. If the separation flag is "separation present", the adders 28a and 28b output the sum signal ch (L + R),
Each upper 16-bit PCM data of the difference signal ch (LR) and the lower bit PCM data separated by the demultiplexer 21 are added and output, while if the separation flag is "no separation", upper 16 bits The bit PCM data is output as it is.

【0024】この和信号(L+R)、差信号(L−R)
は図1に示すように加算回路4aにより2L信号が算出
されるとともに、減算回路4bにより2R信号が算出さ
れる。そして、2L信号と2R信号がそれぞれ割り算器
5a、5bにより1/2に割り算され、元のステレオ2
チャネル信号L、Rが復元される。
The sum signal (L + R) and the difference signal (L-R)
As shown in FIG. 1, the adder circuit 4a calculates the 2L signal and the subtractor circuit 4b calculates the 2R signal. Then, the 2L signal and the 2R signal are divided into ½ by the dividers 5a and 5b, respectively, and the original stereo 2
The channel signals L and R are restored.

【0025】次に図6、図7を参照して第2の実施形態
について説明する。上記の実施形態では、和信号(L+
R)、差信号(L−R)の各差分Δ(L+R)、Δ(L
−R)、すなわちDPCMデータのみを予測符号化する
ように構成されているが、この第2の実施形態では和信
号(L+R)、差信号(L−R)すなわちPCMデー
タ、又はその各差分Δ(L+R)、Δ(L−R)すなわ
ちDPCMデータを選択的に予測符号化するように構成
されている。
Next, a second embodiment will be described with reference to FIGS. In the above embodiment, the sum signal (L +
R), each difference Δ (L + R) of the difference signal (LR), Δ (L
-R), that is, it is configured to predictively encode only DPCM data, but in the second embodiment, a sum signal (L + R), a difference signal (LR), that is, PCM data, or each difference Δ thereof. (L + R), Δ (L−R), that is, DPCM data is selectively predictively coded.

【0026】このため図6に示す符号化装置では、図2
に示す構成に対して和信号(L+R)、差信号(L−
R)をそれぞれ予測符号化するための予測回路15A、
15Sとバッファ・選択器16A、16Sが追加されて
いる。また、選択信号生成器17はバッファ・選択器1
6A、16Sによりそれぞれ選択された和信号(L+
R)、差信号(L−R)と、バッファ・選択器16D
1、16D2によりそれぞれ選択された差分Δ(L+
R)、Δ(L−R)の各予測残差の最小値に基づいて、
PCMデータとDPCMデータのどちらが圧縮率が高い
か否かを判断し、高い方のデータを選択する。このと
き、そのPCM/DPCMの選択フラグ(予測回路選択
フラグ)を追加して多重化する。
Therefore, in the encoding device shown in FIG.
With respect to the configuration shown in (1), a sum signal (L + R) and a difference signal (L-
Prediction circuits 15A for predictively encoding R),
15S and buffer / selectors 16A and 16S are added. Further, the selection signal generator 17 is the buffer / selector 1.
Sum signal (L + selected by 6A and 16S, respectively)
R), difference signal (LR) and buffer / selector 16D
Differences Δ (L +
R), Δ (LR) based on the minimum value of each prediction residual,
It is determined which of the PCM data and the DPCM data has a higher compression rate, and the higher data is selected. At this time, the selection flag (prediction circuit selection flag) of the PCM / DPCM is added and multiplexed.

【0027】ここで、図6に示す和信号(L+R)の予
測回路15Aと差分Δ(L+R)の予測回路15D1が
同一の構成であり、また、差信号(L−R)の予測回路
15Sと差分Δ(L−R)の予測回路15D2が同一の
構成である場合、復号装置では図7に示すようにPCM
データとDPCMデータの両方の予測回路を設ける必要
はなく、1つのデータ分の予測回路でよい。そして、符
号化装置から伝送された予測回路選択フラグに基づいて
セレクタ26a、26bにより、DPCMデータの場合
には累積演算回路25a、25bの出力を選択し、PC
Mデータの場合には加算回路23a、23bの出力を選
択する。そして、セレクタ26a、26bによりそれぞ
れ選択された各チャネルの上位16ビットデータと下位
ビットデータが加算器28a、28bにより加算され
る。
Here, the prediction circuit 15A for the sum signal (L + R) and the prediction circuit 15D1 for the difference Δ (L + R) shown in FIG. 6 have the same configuration, and the prediction circuit 15S for the difference signal (LR) is the same. When the prediction circuit 15D2 for the difference Δ (L−R) has the same configuration, the decoding device uses PCM as shown in FIG.
It is not necessary to provide prediction circuits for both data and DPCM data, and a prediction circuit for one data is sufficient. Then, based on the prediction circuit selection flag transmitted from the encoder, the selectors 26a and 26b select the outputs of the cumulative operation circuits 25a and 25b in the case of DPCM data, and the PC
In the case of M data, the output of the adder circuits 23a and 23b is selected. Then, the upper 16-bit data and the lower bit data of each channel selected by the selectors 26a and 26b are added by the adders 28a and 28b.

【0028】第3の実施形態では図8に示すように、原
信号L、R(PCMデータ)と、和信号(L+R)、差
信号(L−R)(PCMデータ)と、その各差分Δ(L
+R)、Δ(L−R)(DPCMデータ)の3グループ
の1つを選択的に予測符号化するように構成されてい
る。
In the third embodiment, as shown in FIG. 8, original signals L and R (PCM data), sum signal (L + R), difference signal (LR) (PCM data), and their respective differences Δ. (L
+ R), Δ (LR) (DPCM data), one of three groups is selectively predictively coded.

【0029】このため図8に示す符号化装置では、図6
に示す構成に対して原信号L、Rをそれぞれ予測符号化
するための予測回路15L、15Rとバッファ・選択器
16L、16Rが追加されている。また、選択信号生成
器17はバッファ・選択器16L、16Rにより選択さ
れた原信号L、Rと、バッファ・選択器16A、16S
により選択された和信号(L+R)、差信号(L−R)
と、バッファ・選択器16D1、16D2により選択さ
れた各差分Δ(L+R)、Δ(L−R)の各予測残差の
最小値に基づいて圧縮率が高いグループのデータを選択
する。このとき、その選択フラグ(予測回路選択フラ
グ)を追加して多重化する。
Therefore, in the encoding device shown in FIG.
Prediction circuits 15L and 15R and buffer / selectors 16L and 16R for predictively encoding the original signals L and R, respectively, are added to the configuration shown in FIG. The selection signal generator 17 includes the original signals L and R selected by the buffer / selectors 16L and 16R and the buffer / selectors 16A and 16S.
Sum signal (L + R), difference signal (LR) selected by
And the data of the group having a high compression rate based on the minimum value of the prediction residuals of the differences Δ (L + R) and Δ (L−R) selected by the buffer / selectors 16D1 and 16D2. At this time, the selection flag (prediction circuit selection flag) is added and multiplexed.

【0030】また、図8に示す3グループの予測回路が
同一の構成である場合、復号装置では図9に示すように
3グループ分の予測回路を設ける必要はなく、1つのグ
ループ分の予測回路でよい。そして、符号化装置から伝
送された予測回路選択フラグに基づいて、DPCMデー
タの場合には累積演算回路25a、25bの出力を選択
し、PCMデータの場合には加算回路23a、23bの
出力を選択してチャネル相関回路Bにより原信号L、R
(上位16ビットデータ)を復元する。そして、更にセ
レクタ27a、27bにより原信号L、Rのグループの
場合には加算回路23a、23bの出力を選択し、他の
場合にはチャネル相関回路Bの出力を選択する。次いで
セレクタ27a、27bによりそれぞれ選択された各チ
ャネルの上位16ビットデータと下位ビットデータが加
算器28a、28bにより加算される。
When the three groups of prediction circuits shown in FIG. 8 have the same configuration, the decoding device does not need to have three groups of prediction circuits as shown in FIG. Good. Then, based on the prediction circuit selection flag transmitted from the encoding device, the output of the cumulative operation circuits 25a and 25b is selected in the case of DPCM data, and the output of the addition circuits 23a and 23b is selected in the case of PCM data. Then, the channel correlation circuit B outputs the original signals L and R.
(Upper 16-bit data) is restored. Then, the selectors 27a and 27b further select the outputs of the adder circuits 23a and 23b in the case of the group of the original signals L and R, and select the output of the channel correlation circuit B in other cases. Next, the upper 16-bit data and the lower bit data of each channel selected by the selectors 27a and 27b are added by the adders 28a and 28b.

【0031】なお、上記の第1〜第3の実施形態では、
原信号が2チャネルの場合について説明したが、マルチ
チャネル信号の場合にも適用することができる。ここ
で、マルチチャネル方式としては次の4つの方式が知ら
れている。 (1)ドルビーサラウンド方式 前方L、C、Rの3チャネル+後方Sの1チャネルの合
計4チャネル (2)ドルビーAC−3方式 前方L、C、R、SWの4チャネル+後方SL、SRの
2チャネルの合計6チャネル (3)DTS(Digital Theater System)方式 ドルビーAC−3方式と同様に6チャネル(L、C、
R、SW、SL、SR) (4)SDDS(Sony Dynamic Digital Sound)方式 前方L、LC、C、RC、R、SWの6チャネル+後方
SL、SRの2チャネルの合計8チャネル
In the first to third embodiments described above,
Although the case where the original signal has two channels has been described, the present invention can also be applied to the case of a multi-channel signal. Here, the following four methods are known as multi-channel methods. (1) Dolby Surround system front L, C, R 3 channels + rear S 1 channel 4 channels in total (2) Dolby AC-3 system front L, C, R, SW 4 channels + rear SL, SR 2 channels in total 6 channels (3) DTS (Digital Theater System) system 6 channels (L, C,
(R, SW, SL, SR) (4) SDDS (Sony Dynamic Digital Sound) system 6 channels of front L, LC, C, RC, R, SW + 2 channels of rear SL, SR, total 8 channels

【0032】そこで、図1に示す相関回路Aは、マルチ
チャネル信号の一例としてレフト(L)、センタ
(C)、ライト(R)、サラウンドレフト(SL)及び
サラウンドライト(SR)の5chのPCMデータを、L
chを基準として次の5ch(L)、(D1)〜(D4)に
変換する。 L =L(基準チャネル) D1=C−(L+R)/2 D2=R−L D3=SL−a×L D4=SR−b×R 但し、0≦a,b≦1
Therefore, the correlation circuit A shown in FIG. 1 uses, as an example of a multi-channel signal, left (L), center (C), right (R), surround left (SL) and surround right (SR) 5ch PCM. Data to L
The channel is converted into the next 5 channels (L) and (D1) to (D4) with reference to the channel. L = L (reference channel) D1 = C− (L + R) / 2 D2 = R−L D3 = SL−a × L D4 = SR−b × R However, 0 ≦ a, b ≦ 1

【0033】そして、この5chの各チャネルデータを上
位16ビットと下位ビットに分離し、上位16ビットデ
ータを予測符号化して伝送し、下位ビットデータをその
まま伝送する。また、相関を求める場合、次の5chに変
換するようにしてもよい。 L =L(基準チャネル) D1=C−L D2=R−L D3=SL−L D4=SR−R
Then, each channel data of 5 channels is separated into upper 16 bits and lower bits, the upper 16 bits data is predictively encoded and transmitted, and the lower bit data is transmitted as it is. Further, when obtaining the correlation, conversion to the next 5 channels may be performed. L = L (reference channel) D1 = C-L D2 = R-L D3 = SL-L D4 = SR-R

【0034】符号化側により予測符号化された可変レー
トビットストリームデータをネットワークを介して伝送
する場合には、符号化側では図10に示すように伝送用
にパケット化し(ステップS41)、次いでパケットヘ
ッダを付与し(ステップS42)、次いでこのパケット
をネットワーク上に送り出す(ステップS43)。復号
側では図11に示すようにヘッダを除去し(ステップS
51)、次いでデータを復元し(ステップS52)、次
いでこのデータをメモリに格納して復号を待つ(ステッ
プS53)。
When the variable rate bit stream data predictively coded by the coding side is transmitted through the network, the coding side packetizes it for transmission as shown in FIG. 10 (step S41) and then packetizes it. A header is added (step S42), and then this packet is sent out on the network (step S43). On the decoding side, the header is removed as shown in FIG. 11 (step S
51), then restore the data (step S52), then store this data in memory and wait for decoding (step S53).

【0035】[0035]

【発明の効果】以上説明したように本発明によれば、複
数チャネルの音声信号をチャネル毎に上位ビットデータ
と下位ビットデータに分離して、上位ビットデータを予
測符号化するようにしたので、複数チャネルの音声信号
を予測符号化する場合に圧縮率を改善することができ
る。
As described above, according to the present invention, the audio signals of a plurality of channels are separated into upper bit data and lower bit data for each channel, and the upper bit data is predictively coded. It is possible to improve the compression ratio when predictively encoding a multi-channel audio signal.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明を適用した音声符号化装置及び音声復号
装置の第1の実施形態を示すブロック図である。
FIG. 1 is a block diagram showing a first embodiment of a speech coding apparatus and speech decoding apparatus to which the present invention has been applied.

【図2】図1のエンコーダを詳しく示すブロック図であ
る。
FIG. 2 is a detailed block diagram of the encoder of FIG.

【図3】DVDのパックのフォーマットを示す説明図で
ある。
FIG. 3 is an explanatory diagram showing a format of a DVD pack.

【図4】DVDのオーディオパックのフォーマットを示
す説明図である。
FIG. 4 is an explanatory diagram showing a format of a DVD audio pack.

【図5】図1のデコーダを詳しく示すブロック図であ
る。
5 is a detailed block diagram of the decoder of FIG. 1. FIG.

【図6】第2の実施形態のエンコーダを示すブロック図
である。
FIG. 6 is a block diagram showing an encoder of a second embodiment.

【図7】第2の実施形態のデコーダを示すブロック図で
ある。
FIG. 7 is a block diagram showing a decoder of the second embodiment.

【図8】第3の実施形態のエンコーダを示すブロック図
である。
FIG. 8 is a block diagram showing an encoder of a third embodiment.

【図9】第3の実施形態のデコーダを示すブロック図で
ある。
FIG. 9 is a block diagram showing a decoder of the third embodiment.

【図10】音声伝送方法を示すフローチャートである。FIG. 10 is a flowchart showing a voice transmission method.

【図11】音声伝送方法を示すフローチャートである。FIG. 11 is a flowchart showing a voice transmission method.

【符号の説明】[Explanation of symbols]

1a 加算回路(加算手段) 1b 減算回路(減算手段) 10 1フレームバッファ(分離手段) 11D1 差分演算回路(第1の差分演算手段) 11D2 差分演算回路(第2の差分演算手段) 12a−1〜12a−n 予測器(減算器13a−1〜
13a−n、バッファ・選択器16D1と共に第1の予
測符号化手段を構成する。) 12b−1〜12b−n 予測器(減算器13b−1〜
13b−n、バッファ・選択器16D2と共に第2の予
測符号化手段を構成する。) 13a−1〜13a−n,13b−1〜13b−n 減
算器 16D1,16D2,16A,16S,16L,16R
バッファ・選択器 15A 予測回路(バッファ・選択器16Aと共に第3
の予測符号化手段を構成する。) 15S 予測回路(バッファ・選択器16Sと共に第4
の予測符号化手段を構成する。) 15L 予測回路(バッファ・選択器16Lと共に第5
の予測符号化手段を構成する。) 15R 予測回路(バッファ・選択器16Rと共に第6
の予測符号化手段を構成する。) 19 マルチプレクサ(多重化手段) A 相関回路(相関手段)
1a addition circuit (addition means) 1b subtraction circuit (subtraction means) 10 1 frame buffer (separation means) 11D1 difference calculation circuit (first difference calculation means) 11D2 difference calculation circuit (second difference calculation means) 12a-1 to 12a-1 12a-n predictor (subtractors 13a-1 to 13a-1
13a-n and the buffer / selector 16D1 constitute a first predictive coding means. ) 12b-1 to 12b-n Predictor (subtractor 13b-1 to
13b-n and the buffer / selector 16D2 constitute second predictive coding means. ) 13a-1 to 13a-n, 13b-1 to 13b-n Subtractors 16D1, 16D2, 16A, 16S, 16L, 16R
Buffer / selector 15A Prediction circuit (with buffer / selector 16A
The predictive coding means of is constructed. ) 15S Prediction circuit (fourth with buffer / selector 16S)
The predictive coding means of is constructed. ) 15L prediction circuit (fifth with buffer / selector 16L)
The predictive coding means of is constructed. ) 15R prediction circuit (sixth with buffer / selector 16R)
The predictive coding means of is constructed. ) 19 multiplexer (multiplexing means) A correlation circuit (correlation means)

フロントページの続き (56)参考文献 特開 昭64−44499(JP,A) 特開 平3−108824(JP,A) 特開 平6−133252(JP,A) 特開 平10−233058(JP,A) 特開 平10−320928(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 Continuation of the front page (56) References JP-A 64-44499 (JP, A) JP-A 3-108824 (JP, A) JP-A 6-133252 (JP, A) JP-A 10-233058 (JP , A) JP-A-10-320928 (JP, A) (58) Fields investigated (Int.Cl. 7 , DB name) G10L 19/00

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】同一のサンプリング周波数であると共に2
つの系統からなる第1の複数チャネルのデジタル音声信
号を所定のマトリクス演算により互いに相関性のある第
2の複数チャネルの音声信号に変換するステップと、 前記変換された第2の複数チャネルの音声信号を、チャ
ネル毎に入力される音声信号に応答して先頭サンプル値
所定時間のフレーム単位で得ると共に、特性が異なる
複数の線形予測方法により時間領域の過去から現在の信
号の線形予測値がそれぞれ予測され、その予測される線
形予測値と前記音声信号とから得られる予測残差が最小
となるような線形予測方法を、前記フレームを更に分割
したサブフレーム単位に選択して予測符号化するステッ
プと、 前記選択された各チャネルの先頭サンプル値と予測残差
と線形予測方法と予測残差のビット数フラグを含む予測
符号化データをパッキングする場合、前記予測残差をビ
ット情報に基づいたビット数でパッキングすると共に、 前記予測符号化データを、パケットヘッダと圧縮PCM
プライベートヘッダとオーディオ圧縮PCMデータ部と
でパケット化されたユザーデータ内の前記オーディオ圧
縮PCMデータ部にパッキングするステップと 、からな
る音声符号化方法により符号化されたデータから元の音
声信号を復号する音声復号方法であって、 前記選択された各チャネルの先頭サンプル値と予測残差
と線形予測方法を含む予測符号化データから予測値を算
出するステップと、 この算出された予測値から前記第1の複数チャンネルの
デジタル音声信号を復元するステップと、 からなる音声復号方法。
1. The same sampling frequency and 2
The digital audio signals of the first multiple channels consisting of two channels are correlated with each other by a predetermined matrix operation.
Converting the second multi-channel audio signal into two multi-channel audio signals, and obtaining a leading sample value in frame units of a predetermined time in response to the audio signal input for each channel. At the same time, the linear prediction values of the current signal are predicted from the past in the time domain by a plurality of linear prediction methods having different characteristics, and the prediction residual obtained from the predicted linear prediction value and the speech signal is minimized. the linear prediction methods as further dividing the frame
And a step of performing predictive coding in the selected subframe unit, and packing the predictive coded data including the leading sample value of each selected channel, the prediction residual, the linear prediction method, and the bit number flag of the prediction residual. If the prediction residual is
The predicted coded data with a packet header and a compressed PCM.
Private header and audio compression PCM data section
Audio pressure in user data packetized by
A voice decoding method for decoding an original voice signal from data encoded by a voice encoding method, which comprises a step of packing in a reduced PCM data part , wherein a leading sample value and a prediction residual of each selected channel are included. Calculating a predictive value from predictive coded data including a difference and a linear predictive method, and calculating the predictive value from the calculated predictive value of the first plurality of channels.
A voice decoding method comprising the steps of recovering a digital voice signal.
【請求項2】同一のサンプリング周波数であると共に2
つの系統からなる第1の複数チャネルのデジタル音声信
号を所定のマトリクス演算により互いに相関性のある第
2の複数チャネルの音声信号に変換するステップと、 前記変換された第2の複数チャネルの音声信号を、チャ
ネル毎に入力される音声信号に応答して先頭サンプル値
所定時間のフレーム単位で得ると共に、特性が異なる
複数の線形予測方法により時間領域の過去から現在の信
号の線形予測値がそれぞれ予測され、その予測される線
形予測値と前記音声信号とから得られる予測残差が最小
となるような線形予測方法を、前記フレームを更に分割
したサブフレーム単位に選択して予測符号化するステッ
プと、 前記選択された各チャネルの先頭サンプル値と予測残差
と線形予測方法と予測残差のビット数フラグを含む予測
符号化データをパッキングする場合、前記予測残差をビ
ット情報に基づいたビット数でパッキングすると共に、 前記予測符号化データを、パケットヘッダと圧縮PCM
プライベートヘッダとオーディオ圧縮PCMデータ部と
でパケット化されたユザーデータ内の前記オーディオ圧
縮PCMデータ部にパッキングするステップと、 からな
る音声符号化方法により符号化された音声信号を伝送す
る音声信号伝送方法であって、 前記選択された各チャネルの先頭サンプル値と予測残差
と線形予測方法を含む予測符号化データをパケット化し
て通信回線を介して伝送することを特徴とする音声信号
伝送方法。
2. The same sampling frequency and 2
The digital audio signals of the first multiple channels consisting of two channels are correlated with each other by a predetermined matrix operation.
Converting the second multi-channel audio signal into two multi-channel audio signals, and obtaining a leading sample value in frame units of a predetermined time in response to the audio signal input for each channel. At the same time, the linear prediction values of the current signal are predicted from the past in the time domain by a plurality of linear prediction methods having different characteristics, and the prediction residual obtained from the predicted linear prediction value and the speech signal is minimized. the linear prediction methods as further dividing the frame
And a step of performing predictive coding in the selected subframe unit, and packing the predictive coded data including the leading sample value of each selected channel, the prediction residual, the linear prediction method, and the bit number flag of the prediction residual. If the prediction residual is
The predicted coded data with a packet header and a compressed PCM.
Private header and audio compression PCM data section
Audio pressure in user data packetized by
A voice signal transmission method for transmitting a voice signal encoded by a voice encoding method, which comprises the step of packing in a reduced PCM data part , wherein the head sample value and the prediction residual of each selected channel are linear. A method of transmitting a voice signal, characterized in that predictive coded data including a predicting method is packetized and transmitted via a communication line.
【請求項3】同一のサンプリング周波数であると共に2
つの系統からなる第1の複数チャネルのデジタル音声信
号を所定のマトリクス演算により互いに相関性のある第
2の複数チャネルの音声信号に変換するステップと、 前記変換された第2の複数チャネルの音声信号を、チャ
ネル毎に入力される音声信号に応答して先頭サンプル値
所定時間のフレーム単位で得ると共に、特性が異なる
複数の線形予測方法により時間領域の過去から現在の信
号の線形予測値がそれぞれ予測され、その予測される線
形予測値と前記音声信号とから得られる予測残差が最小
となるような線形予測方法を、前記フレームを更に分割
したサブフレーム単位に選択して予測符号化するステッ
プと、 前記選択された各チャネルの先頭サンプル値と予測残差
と線形予測方法と予測残差のビット数フラグを含む予測
符号化データをパッキングする場合、前記予測残差をビ
ット情報に基づいたビット数でパッキングすると共に、 前記予測符号化データが、パケットヘッダと圧縮PCM
プライベートヘッダと オーディオ圧縮PCMデータ部と
でパケット化されたユザーデータ内の前記オーディオ圧
縮PCMデータ部にパッキングされて記録され、 前記予測符号化データは元の音声信号を復元するために
用いられる予測値を算出するためのデータとして記録さ
れていることを特徴とする光記録媒体。
3. Same sampling frequency and 2
The digital audio signals of the first multiple channels consisting of two channels are correlated with each other by a predetermined matrix operation.
Converting the second multi-channel audio signal into two multi-channel audio signals, and obtaining a leading sample value in frame units of a predetermined time in response to the audio signal input for each channel. At the same time, the linear prediction values of the current signal are predicted from the past in the time domain by a plurality of linear prediction methods having different characteristics, and the prediction residual obtained from the predicted linear prediction value and the speech signal is minimized. the linear prediction methods as further dividing the frame
And a step of performing predictive coding in the selected subframe unit, and packing the predictive coded data including the leading sample value of each selected channel, the prediction residual, the linear prediction method, and the bit number flag of the prediction residual. If the prediction residual is
The prediction coded data is packed in a packet header and a compressed PCM while being packed by the number of bits based on the packet information.
Private header and audio compression PCM data section
Audio pressure in user data packetized by
An optical recording medium, which is packed and recorded in a reduced PCM data part, and the predictive encoded data is recorded as data for calculating a predictive value used for restoring an original audio signal.
JP2000321501A 2000-10-20 2000-10-20 Optical recording medium, audio signal transmission method and audio decoding method Expired - Lifetime JP3387088B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000321501A JP3387088B2 (en) 2000-10-20 2000-10-20 Optical recording medium, audio signal transmission method and audio decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000321501A JP3387088B2 (en) 2000-10-20 2000-10-20 Optical recording medium, audio signal transmission method and audio decoding method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP30632098A Division JP3387429B2 (en) 1998-10-13 1998-10-13 Optical recording medium, audio decoding device

Publications (2)

Publication Number Publication Date
JP2001188565A JP2001188565A (en) 2001-07-10
JP3387088B2 true JP3387088B2 (en) 2003-03-17

Family

ID=18799617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000321501A Expired - Lifetime JP3387088B2 (en) 2000-10-20 2000-10-20 Optical recording medium, audio signal transmission method and audio decoding method

Country Status (1)

Country Link
JP (1) JP3387088B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101183857B1 (en) * 2004-06-21 2012-09-19 코닌클리케 필립스 일렉트로닉스 엔.브이. Method and apparatus to encode and decode multi-channel audio signals

Also Published As

Publication number Publication date
JP2001188565A (en) 2001-07-10

Similar Documents

Publication Publication Date Title
JP4831115B2 (en) Speech encoding method and speech decoding method
JP3387461B2 (en) Recording medium, audio decoding device
JP3342001B2 (en) Recording medium, audio decoding device
JP3387088B2 (en) Optical recording medium, audio signal transmission method and audio decoding method
JP3387086B2 (en) Audio coding device
JP3387429B2 (en) Optical recording medium, audio decoding device
JP3387087B2 (en) Audio coding method
JP3606453B2 (en) Audio signal transmission method and audio decoding method
JP3344581B2 (en) Audio coding device
JP3344583B2 (en) Audio encoding method and audio decoding method
JP4164823B2 (en) Audio signal transmission method and audio decoding method
JP4148203B2 (en) Audio signal transmission method and audio decoding method
JP4151033B2 (en) Speech encoding method and speech decoding method
JP4151031B2 (en) Speech encoding method and speech decoding method
JP4244222B2 (en) Speech encoding method and speech decoding method
JP2001188570A (en) Voice coding method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100110

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110110

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120110

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120110

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20190110

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20190110

Year of fee payment: 16

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20190110

Year of fee payment: 16

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term