JP3387090B2 - Audio coding method - Google Patents
Audio coding methodInfo
- Publication number
- JP3387090B2 JP3387090B2 JP2000321503A JP2000321503A JP3387090B2 JP 3387090 B2 JP3387090 B2 JP 3387090B2 JP 2000321503 A JP2000321503 A JP 2000321503A JP 2000321503 A JP2000321503 A JP 2000321503A JP 3387090 B2 JP3387090 B2 JP 3387090B2
- Authority
- JP
- Japan
- Prior art keywords
- channels
- frame
- data
- prediction
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を予測符
号化するための音声符号化方法に関する。
【0002】
【従来の技術】音声信号を予測符号化する方法として、
本発明者は先の出願(特願平9−289159号)にお
いて1チャネル(チャンネル)の原デジタル音声信号に
対して、特性が異なる複数の予測器により時間領域にお
ける過去の信号から現在の信号の複数の線形予測値を算
出し、原デジタル音声信号とこの複数の線形予測値から
予測器毎の予測残差を算出し、予測残差の最小値を選択
する方法を提案している。
【0003】
【発明が解決しようとする課題】しかしながら、上記方
法では原デジタル音声信号がサンプリング周波数=96
kHz、量子化ビット数=20ビット程度の場合にある
程度の圧縮効果を得ることができるが、近年のDVDオ
ーディオディスクではこの2倍のサンプリング周波数
(=192kHz)が使用され、また、量子化ビット数
も24ビットが使用される傾向があるので、圧縮率を改
善する必要がある。
【0004】そこで本発明は、音声信号を予測符号化す
る場合に圧縮率を改善することができる音声符号化方法
を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明は上記目的を達成
するために、以下の手段よりなる。すなわち、
【0006】少なくともレフト、センタ、ライト、サラ
ウンドレフト及びサラウンドライトの5チャネルを含む
第1の複数チャネルのデジタル音声信号を所定のマトリ
クス演算により互いに同一のサンプリング周波数を有し
て相関性のある第2の複数チャネルの音声信号に変換す
るステップと、前記第2の複数チャネルの音声信号をチ
ャネル毎に、入力される音声信号に応答して、先頭サン
プル値を所定時間のフレーム単位で得ると共に、特性が
異なる複数の線形予測方法により時間領域の過去から現
在の信号の線形予測値がそれぞれ予測され、その予測さ
れる線形予測値と前記音声信号とから得られる予測残差
が最小となるような線形予測方法を前記フレームを更に
分割したサブフレーム単位に選択して予測符号化するス
テップと、前記予測符号化手段により選択された先頭サ
ンプル値と予測残差と線形予測方法とを含む予測符号化
データをパッキングする場合、前記予測残差をビット情
報に基づいたビット数でパッキングすると共に、 前記予
測符号化データを、パケットヘッダと圧縮PCMプライ
ベートヘッダとオーディオ圧縮PCMデータ部とでパケ
ット化されたユザーデータ内の前記オーディオ圧縮PC
Mデータ部にパッキングするステップと、からなる音声
符号化方法。
【0007】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は本発明に係る音声符号化方
法を適用した音声符号化装置とそれに対応する音声復号
装置の第1の実施形態を示すブロック図、図2は図1の
符号化部を詳しく示すブロック図、図3は図1の復号化
部を詳しく示すブロック図、図4はDVDのパックのフ
ォーマットを示す説明図、図5はDVDのオーディオパ
ックのフォーマットを示す説明図、図6、図7は音声伝
送方法を示すフローチャートである。
【0008】ここで、マルチチャネル方式としては次の
4つの方式が知られている。
(1)ドルビーサラウンド方式
前方L、C、Rの3チャネル+後方Sの1チャネルの合
計4チャネル
(2)ドルビーAC−3方式
前方L、C、R、SWの4チャネル+後方SL、SRの
2チャネルの合計6チャネル
(3)DTS(Digital Theater System)方式
ドルビーAC−3方式と同様に6チャネル(L、C、
R、SW、SL、SR)
(4)SDDS(Sony Dynamic Digital Sound)方式
前方L、LC、C、RC、R、SWの6チャネル+後方
SL、SRの2チャネルの合計8チャネル
【0009】図1に示す符号化側の5チャネル(ch)相
関回路1は、マルチチャネル信号の一例としてレフト
(L)、センタ(C)、ライト(R)、サラウンドレフ
ト(SL)及びサラウンドライト(SR)の5chのPC
Mデータを、Lchを基準として次の5ch(L)、(D
1)〜(D4)に変換して図2に詳しく示す符号化部2
に出力する。
L =L(基準チャネル)
D1=C−(L+R)/2
D2=R−L
D3=SL−a×L
D4=SR−b×R
ただし、0≦a,b≦1
【0010】符号化部2は図2に詳しく示すように各ch
(L)、(D1)〜(D4)のPCMデータを予測符号
化し、これを記録媒体や通信媒体を介して復号側に伝送
する。復号側では図3に詳しく示す復号化部3により各
ch(L)、(D1)〜(D4)の予測符号化データを復
号し、次いで5チャネル相関回路4により次のように元
の5chを復元する。
R=(R−L)+L
C=C−(L+R)/2+L/2+R/2
SL=SL−a×L+a×L
SR=SR−b×R+b×R
【0011】図2を参照して符号化部2について詳しく
説明する。各ch(L)、(D1)〜(D4)のPCMデ
ータは1フレーム毎に1フレームバッファ10に格納さ
れる。そして、1フレームの各chのサンプルデータがそ
れぞれ予測回路15L、15D1〜15D4に印加され
るとともに、各chの1フレームの先頭サンプルデータが
フォーマット化回路19に印加される。予測回路15
L、15D1〜15D4はそれぞれ、各ch(L)、(D
1)〜(D4)のPCMデータに対して、特性が異なる
複数の予測器(不図示)により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、原P
CMデータとこの複数の線形予測値から予測器毎の予測
残差を算出する。続くバッファ・選択器16L、16D
1〜16D4はそれぞれ、予測回路15L、15D1〜
15D4により算出された各予測残差を一時記憶して、
選択信号生成器17により指定されたサブフレーム毎に
予測残差の最小値を選択する。
【0012】選択信号生成器17は予測残差のビット数
フラグをパッキング回路18とフォーマット化回路19
に対して印加し、また、予測残差が最小の予測器を示す
予測器選択フラグをフォーマット化回路19に対して印
加する。パッキング回路18はバッファ・選択器16
L、16D1〜16D4により選択された5ch分の予測
誤差を、選択信号生成器17により指定されたビット数
フラグに基づいて指定ビット数でパッキングする。
【0013】続くフォーマット化回路19は1フレーム
分に対して
・フレームヘッダと、
・各ch(L)、(D1)〜(D4)の1フレームの先頭
サンプル値と、
・各ch(L)、(D1)〜(D4)のサブフレーム毎の
予測器選択フラグと、
・各ch(L)、(D1)〜(D4)のサブフレーム毎の
ビット数フラグと、
・各ch(L)、(D1)〜(D4)の予測残差データ列
(可変ビット数)とを、多重化し、可変レートビットス
トリームとして出力する。このような予測符号化によれ
ば、原信号が例えばサンプリング周波数=96kHz、
量子化ビット数=24ビット、5チャネルの場合、71
%の圧縮率を実現することができる。
【0014】次に図3を参照して復号化部3について説
明する。上記フォーマットの可変レートビットストリー
ムデータは、デフォーマット化回路21によりフレーム
ヘッダに基づいて分離される。そして、各ch(L)、
(D1)〜(D4)の1フレームの先頭サンプルデータ
と予測器選択フラグはそれぞれ予測回路23L、23D
1〜23D4に印加され、各ch(L)、(D1)〜
(D4)のビット数フラグと予測残差データ列はアンパ
ッキング回路22に印加される。ここで、予測回路23
L、23D1〜23D4内の複数の予測器(不図示)は
それぞれ、符号化側の予測回路15L、15D1〜15
D4内の複数の予測器と同一の特性であり、予測器選択
フラグにより同一特性のものが選択される。
【0015】アンパッキング回路22は各ch(L)、
(D1)〜(D4)の予測残差データ列をビット数フラ
グ毎に基づいて分離してそれぞれ予測回路23L、23
D1〜23D4に出力する。予測回路23L、23D1
〜23D4ではそれぞれ、アンパッキング回路22から
の各ch(L)、(D1)〜(D4)の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各1つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで1フレー
ムの先頭サンプル値を基準として各サンプル値のPCM
データが算出される。
【0016】ここで、図2に示す符号化部2により予測
符号化された可変レートビットストリームデータを、記
録媒体の一例としてDVDオーディオディスクに記録す
る場合には、図4に示す圧縮PCMのオーディオ(A)
パックにパッキングされる。このパックは2034バイ
トのユーザデータ(Aパケット、Vパケット)に対して
4バイトのパックスタート情報と、6バイトのSCR
(System Clock Reference:システム時刻基準参照値)
情報と、3バイトのMux レート(rate)情報と1バイト
のスタッフィングの合計14バイトのパックヘッダが付
加されて構成されている(1パック=合計2048バイ
ト)。この場合、タイムスタンプであるSCR情報を、
ACBユニット内の先頭パックでは「1」として同一タ
イトル内で連続とすることにより同一タイトル内のAパ
ックの時間を管理することができる。
【0017】圧縮PCMのAパケットは図5に詳しく示
すように、17、9又は14バイトのパケットヘッダ
と、圧縮PCMのプライベートヘッダと、図3に示すフ
ォーマットの1ないし2011バイトのオーディオ圧縮
PCMデータにより構成されている。圧縮PCMのプラ
イベートヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code)番号、及びUPC/EAN−
ISRCデータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・8バイトのオーディオデータ情報(ADI)と
・0〜7バイトのスタッフィングバイトとに、より構成
されている。
【0018】また、図2に示す符号化部2により予測符
号化された可変レートビットストリームデータをネット
ワークを介して伝送する場合には、符号化側では図6に
示すように伝送用にパケット化し(ステップS41)、
次いでパケットヘッダを付与し(ステップS42)、次
いでこのパケットをネットワーク上に送り出す(ステッ
プS43)。復号側では図7に示すようにヘッダを除去
し(ステップS51)、次いでデータを復元し(ステッ
プS52)、次いでこのデータをメモリに格納して復号
を待つ(ステップS53)。
【0019】次に図8、図9を参照して第2の実施形態
について説明する。上記の実施形態では、1種類の相関
性の信号(L)、(D1)〜(D4)を予測符号化する
ように構成されているが、この第2の実施形態では複数
種類の相関性の信号の1種類を選択的に予測符号化する
ように構成されている。このため図8に示す符号化部で
は、第1〜第nの相関回路1−1〜1−nが設けられ、
このn個の相関回路1−1〜1−nは例えば5ch(L、
C、R、SL、SR)のPCMデータを相関性が異なる
n種類の5ch信号に変換する。第nの相関回路1−nは
例えば以下のように変換する。
L =L(基準チャネル)
D1=C−L
D2=R−L
D3=SL−L
D4=SR−R
【0020】また、相関回路1−1〜1−n毎に予測回
路15L、15D1〜15D4とバッファ・選択器16
L、16D1〜16D4が設けられ、グループ毎の予測
誤差の最小値のデータ量に基づいて圧縮率が最も高いグ
ループが相関選択信号生成器17bにより選択される。
このとき、その選択フラグ(相関回路選択フラグ、その
相関回路の相関係数a、b)を追加して多重化する。
【0021】また、図9に示す復号化側では、符号化側
の相関回路1−1〜1−nに対してn個の相関回路4−
1〜4−n(又は係数a、bが変更可能な1つの相関回
路4)が設けられる。なお、図8に示すnグループの予
測回路が同一の構成である場合、復号装置では図9に示
すようにnグループ分の予測回路を設ける必要はなく、
1つのグループ分の予測回路でよい。そして、符号化装
置から伝送された選択フラグに基づいて相関回路4−1
〜4−nの1つを選択、又は係数a、bを設定して元の
5ch(L、C、R、SL、SR)を復元する。
【0022】また、上記の第1の実施形態では、1種類
の相関性の信号L、D1〜D4を予測符号化するように
構成されているが、この信号L、D1〜D4のグループ
と原信号L、C、R、SL及びSRのグループを予測符
号化し、圧縮率が高い方のグループを選択するようにし
てもよい。
【0023】
【発明の効果】以上説明したように本発明によれば、複
数チャネルの音声信号を相関性のある第2の複数チャネ
ルの音声信号に変換して予測符号化するようにしたの
で、音声信号を予測符号化する場合に圧縮率を改善する
ことができる。Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech coding method for predictively coding a speech signal. 2. Description of the Related Art As a method for predictive encoding of a speech signal,
In the prior application (Japanese Patent Application No. 9-289159), the present inventor has applied a plurality of predictors having different characteristics to an original digital audio signal of one channel (channel) from a past signal in the time domain to a current signal. A method has been proposed in which a plurality of linear prediction values are calculated, a prediction residual for each predictor is calculated from the original digital audio signal and the plurality of linear prediction values, and a minimum value of the prediction residual is selected. [0003] However, in the above method, the original digital audio signal has a sampling frequency = 96.
Although a certain compression effect can be obtained when the kHz and the quantization bit number are about 20 bits, recent DVD audio discs use twice the sampling frequency (= 192 kHz). Since 24 bits also tend to be used, the compression ratio needs to be improved. Accordingly, an object of the present invention is to provide a speech coding method capable of improving a compression ratio when predictive coding of a speech signal is performed. [0005] The present invention, in order to achieve the above object, comprises the following means. That is, the digital audio signals of the first plurality of channels including at least five channels of left, center, right, surround left and surround right have the same sampling frequency and are correlated by a predetermined matrix operation. Converting the audio signals of the second plurality of channels into audio signals of the second plurality of channels, for each channel, in response to the input audio signal , obtaining a first sample value in frame units of a predetermined time; The linear prediction values of the current signal from the past in the time domain are respectively predicted by a plurality of linear prediction methods having different characteristics, and the prediction residual obtained from the predicted linear prediction value and the audio signal is minimized. a linear prediction method further said frame
Selecting and performing predictive coding in units of divided sub-frames; and, when packing predicted coded data including a head sample value, a prediction residual, and a linear prediction method selected by the predictive coding means , Bit information
With packing the number of bits based on distribution, the pre
The measured and encoded data is transferred to the packet header and the compressed PCM
Packet with the header and audio compression PCM data
Said audio compression PC in the user data converted into
Packing in the M data part . Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a first embodiment of a speech encoding apparatus to which the speech encoding method according to the present invention is applied and a speech decoding apparatus corresponding thereto, and FIG. 2 is a block diagram showing the encoding unit of FIG. 1 in detail. , FIG. 3 is a block diagram showing the decoding unit of FIG. 1 in detail, FIG. 4 is an explanatory diagram showing a format of a DVD pack, FIG. 5 is an explanatory diagram showing a format of an audio pack of a DVD, and FIGS. 5 is a flowchart illustrating a transmission method. Here, the following four systems are known as multi-channel systems. (1) Dolby surround system: 3 channels of front L, C, R + 1 channel of rear S in total 4 channels (2) Dolby AC-3 system: 4 channels of front L, C, R, SW + rear SL, SR 6 channels in total, 3 channels (3) DTS (Digital Theater System) system 6 channels (L, C,
R, SW, SL, SR) (4) SDDS (Sony Dynamic Digital Sound) system 6 channels of front L, LC, C, RC, R and SW + 2 channels of rear SL and SR, totaling 8 channels The five-channel (ch) correlation circuit 1 on the encoding side shown in FIG. 1 includes left (L), center (C), right (R), surround left (SL), and surround right (SR) as examples of a multi-channel signal. 5ch PC
The M data is divided into the following 5 ch (L), (D
1) to (D4), which are converted to an encoding unit 2 shown in detail in FIG.
Output to L = L (reference channel) D1 = C-(L + R) / 2 D2 = R-L D3 = SL-a x L D4 = SR-b x R where 0≤a, b≤1 2 is each channel as shown in detail in FIG.
(L), the PCM data of (D1) to (D4) are predictively coded and transmitted to the decoding side via a recording medium or a communication medium. On the decoding side, the decoding unit 3 shown in detail in FIG.
The prediction coded data of ch (L) and (D1) to (D4) are decoded, and then the original 5ch is restored by the 5-channel correlation circuit 4 as follows. R = (RL) + LC = C- (L + R) / 2 + L / 2 + R / 2 SL = SL-a * L + a * L SR = SR-b * R + b * R Encoding with reference to FIG. The unit 2 will be described in detail. The PCM data of each channel (L) and (D1) to (D4) is stored in one frame buffer 10 for each frame. Then, the sample data of each channel of one frame is applied to the prediction circuits 15L and 15D1 to 15D4, respectively, and the head sample data of one frame of each channel is applied to the formatting circuit 19. Prediction circuit 15
L, 15D1 to 15D4 are the respective channels (L), (D
For the PCM data of 1) to (D4), a plurality of linear predictors of the current signal are calculated from past signals in the time domain by a plurality of predictors (not shown) having different characteristics, and the original P
A prediction residual for each predictor is calculated from the CM data and the plurality of linear prediction values. Following buffer / selector 16L, 16D
1 to 16D4 are prediction circuits 15L and 15D1 to 15D1, respectively.
Each prediction residual calculated by 15D4 is temporarily stored,
The minimum value of the prediction residual is selected for each subframe specified by the selection signal generator 17. The selection signal generator 17 outputs a bit number flag of the prediction residual to a packing circuit 18 and a formatting circuit 19.
, And a predictor selection flag indicating the predictor with the smallest prediction residual is applied to the formatting circuit 19. The packing circuit 18 is a buffer / selector 16
L, the prediction errors of 5 channels selected by 16D1 to 16D4 are packed with the specified number of bits based on the bit number flag specified by the selection signal generator 17. The following formatting circuit 19 provides a frame header for one frame, a leading sample value of one frame of each channel (L), (D1) to (D4), (D1)-(D4) a predictor selection flag for each sub-frame;-each channel (L); a bit number flag for each sub-frame of (D1)-(D4);-each channel (L), ( The prediction residual data sequence (variable bit number) of D1) to (D4) is multiplexed and output as a variable rate bit stream. According to such predictive coding, the original signal is, for example, sampling frequency = 96 kHz,
Quantization bit number = 24 bits, 71 for 5 channels
% Compression ratio can be achieved. Next, the decoding section 3 will be described with reference to FIG. The variable-rate bit stream data in the above format is separated by the deformatting circuit 21 based on the frame header. And each channel (L),
The head sample data of one frame (D1) to (D4) and the predictor selection flag are stored in the prediction circuits 23L and 23D, respectively.
1 to 23D4, each channel (L), (D1) to
The bit number flag (D4) and the prediction residual data string are applied to the unpacking circuit 22. Here, the prediction circuit 23
L, a plurality of predictors (not shown) in 23D1 to 23D4 are prediction circuits 15L, 15D1 to 15D on the encoding side, respectively.
The same characteristics as those of the plurality of predictors in D4, and those having the same characteristics are selected by the predictor selection flag. The unpacking circuit 22 includes channels (L),
The prediction residual data strings of (D1) to (D4) are separated based on each bit number flag, and are respectively predicted by the prediction circuits 23L and 23L.
It outputs to D1-23D4. Prediction circuits 23L, 23D1
23D4, the current prediction residual data of each channel (L) and (D1) to (D4) from the unpacking circuit 22 and a predictor selection flag among a plurality of internal predictors are selected. The previous predicted value predicted by each one is added to calculate the current predicted value, and then the PCM of each sample value is set based on the first sample value of one frame.
Data is calculated. Here, when the variable-rate bit stream data predictively encoded by the encoding unit 2 shown in FIG. 2 is recorded on a DVD audio disc as an example of a recording medium, the compressed PCM audio data shown in FIG. (A)
Packed in a pack. This pack contains 4 bytes of pack start information and 20 bytes of SCR for 2034 bytes of user data (A packet, V packet).
(System Clock Reference: System clock reference value)
Information, a 3-byte Mux rate (rate) information, and a 1-byte stuffing are added to add a 14-byte pack header (1 pack = 2048 bytes in total). In this case, the time stamp SCR information is
In the first pack in the ACB unit, the time of the A pack in the same title can be managed by setting “1” to be continuous in the same title. As shown in detail in FIG. 5, the A packet of the compressed PCM is a packet header of 17, 9, or 14 bytes, a private header of the compressed PCM, and 1 to 2011 bytes of audio compressed PCM data of the format shown in FIG. It consists of. The private header of the compressed PCM is: 1-byte substream ID, 2 bytes of UPC / EAN-ISRC (Universal Prism).
oduct Code / European Article Number-International S
tandard Recording Code) number and UPC / EAN-
ISRC data, 1-byte private header length, 2 bytes of first access unit pointer, 8 bytes of audio data information (ADI), and 0 to 7 bytes of stuffing bytes. I have. When the variable-rate bit stream data predicted and encoded by the encoding unit 2 shown in FIG. 2 is transmitted via a network, the encoding side packetizes the data for transmission as shown in FIG. (Step S41),
Next, a packet header is added (step S42), and the packet is sent out to the network (step S43). On the decoding side, the header is removed as shown in FIG. 7 (step S51), the data is restored (step S52), and the data is stored in the memory and decoding is waited (step S53). Next, a second embodiment will be described with reference to FIGS. In the above embodiment, one kind of correlation signal (L), (D1) to (D4) is configured to be predictively coded, but in the second embodiment, a plurality of kinds of correlation It is configured to selectively predictively encode one type of signal. Therefore, the encoding unit shown in FIG. 8 includes first to n-th correlation circuits 1-1 to 1-n,
The n number of correlation circuits 1-1 to 1-n are, for example, 5 ch (L,
C, R, SL, and SR) are converted into n types of 5ch signals having different correlations. The n-th correlation circuit 1-n converts, for example, as follows. L = L (reference channel) D1 = C-L D2 = R-L D3 = SL-L D4 = SR-R Further, the prediction circuits 15L, 15D1 to 15D4 are provided for each of the correlation circuits 1-1 to 1-n. And buffer / selector 16
L, 16D1 to 16D4 are provided, and the group with the highest compression ratio is selected by the correlation selection signal generator 17b based on the data amount of the minimum value of the prediction error for each group.
At this time, the selection flag (correlation circuit selection flag, correlation coefficients a and b of the correlation circuit) is added and multiplexed. On the decoding side shown in FIG. 9, n correlator circuits 4--1 to n-correlator circuits 1-1 to 1-n on the encoder side are used.
1 to 4-n (or one correlation circuit 4 whose coefficients a and b can be changed) are provided. When the prediction circuits of the n groups shown in FIG. 8 have the same configuration, the decoding device does not need to provide the prediction circuits for the n groups as shown in FIG.
A prediction circuit for one group may be used. Then, based on the selection flag transmitted from the encoding device, the correlation circuit 4-1
... 4-n is selected, or coefficients a and b are set to restore the original 5 ch (L, C, R, SL, SR). In the first embodiment, one kind of correlated signals L, D1 to D4 is configured to be predictively coded. A group of the signals L, C, R, SL and SR may be predictively coded and a group having a higher compression rate may be selected. As described above, according to the present invention, a plurality of channels of audio signals are converted into correlated second plurality of channels of audio signals and predictively encoded. It is possible to improve the compression ratio when predictive coding of an audio signal is performed.
【図面の簡単な説明】
【図1】本発明に係る音声符号化方法を適用した音声符
号化装置とそれに対応する音声復号装置の第1の実施形
態を示すブロック図である。
【図2】図1の符号化部を詳しく示すブロック図であ
る。
【図3】図1の復号化部を詳しく示すブロック図であ
る。
【図4】DVDのパックのフォーマットを示す説明図で
ある。
【図5】DVDのオーディオパックのフォーマットを示
す説明図である。
【図6】音声伝送方法を示すフローチャートである。
【図7】音声伝送方法を示すフローチャートである。
【図8】他の音声符号化装置を示すブロック図である。
【図9】図8に対応した音声復号装置を示すブロック図
である。
【符号の説明】
1,1−1〜1−n,4,4−1〜4−n 相関回路
(相関手段)
15L、15D1〜15D4 予測回路(バッファ・選
択器16L、16D1〜16D4と共に予測符号化手段
を構成する。)
16L、16D1〜16D4 バッファ・選択器BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing a first embodiment of a speech encoding device to which a speech encoding method according to the present invention is applied and a speech decoding device corresponding thereto. FIG. 2 is a block diagram illustrating an encoding unit of FIG. 1 in detail. FIG. 3 is a block diagram illustrating a decoding unit of FIG. 1 in detail; FIG. 4 is an explanatory diagram showing a format of a DVD pack. FIG. 5 is an explanatory diagram showing a format of a DVD audio pack. FIG. 6 is a flowchart illustrating a voice transmission method. FIG. 7 is a flowchart illustrating a voice transmission method. FIG. 8 is a block diagram showing another speech encoding device. FIG. 9 is a block diagram showing a speech decoding device corresponding to FIG. 8; [Description of Codes] 1,1-1 to 1-n, 4,4-1 to 4-n Correlation circuit (correlation means) 15L, 15D1 to 15D4 Prediction circuit (Buffer / selector 16L, 16D1 to 16D4 and prediction code 16L, 16D1 to 16D4 Buffer / Selector
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭64−44499(JP,A) 特開 平3−108824(JP,A) 特開 平8−65169(JP,A) 特開 平10−320928(JP,A) 特開 平10−233058(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 ──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-64-44499 (JP, A) JP-A-3-108824 (JP, A) JP-A-8-65169 (JP, A) JP-A 10-108 320928 (JP, A) JP-A-10-233058 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G10L 19/00
Claims (1)
ウンドレフト及びサラウンドライトの5チャネルを含む
第1の複数チャネルのデジタル音声信号を所定のマトリ
クス演算により互いに同一のサンプリング周波数を有し
て相関性のある第2の複数チャネルの音声信号に変換す
るステップと、 前記第2の複数チャネルの音声信号をチャネル毎に、入
力される音声信号に応答して、先頭サンプル値を所定時
間のフレーム単位で得ると共に、特性が異なる複数の線
形予測方法により時間領域の過去から現在の信号の線形
予測値がそれぞれ予測され、その予測される線形予測値
と前記音声信号とから得られる予測残差が最小となるよ
うな線形予測方法を前記フレームを更に分割したサブフ
レーム単位に選択して予測符号化するステップと、 前記予測符号化手段により選択された先頭サンプル値と
予測残差と線形予測方法とを含む予測符号化データをパ
ッキングする場合、前記予測残差をビット情報に基づい
たビット数でパッキングすると共に、 前記予測符号化データを、パケットヘッダと圧縮PCM
プライベートヘッダとオーディオ圧縮PCMデータ部と
でパケット化されたユザーデータ内の前記オーディオ圧
縮PCMデータ部にパッキングするステップと、 からなる音声符号化方法。(57) [Claims 1] The same sampling of digital audio signals of a first plurality of channels including at least five channels of left, center, right, surround left and surround right by a predetermined matrix operation. Converting the audio signals of the second plurality of channels having a frequency and correlation, and, for each channel, the audio signals of the second plurality of channels, in response to the input audio signal, a first sample value At a given time
With obtaining a frame-by-frame basis between, characteristics are predicted linear prediction value of the current signal from a past time domain by a plurality of different linear prediction methods, respectively, obtained from the audio signal and the linear prediction value the predicted prediction A linear prediction method that minimizes the residual is applied to a sub-frame obtained by further dividing the frame.
Pas and predicting coding by selecting frame unit, a predictive coded data comprising said first sample values selected by predictive coding means and the prediction residual and the linear prediction method
When locking, the prediction residual is calculated based on bit information.
And packed the predicted encoded data with a packet header and a compressed PCM.
Private header and audio compressed PCM data part
The audio pressure in the user data packetized by
And packing the compressed PCM data section .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000321503A JP3387090B2 (en) | 2000-10-20 | 2000-10-20 | Audio coding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000321503A JP3387090B2 (en) | 2000-10-20 | 2000-10-20 | Audio coding method |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10306322A Division JP2000122697A (en) | 1998-10-13 | 1998-10-13 | Sound encoder, optical recording medium and sound decorder, and sound transmitting method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001188567A JP2001188567A (en) | 2001-07-10 |
JP3387090B2 true JP3387090B2 (en) | 2003-03-17 |
Family
ID=18799619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000321503A Expired - Lifetime JP3387090B2 (en) | 2000-10-20 | 2000-10-20 | Audio coding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3387090B2 (en) |
-
2000
- 2000-10-20 JP JP2000321503A patent/JP3387090B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2001188567A (en) | 2001-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000148193A (en) | Voice encoding device, optical recording medium, voice decoding device and voice transmitting method | |
JP3387089B2 (en) | Audio coding device | |
JP3387090B2 (en) | Audio coding method | |
JP3354136B2 (en) | Audio encoding method, audio signal receiving method, and audio decoding method | |
JP3387096B2 (en) | Audio coding device | |
JP3606454B2 (en) | Audio signal transmission method and audio decoding method | |
JP3387091B2 (en) | Optical recording medium, audio transmission method and audio decoding method | |
JP3387095B2 (en) | Audio coding device | |
JP3356166B2 (en) | Audio coding method | |
JP3356165B2 (en) | Audio coding device | |
JP4164824B2 (en) | Audio signal transmission method and audio decoding method | |
JP3344567B2 (en) | Optical recording medium, audio decoding device | |
JP2000214887A (en) | Sound coding device, optical record medium sound decoding device, sound transmitting method and transmission medium | |
JP3387097B2 (en) | Audio encoding method and audio decoding method | |
JP2000122697A (en) | Sound encoder, optical recording medium and sound decorder, and sound transmitting method | |
JP3606457B2 (en) | Audio signal transmission method and audio decoding method | |
JP4164825B2 (en) | Audio signal transmission method and audio decoding method | |
JP3344568B2 (en) | Audio signal transmission method, audio decoding method | |
JP2004139102A (en) | Optical recording medium and voice decoding device | |
JP2004326136A (en) | Voice signal transmitting method and voice decoding method | |
JP2001202099A (en) | Voice encording method and voice decoding method | |
JP2004139099A (en) | Optical recording medium and voice decoding device | |
JP2001188565A (en) | Optical recording medium, voice signal transmission method, and voice decoding method | |
JP2001188585A (en) | Optical recording device and voice decoding device | |
JP2004139100A (en) | Optical recording medium and voice decoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090110 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090110 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100110 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110110 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120110 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120110 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20190110 Year of fee payment: 16 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20190110 Year of fee payment: 16 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20190110 Year of fee payment: 16 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |