JP3344571B2 - 記録媒体、音声復号装置 - Google Patents

記録媒体、音声復号装置

Info

Publication number
JP3344571B2
JP3344571B2 JP32595899A JP32595899A JP3344571B2 JP 3344571 B2 JP3344571 B2 JP 3344571B2 JP 32595899 A JP32595899 A JP 32595899A JP 32595899 A JP32595899 A JP 32595899A JP 3344571 B2 JP3344571 B2 JP 3344571B2
Authority
JP
Japan
Prior art keywords
data
channel
information
audio signal
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP32595899A
Other languages
English (en)
Other versions
JP2000214895A (ja
Inventor
美昭 田中
昭治 植野
徳彦 渕上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP32595899A priority Critical patent/JP3344571B2/ja
Publication of JP2000214895A publication Critical patent/JP2000214895A/ja
Application granted granted Critical
Publication of JP3344571B2 publication Critical patent/JP3344571B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マルチチャネルの
音声信号を圧縮して記録した記録媒体及び音声復号装置
に関する。
【0002】
【従来の技術】音声信号を圧縮する方法として、本発明
者は先の出願(特願平9−289159号)において1
チャネルの原デジタル音声信号に対して、特性が異なる
複数の予測器により時間領域における過去の信号から現
在の信号の複数の線形予測値を算出し、原デジタル音声
信号と、この複数の線形予測値から予測器毎の予測残差
を算出し、予測残差の最小値を選択する予測符号化方法
を提案している。
【0003】なお、上記方法では原デジタル音声信号が
サンプリング周波数=96kHz、量子化ビット数=2
0ビット程度の場合にある程度の圧縮効果を得ることが
できるが、近年のDVDオーディオディスクではこの2
倍のサンプリング周波数(=192kHz)が使用さ
れ、また、量子化ビット数も24ビットが使用される傾
向がある。
【0004】
【発明が解決しようとする課題】上記したように、DV
Dオーディオの場合、サンプリング周波数も高く、しか
も、マルチチャンネル信号を扱うためデータ量も多くな
り、より圧縮効率の改善が望まれていると共に、再生時
のことを考慮すると、圧縮されたデータをより正確に復
号することが望まれている。そこで、本願各発明では、
そのような点を考慮して圧縮効率を改善すると共に、よ
り正確な復号ができるデータを記録した記録媒体及び音
声復号装置を提供することを目的とする。
【0005】本発明は上記目的を達成するために、以下
の1)〜4)の手段からなるものである。すなわち、
【0006】1)マルチチャネルの音声信号、そのま
まのチャネル又は互いに相関をとったチャネル毎に入力
される音声信号に応答して先頭サンプル値を得ると共
に、特性が異なる複数の線形予測方法により時間領域
過去から現在の信号の線形予測値がそれぞれ予測され、
その予測される線形予測値と前記音声信号とから得られ
予測残差が最小となるような線形予測方法を選択して
予測符号化するステップと、前記ステップにより選択さ
れたチャネル毎の線形予測方法と予測残差と所定の先頭
サンプル値を含む予測符号化データを格納するサブスト
リームを有するサブパケットと、そのサブパケットに対
応して設けられその同期情報を含む同期情報部とから一
つのアクセスユニットを形成し、前記サブパケット内に
前記アクセスユニットの数個毎に再生側において元の音
声信号を復元する際に必要なリスタート情報を含むリス
タート情報部を設けたデータ構造にフォーマット化する
ステップとにより、前記データ構造にフォーマット化さ
れたデータが記録され、その記録されたデータうち前記
予測符号化データは元の音声信号を復元するために用い
られる予測値を算出するためのデータとして記録される
ことを特徴とする記録媒体。 2)請求項記載のサブパケット及び同期情報部と、更
にSCR情報を含むパックヘッダと、を含んで一つのパ
ックとしてフォーマット化されて記録されると共に、前
記SCR情報は、前記パックを再生する際の時間管理情
報として用いられることを特徴とする記録媒体。 3)請求項1記載の記録媒体に記録されたデータから元
マルチチャネルの音声信号を復号する音声復号装置で
あって、前記データ構造をサブパケットと同期情報部に
分離する手段と、前記サブパケット内の圧縮データを前
記リスタート情報部内の情報に基づいてチャネル毎に伸
長する伸長手段と、前記伸長された音声データから前記
マルチチャンネルの音声信号に変換する手段と、前記変
換されたマルチチャンネル音声データを前記同期情報部
内のサンプリング周波数及び量子化ビット数に基づいて
アナログ音声信号に変換する手段とを、有する音声復号
装置。 4)請求項2記載の記録媒体に記録されたデータから元
マルチチャネルの音声信号を復号する音声復号装置で
あって、前記パックヘッダに含まれるSCR情報を分離
する第1の分離手段と、前記分離されたSCR情報に基
づいて前記サブパケット及び同期情報部を保持するため
のバッファと、前記バッファに保持された前記サブパケ
ットと同期情報部とを分離する第2の分離手段と、前記
サブパケット内の圧縮データを前記リスタート情報部内
の情報に基づいてチャネル毎に伸長する伸長手段と、前
記伸長された音声データから前記マルチチャンネルの音
声信号に変換する手段と、前記変換されたマルチチャン
ネル音声データを前記同期情報部内のサンプリング周波
数及び量子化ビット数に基づいてアナログ音声信号に変
換する手段とを、有する音声復号装置。
【0007】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は本発明が適用される音声符
号化装置及び音声復号装置の第1の実施形態を示すブロ
ック図、図2は図1の符号化部を詳しく示すブロック
図、図3は図1、図2の符号化部により符号化されたビ
ットストリームを示す説明図、図4はDVDのパックの
フォーマットを示す説明図、図5はDVDのオーディオ
パックのフォーマットを示す説明図、図6は図5のオー
ディオデータエリアのフォーマットを詳しく示す説明
図、図7は図1の復号化部を詳しく示すブロック図、図
8は図7の入力バッファの書き込み/読み出しタイミン
グを示すタイミングチャート、図9はアクセスユニット
毎の圧縮データ量を示す説明図、図10はアクセスユニ
ットとプレゼンテーションユニットを示す説明図であ
る。
【0008】ここで、マルチチャネル方式としては、例
えば次の4つの方式が知られている。 (1)4チャネル方式 ドルビーサラウンド方式の
ように、前方L、C、Rの3チャネル+後方Sの1チャ
ネルの合計4チャネル (2)5チャネル方式 ドルビーAC−3方式のS
Wチャネルなしのように、前方L、C、Rの3チャネル
+後方SL、SRの2チャネルの合計5チャネル (3)6チャネル方式 DTS(Digital Theater
System)方式や、ドルビーAC−3方式のように6チャ
ネル(L、C、R、SW(Lfe)、SL、SR) (4)8チャネル方式 SDDS(Sony Dynamic D
igital Sound)方式のように、前方L、LC、C、R
C、R、SWの6チャネル+後方SL、SRの2チャネ
ルの合計8チャネル
【0009】図1に示す符号化側の6チャネル(ch)ミ
クス&マトリクス回路1’は、マルチチャネル信号の一
例としてフロントレフト(Lf)、センタ(C)、フロ
ントライト(Rf)、サラウンドレフト(Ls)、サラ
ウンドライト(Rs)及びLfe(Low Frequency Effe
ct)の6chのPCMデータを次式(1)により前方グル
ープに関する2ch「1」、「2」と他のグループに関す
る4ch「3」〜「6」に分類して変換し、2ch「1」、
「2」を第1符号化部2’−1に、また、4ch「3」〜
「6」を第2符号化部2’−2に出力する。
【0010】 「1」=Lf+Rf 「2」=Lf−Rf 「3」=C−(Ls+Rs)/2 「4」=Ls+Rs 「5」=Ls−Rs 「6」=Lfe−a×C ただし、0≦a≦1 …(1)
【0011】符号化部2’を構成する第1及び第2符号
化部2’−1、2’−2はそれぞれ、図2に詳しく示す
ように2ch「1」、「2」と4ch「3」〜「6」のPC
Mデータをチャネル毎に予測符号化し、予測符号化デー
タを図3に示すようなビットストリームで記録媒体5や
衛星回線や電話回線等の通信媒体6を介して復号側に伝
送する。復号側では復号化部3’を構成する第1及び第
2復号化部3’−1、3’−2により、図7に詳しく示
すようにそれぞれ前方グループに関する2ch「1」、
「2」と他のグループに関する4ch「3」〜「6」の予
測符号化データをチャネル毎にPCMデータに復号す
る。
【0012】次いでミクス&マトリクス回路4’により
式(1)に基づいて元の6ch(Lf、C、Rf、Ls、
Rs、Lfe)を復元するとともに、この元の6chと係
数mij(i=1,2,j=1,2〜6)により次式
(2)のようにステレオ2chデータ(L、R)を生成す
る。 L=m11・Lf+m12・Rf+m13・C +m14・Ls+m15・Rs+m16・Lfe R=m21・Lf+m22・Rf+m23・C +m24・Ls+m25・Rs+m26・Lfe …(2)
【0013】図2を参照して符号化部2’−1、2’−
2について詳しく説明する。各ch「1」〜「6」のPC
Mデータは1フレーム毎に1フレームバッファ10に格
納される。そして、1フレームの各ch「1」〜「6」の
サンプルデータがそれぞれ予測回路13D1、13D
2、15D1〜15D4に印加されるとともに、各ch
「1」〜「6」の各フレームの先頭サンプルデータ(後
述のリスタートヘッダ内に格納される)がアンパッキン
グ回路8及びフォーマット化回路19に印加される。ま
た、PCMデータがA/D変換されたときのサンプリン
グ周波数(fs)と量子化ビット数(Qb)がパッキン
グ回路18及びフォーマット化回路19に印加される。
予測回路13D1、13D2、15D1〜15D4はそ
れぞれ、各ch「1」〜「6」のPCMデータに対して、
特性が異なる複数の予測器(不図示)により時間領域に
おける過去の信号から現在の信号の複数の線形予測値を
算出し、次いで原PCMデータと、この複数の線形予測
値から予測器毎の予測残差を算出する。続くバッファ・
選択器14D1、14D2、16D1〜16D4はそれ
ぞれ、予測回路13D1、13D2、15D1〜15D
4により算出された各予測残差を一時記憶して、選択信
号/DTS(デコーディング・タイム・スタンプ)生成
器17により指定されたサブフレーム毎に予測残差の最
小値を選択する。
【0014】選択信号/DTS生成器17は予測残差の
ビット数フラグをパッキング回路18とフォーマット化
回路19に対して印加し、また、予測残差が最小の予測
器を示す予測器選択フラグと、式(1)における相関係
数aと、復号化側が入力バッファ22a(図7)からス
トリームデータを取り出す時間を示すDTSをフォーマ
ット化回路19に対して印加する。パッキング回路18
はバッファ・選択器14D1、14D2、16D1〜1
6D4により選択された6ch分の予測残差を、選択信号
/DTS生成器17により指定されたビット数フラグに
基づいて指定ビット数でパッキングし、サンプリング周
波数fsに応じたサンプル数でパッキングする。すなわ
ち、サンプリング周波数48kHzの場合にはサンプル
数40を選び、サンプリング周波数96kHzの場合に
はサンプル数80を選び、、192kHzの場合にはサ
ンプル数80を選ぶようになっている。またPTS生成
器17cは、復号化側が出力バッファ110(図7)か
らPCMデータを取り出す時間を示すPTS(プレゼン
テーション・タイム・スタンプ)を生成してフォーマッ
ト化回路19に出力する。
【0015】続くフォーマット化回路19は図3〜図6
に示すようなユーザデータにフォーマット化する。図3
に示すユーザデータ(サブパケット)は、前方グループ
に関する2ch「1」、「2」の予測符号化データを含む
可変レートビットストリーム(サブストリーム)BS0
と、他のグループに関する4ch「3」〜「6」の予測符
号化データを含む可変レートビットストリーム(サブス
トリーム)BS1と、サブストリームBS0、BS1の
前に設けられたビットストリームヘッダ(リスタートヘ
ッダ)により構成されている。また、サブストリームB
S0、BS1の1フレーム分は ・フレームヘッダと、 ・各ch「1」〜「6」の1フレームの先頭サンプルデー
タと、 ・各ch「1」〜「6」のサブフレーム毎の予測器選択フ
ラグと、 ・各ch「1」〜「6」のサブフレーム毎のビット数フラ
グと、 ・各ch「1」〜「6」の予測残差データ列(可変ビット
数)と、 ・ch「6」の係数aとが、 多重化されている。このような予測符号化によれば、原
信号が例えばサンプリング周波数(fs)=96kH
z、量子化ビット数(Qb)=24ビット、6チャネル
の場合、71%の圧縮率を実現することができる。
【0016】図2に示す符号化部2’−1、2’−2に
より予測符号化された可変レートビットストリームデー
タを、記録媒体の一例としてDVDオーディオディスク
に記録する場合には、図4に示すオーディオ(A)パッ
クにパッキングされる。このパックは2034バイトの
ユーザデータ(Aパケット、Vパケット)に対して4バ
イトのパックスタート情報と、6バイトのSCR(Syst
em Clock Reference:システム時刻基準参照値)情報
と、3バイトのMux レート(rate)情報と1バイトのス
タッフィングの合計14バイトのパックヘッダが付加さ
れて構成されている(1パック=合計2048バイ
ト)。この場合、タイムスタンプであるSCR情報を、
先頭パックでは「1」として同一タイトル内で連続とす
ることにより同一タイトル内のAパックの時間を管理す
ることができる。
【0017】圧縮PCMのAパケットは図5に詳しく示
すように、9〜22バイトのパケットヘッダと、圧縮P
CMのプライベートヘッダと、図3に示すフォーマット
の1ないし2015バイトのオーディオデータ(圧縮P
CM)により構成されている。そして、DTSとPTS
は図5のパケットヘッダ内に(具体的にはパケットヘッ
ダの10〜14バイト目にPTSが、15〜19バイト
目にDTSが)セットされる。圧縮PCMのプライベー
トヘッダは、 ・1バイトのサブストリームIDと、 ・2バイトのUPC/EAN−ISRC(Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code)番号、及びUPC/EAN−
ISRCデータと、 ・1バイトのプライベートヘッダ長と、 ・2バイトの第1アクセスユニットポインタと、 ・4バイトのオーディオデータ情報(ADI)と、 ・0〜7バイトのスタッフィングバイトとに、より構成
されている。
【0018】そして、ADI内に1秒後のアクセスユニ
ットをサーチするための前方アクセスユニット・サーチ
ポインタと、1秒前のアクセスユニットをサーチするた
めの後方アクセスユニット・サーチポインタがともに1
バイトでセットされる。具体的には、ADIの1バイト
目に前方アクセスユニット・サーチポインタが、8バイ
ト目に後方アクセスユニット・サーチポインタがセット
される。このようにADIは、圧縮PCMでは4バイト
に減少させるためオーディオデータを2015バイトま
で収納できる。
【0019】図5に示す圧縮PCM(PPCM)のオー
ディオパケットにおけるオーディオデータエリアは、図
6に示すように複数のPPCMアクセスユニットにより
構成され、PPCMアクセスユニットはPPCMシンク
情報とサブパケットにより構成されている。最初のPP
CMアクセスユニット内のサブパケットは、ディレクト
リと、サブストリーム「BS0」と、CRC(1バイト
又は2バイト)と、サブストリーム「BS1」と、CR
Cとエクストラ情報により構成され、サブストリーム
「BS0」、「BS1」はPPCMブロックのみにより
構成されている。2番目以降のPPCMアクセスユニッ
ト内のサブパケットも、ディレクトリと、サブストリー
ム「BS0」と、CRCと、サブストリーム「BS1」
と、CRCとエクストラ情報により構成され、サブスト
リーム「BS0」、「BS1」はリスタートヘッダとP
PCMブロックにより構成されている。このリスタート
ヘッダには前述のフレーム先頭サンプル値が格納され、
このリスタートヘッダは一アクセスユニット毎に設けら
れるのではなく、数個毎のアクセスユニットに一つ設け
られるようになっている。そして、エクストラ情報は、
少なくとも、サイズ調整機能を有している。すなわち、
入来データが固定レート(CBR)の場合には、上述し
たようにサンプリング周波数fsによって1パケット当
たりのサンプリング数が40,80,160のいずれか
に定められており、そのため、決定されたサンプリング
数によっては1パケット当たりのデータ長とサブパケッ
トのサイズとが合わない場合があり、それをサブパケッ
トのサイズに合わせるために、例えば、0,0…等を付
加してサイズ調整を行う。また、このサイズ調整用のデ
ータはテキストデータ等を利用することも可能である。
【0020】PPCMシンク情報(以下、同期情報とも
いう)は次の情報を含む。 ・1パケット当たりのサンプル数:サンプリング周波数
fsに応じて40、80又は160が選択される。 ・データレートがVBRの場合には「0」(サブパケッ
ト内のデータがVBRの圧縮データであることを示す識
別子)、CBRの場合には「1」(サブパケット内のデ
ータが固定レートであることを示す識別子) ・サンプリング周波数fs及び量子化ビット数Qb ・チャネル割り当て情報
【0021】次に図7を参照して復号化部3’−1、
3’−2について説明する。上記フォーマットのパック
ヘッダと可変レートビットストリームデータBS0、B
S1は、デフォーマット化回路21により分離される。
そして、各ch「1」〜「6」の1フレームの先頭サン
プルデータ含むリスタートヘッダ、予測器選択フラグ、
各ch「1」〜「6」のビット数フラグ、SCR、DT
S、チャンネル割り当て情報及び予測残差データ列が入
力バッファ22aに印加され、PTSは出力バッファ1
10に印加される。そして、これらの情報はアンパッキ
ング回路22に印加され、チャンネル割り当て情報に応
じて使用される各予測回路24D1,24D2,23D
1〜23D4が決定されるようになっている。例えば、
6チャンネルの割り当て情報であれば、全部の予測回路
が使用され、6チャンネルのデータが繰り返し供給さ
れ、5チャンネルの割り当て情報であれば、5チャンネ
ルのデータが繰り返し供給されるよになっている。ま
た、割り当て情報はマルチチャンネルの情報だけに限ら
ず、ステレオ2チャンネルの情報の場合もあり得、その
場合には予測回路24D1,24D2が使用される。ま
た、データレートがVBRかCBRかを示す識別子は各
予測器24D1、24D2、23D1、23D2、23
D3、23D4に印加され、これらにおいて識別子に応
じた入出力データの処理プログラムが決定されてデータ
の取り込み速度の制御がなされることになる。VBRで
ある場合には処理プログラムを切り換えると共に入力デ
ータを毎回ロードする必要があり処理に時間を要するこ
とになるが、CBRの場合には固定レートであることか
ら処理プログラムを切り換える必要がなく処理が速くな
る。そして、選択された各予測器ではリスタートヘッダ
内のフレーム先頭サンプル値に基づいて予測算差が計算
されることになる。また、サンプリング周波数fs及び
量子化ビット数QbはD/A変換器102に印加され
る。ここで、予測回路24D1、24D2、23D1〜
23D4内の複数の予測器(不図示)はそれぞれ、符号
化側の予測回路13D1、13D2、15D1〜15D
4内の複数の予測器と同一の特性であり、予測器選択フ
ラグにより同一特性のものが選択される。
【0022】デフォーマット化回路21により、最初オ
ーディオパックからオーディオパケットが分離され、次
にオーディオパケットからストリームデータ(予測残差
データ列)が分離されてビットストリームBS0とBS
1が取り出される。またSCRが取り出され、図8に示
すようにSCRによるタイミングにしたがってアクセス
ユニット毎に入力バッファ22aに取り込まれて蓄積さ
れる。ここで、1つのアクセスユニットのデータ量は、
例えばfs=96kHzの場合には(1/96kHz)
秒分であるが、図9、図10(a)に詳しく示すように
可変長である。そして、入力バッファ22aに蓄積され
たストリームデータはDTSに基づいてFIFOで読み
出されてアンパッキング回路22に印加される。
【0023】アンパッキング回路22は各ch「1」〜
「6」の予測残差データ列をビット数フラグ毎に基づい
て分離してそれぞれ予測回路24D1、24D2、23
D1〜23D4に出力する。予測回路24D1、24D
2、23D1〜23D4ではそれぞれ、アンパッキング
回路22からの各ch「1」〜「6」の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各1つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで1フレー
ムの先頭サンプルデータを基準として各サンプルのPC
Mデータが算出されて出力バッファ110に蓄積され
る。出力バッファ110に蓄積されたPCMデータはP
TSに基づいて読み出されて出力され、したがって、図
10(a)に示す可変長のアクセスユニットが伸長され
て、図10(b)に示す一定長のプレゼンテーションユ
ニットが出力される。
【0024】また、PPCMシンク情報内のサンプリン
グ周波数fs及び量子化ビット数Qbに基づいて、PC
MデータがD/A変換器102によりアナログ信号に変
換される。また、同時にPPCMシンク情報においてC
BRの識別子が検出され、ディレクトリ内のエクストラ
データの位置が検出されて、更に例えば0,0…のデー
タや、テキストデータ等のサイズ調整用のエクストラデ
ータが検出されると、それがテキストデータである場合
にはエクストラデータをこのアンパッキング回路22か
ら図示しないテキストデータデコード回路に供給し、そ
こで、デコード処理をしてテキストデータとして取り出
し、出力バッファ110を通じて出力されることにな
る。また一方、エクストラデータが0,0…データであ
った場合には、何の処理も施されないようになってい
る。また、テキストデータデコーダ回路が用意されてい
ない場合には、この処理はパスされる。また、ここで、
操作部101を介してサーチ再生が指示された場合に
は、制御部100により図5に示す前方アクセスユニッ
ト・サーチポインタ(1秒先)と後方アクセスユニット
・サーチポインタ(1秒前)に基づいてアクセスユニッ
トを再生する。このサーチポインタとしては、1秒先、
1秒前の代わりに2秒先、2秒前のものでよい。
【0025】図2に示す符号化部2’−1、2’−2に
より予測符号化された可変レートビットストリームデー
タをネットワークを介して伝送する場合には、符号化側
では図11に示すように伝送用にパケット化し(ステッ
プS41)、次いでパケットヘッダを付与し(ステップ
S42)、次いでこのパケットをネットワーク上に送り
出す(ステップS43)。
【0026】復号側では図12(A)に示すようにヘッ
ダを除去し(ステップS51)、次いでデータを復元し
(ステップS52)、次いでこのデータをメモリに格納
して復号を待つ(ステップS53)。そして、復号を行
う場合には図12(B)に示すように、デフォーマット
化を行い(ステップS61)、次いで入力バッファ22
aの入出力制御を行い(ステップS62)、次いでアン
パッキングを行う(ステップS63)。なお、このと
き、サーチ再生指示がある場合にはサーチポインタをデ
コードする。次いで予測器をフラグに基づいて選択して
デコードを行い(ステップS64)、次いで出力バッフ
ァ110の入出力制御を行い(ステップS65)、次い
で元のマルチチャネルを復元し(ステップS66)、次
いでこれを出力し(ステップS67)、以下、これを繰
り返す。
【0027】なお、上記実施形態では、前方グループに
関する2ch「1」、「2」を 「1」=Lf+Rf 「2」=Lf−Rf により変換して予測符号化したが、代わりに式(2)に
よりマルチチャネルをダウンミクスしてステレオ2chデ
ータ(L、R)を生成し、次いで次式(1)’ 「1」=L+R 「2」=L−R 「3」〜「5」は同じ 「6」=Lfe−C …(1)’ により変換して予測符号化するようにしてもよい(第2
の実施形態)。この場合には、復号化側のミクス&マト
リクス回路4’はチャネル「1」、「2」を加算するこ
とによりチャネルLを、減算することによりチャネルR
を生成することができる。
【0028】また、第3の実施形態として図13に示す
ように、2ch「1」、「2」の代わりに式(2)により
マルチチャネルをダウンミクスしてステレオ2chデータ
(L、R)を生成して、このステレオ2ch(L、R)と
4ch「3」〜「6」を予測符号化するようにしてもよ
い。なお、第2、第3の実施形態では、フロントレフト
(Lf)とフロントライト(Rf)が復号化側に伝送さ
れないので、復号化側ではこれを式(1)、(2)によ
り生成する。
【0029】次に図14、図15、図16を参照して第
4の実施形態について説明する。上記の実施形態では、
1グループの相関性の信号「1」〜「6」を予測符号化
するように構成されているが、この第4の実施形態では
複数グループの相関性のある信号を生成して予測符号化
し、圧縮率が最も高いグループの予測符号化データを選
択するように構成されている。また、この実施例ではそ
の1グループ内における符号化は、前述の各実施例の場
合のように前方グループに関する2chと他のグループ
に関する4chに分類して変換するようなことはせず
に、一つにまとめた符号化処理が行われる構成で、図1
4は前述の図1に対応した図として示してある。また、
図15は符号化部の詳細ブロックを示すものであるが、
本実施例の場合にはn個の相関回路1−1〜1−nまで
が、ミクス&マトリクス回路1’側に設けられている。
これらn個の相関回路1−1〜1−nは例えば6ch(L
f、C、Rf、Ls、Rs、Lfe)のPCMデータ
を、相関性が異なるn種類の6ch信号「1」〜「6」に
変換する。
【0030】例えば第1の相関回路1−1は以下のよう
に変換し、 「1」=Lf 「2」=C−(Ls+Rs)/2 「3」=Rf−Lf 「4」=Ls−a×Lfe 「5」=Rs−b×Rf 「6」=Lfe また、第nの相関回路1−nは以下のように変換する。 「1」=Lf+Rf 「2」=C−Lf 「3」=Rf−Lf 「4」=Ls−Lf 「5」=Rs−Lf 「6」=Lfe−C
【0031】また、相関回路1−1〜1−n毎に予測回
路15とバッファ・選択器16が設けられ、グループ毎
の予測残差の最小値のデータ量に基づいて圧縮率が最も
高いグループが相関選択信号生成器17bにより選択さ
れる。このとき、フォーマット化回路19はその選択フ
ラグ(相関回路選択フラグ、その相関回路の相関係数
a、b)を追加して多重化する。
【0032】そして、図16は前述の図6に対応したデ
ータエリアを示し、この実施例ではサブストリーム「B
S1」を用いず、サブストリーム「BS0」のみで構成
することになる。
【0033】また、図17に示す復号化側では、符号化
側の相関回路1−1〜1−nに対してn個の相関回路4
−1〜4−n(又は係数a、bが変更可能な図示省略の
1つの相関回路)が設けられる。なお、図15に示すn
グループの予測回路が同一の構成である場合、復号装置
では図17に示すようにnグループ分の予測回路を設け
る必要はなく、1つのグループ分の予測回路でよい。そ
して、符号化装置から伝送された選択フラグに基づいて
相関回路4−1〜4−nの1つを選択、又は係数a、b
を設定して元の6ch(Lf、C、Rf、Ls、Rs、L
fe)を復元し、また、式(2)によりマルチチャネル
をダウンミクスしてステレオ2chデータ(L、R)を生
成する。
【0034】また、上記の第1の実施形態では、1種類
の相関性の信号「1」〜「6」を予測符号化するように
構成されているが、この信号「1」〜「6」のグループ
と原信号(Lf、C、Rf、Ls、Rs、Lfe)のグ
ループを予測符号化し、圧縮率が高い方のグループを選
択するようにしてもよい。
【0035】
【発明の効果】以上説明したように本発明によれば、よ
り圧縮効率の改善が図れると共に、圧縮処理された音声
信号をより正確に復号することが可能になる。
【図面の簡単な説明】
【図1】本発明が適用される音声符号化装置及び音声復
号装置の第1の実施形態を示すブロック図である。
【図2】図1の符号化部を詳しく示すブロック図であ
る。
【図3】図1、図2の符号化部により符号化されたビッ
トストリームを示す説明図である。
【図4】DVDのパックのフォーマットを示す説明図で
ある。
【図5】DVDのオーディオパックのフォーマットを示
す説明図である。
【図6】図5のオーディオデータエリアのフォーマット
を詳しく示す説明図である。
【図7】図1の復号化部を詳しく示すブロック図であ
る。
【図8】図7の入力バッファの書き込み/読み出しタイ
ミングを示すタイミングチャートである。
【図9】アクセスユニット毎の圧縮データ量を示す説明
図である。
【図10】アクセスユニットとプレゼンテーションユニ
ットを示す説明図である。
【図11】音声伝送方法を示すフローチャートである。
【図12】音声伝送方法を示すフローチャートである。
【図13】本発明が適用される音声符号化装置及び音声
復号装置の第3の実施形態を示すブロック図である。
【図14】本発明が適用される音声符号化装置及び音声
復号装置の第4の実施形態を示すブロック図である。
【図15】第4の実施形態の音声符号化装置を示すブロ
ック図である。
【図16】図6に対応した別の実施例の説明図である。
【図17】第4の実施形態の音声復号装置を示すブロッ
ク図である。
【符号の説明】
1’ 6chミクス&マトリクス回路 13D1,13D2,15D1〜15D4 予測回路
(バッファ・選択器14D1,14D2,16D1〜1
6D4と共に圧縮手段を構成する。) 14D1,14D2,16D1〜16D4 バッファ・
選択器 17 選択信号/DTS生成器(タイミング生成手段) 17c PTS生成器(タイミング生成手段) 19 フォーマット化回路(フォーマット化手段) 21 デフォーマット化回路(分離手段) 22 アンパッキング回路 22a 入力バッファ 24D1,24D2,23D1〜23D4 予測回路
(伸長手段) 100 制御部 102 D/A変換器 110 出力バッファ
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭64−44499(JP,A) 特開 平8−272393(JP,A) 特開 平3−24834(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 G11B 20/10 - 20/12 H03M 7/30 - 7/40

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】マルチチャネルの音声信号、そのままの
    チャネル又は互いに相関をとったチャネル毎に入力され
    る音声信号に応答して先頭サンプル値を得ると共に、
    性が異なる複数の線形予測方法により時間領域過去か
    現在の信号の線形予測値がそれぞれ予測され、その予
    測される線形予測値と前記音声信号とから得られる予測
    残差が最小となるような線形予測方法を選択して予測符
    号化するステップと、 前記ステップにより選択されたチャネル毎の線形予測方
    法と予測残差と所定の先頭サンプル値を含む予測符号化
    データを格納するサブストリームを有するサブパケット
    と、そのサブパケットに対応して設けられその同期情報
    を含む同期情報部とから一つのアクセスユニットを形成
    し、前記サブパケット内に前記アクセスユニットの数個
    毎に再生側において元の音声信号を復元する際に必要な
    リスタート情報を含むリスタート情報部を設けたデータ
    構造にフォーマット化するステップとにより、 前記データ構造にフォーマット化されたデータが記録さ
    、その記録されたデータうち前記予測符号化データは
    元の音声信号を復元するために用いられる予測値を算出
    するためのデータとして記録されることを特徴とする
    録媒体。
  2. 【請求項2】 請求項記載のサブパケット及び同期情
    報部と、更にSCR情報を含むパックヘッダと、を含ん
    で一つのパックとしてフォーマット化されて記録される
    と共に、前記SCR情報は、前記パックを再生する際の
    時間管理情報として用いられることを特徴とする記録媒
    体。
  3. 【請求項3】 請求項1記載の記録媒体に記録されたデ
    ータから元のマルチチャネルの音声信号を復号する音声
    復号装置であって、 前記データ構造をサブパケットと同期情報部に分離する
    手段と、 前記サブパケット内の圧縮データを前記リスタート情報
    部内の情報に基づいてチャネル毎に伸長する伸長手段
    と、 前記伸長された音声データから前記マルチチャンネルの
    音声信号に変換する手段と、 前記変換されたマルチチャンネル音声データを前記同期
    情報部内のサンプリング周波数及び量子化ビット数に基
    づいてアナログ音声信号に変換する手段とを、有する音
    声復号装置。
  4. 【請求項4】 請求項2記載の記録媒体に記録されたデ
    ータから元のマルチチャネルの音声信号を復号する音声
    復号装置であって、 前記パックヘッダに含まれるSCR情報を分離する第1
    の分離手段と、 前記分離されたSCR情報に基づいて前記サブパケット
    及び同期情報部を保持するためのバッファと、 前記バッファに保持された前記サブパケットと同期情報
    部とを分離する第2の分離手段と、 前記サブパケット内の圧縮データを前記リスタート情報
    部内の情報に基づいてチャネル毎に伸長する伸長手段
    と、 前記伸長された音声データから前記マルチチャンネルの
    音声信号に変換する手段と、 前記変換されたマルチチャンネル音声データを前記同期
    情報部内のサンプリング周波数及び量子化ビット数に基
    づいてアナログ音声信号に変換する手段とを、有する音
    声復号装置。
JP32595899A 1998-11-16 1999-11-16 記録媒体、音声復号装置 Expired - Lifetime JP3344571B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32595899A JP3344571B2 (ja) 1998-11-16 1999-11-16 記録媒体、音声復号装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP34235298 1998-11-16
JP10-342352 1998-11-16
JP32595899A JP3344571B2 (ja) 1998-11-16 1999-11-16 記録媒体、音声復号装置

Related Child Applications (3)

Application Number Title Priority Date Filing Date
JP2000325683A Division JP3346555B2 (ja) 1998-11-16 2000-10-25 音声符号化方法
JP2000325684A Division JP3346556B2 (ja) 1998-11-16 2000-10-25 音声符号化方法及び音声復号方法
JP2000325682A Division JP3346554B2 (ja) 1998-11-16 2000-10-25 音声符号化装置

Publications (2)

Publication Number Publication Date
JP2000214895A JP2000214895A (ja) 2000-08-04
JP3344571B2 true JP3344571B2 (ja) 2002-11-11

Family

ID=26572020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32595899A Expired - Lifetime JP3344571B2 (ja) 1998-11-16 1999-11-16 記録媒体、音声復号装置

Country Status (1)

Country Link
JP (1) JP3344571B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195471A (ja) * 2005-01-13 2006-07-27 Samsung Electronics Co Ltd 多チャンネル信号符号化/復号化方法及びその装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4776489B2 (ja) * 2006-09-29 2011-09-21 シャープ株式会社 画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム、画像符号化方法、および画像復号方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195471A (ja) * 2005-01-13 2006-07-27 Samsung Electronics Co Ltd 多チャンネル信号符号化/復号化方法及びその装置

Also Published As

Publication number Publication date
JP2000214895A (ja) 2000-08-04

Similar Documents

Publication Publication Date Title
JP3346556B2 (ja) 音声符号化方法及び音声復号方法
JP3344571B2 (ja) 記録媒体、音声復号装置
JP3344572B2 (ja) 記録媒体、音声復号装置
JP3344575B2 (ja) 記録媒体、音声復号装置
JP3344574B2 (ja) 記録媒体、音声復号装置
JP3344573B2 (ja) 記録媒体、音声復号装置
JP3346553B2 (ja) 音声符号化方法及び音声復号方法
JP3346554B2 (ja) 音声符号化装置
JP3346555B2 (ja) 音声符号化方法
JP3344569B2 (ja) 光記録媒体、音声復号装置
JP3346557B2 (ja) 音声符号化方法
JP3346550B2 (ja) 音声符号化方法及び音声復号方法
JP3346547B2 (ja) 音声符号化方法及び音声復号方法
JP3346384B2 (ja) 音声符号化方法
JP3346390B2 (ja) 音声符号化方法
JP3346388B2 (ja) 音声符号化方法及び音声復号方法
JP3346387B2 (ja) 音声符号化方法
JP3346381B2 (ja) 音声符号化装置
JP3346546B2 (ja) 音声符号化方法
JP3346552B2 (ja) 音声符号化方法
JP3346549B2 (ja) 音声符号化方法
JP3344570B2 (ja) 記録媒体、音声復号装置
JP3346383B2 (ja) 音声符号化装置
JP3346545B2 (ja) 音声符号化装置
JP3346551B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
R151 Written notification of patent or utility model registration

Ref document number: 3344571

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20200830

Year of fee payment: 18

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20200830

Year of fee payment: 18

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term