JP4378716B2 - 音声符号化方法及び音声復号化方法 - Google Patents
音声符号化方法及び音声復号化方法 Download PDFInfo
- Publication number
- JP4378716B2 JP4378716B2 JP2006187743A JP2006187743A JP4378716B2 JP 4378716 B2 JP4378716 B2 JP 4378716B2 JP 2006187743 A JP2006187743 A JP 2006187743A JP 2006187743 A JP2006187743 A JP 2006187743A JP 4378716 B2 JP4378716 B2 JP 4378716B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- data
- prediction
- access unit
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
89159号)において1チャネルの原デジタル音声信号に対して、特性が異な
る複数の予測器により時間領域における過去の信号から現在の信号の複数の線形
予測値を算出し、原デジタル音声信号と、この複数の線形予測値から予測器毎の
予測残差を算出し、予測残差の最小値を選択する予測符号化方法を提案している
。
量子化ビット数=20ビット程度の場合にある程度の圧縮効果を得ることができ
るが、近年のDVDオーディオディスクではこの2倍のサンプリング周波数(=
192kHz)が使用され、また、量子化ビット数も24ビットが使用される傾
向がある。また、マルチチャネルにおけるサンプリング周波数と量子化ビット数
はチャネル毎に異なることもある。
また、サンプリング周波数や量子化ビット数が高くなることから、従来以上に圧縮率を改善する必要がある。
すなわち、
1)元のマルチチャネルの音声信号をダウンミクスしてステレオ2チャネルの音声信号に変換するステップと、
前記元のマルチチャネルを所定のマトリクス演算により、相関あるチャネルであってそのチャネル数が前記2チャネル分少ない数の相関チャネルに変換するステップと、
前記ステレオ2チャネルと前記相関チャネルの音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮PCMアクセスユニットは前記サブフレーム毎に設けられ、前記ステップにより選択されたサブフレーム毎の各チャネルの予測残差と線形予測方法を含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケットに前記音声信号のサンプリング周波数に応じたサンプル数により格納すると共に前記予測残差をビット情報に基づいたビット数でパッキングして格納し、前記圧縮PCMアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記先頭サンプル値を収納するステップと、
からなる音声符号化方法。
2)請求項1記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記ユーザデータから圧縮PCMアクセスユニットを抽出するステップと、
前記圧縮PCMアクセスユニットから前記先頭サンプル値と、サンプリング周波数に応じたサンプル数の予測残差および線形予測方法を含むサブフレーム単位の予測符号化データとを取り出すステップと、
前記予測残差をビット情報に基づいたビット数で復号し、この復号した予測残差と前記先頭サンプル値と線形予測方法とに基づいて予測値を算出するステップと、
この算出された予測値から前記ステレオ2チャネルの音声信号と元のマルチチャネルの音声信号を復元するステップと、
からなる音声復号方法。
適用されるマルチチャネル伝送形態を実現する音声符号化装置の処理を示す説明
図である。
。
(1)4チャネル方式 ドルビーサラウンド方式のように、前方L、C、R
の3チャネル+後方Sの1チャネルの合計4チャネル
(2)5チャネル方式 ドルビーAC−3方式のSWチャネルなしのように
、前方L、C、Rの3チャネル+後方SL、SRの2チャネルの合計5チャネル
(3)6チャネル方式 DTS(Digital Theater System)方式や、ドルビ
ーAC−3方式のように6チャネル(L、C、R、SW(Lfe)、SL、SR
)
(4)8チャネル方式 SDDS(Sony Dynamic Digital Sound)方式のよ
うに、前方L、LC、C、RC、R、SWの6チャネル+後方SL、SRの2チ
ャネルの合計8チャネル
のダウンミクスを禁止する場合を示している。符号化側の6チャネル(ch)ミク
ス&マトリクス回路1’は、マルチチャネル信号の一例としてフロントレフト(
Lf)、センタ(C)、フロントライト(Rf)、サラウンドレフト(Ls)、
サラウンドライト(Rs)及びLfe(Low Frequency Effect)の6chのPCM
データを次式(1−1)により6ch「1」〜「6」分の相関信号に変換し、符号
化部2’に出力する。
「1」=Lf+Rf−C
「2」=Lf−Rf−C
「3」=C−(Ls+Rs)/2
「4」=Ls+Rs
「5」=Ls−Rs
「6」=Lfe−a×C
ただし、0≦a≦1 …(1−1)
このような6チャネル(ch)ミクス&マトリクス回路1’による相関式と符
号化部2’の符号化方式は選択手段7’で選択される。以下説明する図2、図3
、図4、図5及び図6でも同様であるので、これらの図では選択手段7’を略す
ことにする。
く示すようにこの6ch「1」〜「6」のPCMデータを予測符号化し、予測符号
化データを図8に示すようなビットストリームで記録媒体5や通信媒体6を介し
て復号側に伝送する。復号側では第1と第2の復号化部3’−1、3’−2を有
する復号化部3’により、図14に詳しく示すように6ch「1」〜「6」の予測
符号化データをPCMデータに復号し、次いでミクス&マトリクス回路4’によ
り式(1−1)に基づいて元の6ch(Lf、C、Rf、Ls、Rs、Lfe)の
みを復元する。
のダウンミクスを許可する場合を示している。符号化側の6chミクス&マトリク
ス回路1’は、元の6ch(Lf、C、Rf、Ls、Rs、Lfe)と係数mij(
i=1,2,j=1,2〜6)により次式(2)のようにステレオ2chデータ(
L、R)を生成(ダウンミクス)する。
L=m11・Lf+m12・Rf+m13・C
+m14・Ls+m15・Rs+m16・Lfe
R=m21・Lf+m22・Rf+m23・C
+m24・Ls+m25・Rs+m26・Lfe …(2)
ル分の相関信号「1」、「2」と第2グループの4チャネル分の相関信号「3」
〜「6」に変換し、それぞれ第1符号化部2’−1、第2符号化部2’−2に出
力する。
「1」=L+R
「2」=L−R
「3」〜「6」は式(1−1)と同じ …(1−2)
」、「2」と第2グループチャネル「3」〜「6」のPCMデータを予測符号化
し、各チャネルの予測符号化データを記録媒体5や通信媒体6を介して復号側に
伝送する。復号側では第1、第2復号化部3’−1、3’−2により、それぞれ
第1グループチャネル「1」、「2」と第2グループチャネル「3」〜「6」の
予測符号化データをPCMデータに復号し、次いでミクス&マトリクス回路4’
により式(1−2)、(2)に基づいて元の6ch(Lf、C、Rf、Ls、Rs
、Lfe)を復元するとともに、第1グループチャネル「1」、「2」を加算、
減算することによりそれぞれステレオ2chデータ(L、R)を生成する。
ともに再生側のダウンミクスを禁止する場合を示している。この場合には、非圧
縮であるので、符号化側では相関信号も生成することなく元の6ch(Lf、C、
Rf、Ls、Rs、Lfe)のPCMデータをそのまま伝送し(ただし、フォー
マット化する)、復号化側ではデフォーマット化した後、元の6ch(Lf、C、
Rf、Ls、Rs、Lfe)のみを復元する。
ともに再生側のダウンミクスを許可する場合を示している。この場合にも、非圧
縮であるので、符号化側では圧縮率を高めるための相関信号も生成することなく
元の6ch(Lf、C、Rf、Ls、Rs、Lfe)のPCMデータをそのまま伝
送する(ただし、フォーマット化する)。復号化側ではデフォーマット化した後
、元の6ch(Lf、C、Rf、Ls、Rs、Lfe)を復元するとともに、式(
2)によりステレオ2chデータ(L、R)を生成(ダウンミクス)する。
を禁止する場合の変形例を示している。この場合には、符号化側では次式(1−
3)により6ch(1)〜(6)分の相関信号に変換し、符号化部2’はこれを予
測符号化する。そして、復号化側では式(1−2)により元の6ch(Lf、C、
Rf、Ls、Rs、Lfe)のみを復元する。
「1」=Lf−C
「2」=Rf−C
「3」〜「6」は式(1−1)と同じ …(1−3)
このように再生側のダウンミクスを禁止する場合は、これに対応して式(2)の
ダウンミクス係数を符号化に加えないとともに、符号化側で式(2)によりステ
レオ2chデータ(L、R)を生成(ダウンミクス)することが禁じられる。
を許可する場合の変形例を示している。この場合には、符号化側では式(2)に
よりステレオ2chデータ(L、R)を生成(ダウンミクス)し、次いで次式(1
−4)により次のような第1グループの2チャネル「1」、「2」と第2グルー
プの4チャネル分の相関信号「3」〜「6」に変換し、第1、第2符号化部2’
−1、2’−2はこの各グループチャネルを予測符号化する。そして、復号化側
では式(1−4)、(2)により元の6ch(Lf、C、Rf、Ls、Rs、Lf
e)を復元するとともにステレオ2chデータ(L、R)をそのまま出力する。
「1」=L
「2」=R
「3」〜「6」は式(1−1)と同じ …(1−4)
」〜「6」のPCMデータは1フレーム毎に1フレームバッファ10に格納され
る。そして、1フレームの各ch「1」〜「6」のサンプルデータがそれぞれ予測
回路13D1、13D2、15D1〜15D4に印加されるとともに、各ch「1
」〜「6」の各フレームの先頭サンプルデータがフォーマット化回路19に印加
される。予測回路13D1、13D2、15D1〜15D4はそれぞれ、各ch「
1」〜「6」のPCMデータに対して、特性が異なる複数の予測器(不図示)に
より時間領域における過去の信号から現在の信号の複数の線形予測値を算出し、
次いで原PCMデータと、この複数の線形予測値から予測器毎の予測残差を算出
する。続くバッファ・選択器14D1、14D2、16D1〜16D4はそれぞ
れ、予測回路13D1、13D2、15D1〜15D4により算出された各予測
残差を一時記憶して、選択信号/DTS(デコーディング・タイム・スタンプ)
生成器17により指定されたサブフレーム毎に予測残差の最小値を選択する。
8とフォーマット化回路19に対して印加し、また、予測残差が最小の予測器を
示す予測器選択フラグと、相関係数aと、復号化側が入力バッファ22a(図1
4)からストリームデータを取り出す時間を示すDTSをフォーマット化回路1
9に対して印加する。パッキング回路18はバッファ・選択器14D1、14D
2、16D1〜16D4により選択された6ch分の予測残差を、選択信号/DT
S生成器17により指定されたビット数フラグに基づいて指定ビット数でパッキ
ングする。またPTS生成器17cは、復号化側が出力バッファ110(図14
)からPCMデータを取り出す時間を示すPTS(プレゼンテーション・タイム
・スタンプ)を生成してフォーマット化回路19に出力する。フォーマット化回
路19にはまた、圧縮/非圧縮などを示す符号化モードと、ダウンミクス許可/
禁止を示す識別子が印加される。
ーマット化する。図8に示すユーザデータ(サブパケット)は、前方グループに
関する2ch「1」、「2」の予測符号化データを含む可変レートビットストリー
ム(サブストリーム)BS0と、他のグループに関する4ch「3」〜「6」の予
測符号化データを含む可変レートビットストリーム(サブストリーム)BS1と
、サブストリームBS0、BS1の前に設けられたビットストリームヘッダ(リ
スタートヘッダ)により構成されている。
・フレームヘッダと、
・各ch「1」〜「6」の1フレームの先頭サンプルデータと、
・各ch「1」〜「6」のサブフレーム毎の予測器選択フラグと、
・各ch「1」〜「6」のサブフレーム毎のビット数フラグと、
・各ch「1」〜「6」の予測残差データ列(可変ビット数)と、
・ch「6」の係数aとが、
多重化されている。このような予測符号化によれば、原信号が例えばサンプリ
ング周波数=96kHz、量子化ビット数=24ビット、6チャネルの場合、7
1%の圧縮率を実現することができる。
ットストリームデータを、記録媒体の一例としてDVDオーディオディスクに記
録する場合には、図9に示すオーディオ(A)パックにパッキングされる。この
パックは2034バイトのユーザデータ(Aパケット、Vパケット)に対して4
バイトのパックスタート情報と、6バイトのSCR(System Clock Reference:
システム時刻基準参照値)情報と、3バイトのMux レート(rate)情報と1バイ
トのスタッフィングの合計14バイトのパックヘッダが付加されて構成されてい
る(1パック=合計2048バイト)。この場合、タイムスタンプであるSCR
情報を、先頭パックでは「1」として同一タイトル内で連続とすることにより同
一タイトル内のAパックの時間を管理することができる。
パケットヘッダと、圧縮PCMのプライベートヘッダと、図11に示すフォーマ
ットの1ないし2011バイトのオーディオデータ(圧縮PCM)により構成さ
れている。そして、DTSとPTSは図5のパケットヘッダ内に(具体的にはパ
ケットヘッダの10〜14バイト目にPTSが、15〜19バイト目にDTSが
)セットされる。圧縮PCMのプライベートヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Product Code/European Ar
ticle Number-International Standard Recording Code)番号、及びUPC/E
AN−ISRCデータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・8バイトのオーディオデータ情報(ADI)と、
・0〜7バイトのスタッフィングバイトとに、
より構成されている。
ユニット・サーチポインタと、1秒前のアクセスユニットをサーチするための後
方アクセスユニット・サーチポインタがともに1バイトでセットされる。具体的
にはADIの7バイト目に前方アクセスユニット・サーチポインタが、8バイト
目に後方アクセスユニット・サーチポインタがセットされる。
オーディオデータエリアは、図11に示すようにサブパケットと複数のPPCM
アクセスユニットにより構成され、PPCMアクセスユニットはPPCMシンク
情報とサブパケットにより構成されている。最初のPPCMアクセスユニット内
のサブパケットは、ディレクトリと、サブストリーム「0」と、CRCと、サブ
ストリーム「1」と、CRCとエクストラ情報により構成され、サブストリーム
「0」、「1」はPPCMブロックのみにより構成されている。2番目以降のP
PCMアクセスユニット内のサブパケットは、ディレクトリを除いてサブストリ
ーム「0」と、CRCと、サブストリーム「1」と、CRCとエクストラ情報に
より構成され、サブストリーム「0」、「1」はリスタートヘッダとPPCMブ
ロックにより構成されている。
・1パケット当たりのサンプル数:サンプリング周波数fsに応じて40、80
又は160が選択される。
・データレート:VBRの場合には「0」(サブパケット内のデータが圧縮デー
タであることを示す識別子)
・サンプリング周波数fs及び量子化ビット数Qb
・チャネル割り当て情報
するために図12、図13に示すような管理情報を含むATSI(オーディオ・
タイトル・セット・インフォーメーション)をフォーマット化する。図12はA
OTT−AOB−ATR(オーディオオンリタイトル・オーディオオブジェクト
セット・アトリビュート)を示し、このAOTT−AOB−ATR(b127〜
b0)は、MSB側から順に
・8ビット(b127〜b120)のオーディオ符号化モードと、
・8ビット(b119〜b112)の保留領域と、
・4ビット(b111〜b108)のチャネルグループ「1」の量子化ビット数
Q1と、
・4ビット(b107〜b104)のチャネルグループ「2」の量子化ビット数
Q2と、
・4ビット(b103〜b100)のチャネルグループ「1」のサンプリング周
波数fs1と、
・4ビット(b99〜b96)のチャネルグループ「2」のサンプリング周波数
fs2と、
・3ビット(b95〜b93)のマルチチャネル構造のタイプと、
・5ビット(b92〜b88)のチャネル割り当てと、
・8ビット×11(b87〜b0)の保留領域により構成されている。
(1)オーディオ符号化モード(b127〜b120)
00000000b:リニアPCMモード
00000001b:圧縮PCMモード
その他 :その他の符号化モード用に保留
0000b:16ビット
0001b:20ビット
0010b:24ビット
その他 :保留
(3)チャネルグループ2の量子化ビット数Q2(b107〜b104)
・チャネルグループ1の量子化ビット数Q1が「0000b」の場合には「0
000b」
・チャネルグループ1の量子化ビット数Q1が「0001b」の場合には「0
000b」又は「0001b」
・チャネルグループ1の量子化ビット数Q1が「0010b」の場合には「0
000b」、「0001b」又は「0010b」
ただし、0000b:16ビット
0001b:20ビット
0010b:24ビット
その他 :保留
0000b:48kHz
0001b:96kHz
0010b:192kHz
1000b:44.1kHz
1001b:88.2kHz
1010b:176.4kHz
その他 :保留
・チャネルグループ1のサンプリング周波数fs1が「0000b」の場合に
は「0000b」
・チャネルグループ1のサンプリング周波数fs1が「0001b」の場合に
は「0000b」又は「0001b」
・チャネルグループ1のサンプリング周波数fs1が「0010b」の場合に
は「0000b」、「0001b」又は「0010b」
・チャネルグループ1のサンプリング周波数fs1が「1000b」の場合に
は「1000b」
・チャネルグループ1のサンプリング周波数fs1が「1001b」の場合に
は「1000b」又は「1001b」
・チャネルグループ1のサンプリング周波数fs1が「1010b」の場合に
は「1000b」、「1001b」又は「1010b」
000b:タイプ1
その他 :保留
(7)チャネル割り当て(b92〜b88)
1チャネル(モノラル)から6チャネルまでのグループ「1」、「2」のチャ
ネル割り当て情報
ンテンツ)を示し、これは先頭から順に
・1ビット(b31)の、前回と今回のPGの関係(R/A)と、
・1ビット(b30)のSTC不連続性フラグ(STC−F)と、
・3ビット(b29〜b27)のアトリビュート数(ATRN)と、
・3ビット(b26〜b24)のチャネルグループ(ChGr)「2」のビット
シフトデータと、
・2ビット(b23、b22)の保留領域と、
・1ビット(b21)のダウンミックスモード(D−M)と、
・1ビット(b20)のダウンミックス係数の有効性(図示※)と、
・4ビット(b19〜b16)のダウンミックス係数テーブル番号(DM−CO
EFTN)と、
・各々が1ビット、合計16ビット(b15〜b0)のRTIフラグF15〜F
0により構成されている。
そして、ビット(b21)のダウンミクスモード(D−M)が「1」の場合に
「ダウンミクス禁止」、「0」の場合に「ダウンミクス許可」を表す。
。なお、この復号化部3’(3’−1、3’−2)とミクス&マトリクス回路4
’は、ハードウエアの他にコンピュータプログラムよっても実現することができ
る。上記フォーマットの可変レートビットストリームデータBS0、BS1は、
デフォーマット化回路21により分離される。そして、各ch「1」〜「6」の
1フレームの先頭サンプルデータと予測器選択フラグはそれぞれ予測回路24D
1、24D2、23D1〜23D4に印加され、各ch「1」〜「6」のビット
数フラグはアンパッキング回路22に印加される。また、SCRと、DTSと予
測残差データ列は入力バッファ22aに印加され、PTSは出力バッファ110
に印加される。また、圧縮/非圧縮などを示す符号化モードと、ダウンミクス許
可/禁止を示す識別子は制御部100に印加され、サンプリング周波数fs及び
量子化ビット数QbはD/A変換器102に印加される。ここで、予測回路24
D1、24D2、23D1〜23D4内の複数の予測器(不図示)はそれぞれ、
符号化側の予測回路13D1、13D2、15D1〜15D4内の複数の予測器
と同一の特性であり、予測器選択フラグにより同一特性のものが選択される。
タ列)は、図15に示すようにSCRによりアクセスユニット毎に入力バッファ
22aに取り込まれて蓄積される。ここで、1つのアクセスユニットのデータ量
は、例えばfs=96kHzの場合には(1/96kHz)秒分であるが、図1
6、図17(a)に詳しく示すように可変長である。そして、入力バッファ22
aに蓄積されたストリームデータはDTSに基づいてFIFOで読み出されてア
ンパッキング回路22に印加される。
数フラグ毎に基づいて分離してそれぞれ予測回路24D1、24D2、23D1
〜23D4に出力する。予測回路24D1、24D2、23D1〜23D4では
それぞれ、アンパッキング回路22からの各ch「1」〜「6」の今回の予測残
差データと、内部の複数の予測器の内、予測器選択フラグにより選択された各1
つにより予測された前回の予測値が加算されて今回の予測値が算出され、次いで
1フレームの先頭サンプルデータを基準として各サンプルのPCMデータが算出
されて出力バッファ110に蓄積される。出力バッファ110に蓄積されたPC
MデータはPTSに基づいて読み出されて出力され、したがって、図17(a)
に示す可変長のアクセスユニットが伸長されて、図17(b)に示す一定長のプ
レゼンテーションユニットが出力される。
bに基づいて、PCMデータがD/A変換器102によりアナログ信号に変換さ
れる。ここで、操作部101を介してサーチ再生が指示された場合には、制御部
100により図5に示す前方アクセスユニット・サーチポインタ(1秒先)と後
方アクセスユニット・サーチポインタ(1秒前)に基づいてアクセスユニットを
再生する。このサーチポインタとしては、1秒先、1秒前の代わりに2秒先、2
秒前のものでよい。
トストリームデータをネットワークを介して伝送する場合には、符号化側では図
18に示すように伝送用にパケット化し(ステップS41)、次いでパケットヘ
ッダを付与し(ステップS42)、次いでこのパケットをネットワーク上に送り
出す(ステップS43)。
いでデータを復元し(ステップS52)、次いでこのデータをメモリに格納して
復号を待つ(ステップS53)。そして、復号を行う場合には図19(B)に示
すように、デフォーマット化を行い(ステップS61)、次いで入力バッファ2
2aの入出力制御を行い(ステップS62)、次いでアンパッキングを行う(ス
テップS63)。なお、このとき、サーチ再生指示がある場合にはサーチポイン
タをデコードする。次いで予測器をフラグに基づいて選択してデコードを行い(
ステップS64)、次いで出力バッファ110の入出力制御を行い(ステップS
65)、次いで元のマルチチャネルを復元し(ステップS66)、次いでこれを
出力し(ステップS67)、以下、これを繰り返す。
形態では、1グループの相関性の信号「1」〜「6」を予測符号化するように構
成されているが、この第4の実施形態では複数グループの相関性のある信号を生
成して予測符号化し、圧縮率が最も高いグループの予測符号化データを選択する
ように構成されている。このため図20に示す符号化部では、第1〜第nの相関
回路1−1〜1−nが設けられ、このn個の相関回路1−1〜1−nは例えば6
ch(Lf、C、Rf、Ls、Rs、Lfe)のPCMデータを、相関性が異なる
n種類の6ch信号「1」〜「6」に変換する。
(1)=Lf
(2)=C−(Ls+Rs)/2
(3)=Rf−Lf
(4)=Ls−a×Lfe
(5)=Rs−b×Rf
(6)=Lfe
また、第nの相関回路1−nは以下のように変換する。
(1)=Lf+Rf
(2)=C−Lf
(3)=Rf−Lf
(4)=Ls−Lf
(5)=Rs−Lf
(6)=Lfe−C
けられ、グループ毎の予測残差の最小値のデータ量に基づいて圧縮率が最も高い
グループが相関選択信号生成器17bにより選択される。このとき、フォーマッ
ト化回路19はその選択フラグ(相関回路選択フラグ、その相関回路の相関係数
a、b)を追加して多重化する。
てn個の相関回路4−1〜4−n(又は係数a、bが変更可能な1つの相関回路
4)が設けられる。なお、図20に示すnグループの予測回路が同一の構成であ
る場合、復号装置では図21に示すようにnグループ分の予測回路を設ける必要
はなく、1つのグループ分の予測回路でよい。そして、符号化装置から伝送され
た選択フラグに基づいて相関回路4−1〜4−nの1つを選択、又は係数a、b
を設定して元の6ch(Lf、C、Rf、Ls、Rs、Lfe)を復元し、また、
式(2)によりマルチチャネルをダウンミクスしてステレオ2chデータ(L、R
)を生成する。
測符号化するように構成されているが、この信号「1」〜「6」のグループと原
信号(Lf、C、Rf、Ls、Rs、Lfe)のグループを予測符号化し、圧縮
率が高い方のグループを選択するようにしてもよい。
本発明によれば、特許請求の範囲に記載した発明の他に、次のような発明が提
供される。
マルチチャネルの音声信号が圧縮されたデータ又は圧縮されないデータを選択
的にオーディオパケットに配置するフォーマット化手段と、
前記オーディオパケット内のマルチチャネルデータが圧縮されているか否か、
あるいは、前記オーディオパケット内のマルチチャネルデータをステレオ2チャ
ネルにダウンミクスすることを許可するか又は禁止するかによってあらかじめダ
ウンミクスして符号化するか否か、あるいはダウンミクス係数を符号化するか否
かを選択する手段とを、
有する音声符号化装置。
13D1,13D2,15D1〜15D4 予測回路(バッファ・選択器14
D1,14D2,16D1〜16D4と共に圧縮手段を構成する。)
14D1,14D2,16D1〜16D4 バッファ・選択器
17 選択信号/DTS生成器
17c PTS生成器
19 フォーマット化回路
21 デフォーマット化回路(分離手段)
22 アンパッキング回路
22a 入力バッファ
24D1,24D2,23D1〜23D4 予測回路(伸長手段)
100 制御部(再生手段)
102 D/A変換器
110 出力バッファ
Claims (2)
- 元のマルチチャネルの音声信号をダウンミクスしてステレオ2チャネルの音声信号に変換するステップと、
前記元のマルチチャネルを所定のマトリクス演算により、相関あるチャネルであってそのチャネル数が前記2チャネル分少ない数の相関チャネルに変換するステップと、
前記ステレオ2チャネルと前記相関チャネルの音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記圧縮PCMアクセスユニットは前記サブフレーム毎に設けられ、前記ステップにより選択されたサブフレーム毎の各チャネルの予測残差と線形予測方法を含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケットに前記音声信号のサンプリング周波数に応じたサンプル数により格納すると共に前記予測残差をビット情報に基づいたビット数でパッキングして格納し、前記圧縮PCMアクセスユニットが前記フレーム中の先頭のものである場合には、さらに、前記先頭サンプル値を収納するステップと、
からなる音声符号化方法。 - 請求項1記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記ユーザデータから圧縮PCMアクセスユニットを抽出するステップと、
前記圧縮PCMアクセスユニットから前記先頭サンプル値と、サンプリング周波数に応じたサンプル数の予測残差および線形予測方法を含むサブフレーム単位の予測符号化データとを取り出すステップと、
前記予測残差をビット情報に基づいたビット数で復号し、この復号した予測残差と前記先頭サンプル値と線形予測方法とに基づいて予測値を算出するステップと、
この算出された予測値から前記ステレオ2チャネルの音声信号と元のマルチチャネルの音声信号を復元するステップと、
からなる音声復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006187743A JP4378716B2 (ja) | 2006-07-07 | 2006-07-07 | 音声符号化方法及び音声復号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006187743A JP4378716B2 (ja) | 2006-07-07 | 2006-07-07 | 音声符号化方法及び音声復号化方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006184164A Division JP4367456B2 (ja) | 2006-07-04 | 2006-07-04 | 音声信号の音声符号化方法、音声復号化方法、及び音声信号伝送方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006313375A JP2006313375A (ja) | 2006-11-16 |
JP4378716B2 true JP4378716B2 (ja) | 2009-12-09 |
Family
ID=37534856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006187743A Expired - Fee Related JP4378716B2 (ja) | 2006-07-07 | 2006-07-07 | 音声符号化方法及び音声復号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4378716B2 (ja) |
-
2006
- 2006-07-07 JP JP2006187743A patent/JP4378716B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006313375A (ja) | 2006-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006323408A (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378714B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378712B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378727B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4399828B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4399829B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4367463B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378716B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378729B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4399822B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378725B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378726B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4367461B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378717B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378719B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4399823B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378715B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378713B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378728B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4399825B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378720B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378730B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378723B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378722B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP4378721B2 (ja) | 音声符号化方法及び音声復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090716 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090821 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090903 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131002 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |