JP4148203B2 - 音声信号伝送方法及び音声復号方法 - Google Patents

音声信号伝送方法及び音声復号方法 Download PDF

Info

Publication number
JP4148203B2
JP4148203B2 JP2004243781A JP2004243781A JP4148203B2 JP 4148203 B2 JP4148203 B2 JP 4148203B2 JP 2004243781 A JP2004243781 A JP 2004243781A JP 2004243781 A JP2004243781 A JP 2004243781A JP 4148203 B2 JP4148203 B2 JP 4148203B2
Authority
JP
Japan
Prior art keywords
signal
audio
prediction
linear prediction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004243781A
Other languages
English (en)
Other versions
JP2005038592A (ja
Inventor
徳彦 渕上
昭治 植野
美昭 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2004243781A priority Critical patent/JP4148203B2/ja
Publication of JP2005038592A publication Critical patent/JP2005038592A/ja
Application granted granted Critical
Publication of JP4148203B2 publication Critical patent/JP4148203B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音声信号を予測符号化して圧縮するための音声符号化方法により符
号化された音声信号の伝送方法及び音声復号方法に関する。
音声信号を予測符号化する方法として、本発明者は先の出願(特願平9−28
9159号)において1チャネル(チャンネル)の原デジタル音声信号に対して
、特性が異なる複数の予測器により時間領域における過去の信号から現在の信号
の複数の線形予測値を算出し、原デジタル音声信号と、この複数の線形予測値か
ら予測器毎の予測残差を算出し、この複数の予測残差の最小値を選択する方法を
提案している。
しかしながら、上記方法では原デジタル音声信号がサンプリング周波数=96
kHz、量子化ビット数=20ビット程度の場合に、ある程度の圧縮効果を得る
ことができるが、近年のDVDオーディオディスクではこの2倍のサンプリング
周波数(=192kHz)が使用され、また、量子化ビット数も24ビットが使
用される傾向があるので、圧縮率を改善する必要がある。また、近年のDVDオ
ーディオディスクでは、マルチチャネルが利用され、チャネル数が最大6となる
ので圧縮率を改善する必要がある。
そこで本発明は、音声信号を予測符号化する場合に圧縮率を改善することがで
きる音声符号化方法により符号化されたデータの伝送方法及び音声復号方法を提供することを目的とする。
本発明は上記目的を達成するために、以下の1)及び2)手段よりなる。
すなわち、
1)3以上のマルチチャネルの音声信号中の少なくとも選択された第及び第の2つのチャネルの音声信号をマトリクス演算して互いに相関ある2つの相関チャネルに変換するステップと、
前記ステップにより変換された2つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮PCMプライベートヘッダ及びオーディオ圧縮PCMデータ部を含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの先頭サンプル値と予測残差と線形予測方法を含む予測符号化データを前記オーディオ圧縮PCMデータ部内に記録し、前記音声信号のUPC/EAN番号及びISRCコードを前記圧縮PCMプライベートヘッダ内に配置するステップからなる音声符号化方法により符号化された音声信号を伝送する音声信号伝送方法であって、
前記選択された先頭サンプル値と予測残差と線形予測方法とを含む予測符号化データと前記音声信号のUPC/EAN番号及びISRCコードをパケット化して伝送することを特徴とする音声信号伝送方法。
2)3以上のマルチチャネルの音声信号中の少なくとも選択された第及び第の2つのチャネルの音声信号をマトリクス演算して互いに相関ある2つの相関チャネルに変換するステップと、
前記ステップにより変換された2つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮PCMプライベートヘッダ及びオーディオ圧縮PCMデータ部を含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの先頭サンプル値と予測残差と線形予測方法を含む予測符号化データを、前記オーディオ圧縮PCMデータ部内に記録し、前記音声信号のUPC/EAN番号及びISRCコードを前記圧縮PCMプライベートヘッダ内に配置するステップからなる音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記圧縮PCMプライベートヘッダ内に配置するUPC/EAN番号及びISRCコードをデコードするステップと、
前記選択された先頭サンプル値と予測残差と線形予測方法を含むサブフレーム単位の予測符号化データから予測値を算出するステップと、
この算出された予測値から元の音声信号を復元するステップと、
からなる音声復号方法。
以上説明したように本発明によれば、従来以上に圧縮率を改善した音声信号を伝送することができると共に、不都合なく音声信号を復号できる。
以下、図面を参照して本発明の実施の形態を説明する。図1は本発明が適用さ
れる音声符号化装置とそれに対応した音声復号装置の第1の実施形態を示すブロ
ック図、図2は図1のエンコーダを詳しく示すブロック図、図3は図2のマルチ
プレクサにより多重化される1フレームのフォーマットを示す説明図、図4はD
VDのパックのフォーマットを示す説明図、図5はDVDのオーディオパックの
フォーマットを示す説明図、図6は図1のデコーダを詳しく示すブロック図であ
る。
図1に示すチャネル相関回路Aは加算回路1aと減算回路1bを有する。加算
回路1aは各チャネル(以下、ch)が例えばサンプリング周波数=192kHz
、量子化ビット数=24ビットのステレオ2ch信号L、Rの和信号(L+R)を
算出して和ch用1chロスレス・エンコーダ2D1に出力し、減算回路1bは差信
号(L−R)を算出して差ch用1chロスレス・エンコーダ2D2に出力する。エ
ンコーダ2D1、2D2は図2に詳しく示すように、それぞれ和信号(L+R)
、差信号(L−R)の差分Δ(L+R)、Δ(L−R)を予測符号化して記録媒
体や通信媒体を介して伝送する。
そして、復号側では、図6に詳しく示すようにデコーダ3D1、3D2がそれ
ぞれ各chの予測符号化データを和信号(L+R)、差信号(L−R)に復号し、
次いでチャネル相関回路Bがこの和信号(L+R)、差信号(L−R)をステレ
オ2ch信号L、Rに復元する。
図2を参照してエンコーダ2D1、2D2について詳しく説明する。和信号(
L+R)と差信号(L−R)は1フレーム毎に1フレームバッファ10に格納さ
れる。そして、1フレームの各サンプル値(L+R)、(L−R)がそれぞれ差
分演算回路11D1、11D2に印加され、今回と前回の差分Δ(L+R)、Δ
(L−R)、すなわち差分PCM(DPCM)データが算出される。また、各フ
レームの先頭サンプル値(L+R)、(L−R)がマルチプレクサ19に印加さ
れる。
差分演算回路11D1により算出された差分Δ(L+R)は、予測係数が異な
る複数の予測器12a−1〜12a−nと減算器13a−1〜13a−nに印加
される。そして、予測器12a−1〜12a−nではそれぞれ各予測係数に基づ
いて差分Δ(L+R)の各予測値が算出され、減算器13a−1〜13b−nで
はそれぞれこの各予測値と差分Δ(L+R)の各予測残差が算出される。バッフ
ァ・選択器16D1はこの複数の予測残差を一時記憶して、選択信号生成器17
により指定されたサブフレーム毎に最小の予測残差を選択し、パッキング回路1
8に出力する。なお、このサブフレームはフレームの数十分の1程度のサンプル
長であり、一例として1フレームを80サブフレームとする。ここで、予測器1
2a−1〜12a−nと減算器13a−1〜13a−nは和信号chの予測回路1
5D1を構成し、また、この予測回路15D1とバッファ・選択器16D1は和
信号chの予測符号化回路を構成している。
同様に、差分演算回路11D2により算出された差分Δ(L−R)は、予測係
数が異なる複数の予測器12b−1〜12b−nと減算器13b−1〜13b−
nに印加される。そして、予測器12b−1〜12b−nではそれぞれ各予測係
数に基づいて差分Δ(L−R)の各予測値が算出され、減算器13b−1〜13
b−nではそれぞれこの各予測値と差分Δ(L−R)の各予測残差が算出される
。バッファ・選択器16D2はこの複数の予測残差を一時記憶して、選択信号生
成器17により指定されたサブフレーム毎に最小の予測残差を選択し、パッキン
グ回路18に出力する。予測器12b−1〜12b−nと減算器13b−1〜1
3b−nは差信号chの予測回路15D2を構成し、また、この予測回路15D2
とバッファ・選択器16D2は差信号chの予測符号化回路を構成している。
選択信号生成器17は予測残差のビット数フラグ(5ビット)をパッキング回
路18とマルチプレクサ19に対して印加し、また、予測残差が最小の予測器を
示す予測器選択フラグ(その数nが2〜9個として3ビット)をマルチプレクサ
19に対して印加する。パッキング回路18はバッファ・選択器16D1、16
D2により選択された2ch分の予測残差を、選択信号生成器17により指定され
たビット数フラグに基づいて指定ビット数でパッキングする。
続くマルチプレクサ19は図3に示すように1フレーム分に対して
・フレームヘッダ(40ビット)と、
・和信号ch(L+R)の1フレームの先頭サンプル値(25ビット)と、
・差信号ch(L−R)の1フレームの先頭サンプル値(25ビット)と、
・和信号ch(L+R)のサブフレーム毎の予測器選択フラグ(3ビット×80
)と、
・差信号ch(L−R)のサブフレーム毎の予測器選択フラグ(3ビット×80
)と、
・和信号ch(L+R)のサブフレーム毎のビット数フラグ(5ビット×80)
と、
・差信号ch(L−R)のサブフレーム毎のビット数フラグ(5ビット×80)
と、
・和信号ch(L+R)の予測残差データ列(可変ビット数)と、
・差信号ch(L−R)の予測残差データ列(可変ビット数)とを
アクセスユニットとして多重化し、可変レートビットストリームとして出力す
る。上記予測残差データ列はサブパケットを構成する。このような予測符号化に
よれば、原信号が例えばサンプリング周波数=192kHz、量子化ビット数=
24ビット、2チャネルの場合、59%の圧縮率を実現することができる。
また、この可変レートビットストリームデータをDVDオーディオディスクに
記録する場合には、図4に示す圧縮PCMのオーディオ(A)パックにパッキン
グされる。このパックは2034バイトのユーザデータ(Aパケット、Vパケッ
ト)に対して4バイトのパックスタート情報と、6バイトのSCR(System Clo
ck Reference:システム時刻基準参照値)情報と、3バイトのMux レート(rate
)情報と1バイトのスタッフィングの合計14バイトのパックヘッダが付加され
て構成されている(1パック=合計2048バイト)。この場合、タイムスタン
プであるSCR情報を、ACBユニット内の先頭パックでは「1」として同一タ
イトル内で連続とすることにより同一タイトル内のAパックの時間を管理するこ
とができる。
圧縮PCMのAパケットは図5に詳しく示すように、17、9又は14バイト
のパケットヘッダと、プライベートヘッダと、図3に示すフォーマットの1ない
し2015バイトのオーディオ圧縮PCMデータにより構成されている。圧縮P
CMのプライベートヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Product Code/European Ar
ticle Number-International Standard Recording Code)番号、及びUPC/E
AN−ISRCデータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・4バイトのオーディオデータ情報(ADI)と、
・0〜7バイトのスタッフィングバイトとに、
より構成されている。
このように圧縮PCMのAパケットのADIは、4バイトに選定され、通常の
非圧縮のPCMのAパケットのADIよりも4バイトだけ短くされている。した
がってオーディオデータは4バイト分増加させることができる。
次に図6を参照してデコーダ3D1、3D2について説明する。図3に示した
フォーマットの可変レートビットストリームデータは、デマルチプレクサ21に
よりフレームヘッダに基づいて分離される。そして、和信号ch(L+R)及び
差信号ch(L−R)の1フレームの先頭サンプル値はそれぞれ累積演算回路2
5a、25bに印加され、和信号ch(L+R)及び差信号ch(L−R)の予
測器選択フラグはそれぞれ予測器(24a−1〜24a−n)、(24b−1〜
24b−n)の各選択信号として印加され、和信号ch(L+R)及び差信号c
h(L−R)のビット数フラグと予測残差データ列はアンパッキング回路22に
印加される。ここで、予測器(24a−1〜24a−n)、(24b−1〜24
b−n)はそれぞれ、符号化側の予測器(12a−1〜12a−n)、(12b
−1〜12b−n)と同一の特性であり、予測器選択フラグにより同一特性のも
のが選択される。
アンパッキング回路22は和信号ch(L+R)及び差信号ch(L−R)の
予測残差データ列をビット数フラグ毎に基づいて分離してそれぞれ加算回路23
a、23bに出力する。加算回路23a、23bではそれぞれ、アンパッキング
回路22からの和信号ch(L+R)及び差信号ch(L−R)の今回の予測残
差データと、予測器(24a−1〜24a−n)、(24b−1〜24b−n)
の内、予測器選択フラグにより選択された各1つにより予測された前回の予測値
が加算されて今回の予測値が算出される。この今回の予測値は、図2に示す差分
回路11a、11bによりそれぞれ算出された差分Δ(L+R)、Δ(L−R)
すなわちDPCMデータであり、予測器(24a−1〜24a−n)、(24b
−1〜24b−n)と累積演算回路25a、25bに印加される。
累積演算回路25a、25bはそれぞれ、1フレームの先頭サンプル値に対し
て差分Δ(L+R)、Δ(L−R)をサンプル毎に累積加算して和信号ch(L
+R)、差信号ch(L−R)の各PCMデータを出力する。この和信号(L+
R)、差信号(L−R)は図1に示すように加算回路4aにより2L信号が算出
されるとともに、減算回路4bにより2R信号が算出される。そして、2L信号
と2R信号がそれぞれ割り算器5a、5bにより1/2に割り算され、元のステ
レオ2チャネル信号L、Rが復元される。
次に図7、図8を参照して第2の実施形態について説明する。上記の実施形態
では、和信号(L+R)、差信号(L−R)の各差分Δ(L+R)、Δ(L−R
)、すなわちDPCMデータのみを予測符号化するように構成されているが、こ
の第2の実施形態では和信号(L+R)、差信号(L−R)すなわちPCMデー
タ、又はその各差分Δ(L+R)、Δ(L−R)すなわちDPCMデータを選択
的に予測符号化するように構成されている。
このため図7に示す符号化装置では、図2に示す構成に対して和信号(L+R
)、差信号(L−R)をそれぞれ予測符号化するための予測回路15A、15S
とバッファ・選択器16A、16Sが追加されている。また、選択信号生成器1
7はバッファ・選択器16A、16Sによりそれぞれ選択された和信号(L+R
)、差信号(L−R)と、バッファ・選択器16D1、16D2によりそれぞれ
選択された差分Δ(L+R)、Δ(L−R)の各予測残差の最小値に基づいて、
PCMデータとDPCMデータのどちらが圧縮率が高いか否かを判断し、高い方
のデータを選択する。このとき、そのPCM/DPCMの選択フラグ(予測回路
選択フラグ)を追加して多重化する。
ここで、図7に示す和信号(L+R)の予測回路15Aと差分Δ(L+R)の
予測回路15D1が同一の構成であり、また、差信号(L−R)の予測回路15
Sと差分Δ(L−R)の予測回路15D2が同一の構成である場合、復号装置で
は図8に示すようにPCMデータとDPCMデータの両方の予測回路を設ける必
要はなく、1つのデータ分の予測回路でよい。そして、符号化装置から伝送され
た予測回路選択フラグに基づいてセレクタ26a、26bにより、DPCMデー
タの場合には累積演算回路25a、25bの出力を選択し、PCMデータの場合
には加算回路23a、23bの出力を選択する。
第3の実施形態では図9に示すように、原信号L、R(PCMデータ)と、和
信号(L+R)、差信号(L−R)(PCMデータ)と、その各差分Δ(L+R
)、Δ(L−R)(DPCMデータ)の3グループの1つを選択的に予測符号化
するように構成されている。
このため図9に示す符号化装置では、図7に示す構成に対して原信号L、Rを
それぞれ予測符号化するための予測回路15L、15Rとバッファ・選択器16
L、16Rが追加されている。また、選択信号生成器17はバッファ・選択器1
6L、16Rにより選択された原信号L、Rと、バッファ・選択器16A、16
Sにより選択された和信号(L+R)、差信号(L−R)と、バッファ・選択器
16D1、16D2により選択された各差分Δ(L+R)、Δ(L−R)の各予
測残差の最小値に基づいて圧縮率が高いグループのデータを選択する。このとき
、その選択フラグ(予測回路選択フラグ)を追加して多重化する。
また、図9に示す3グループの予測回路が同一の構成である場合、復号装置で
は図10に示すように3グループ分の予測回路を設ける必要はなく、1つのグル
ープ分の予測回路でよい。そして、符号化装置から伝送された予測回路選択フラ
グに基づいて、DPCMデータの場合には累積演算回路25a、25bの出力を
選択し、PCMデータの場合には加算回路23a、23bの出力を選択してチャ
ネル相関回路Bにより原信号L、Rを復元する。そして、更にセレクタ27a、
27bにより原信号L、Rのグループの場合には加算回路23a、23bの出力
を選択し、他の場合にはチャネル相関回路Bの出力を選択する
また、符号化側により予測符号化された可変レートビットストリームデータを
ネットワークを介して伝送する場合には、符号化側では図11に示すように伝送
用にパケット化し(ステップS41)、次いでパケットヘッダを付与し(ステッ
プS42)、次いでこのパケットをネットワーク上に送り出す(ステップS43
)。復号側では図12に示すようにヘッダを除去し(ステップS51)、次いで
データを復元し(ステップS52)、次いでこのデータをメモリに格納して復号
を待つ(ステップS53)。
上記第1の実施の形態は2チャネルの場合について説明したが、2以上のマル
チチャネルの場合の第2の実施の形態について以下説明する。図13は、本発明
の第2の実施の形態を示すブロック図である。図13は、図1の2チャネル用の
構成に対して後方の2チャネルSL、SRを加えた4チャネル用として構成され、
よって入力側にはチャネル相関回路Aに加えて、同様な構成のチャネル相関回路
A2が設けられている。また、出力側にもチャネル相関回路Bに加えて、同様な
構成のチャネル相関回路B2が設けられている。また、ロスレス・エンコーダ2
Dとロスレス・デコーダ3Dはマルチチャネル対応型として構成されている。な
お、チャネル相関回路A、A2、B、B2は、それぞれLとR、SLとSRを組み
合わせの対象としている。なお、ロスレス・エンコーダ2Dとロスレス・デコー
ダ3Dにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の
選択、最小予測残差を用いた予測値の算出などは、第1の実施の形態と同様に行
われる。
次に、第2の実施の形態の変形例としての第3の実施の形態について、そのブ
ロック図を示す図14に沿って説明する。図14は、図13の4チャネル用の構
成に対して更にセンタチャネルC及び低音効果チャネルLFEを加えた合計6チャ
ネル用として構成されている。ただし、センタチャネルC、後方の2チャネルS
L、SR、及び低周波音効果チャネルLFEはLとRのように相関をとることなく、
直接ロスレス・エンコーダ2Dに入力され、また直接ロスレス・デコーダ3Dか
ら出力される。
次に、第2の実施の形態及び第3の実施の形態の変形例としての第4の実施の
形態について、そのブロック図を示す図15に沿って説明する。図15に示すチ
ャネル相関回路A−1は加算回路1aと減算回路1bを有する。加算回路1aは
ステレオ2ch信号L、Rの和信号(L+R)を算出し、この和信号(L+R)を
割り算器5aにより1/2に割り算してから、ロスレス・エンコーダ2Dに出力
し、減算回路1bは差信号(L−R)を算出し、この差信号(L−R)を割り算
器5bにより1/2に割り算してから、ロスレス・エンコーダ2Dに出力する。
ロスレス・エンコーダ2Dは、1/2(L+R)と1/2(L−R)を用いてこ
れらを多重化して多重化信号250を作る。多重化信号250はロスレス・デコ
ーダ3Dによりデコードされて、元の1/2(L+R)と1/2(L−R)が得
られ、これらが、チャネル相関回路B−1を構成する加算回路4aと減算回路4
bにそれぞれ与えられ、出力信号としてステレオ2chのL信号とR信号が得られ
る。なお、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dにおける一連の
動作である、差分の算出、予測値の算出、最小予測残差の選択、最小予測残差を
用いた予測値の算出などは、第1の実施の形態と同様に行われる。第4の実施の
形態からわかるように、第2、第3の実施の形態におけるチャネル相関回路A、
A2はL+R及びL−Rを演算するものに限らず、1/2(L+R)、1/2(
L−R)を演算するものに置き換えることができる。この場合、ロスレス・デコ
ーダ3D側のチャネル相関回路B−1では1/2の演算は不要である。
なお、先に図3で説明したフォーマットは1例であって、本発明における信号
処理において記録あるいは伝送される信号のフォーマットは、これに限られるも
のでない。マルチチャネルの場合は、図13に対応してL、R信号に加えて、後
方2チャネルSL、SRも和信号(SL+SR)と差信号(SL−SR)の形で収納さ
れる(図16のa)。また、同様に図14に対応してL、R信号は和信号と差信
号の形で収納され、これに加えて、センターチャネルC、後方2チャネルSL、
SR、低周波効果チャネルLFEは、そのまま、すなわち和信号や差信号の形をと
ることなく収納される(図16のb)。
図17は、図16に示すようなマルチチャネルの信号を図4のAパックのユー
ザデータのパケットとするときのフォーマットを示す図である。ビットストリー
ムBS0には、和信号(L+R)と差信号(L−R)が収納され、また他のビッ
トストリームBS1には、図16のaに対応する場合は、和信号(SL+SR)と
差信号の(SL−SR)が、一方図16のbに対応する場合は、センターチャネル
C、後方2チャネルSL、SR、低周波効果チャネルLFEが、そのまま収納される
図5に示す圧縮PCM(PPCM)のオーディオ(A)パケットの図3と異な
る態様を図18に示す。この異なる態様では、圧縮PCM(PPCM)のオーデ
ィオ(A)パケットにおけるオーディオデータエリアは、図18に示すように複
数のPPCMアクセスユニットにより構成され、PPCMアクセスユニットはP
PCMシンク情報とサブパケットにより構成されている。最初のPPCMアクセ
スユニット内のサブパケットは、ディレクトリと、ビットストリームBS0と、
CRCと、ビットストリームBS1と、CRCとエクストラ情報により構成され
、ビットストリームBS0,BS1はPPCMブロックのみにより構成されてい
る。2番目以降のPPCMアクセスユニット内のサブパケットは、ディレクトリ
を除いてビットストリームBS0と、CRCと、ビットストリームBS1と、C
RCとエクストラ情報により構成され、フレーム先頭のビットストリームBS0
及びBS1はリスタートヘッダとPPCMブロックにより構成されている。フレ
ーム先頭のPPCMブロックにフレーム先頭サンプル値を配する。
PPCMシンク情報(以下、同期情報ともいう)は次の情報を含む。
・1パケット当たりのサンプル数:サンプリング周波数fsに応じて40、80
又は160が選択される。
・データレート:VBRの場合には「0」(サブパケット内のデータが圧縮デー
タであることを示す識別子)
・サンプリング周波数fs及び量子化ビット数Qb
・チャネル割り当て情報
ここで、リスタートヘッダはフレーム毎にチャネル相関回路Aが加算回路と減
算回路で構成されることを明記した情報を有している。これらのオーディオデー
タは図13と図14においてデマルチプレクサ21以下の構成からなるロスレス
・デコーダ3D(図8)により元のマルチチャネルオーディオ信号に復号される
。図18に示したフォーマットの可変レートビットストリームデータは、図1の
チャネル相関回路を用いたか、図15のチャネル相関回路を用いたかを、例えば
PPCMアクセスユニットのリスタートヘッダに格納した識別子(図示せず)で
識別するようにしているので、いずれであってもデコーダは確実にデコードでき
る。なお、フレーム毎のロスレス圧縮を例に説明したが、固定の長さに限らず区
間は可変の長さであってもよい。
本発明が適用される音声符号化装置とそれに対応した音声復号装置の第1の実施形態を示すブロック図である。 図1のエンコーダを詳しく示すブロック図である。 図2のマルチプレクサにより多重化される1フレームのフォーマットを示す説明図である。 DVDのパックのフォーマットを示す説明図である。 DVDのオーディオパックのフォーマットを示す説明図である。 図1のデコーダを詳しく示すブロック図である。 第2の実施形態のエンコーダを示すブロック図である。 第2の実施形態のデコーダを示すブロック図である。 第3の実施形態のエンコーダを示すブロック図である。 第3の実施形態のデコーダを示すブロック図である。 音声伝送方法を示すフローチャートである。 音声伝送方法を示すフローチャートである。 本発明が適用される音声符号化装置とそれに対応した音声復号装置の第2の実施形態を示すブロック図である。 本発明が適用される音声符号化装置とそれに対応した音声復号装置の第3の実施形態を示すブロック図である。 本発明が適用される音声符号化装置とそれに対応した音声復号装置の第4の実施形態を示すブロック図である。 本発明における信号処理において記録あるいは伝送されるマルチチャネル信号のフォーマットの例を示す図である。 マルチチャネルの信号を図4のAパックのユーザデータのパケットとするときのフォーマットを示す図である。 図5に示す圧縮PCM(PPCM)のオーディオ(A)パケットの図3と異なる態様を示すフォーマット説明図である。
符号の説明
1a、4a 加算回路(加算手段)
1b、4b 減算回路(減算手段)
5a、5b 割り算器
11D1 差分演算回路(第1の差分演算手段)
11D2 差分演算回路(第2の差分演算手段)
12a−1〜12a−n 予測器(減算器13a−1〜13a−n、バッファ
・選択器16D1と共に第1の予測符号化手段を構成する。)
12b−1〜12b−n 予測器(減算器13b−1〜13b−n、バッファ
・選択器16D2と共に第2の予測符号化手段を構成する。)
13a−1〜13a−n,13b−1〜13b−n 減算器
16D1,16D2,16A,16S,16L,16R バッファ・選択器
15A 予測回路(バッファ・選択器16Aと共に第3の予測符号化手段を構
成する。)
15S 予測回路(バッファ・選択器16Sと共に第4の予測符号化手段を構
成する。)
15L 予測回路(バッファ・選択器16Lと共に第5の予測符号化手段を構
成する。)
15R 予測回路
路(バッファ・選択器16Rと共に第6の予測符号化手段を構成する。)

Claims (2)

  1. 3以上のマルチチャネルの音声信号中の少なくとも選択された第及び第の2つのチャネルの音声信号をマトリクス演算して互いに相関ある2つの相関チャネルに変換するステップと、
    前記ステップにより変換された2つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
    ヘッダ情報と、圧縮PCMプライベートヘッダ及びオーディオ圧縮PCMデータ部を含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの先頭サンプル値と予測残差と線形予測方法を含む予測符号化データを前記オーディオ圧縮PCMデータ部内に記録し、前記音声信号のUPC/EAN番号及びISRCコードを前記圧縮PCMプライベートヘッダ内に配置するステップからなる音声符号化方法により符号化された音声信号を伝送する音声信号伝送方法であって、
    前記選択された先頭サンプル値と予測残差と線形予測方法とを含む予測符号化データと前記音声信号のUPC/EAN番号及びISRCコードをパケット化して伝送することを特徴とする音声信号伝送方法。
  2. 3以上のマルチチャネルの音声信号中の少なくとも選択された第及び第の2つのチャネルの音声信号をマトリクス演算して互いに相関ある2つの相関チャネルに変換するステップと、
    前記ステップにより変換された2つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
    ヘッダ情報と、圧縮PCMプライベートヘッダ及びオーディオ圧縮PCMデータ部を含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの先頭サンプル値と予測残差と線形予測方法を含む予測符号化データを、前記オーディオ圧縮PCMデータ部内に記録し、前記音声信号のUPC/EAN番号及びISRCコードを前記圧縮PCMプライベートヘッダ内に配置するステップからなる音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
    前記圧縮PCMプライベートヘッダ内に配置するUPC/EAN番号及びISRCコードをデコードするステップと、
    前記選択された先頭サンプル値と予測残差と線形予測方法を含むサブフレーム単位の予測符号化データから予測値を算出するステップと、
    この算出された予測値から元の音声信号を復元するステップと、
    からなる音声復号方法。
JP2004243781A 1998-10-13 2004-08-24 音声信号伝送方法及び音声復号方法 Expired - Fee Related JP4148203B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004243781A JP4148203B2 (ja) 1998-10-13 2004-08-24 音声信号伝送方法及び音声復号方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP30634998 1998-10-13
JP34235298 1998-11-16
JP2004243781A JP4148203B2 (ja) 1998-10-13 2004-08-24 音声信号伝送方法及び音声復号方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001131800A Division JP3606456B2 (ja) 1998-10-13 2001-04-27 音声信号伝送方法及び音声復号方法

Related Child Applications (18)

Application Number Title Priority Date Filing Date
JP2005374876A Division JP4151035B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374870A Division JP4244224B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374871A Division JP4244225B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374865A Division JP4148260B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374869A Division JP4244223B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374872A Division JP4244226B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374863A Division JP4151029B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374868A Division JP4244222B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374864A Division JP4196356B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374861A Division JP4151028B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374862A Division JP4148259B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374874A Division JP4151033B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374877A Division JP4151036B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374866A Division JP4151030B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374875A Division JP4151034B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374867A Division JP4151031B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374860A Division JP4151027B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法
JP2005374873A Division JP4151032B2 (ja) 1998-10-13 2005-12-27 音声符号化方法及び音声復号方法

Publications (2)

Publication Number Publication Date
JP2005038592A JP2005038592A (ja) 2005-02-10
JP4148203B2 true JP4148203B2 (ja) 2008-09-10

Family

ID=34222054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004243781A Expired - Fee Related JP4148203B2 (ja) 1998-10-13 2004-08-24 音声信号伝送方法及び音声復号方法

Country Status (1)

Country Link
JP (1) JP4148203B2 (ja)

Also Published As

Publication number Publication date
JP2005038592A (ja) 2005-02-10

Similar Documents

Publication Publication Date Title
JP5035458B2 (ja) 音声信号伝送装置、音声信号受信装置及び音声信号伝送システム
JP4244223B2 (ja) 音声符号化方法及び音声復号方法
JP4148203B2 (ja) 音声信号伝送方法及び音声復号方法
JP4148259B2 (ja) 音声符号化方法及び音声復号方法
JP4148260B2 (ja) 音声符号化方法及び音声復号方法
JP3606456B2 (ja) 音声信号伝送方法及び音声復号方法
JP2006171774A (ja) 音声符号化方法及び音声復号方法
JP2006171769A (ja) 音声符号化方法及び音声復号方法
JP2006171778A (ja) 音声符号化方法及び音声復号方法
JP2006171777A (ja) 音声符号化方法及び音声復号方法
JP2006171779A (ja) 音声符号化方法及び音声復号方法
JP2006171775A (ja) 音声符号化方法及び音声復号方法
JP2006171772A (ja) 音声符号化方法及び音声復号方法
JP2006171780A (ja) 音声符号化方法及び音声復号方法
JP2006178481A (ja) 音声符号化方法及び音声復号方法
JP2006178482A (ja) 音声符号化方法及び音声復号方法
JP2006178479A (ja) 音声符号化方法及び音声復号方法
JP2006178480A (ja) 音声符号化方法及び音声復号方法
JP2006171770A (ja) 音声符号化方法及び音声復号方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080603

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080616

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110704

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110704

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120704

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120704

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120704

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120704

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130704

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees