JP2001202099A - 音声符号化方法及び音声復号方法 - Google Patents

音声符号化方法及び音声復号方法

Info

Publication number
JP2001202099A
JP2001202099A JP2000328614A JP2000328614A JP2001202099A JP 2001202099 A JP2001202099 A JP 2001202099A JP 2000328614 A JP2000328614 A JP 2000328614A JP 2000328614 A JP2000328614 A JP 2000328614A JP 2001202099 A JP2001202099 A JP 2001202099A
Authority
JP
Japan
Prior art keywords
data
decoding
channel
stamp information
time stamp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000328614A
Other languages
English (en)
Other versions
JP3346398B2 (ja
Inventor
Yoshiaki Tanaka
美昭 田中
Shoji Ueno
昭治 植野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2000328614A priority Critical patent/JP3346398B2/ja
Publication of JP2001202099A publication Critical patent/JP2001202099A/ja
Application granted granted Critical
Publication of JP3346398B2 publication Critical patent/JP3346398B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 マルチチャネルの音声信号を可変の圧縮率で
符号化する場合に再生側の処理時間を管理可能にする。 【解決手段】 予測回路13D1,13D2,15D1
〜15D4とバッファ・選択器14D1,14D2,1
6D1〜16D4は、6チャネル音声信号を予測符号化
する。DTS生成器17はチャネル毎の予測符号化デー
タ量に応じて、復号側の入力バッファ22a内の圧縮デ
ータを読み出すタイミングを示すデコーディング・タイ
ム・スタンプ情報を生成し、フォーマット化回路19は
デコーディング・タイム・スタンプ情報を含むパケット
ヘッダと、圧縮データを含むユーザデータを有するパケ
ットにフォーマット化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マルチチャネルの
音声信号を可変長で圧縮するための音声符号化方法及び
音声復号方法に関する。
【0002】
【従来の技術】音声信号を可変長で圧縮する方法とし
て、本発明者は先の出願(特願平9−289159号)
において1チャネルの原デジタル音声信号に対して、特
性が異なる複数の予測器により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、原デ
ジタル音声信号と、この複数の線形予測値から予測器毎
の予測残差を算出し、予測残差の最小値を選択する予測
符号化方法を提案している。
【0003】なお、上記方法では原デジタル音声信号が
サンプリング周波数=96kHz、量子化ビット数=2
0ビット程度の場合にある程度の圧縮効果を得ることが
できるが、近年のDVDオーディオディスクではこの2
倍のサンプリング周波数(=192kHz)が使用さ
れ、また、量子化ビット数も24ビットが使用される傾
向があるので、圧縮率を改善する必要がある。また、マ
ルチチャネルにおけるサンプリング周波数と量子化ビッ
ト数はチャネル毎に異なることもある。
【0004】
【発明が解決しようとする課題】ところで、予測符号化
方式のような圧縮方式は圧縮率が可変(VBR:バリア
ブル・ビット・レート)であるので、マルチチャネルの
音声信号を予測符号化するとチャネル毎のデータ量が時
間的に大きく変化する。また、このようなデータを伝送
する場合には、チャネル毎にパラレルではなくデータス
トリームとして伝送される。
【0005】したがって、再生側(デコード側)におい
てこのような可変長のデータストリームをチャネル毎に
同期して再生(プレゼンテーション)可能にするために
は、入力バッファに蓄積されたデータストリームを読み
出してデコーダに出力するためのタイミングを示すデコ
ード時間と、出力バッファに蓄積されたデコード後のデ
ータを読み出してスピーカなどに出力(プレゼンテーシ
ョン)するためのタイミングを示す再生時間を管理しな
ければならない。また、再生側でこのような可変長のデ
ータストリームをサーチ再生するための時間を管理しな
ければならない。
【0006】そこで本発明は、マルチチャネルの音声信
号を可変の圧縮率で符号化する場合に再生側の処理時間
を管理することができる音声符号化方法及び音声復号方
法を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明は上記目的を達成
するために、以下の1)及び2)に記載の手段よりな
る。すなわち、
【0008】1)マルチチャネルの音声信号を、そのま
まのチャネル又は互いに相関をとったチャネル毎に、入
力される音声信号に応答して先頭サンプル値を所定時間
のフレーム単位で得ると共に、時間領域の過去の信号か
ら予測される現在の信号の複数の予測値の中でその予測
残差が最小値となる線形予測方法を前記フレームを更に
分割したサブフレーム単位に選択して予測符号化するス
テップと、前記ステップにより選択されたチャネル毎の
予測符号化データ量に応じて、復号側の入力バッファ内
の予測符号化データ(圧縮データ)を読み出すタイミン
グを示すデコーディング・タイム・スタンプ情報を生成
するステップと、前記デコーディング・タイム・スタン
プ情報を含むパケットヘッダと、前記予測符号化データ
を含むユーザデータをパケットにフォーマット化するス
テップと、からなる音声符号化方法。 2)マルチチャネルの音声信号を、そのままのチャネル
又は互いに相関をとったチャネル毎に、入力される音声
信号に応答して先頭サンプル値を得ると共に、時間領域
の過去の信号から予測される現在の信号の複数の予測値
の中でその予測残差が最小値となる線形予測方法を選択
して予測符号化するステップと、前記ステップにより選
択されたチャネル毎の予測符号化データ量に応じて、復
号側の入力バッファ内の予測符号化データ(圧縮デー
タ)を読み出すタイミングを示すデコーディング・タイ
ム・スタンプ情報を生成するステップと、前記デコーデ
ィング・タイム・スタンプ情報を含むパケットヘッダ
と、前記予測符号化データを含むユーザデータをパケッ
トにフォーマット化するステップと、からなる音声符号
化方法により符号化されたデータから元の音声信号を復
号する復号方法であって、前記パケットをパケットヘッ
ダとユーザデータに分離するステップと、前記ユーザデ
ータ内の予測符号化データをバッファに蓄積するステッ
プと、前記バッファ内の予測符号化データを前記パケッ
トヘッダ内のデコーディング・タイム・スタンプ情報に
基づいて読み出すステップと、前記バッファから読み出
された予測符号化データを伸長するステップと、からな
る音声復号方法。
【0009】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は本発明が適用される係る音
声符号化装置及び音声復号装置の第1の実施形態を示す
ブロック図、図2は図1の符号化部を詳しく示すブロッ
ク図、図3は図1、図2の符号化部により符号化された
ビットストリームを示す説明図、図4はDVDのパック
のフォーマットを示す説明図、図5はDVDのオーディ
オパックのフォーマットを示す説明図、図6は図1の復
号化部を詳しく示すブロック図、図7は図6の入力バッ
ファの書き込み/読み出しタイミングを示すタイミング
チャート、図8はアクセスユニット毎の圧縮データ量を
示す説明図、図9はアクセスユニットとプレゼンテーシ
ョンユニットを示す説明図である。
【0010】ここで、マルチチャネル方式としては、例
えば次の4つの方式が知られている。 (1)4チャネル方式 ドルビーサラウンド方式の
ように、前方L、C、Rの3チャネル+後方Sの1チャ
ネルの合計4チャネル (2)5チャネル方式 ドルビーAC−3方式のS
Wチャネルなしのように、前方L、C、Rの3チャネル
+後方SL、SRの2チャネルの合計5チャネル (3)6チャネル方式 DTS(Digital Theater
System)方式や、ドルビーAC−3方式のように6チャ
ネル(L、C、R、SW(Lfe)、SL、SR) (4)8チャネル方式 SDDS(Sony Dynamic D
igital Sound)方式のように、前方L、LC、C、R
C、R、SWの6チャネル+後方SL、SRの2チャネ
ルの合計8チャネル
【0011】図1に示す符号化側の6チャネル(ch)ミ
クス&マトリクス回路1’は、マルチチャネル信号の一
例としてフロントレフト(Lf)、センタ(C)、フロ
ントライト(Rf)、サラウンドレフト(Ls)、サラ
ウンドライト(Rs)及びLfe(Low Frequency Effe
ct)の6chのPCMデータを次式(1)により前方グル
ープに関する2ch「1」、「2」と他のグループに関す
る4ch「3」〜「6」に分類して変換し、2ch「1」、
「2」を第1符号化部2’−1に、また、4ch「3」〜
「6」を第2符号化部2’−2に出力する。 「1」=Lf+Rf 「2」=Lf−Rf 「3」=C−(Ls+Rs)/2 「4」=Ls+Rs 「5」=Ls−Rs 「6」=Lfe−a×C ただし、0≦a≦1 …(1)
【0012】符号化部2’を構成する第1及び第2符号
化部2’−1、2’−2はそれぞれ、図2に詳しく示す
ように2ch「1」、「2」と4ch「3」〜「6」のPC
Mデータを予測符号化し、予測符号化データを図3に示
すようなビットストリームで記録媒体5や通信媒体6を
介して復号側に伝送する。復号側では復号化部3’を構
成する第1及び第2復号化部3’−1、3’−2によ
り、図6に詳しく示すようにそれぞれ前方グループに関
する2ch「1」、「2」と他のグループに関する4ch
「3」〜「6」の予測符号化データをPCMデータに復
号する。
【0013】次いでミクス&マトリクス回路4’により
式(1)に基づいて元の6ch(Lf、C、Rf、Ls、
Rs、Lfe)を復元するとともに、この元の6chと係
数mij(i=1,2,j=1,2〜6)により次式
(2)のようにステレオ2chデータ(L、R)を生成す
る。 L=m11・Lf+m12・Rf+m13・C +m14・Ls+m15・Rs+m16・Lfe R=m21・Lf+m22・Rf+m23・C +m24・Ls+m25・Rs+m26・Lfe …(2 )
【0014】図2を参照して符号化部2’−1、2’−
2について詳しく説明する。各ch「1」〜「6」のPC
Mデータは1フレーム毎に1フレームバッファ10に格
納される。そして、1フレームの各ch「1」〜「6」の
サンプルデータがそれぞれ予測回路13D1、13D
2、15D1〜15D4に印加されるとともに、各ch
「1」〜「6」の各フレームの先頭サンプルデータがフ
ォーマット化回路19に印加される。予測回路13D
1、13D2、15D1〜15D4はそれぞれ、各ch
「1」〜「6」のPCMデータに対して、特性が異なる
複数の予測器(不図示)により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、次い
で原PCMデータと、この複数の線形予測値から予測器
毎の予測残差を算出する。続くバッファ・選択器14D
1、14D2、16D1〜16D4はそれぞれ、予測回
路13D1、13D2、15D1〜15D4により算出
された各予測残差を一時記憶して、選択信号/DTS
(デコーディング・タイム・スタンプ)生成器17によ
り指定されたサブフレーム毎に予測残差の最小値を選択
する。
【0015】選択信号/DTS生成器17は予測残差の
ビット数フラグをパッキング回路18とフォーマット化
回路19に対して印加し、また、予測残差が最小の予測
器を示す予測器選択フラグと、式(1)における相関係
数aと、復号化側が入力バッファ22a(図6)からス
トリームデータを取り出す時間を示すDTSをフォーマ
ット化回路19に対して印加する。パッキング回路18
はバッファ・選択器14D1、14D2、16D1〜1
6D4により選択された6ch分の予測残差を、選択信号
/DTS生成器17により指定されたビット数フラグに
基づいて指定ビット数でパッキングする。またPTS生
成器17cは、復号化側が出力バッファ110(図6)
からPCMデータを取り出す時間を示すPTS(プレゼ
ンテーション・タイム・スタンプ)を生成してフォーマ
ット化回路19に出力する。
【0016】続くフォーマット化回路19は図3〜図5
に示すようなユーザデータにフォーマット化する。図3
に示すユーザデータ(サブパケット)は、前方グループ
に関する2ch「1」、「2」の予測符号化データを含む
可変レートビットストリーム(サブストリーム)BS0
と、他のグループに関する4ch「3」〜「6」の予測符
号化データを含む可変レートビットストリーム(サブス
トリーム)BS1と、サブストリームBS0、BS1の
前に設けられたビットストリームヘッダ(リスタートヘ
ッダ)により構成されている。また、サブストリームB
S0、BS1の1フレーム分は ・フレームヘッダと、 ・各ch「1」〜「6」の1フレームの先頭サンプルデー
タと、 ・各ch「1」〜「6」のサブフレーム毎の予測器選択フ
ラグと、 ・各ch「1」〜「6」のサブフレーム毎のビット数フラ
グと、 ・各ch「1」〜「6」の予測残差データ列(可変ビット
数)と、 ・ch「6」の係数a が多重化されている。このような予測符号化によれば、
原信号が例えばサンプリング周波数=96kHz、量子
化ビット数=24ビット、6チャネルの場合、71%の
圧縮率を実現することができる。
【0017】図2に示す符号化部2’−1、2’−2に
より予測符号化された可変レートビットストリームデー
タを、記録媒体の一例としてDVDオーディオディスク
に記録する場合には、図4に示すオーディオ(A)パッ
クにパッキングされる。このパックは2034バイトの
ユーザデータ(Aパケット、Vパケット)に対して4バ
イトのパックスタート情報と、6バイトのSCR(Syst
em Clock Reference:システム時刻基準参照値)情報
と、3バイトのMux レート(rate)情報と1バイトのス
タッフィングの合計14バイトのパックヘッダが付加さ
れて構成されている(1パック=合計2048バイ
ト)。この場合、タイムスタンプであるSCR情報を、
先頭パックでは「1」として同一タイトル内で連続とす
ることにより同一タイトル内のAパックの時間を管理す
ることができる。
【0018】圧縮PCMのAパケットは図5に詳しく示
すように、19又は14バイトのパケットヘッダと、圧
縮PCMのプライベートヘッダと、図3に示すフォーマ
ットの1ないし2011バイトのオーディオデータ(圧
縮PCM)により構成されている。そして、DTSとP
TSは図5のパケットヘッダ内に(具体的にはパケット
ヘッダの10〜14バイト目にPTSが、15〜19バ
イト目にDTSが)セットされる。圧縮PCMのプライ
ベートヘッダは、 ・1バイトのサブストリームIDと、 ・2バイトのUPC/EAN−ISRC(Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code)番号、及びUPC/EAN−
ISRCデータと、 ・1バイトのプライベートヘッダ長と、 ・2バイトの第1アクセスユニットポインタと、 ・8バイトのオーディオデータ情報(ADI)と、 ・0〜7バイトのスタッフィングバイトとに、より構成
されている。そして、ADI内に1秒後のアクセスユニ
ットをサーチするための前方アクセスユニット・サーチ
ポインタと、1秒前のアクセスユニットをサーチするた
めの後方アクセスユニット・サーチポインタがともに1
バイトで(具体的にはADIの7バイト目に前方アクセ
スユニット・サーチポインタが、8バイト目に後方アク
セスユニット・サーチポインタが)セットされる。
【0019】次に図6を参照して復号化部3’−1、
3’−2について説明する。上記フォーマットの可変レ
ートビットストリームデータBS0、BS1は、デフォ
ーマット化回路21により分離される。そして、各ch
「1」〜「6」の1フレームの先頭サンプルデータと予
測器選択フラグはそれぞれ予測回路24D1、24D
2、23D1〜23D4に印加され、各ch「1」〜
「6」のビット数フラグはアンパッキング回路22に印
加される。また、SCRと、DTSと予測残差データ列
は入力バッファ22aに印加され、PTSは出力バッフ
ァ110に印加される。ここで、予測回路24D1、2
4D2、23D1〜23D4内の複数の予測器(不図
示)はそれぞれ、符号化側の予測回路13D1、13D
2、15D1〜15D4内の複数の予測器と同一の特性
であり、予測器選択フラグにより同一特性のものが選択
される。
【0020】デフォーマット化回路21により分離され
たストリームデータ(予測残差データ列)は、図7に示
すようにSCRによりアクセスユニット毎に入力バッフ
ァ22aに取り込まれて蓄積される。ここで、1つのア
クセスユニットのデータ量は、例えばfs=96kHz
の場合には(1/96kHz)秒分であるが、図8、図
9(a)に詳しく示すように可変長である。そして、入
力バッファ22aに蓄積されたストリームデータはDT
Sに基づいてFIFOで読み出されてアンパッキング回
路22に印加される。
【0021】アンパッキング回路22は各ch「1」〜
「6」の予測残差データ列をビット数フラグ毎に基づい
て分離してそれぞれ予測回路24D1、24D2、23
D1〜23D4に出力する。予測回路24D1、24D
2、23D1〜23D4ではそれぞれ、アンパッキング
回路22からの各ch「1」〜「6」の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各1つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで1フレー
ムの先頭サンプルデータを基準として各サンプルのPC
Mデータが算出されて出力バッファ110に蓄積され
る。出力バッファ110に蓄積されたPCMデータはP
TSに基づいて読み出されて出力される。したがって、
図9(a)に示す可変長のアクセスユニットが伸長され
て、図9(b)に示す一定長のプレゼンテーションユニ
ットが出力される。
【0022】ここで、操作部101を介してサーチ再生
が指示された場合には、制御部100により図5に示す
ADI内に置かれる1秒先を示す前方アクセスユニット
・サーチポインタと1秒後を示す後方アクセスユニット
・サーチポインタに基づいてアクセスユニットを再生す
る。このサーチポインタとしては、1秒先、1秒前の代
わりに2秒先、2秒前のものでよい。
【0023】図2に示す符号化部2’−1、2’−2に
より予測符号化された可変レートビットストリームデー
タをネットワークを介して伝送する場合には、符号化側
では図10に示すように伝送用にパケット化し(ステッ
プS41)、次いでパケットヘッダを付与し(ステップ
S42)、次いでこのパケットをネットワーク上に送り
出す(ステップS43)。
【0024】復号側では図11(A)に示すようにヘッ
ダを除去し(ステップS51)、次いでデータを復元し
(ステップS52)、次いでこのデータをメモリに格納
して復号を待つ(ステップS53)。そして、復号を行
う場合には図11(B)に示すように、デフォーマット
化を行い(ステップS61)、次いで入力バッファ22
aの入出力制御を行い(ステップS62)、次いでアン
パッキングを行う(ステップS63)。なお、このと
き、サーチ再生指示がある場合にはサーチポインタをデ
コードする。次いで予測器をフラグに基づいて選択して
デコードを行い(ステップS64)、次いで出力バッフ
ァ110の入出力制御を行い(ステップS65)、次い
で元のマルチチャネルを復元し(ステップS66)、次
いでこれを出力し(ステップS67)、以下、これを繰
り返す。
【0025】なお、上記実施形態では、前方グループに
関する2ch「1」、「2」を 「1」=Lf+Rf 「2」=Lf−Rf により変換して予測符号化したが、代わりに式(2)に
よりマルチチャネルをダウンミクスしてステレオ2chデ
ータ(L、R)を生成し、次いで次式(1)’ 「1」=L+R 「2」=L−R 「3」〜「5」は同じ 「6」=Lfe−C …(1)’ により変換して予測符号化するようにしてもよい(第2
の実施形態)。この場合には、復号化側のミクス&マト
リクス回路4’はチャネル「1」、「2」を加算するこ
とによりチャネルLを、減算することによりチャネルR
を生成することができる。
【0026】また、第3の実施形態として図12に示す
ように、2ch「1」、「2」の代わりに式(2)により
マルチチャネルをダウンミクスしてステレオ2chデータ
(L、R)を生成して、このステレオ2ch(L、R)と
4ch「3」〜「6」を予測符号化するようにしてもよ
い。なお、第2、第3の実施形態では、フロントレフト
(Lf)とフロントライト(Rf)が復号化側に伝送さ
れないので、復号化側ではこれを式(1)、(2)によ
り生成する。
【0027】次に図13、図14を参照して第4の実施
形態について説明する。上記の実施形態では、1グルー
プの相関性の信号「1」〜「6」を予測符号化するよう
に構成されているが、この第4の実施形態では複数グル
ープの相関性のある信号を生成して予測符号化し、圧縮
率が最も高いグループの予測符号化データを選択するよ
うに構成されている。このため図13に示す符号化部で
は、第1〜第nの相関回路1−1〜1−nが設けられ、
このn個の相関回路1−1〜1−nは例えば6ch(L
f、C、Rf、Ls、Rs、Lfe)のPCMデータ
を、相関性が異なるn種類の6ch信号「1」〜「6」に
変換する。
【0028】例えば第1の相関回路1−1は以下のよう
に変換し、 「1」=Lf 「2」=C−(Ls+Rs)/2 「3」=Rf−Lf 「4」=Ls−a×Lfe 「5」=Rs−b×Rf 「6」=Lfe また、第nの相関回路1−nは以下のように変換する。 「1」=Lf+Rf 「2」=C−Lf 「3」=Rf−Lf 「4」=Ls−Lf 「5」=Rs−Lf 「6」=Lfe−C
【0029】また、相関回路1−1〜1−n毎に予測回
路15とバッファ・選択器16が設けられ、グループ毎
の予測残差の最小値のデータ量に基づいて圧縮率が最も
高いグループが相関選択信号生成器17bにより選択さ
れる。このとき、フォーマット化回路19はその選択フ
ラグ(相関回路選択フラグ、その相関回路の相関係数
a、b)を追加して多重化する。
【0030】また、図14に示す復号化側では、符号化
側の相関回路1−1〜1−nに対してn個の相関回路4
−1〜4−n(又は係数a、bが変更可能な図示省略の
1つの相関回路)が設けられる。なお、図13に示すn
グループの予測回路が同一の構成である場合、復号装置
では図14に示すようにnグループ分の予測回路を設け
る必要はなく、1つのグループ分の予測回路でよい。そ
して、符号化装置から伝送された選択フラグに基づいて
相関回路4−1〜4−nの1つを選択、又は係数a、b
を設定して元の6ch(Lf、C、Rf、Ls、Rs、L
fe)を復元し、また、式(2)によりマルチチャネル
をダウンミクスしてステレオ2chデータ(L、R)を生
成する。
【0031】また、上記の第1の実施形態では、1種類
の相関性の信号「1」〜「6」を予測符号化するように
構成されているが、この信号「1」〜「6」のグループ
と原信号(Lf、C、Rf、Ls、Rs、Lfe)のグ
ループを予測符号化し、圧縮率が高い方のグループを選
択するようにしてもよい。
【0032】
【発明の効果】以上説明したように本発明によれば、チ
ャネル毎の圧縮データ量に応じて、復号側の入力バッフ
ァ内の圧縮データを読み出すタイミングを示すデコーデ
ィング・タイム・スタンプ情報を生成してパケットヘッ
ダにセットしたので、マルチチャネルの音声信号を可変
の圧縮率で符号化する場合に再生側の処理時間を管理す
ることができる。
【図面の簡単な説明】
【図1】本発明が適用される音声符号化装置及び音声復
号装置の第1の実施形態を示すブロック図である。
【図2】図1の符号化部を詳しく示すブロック図であ
る。
【図3】図1、図2の符号化部により符号化されたビッ
トストリームを示す説明図である。
【図4】DVDのパックのフォーマットを示す説明図で
ある。
【図5】DVDのオーディオパックのフォーマットを示
す説明図である。
【図6】図1の復号化部を詳しく示すブロック図であ
る。
【図7】図6の入力バッファの書き込み/読み出しタイ
ミングを示すタイミングチャートである。
【図8】アクセスユニット毎の圧縮データ量を示す説明
図である。
【図9】アクセスユニットとプレゼンテーションユニッ
トを示す説明図である。
【図10】音声伝送方法を示すフローチャートである。
【図11】音声伝送方法を示すフローチャートである。
【図12】本発明が適用される音声符号化装置及び音声
復号装置第3の実施形態を示すブロック図である。
【図13】第4の実施形態の音声符号化装置を示すブロ
ック図である。
【図14】第4の実施形態の音声復号装置を示すブロッ
ク図である。
【符号の説明】
1’ 6chミクス&マトリクス回路 13D1,13D2,15D1〜15D4 予測回路
(バッファ・選択器14D1,14D2,16D1〜1
6D4と共に圧縮手段を構成する。) 14D1,14D2,16D1〜16D4 バッファ・
選択器 17 選択信号/DTS生成器(タイミング生成手段) 17c PTS生成器(タイミング生成手段) 19 フォーマット化回路(フォーマット化手段) 21 デフォーマット化回路(分離手段) 22 アンパッキング回路 22a 入力バッファ 24D1,24D2,23D1〜23D4 予測回路
(伸長手段) 100 制御部(読み出し手段) 110 出力バッファ
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成13年2月28日(2001.2.2
8)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正内容】
【0008】1)マルチチャネルの音声信号を、そのま
まのチャネル又は互いに相関をとったチャネル毎に、入
力される音声信号に応答して先頭サンプル値を得ると
共に、特性が異なる複数の線形予測方法により時間領域
の過去の信号から現在の信号の線形予測値がそれぞれ予
測され、その予測される線形予測値と前記音声信号とか
ら得られる予測残差が最小となるような線形予測方法を
前記フレームを更に分割したサブフレーム単位に選択し
圧縮するステップと、前記圧縮されたデータの量に応
じて、復号側の入力バッファ内の圧縮データを読み出す
タイミングを示すデコーディング・タイム・スタンプ情
報を生成すると共に、復号側の出力バッファ内のデコー
ド済みデータを読み出すタイミングを示すプレゼンテー
ション・タイム・スタンプ情報を生成するステップと、
前記デコーディング・タイム・スタンプ情報及び前記プ
レゼンテーション・タイム・スタンプ情報を含むパケッ
トヘッダと、前記圧縮データと、を含むユーザデータを
パケットにフォーマット化するステップと、からなる音
声符号化方法。 2))マルチチャネルの音声信号を、そのままのチャネ
ル又は互いに相関をとったチャネル毎に、入力される音
声信号に応答して先頭サンプル値を得ると共に、特性
が異なる複数の線形予測方法により時間領域の過去の信
号から現在の信号の線形予測値がそれぞれ予測され、そ
の予測される線形予測値と前記音声信号とから得られる
予測残差が最小となるような線形予測方法を選択して
縮するステップと、前記圧縮されたデータの量に応じ
て、デコーディング・タイム・スタンプ情報を生成する
と共に、プレゼンテーション・タイム・スタンプ情報
生成するステップと、前記デコーディング・タイム・ス
タンプ情報及びプレゼンテーション・タイム・スタンプ
情報と、を含むパケットヘッダと、前記圧縮データと、
を含むユーザデータを有するパケットにフォーマット化
するステップと、からなる音声符号化方法により符号化
されたデータから元の音声信号を復号する復号方法であ
って、前記パケット内のユーザデータをパケットヘッダ
圧縮データとに分離するステップと、前記分離された
圧縮データを入力バッファに蓄積するステップと、前記
入力バッファ内に蓄積された圧縮データを前記パケット
ヘッダ内のデコーディング・タイム・スタンプ情報に基
づいて読み出し伸長するステップと、前記読み出されて
伸長された音声データを出力バッファに蓄積するステッ
プと、前記出力バッファに蓄積された音声データを前記
パケット内のプレゼンテーション・タイム・スタンプ情
報に基づいて取り出すステップと、からなる音声復号方
法。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04S 3/02 G10L 9/18 D M

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】マルチチャネルの音声信号を、そのままの
    チャネル又は互いに相関をとったチャネル毎に、入力さ
    れる音声信号に応答して先頭サンプル値を所定時間のフ
    レーム単位で得ると共に、時間領域の過去の信号から予
    測される現在の信号の複数の予測値の中でその予測残差
    が最小値となる線形予測方法を前記フレームを更に分割
    したサブフレーム単位に選択して予測符号化するステッ
    プと、 前記ステップにより選択されたチャネル毎の予測符号化
    データ量に応じて、復号側の入力バッファ内の予測符号
    化データ(圧縮データ)を読み出すタイミングを示すデ
    コーディング・タイム・スタンプ情報を生成すると共
    に、復号側の出力バッファ内のデコード済みデータを読
    み出すタイミングを示すプレゼンテーション・タイム・
    スタンプ情報を生成するステップと、 前記デコーディング・タイム・スタンプ情報と前記プレ
    ゼンテーション・タイム・スタンプ情報を含むパケット
    ヘッダと、前記予測符号化データを含むユーザデータを
    パケットにフォーマット化するステップと、からなる音
    声符号化方法。
  2. 【請求項2】マルチチャネルの音声信号を、そのままの
    チャネル又は互いに相関をとったチャネル毎に、入力さ
    れる音声信号に応答して先頭サンプル値を得ると共に、
    時間領域の過去の信号から予測される現在の信号の複数
    の予測値の中でその予測残差が最小値となる線形予測方
    法を選択して予測符号化するステップと、 前記ステップにより選択されたチャネル毎の予測符号化
    データ量に応じて、復号側の入力バッファ内の予測符号
    化データ(圧縮データ)を読み出すタイミングを示すデ
    コーディング・タイム・スタンプ情報を生成すると共
    に、復号側の出力バッファ内のデコード済みデータを読
    み出すタイミングを示すプレゼンテーション・タイム・
    スタンプ情報を生成するステップと、 前記デコーディング・タイム・スタンプ情報と前記プレ
    ゼンテーション・タイム・スタンプ情報を含むパケット
    ヘッダと、前記予測符号化データを含むユーザデータを
    パケットにフォーマット化するステップと、からなる音
    声符号化方法により符号化されたデータから元の音声信
    号を復号する音声復号方法であって、 前記パケットをパケットヘッダとユーザデータに分離す
    るステップと、 前記ユーザデータ内の予測符号化データを入力バッファ
    に蓄積するステップと、 前記入力バッファ内の予測符号化データを前記パケット
    ヘッダ内のデコーディング・タイム・スタンプ情報に基
    づいて読み出すステップと、 前記バッファから読み出された予測符号化データを伸長
    し、前記伸長された音声データを前記パケットヘッダ内
    のプレゼンテーション・タイム・スタンプ情報に基づい
    て取り出すステップと、からなる音声復号方法。
JP2000328614A 2000-10-27 2000-10-27 音声符号化方法及び音声復号方法 Expired - Lifetime JP3346398B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000328614A JP3346398B2 (ja) 2000-10-27 2000-10-27 音声符号化方法及び音声復号方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000328614A JP3346398B2 (ja) 2000-10-27 2000-10-27 音声符号化方法及び音声復号方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP34239598A Division JP3341992B2 (ja) 1998-11-16 1998-11-16 光記録媒体、音声復号装置

Publications (2)

Publication Number Publication Date
JP2001202099A true JP2001202099A (ja) 2001-07-27
JP3346398B2 JP3346398B2 (ja) 2002-11-18

Family

ID=18805444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000328614A Expired - Lifetime JP3346398B2 (ja) 2000-10-27 2000-10-27 音声符号化方法及び音声復号方法

Country Status (1)

Country Link
JP (1) JP3346398B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006030289A1 (en) * 2004-09-17 2006-03-23 Digital Rise Technology Co., Ltd. Apparatus and methods for multichannel digital audio coding
CN101046963B (zh) * 2004-09-17 2011-03-23 广州广晟数码技术有限公司 解码经编码的音频数据流的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006030289A1 (en) * 2004-09-17 2006-03-23 Digital Rise Technology Co., Ltd. Apparatus and methods for multichannel digital audio coding
KR100952693B1 (ko) 2004-09-17 2010-04-13 디지털 라이즈 테크놀로지 씨오., 엘티디 멀티채널 디지털 오디오 코딩을 위한 장치 및 방법
CN101046963B (zh) * 2004-09-17 2011-03-23 广州广晟数码技术有限公司 解码经编码的音频数据流的方法

Also Published As

Publication number Publication date
JP3346398B2 (ja) 2002-11-18

Similar Documents

Publication Publication Date Title
JP3341992B2 (ja) 光記録媒体、音声復号装置
JP3346398B2 (ja) 音声符号化方法及び音声復号方法
JP3791801B2 (ja) 光記録媒体及び音声復号装置
JP3606455B2 (ja) 音声信号伝送方法及び音声復号方法
JP3346395B2 (ja) 光記録媒体及び音声復号装置
JP3346399B2 (ja) 光記録媒体及び音声復号装置
JP3346394B2 (ja) 音声符号化方法及び音声復号方法
JP3346402B2 (ja) 音声符号化方法及び音声復号方法
JP3821384B2 (ja) 光記録媒体及び音声復号装置
JP3346397B2 (ja) 音声符号化方法
JP3346392B2 (ja) 音声符号化装置
JP3821385B2 (ja) 光記録媒体及び音声復号装置
JP3346396B2 (ja) 音声符号化装置
JP3346393B2 (ja) 音声符号化方法
JP3346406B2 (ja) 音声符号化方法及び音声復号方法
JP3346401B2 (ja) 音声符号化方法
JP3346405B2 (ja) 音声符号化方法
JP3346403B2 (ja) 光記録媒体及び音声復号装置
JP3346400B2 (ja) 音声符号化装置
JP3346404B2 (ja) 音声符号化装置
JP3791798B2 (ja) 音声符号化方法及び音声復号方法
JP3821381B2 (ja) 音声符号化方法及び音声復号方法
JP2005189884A (ja) 音声符号化方法及び音声復号方法
JP2000214894A (ja) 音声符号化装置、記録媒体、音声復号装置、音声伝送方法及び伝送媒体
JP2000214898A (ja) 音声符号化装置、記録媒体、音声復号装置、音声伝送方法及び伝送媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080906

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080906

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090906

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090906

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100906

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100906

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110906

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120906

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120906

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120906

Year of fee payment: 10

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120906

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130906

Year of fee payment: 11

EXPY Cancellation because of completion of term