JP4164831B2 - 音声符号化方法及び音声復号方法 - Google Patents
音声符号化方法及び音声復号方法 Download PDFInfo
- Publication number
- JP4164831B2 JP4164831B2 JP2005052785A JP2005052785A JP4164831B2 JP 4164831 B2 JP4164831 B2 JP 4164831B2 JP 2005052785 A JP2005052785 A JP 2005052785A JP 2005052785 A JP2005052785 A JP 2005052785A JP 4164831 B2 JP4164831 B2 JP 4164831B2
- Authority
- JP
- Japan
- Prior art keywords
- decoding
- data
- channel
- audio
- time stamp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
声復号方法に関する。
1)複数のチャネルの音声信号をそのままのチャネル又は互いに相関をとったチャネル毎に入力される音声信号に応答して、先頭サンプル値を得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を選択して圧縮するステップと、
前記圧縮されたデータの量に応じて、復号側の入力バッファ内の圧縮データを読み出して伸長するタイミングを示すデコーディング・タイム・スタンプ情報を生成すると共に、復号側において前記伸長されるデータが一旦蓄積されて出力する際のタイミングを示すプレゼンテーション・タイム・スタンプ情報を生成するステップと、
前記デコーディング・タイム・スタンプ情報及び前記プレゼンテーション・タイム・スタンプ情報を含むパケットヘッダと、前記圧縮するステップにより選択されたチャネル毎の線形予測方法と予測残差と所定のサンプル値を含む圧縮データを格納するサブパケットであってビットストリーム(サブストリーム)及び前記ビットストリームの前に設けられるビットストリームヘッダを含むサブパケットと、を含むユーザデータを有するパケットにフォーマット化するステップと、
からなる音声符号化方法。
2)請求項1記載の音声符号化方法により符号化されたデータから元の前記複数のチャネルの音声信号を復号する音声復号方法であって、
前記格納されたサブパケットを前記デコーディング・タイム・スタンプ情報に基づいてデコードしてサブパケットを分離するステップと、
前記分離されたサブパケット内の圧縮データから予測値をチャネル毎に算出するステップと、
前記算出された予測値から元の前記複数のチャネルの音声信号を復元して音声データとするステップと、
前記復元された音声データを前記プレゼンテーション・タイム・スタンプ情報に基づいて取り出すステップと、
からなる音声復号方法。
号化装置とそれに対応する音声復号装置の第1の実施形態を示すブロック図、図2は図1
の符号化部を詳しく示すブロック図、図3は図1、図2の符号化部により符号化されたビ
ットストリームを示す説明図、図4はDVDのパックのフォーマットを示す説明図、図5
はDVDのオーディオパックのフォーマットを示す説明図、図6は図1の復号化部を詳し
く示すブロック図、図7は図6の入力バッファの書き込み/読み出しタイミングを示すタ
イミングチャート、図8はアクセスユニット毎の圧縮データ量を示す説明図、図9はアク
セスユニットとプレゼンテーションユニットを示す説明図である。
(1)4チャネル方式 ドルビーサラウンド方式のように、前方L、C、Rの3チャネル+後方Sの1チャネルの合計4チャネル
(2)5チャネル方式 ドルビーAC−3方式のSWチャネルなしのように、前方L、C、Rの3チャネル+後方SL、SRの2チャネルの合計5チャネル
(3)6チャネル方式 DTS(Digital Theater System)方式や、ドルビーAC−3方式のように6チャネル(L、C、R、SW(Lfe)、SL、SR)
(4)8チャネル方式 SDDS(Sony Dynamic Digital Sound)方式のように、前方L、LC、C、RC、R、SWの6チャネル+後方SL、SRの2チャネルの合計8チャネル
図1に示す符号化側の6チャネル(ch)ミクス&マトリクス回路1’は、マルチチャネル信号の一例としてフロントレフト(Lf)、センタ(C)、フロントライト(Rf)、サラウンドレフト(Ls)、サラウンドライト(Rs)及びLfe(Low Frequency Effect)の6chのPCMデータを次式(1)により前方グループに関する2ch「1」、「2」と他のグループに関する4ch「3」〜「6」に分類して変換し、2ch「1」、「2」を第1符号化部2’−1に、また、4ch「3」〜「6」を第2符号化部2’−2に出力する。
「2」=Lf−Rf
「3」=C−(Ls+Rs)/2
「4」=Ls+Rs
「5」=Ls−Rs
「6」=Lfe−a×C
ただし、0≦a≦1 …(1)
符号化部2’を構成する第1及び第2符号化部2’−1、2’−2はそれぞれ、図2に詳しく示すように2ch「1」、「2」と4ch「3」〜「6」のPCMデータを予測符号化し、予測符号化データを図3に示すようなビットストリームで記録媒体5や通信媒体6を介して復号側に伝送する。復号側では復号化部3’を構成する第1及び第2復号化部3’−1、3’−2により、図6に詳しく示すようにそれぞれ前方グループに関する2ch「1」、「2」と他のグループに関する4ch「3」〜「6」の予測符号化データをPCMデータに復号する。
+m14・Ls+m15・Rs+m16・Lfe
R=m21・Lf+m22・Rf+m23・C
+m24・Ls+m25・Rs+m26・Lfe …(2)
図2を参照して符号化部2’−1、2’−2について詳しく説明する。各ch「1」〜「6」のPCMデータは1フレーム毎に1フレームバッファ10に格納される。そして、1フレームの各ch「1」〜「6」のサンプルデータがそれぞれ予測回路13D1、13D2、15D1〜15D4に印加されるとともに、各ch「1」〜「6」の各フレームの先頭サンプルデータがフォーマット化回路19に印加される。予測回路13D1、13D2、15D1〜15D4はそれぞれ、各ch「1」〜「6」のPCMデータに対して、特性が異なる複数の予測器(不図示)により時間領域における過去の信号から現在の信号の複数の線形予測値を算出し、次いで原PCMデータと、この複数の線形予測値から予測器毎の予測残差を算出する。続くバッファ・選択器14D1、14D2、16D1〜16D4はそれぞれ、予測回路13D1、13D2、15D1〜15D4により算出された各予測残差を一時記憶して、選択信号/DTS(デコーディング・タイム・スタンプ)生成器17により指定されたサブフレーム毎に予測残差の最小値を選択する。
また、サブストリームBS0、BS1の1フレーム分は
・フレームヘッダと、
・各ch「1」〜「6」の1フレームの先頭サンプルデータと、
・各ch「1」〜「6」のサブフレーム毎の予測器選択フラグと、
・各ch「1」〜「6」のサブフレーム毎のビット数フラグと、
・各ch「1」〜「6」の予測残差データ列(可変ビット数)と、
・ch「6」の係数a
が多重化されている。このような予測符号化によれば、原信号が例えばサンプリング周波数=96kHz、量子化ビット数=24ビット、6チャネルの場合、71%の圧縮率を実現することができる。
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Product Code/European Article Number-International Standard Recording Code)番号、及びUPC/EAN−I
SRCデータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・8バイトのオーディオデータ情報(ADI)と、
・0〜7バイトのスタッフィングバイトとに、
より構成されている。そして、ADI内に1秒後のアクセスユニットをサーチするための前方アクセスユニット・サーチポインタと、1秒前のアクセスユニットをサーチするための後方アクセスユニット・サーチポインタがともに1バイトで(具体的にはADIの7バイト目に前方アクセスユニット・サーチポインタが、8バイト目に後方アクセスユニット・サーチポインタが)セットされる。
ゼンテーションユニットが出力される。
「1」=Lf+Rf
「2」=Lf−Rf
により変換して予測符号化したが、代わりに式(2)によりマルチチャネルをダウンミクスしてステレオ2chデータ(L、R)を生成し、
次いで次式(1)’
「1」=L+R
「2」=L−R
「3」〜「5」は同じ
「6」=Lfe−C …(1)’
により変換して予測符号化するようにしてもよい(第2の実施形態)。この場合には、復号化側のミクス&マトリクス回路4’はチャネル「1」、「2」を加算することによりチャネルLを、減算することによりチャネルRを生成することができる。
「1」=Lf
「2」=C−(Ls+Rs)/2
「3」=Rf−Lf
「4」=Ls−a×Lfe
「5」=Rs−b×Rf
「6」=Lfe
また、第nの相関回路1−nは以下のように変換する。
「2」=C−Lf
「3」=Rf−Lf
「4」=Ls−Lf
「5」=Rs−Lf
「6」=Lfe−C
また、相関回路1−1〜1−n毎に予測回路15とバッファ・選択器16が設けられ、グループ毎の予測残差の最小値のデータ量に基づいて圧縮率が最も高いグループが相関選択信号生成器17bにより選択される。このとき、フォーマット化回路19はその選択フラグ(相関回路選択フラグ、その相関回路の相関係数a、b)を追加して多重化する。
13D1,13D2,15D1〜15D4 予測回路(バッファ・選択器14
D1,14D2,16D1〜16D4と共に圧縮手段を構成する。)
14D1,14D2,16D1〜16D4 バッファ・選択器
17 選択信号/DTS生成器(タイミング生成手段)
17c PTS生成器(タイミング生成手段)
19 フォーマット化回路(フォーマット化手段)
21 デフォーマット化回路(分離手段)
22 アンパッキング回路
22a 入力バッファ
24D1,24D2,23D1〜23D4 予測回路(伸長手段)
100 制御部(読み出し手段)
110 出力バッファ
Claims (2)
- 複数のチャネルの音声信号をそのままのチャネル又は互いに相関をとったチャネル毎に入力される音声信号に応答して、先頭サンプル値を得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を選択して圧縮するステップと、
前記圧縮されたデータの量に応じて、復号側の入力バッファ内の圧縮データを読み出して伸長するタイミングを示すデコーディング・タイム・スタンプ情報を生成すると共に、復号側において前記伸長されるデータが一旦蓄積されて出力する際のタイミングを示すプレゼンテーション・タイム・スタンプ情報を生成するステップと、
前記デコーディング・タイム・スタンプ情報及び前記プレゼンテーション・タイム・スタンプ情報を含むパケットヘッダと、前記圧縮するステップにより選択されたチャネル毎の線形予測方法と予測残差と所定のサンプル値を含む圧縮データを格納するサブパケットであってビットストリーム(サブストリーム)及び前記ビットストリームの前に設けられるビットストリームヘッダを含むサブパケットと、を含むユーザデータを有するパケットにフォーマット化するステップと、
からなる音声符号化方法。 - 請求項1記載の音声符号化方法により符号化されたデータから元の前記複数のチャネルの音声信号を復号する音声復号方法であって、
前記格納されたサブパケットを前記デコーディング・タイム・スタンプ情報に基づいてデコードしてサブパケットを分離するステップと、
前記分離されたサブパケット内の圧縮データから予測値をチャネル毎に算出するステップと、
前記算出された予測値から元の前記複数のチャネルの音声信号を復元して音声データとするステップと、
前記復元された音声データを前記プレゼンテーション・タイム・スタンプ情報に基づいて取り出すステップと、
からなる音声復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005052785A JP4164831B2 (ja) | 2005-02-28 | 2005-02-28 | 音声符号化方法及び音声復号方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005052785A JP4164831B2 (ja) | 2005-02-28 | 2005-02-28 | 音声符号化方法及び音声復号方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003371813A Division JP3821381B2 (ja) | 2003-10-31 | 2003-10-31 | 音声符号化方法及び音声復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005208666A JP2005208666A (ja) | 2005-08-04 |
JP4164831B2 true JP4164831B2 (ja) | 2008-10-15 |
Family
ID=34909694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005052785A Expired - Fee Related JP4164831B2 (ja) | 2005-02-28 | 2005-02-28 | 音声符号化方法及び音声復号方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4164831B2 (ja) |
-
2005
- 2005-02-28 JP JP2005052785A patent/JP4164831B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005208666A (ja) | 2005-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4305867B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4164833B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4305868B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4200499B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP4200500B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP3606455B2 (ja) | 音声信号伝送方法及び音声復号方法 | |
JP3821384B2 (ja) | 光記録媒体及び音声復号装置 | |
JP4164831B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP3821385B2 (ja) | 光記録媒体及び音声復号装置 | |
JP4196354B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4200991B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4196353B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4305869B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4164832B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4164830B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4200501B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP4305866B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4193826B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP4193827B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP4193828B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP4164834B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP4305870B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP4200990B2 (ja) | 音声符号化方法及び音声復号装置 | |
JP4552209B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4552210B2 (ja) | 音声符号化方法及び音声復号方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080704 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080717 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110808 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120808 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120808 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120808 Year of fee payment: 4 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120808 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130808 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |