JP2001324999A - 音声信号伝送方法 - Google Patents
音声信号伝送方法Info
- Publication number
- JP2001324999A JP2001324999A JP2001078123A JP2001078123A JP2001324999A JP 2001324999 A JP2001324999 A JP 2001324999A JP 2001078123 A JP2001078123 A JP 2001078123A JP 2001078123 A JP2001078123 A JP 2001078123A JP 2001324999 A JP2001324999 A JP 2001324999A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- channels
- linear prediction
- prediction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
る。 【解決手段】 5チャネル相関回路1は5チャネル信号
(L、C、R、SL、SR)を相関のある5チャネル信
号L、D1〜D4に変換し、予測回路15L、15D1
〜15D4は5チャネル信号L、D1〜D4毎に複数の
予測値を算出してこの複数の予測値の各予測残差を算出
し、バッファ・選択器16L、16D1〜16D4はこ
の複数の予測残差の最小値を選択し、選択された予測残
差等を含む予測符号化データを所定のフォーマットで多
重化し、通信回線を介して伝送する。
Description
号化して圧縮した音声信号の伝送方法に関する。
本発明者は先の出願(特願平9−289159号)にお
いて1チャネル(チャンネル)の原デジタル音声信号に
対して、特性が異なる複数の予測器により時間領域にお
ける過去の信号から現在の信号の複数の線形予測値を算
出し、原デジタル音声信号とこの複数の線形予測値から
予測器毎の予測残差を算出し、予測残差の最小値を選択
する方法を提案している。
法では原デジタル音声信号がサンプリング周波数=96
kHz、量子化ビット数=20ビット程度の場合にある
程度の圧縮効果を得ることができるが、近年のDVDオ
ーディオディスクではこの2倍のサンプリング周波数
(=192kHz)が使用され、また、量子化ビット数
も24ビットが使用される傾向があるので、圧縮率を改
善する必要がある。
る場合に圧縮率を改善した音声信号の伝送方法を提供す
ることを目的とする。
するために、以下の手段よりなる。すなわち、
ウンドレフト及びサラウンドライトの5チャネルを含む
第1の複数チャネルのデジタル音声信号を所定のマトリ
クス演算により互いに同一のサンプリング周波数を有し
て相関性のある第2の複数チャネルの音声信号に変換す
るステップと、前記第2の複数チャネルの音声信号をチ
ャネル毎に、入力される音声信号に応答して、先頭サン
プル値を得ると共に、特性が異なる複数の線形予測方法
により時間領域の過去から現在の信号の線形予測値がそ
れぞれ予測され、その予測される線形予測値と前記音声
信号とから得られる予測残差が最小となるような線形予
測方法を選択するステップと、前記選択された先頭サン
プル値と予測残差と線形予測方法とを含む予測符号化デ
ータを所定のフォーマットで多重化するステップと、か
らなる音声符号化方法により符号化された音声信号を伝
送する音声信号伝送方法であって、前記選択された先頭
サンプル値と予測残差と線形予測方法とを含む予測符号
化データをパケット化して通信回線を介して伝送するこ
とを特徴とする音声信号伝送方法。
施の形態を説明する。図1は本発明を適用した音声符号
化装置とそれに対応する音声復号装置の第1の実施形態
を示すブロック図、図2は図1の符号化部を詳しく示す
ブロック図、図3は図1の復号化部を詳しく示すブロッ
ク図、図4はDVDのパックのフォーマットを示す説明
図、図5はDVDのオーディオパックのフォーマットを
示す説明図、図6、図7は音声伝送方法を示すフローチ
ャートである。
4つの方式が知られている。 (1)ドルビーサラウンド方式 前方L、C、Rの3チャネル+後方Sの1チャネルの合
計4チャネル (2)ドルビーAC−3方式 前方L、C、R、SWの4チャネル+後方SL、SRの
2チャネルの合計6チャネル (3)DTS(Digital Theater System)方式 ドルビーAC−3方式と同様に6チャネル(L、C、
R、SW、SL、SR) (4)SDDS(Sony Dynamic Digital Sound)方式 前方L、LC、C、RC、R、SWの6チャネル+後方
SL、SRの2チャネルの合計8チャネル
関回路1は、マルチチャネル信号の一例としてレフト
(L)、センタ(C)、ライト(R)、サラウンドレフ
ト(SL)及びサラウンドライト(SR)の5chのPC
Mデータを、Lchを基準として次の5ch(L)、(D
1)〜(D4)に変換して図2に詳しく示す符号化部2
に出力する。 L =L(基準チャネル) D1=C−(L+R)/2 D2=R−L D3=SL−a×L D4=SR−b×R ただし、0≦a,b≦1
(L)、(D1)〜(D4)のPCMデータを予測符号
化し、これを記録媒体や通信媒体を介して復号側に伝送
する。復号側では図3に詳しく示す復号化部3により各
ch(L)、(D1)〜(D4)の予測符号化データを復
号し、次いで5チャネル相関回路4により次のように元
の5chを復元する。 R=(R−L)+L C=C−(L+R)/2+L/2+R/2 SL=SL−a×L+a×L SR=SR−b×R+b×R
説明する。各ch(L)、(D1)〜(D4)のPCMデ
ータは1フレーム毎に1フレームバッファ10に格納さ
れる。そして、1フレームの各chのサンプルデータがそ
れぞれ予測回路15L、15D1〜15D4に印加され
るとともに、各chの1フレームの先頭サンプルデータが
フォーマット化回路19に印加される。予測回路15
L、15D1〜15D4はそれぞれ、各ch(L)、(D
1)〜(D4)のPCMデータに対して、特性が異なる
複数の予測器(不図示)により時間領域における過去の
信号から現在の信号の複数の線形予測値を算出し、原P
CMデータとこの複数の線形予測値から予測器毎の予測
残差を算出する。続くバッファ・選択器16L、16D
1〜16D4はそれぞれ、予測回路15L、15D1〜
15D4により算出された各予測残差を一時記憶して、
選択信号生成器17により指定されたサブフレーム毎に
予測残差の最小値を選択する。
フラグをパッキング回路18とフォーマット化回路19
に対して印加し、また、予測残差が最小の予測器を示す
予測器選択フラグをフォーマット化回路19に対して印
加する。パッキング回路18はバッファ・選択器16
L、16D1〜16D4により選択された5ch分の予測
誤差を、選択信号生成器17により指定されたビット数
フラグに基づいて指定ビット数でパッキングする。
分に対して ・フレームヘッダと、 ・各ch(L)、(D1)〜(D4)の1フレームの先頭
サンプル値と、 ・各ch(L)、(D1)〜(D4)のサブフレーム毎の
予測器選択フラグと、 ・各ch(L)、(D1)〜(D4)のサブフレーム毎の
ビット数フラグと、 ・各ch(L)、(D1)〜(D4)の予測残差データ列
(可変ビット数)とを、 多重化し、可変レートビットストリームとして出力す
る。このような予測符号化によれば、原信号が例えばサ
ンプリング周波数=96kHz、量子化ビット数=24
ビット、5チャネルの場合、71%の圧縮率を実現する
ことができる。
明する。上記フォーマットの可変レートビットストリー
ムデータは、デフォーマット化回路21によりフレーム
ヘッダに基づいて分離される。そして、各ch(L)、
(D1)〜(D4)の1フレームの先頭サンプルデータ
と予測器選択フラグはそれぞれ予測回路23L、23D
1〜23D4に印加され、各ch(L)、(D1)〜
(D4)のビット数フラグと予測残差データ列はアンパ
ッキング回路22に印加される。ここで、予測回路23
L、23D1〜23D4内の複数の予測器(不図示)は
それぞれ、符号化側の予測回路15L、15D1〜15
D4内の複数の予測器と同一の特性であり、予測器選択
フラグにより同一特性のものが選択される。
(D1)〜(D4)の予測残差データ列をビット数フラ
グ毎に基づいて分離してそれぞれ予測回路23L、23
D1〜23D4に出力する。予測回路23L、23D1
〜23D4ではそれぞれ、アンパッキング回路22から
の各ch(L)、(D1)〜(D4)の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各1つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで1フレー
ムの先頭サンプル値を基準として各サンプル値のPCM
データが算出される。
符号化された可変レートビットストリームデータを、記
録媒体の一例としてDVDオーディオディスクに記録す
る場合には、図4に示す圧縮PCMのオーディオ(A)
パックにパッキングされる。このパックは2034バイ
トのユーザデータ(Aパケット、Vパケット)に対して
4バイトのパックスタート情報と、6バイトのSCR
(System Clock Reference:システム時刻基準参照値)
情報と、3バイトのMux レート(rate)情報と1バイト
のスタッフィングの合計14バイトのパックヘッダが付
加されて構成されている(1パック=合計2048バイ
ト)。この場合、タイムスタンプであるSCR情報を、
ACBユニット内の先頭パックでは「1」として同一タ
イトル内で連続とすることにより同一タイトル内のAパ
ックの時間を管理することができる。
すように、17、9又は14バイトのパケットヘッダ
と、圧縮PCMのプライベートヘッダと、図3に示すフ
ォーマットの1ないし2011バイトのオーディオ圧縮
PCMデータにより構成されている。圧縮PCMのプラ
イベートヘッダは、 ・1バイトのサブストリームIDと、 ・2バイトのUPC/EAN−ISRC(Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code)番号、及びUPC/EAN−
ISRCデータと、 ・1バイトのプライベートヘッダ長と、 ・2バイトの第1アクセスユニットポインタと、 ・8バイトのオーディオデータ情報(ADI)と ・0〜7バイトのスタッフィングバイトとに、より構成
されている。
号化された可変レートビットストリームデータをネット
ワークを介して伝送する場合には、符号化側では図6に
示すように伝送用にパケット化し(ステップS41)、
次いでパケットヘッダを付与し(ステップS42)、次
いでこのパケットをネットワーク上に送り出す(ステッ
プS43)。復号側では図7に示すようにヘッダを除去
し(ステップS51)、次いでデータを復元し(ステッ
プS52)、次いでこのデータをメモリに格納して復号
を待つ(ステップS53)。
について説明する。上記の実施形態では、1種類の相関
性の信号(L)、(D1)〜(D4)を予測符号化する
ように構成されているが、この第2の実施形態では複数
種類の相関性の信号の1種類を選択的に予測符号化する
ように構成されている。このため図8に示す符号化部で
は、第1〜第nの相関回路1−1〜1−nが設けられ、
このn個の相関回路1−1〜1−nは例えば5ch(L、
C、R、SL、SR)のPCMデータを相関性が異なる
n種類の5ch信号に変換する。第nの相関回路1−nは
例えば以下のように変換する。 L =L(基準チャネル) D1=C−L D2=R−L D3=SL−L D4=SR−R
路15L、15D1〜15D4とバッファ・選択器16
L、16D1〜16D4が設けられ、グループ毎の予測
誤差の最小値のデータ量に基づいて圧縮率が最も高いグ
ループが相関選択信号生成器17bにより選択される。
このとき、その選択フラグ(相関回路選択フラグ、その
相関回路の相関係数a、b)を追加して多重化する。
の相関回路1−1〜1−nに対してn個の相関回路4−
1〜4−n(又は係数a、bが変更可能な1つの相関回
路4)が設けられる。なお、図8に示すnグループの予
測回路が同一の構成である場合、復号装置では図9に示
すようにnグループ分の予測回路を設ける必要はなく、
1つのグループ分の予測回路でよい。そして、符号化装
置から伝送された選択フラグに基づいて相関回路4−1
〜4−nの1つを選択、又は係数a、bを設定して元の
5ch(L、C、R、SL、SR)を復元する。
の相関性の信号L、D1〜D4を予測符号化するように
構成されているが、この信号L、D1〜D4のグループ
と原信号L、C、R、SL及びSRのグループを予測符
号化し、圧縮率が高い方のグループを選択するようにし
てもよい。
数チャネルの音声信号を相関性のある第2の複数チャネ
ルの音声信号に変換して予測符号化するようにしたの
で、音声信号を予測符号化する場合に圧縮率を改善し、
その改善した音声信号を伝送することができる。
する音声復号装置の第1の実施形態を示すブロック図で
ある。
る。
る。
ある。
す説明図である。
ク図である。
である。
(相関手段) 15L、15D1〜15D4 予測回路(バッファ・選
択器16L、16D1〜16D4と共に予測符号化手段
を構成する。) 16L、16D1〜16D4 バッファ・選択器
Claims (1)
- 【請求項1】少なくともレフト、センタ、ライト、サラ
ウンドレフト及びサラウンドライトの5チャネルを含む
第1の複数チャネルのデジタル音声信号を所定のマトリ
クス演算により互いに同一のサンプリング周波数を有し
て相関性のある第2の複数チャネルの音声信号に変換す
るステップと、 前記第2の複数チャネルの音声信号をチャネル毎に、入
力される音声信号に応答して、先頭サンプル値を得ると
共に、特性が異なる複数の線形予測方法により時間領域
の過去から現在の信号の線形予測値がそれぞれ予測さ
れ、その予測される線形予測値と前記音声信号とから得
られる予測残差が最小となるような線形予測方法を選択
するステップと、 前記選択された先頭サンプル値と予測残差と線形予測方
法とを含む予測符号化データを所定のフォーマットで多
重化するステップと、からなる音声符号化方法により符
号化された音声信号を伝送する音声信号伝送方法であっ
て、 前記選択された先頭サンプル値と予測残差と線形予測方
法とを含む予測符号化データをパケット化して通信回線
を介して伝送することを特徴とする音声信号伝送方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001078123A JP3606454B2 (ja) | 2001-03-19 | 2001-03-19 | 音声信号伝送方法及び音声復号方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001078123A JP3606454B2 (ja) | 2001-03-19 | 2001-03-19 | 音声信号伝送方法及び音声復号方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10306322A Division JP2000122697A (ja) | 1998-10-13 | 1998-10-13 | 音声符号化装置、光記録媒体及び音声復号装置並びに音声伝送方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004242809A Division JP4164824B2 (ja) | 2004-08-23 | 2004-08-23 | 音声信号伝送方法及び音声復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001324999A true JP2001324999A (ja) | 2001-11-22 |
JP3606454B2 JP3606454B2 (ja) | 2005-01-05 |
Family
ID=18934778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001078123A Expired - Lifetime JP3606454B2 (ja) | 2001-03-19 | 2001-03-19 | 音声信号伝送方法及び音声復号方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3606454B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100745688B1 (ko) | 2004-07-09 | 2007-08-03 | 한국전자통신연구원 | 다채널 오디오 신호 부호화/복호화 방법 및 장치 |
-
2001
- 2001-03-19 JP JP2001078123A patent/JP3606454B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100745688B1 (ko) | 2004-07-09 | 2007-08-03 | 한국전자통신연구원 | 다채널 오디오 신호 부호화/복호화 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP3606454B2 (ja) | 2005-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4831120B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP3387089B2 (ja) | 音声符号化装置 | |
JP3606454B2 (ja) | 音声信号伝送方法及び音声復号方法 | |
JP3354136B2 (ja) | 音声符号化方法、音声信号受信方法及び音声復号方法 | |
JP3387090B2 (ja) | 音声符号化方法 | |
JP4164824B2 (ja) | 音声信号伝送方法及び音声復号方法 | |
JP3387091B2 (ja) | 光記録媒体、音声伝送方法及び音声復号方法 | |
JP3387096B2 (ja) | 音声符号化装置 | |
JP4244223B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP2000122697A (ja) | 音声符号化装置、光記録媒体及び音声復号装置並びに音声伝送方法 | |
JP3606453B2 (ja) | 音声信号伝送方法及び音声復号方法 | |
JP3356166B2 (ja) | 音声符号化方法 | |
JP3606457B2 (ja) | 音声信号伝送方法及び音声復号方法 | |
JP4164825B2 (ja) | 音声信号伝送方法及び音声復号方法 | |
JP2000214887A (ja) | 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体 | |
JP4244225B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4244222B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4151033B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4148259B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP4244224B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP2004326136A (ja) | 音声信号伝送方法及び音声復号方法 | |
JP2001188565A (ja) | 光記録媒体、音声信号伝送方法及び音声復号方法 | |
JP2001188572A (ja) | 音声符号化装置 | |
JP2004139099A (ja) | 光記録媒体及び音声復号装置 | |
JP2004139100A (ja) | 光記録媒体及び音声復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20040622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040930 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071015 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081015 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091015 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101015 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101015 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111015 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121015 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121015 Year of fee payment: 8 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121015 Year of fee payment: 8 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131015 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |