JPH08204574A - 適応的符号化システム - Google Patents

適応的符号化システム

Info

Publication number
JPH08204574A
JPH08204574A JP7028806A JP2880695A JPH08204574A JP H08204574 A JPH08204574 A JP H08204574A JP 7028806 A JP7028806 A JP 7028806A JP 2880695 A JP2880695 A JP 2880695A JP H08204574 A JPH08204574 A JP H08204574A
Authority
JP
Japan
Prior art keywords
channel
bit allocation
bit
channels
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7028806A
Other languages
English (en)
Other versions
JP3297240B2 (ja
Inventor
Jong-Il Kim
鐘一 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiu Denshi Kk
WiniaDaewoo Co Ltd
Original Assignee
Daiu Denshi Kk
Daewoo Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to EP95100207A priority Critical patent/EP0721257B1/en
Application filed by Daiu Denshi Kk, Daewoo Electronics Co Ltd filed Critical Daiu Denshi Kk
Priority to JP02880695A priority patent/JP3297240B2/ja
Priority to US08/393,294 priority patent/US5627937A/en
Publication of JPH08204574A publication Critical patent/JPH08204574A/ja
Application granted granted Critical
Publication of JP3297240B2 publication Critical patent/JP3297240B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 入力ディジタルオーディオ信号を適応的に
符号化して、符号化効率と音質を向上させる新規なシス
テムを提供すること。 【構成】 N個のサブバンドフィルタ11、12と、
第1パラメータを測定する第1認知パラメータ測定デバ
イス20と、各フレームの認知情報量を測定して、平均
及び標準偏差パラメータを算出し、F個のフレームを含
むチャンネル内フレームグループを発生する第2認知パ
ラメータ測定デバイス30と、各チャンネル内フレーム
グループへのビットを適応的に特定し、ビット割当情報
を発生する第1ビット割当ユニット40と、各サブバン
ドへのビットを特定し、ビット割当情報を発生する第2
ビット割当ユニット50と、サブバンドオーディオ信号
を量子化するN個の量子化器71、72と、量子化済み
のオーディオ信号と共に、ビット割当情報をフォーマッ
トするフォーマッティング回路80とを含む。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタルオーディオ
符号化システムに関するものであって、特に、人間の聴
覚特性に符合する各々の入力ディジタルオーディオ信号
への認知情報量に基づいて、複数のチャンネルからの入
力ディジタルオーディオ信号を適応的に符号化する改良
された符号化システムに関するものである。
【0002】
【従来の技術】コンパクトディスク(CD)及び/また
はディジタルオーディオテープ(DAT)のようなもの
に比肩しうる高音質のオーディオ信号を達成するため
に、ディジタル化されたオーディオ信号を伝送する。オ
ーディオ信号がディジタル形態で表現される場合、特
に、高精細度テレビ(HDTV)の場合、相当な量のデ
ータを伝送する必要がある。しかし、オーディオ信号に
割当てられた利用可能な周波数帯域幅は限定されている
ので、例えば、48kHzにサンプリングされた16ビ
ットパルス符号変調(PCM)オーディオ信号、即ち、
1秒当り768kビットの相当な量のデータを、限定さ
れたオーディオ帯域(約128kHz)を通して伝送す
るためには、データを圧縮するのことが必須である。
【0003】多様なオーディオ圧縮デバイスまたは技法
の中で、HDTV応用のための心理音響アルゴリズム
(Psychoacoustic algorith
m)を用いる、いわゆるMPEGオーディオアルゴリズ
ムが提案されてきた。
【0004】このMPEGオーディオアルゴリズムはサ
ブバンドフィルタリング、心理音響モデリング、量子化
及び符号化、及びフレームフォーマッティングのような
4つの主な要素で形成されている。このサブバンドフィ
ルタリングは、入力PCMディジタルオーディオ信号を
時間領域から周波数領域へ写像するプロセスである。B
個(例えば、32個)のサブバンドを有するフィルタバ
ンク(FilterBank)が用いられる。各々のサ
ブバンドにおいて、12個または36個のサンプルがグ
ループになって処理され、前記B個のサブバンドからの
グループ化されたサンプル、即ち、B×12個またはB
×36個のサンプルが1つのフレームで構成される。こ
の各々のフレームはオーディオ信号を符号化、伝送及び
復号化するための処理単位である。心理音響モデリング
は、各々のサブバンドまたはサブバンドの群に対して、
量子化及び符号化の処理を制御するための1セットのデ
ータ、例えば、信号対マスク比(Signal−to−
Mask Ratio;SMR)のデータを生成する。
その次に、サブバンドサンプルを量子化及び符号化する
プロセスで、そのSMRデータを参照して利用可能なビ
ットを1つのフレームの各々のサブバンドに適応的に割
当てる。フレームフォーマットはフレームデータを他の
必要な附加情報と共に適切な形態でフォーマットして伝
送する。
【0005】しかし、上述のMPEGオーディオ技法
は、各フレームに固定されたビットを割当てるので、そ
のフレームの間に連続的に変形されうる入力ディジタル
オーディオ信号の平均、標準偏差、認知情報量のような
統計的特性を反映できないという問題点を内包してい
る。
【0006】その上に、異なる認知情報量を有する入力
ディジタルオーディオ信号が、かかる従来の技法を用い
る通常のデバイスへ提供される場合に、そのデバイスは
認知情報量とは無関係に、入力ディジタルオーディオ信
号を符号化するので、人間の聴覚特性を悪化させる。
【0007】
【発明が解決しようとする課題】従って、本発明の主な
目的は、各々の入力ディジタルオーディオ信号への認知
情報量に基づいて、複数のチャンネルからの入力ディジ
タルオーディオ信号を適応的に符号化することによっ
て、符号化効率と音質とを向上させる新規なシステムを
提供することである。
【0008】
【課題を達成するための手段】上記目的を達成するため
に、本発明によれば、N個(Nは正の整数)のチャンネ
ルからの入力ディジタルオーディオ信号を適応的に符号
化するものであって、該入力ディジタルオーディオ信号
の各々は複数のフレームを備えており、該各々のフレー
ムは複数のサブバンドを備える適応的符号化システムに
おいて、前記入力ディジタルオーディオ信号をサブバン
ド単位で受信して、フィルタリングする並列に配設され
たN個のサブバンドフィルタリング手段と、前記入力デ
ィジタルオーディオ信号における各サブバンドに対する
信号対マスク比データ、音圧レベル及びマスキング臨界
値を測定する第1測定手段と、前記測定された信号対マ
スク比データ、音圧レベル及びマスキング臨界値に基づ
いて、前記入力ディジタルオーディオ信号の各々に含ま
れた各々のフレームの認知情報量を測定することによっ
て、前記N個の全チャンネルの全体へのN×F個の現フ
レーム及び前フレーム(Fは正の整数)を含む前記測定
された認知情報量に対応するチャンネル間フレームグル
ープに対する平均及び標準偏差パラメータを算出し、前
記N個のチャンネルの各々に対してF個の現フレーム及
び前フレームを含むチャンネル内フレームグループを発
生する第2測定手段と、前記チャンネル内フレームグル
ープの各々に対して測定された認知情報量と前記平均及
び標準偏差パラメータに基づいて、前記チャンネル内フ
レームグループの各々へのビットを適応的に特定すると
共に、前記チャンネル内フレームグループの各々に対し
て特定されたビットに対応するビット割当情報を発生す
る第1ビット割当手段と、前記測定された信号対マスク
比データと前記発生されたビット割当情報に基づいて、
前記チャンネル内フレームグループの各々に含まれた各
々のサブバンドへのビットを特定すると共に、前記サブ
バンドの各々に対して特定されたビットに対応するビッ
ト割当情報を発生する第2ビット割当手段と、前記チャ
ンネル内フレームグループにおける各サブバンドへの発
生されたその対応するビット割当情報に応答して、前記
N個のチャンネルに対してフィルタリング済みのサブバ
ンドオーディオ信号を前記量子化する並列に配設された
N個の量子化手段と、前記量子化済みのオーディオ信号
と共に、前記発生されたビット割当情報をフォーマット
する手段とを含む適応的符号化システムが提供される。
【0009】
【実施例】以下、本発明の適応的符号化システムについ
て、図面を参照しながら詳しく説明する。
【0010】図1には、本発明による符号化システム1
00を概略的に示したブロック図が示されている。
【0011】この符号化システム100は、サブバンド
フィルタリングデバイス10、第1及び第2認知パラメ
ータ測定デバイス20、30、第1、第2及び第3ビッ
ト割当ユニット40、50及び60、量子化デバイス7
0及びフォーマッティング回路80からなる。
【0012】符号化システム100において、N(例え
ば2)個のチャンネル、即ち、第1(またはL)及び第
2(またはR)チャンネルを通じて入力された、i番目
のフレーム(現フレーム)の入力ディジタルオーディオ
信号X1(m,i)及びX2(s,i)は、第1認知パ
ラメータ測定デバイス20及びサブバンドフィルタリン
グデバイス10に供給される。ここで、各々の入力ディ
ジタルオーディオ信号は正の整数であるM個(即ち、m
=0,1,...,M−1)及びS個(即ち、s=0,
1,...,S−1)のサンプルを含む。このサンプル
数M及びSは、前記チャンネルからの入力ディジタルオ
ーディオ信号の各々に対するサンプリング周波数に正比
例する。本明細書で用いられた「フレーム」は、一定の
個数のオーディオサンプルに対応するディジタルオーデ
ィオ信号の一部分を表すと共に、ディジタルオーディオ
信号の符号化及び復号化のための処理単位である。
【0013】図示されたように、サブバンドフィルタリ
ングデバイス10は、現フレームの入力ディジタルオー
ディオ信号を同時に受信するために並列結合された、複
数のサブバンドフィルタ、例えば2個のサブバンドフィ
ルタ11及び12を含む。このデバイス10は当業者に
良く知られているサブバンドフィルタリング技法、例え
ば、ISO/IEC JTCI/SC2/WG 11、
「Part3,Audio Proposal」、CD
−11172−3(1991年)に記述された、いわゆ
るMPEGオーディオアルゴリズムに開示されたような
方法を利用することによって、第1及び第2チャンネル
から該入力ディジタルオーディオ信号に対してフィルタ
リング処理を行う。即ち、各々のサブバンドフィルタ1
1、12は、サンプリング周波数fsを有する入力ディ
ジタルオーディオ信号を、サンプリング周波数fs/B
を有するB個(例えば、32個)の同一の大きさのサブ
バンドに分割するように働き、その分割されたサブバン
ドオーディオサンプルを量子化デバイス70へ供給す
る。
【0014】一方、第1認知パラメータ測定デバイス2
0は、第1及び第2チャンネルからの現フレームの入力
ディジタルオーディオ信号を受信して、各々のサブバン
ドに対する信号対マスク比(SMR)データSMR1、
SMR2と、音圧レベルP1、P2と、マスキング臨界
値M1、M2とを測定する。その各々のサブバンドは例
えば、前記MPEGオーディオアルゴリズムに議論され
た心理音響モデルを用いて第1及び第2チャンネルから
の現フレームに含まれている。第1チャンネルからの各
サブバンドへのSMR1データは、次式のように表され
る。
【0015】 SMR1(j)=P1(j)−M1(j) dB ・・・(1)
【0016】ここで、jは、サブバンドインデックス
(j=0,1,...,B−1)であり、Bは、1つの
フレームにおける全サブバンド数であり、SMR1
(j)は、j番目のサブバンドにおける信号対マスク比
であり、P1(j)は、高速フーリエ変換(FFT)技
法から測定されたj番目のサブバンドにおける音圧レベ
ルであり、M1(j)は、j番目のサブバンドにおける
マスキング臨界値である。
【0017】ただし、SMR1(j)、P1(j)及び
M1(j)の単位は全てデシベル(dB)である。
【0018】同様に、第2チャンネルからの各サブバン
ドへのSMR2データは、次式のように計算される。
【0019】 SMR2(j)=P2(j)−M2(j) dB ・・・(2)
【0020】ここで、jは上記式のものと等しい。
【0021】マスキング臨界値は可聴限界を表すもので
あって、固有の可聴限界または音の臨界値と、オーディ
オ信号の他の音調及び非音調成分の存在によって生じた
増分との和を表す。その次に、第1及び第2チャンネル
の信号対マスク比データSMR1(j)、SMR2
(j)は、第3ビット割当ユニット60へ供給され、第
1及び第2チャンネルの音圧レベルP1(j)、P2
(j)及びマスキング臨界値M1(j)、M2(j)
は、認知情報量測定器32と平均及び標準偏差測定器3
4からなる第2認知情報量測定デバイス30へ供給され
る。
【0022】この認知情報量測定器32は、第1認知パ
ラメータ測定デバイス20からの音圧レベルP1
(j)、P2(j)とマスキング臨界値M1(j)、M
2(j)に基づいて、第1及び第2チャンネルのi番目
のフレーム(または、現フレーム)に対する認知情報量
PE1(i)、PE2(i)を測定するように働く。前
記第1チャンネルのi番目のフレームに対する認知情報
量PE1(i)は、当業者には良く知られているよう
に、次式のように表される。
【0023】
【数1】
【0024】ここで、i,j及びBは上述した式のもの
と等しい。
【0025】同様に、第2チャンネルのi番目のフレー
ムに対する認知情報量PE2(i)は、当業者には良く
知られているように、次式のように表される。
【0026】
【数2】
【0027】ここで、i、j及びBは上述した式のもの
と等しい。
【0028】上記式(3)及び式(4)は、いわゆるひ
ずみ率理論(Rate Distortion The
ory)を適用することによって得られ、人間の聴覚特
性に基づいた認知情報量に一致する。次に、認知情報量
測定器32で測定された、第1及び第2チャンネルのi
番目のフレームに対する認知情報量は、第2ビット割当
ユニット50と平均及び標準偏差測定器34へ送られ
る。
【0029】この平均及び標準偏差測定器34は、認知
情報量測定器32から供給された第1及び第2チャンネ
ルのQ個(例えば、4個)の現フレーム及びその前フレ
ームに対して測定された認知情報量(即ち、PE1(i
−1),PE1(i)及び、PE2(i−1)及びPE
2(i))をグループ化させるように働く。その結果、
図2を参照して、以下で詳細に説明される第1ビット割
当ユニット40の処理によって、その第1及び第2チャ
ンネルの間にビットを適応的に割当られるようにし、ま
た、第1及び第2チャンネルに対する4つの現フレーム
及び前フレームを含むチャンネル間のフレームグループ
に対して測定された全認知情報量を用いて、それらの統
計的特性を表す平均及び標準偏差パラメータを測定す
る。チャンネル間のフレームグループの全認知情報量に
対する平均パラメータPEmは、当業者には良く知られ
ているように、次式のように表される。
【0030】
【数3】
【0031】ここで、Pは、チャンネル間のフレームグ
ループで用いられたフレームインデックス(p=0,
1,...,Q−1)であり、Qは、チャンネル間のフ
レームグループの全フレーム数であり、PE(p)は、
チャンネル間のフレームグループにおけるp番目のフレ
ームの認知情報量である。
【0032】従って、チャンネル間のフレームグループ
の全認知情報量に対する標準偏差パラメータPEstd
は、当業者には良く知られているように、次式のように
得られる。
【0033】
【数4】
【0034】ここで、p及びQは上述した式のものと等
しい。
【0035】本発明の好ましい実施例において、平均及
び標準偏差測定器34は前記第1及び第2チャンネルの
各々に対するF個(例えば、2個)の現フレーム及びそ
の前フレームに対して測定された認知情報量(即ち、P
E1(i)及びPE1(i−1)と、PE2(i)及び
PE2(i−1))を各々グループ化して、その認知情
報量によって第1及び第2チャンネルの各々にまたその
チャンネルの各々に含まれた各々のフレームに対してビ
ットを適応的に割当てると共に、また第1及び第2チャ
ンネルの2つのチャンネル内フレームグループに対する
認知情報量PE(1)及びPE(2)を生成する。次
に、平均及び標準偏差測定器34で生成させて、かつ測
定された第1及び第2チャンネルへの認知情報量PE
(1)、PE(2)及び平均及び標準偏差パラメータP
Em、PEstdは、第1ビット割当ユニット40へ伝達
される。
【0036】この第1ビット割当ユニット40は、前記
平均及び標準偏差測定器34からの認知情報量PE
(1)、PE(2)と平均及び標準偏差パラメータPE
m及びPEstdに基づいて、第1及び第2チャンネルの
2つのチャンネル内フレームグループへのビットを特定
すると共に、その2つのチャンネル内フレームグループ
に対して特定されたビットに対応するビット割当情報C
BI1、CBI2を第2ビット割当ユニット50及びフ
ォーマッティング回路80へ供給する。図2には、図1
に示された第1ビット割当ユニット40の詳細ブロック
が示されている。第1ビット割当ユニット40は、決定
レベル測定器41と、乗算器42と、減算器43と、分
周器44と、ビット割当デバイス45とからなる。この
決定レベル測定器41は、ビット割当デバイス45が第
1及び第2チャンネルの2つのチャンネル内フレームグ
ループに対してビットを割当てるために、図1に示され
た平均及び標準偏差測定器34からの平均及び標準偏差
パラメータPEm及びPEstdに基づいて、前記チャン
ネル間のフレームグループの最適の決定レベルを測定す
るように働く。本発明の好ましい実施例において、チャ
ンネル間のフレームグループのk番目の決定レベルD
(k)は、次式のように得られる。
【0037】 D(k)=NF・PEstd・k ・・・(7)
【0038】ここで、kは、決定レベルインデックス
(k=−q〜q)であり、q、正の整数であり、NF
は、チャンネル間のフレームグループにおける正規化フ
ァクタである。
【0039】上記式(7)からわかるように、チャンネ
ル間のフレームのk番目の決定レベルD(k)と(k−
1)番目の決定レベルD(k−1)との間のレベル間隔
は、平均及び標準偏差測定器34からの標準偏差パラメ
ータPEstdとそのチャンネル間のフレームグループの
正規化ファクタNFとに依存する。一方、決定レベルの
全数(即ち、2q+1)は予め定められている。この決
定レベルの全数は符号化装置の要求される符号化効率と
音質とに基づいて特定される。決定レベル測定器41で
用いられたチャンネル間フレームグループの正規化ファ
クターNFは、実際の人間の聴覚特性と非常に符合する
チャンネル間フレームグループの最適の決定レベルを算
出すために、平均及び標準偏差測定器34からの平均及
び標準偏差パラメータPEm、PEstdと、そのメモリ
(図示せず)に予め記憶されたグローバル平均PEgmと
グローバル標準偏差パラメータの平均PEgstdとを用い
ることによって、特定されることが好ましい。このグロ
ーバル平均とグローバル標準偏差の平均パラメータの各
々は、予め定められた期間の間に測定された平均及び標
準偏差パラメータを用いることによって容易に測定され
る。本発明において、このチャンネル間フレームグルー
プの正規化ファクターNFは次式のように得られる。
【0040】 NF=(PEgstd/PEgm)・(PEm/PEstd) ・・・(8)
【0041】上記式(7)及び(8)から分かるよう
に、チャンネル間のフレームグループの決定レベルは、
平均パラメータの整数倍として特定されたことに注目す
べきである。決定レベル測定器41で測定されて、かつ
予め定められた決定レベル及びその決定レベルの全数は
ビット割当デバイス45へ供給される。
【0042】一方、乗算器42は、図1に示された平均
及び標準偏差測定器34から供給された平均パラメータ
PEmと、そのメモリ(図示せず)に記憶された二つの
チャンネル内グループの何れか1つに含まれたフレーム
の全数を表す係数F(例えば、2)とを乗じて、出力パ
ラメータ2・PEmを生成する。その後、図1に示した
平均及び標準偏差測定器34からの2つのチャンネル内
フレームグループへの認知情報量PE(1)、PE
(2)及び乗算器42で生成した出力パラメータ2・P
Emは減算器43へ送られる。この減算器43は認知情
報量PE(1)及びPE(2)の各々を出力パラメータ
2・PEmから各減算して、偏差信号E(1)、E
(2)を生成する。分周器44は減算器43からの偏差
信号E(1)、E(2)を受信して、その信号をチャン
ネル内フレームグループの何れか1つに含まれた予め定
められたフレーム数F(例えば、2)に各々分周して、
CK偏差信号を平均することによって、最適の決定レベ
ルを算出するようにして、また分周済みの偏差信号E
(1)/2及びE(2)/2を生成するように働く。そ
の次に、前記決定レベル測定器41で測定されて、かつ
予め定められた決定レベルD(k)及び決定レベルの全
数(即ち、2q+1)と分周器44からの偏差信号E
(1)/2、E(2)/2は、ビット割当デバイス45
へ同時に供給される。
【0043】このビット割当デバイス45は、決定レベ
ル測定器41からの決定レベル及び決定レベル全数と分
周器44からの偏差信号に基づいて、第1及び第2チャ
ンネルの1つのチャンネル内フレームグループにおける
各フレームに対するビットを特定する。本発明の好まし
い実施例において、各チャンネルへのビット割当FB
は、次式のように決定される。
【0044】 FB(r)=F・FBm+(F・BV/(2q+1))・I ・・・(9)
【0045】ここで、Fは上述した式のものと等しく、
FBmは該フレームの平均ビット(例えば、3072ビ
ット、即ちサンプリング周波数が48kHz、オーディ
オデータが16ビットPCM形態、従って、1チャンネ
ル当り128kビットの伝送率の場合)で、BVは、予
め定められたビット変更値であり、(2q+1)は、予
め定められた決定レベルの全数であり、Iは、r番目の
チャンネルにおけるレベルインデックスであり、rは、
チャンバーインデックスとして正の整数である。
【0046】上記式(9)から分かるように、r番目の
チャンネルに対するビット割当FB(r)は、平均ビッ
トの全数F・FBmとその2番目の項から計算された可
変ビット数を加算することによって特定される。その予
め定められたビット変更値BVは、各チャンネル内で変
更されるビット割当の最小ビットと最大ビットとの間の
ビット変動範囲を表す値として特定されてもよい。ま
た、r番目のチャンネル内のフレームグループに対する
レベルインデックスIは、決定レベル測定器41からの
決定レベルD(k)と分周器44からの偏差信号E
(1)/2及びE(2)/2に基づいて得られる。本発
明の好ましい実施例において、フレームグループにおけ
るr番目のチャンネルに対するレベルインデックスI
は、次の表に示されたように表しうる(ここで、決定レ
ベルの間隔が1.27で、決定レベルインデックスkが
−2〜2と仮定する)。
【0047】
【表1】
【0048】上記表から分かるように、もしr番目のチ
ャンネルのチャンネル内フレームグループに対する偏差
信号E(r)が決定レベル−2.55〜−1.28の間
に存在すれば、レベルインデックスIは−1として選択
でき、また偏差信号が決定レベル−1.27〜1.26
の間に存在すれば、そのレベルインデックスIは0とし
て選択できる。このような方法で、r番目のチャンネル
内フレームグループに対するビット割当FB(r)は上
記式(9)を用いることによって、効果的に特定され
る。
【0049】次に、ビット割当デバイス45で、各々の
チャンネルに対して特定されたビットに対応する、第1
及び第2チャンネルのビット割当情報CBI1、CBI
2と、図1の認知情報量測定器32からの認知情報量P
E(i)、PE(i)とは第2ビット割当ユニット50
へ同時に供給されると共に、各々のチャンネルに対する
ビット割当情報CBI1、CBI2はフォーマッティン
グ回路80へ供給される。
【0050】図1をもう1度参照すれば、第2ビット割
当ユニット50は、第1及び第2チャンネルに対する2
つのチャンネル内フレームグループの各々に含まれた各
々のフレームへのビットを、認知情報量測定器32から
のその対応する認知情報量と、第1ビット割当ユニット
40からのビット割当情報CBI1、CBI2とに基づ
いて特定する。この第2ビット割当ユニット50で、2
つのチャンネル内フレームグループの各々における各フ
レームへのビット割当は、ディジタルオーディオ符号化
装置で用いるものであって、本出願と同一の出願人によ
って係属中の米国特許出願に開示された適応的ディジタ
ルオーディオ符号化装置及びそのビット割当方法(Ad
aptive Digital Audio Enco
dingApparatus and a Bit A
llocation Method Thereof)
のビット割当技法を用いることによって、好ましく特定
される。
【0051】次に、この第2ビット割当ユニット50に
おいて、この第1及び第2チャンネルに対する2つのチ
ャンネル内フレームグループの各々における各フレーム
に対して特定されたビットに対応する、第1及び第2チ
ャンネルのビット割当情報FBI1、FBI2と、図1
に示された第1認知パラメータ測定デバイス20からの
信号対マスク比データSMR1(j)、SMR2(j)
とは第3ビット割当ユニット60へ同時に供給されると
共に、ビット割当情報FBI1、FBI2はフォーマッ
ティング回路80へ供給される。
【0052】第3ビット割当ユニット60は、第1認知
パラメータ測定デバイス20からの信号対マスク比デー
タSMR1、SMR2と、第2ビット割当ユニット50
からの各々のフレームへのビット割当情報FBI1、F
BI2とを受け取って、2つのチャンネル内フレームグ
ループの各々のフレームに含まれた各サブバンドに対す
るビットを特定すると共に、第1及び第2チャンネルの
各サブバンドに対して特定ビットに対応するビット割当
情報SBI1、SBI2を前記量子化デバイス70及び
フォーマッティング回路80へ各々供給する。この第3
ビット割当ユニット60で用いられたプロセス原理は、
第2ビット割当ユニット50から伝送された各フレーム
への利用可能なビットを超過しない範囲内で、1フレー
ムに対する全信号対マスク比の最適化に基づく。次に、
第3ビット割当ユニット60からの第1及び第2チャン
ネルの各々のサブバンドへのビット割当情報SBI1、
SBI2と、サブバンドフィルタ11、12からの分割
済みのサブバンドオーディオサンプルが、複数の量子化
器(例えば、71、72)からなる量子化デバイス70
へ同時に供給される。
【0053】この量子化器71、72の各々は、第3ビ
ット割当ユニット60からのその対応するビット割当情
報に基づいて、そのサブバンドフィルタ11、12から
の対応する分割済みのサブバンドオーディオサンプルを
適応的に量子化して、第1及び第2チャンネルの各々に
対する量子化済みのオーディオ信号をフォーマッティン
グ回路80へ供給すように働く。
【0054】フォーマッティング回路80において、量
子化器71、72の各々からの量子化済みのオーディオ
サンプルと、前記第1、第2及び第3ビット割当ユニッ
ト40、50及び60からのビット割当情報とをフォー
マット化して、かつその伝送のための伝送器(図示せ
ず)へ伝送する。これによって、第1及び第2チャンネ
ルからの入力ディジタルオーディオ信号の符号化効率及
び音質を向上させる。サブバンドフィルタリングデバイ
ス10の原理と機能、第1認知パラメータ測定デバイス
20、第3ビット割当ユニット60、量子化デバイス7
0及びフォーマッティング回路80はMPEGオーディ
オアルゴリズムに議論されたものと基本的に同一であ
る。
【0055】本発明は、特定の実施例について説明して
いるが、本発明の範囲を逸脱することなく、当業者は種
々の改変をなし得るであろう。
【0056】
【発明の効果】従って、本発明のシステムによれば、複
数のチャンネルからの入力ディジタルオーディオ信号を
適応的に符号化することによって、符号化効率と音質を
向上することができる。
【図面の簡単な説明】
【図1】本発明による、複数のチャンネルからの入力デ
ィジタルオーディオ信号を適応的に符号化する新規な装
置を概略的に示す図である。
【図2】図1に示された第1ビット割当ユニットの詳細
なブロック図である。
【符号の説明】
10 サブバンドフィルタリングデバイス 11、12 サブバンドフィルタ 20 第1認知パラメータ測定デバイス 30 第2認知パラメータ測定デバイス 32 認知情報量測定器 34 平均及び標準偏差測定器 40 第1ビット割当ユニット 41 決定レベル測定器 42 乗算器 43 減算器 44 分周器 45 ビット割当デバイス 50 第2ビット割当ユニット 60 第3ビット割当ユニット 70 量子化デバイス 71、72 量子化器 80 フォーマッティング回路

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 N個(Nは正の整数)のチャンネルか
    らの入力ディジタルオーディオ信号を適応的に符号化す
    るものであって、該入力ディジタルオーディオ信号の各
    々は複数のフレームを備えており、該各々のフレームは
    複数のサブバンドを備える適応的符号化システムにおい
    て、 前記入力ディジタルオーディオ信号をサブバンド単位で
    受信してフィルタリングする、並列に配設されたN個の
    サブバンドフィルタリング手段と、 前記入力ディジタルオーディオ信号における各サブバン
    ドに対する信号対マスク比データ、音圧レベル及びマス
    キング臨界値を測定する第1測定手段と、 前記測定された信号対マスク比データ、音圧レベル及び
    マスキング臨界値に基づいて、前記入力ディジタルオー
    ディオ信号の各々に含まれた各々のフレームの認知情報
    量を測定することによって、前記N個の全チャンネルの
    全数へのN×F個の現フレーム及び前フレーム(Fは正
    の整数)を含む前記測定された認知情報量に対応するチ
    ャンネル間フレームグループに対する平均及び標準偏差
    パラメータを算出し、前記N個のチャンネルの各々に対
    してF個の現フレーム及び前フレームを含むチャンネル
    内フレームグループを発生する第2測定手段と、 前記チャンネル内フレームグループの各々に対して測定
    された認知情報量と前記平均及び標準偏差パラメータに
    基づいて、前記チャンネル内フレームグループの各々へ
    のビットを適応的に特定すると共に、前記チャンネル内
    フレームグループの各々に対して特定されたビットに対
    応するビット割当情報を発生する第1ビット割当手段
    と、 前記測定された信号対マスク比データと前記発生された
    ビット割当情報に基づいて、前記チャンネル内フレーム
    グループの各々に含まれた各々のサブバンドへのビット
    を特定するとともに、前記サブバンドの各々に対して特
    定されたビットに対応するビット割当情報を発生する第
    2ビット割当手段と、 前記チャンネル内フレームグループにおける各サブバン
    ドへの発生されたその対応するビット割当情報に応答し
    て、前記N個のチャンネルに対してフィルタリング済み
    のサブバンドオーディオ信号を量子化する並列に配設さ
    れた、N個の量子化手段と、 前記量子化済みのオーディオ信号と共に、前記発生され
    たビット割当情報とをフォーマットするフォーマッティ
    ング手段とを有することを特徴とする適応的符号化シス
    テム。
  2. 【請求項2】 前記第1ビット割当手段が、 前記測定された認知情報量と平均及び標準偏差パラメー
    タに基づいて、前記チャンネル間フレームグループの決
    定レベルを測定する手段と、 前記平均パラメータを前記チャンネル内フレームグルー
    プの各々に含まれたフレーム数を表す予め定められたフ
    ァクターに乗算して、平均関数を発生する手段と、 前記チャンネル内フレームグループへの各々の認知情報
    量と前記発生された平均関数との間に偏差を表す偏差信
    号を発生すると共に、その発生された偏差信号を前記予
    め定められたファクターに分周し、平均偏差信号を発生
    する手段と、 前記測定された決定レベル、決定レベルの全数及び発生
    された偏差信号の各々に基づいて、前記チャンネル内の
    フレームグループの各々へのビットを適応的に特定する
    とともに、前記チャンネル内のフレームグループの各々
    への特定されたビットに対応するビット割当情報を発生
    するビット割当手段とを有することを特徴とする請求項
    1に記載の適応的符号化システム。
  3. 【請求項3】 前記チャンネル間フレームグループの
    各決定レベルDが、次式のように決定され、 D=NF・PEstd・k ここで、k;決定レベルインデックス(k=−q〜q) q;正の整数 NF;前記チャンネル間フレームグループにおける正規
    化ファクター PEstd;前記チャンネル間フレームグループの標準偏
    差パラメータ であることを特徴とする請求項2に記載の適応的符号化
    システム。
  4. 【請求項4】 前記N個のチャンネルにおいて、r番
    目のチャンネルに対するビット割当FB(r)は、下記
    式のように得られ、 FB(r)=F・FBm+(F・BV/(2q+1))・I ここで、r;チャンネルインデックスとして用いられた
    正の整数 FBm;一つのフレームに対する平均ビットの関数 F;前記チャンネル内のフレームグループの各々に含ま
    れたフレームの数を表すファクター BV;予め定められたビット変更値 2q+1;予め定められた決定レベルの全数 I;前記r番目のチャンネルにおけるレベルインデック
    ス であることを特徴とする請求項2に記載の適応的符号化
    システム。
JP02880695A 1995-01-09 1995-01-25 適応的符号化システム Expired - Lifetime JP3297240B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP95100207A EP0721257B1 (en) 1995-01-09 1995-01-09 Bit allocation for multichannel audio coder based on perceptual entropy
JP02880695A JP3297240B2 (ja) 1995-01-09 1995-01-25 適応的符号化システム
US08/393,294 US5627937A (en) 1995-01-09 1995-02-23 Apparatus for adaptively encoding input digital audio signals from a plurality of channels

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP95100207A EP0721257B1 (en) 1995-01-09 1995-01-09 Bit allocation for multichannel audio coder based on perceptual entropy
JP02880695A JP3297240B2 (ja) 1995-01-09 1995-01-25 適応的符号化システム
US08/393,294 US5627937A (en) 1995-01-09 1995-02-23 Apparatus for adaptively encoding input digital audio signals from a plurality of channels

Publications (2)

Publication Number Publication Date
JPH08204574A true JPH08204574A (ja) 1996-08-09
JP3297240B2 JP3297240B2 (ja) 2002-07-02

Family

ID=27236479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02880695A Expired - Lifetime JP3297240B2 (ja) 1995-01-09 1995-01-25 適応的符号化システム

Country Status (3)

Country Link
US (1) US5627937A (ja)
EP (1) EP0721257B1 (ja)
JP (1) JP3297240B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09321628A (ja) * 1996-05-29 1997-12-12 Nec Corp 音声符号化装置
KR100548891B1 (ko) * 1998-06-15 2006-02-02 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
JP2008538619A (ja) * 2005-04-20 2008-10-30 株式会社エヌ・ティ・ティ・ドコモ 非典型的な部分系列に関する部分情報を用いた音声及びオーディオ符号化パラメータの量子化
JP2010156837A (ja) * 2008-12-26 2010-07-15 Fujitsu Ltd オーディオ符号化装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995030286A2 (en) * 1994-05-02 1995-11-09 Philips Electronics N.V. Encoding system and encoding method for encoding a digital signal having at least a first and a second digital signal component
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
KR100472402B1 (ko) * 1996-04-10 2005-07-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수의정보신호의부호화장치및방법
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6005893A (en) * 1997-09-23 1999-12-21 Telefonaktiebolaget Lm Ericsson Reduced complexity bit allocation to subchannels in a multi-carrier, high speed data transmission system
US6134524A (en) * 1997-10-24 2000-10-17 Nortel Networks Corporation Method and apparatus to detect and delimit foreground speech
SE511248C2 (sv) * 1997-12-05 1999-08-30 Ericsson Telefon Ab L M Bitallokering i ett transmissionssytem
US6161088A (en) * 1998-06-26 2000-12-12 Texas Instruments Incorporated Method and system for encoding a digital audio signal
JP3762579B2 (ja) * 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
IL134182A (en) 2000-01-23 2006-08-01 Vls Com Ltd Method and apparatus for visual lossless pre-processing
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
US6753929B1 (en) 2000-06-28 2004-06-22 Vls Com Ltd. Method and system for real time motion picture segmentation and superposition
US6744818B2 (en) * 2000-12-27 2004-06-01 Vls Com Ltd. Method and apparatus for visual perception encoding
US20040131117A1 (en) * 2003-01-07 2004-07-08 Sheraizin Vitaly S. Method and apparatus for improving MPEG picture compression
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
US7903902B2 (en) 2004-07-26 2011-03-08 Sheraizin Semion M Adaptive image improvement
US7639892B2 (en) * 2004-07-26 2009-12-29 Sheraizin Semion M Adaptive image improvement
US7526142B2 (en) * 2005-02-22 2009-04-28 Sheraizin Vitaly S Enhancement of decompressed video

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09321628A (ja) * 1996-05-29 1997-12-12 Nec Corp 音声符号化装置
KR100548891B1 (ko) * 1998-06-15 2006-02-02 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
JP2008538619A (ja) * 2005-04-20 2008-10-30 株式会社エヌ・ティ・ティ・ドコモ 非典型的な部分系列に関する部分情報を用いた音声及びオーディオ符号化パラメータの量子化
JP2010156837A (ja) * 2008-12-26 2010-07-15 Fujitsu Ltd オーディオ符号化装置

Also Published As

Publication number Publication date
EP0721257A1 (en) 1996-07-10
EP0721257B1 (en) 2005-03-30
JP3297240B2 (ja) 2002-07-02
US5627937A (en) 1997-05-06

Similar Documents

Publication Publication Date Title
JP3297240B2 (ja) 適応的符号化システム
US5621856A (en) Digital encoder with dynamic quantization bit allocation
US5613035A (en) Apparatus for adaptively encoding input digital audio signals from a plurality of channels
US5537510A (en) Adaptive digital audio encoding apparatus and a bit allocation method thereof
JP3134455B2 (ja) 高能率符号化装置及び方法
JP3278900B2 (ja) データ符号化装置及び方法
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3186292B2 (ja) 高能率符号化方法及び装置
JP4091994B2 (ja) ディジタルオーディオ符号化方法及び装置
JP3395001B2 (ja) ディジタルオーディオ信号の適応的符号化方法
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
KR0181054B1 (ko) 다수개의 채널들로부터의 입력 디지탈 오디오 신호들을 적응적으로 부호화하는 장치
KR100287861B1 (ko) 디지탈 오디오 스테레오 모드에서의 각 채널 비균등 비트할당 장치 및 방법
KR0181061B1 (ko) 적응 디지탈 오디오 부호화 장치 및 그의 비트 할당방법
KR100340368B1 (ko) 고능률부호화장치,복호화장치및디지털데이터도출방법
JP3134384B2 (ja) 符号化装置及び方法
KR100351772B1 (ko) 디지털부호화장치,디지털기록신호도출장치및디지털신호데이터도출방법
JPH1032494A (ja) ディジタル信号処理方法及び処理装置、ディジタル信号記録方法及び記録装置、記録媒体並びにディジタル信号送信方法及び送信装置
JPH0822298A (ja) 符号化装置および復号化装置
JPH06291670A (ja) ディジタルオーディオ信号の符号化方法
JPH11272294A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
KR20050031227A (ko) 디지털 오디오 부호화 방법 및 장치
KR19990041758A (ko) 디지탈 오디오 부호화장치

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090412

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100412

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110412

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120412

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130412

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140412

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term