JP2908270B2 - 適応的符号化システム - Google Patents

適応的符号化システム

Info

Publication number
JP2908270B2
JP2908270B2 JP7023465A JP2346595A JP2908270B2 JP 2908270 B2 JP2908270 B2 JP 2908270B2 JP 7023465 A JP7023465 A JP 7023465A JP 2346595 A JP2346595 A JP 2346595A JP 2908270 B2 JP2908270 B2 JP 2908270B2
Authority
JP
Japan
Prior art keywords
frame
bit allocation
bit
frame group
digital audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7023465A
Other languages
English (en)
Other versions
JPH0851366A (ja
Inventor
鐘一 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiu Denshi Kk
Original Assignee
Daiu Denshi Kk
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daiu Denshi Kk filed Critical Daiu Denshi Kk
Publication of JPH0851366A publication Critical patent/JPH0851366A/ja
Application granted granted Critical
Publication of JP2908270B2 publication Critical patent/JP2908270B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタルオーディオ
符号化システムに関する。特に、複数のチャンネルから
入力される入力ディジタルオーディオ信号を、人間の聴
覚特性に相応する各入力ディジタルオーディオ信号に対
する認知エントロピー(perceptual entropy)に基づいて
適応的に符号化する改良された符号化システムに関す
る。
【0002】
【従来の技術】ディジタル化されたオーディオ信号を伝
送することによって、コンパクトディスク(CD)及び/ま
たはディジタルオーディオテープ(DAT)に相応する高音
質のオーディオ信号の伝送が可能である。オーディオ信
号をディジタル信号で表すときは、特に高精細度テレビ
(HDTV)の場合、大量のデータを伝送する必要がある。し
かし、オーディオ信号に割り当てられた周波数帯域は限
定されているため、例えば、48KHzでサンプリング
された16ビットパルス符号変調(PCM)オーディオ信
号、即ち、768Kbpsといった大量のデータを限定
されたオーディオ帯域(約128KHz)で伝送するた
めには、データの圧縮が必要である。
【0003】様々なオーディオ信号圧縮装置または技法
の中で、HDTVのため、心理音響アルゴリズム(Psyc
hoacoustic algorithm)を用いた、いわゆるMPEG(M
oving Pictures Expert Group)オーディオアルゴリズム
が提案されてきた。
【0004】このMPEGオーディオアルゴリズムは、
主に、サブバンドフィルタリング、心理音響モデリング
(psychoacoustic modeling)、量子化及び符号化、及び
フレームフォーマッティングの4つの要素からなる。サ
ブバンドフィルタリングは、入力PCMオーディオ信号
を時間領域から周波数領域へ写像するプロセスである。
B個(例えば、32個)のサブバンドを有するフィルタ
バンク(Filterbank)を用いてもよい。各サブバンドで
は12または36サンプルがグループ化されて処理さ
れ、B個のサブバンドのグループ化されたサンプル、即
ち、B×12個またはB×36個のサンプルによって1
フレームが構成される。このフレームがオーディオ信号
の符号化、伝送、及び復号の処理単位となる。心理音響
モデリングは、各サブバンドまたはサブバンドのグルー
プに対して、例えば信号対マスク比(Signal-to-Mask Ra
tio;SMR)のようなデータのセットを生成し、量子化及び
符号化を制御する。次に、サブバンドのサンプルを量子
化する過程で、SMRを参照して、使用可能な(availab
le)ビットがフレームの各サブバンドに適応的に割り当
られる。フレームフォーマットはフレームデータを他の
必要な付加情報と共に、伝送に適した形にフォーマット
する。
【0005】しかし、上述のMPEGオーディオ技法で
は、各フレームに割り当てられるビット数が固定である
ため、入力ディジタルオーディオ信号の平均値、標準偏
差、及び認知エントロピーといった、フレームによって
異なる統計的特性を反映することができない。
【0006】さらに、異なる認知エントロピーを有する
入力ディジタルオーディオ信号がこのような従来技術を
用いた通常の装置に加えられると、入力ディジタルオー
ディオ信号は認知エントロピーと全く関係なく符号化さ
れるため、結果として人による認識がされにくくなる。
【0007】
【発明が解決しようとする課題】従って、本発明の主な
目的は、複数のチャンネルから入力される入力ディジタ
ルオーディオ信号を、各入力ディジタルオーディオ信号
に対する認知エントロピーに基づいて適応的に符号化す
ることによって符号化効率と音質とを向上させる新しい
システムを提供することである。
【0008】
【課題を達成するための手段】上記目的を達成するため
に、本発明によれば、N個(Nは正の整数)のチャンネ
ルから入力される入力ディジタルオーディオ信号を適応
的に符号化するシステムであって、前記入力ディジタル
オーディオ信号の各々が複数のフレームを含み、該フレ
ームの各々が複数のサブバンドを含んでおり、前記入力
ディジタルオーディオ信号を各サブバンド単位で受信し
フィルタリングする、並列に配置されたN個のサブバン
ドフィルタリング手段と、前記入力ディジタルオーディ
オ信号に含まれる各サブバンドに対して信号対マスク
比、音圧レベル、及びマスクしきい値を算定する第1算
定手段と、前記算定された信号対マスク比、音圧レベ
ル、及びマスクしきい値に基づいて、前記入力ディジタ
ルオーディオ信号のそれぞれに含まれるフレームの各々
に対して認知エントロピーを算定し、総数N個の前記チ
ャンネルに対しN×M個(Mは正の整数)の現フレーム
及び前フレームを含むフレームグループに対して、平均
値及び標準偏差を算定する第2算定手段と、前記算定さ
れた信号対マスク比、認知エントロピー、平均値及び標
準偏差に基づいて、前記フレームグループの各サブバン
ドに対して適応的にビットを決定し、前記サブバンドの
各々に対して決定されたビットに対応するビット割当情
報を発生するビット割当手段と、前記フレームグループ
の各サブバンドに対して発生される対応するビット割当
情報に応じて、前記N個のチャンネルに対してフィルタ
リングされたサブバンドオーディオ信号を量子化する並
列に配置されたN個の量子化手段と、前記ビット割当情
報と共に、前記量子化されたディジタルオーディオ信号
をフォーマットする手段とを含むことを特徴とする適応
的符号化システムが提供される。
【0009】
【実施例】以下、本発明の適応的符号化システムについ
て、図面を参照しながら詳しく説明する。
【0010】図1に、本発明による適応的符号化システ
ム100を概略的に示したブロック図を示す。
【0011】適応的符号化システム100はサブバンド
フィルタリングデバイス10、第1及び第2認知パラメ
ータ算定器20,30、第1及び第2ビット割当ユニッ
ト40、50、量子化デバイス60及びフォーマッティ
ング回路70とを含む。
【0012】符号化システム100に於いて、N個のチ
ャネル(この例では、2個、即ち、第1(またはL)チ
ャネル、及び第2(またはR)チャネル)を通して受容
されたi番目のフレーム(すなわち現フレーム)の入力
ディジタルオーディオ信号X1(m,i)及びX2
(s,i)は、前記第1認知パラメータ算定器20及び
前記サブバンドフィルタリングデバイス10に入力され
る。ここで、各入力ディジタルオーディオ信号は、それ
ぞれM個(即ち、m=0,1,...,M−1)及びS
個(即ち、s=0,1,...,S−1)のサンプルを
含む。M及びSは正の整数である。本明細書で使われて
いる“フレーム”は、ある決まった数のオーディオサン
プルに対応するディジタルオーディオ信号の一部を意味
すると共に、ディジタルオーディオ信号の符号化及び復
号に於ける処理単位でもある。
【0013】図示されているように、サブバンドフィル
タリングデバイス10は、複数の現フレームの入力ディ
ジタルオーディオ信号を同時に受信するため、例えば2
つのサブバンドフィルタ11及び12のような並列に結
合された複数のサブバンドフィルタを含み、本技術分野
では公知のサブバンドフィルタリング技法、例えば、IS
O IEC JTCI/SC2/WG 11、“Part3,Audio Proposal”、CD
-11172-3(1991年)に記述された、いわゆるMPEGオ
ーディオアルゴリズムに開示された方法を用いることに
よって、第1チャンネル及び第2チャンネルから入力さ
れる入力ディジタルオーディオ信号のフィルタリングを
する。即ち、各々のサブバンドフィルタ11及び12
は、サンプリング周波数fsの入力ディジタルオーディ
オ信号をサンプリング周波数fs/BのB個(例えば、
32個)の同一の大きさのサブバンドに分ける働きを
し、その分けられたサブバンドオーディオサンプルを量
子化デバイス60へと出力する。
【0014】一方、第1認知パラメータ算定器20は、
第1及び第2チャンネルから現フレームの入力ディジタ
ルオーディオ信号を受信し、現フレームの各サブバンド
に対する信号対マスク比(SMR)データSMR1、S
MR2と、音圧レベルP1、P2と、マスクしきい値M
1、M2とを算定する。これらは、例えば前記MPEG
オーディオアルゴリズムで論議されている心理音響モデ
ルを用いて行われる。第1チャンネルから入力される各
サブバンドのSMR1データは、次の(式1)のように
表される。
【0015】 SMR1(r)=P1(r)−M1(r) dB (式1)
【0016】ここで、
【0017】r:サブバンドインデックス(r=0,
1,...,B−1)、
【0018】B:1フレームのサブバンド数、
【0019】SMR1(r):第1チャンネルのr番目
のサブバンドに於ける信号対マスク比、
【0020】P1(r):高速フーリエ変換(FFT)
法から算定されたr番目のサブバンドに於ける音圧レベ
ル、
【0021】M1(r):r番目のサブバンドに於ける
マスクしきい値である。また、SMR1(r)、P1
(r)及びM1(r)の単位は全てデシベル(dB)で
ある。
【0022】同様に、第2チャンネルから入力される各
サブバンドのSMR2データは、次の(式2)から得ら
れる。
【0023】 SMR2(r)=P2(r)−M2(r) dB (式2)
【0024】ここで、rは(式1)で定義したのと同じ
意味である。
【0025】マスクしきい値は可聴限界を表すものであ
って、固有の可聴限界または音のしきい値と、オーディ
オ信号の他の音調及び非音調成分の存在によって生じる
増分との和である。次に、第1認知パラメータ算定器2
0で算定された第1及び第2チャンネルの信号対マスク
比SMR1(r)、SMR2(r)は第2ビット割当ユ
ニット50へ入力されると共に、第1及び第2チャンネ
ルの音圧レベルP1(r)、P2(r)及びマスクしき
い値M1(r)、M2(r)は第2認知パラメータ算定
器30へ入力される。
【0026】第2認知パラメータ算定器30は、第1認
知パラメータ算定器20から入力される音圧レベルP1
(r)、P2(r)とマスクしきい値M1(r),M2
(r)に基づいて、第1及び第2チャンネルのi番目の
フレーム(または、現フレーム)に対する認知エントロ
ピーPE1(i)、PE2(i)を算定する。また算定
された認知エントロピーに基づき、第1及び第2チャン
ネルの現フレーム及び前フレームを含むフレームグルー
プの統計的特性を表す平均値PEm及び標準偏差PEst
dを計算する。第2認知パラメータ算定器30は、後で
図2を参照しながら詳細に説明する。
【0027】フレームグループに含まれるp番目のフレ
ームの認知エントロピーPE(p)、平均値PEm、及
び標準偏差PEstdは、第2認知パラメータ算定器30
で算定され、第1ビット割当ユニット40へ入力され
る。この第1ビット割当ユニット40は、第2認知パラ
メータ算定器30から入力される認知エントロピー、平
均値、及び標準偏差に基づいて、フレームグループに含
まれる各フレームに対してビットを決定する働きをし、
さらに、第2ビット割当ユニット50及びフォーマッテ
ィング回路70に向けて、第1及び第2チャンネルの各
フレームに対して決定されたビットに対応するビット割
当情報FBI1、FBI2を出力する。第1ビット割当
ユニット40の詳細な説明は、後に図3を参照して詳細
に説明する。
【0028】図2を見ると、図1に示された第2認知パ
ラメータ算定器30の詳細ブロック図が示されている。
この第2認知パラメータ算定器30は認知エントロピー
計算器32と、平均値及び標準偏差計算器34とを含
む。認知エントロピー計算器32は、図1に示された第
1認知パラメータ算定器20から出力された第1及び第
2チャンネルの音圧レベルP1(r)、P2(r)及び
マスクしきい値M1(r)、M2(r)を受信して、第
1及び第2チャンネルのi番目のフレームに対する認知
エントロピーPE1(i)、PE2(i)を計算する。
第1チャンネルのi番目のフレームに対する認知エント
ロピーPE1(i)は、本分野では知られているよう
に、(式3)のように表される。
【0029】
【数1】
【0030】ここで、r、i、及びBは上記にて定義し
たのと同じ意味である。
【0031】同様に、第2チャンネルのi番目のフレー
ムに対する認知エントロピーPE2(i)は、本分野で
は知られているように、(式4)のように表される。
【0032】
【数2】
【0033】ここで、r、i、及びBは上記にて定義し
たのと同じ意味である。
【0034】上記(式3)及び(式4)は、いわゆるひ
ずみ率理論(Rate Distortion Theory)を適用すること
によって得られ、人間の聴覚特性に基づいた認知エント
ロピーに一致する。しかる後、認知エントロピー計算器
32で計算された、第1及び第2チャンネルのi番目の
フレームに対する認知エントロピーは、平均値及び標準
偏差計算器34へ送られる。
【0035】平均値及び標準偏差計算器34は、認知エ
ントロピー計算器32から入力されたQ個(この例で
は、4個)の第1及び第2チャンネルの現フレーム及び
前フレームに対して算定された認知エントロピー(即
ち、PE1(i−1)、PE1(i)及び、PE2(i
−1)及びPE2(i))をグループ化し、第1ビット
割当ユニット40の処理によって、グループ化されたフ
レームの間でビットが適応的に割り当てられるようにし
ている。第1ビット割当ユニット40については、後に
図3を参照して詳細に説明する。また、平均値及び標準
偏差計算機34は、フレームグループの全認知エントロ
ピーを用いて、それらの統計的特性を表す平均値及び標
準偏差を計算する。フレームグループの全認知エントロ
ピーに対する平均値PEmは、本分野では知られている
ように、(式5)のように表される。
【0036】
【数3】
【0037】ここで、
【0038】p:フレームグループで用いられるフレー
ムインデックス(p=0,1,...,Q−1)、
【0039】Q:フレームグループの全フレーム数、
【0040】PE(p):フレームグループに於けるp
番目のフレームの認知エントロピーである。従って、フ
レームグループの全認知エントロピーに対する標準偏差
PEstdは、本分野では知られているように、(式6)
のように得られる。
【0041】
【数4】
【0042】ここで、p及びQは上記で定義したのと同
じ意味である。
【0043】平均値及び標準偏差計算器34に於いてグ
ループ化され計算された平均値PEm、標準偏差PEst
d、及びp番目のフレームの認知エントロピーPE
(p)は、しかる後、図1に示されている第1ビット割
当ユニット40へ入力される。
【0044】図3を参照すると、図1に示されている第
1ビット割当ユニット40の詳細なブロック図が示され
ている。この第1ビット割当ユニット40は、決定レベ
ル算定器(dicision level estimator)42とビット割当
デバイス44とを含む。この決定レベル算定器42は、
図2に示されている平均値及び標準偏差計算器34から
入力される平均値及び標準偏差に基づいて、ビット割当
デバイス44がフレームグループの各フレームに対して
ビットを適応的に割り当てるのに、最も適したフレーム
グループの決定レベルを算定する。本発明の好適実施例
によると、このフレームグループのj番目の決定レベル
D(j)は(式7)のように得られる。
【0045】 D(j)=PEm+j・PEstd ・W 式(7)
【0046】ここで、
【0047】j:決定レベルインデックス(j=−q〜
q)、
【0048】q:正の整数、
【0049】W:フレームグループに於ける重みファク
タである。
【0050】上記(式7)からわかるように、p番目の
フレームのj番目の決定レベルD(j)と(j−1)番
目の決定レベルD(j−1)との間のレベル間隔は、平
均値及び標準偏差計算器34から入力される標準偏差P
Estdと、フレームグループの重みファクタWの両方に
依存するが、決定レベルの全数(即ち、2q+1)は予
め定められている。決定レベル算定器42で用いられた
フレームグループの重みファクタWは、フレームグルー
プの決定レベルが最適になり実際の人間の聴覚特性によ
く合うように、平均値及び標準偏差計算器34から入力
される平均値PEm及び標準偏差PEstdを用いて決定
されることが好ましい。本発明によると、フレームグル
ープの重みファクタWは、表1に示されているように、
フレームグループの統計的特性を表す平均値PEm及び
標準偏差PEstdの両方に基づいて得ることができる。
【0051】
【表1】
【0052】上記の表1から分かるように、PEstdが
予め定められた第1しきい値(例えば、0.0125)
より小さく、PEmが予め定められた第2しきい値(例
えば、0.15)より小さい場合、重みファクタWは0
となり、そうでない場合は、上記の表1を参照して、表
中の重みファクタの内のいずれか一つが選択される。即
ち、このPEstdが相対的に小さくて、PEmが相対的
に大きければ、より大きい値の重みファクタが選択さ
れ、PEstdが相対的に大きくて、PEmがより小さけ
れば、より小さい値が選択される。
【0053】ここで、決定レベルの数、平均値及び標準
偏差のしきい値、及び重みファクタは、要求されている
符号化システムの符号化効率と音質とに基づいて決定さ
れることが好ましいということが理解されるだろう。
【0054】その次に、決定レベル算定器42で算定さ
れた決定レベルD(j)、あらかじめ決定された決定レ
ベルの全数(即ち、2q+1)、及び図2に示された平
均値及び標準偏差計算器34から入力された認知エント
ロピーPE(p)はビット割当デバイス44へ同時に入
力される。
【0055】 このビット割当デバイス44は、フレー
ムグループの各フレームに対するビットを、決定レベル
算定器42から入力される決定レベル及び決定レベルの
全数と、図2に示された平均値及び標準偏差計算器34
から入力されるp番目のフレームの認知エントロピーと
に基づいて決定する。その後、フレームグループの第1
及び第2チャンネルの各フレームに対して決定されたビ
ットに対応するビット割当情報FBI1、FBI2を図
1の第2ビット割当ユニット50及びフォーマッティン
グ回路70へ出力する。本発明の好適実施例に於いて、
フレームグループに於けるp番目のフレームに対するビ
ット割当FB(p)は、(式8)のように決定される。
【0056】 FB(p)=FBm+BV/(2q+1)・I (式8)
【0057】ここで、pは上記で定義したのと同じ意味
である。また、
【0058】FBm:フレームの平均ビット(mean bit
s)(例えば、1チャンネル当たり128Kbpsの伝送
速度で、サンプリング周波数が48KHzの16ビットP
CMオーディオ信号の場合、1フレーム当たり3072
ビット)、
【0059】BV:予め定められたビット分散値(bit v
ariation value)、
【0060】2q+1:予め定められた決定レベルの全
数、
【0061】I:p番目のフレームに於けるレベルイン
デックス(level index)である。
【0062】 上記(式8)から分かるように、p番目
のフレームに対するビット割当FB(p)は、平均ビッ
トFBmと(式8)の第2項で計算される可変ビット数
とを加算することによって決定される。予め定められた
ビット分散値BVは、上記(式8)で定義されるよう
に、1フレームの平均ビットと同一の値として決定して
もよい。また、フレームグループのp番目のフレームに
対するレベルインデックスIは、決定レベル算定器42
から入力される決定レベルD(j)と図2に示されてい
る平均値及び標準偏差計算器34から入力される認知エ
ントロピーPE(p)とに基づいて得られる。本発明の
好適実施例に於いて、フレームグループのp番目のフレ
ームに対するレベルインデックスIは、表2に示すよう
に表すことができる(ここで、決定レベルの間隔は1.
27で、決定レベルインデックスjは−2〜2と仮定し
ている)。
【0063】
【表2】
【0064】 上記の表2から分かるように、もし認知
エントロピーPE(p)が決定レベル-2.55〜-1.28の間
に存在する場合は、p番目のフレームのレベルインデッ
クスIは-1として選択され、また、もし認知エントロピ
ーPE(p)が決定レベル-1.27〜1.26の間にある場合
は、レベルインデックスIとして0が選択される。この
ような方法で、p番目のフレームのビット割当F
(p)を上記(式8)を用いることによって、効果的に
決定することができる。
【0065】しかる後、ビット割当デバイス44にてフ
レームグループの各フレームに対して決定されたビット
に対応する第1及び第2チャンネルのビット割当情報F
BI1、FBI2と、図1に示されている第1認知パラ
メータ算定器20から入力される信号対マスク比SMR
1(r)、SMR2(r)とは、第2ビット割当ユニッ
ト50へ同時に入力される。また、ビット割当情報FB
I1、FBI2はフォーマッティング回路70へも入力
される。
【0066】再度図1を参照すると、第2ビット割当ユ
ニット50は、第1認知パラメータ算定器20から出力
された信号対マスク比SMR1、SMR2と第1ビット
割当ユニット40から出力された各フレームのビット割
当情報FBI1、FBI2とを受信した後、前フレーム
グループの各フレームに含まれる各サブバンドに対して
ビットを決定する。その後、前記各サブバンドに対して
決定されたビットに対応するビット割当情報SBI1、
SBI2を量子化デバイス60とフォーマッティング回
路70へ出力する。第2ビット割当ユニット50にて用
いられたプロセスの原理は、使用されるビット数が第1
ビット割当ユニット40から送られてきたフレームに対
して使用可能なビット数を超過しないという条件の下で
の、1フレーム全体に渡る信号対マスク比の総合的な最
適化に基づく。続いて、第2ビット割当ユニット50か
ら出力される第1及び第2チャンネルの各サブバンドに
対するビット割当情報SBI1、SBI2と、各サブバ
ンドフィルタ11、12から出力されるサブバンドオー
ディオサンプルとは、複数の量子化器(例えば、61及
び62)を含む量子化デバイス60へ同時に入力され
る。
【0067】各量子化器61、62は、第2ビット割当
ユニット50から入力される対応するビット割当情報に
基づいて、各サブバンドフィルタ11、12から入力さ
れる対応するサブバンドオーディオサンプルを適応的に
量子化し、第1及び第2チャンネルそれぞれの量子化さ
れたオーディオ信号をフォーマッティング回路70へと
出力する。
【0068】このフォーマッティング回路70では、各
量子化器61、62から入力された量子化されたオーデ
ィオ信号と、第1及び第2ビット割当ユニット40、5
0から入力されるビット割当情報とをフォーマッティン
グすると共に、伝送のために伝送器(図示せず)へ伝送
する。これによって、入力ディジタルオーディオ信号の
符号化効率と音質が向上する。第2ビット割当ユニット
50、量子化器61、62、及びフォーマッティング回
路70は上述のMPEGオーディオアルゴリズムに於い
て見い出されるものと基本的に同じである。
【0069】本発明は、特定の実施例について説明して
いるが、本発明の範囲を逸脱することなく、当業者は種
々の改変をなし得るであろう。
【0070】
【発明の効果】本発明によれば、複数のチャンネルから
入力される入力ディジタルオーディオ信号を、各入力デ
ィジタルオーディオ信号に対する認知エントロピーに基
づいて適応的に符号化することによって、符号化効率と
音質を向上することができる。
【図面の簡単な説明】
【図1】複数のチャンネルから入力される入力ディジタ
ルオーディオ信号を適応的に符号化する本発明によるシ
ステムを概略的に示したブロック図である。
【図2】図1に示されている第2認知パラメータ算定器
の詳細なブロック図である。
【図3】図1に示されている第1ビット割当ユニットの
詳細なブロック図である。
【符号の説明】
10 サブバンドフィルタリングデバイス 20 第1認知パラメータ算定器 30 第2認知パラメータ算定器 32 認知エントロピー計算器 34 平均値及び標準偏差計算器 40 第1ビット割当ユニット 42 決定レベル算定器 44 ビット割当デバイス 50 第2ビット割当ユニット 61 量子化器 62 量子化器 60 量子化デバイス 70 フォーマッティング回路 100 適応的符号化システム 2q+1 決定レベルの全数 D(j) フレームグループのj番目の決定レベル FBI1 第1チャンネルのビット割当情報 FBI2 第2チャンネルのビット割当情報 M1(r) 第1チャンネルのr番目のサブバンドに於
けるマスクしきい値 M2(r) 第2チャンネルのr番目のサブバンドに於
けるマスクしきい値 P1(r) 第1チャンネルのr番目のサブバンドに於
ける音圧レベル、 P2(r) 第2チャンネルのr番目のサブバンドに於
ける音圧レベル、 PE1(i) 第1チャンネルのi番目のフレームに対
する認知エントロピー PE2(i) 第2チャンネルのi番目のフレームに対
する認知エントロピー PEm フレームグループの平均値 PEstd フレームグループの標準偏差 PE(p) フレームグループのp番目のフレームの認
知エントロピー SMR1(r) 第1チャンネルのr番目のサブバンド
に於ける信号対マスク比 SMR2(r) 第2チャンネルのr番目のサブバンド
に於ける信号対マスク比 X1(m,i) 第1チャンネルのi番目のフレームの
入力ディジタルオーディオ信号 X2(s,i) 第2チャンネルのi番目のフレームの
入力ディジタルオーディオ信号
フロントページの続き (56)参考文献 特開 昭60−96041(JP,A) 特開 平7−87328(JP,A) 特開 平7−183818(JP,A) 特開 平7−210196(JP,A) 特開 平7−87329(JP,A) 特開 平8−56163(JP,A) IEEE SIGNAL PROCE SSING LETTERS,VOL. 1,NO.2,p,26−28;”Fast Subband Filtering in MPEG Audio Cod ing" (58)調査した分野(Int.Cl.6,DB名) H03M 7/30 G10L 7/04 G10L 9/18

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 N個(Nは正の整数)のチャンネルか
    ら入力される入力ディジタルオーディオ信号を適応的に
    符号化するシステムであって、 前記入力ディジタルオーディオ信号の各々が複数のフレ
    ームを含み、該フレームの各々が複数のサブバンドを含
    んでおり、 前記入力ディジタルオーディオ信号を各サブバンド単位
    で受信しフィルタリングする、並列に配置されたN個の
    サブバンドフィルタリング手段と、 前記入力ディジタルオーディオ信号に含まれる各サブバ
    ンドに対して信号対マスク比、音圧レベル、及びマスク
    しきい値を算定する第1算定手段と、 前記算定された信号対マスク比、音圧レベル、及びマス
    クしきい値に基づいて、前記入力ディジタルオーディオ
    信号のそれぞれに含まれるフレームの各々に対して認知
    エントロピーを算定し、総数N個の前記チャンネルに対
    しN×M個(Mは正の整数)の現フレーム及び前フレー
    ムを含むフレームグループに対して平均値及び標準偏差
    を算定する第2算定手段と、 前記算定された信号対マスク比、認知エントロピー、平
    均値、及び標準偏差に基づいて、前記フレームグループ
    のサブバンドの各々に対して適応的にビットを決定し、
    前記サブバンドの各々に対して決定されたビットに対応
    するビット割当情報を生成するビット割当手段と、 前記フレームグループの各サブバンドに対して生成され
    る対応するビット割当情報に応じて、前記N個のチャン
    ネルに対してフィルタリングされたサブバンドオーディ
    オ信号を量子化する並列に配置されたN個の量子化手段
    と、 前記ビット割当情報と共に、前記量子化されたディジタ
    ルオーディオ信号をフォーマットする手段とを含むこと
    を特徴とする適応的符号化システム。
  2. 【請求項2】 前記ビット割当手段が、 前記算定された平均値及び標準偏差に基づいて、前記フ
    レームグループの決定レベルを算定する手段と、 前記算定された決定レベル、前記決定レベルの全数、前
    記認知エントロピー、及び予め定められた平均ビットに
    基づいて、前記フレームグループの各フレームに対して
    ビットを決定すると共に、前記フレームの各々に対して
    決定されたビットに対応するビット割当情報を発生する
    第1ビット割当手段と、 前記算定された信号対マスク比と前記生成されたビット
    割当情報とに基づいて、前記各フレームのサブバンドの
    各々に対してビットを決定すると共に、前記サブバンド
    の各々に対して決定されたビットに対応するビット割当
    情報を発生する第2ビット割当手段とを備えることを特
    徴とする請求項1に記載の適応的符号化システム。
  3. 【請求項3】 前記フレームグループの各決定レベル
    Dが、 D=PEm+j・PEstd ・W のように決定され、 ここで、 j:決定レベルインデックス(j=−q〜q)、 q:正の整数、 W:前記フレームグループに於ける重みファクタ、 PEm:前記フレームグループの平均値、 PEstd:前記フレームグループの標準偏差 であることを特徴とする請求項2に記載の適応的符号化
    システム。
  4. 【請求項4】 p番目のフレームのビット割当F
    (p)が、 FB(p)=FBm+BV/(2q+1)・I のように得られ、 ここで、 p:前記フレームグループに於けるフレームインデック
    ス、 FBm:1フレームの平均ビットの関数、 BV:予め定められたビット分散値、 2q+1:予め定められた決定レベルの全数、 I:前記p番目のフレームのレベルインデックス であることを特徴とする請求項3に記載の適応的符号化
    システム。
JP7023465A 1994-01-18 1995-01-18 適応的符号化システム Expired - Lifetime JP2908270B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1994P784 1994-01-18
KR1019940000784A KR960012475B1 (ko) 1994-01-18 1994-01-18 디지탈 오디오 부호화장치의 채널별 비트 할당 장치

Publications (2)

Publication Number Publication Date
JPH0851366A JPH0851366A (ja) 1996-02-20
JP2908270B2 true JP2908270B2 (ja) 1999-06-21

Family

ID=19375804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7023465A Expired - Lifetime JP2908270B2 (ja) 1994-01-18 1995-01-18 適応的符号化システム

Country Status (5)

Country Link
US (1) US5613035A (ja)
EP (1) EP0663740A3 (ja)
JP (1) JP2908270B2 (ja)
KR (1) KR960012475B1 (ja)
CN (1) CN1119376A (ja)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
KR0144011B1 (ko) * 1994-12-31 1998-07-15 김주용 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법
JP2820117B2 (ja) * 1996-05-29 1998-11-05 日本電気株式会社 音声符号化装置
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6005893A (en) * 1997-09-23 1999-12-21 Telefonaktiebolaget Lm Ericsson Reduced complexity bit allocation to subchannels in a multi-carrier, high speed data transmission system
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
EP0907258B1 (en) 1997-10-03 2007-01-03 Matsushita Electric Industrial Co., Ltd. Audio signal compression, speech signal compression and speech recognition
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
IL134182A (en) 2000-01-23 2006-08-01 Vls Com Ltd Method and apparatus for visual lossless pre-processing
US6753929B1 (en) 2000-06-28 2004-06-22 Vls Com Ltd. Method and system for real time motion picture segmentation and superposition
US6744818B2 (en) * 2000-12-27 2004-06-01 Vls Com Ltd. Method and apparatus for visual perception encoding
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
WO2003061143A2 (en) * 2002-01-15 2003-07-24 University Of Miami Coding a masked data channel in a radio signal
CN100452657C (zh) * 2002-08-21 2009-01-14 广州广晟数码技术有限公司 对多声道数字音频信号进行压缩编码的编码方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
CN100349207C (zh) * 2003-01-14 2007-11-14 北京阜国数字技术有限公司 高频耦合的伪小波5声道音频编/解码方法
US7212666B2 (en) * 2003-04-01 2007-05-01 Microsoft Corporation Generating visually representative video thumbnails
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
GB2398191B (en) * 2004-03-10 2004-12-22 David Asher Jaffa Adaptive quantiser
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
EP1873753A1 (en) * 2004-04-01 2008-01-02 Beijing Media Works Co., Ltd Enhanced audio encoding/decoding device and method
US7903902B2 (en) 2004-07-26 2011-03-08 Sheraizin Semion M Adaptive image improvement
US7639892B2 (en) * 2004-07-26 2009-12-29 Sheraizin Semion M Adaptive image improvement
JP4639073B2 (ja) * 2004-11-18 2011-02-23 キヤノン株式会社 オーディオ信号符号化装置および方法
US7526142B2 (en) * 2005-02-22 2009-04-28 Sheraizin Vitaly S Enhancement of decompressed video
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
US7562021B2 (en) 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
CN104282311B (zh) * 2014-09-30 2018-04-10 武汉大学深圳研究院 一种音频编码带宽扩展中子带划分的量化方法及装置
US10666289B1 (en) 2019-01-16 2020-05-26 International Business Machines Corporation Data compression using dictionary encoding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2389277A1 (fr) * 1977-04-29 1978-11-24 Ibm France Procede de quantification a allocation dynamique du taux de bits disponible, et dispositif de mise en oeuvre dudit procede
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
CA1253255A (en) * 1983-05-16 1989-04-25 Nec Corporation System for simultaneously coding and decoding a plurality of signals
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5539829A (en) * 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
US5331414A (en) * 1991-12-23 1994-07-19 Intel Corporation Method and apparatus for encoding a digital motion video signal using pyramid specific filtering
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
DE4222623C2 (de) * 1992-07-10 1996-07-11 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern von digitalisierten Tonsignalen

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEE SIGNAL PROCESSING LETTERS,VOL.1,NO.2,p,26−28;"Fast Subband Filtering in MPEG Audio Coding"

Also Published As

Publication number Publication date
KR960012475B1 (ko) 1996-09-20
EP0663740A2 (en) 1995-07-19
CN1119376A (zh) 1996-03-27
JPH0851366A (ja) 1996-02-20
US5613035A (en) 1997-03-18
EP0663740A3 (en) 1998-08-19
KR950024447A (ko) 1995-08-21

Similar Documents

Publication Publication Date Title
JP2908270B2 (ja) 適応的符号化システム
JP3134455B2 (ja) 高能率符号化装置及び方法
US5537510A (en) Adaptive digital audio encoding apparatus and a bit allocation method thereof
JP3297240B2 (ja) 適応的符号化システム
JP3278900B2 (ja) データ符号化装置及び方法
JP2693893B2 (ja) ステレオ音声符号化方法
JP3336618B2 (ja) 高能率符号化方法及び高能率符号化信号の復号化方法
JP3203657B2 (ja) 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体
JP3186292B2 (ja) 高能率符号化方法及び装置
JPS5997242A (ja) 音声信号符号化方法
JPH066236A (ja) 高能率符号化及び/又は復号化装置
WO1995013660A1 (fr) Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite
JP3318931B2 (ja) 信号符号化装置、信号復号化装置及び信号符号化方法
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JP3336619B2 (ja) 信号処理装置
WO1995016263A1 (fr) Procede, dispositif et support concernant le traitement de l'information
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP3301886B2 (ja) 可変レート音声符号化方法及び装置
JPH08167851A (ja) 高能率符号化方法及び装置、並びに伝送媒体
JP3227945B2 (ja) 符号化装置
JP3227948B2 (ja) 復号化装置
KR0181054B1 (ko) 다수개의 채널들로부터의 입력 디지탈 오디오 신호들을 적응적으로 부호화하는 장치
JP2575265B2 (ja) ディジタルオーディオ信号の符号化方法
JP3134383B2 (ja) ディジタルデータの高能率符号化方法及び装置