JPH07183818A - オーディオ信号の符号化方法及びその装置 - Google Patents

オーディオ信号の符号化方法及びその装置

Info

Publication number
JPH07183818A
JPH07183818A JP6189715A JP18971594A JPH07183818A JP H07183818 A JPH07183818 A JP H07183818A JP 6189715 A JP6189715 A JP 6189715A JP 18971594 A JP18971594 A JP 18971594A JP H07183818 A JPH07183818 A JP H07183818A
Authority
JP
Japan
Prior art keywords
critical band
critical
bits
band
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6189715A
Other languages
English (en)
Other versions
JP3274285B2 (ja
Inventor
Sang-Wook Kim
金尚▲ウォク▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JPH07183818A publication Critical patent/JPH07183818A/ja
Application granted granted Critical
Publication of JP3274285B2 publication Critical patent/JP3274285B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 人間の聴覚特性を利用したオーディオ信号の
符号化方法にビット割り当て時の演算速度を改善し、非
反復的な演算が実現され演算回数を軽減させたオーディ
オ信号の符号方法及び装置を提供する。 【構成】 ビット割当て部12において、高周波数帯域
から低周波数帯域の順に量子化ビットを割当てることに
より、非反復的な演算が実現されて演算の回数を軽減す
る効果を有する。また、臨界帯域に量子化ビットを割当
てる場合に、NMRの代わりにSMRを使用して割当て
られる量子化ビット数を演算することにより、演算を簡
便化する効果を有する。また、各臨界帯域に固有な加重
値を付与し得るので、特定の帯域を強調したりプリエン
ファシス等の処理が可能である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は人間の聴覚特性を用いた
オーディオ信号の符号化方法及びその装置に係り、特に
ビット割当て時の演算速度を改善したオーディオ信号の
符号化方法及びその装置に関するものである。
【0002】
【従来の技術】既存のオーディオ機器は、最近のデジタ
ル信号処理技術の発達によって急速にデジタル方式に代
替されている。すなわち、アナログオーディオ信号を記
録/再生するレーザディスクプレイヤ(LDP)及びテ
ープレコーダは、デジタルオーディオ信号を記録/再生
するコンパクトディスクプレイヤ(CDP),デジタル
オーディオテ−プ(DAT),ミニディスク(MD)な
どを採用したシステムで代替されている。しかし、オー
ディオ信号をディジタル方式で処理すると音質が向上す
る効果がある反面、データ量が増大するという逆効果が
ある。
【0003】前記データ量の問題は、人間の耳では感知
できない信号成分を選別的に除去し、人間の耳で認知し
得る成分には量子化ビット数を適応的に割当てることに
より、軽減される。これは、最近ISOによって標準化
作業が進行しているデジタルコンパクトカセット,ミニ
ディスクあるいはMPEG等によって達成される。かか
る符号化方式の主な目的は、発生した雑音を除去するこ
とでなく、マスキング効果(masking effect)と臨界帯
域(critical bands)などを考慮して、信号の重要度に
よって量子化ビット数を適応的に割当てることにより、
雑音が認知されないように処理することである。
【0004】ここで、マスキング効果というのは、聞く
べき音(オーディオ成分)が他の音によって妨害された
り完全に遮断される現象であり、臨界帯域とは、周波数
と信号電力とが類似な場合に信号と雑音成分とが周波数
領域から相互区分されないようになる周波数帯域をい
う。人間の聴覚特性を用いた符号化方法では、このよう
なマクキング効果を考慮して符号化を行う。まず、マス
クキングスレショルドを求める。マスキングスレショル
ドは、入力信号間の相互作用で変化し、人間が聞いても
識別できない信号の最小の大きさである。識別できない
信号には量子化ビットを割当てず、音を知覚するに重要
な役割を果たす信号成分には適応的に量子化ビットを割
当てることにより、データの圧縮効果を得る。
【0005】入力信号と入力信号のマスキングスレショ
ルドとを利用して、音を知覚するのに決定的な役割をす
る信号を探す尺度は様々提案されているが、代表的に
は、各バンド別量子化に従う誤差値による雑音である誤
差雑音成分とマスキングスレショルドとの比であるNM
R(noise to mask ratio)がある。このNMRは、マス
キングスレショルドと誤差成分との差を示す。聴覚実験
によって知られた通り、もし雑音がマスキングスレショ
ルド近辺に存すると検出しにくく、雑音がマスキングス
レショルドの下ならば検出が不可能なので、誤差信号と
マスキングスレショルドとの差を知ることは重要であ
る。
【0006】NMRは、マスキングスレショルドに関す
る前記の特性を考慮するための1つの指数で、1987
年に始めて導入されて、人間の聴覚心理を考慮して誤差
信号が聞こえる程度を示す。NMRは、SMR(signal
to mask ratio)を求め、求めたSMRを量子化された誤
差信号と誤差雑音との比SNR(signal to noise rati
o)と比較演算して決定する。
【0007】従来の符号化方法において、認知し得る音
成分に対して量子化ビット数を割当てる方法は次の通り
である。 (1)全ての臨界帯域に割当てられたビット数を0と初
期化し、全ての臨界帯域に対するNMRを計算する。 (2)最も大きいNMRを有する臨界帯域を探し、探し
た臨界帯域に1つのビットを割当てる。 (3)全ての臨界帯域のNMRを新たに計算し、第2過
程を使用可能な量子化ビット数が全部使用される時まで
反復する。
【0008】前述した従来のビット割当て方法において
は、1つのビットを割当てる時に一定の回数、即ち(処
理帯域数−1)回の比較演算を行った後、1回の加算が
必要である。例えば、臨界帯域の数が24ならば、ある
一帯域にN個の量子化ビットが割当てられるためには全
部でN×(24−1)回の比較演算とN回の加算とが要
求される。
【0009】
【発明が解決しようとする課題】このような反復的なビ
ット割当て方法では、多数回の演算が要求されるのでハ
ードウェアの構成が複雑になる問題点がある。
【0010】本発明は、ビット割当てのための演算回数
を節減するための、人間の聴覚器官の特性を考慮した符
号化方法及びその装置を提供することをその目的とす
る。
【0011】
【課題を達成するための手段】前記の目的を達成するた
めに、本発明によるオーディオ信号の符号化方法は、時
間領域のオーディオ信号をサンプリングするサンプリン
グ過程と、前記サンプリングされたオーディオ信号を複
数の臨界帯域に分割された周波数領域の信号に変換する
臨界帯域分割過程と、各臨界帯域毎に当該臨界帯域の雑
音対マスクされたスレショルド(NMR)の値を最小に
する量子化ビット数を割当てるビット割当過程と、割当
てられた量子化ビット数により周波数領域の信号を量子
化する量子化過程とを有し、前記ビット割当過程では、
最上位周波数の臨界帯域から最下位周波数の臨界帯域の
順に臨界帯域の加重値に従い量子化ビットを割当てるこ
とを特徴とする。
【0012】ここで、前記ビット割当過程では、任意の
臨界帯域に割当てられる量子化ビット数が前記任意の臨
界帯域以下の臨界帯域中で前記臨界帯域の加重値によっ
て決定される。また、任意の臨界帯域の前記加重値は、
当該臨界帯域以下の臨界帯域中で前記任意の臨界帯域の
信号対マスクされたスレショルドとの比(SMR)の大
きさによって決定される。また、任意の臨界帯域に割当
てられる前記量子化ビット数は、前記任意の臨界帯域以
下の臨界帯域の信号対マスクされたスレショルドとの比
(SMR)の大きさを考慮して、下記の式によって決定
される。
【0013】 ここで、BITiは、任意の臨界帯域に割当てられる量
子化ビット数であり、BITtotal は、前記任意の臨界
帯域以下の臨界帯域に割当てられる量子化ビット数であ
り、SMRiは、任意の臨界帯域のSMRであり、SM
Rmin は、任意の臨界帯域以下の臨界帯域のSMR中で
最も小さいSMRであり、そしてSMRtotal は、任意
の臨界帯域以下の臨界帯域のSMRの総合であり、N
は、帯域数である。また、任意の臨界帯域に割当てられ
た前記量子化ビット数を、下記の式で決定される新たな
必要ビット数(NEEDBITnew)と比較し、新たなビット数以
上であれば当該臨界領域に量子化ビット数を割当て、新
たな必要ビット数より小さければ当該臨界領域に量子化
ビット数を割当てない。
【0014】 NEEDBIT =Wi×NEEDBIT =Wi(S+BITmin ) ここで、Wiは各臨界帯域に固有な加重値、BITmin
は量子化に使用される最小ビット数。又、本発明のオー
ディオ信号の符号化装置は、時間領域のオーディオ信号
をサンプリングするサンプリング手段と、前記サンプリ
ングされたオーディオ信号を複数の臨界帯域に分割され
た周波数領域の信号に変換する臨界帯域分割手段と、各
臨界帯域毎に当該臨界帯域の雑音対マスクされたスレシ
ョルド(NMR)の値を最小にする量子化ビット数を割
当てるビット割当手段と、割当てられた量子化ビット数
により周波数領域の信号を量子化する量子化手段とを備
え、前記ビット割当手段は、最上位周波数の臨界帯域か
ら最下位周波数の臨界帯域の順に臨界帯域の加重値に従
い量子化ビットを割当てることを特徴とする。
【0015】
【作用】かかる構成により、本発明によるオーディオ信
号の符号化方法及びその装置は、高い周波数の臨界帯域
から順次に量子化ビットを割当てさせることにより、低
周波数帯域により多い量子化ビット数が割当てられるよ
うにする。また、NMRの代わりにSMRのみを考慮し
て量子化ビット数を割当てることにより、演算の複雑度
を軽減させる。
【0016】
【実施例】以下、添付した図面に基づき本発明の実施例
を詳細に説明する。図1は人間の聴覚特性を考慮した符
号化方式を採択したオーディオ機器の一般的な構成を示
したブロック図である。図1に示した装置は、所定大き
さのブロックで時間領域のオーディオ信号をサンプリン
グし、サンプリングされた信号を臨界帯域に分割された
周波数領域の信号に変換させて、変換された信号を出力
するマッピング部10と、各臨界帯域に分割された周波
数領域の信号の量子化ビット数を決定するビット割当て
部12と、割当てられた量子化ビット数により周波数領
域の信号を量子化する量子化部14と、量子化された周
波数領域の信号をデータ圧縮し、圧縮された信号を出力
するデータ圧縮部16とを含む。
【0017】マッピング部10では、人間の聴覚特性を
考慮した符号化を行うために、入力信号を周波数領域の
信号に変換し、その信号を臨界帯域に分割させて出力す
る。ビット割当て部12では、入力信号が大きさと臨界
帯域間の相互作用から発生されるマスキング効果によ
り、各臨界帯域の量子化ビット数を適応的に割当てる。
即ち、人間の耳で認知されない部分には量子化ビットを
割当てず、重要な部分には加重値により量子化ビットを
割当てる。入力信号の加重値を判断する尺度としてマス
クレベルと量子化による雑音の比率NMR(noise to m
ask ratio)を使用する。
【0018】量子化部14では、ビット割当て部12で
割当てられた量子化ビット数によって周波数領域の信号
を量子化し、信号復元時に発生される誤差が最小になる
ように信号の伝送特性に応じて線型または非線型量子化
を行う。また量子化部14は、与えられた量子化ビット
数による最適な量子化を実現するためにフィードバック
(feed-back)あるいはフィードフォワード(feed-forwa
rd)の適応量子化方式を採択している。
【0019】人間の聴覚特性を考慮した符号化方式を採
択したデジタルオーディオ機器では、大部分が量子化段
階と量子化雑音の大きさなどをフィードフォワードする
適応量子化方式とによって調節して、音質の向上を図
る。オーディオ信号の知覚程度は、与えられた量子化器
に対して入力信号の電力分布及び周波数分布特性によっ
て異なる。これは、誤差信号がランダムな分布を有さず
人間の聴覚特性に応じて決定される一定な分布形態を有
することを意味し、印加されたオーディオ信号の客観的
な評価値として使用されてきたSNR(Signal to Nois
e Ratio)が、主観的評価である聴覚実験と相関関係が少
ない理由となる。聴覚実験を通じて、マスキングスレシ
ョルド近辺の雑音は検出されにくく、雑音がスレショル
ド下にあると検出が不可能であるという事実が分った。
したがって、誤差雑音とマスキングスレショルドとの差
(gap)を知ることは、人間の聴覚特性を用いた符号化に
おいて極めて重要なことになる。
【0020】一般的に、音楽や音声での情報の伝達は経
過時間の作用である。マスキングの効果もこのような経
過した時間によって発生する。図2は、時間的な流れに
よるマスキングの効果を、前方マスキング,同時マスキ
ング及び後方マスキングの3つの領域に区分しうること
を示し、x軸は時間領域(tv)を、y軸はマスキングの強
度(LT)を示す。前方マスキング(pre-maskingor back-w
ard masking)は、先に信号が現れた後に現れるマスカ
(マスキング効果を起こす成分)によってマスクされる
現象であり、同時マスキングは、信号とマスカとが同時
に現れる時に発生し、後方マスキング(post-masking o
r forward masking)は先に現れたマスカによって後に
発生する信号がマスクされる現象である。
【0021】図3は、入力信号によって変形されるマス
キングスレショルドの一例を示し、x軸は周波数領域(f
T)を、y軸は入力信号の強度(LT ) を示す。ここで、約
1KHz付近の信号は、入力信号によって変形されたマ
スキングスレショルドによってマスクされた信号とみ
る。この信号は、入力信号がない静かな状態ではマスク
されない(静かな状態のマスキングスレショルドを示し
た図3を参照)。
【0022】ここで、周波数領域によるマスキングスレ
ショルドの計算が行われ、周波数領域は表1のような臨
界帯域に分けて各臨界帯域における信号電力を求める。
【0023】
【表1】
【0024】臨界帯域の信号電力をS(x)とし、人間
の聴覚器官のマスキング効果をモデリングした拡散関数
(spreading fuction )をB(x)とする時、各臨界帯
域におけるマスク効果で変形されたマスキングスレショ
ルドE(x)は、次のようにS(x)とB(x)とに対
する線型コンボル−ションによって計算される。 E(x)=S(x)×B(x) …(1) ここで、拡散係数B(x)は次のように表現される関数
である。
【0025】 10×logB(x)=15.81+7.5(x+0.474)−17.5 +(1+( x+0.474)2)1/2 …(2) この結果得られるスレショルドは、各帯域における最大
値である。これは静かな時のスレショルド(absolute t
hreshold)と比較され、2つのうちの大きい値を最終の
マスキングスレショルドとする。このような過程を通じ
て得たマスキングスレショルドは、図5に示したように
階段波の形を有する。このマスキングスレショルドから
SMRを計算する。
【0026】NMRを計算するためには、SMRを誤差
スペクトルと比較する。このような誤差スペクトルは、
誤差信号を帯域別にグルーピングされた周波数領域に変
換させることで得、その後には各臨界帯域の信号電力が
算出される。NMRは次のように計算される。 NMR=SMR−SNR …(3) NMRにログを取った値は、誤差雑音とマスキングスレ
ショルドとの距離を示す。もし誤差雑音がスレショルド
より大きければ、その雑音は聞くことができる。
【0027】NMRが0より大きいというのは、量子化
雑音が完全にマスクされ得ないことをいう。計算された
NMRによって誤差雑音が聞くことができたり聞けない
場合に対する例を、図4の(B)に示した。ここでは、
6KHzから12KHz間の雑音が聞こえる。前述した
ように、人間の聴覚特性を考慮した従来の符号化方式で
は、ビット割当て過程で適切な量子化ビット数を選定す
ることにより量子化雑音を減少させて、マスキングスレ
ショルドより下に位置させようとする。
【0028】また、各臨界帯域に量子化ビット数を割当
てる方法において、最も大きいNMR、つまりマスキン
グスレショルドより高い雑音成分を探す理由は、そのよ
うな雑音は耳に障るので、この部分に多い量子化ビット
数が割当てられるようにして量子化雑音を少なくするこ
とにより、雑音が聞こえないようにするためである。こ
のような方法は、耳に障る誤差の影響を最小化させなが
ら使用可能なビットを最大限に使用しうるようにする。
しかしながら、このようなビット割当て段階は、1つの
ビットを割当てさせるが、一定回数、即ち(処理帯域数
−1)個の比較演算を反復した後に、1回の加算がさら
に必要である。
【0029】したがって、本実施例では、量子化ビット
割当ての処理段階毎に変わる入力値と、耳で感知するに
必要な入力信号の最小の大きさの分布とを考慮して信号
の加重値を算出し、算出された加重値を用いて順に非反
復的な方法で任意の臨界帯域に量子化ビット数を割当て
る方法を提案する。このようなビット割当て方法は、N
MR値の使用の代わりにSMR値のみを考慮することに
より、演算の複雑度を軽減させ、さらに高い周波数の臨
界帯域から順に量子化ビットを割当てさせることによ
り、低周波数部分により多いビットが割当てられるよう
にする。
【0030】本実施例によるビット割当て方法は次のよ
うに要約され得る。 (1)全ての臨界帯域に対するSMR値を計算し、最も
小さい値(SMRmin )と全てのSMRの総合(SMR
total )を求める。 (2)このようなSMR値中で各帯域別信号の加重値を
求めて、最高周波数領域から使用可能なビット数を必要
ビット数と比較した後、比較の結果が一定の条件を満た
すと該当帯域にビットを割当てる。 (3)使用可能なビット数と残りの臨界帯域のSMRを
再計算した後、(1)と(2)の過程を使用可能なビッ
トが全部割当てられるまで反復する。
【0031】(1)でSMRmin を求めるのは、各帯域
のSMR値からSMRmin を引くことにより各帯域のS
MR値に対するオフセット(offset)補正を行うためで
ある。ここで、オフセット補正をする理由は、加重値に
おける正確度と負数であるSMR値のためである。ま
た、SMRtotal を求めるのは、各臨界帯域の加重値を
算出する時に使用するためである。
【0032】データの圧縮比によって決定される使用可
能なビット数の総合BITtotal に基づいて、任意の帯
域iに割当てられる量子化ビット数は次の式によって決
定される。 ここで、BITiは任意の臨界帯域に割当てられる量子
化ビット数であり、BITtotal は前記任意の臨界帯域
以下の臨界帯域に割当てることができる量子化ビット数
であり、SMRiは任意の臨界帯域のSMRであり、S
MRmin は任意の臨界帯域以下の臨界帯域のSMR中で
最も小さいSMRであり、SMRtotal は任意の臨界帯
域以下の臨界帯域のSMRの総合であり、Nは帯域数で
ある。ここで、SMRmin で補正されたSMR(4式の
分子)を求め、これを補正されたSMRの和(分母)に
分けたのが、オフセット補正されて計算されたi番目の
臨界帯域の加重値である。
【0033】この加重値により、BITtotal が部分的
に使用可能なビット数BITiに割当てられ、BITi
を量子化されたデータを示すに必要なビット数(NEEDBI
T) と比較する。ここで、NEEDBIT は、任意の臨界帯域
のサンプリングされたデータに量子化ビットを割当てる
ことにより付加的に使用されるビット数の総合であり、
(スケールファクタ(scalefactor) +量子化時に使用さ
れる最小のビット数)と同一である。BITiが量子化
データを示すのに十分でないと、任意の臨界帯域iに割
当てられたビット数は0となり、このビット数は次の演
算に使われる。
【0034】ある臨界帯域に量子化ビット数を割当てて
から、残りの臨界帯域のSMR値から加重値を再び求め
て、ビット割当て量が決定されるにつれ変化するBIT
total 値が効率的に使用されうるようにする。与えられ
たビット数を残り帯域のSMR値の和と比較して、当該
帯域のSMRの加重値を求める。即ち、一臨界帯域でビ
ット割当て量が決定された後、SMRtotal からで直前
のSMRを引いて、加重値の演算時に使用されずに残っ
た帯域数の値を1つ引くことにより、残っている帯域で
加重値を調節することができる。
【0035】 BITtotal =BITtotal −BITi …(5) ここで、各臨界帯域の処理をする時、一般的な信号の属
性上、低周波数の帯域に多くの信号が集まっていること
と、高周波数帯域には少ない量の信号しか集まっていな
いこととを考慮しなければならない。すると、低周波数
帯域からビットを割当てる場合には、大部分が情報がな
い部分である高周波数帯域に対するスケールファクタも
臨界帯域の処理で考慮される。したがって、全体的なビ
ット割当て時のこのような手続きは、高周波数帯域にビ
ットが割当てられる時には使用されないスケールファク
タに対してビットが使用されるような問題が発生するな
ど、与えられたビット数を効率的に使用する処理ではな
いことが分かる。
【0036】したがって、本実施例による符号化方法で
は、高周波数部分が先に処理される処理順序を採用し
て、符号化をする前に不要な部分を除去することによ
り、ビット割当て量の高効率化を図った。ここで、下記
の式6のように使用される、必要ビット数に各帯域の加
重値をかけた値を比較に使用される新たな値(NEEDBITne
w)とすることにより、特定周波数帯域により多いビット
が割当てられるように調節しうる。
【0037】 NEEDBIT =Wi×NEEDBIT =Wi×(S+BITmin ) …(6) ここで、Sはスケールファクタを示す。Wiの値を小さ
くすることにより高周波数帯域により多いビット数が割
当てられるようにして、音声信号の処理時に使用される
プリエンファシス(pre-emphasis)のように高周波数成
分の信号を強調するのと同等な効果を有する。即ち、帯
域加重値Wiをこのように調節することにより、プリエ
ンファシスの効果を出すことができる。
【0038】
【発明の効果】前述したように、本発明による符号化方
法及び装置は、高周波数帯域から低周波数帯域に順次に
量子化ビットを割当てることにより、非反復的な演算が
実現されて演算の回数を軽減する効果を有する。また、
本発明による符号化方法及び装置は、臨界帯域に量子化
ビットを割当てる場合に、NMRの代わりにSMRを使
用して割当てられる量子化ビット数を演算することによ
り、演算を簡便化する効果を有する。また、本発明によ
る符号化方法及び装置は、各臨界帯域に固有な加重値を
付与し得るので、特定の帯域を強調したりプリエンファ
シス等の処理が可能である。
【図面の簡単な説明】
【図1】本実施例及び従来技術に共通に関連する人間の
聴覚特性を用いた符号化器のブロック図である。
【図2】時間領域に対するマスキング効果を示した図で
ある。
【図3】入力信号により変形されたマスキングスレショ
ルドの一例を示した図である。
【図4】マスクされたスレショルドと誤差雑音との関係
及びNMRと誤差雑音との関係を示した図である。
【図5】本実施例の方法に関連してオフセット補正前後
のSMRを示した図である。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 時間領域のオーディオ信号をサンプリン
    グするサンプリング過程と、 前記サンプリングされたオーディオ信号を複数の臨界帯
    域に分割された周波数領域の信号に変換する臨界帯域分
    割過程と、 各臨界帯域毎に当該臨界帯域の雑音対マスクされたスレ
    ショルド(NMR)の値を最小にする量子化ビット数を
    割当てるビット割当過程と、 割当てられた量子化ビット数により周波数領域の信号を
    量子化する量子化過程とを有し、 前記ビット割当過程では、最上位周波数の臨界帯域から
    最下位周波数の臨界帯域の順に臨界帯域の加重値に従い
    量子化ビットを割当てることを特徴とするオーディオ信
    号の符号化方法。
  2. 【請求項2】 前記ビット割当過程では、任意の臨界帯
    域に割当てられる量子化ビット数が前記任意の臨界帯域
    以下の臨界帯域中で前記臨界帯域の加重値によって決定
    されることを特徴とする請求項1記載のオーディオ信号
    の符号化方法。
  3. 【請求項3】 任意の臨界帯域の前記加重値は、当該臨
    界帯域以下の臨界帯域中で前記任意の臨界帯域の信号対
    マスクされたスレショルドとの比(SMR)の大きさに
    よって決定されることを特徴とする請求項2記載のオー
    ディオ信号の符号化方法。
  4. 【請求項4】 任意の臨界帯域に割当てられる前記量子
    化ビット数は、前記任意の臨界帯域以下の臨界帯域の信
    号対マスクされたスレショルドとの比(SMR)の大き
    さを考慮して、下記の式、 ここで、BITiは、任意の臨界帯域に割当てられる量
    子化ビット数であり、BITtotal は、前記任意の臨界
    帯域以下の臨界帯域に割当てられる量子化ビット数であ
    り、SMRiは、任意の臨界帯域のSMRであり、SM
    Rmin は、任意の臨界帯域以下の臨界帯域のSMR中で
    最も小さいSMRであり、そしてSMRtotal は、任意
    の臨界帯域以下の臨界帯域のSMRの総合であり、N
    は、帯域数である、によって決定されることを特徴とす
    る請求項3記載のオーディオ信号の符号化方法。
  5. 【請求項5】 任意の臨界帯域に割当てられた前記量子
    化ビット数を、下記の式、 NEEDBIT =Wi×NEEDBIT =Wi(S+BITmin ) ここで、Wiは各臨界帯域に固有な加重値、BITmin
    は量子化に使用される最小ビット数、で決定される新た
    な必要ビット数(NEEDBITnew)と比較し、新たなビット数
    以上であれば当該臨界領域に量子化ビット数を割当て、
    新たな必要ビット数より小さければ当該臨界領域に量子
    化ビット数を割当てないことを特徴とする請求項1記載
    のオーディオ信号の符号化方法。
  6. 【請求項6】 時間領域のオーディオ信号をサンプリン
    グするサンプリング手段と、 前記サンプリングされたオーディオ信号を複数の臨界帯
    域に分割された周波数領域の信号に変換する臨界帯域分
    割手段と、 各臨界帯域毎に当該臨界帯域の雑音対マスクされたスレ
    ショルド(NMR)の値を最小にする量子化ビット数を
    割当てるビット割当手段と、 割当てられた量子化ビット数により周波数領域の信号を
    量子化する量子化手段とを備え、 前記ビット割当手段は、最上位周波数の臨界帯域から最
    下位周波数の臨界帯域の順に臨界帯域の加重値に従い量
    子化ビットを割当てることを特徴とするオーディオ信号
    の符号化装置。
JP18971594A 1993-10-30 1994-08-11 オーディオ信号の符号化方法 Expired - Lifetime JP3274285B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1019930022958A KR100269213B1 (ko) 1993-10-30 1993-10-30 오디오신호의부호화방법
KR93-22958 1993-10-30
US08/275,452 US5649053A (en) 1993-10-30 1994-07-15 Method for encoding audio signals

Publications (2)

Publication Number Publication Date
JPH07183818A true JPH07183818A (ja) 1995-07-21
JP3274285B2 JP3274285B2 (ja) 2002-04-15

Family

ID=26629967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18971594A Expired - Lifetime JP3274285B2 (ja) 1993-10-30 1994-08-11 オーディオ信号の符号化方法

Country Status (4)

Country Link
US (1) US5649053A (ja)
JP (1) JP3274285B2 (ja)
KR (1) KR100269213B1 (ja)
DE (1) DE4428193C2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09321628A (ja) * 1996-05-29 1997-12-12 Nec Corp 音声符号化装置
JP2009501359A (ja) * 2005-07-15 2009-01-15 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置
JP2016527546A (ja) * 2013-07-01 2016-09-08 華為技術有限公司Huawei Technologies Co.,Ltd. 信号の符号化および復号化の方法および装置

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
JP3082625B2 (ja) * 1995-07-15 2000-08-28 日本電気株式会社 音声信号処理回路
DE19638997B4 (de) * 1995-09-22 2009-12-10 Samsung Electronics Co., Ltd., Suwon Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung
DE19638546A1 (de) * 1996-09-20 1998-03-26 Thomson Brandt Gmbh Verfahren und Schaltungsanordnung zur Kodierung oder Dekodierung von Audiosignalen
US5893066A (en) * 1996-10-15 1999-04-06 Samsung Electronics Co. Ltd. Fast requantization apparatus and method for MPEG audio decoding
JP3283200B2 (ja) * 1996-12-19 2002-05-20 ケイディーディーアイ株式会社 符号化音声データの符号化レート変換方法および装置
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6581170B1 (en) 1997-10-23 2003-06-17 Sony Corporation Source coding to provide for robust error recovery during transmission losses
US6163868A (en) * 1997-10-23 2000-12-19 Sony Corporation Apparatus and method for providing robust error recovery for errors that occur in a lossy transmission environment
US6282684B1 (en) 1997-10-23 2001-08-28 Sony Corporation Apparatus and method for recovery of data in a lossy transmission environment
US6091773A (en) * 1997-11-12 2000-07-18 Sydorenko; Mark R. Data compression method and apparatus
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6571393B1 (en) * 1998-05-27 2003-05-27 The Hong Kong University Of Science And Technology Data transmission system
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
JP3784993B2 (ja) * 1998-06-26 2006-06-14 株式会社リコー 音響信号の符号化・量子化方法
US6094631A (en) * 1998-07-09 2000-07-25 Winbond Electronics Corp. Method of signal compression
US6128593A (en) * 1998-08-04 2000-10-03 Sony Corporation System and method for implementing a refined psycho-acoustic modeler
US6621936B1 (en) 1999-02-12 2003-09-16 Sony Corporation Method and apparatus for spatial class reduction
US6170074B1 (en) 1999-02-12 2001-01-02 Sony Corporation Source coding to provide for robust error recovery
US6535148B1 (en) * 1999-02-12 2003-03-18 Sony Corporation Method and apparatus for truncated decoding
US6307979B1 (en) 1999-02-12 2001-10-23 Sony Corporation Classified adaptive error recovery method and apparatus
US6418548B1 (en) 1999-02-12 2002-07-09 Sony Corporation Method and apparatus for preprocessing for peripheral erroneous data
US7010737B2 (en) * 1999-02-12 2006-03-07 Sony Corporation Method and apparatus for error data recovery
US6591398B1 (en) 1999-02-12 2003-07-08 Sony Corporation Multiple processing system
US6519369B1 (en) 1999-02-12 2003-02-11 Sony Corporation Method and apparatus for filter tap expansion
US6307560B1 (en) 1999-02-12 2001-10-23 Sony Corporation Classified adaptive spatio-temporal format conversion method and apparatus
AU3999500A (en) * 1999-02-12 2000-08-29 Sony Electronics Inc. Method and apparatus for truncated decoding
US6363118B1 (en) 1999-02-12 2002-03-26 Sony Corporation Apparatus and method for the recovery of compression constants in the encoded domain
US6473876B1 (en) 1999-06-29 2002-10-29 Sony Corporation Method and apparatus for encoding of bitstreams using rotation
US6493842B1 (en) 1999-06-29 2002-12-10 Sony Corporation Time-varying randomization for data synchronization and implicit information transmission
US6549672B1 (en) * 1999-06-29 2003-04-15 Sony Corporation Method and apparatus for recovery of encoded data using central value
US6389562B1 (en) 1999-06-29 2002-05-14 Sony Corporation Source code shuffling to provide for robust error recovery
US6166663A (en) * 1999-07-16 2000-12-26 National Science Council Architecture for inverse quantization and multichannel processing in MPEG-II audio decoding
US6351494B1 (en) 1999-09-24 2002-02-26 Sony Corporation Classified adaptive error recovery method and apparatus
US6522785B1 (en) 1999-09-24 2003-02-18 Sony Corporation Classified adaptive error recovery method and apparatus
US6539517B1 (en) 1999-11-09 2003-03-25 Sony Corporation Data transformation for explicit transmission of control information
US6754371B1 (en) 1999-12-07 2004-06-22 Sony Corporation Method and apparatus for past and future motion classification
US6754618B1 (en) * 2000-06-07 2004-06-22 Cirrus Logic, Inc. Fast implementation of MPEG audio coding
JP2002196792A (ja) * 2000-12-25 2002-07-12 Matsushita Electric Ind Co Ltd 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
US7752052B2 (en) * 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
US20030233228A1 (en) * 2002-06-03 2003-12-18 Dahl John Michael Audio coding system and method
US20040002859A1 (en) * 2002-06-26 2004-01-01 Chi-Min Liu Method and architecture of digital conding for transmitting and packing audio signals
KR20050028193A (ko) * 2003-09-17 2005-03-22 삼성전자주식회사 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체
KR100682890B1 (ko) * 2004-09-08 2007-02-15 삼성전자주식회사 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
GB2454208A (en) 2007-10-31 2009-05-06 Cambridge Silicon Radio Ltd Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data
EP4346235A1 (en) * 2022-09-29 2024-04-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method employing a perception-based distance metric for spatial audio

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3805946A1 (de) * 1988-02-25 1989-09-07 Fraunhofer Ges Forschung Vorrichtung zur ermittlung von charakteristischen parametern aus den eingangs- und ausgangssignalen eines systems fuer die audiosignalverarbeitung
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
EP0535889B1 (en) * 1991-09-30 1998-11-11 Sony Corporation Method and apparatus for audio data compression
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09321628A (ja) * 1996-05-29 1997-12-12 Nec Corp 音声符号化装置
JP2009501359A (ja) * 2005-07-15 2009-01-15 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置
JP2012198555A (ja) * 2005-07-15 2012-10-18 Samsung Electronics Co Ltd オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置
US8615391B2 (en) 2005-07-15 2013-12-24 Samsung Electronics Co., Ltd. Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
JP2016527546A (ja) * 2013-07-01 2016-09-08 華為技術有限公司Huawei Technologies Co.,Ltd. 信号の符号化および復号化の方法および装置
US10152981B2 (en) 2013-07-01 2018-12-11 Huawei Technologies Co., Ltd. Dynamic bit allocation methods and devices for audio signal
US10789964B2 (en) 2013-07-01 2020-09-29 Huawei Technologies Co., Ltd. Dynamic bit allocation methods and devices for audio signal

Also Published As

Publication number Publication date
KR100269213B1 (ko) 2000-10-16
JP3274285B2 (ja) 2002-04-15
DE4428193C2 (de) 2003-02-06
US5649053A (en) 1997-07-15
DE4428193A1 (de) 1995-05-04
KR950013054A (ko) 1995-05-17

Similar Documents

Publication Publication Date Title
JPH07183818A (ja) オーディオ信号の符号化方法及びその装置
JP3141450B2 (ja) オーディオ信号処理方法
JP3131542B2 (ja) 符号化復号化装置
CA2027136C (en) Perceptual coding of audio signals
JP4579273B2 (ja) ステレオ音響信号の処理方法と装置
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
JP4628861B2 (ja) 複数のルックアップテーブルを利用したデジタル信号の符号化方法、デジタル信号の符号化装置及び複数のルックアップテーブル生成方法
KR100289733B1 (ko) 디지탈 오디오 부호화 방법 및 장치
JP3927627B2 (ja) ディジタル・オーディオ符号化方法
US6466912B1 (en) Perceptual coding of audio signals employing envelope uncertainty
JP3395001B2 (ja) ディジタルオーディオ信号の適応的符号化方法
US6128593A (en) System and method for implementing a refined psycho-acoustic modeler
JP3465341B2 (ja) オーディオ信号符号化方法
KR100300957B1 (ko) 룩업테이블을이용한디지탈오디오부호화방법및장치
KR100289732B1 (ko) 다채널 디지탈 오디오의 비트할당방법 및 회로
KR100590340B1 (ko) 디지털 오디오 부호화 방법 및 장치
JPH0750589A (ja) サブバンド符号化装置
JPH09274500A (ja) ディジタルオーディオ信号の符号化方法
JPH08204575A (ja) 適応的符号化システム及びビット割当方法
KR0140681B1 (ko) 디지탈 오디오 데이타 부호화장치
KR0144841B1 (ko) 음향신호의 적응적 부호화 및 복호화장치
KR0138325B1 (ko) 오디오 신호 부호화 방법
KR100300956B1 (ko) 룩업테이블을이용한디지탈오디오부호화방법및장치
JP3089690B2 (ja) ディジタルデータの高能率符号化方法
JP2001249699A (ja) 音声圧縮装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080201

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090201

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120201

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130201

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140201

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term