JP2000276198A - デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 - Google Patents

デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Info

Publication number
JP2000276198A
JP2000276198A JP11080372A JP8037299A JP2000276198A JP 2000276198 A JP2000276198 A JP 2000276198A JP 11080372 A JP11080372 A JP 11080372A JP 8037299 A JP8037299 A JP 8037299A JP 2000276198 A JP2000276198 A JP 2000276198A
Authority
JP
Japan
Prior art keywords
audio signal
block
short
blocks
short transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11080372A
Other languages
English (en)
Inventor
Sadafumi Araki
禎史 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP11080372A priority Critical patent/JP2000276198A/ja
Publication of JP2000276198A publication Critical patent/JP2000276198A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 入力音響信号のサンプリング周波数の違いに
も対応して、音質が劣化しないように適切にショートブ
ロックをグループ分けし、かつロング/ショートの別が
判別できるデジタル音響信号符号化装置及び方法を提供
する。 【解決手段】 各々の短い変換ブロック毎に算出した入
力音響信号の知覚エントロピーを算出し、知覚エントロ
ピーの最大値と最小値との差を求め、該最大値と最小値
との差と、入力音響信号のサンプリング周波数毎に予め
定めた閾値とを比較し、比較結果に基づいて、複数の短
い変換ブロックのグループ分けを行い、分けられたグル
ープの数によって音響信号のブロックをロングブロック
又はショートブロックのいずれかで変換するかを判定す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はデジタル音響信号符
号化装置、デジタル音響信号符号化方法及びデジタル音
響信号符号化プログラムを記録した媒体に関し、特に例
えばDVD、デジタル放送等に利用するデジタル音響信
号の圧縮・符号化に関する。
【0002】
【従来の技術】従来より、デジタル音響信号の高品質圧
縮・符号化においては、人間の聴覚心理特性が利用され
ている。その特性は、小さな音が大きな音によってマス
キングされて聴こえなくなるというものである。即ち、
ある周波数で大きな音が発生すると、その近傍の周波数
の小さな音はマスクされて人間の耳には感知されなくな
る。ここで、マスクされて聴こえなくなる限界の強度を
マスキング閾値という。一方、人間の耳はマスキングと
は無関係に、4kHz付近の音に対して最も感度が良
く、それより上下の帯域になればなるほど次第に感度が
悪くなっていくという性質もある。この性質は、静寂な
状況で音を感知し得る限界の強度として表され、これを
絶対可聴閾値という。
【0003】これらのことを音響信号の強度分布を示す
図9に従って説明する。太い実線(A)が音響信号の強
度分布、点線(B)がこの音響信号に対するマスキング
閾値、そして、細い実線(C)が絶対可聴閾値を、それ
ぞれ表す。同図に示すように、人間の耳には、音響信号
に対するマスキング閾値及び絶対可聴閾値よりも大きな
強度の音のみ感知できる。従って、音響信号の強度分布
の中で、音響信号に対するマスキング閾値及び絶対可聴
閾値よりも大きな部分の情報のみを取りだしても、聴覚
的には元の音響信号と同じように感じられるのである。
【0004】このことは、音響信号の符号化において
は、図9の斜線で示した部分のみに符号化ビットを割り
当てることと等価である。ただし、ここでのビット割り
当ては、音響信号の全体域を複数の小帯域に分割して、
その分割帯域(D)の単位で行っている。各斜線の領域
の横幅は、その分割体域幅に相当する。
【0005】各分割帯域で、斜線領域の下限の強度以下
の音は耳に聴こえない。よって、原音と符号/復号化音
の強度の誤差がこの下限を超えなければ両者の差を感知
できない。その意味で、この下限の強度を許容誤差強度
と呼ぶ。音響信号を量子化して圧縮するに際し、原音に
対する符号/復号化音の量子化誤差強度が許容誤差強度
以下になるように量子化すれば、原音の音質を損なわず
に音響信号を圧縮できる。よって、図9の斜線領域のみ
に符号化ビットを割り当てるということは、各分割帯域
での量子化誤差強度がちょうど許容誤差強度になるよう
に量子化することと等価である。
【0006】この音響信号の符号化方式としては、MP
EG(Moving Picture Experts
Group) AudioやDolby Digit
al等があるが、いずれもここで説明したような性質を
用いている。その中で、現在最も符号化効率がよいとさ
れているが、ISO/IEC 13818−7にて標準
化されているMPEG−2AudioAAC(Adva
nced AudioCoding)という方式であ
る。
【0007】図10はAACの符号化の基本的な構成を
示すブロック図である。同図において、聴覚心理モデル
部71は時間軸に沿ってブロック化された入力音響信号
の各分割帯域毎に許容誤差強度を算出する。一方、同じ
くブロック化された入力信号に対して、ゲインコントロ
ール72及びフィルタバンク73ではMDCT(Mod
ified Discrete Cosine Tra
nsform)による周波数領域への変換を行い、TN
S(Temporal Noise Shaping)
74、予測器76では予測符号化、そしてインテンシテ
ィ/カップリング75及びMSステレオ(Middle
Side Stereo)(以下M/Sと略す)77
では、ステレオ相関符号化処理を、それぞれ行う。その
後、正規化係数78を決定し、量子化器79ではその正
規化係数78を基に音響信号を量子化する。この正規化
係数は図9の許容誤差強度に対応するもので、各分割帯
域毎に定められる。量子化後、ノイズレスコーディング
80では予め定められたハフマン符号表に基づいて、正
規化係数と量子化値にそれぞれハフマン符号を与えてノ
イズレスコーディングを行い、最後にマルチプレクサ8
1にて符号ビットストリームを形成する。
【0008】さて、上述のフィルタバンク73における
MDCTとは、図11に示すように時間軸に沿って変換
領域を50%ずつオーバーラップさせながらDCTを施
すものである。これによって、各変換領域の境界部での
歪みの発生が抑えられる。また、生成されるMDCT係
数の数は変換領域のサンプル数の半分である。AACで
は入力音響信号ブロックに対して、2048サンプルの
長い変換領域(ロングブロック)、又は各256サンプ
ルの8個の短い変換領域(ショートブロック)のいずれ
かを適用する。よって、MDCT係数の数はロングの場
合は1024、ショートでは128となる。ショートブ
ロックは常に8ブロックを連続して適用することによ
り、ロングブロックを用いた場合とMDCT係数の数を
合わせるようになっている。
【0009】一般に、図12のように信号波形の変化の
少ない定常的な部分にはロングブロックを、図13のよ
うに変化の激しいアタック部にはショートブロックを用
いる。この両者の使い分けは重要で、もし図13のよう
な信号にロングブロックを適用すると、本来のアタック
の前にプリエコーとよばれるノイズが発生する。また、
図12のような信号にショートブロックを適用すると、
周波数領域での解像度の不足から適切なビット割り当て
がなされずに符号化効率が低下し、やはりノイズが発生
し、特に低周波数の音に対しては顕著である。
【0010】ショートブロックについては、さらに、グ
ループ分けの問題がある。グループ分けとは、上記の8
つのショートブロックを、正規化係数の同じ連続するブ
ロックごとにまとめてグループ化することである。グル
ープ内で正規化係数を共通化することで、情報量の削減
効果が上がる。具体的には、図10のノイズレスコーデ
ィング80にて正規化係数にハフマン符号を割り当てる
際に、各ショートブロック単位ではなく、グループ単位
で割り当てるのである。図14にグループ分けの一例を
示す。ここではグループ数が3で、各グループ内のブロ
ック数は、最初の第0グループでは5、次の第1グルー
プでは1、最後の第2グループでは2、となっている。
グループ分けを適切に行わないと、符号量の増加や音質
の低下を招く。グループの分割数が多きすぎると、本来
共通化できるはずの正規化係数を重複して符号化するこ
とになり、符号化効率が低下する。逆に、グループ数が
少なすぎると、音響信号の変化が激しいにも拘わらず共
通の正規化係数で量子化することになるので、音質が低
下する。なお、ISO/IEC13818−7では、グ
ループ分けに関して、符号のシンタクスの規定はあるも
のの、具体的なグループ分けの基準や手法については考
慮されていない。
【0011】前述のように、符号化に際しては入力音響
信号ブロックに対して適切にロングブロックとショート
ブロックを区別して適用しなければならない。このロン
グ/ショートの判定を行うのは図10の聴覚心理モデル
部71である。ISO/IEC13818−7では、聴
覚心理モデル部71における、各着目ブロックに対する
ロング/ショートの判定方法の一例が示されている。そ
の判定処理の概要を以下に説明する。
【0012】ステップ1:音響信号の再構築 ロングブロック用に1024サンプル(ショートブロッ
ク用には128サンプル)を新たに読み込み、前ブロッ
クにて既に読み込んでいる1024サンプル(128サ
ンプル)と合わせて2048サンプル(256サンプ
ル)の信号系列を再構築する。
【0013】ステップ2:ハン窓の掛け合わせとFFT ステップ1にて構築した2048サンプル(256サン
プル)の音響信号にハン窓を掛け合わせ、さらに、FF
T(Fast Fourier Transform)
を施して1024個(128個)のFFT係数を算出す
る。
【0014】ステップ3:FFT係数の予測値の計算 先行する2ブロック分のFFT係数の実数部と虚数部か
ら、現在着目しているブロックのFFT係数の実数部と
虚数部を予測し、それぞれ1024個(128個)の予
測値を算出する。
【0015】ステップ4:非予測可能性値の計算 ステップ2にて算出した各FFT係数の実数部と虚数部
と、ステップ3にて算出した各FFT係数の実数部と虚
数部の予測値から、それぞれの非予測可能性値を算出す
る。ここで、非予測可能性値は0から1の間の値をと
り、0に近いほど音響信号の純音性が高く、1に近いほ
ど雑音性が高い、言い替えれば純音性が低いことを示
す。
【0016】ステップ5:各分割帯域での音響信号の強
度と非予測可能性値の計算 ここでの分割帯域は、図9で示したものに相当する。各
分割帯域毎に、ステップ2にて算出した各FFT係数を
基にして音響信号の強度を算出する。さらに、ステップ
4にて算出した非予測可能性値を強度で重み付けして、
各分割帯域毎の非予測可能性値を算出する。
【0017】ステップ6:広がり関数を掛けた強度と非
予測可能性値の畳み込み 各分割帯域における他の分割帯域の音響信号強度及び非
予測可能性値の影響を広がり関数で求め、それぞれを畳
み込んで正規化する。
【0018】ステップ7:純音性指標の計算 各分割帯域bにおいて、ステップ6にて算出した畳み込
み非予測可能性値(cb(b))を基に、純音性指標t
b(b)(=−0.299−0.43loge(cb
(b)))を算出する。さらに、純音性指標を0から1
の間に制限する。ここで、指標が1に近いほど音響信号
の純音性が高く、0に近いほど雑音性が高いことを示
す。
【0019】ステップ8:S/N比の計算 各分割帯域において、ステップ7にて算出した純音性指
標を基に、S/N比を算出する。ここで、一般に雑音成
分のほうが純音成分よりもマスキング効果が大きいとい
う性質を利用する。
【0020】ステップ9:強度比の計算 各分割帯域において、ステップ8にて算出したS/N比
を基に、畳み込み音響信号強度とマスキング閾値の比を
算出する。
【0021】ステップ10:許容誤差強度の計算 各分割帯域において、ステップ6にて算出した畳み込み
音響信号強度と、ステップ9にて算出した音響信号強度
とマスキング閾値の比を基に、マスキング閾値を算出す
る。
【0022】ステップ11:プリエコー調整と絶対可聴
閾値の考慮 各分割帯域において、ステップ10にて算出したマスキ
ング閾値を、前ブロックでの許容誤差強度を用いてプリ
エコー調整する。さらに、この調整値と絶対可聴閾値の
大きい方の値を、現ブロックでの許容誤差強度とする。
【0023】ステップ12:知覚エントロピーの計算 ロングブロック用とショートブロック用のそれぞれにつ
いて、式(1)で定義される知覚エントロピー(Per
ceptual Entropy(PE))を算出す
る。
【0024】
【数1】
【0025】ただし、w(b)は分割帯域bの幅、nb
(b)はステップ11にて算出した分割帯域bにおける
許容誤差強度、e(b)はステップ5にて算出した分割
帯域bにおける音響信号の強度、をそれぞれ示す。ここ
で、PEは図9におけるビット割り当て領域(斜線領
域)の面積の総和に対応すると考えられる。
【0026】ステップ13:ロング/ショートブロック
の判定(図15に示すロング/ショートブロック判定動
作フローを参照) ステップ12にて算出したロングブロック用のPEの値
(ステップS10)が、予め定められた定数(swit
ch_pe)より大きい場合は、着目ブロックをショー
トブロックと判定し(ステップS11,S12)、小さ
い場合はロングブロックと判定する(ステップS11,
S13)。ここで、switch_peはアプリケーシ
ョンに依存して決められる値である。
【0027】以上が、ISO/IEC13818−7に
て記載されたロング/ショートの判定方法である。とこ
ろが、上述のISO/IEC13818−7にて記載さ
れたロング/ショートブロックの判定方法では、必ずし
も適切な判定がなされない。つまり、本来ショートと判
定すべき部分をロングと判定して(またはその逆で)、
音質の劣化を生じる場合がある。
【0028】一方、特開平9−232964号公報で
は、入力信号を所定区間毎に取り込んで2乗和をそれぞ
れ求め、各区間毎に2乗和された信号の少なくとも2以
上の区間にわたる変化度によって上記信号の過渡状態を
検出するように過渡状態検出回路2を構成し、直交変換
処理やフィルタ処理を行わずに、時間軸上の入力信号の
2乗和計算を行うだけで過渡状態、即ち、ロング/ショ
ートが変化する部分を検出することができるようにして
いる。この方法では入力信号の2乗和のみを用いて、知
覚エントロピーを考慮していないので、必ずしも聴覚上
の特性に合致した判定ができず、音質が劣化する恐れが
ある。
【0029】そこで、同一グループ内の各ショートブロ
ックに関する知覚エントロピーの最大値と最小値の差が
予め定められた閾値より小さくなるように入力音響信号
ブロックをグループ分けし、その結果、グループ数が1
の場合、又はこれと他の条件を満足する場合は入力音響
信号ブロックを1つのロングブロックで周波数領域に変
換し、それ以外の場合は複数のショートブロックで変換
するという方法がある。この方法について動作フローを
示す図16に従って以下に説明する。なお、入力音響信
号の例として、図17の音響データを用い、図17では
連続する8つの各ショートブロックに対応する通し番号
を付している。
【0030】先ず、入力された音響信号は連続する8つ
のショートブロックに分割される。そして、この8つの
ショートブロックの知覚エントロピーをそれぞれ計算
し、これらを順にPE(i)(0≦i≦7)とする(ス
テップS80)。この計算は、上述のISO/IEC1
3818−7における各着目ブロックに対するロング/
ショートの判定方法のステップ1からステップ12にて
説明した方法を各ショートブロックに対して行うことで
実現する。次に、group_len[0]=1,gr
oup_len[gnum]=0(0≦gnum≦7)
と初期化する(ステップS81)。ここで、gnumは
グループ分におけるグループの通し番号、group_
len[gnum]は第gnumグループ内に含まれる
ショートブロックの数、をそれぞれ表す。そして、gn
um=0,min=PE(0),max=PE(0)と
それぞれ初期化する(ステップS82)。このmin,
maxは、PE(i)の最小値、最大値をそれぞれ表
す。図18により、ここでは、min=110,max
=110となる。さらに、インデックスiをi=1と初
期化する(ステップS83)。このインデックスはショ
ートブロックの通し番号に対応する。
【0031】次に、PE(i)によってmin、又はm
axの更新をする。即ち、PE(i)<minならmi
n=PE(i)、PE(i)>maxならmax=PE
(i)とする(ステップS84)。図18の例では、P
E(1)=96なので、min=96、max=110
となる。そして、グループ分けの判定をする(ステップ
S85)。即ち、求めたmax−minが予め定められ
た閾値thと比較されて当該閾値th以上の場合は、シ
ョートブロックi−1とiの間でグループ分けを行うた
めにステップS86に進み、thより小さい場合は、シ
ョートブロックi−1とiが同一グループに含まれると
判定してステップS87に進むのである。この例ではt
h=50としておく。即ち、同一のグループに含まれる
各ショートブロックのPE(i)の最大値と最小値の差
が50より小さくなるように、グループ分けするという
ことである。i=1のときは、max−min=110
−96=14<50=thなので、ショートブロック0
と1は同一グループに含まれると判定されてステップS
87へ進む。なお、ここではgnum=0なので、ショ
ートブロック0と1は第0グループに含まれる。そし
て、group_len[gnum]の値を1だけイン
クリメントする(ステップS88)。これは、第gnu
mグループに含まれるショートブロックの数を1だけ増
やすということである。この例では、ステップS81,
S82でgnum=0かつgroup_len[0]=
1と初期化されているので、ステップS87ではgro
up_len[0]=2となる。これは、第0グループ
に含まれるショートブロックとしてブロック0,1の2
つのブロックが既に確定していることに対応する。
【0032】次に、インデックスiを1だけインクリメ
ントし(ステップS88)、iが7より小さい場合はス
テップS84へ戻る(ステップS89)。この例ではi
=2<7となるのでステップS84へ戻る。
【0033】その後、以上で説明したのと同様の動作が
i=4まで続く。i=4のときは、図18より、図16
のステップS84にてmin=96,max=137と
なるので、ステップS85ではmax−min=41<
50=thと判定され、やはり、ステップS85からそ
のままステップS87へ進む。そして、ステップS87
にて、group_len[0]=5となる。これは即
ち、第0グループに含まれるショートブロックとしてブ
ロック0,1,2,3,4の5つのブロックが確定した
ことに対応する。そして、ステップS88にてi=5と
なった後、ステップS89を経て再びステップS84に
戻ると、今度はPE(5)=152なのでmin=9
6,max=152となる。すると、ステップS85で
はmax−min=56>50=thと判定されるの
で、ステップS86へ進む。これはショートブロック4
と5の間でグループ分けを行うことを意味する。ステッ
プS86ではgnumの値を1だけインクリメントし、
かつ、min,maxをそれぞれ最新のPE(i)に置
き換える。ここでは、gnum=1,min=152,
max=152となる。gnum=1はショートブロッ
ク5が含まれるグループが第1グループであることに対
応する。
【0034】次に、ステップS87でgroup_le
n[1]を1だけインクリメントする。group_l
en[1]はステップS81にて0に初期化されていた
ので、ここで改めてgroup_len[1]=1とな
る。これは、第1グループに含まれるショートブロック
としてブロック5の1つのブロックが確定したことに対
応する。
【0035】以下同様に、図16のステップS88でi
=6となり、ステップS89からまたステップS84へ
戻ると、今度は図18よりPE(6)=269なので、
min=152,max=269となり、ステップS8
5にてmax−min=117>50と判定され、ステ
ップS86へ進む。つまり、ショートブロック5と6の
間でもグループ分けがなされるのである。そして、ステ
ップS86にてgnum=2,min=269,max
=269となり、さらにステップS87でgroup_
len[2]=1となる。そして、ステップS88でi
=7とした後これまでと同様に、ステップS84でPE
(7)=231なので、min=231,max=26
9となり、ステップS85にてmax−min=38<
50と判定され、ステップS87へ進む。つまり、ショ
ートブロック6と7はいずれも第2グループに含まれ
る。これに対応して、ステップS87でgroup_l
en[2]=2となる。さて、次のステップS88でi
=8となるとステップS89の判定により、ステップS
90へ進む。これで、8つのショートブロック全てにつ
いてのグループ分けが完了したことになる。
【0036】この例では、結局、gnum=2,gro
up_len[0]=5,group_len[1]=
1,group_len[2]=2となる。即ち、グル
ープの数は3で、各グループに含まれるショートブロッ
クの数は、第0グループが5、第1グループが1、第2
グループが2という結果である。これは、図14に示し
たグループ分けの例と同様のものである。
【0037】
【発明が解決しようとする課題】しかしながら、この方
法では、入力音響信号のサンプリング周波数の違いを考
慮していない。前述のように、人間の耳は4kHz付近
の音に対して最も感度が良く、4kHz付近より上下の
大気にならばなるほど次第に感度が悪くなっていく。即
ち、4kHz以上の周波数領域では周波数が大きくなる
につれて絶対可聴閾値も増大していく。このことは、入
力音響信号のサンプリング周波数が大きくなればなるほ
ど、絶対可聴閾値の影響が増大していくことを示すもの
である。これにより、上述のISO/IEC13818
−7における各項目ブロックに対するロング/ショート
の判定方法のステップ11にて絶対可聴閾値の方が大き
くなるような分割帯域の数が増え、ステップ12におけ
るnb(b)のウェイトが大きくなり、結果的手に知覚
エントロピーPEの値をマイナス方向により小さくする
方向に作用する。逆に、サンプリング周波数が小さい場
合は、絶対可聴閾値の影響は相対的に小さいくなり、知
覚エントロピーPEの値はプラス方向に向かう。これ以
外にも、サンプリング周波数によって各分割帯域の周波
数方向の解像度が変化するという要因も加わるので、知
覚エントロピーPEの値を評価するには、サンプリング
周波数の違いを考慮するのが望ましい。
【0038】本発明はこれらの問題点を解決するための
ものであり、入力音響信号のサンプリング周波数の違い
にも対応して、音質が劣化しないように適切にショート
ブロックをグループ分けし、かつロング/ショートの別
が判別できる、デジタル音響信号装置、デジタル音響信
号符号化方法及びデジタル音響信号符号化プログラムを
記録した媒体を提供することを目的とする。
【0039】
【課題を解決するための手段】本発明によれば、入力音
響信号を複数のショートブロックに分割し、それぞれの
ショートブロックに関する知覚エントロピーに基づいて
グループ化し、その際に、各グループに含まれるショー
トブロックの知覚エントロピーの最大値と最小値の差が
予め定めた閾値以下になるようにグループ化し、またロ
ング/ショートの判定に関し、入力音響信号ブロックを
知覚エントロピーに基づくグループ分けをした結果のグ
ループ数によって判定し、その際に、グループ数が1の
場合は入力音響信号ブロックの聴覚上の特性の変化が少
ないとみなしてロングと判定し、グループ数が2以上の
場合は変化が大きいとみなしてショートと判定するよう
にするために、閾値をサンプリング周波数毎に個別に定
めることにより、入力音響信号のサンプリング周波数の
違いに応じた適切なショートブロックのグループ分けと
ロング/ショートの判定ができる。
【0040】また、ロング/ショートの判定に関し、ロ
ングブロックに関する知覚エントロピーについて任意の
閾値をサンプリング周波数毎に個別に定めることによ
り、入力音響信号のサンプリング周波数の違いに応じた
適切なロング/ショートの判定ができる。
【0041】更に、本発明のデジタル音響信号符号化方
法を実行するプログラムが記録した媒体を用いることに
より、既存のシステムを変えることなく、かつ符号化シ
ステムを構築する装置を汎用的に使用することができ
る。
【0042】
【発明の実施の形態】各々の短い変換ブロック毎に算出
した入力音響信号の知覚エントロピーを算出する知覚エ
ントロピー算出手段と、該知覚エントロピー算出手段に
よって算出された知覚エントロピーの最大値と最小値と
の差を求める最大・最小値差算出手段と、該最大値と最
小値との差と、入力音響信号のサンプリング周波数毎に
予め定めた閾値とを比較する比較手段と、該比較手段に
よる比較結果に基づいて、複数の短い変換ブロックのグ
ループ分けを行うグルーピング手段と、該グルーピング
手段によって分けられたグループの数によって音響信号
のブロックをロングブロック又はショートブロックのい
ずれかで変換するかを判定するロング/ショートブロッ
ク判定手段とを具備する。
【0043】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明の一実施例に係るデジタル音響信号
符号化装置の構成を示すブロックである。同図に示す本
実施例のデジタル音響信号符号化装置は、入力された音
響信号を所定の数、以下の説明では8つの連続するブロ
ックに分割するブロック分割手段11、分割された各ブ
ロックの知覚エントロピーPEを上述した算出式によっ
て計算する知覚エントロピー算出手段12、算出された
知覚エントロピーの最大値と最小値の差を求める最大・
最小値差算出手段13、最大値と最小値の差と予め定め
た閾値とを比較する比較手段14、比較結果に応じてグ
ループ分けを行うグルーピング手段15、グループ分け
の状態に応じてロングブロック又はショートブロックの
いずれかを判定するロング/ショートブロック判定手段
16及び各手段の動作を制御する制御手段17を含んで
構成されている。ここで、図2はデジタル音響信号符号
化装置の動作を示すフローチャートである。以下、両図
を用いて本実施例の具体的な動作を説明する。その際、
入力音響信号の例として、図17の音響データを用い
る。
【0044】先ず、ブロック分割手段11によって入力
された音響信号は連続する8つのショートブロックに分
割される。そして、この8つのショートブロックの知覚
エントロピーを知覚エントロピー算出手段12によって
それぞれ計算し、これらを順にPE(i)(0≦i≦
7)とする(ステップS20)。この計算は、上述のI
SO/IEC13818−7における各着目ブロックに
対するロング/ショートの判定方法のステップ1からス
テップ12にて説明した方法を各ショートブロックに対
して行うことで実現する。ここでは、図17の音響デー
タに対しては図18に示すような知覚エントロピーPE
(i)が算出されたとする。
【0045】次に、group_len[0]=1,g
roup_len[gnum]=0(0≦gnum≦
7)と初期化する(ステップS21)。ここで、gnu
mはグループ分におけるグループの通し番号、grou
p_len[gnum]は第gnumグループ内に含ま
れるショートブロックの数、をそれぞれ表す。そして、
gnum=0,min=PE(0),max=PE
(0)とそれぞれ初期化する(ステップS22)。この
min,maxは、PE(i)の最小値、最大値をそれ
ぞれ表す。図18により、ここでは、min=110,
max=110となる。さらに、インデックスiをi=
1と初期化する(ステップS23)。このインデックス
はショートブロックの通し番号に対応する。
【0046】次に、PE(i)によってmin、又はm
axの更新をする。即ち、PE(i)<minならmi
n=PE(i)、PE(i)>maxならmax=PE
(i)とする(ステップS24)。図18の例では、P
E(1)=96なので、min=96、max=110
となる。そして、グループ分けの判定をする(ステップ
S25)。即ち、最大・最小値差算出手段13によって
求めたmax−minが比較手段14にて予め定められ
た閾値TH1と比較されて当該閾値TH1以上の場合
は、ショートブロックi−1とiの間でグルーピング手
段15にてグループ分けを行うためにステップS26に
進み、TH1より小さい場合は、制御手段17によりシ
ョートブロックi−1とiが同一グループに含まれると
判定してステップS27に進むのである。この例ではT
H1=50としておく。即ち、同一のグループに含まれ
る各ショートブロックのPE(i)の最大値と最小値の
差が50より小さくなるように、グループ分けするとい
うことである。i=1のときは、max−min=11
0−96=14<50=TH1なので、ショートブロッ
ク0と1は同一グループに含まれると判定されてステッ
プS27へ進む。なお、ここではgnum=0なので、
ショートブロック0と1は第0グループに含まれる。
【0047】そして、group_len[gnum]
の値を1だけインクリメントする(ステップS27)。
これは、第0gnumグループに含まれるショートブロ
ックの数を1だけ増やすということである。この例で
は、ステップS21,S22でgnum=0かつgro
up_len[0]=1と初期化されているので、ステ
ップS27ではgroup_len[0]=2となる。
これは、第0グループに含まれるショートブロックとし
てブロック0,1の2つのブロックが既に確定している
ことに対応する。
【0048】次に、インデックスiを1だけインクリメ
ントし(ステップS28)、iが7より小さい場合はス
テップS24へ戻る(ステップS29)。この例ではi
=2<7となるのでステップS24へ戻る。
【0049】その後、以上説明したのと同様の動作がi
=4まで続く。i=4のときは、図18より、min=
96,max=137となるので、ステップS25では
最大・最小値差算出手段13及び比較手段14並びに制
御手段17によってmax−min=41<50=TH
1と判定され、やはりステップS25へそのままステッ
プS27にて、group_len[0]=5となる。
これは即ち、第0グループに含まれるショートブロック
として0,1,2,3,4の5つのブロックが確定した
ことに対応する。
【0050】そして、ステップS28でi=5となった
後、ステップS29からまたステップS24へ戻ると、
今度は図18よりPE(5)=152なので、min=
96,max=152なる。すると、ステップS25に
て最大・最小値差算出手段13及び比較手段14並びに
制御手段17によってmax−min=56>50=T
H1と判定され、ステップS26へ進む。つまり、これ
はグルーピング手段15によってショートブロック4と
5の間でグループ分けを行なうことを意味する。そし
て、ステップS26にてgnumの値を1だけインクリ
メントし、かつmin,maxをそれぞれ最新のPE
(i)に置き換える。ここではgnum=1,min=
152,max=152となる。gnum=1はショー
トブロック5が含まれるグループが第1グループである
ことに対応する。次に、ステップS27でgroup_
len[1]を1だけインクリメントする。group
_len[1]はステップS21にて0に初期化されて
いたので、ここで改めてgroup_len[1]=1
となる。これは、第1グループに含まれるショートブロ
ックとしてブロック5の1つのブロックが確定したこと
に対応する。
【0051】以下同様に、ステップS28でi=6とな
り、ステップS29からまたステップS24へ戻ると、
今度は図18よりPE(6)=269なので、min=
152,max=269となり、ステップS25にて最
大・最小値差算出手段13及び比較手段14並びに制御
手段17によってmax−min=117>50と判定
され、ステップS26へ進む。つまり、グルーピング手
段15によってショートブロック5と6の間でもグルー
プ分けがなされるのである。そして、ステップS26に
てgnum=2,min=269,max=269とな
り、更にステップS27group_len[2]=1
となる。
【0052】そして、ステップS28でi=7とした後
これまでと同様に、ステップS24でPE(7)=23
1なので、min=231,max=269となり、ス
テップS25にて最大・最小値差算出手段13及び比較
手段14並びに制御手段17によってmax−min=
38<50と判定され、ステップS27へ進む。つま
り、ショートブロック6と7はいずれも第2グループに
含まれる。これに対応して、ステップS27でgrou
p_len[2]=2となる。
【0053】さて、次のステップS28でi=8となる
とステップS29の判定により、ステップS30へ進
む。これで、8つのショートブロック全てについてのグ
ループ分けが完了したことになる。
【0054】この例では、結局、gnum=2,gro
up_len[0]=5,group_len[1]=
1,group_len[2]=2となる。即ち、グル
ープの数は3で、各グループに含まれるショートブロッ
クの数は、第0グループが5、第1グループが1、第2
グループが2という結果である。これは図14に示した
グループ分けの例と同様のものである。
【0055】次に、グループ分けの結果グループ数によ
ってロング/ショートを判定する方法を説明する。即
ち、ステップS30にて、gnumの値が0か否かを判
定する。もし0ならば、グループの数は1であり、0で
ないならばグループの数は2以上ということになる。そ
こで、gnum=0ならばステップS31へ進んで入力
音響ブロックを1つのロングブロックによってMDCT
変換するものと判定し、gnum=0でないならばステ
ップS32へ進んで入力音響ブロックを8つのショート
ブロックによってMDCT変換するものと判定する。こ
の例ではgnum=2なので、ステップS32へ進み、
ショートブロックで変換すると判定する。
【0056】以上説明した実施例の方法を、入力音響信
号のサンプリング周波数の違いにも対応できるような方
法を与える。これは、図2のステップS25の閾値TH
1をサンプリング周波数毎に個別に予め定めておくこと
で実現できる。この具体例を図3に示す。これによれ
ば、上記実施例ではTH1=50なのでサンプリング周
波数が44.1kHzの場合である。他のサンプリング
周波数に対しては、例えば24kHzならばTH1=4
0.48kHzならTH1=60という具合に閾値を切
り替えて上記実施例と同様の処理を行なうのである。
【0057】なお、サンプリング周波数が異なる場合で
も、必ずしもTH1が異なる必要はない。各サンプリン
グ周波数に対して適切な閾値を求め、結果的に異なるサ
ンプリング閾値に対して同じTH1を対応づけることに
なっても構わない。例えば、図3では、22.05kH
zと24kHzの両方に対してTH1=40と定めてい
る。
【0058】以上説明したロング/ショートの判定方法
は、これに限定されるものではなく、グループ数だけで
なく、ロングブロックに関する知覚エントロピーの値も
判定に用いても良い。例えば、ロングブロックに関する
知覚エントロピーがこの閾値以下で、かつグループ数が
1の場合に、ロングブロックと判定し、それ以外の場合
はショートブロックと判定する。
【0059】具体例を図4,図5により説明する。図4
は図2とほぼ同じフローチャートであるが、ステップS
50(図2ではステップS30)の部分のみが異なって
いる。ここで、ロングブロックの知覚エントロピーPE
L 、予め定めておく閾値をTH2=500なので、ステ
ップS50にてグループ数が1かつPEL <500の場
合は、ステップS51に進んでロングブロックと判定
し、それ以外の場合はステップS52に進んでショート
ブロックと判定する。他のサンプリング周波数に対して
は、例えば図5で24kHzならばTH2=300、4
8kHzならばTh2=550というように閾値を切り
替えてこれと同様の処理を行なう。ここでも、サンプリ
ング周波数が異なる場合でも、必ずしもTH2が異なる
必要はない。各サンプリング周波数に対して適切な閾値
を求め、結果的に異なるサンプリング閾値に対して同じ
TH2を対応づけることになっても構わない。例えば図
5では、22.05kHzと24kHzの両方に対して
TH2=300と定めている。
【0060】最後に、別の方法として、ロングブロック
に関して知覚エントロピーについての任意の閾値を予め
定めておく。そして、現在着目中の入力音響信号ブロッ
クにおけるロングブロックの知覚エントロピーと、既に
符号化を完了した直前の入力音響信号ブロックにおける
ロングブロックの知覚エントロピーと、既に符号化を完
了した直前の入力音響信号ブロックにおけるロングブロ
ックの知覚エントロピーと、既に符号化を完了した直前
の入力音響信号ブロックにおけるロングブロックの知覚
エントロピーの差が、この閾値以下で、かつグループ数
が1の場合に、ロングブロックと判定し、それ以外の場
合はショートブロックと判定する。
【0061】この具体例を図6、図7により説明する。
図6は図2とほぼ同じフローチャートであるが、ステッ
プS70(図2ではステップS30)の部分のみが異な
っている。ここで、現在着目中の入力音響信号ブロック
におけるロングブロックの知覚エントロピーをPEL
既に符号化を完了した直前の入力音響信号ブロックにお
けるロングブロックの知覚エントロピーをPEL-1 、予
め定めておく閾値をTH3で、それぞれ示している。図
7によれば、サンプリング周波数が44.1kHzのと
きはTH3=100なので、ステップS70にてグルー
プ数が1かつ|PEL −PEL-1 |<100の場合は、
ステップS71に進んでロングブロックと判定し、それ
以外の場合はステップS72に進んでショートブロック
と判定する。他のサンプリング周波数に対しては、例え
ば図7で24kHzならばTH3=70、48kHzな
らばTH3=120というように閾値を切り替えてステ
ップS70,S71で同様の処理を行なう。
【0062】なお、サンプリング周波数が異なる場合で
も必ずしもTH3が異なる必要はない。各サンプリング
周波数に対して適切な閾値を求め、結果的に異なるサン
プリング閾値に対して同じTH3を対応づけることにな
っても構わない。例えば図7では、22.05kHzと
24kHzの両方に対してTH3=70と定めている。
【0063】次に、図8は本発明のシステム構成を示す
ブロック図である。つまり、同図は上記実施例における
デジタル音響信号符号化方法によるソフトウェアを実行
するマイクロプロセッサ等から構築するハードウェアを
示すものである。同図において、デジタル音響信号符号
化システムはインターフェース(以下I/Fと略す)5
1、CPU52、ROM53、RAM54、表示装置5
5、ハードディスク56、キーボード57及びCD−R
OMドライブ58を含んで構成されている。また、汎用
の処理装置を用意し、CD−ROM59などの読取可能
な記録媒体には、本発明のデジタル音響信号符号化方法
を実行するプログラムが記録されている。更に、I/F
51を介して外部装置から制御信号が入力され、キーボ
ード57によって操作者による指令又は自動的に本発明
のプログラムが起動される。そして、CPU52は当該
プログラムに従って上述のデジタル音響信号符号化方法
に伴う符号化制御処理を施し、その処理結果をRAM5
4やハードディスク56等の記憶装置に格納し、必要に
より表示装置55などに出力する。以上のように、本発
明のデジタル音響信号符号化方法を実行するプログラム
が記録した媒体を用いることにより、既存のシステムを
変えることなく、かつ符号化システムを構築する装置を
汎用的に使用することができる。
【0064】なお、本発明は上記実施例に限定されるも
のではなく、特許請求の範囲内に記載であれば多種の変
形や置換可能であることは言うまでもない。
【0065】
【発明の効果】以上説明したように、本発明によれば、
入力音響信号を複数のショートブロックに分割し、それ
ぞれのショートブロックに関する知覚エントロピーに基
づいてグループ化し、その際に、各グループに含まれる
ショートブロックの知覚エントロピーの最大値と最小値
の差が予め定めた閾値以下になるようにグループ化し、
またロング/ショートの判定に関し、入力音響信号ブロ
ックを知覚エントロピーに基づくグループ分けをした結
果のグループ数によって判定し、その際に、グループ数
が1の場合は入力音響信号ブロックの聴覚上の特性の変
化が少ないとみなしてロングと判定し、グループ数が2
以上の場合は変化が大きいとみなしてショートと判定す
るようにするために、閾値をサンプリング周波数毎に個
別に定めることにより、入力音響信号のサンプリング周
波数の違いに応じた適切なショートブロックのグループ
分けとロング/ショートの判定ができる。
【0066】また、ロング/ショートの判定に関し、ロ
ングブロックに関する知覚エントロピーについて任意の
閾値をサンプリング周波数毎に個別に定めることによ
り、入力音響信号のサンプリング周波数の違いに応じた
適切なロング/ショートの判定ができる。
【0067】更に、本発明のデジタル音響信号符号化方
法を実行するプログラムが記録した媒体を用いることに
より、既存のシステムを変えることなく、かつ符号化シ
ステムを構築する装置を汎用的に使用することができ
る。
【図面の簡単な説明】
【図1】本発明に係るデジタル音響信号符号化装置の構
成を示すブロック図である。
【図2】本発明の一実施例に係るデジタル音響信号符号
化方法の動作を示すフローチャートである。
【図3】サンプリング周波数毎の閾値の一例を示す図で
ある。
【図4】本発明の一実施例に係るデジタル音響信号符号
化方法の別の動作を示すフローチャートである。
【図5】サンプリング周波数毎の閾値の別の一例を示す
図である。
【図6】本発明の一実施例に係るデジタル音響信号符号
化方法の更に別の動作を示すフローチャートである。
【図7】サンプリング周波数毎の閾値の更に別の一例を
示す図である。
【図8】本発明のシステム構成を示すブロック図であ
る。
【図9】音響信号とマスキング閾値及び絶対可聴閾値の
強度分布を示す図である。
【図10】AACの符号化の基本的な構成を示すブロッ
ク図である。
【図11】MDCTの変換領域を示す図である。
【図12】変化の少ない信号波形の場合のMDCTの変
換領域を示す図である。
【図13】変化の激しい信号波形の場合のMDCTの変
換領域を示す図である。
【図14】グループ分けの一例を示す図である。
【図15】ISO/IEC13818−7におけるロン
グ/ショートブロック判定動作を示すフローチャートで
ある。
【図16】従来のデジタル音響信号符号化方法の動作を
示すフローチャートである。
【図17】音響信号の一例の信号波形を示す図である。
【図18】音響信号に対する知覚エントロピーとの関係
を示す図である。
【符号の説明】
11 ブロック分割手段 12 知覚エントロピー算出手段 13 最大・最小値差算出手段 14 比較手段 15 グルーピング手段 16 制御手段 17 ロング/ショートブロック判定手段 51 I/F 52 CPU 53 ROM 54 RAM 55 表示装置 56 ハードディスク 57 キーボード 58 CD−ROMドライブ 59 CD−ROM

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 デジタル音響信号を時間軸に沿って入力
    してブロック化し、各ブロック毎にサブバンド分割や周
    波数領域への変換等の処理を施し、該音響信号を複数の
    帯域に分割し、各帯域毎に符号化ビットを割り当て、割
    り当てた符号化ビット数に応じて正規化係数を求め、前
    記音響信号を前記正規化係数で量子化することにより圧
    縮符号化するデジタル音響信号符号化装置であって、前
    記周波数領域への変換を行う際に、ブロック化した前記
    音響信号を1つの長い変換ブロック又は複数の短い変換
    ブロックのいずれかにて変換し、短い変換ブロックを用
    いる場合は当該複数の短い変換ブロックを、それぞれ1
    つまたは複数の短い変換ブロックを含むような複数のブ
    ロックにグループ化し、同一グループ内に含まれる1つ
    または複数の短い変換ブロックには共通の正規化係数を
    対応させて音響信号を量子化するデジタル音響信号符号
    化装置において、 各々の短い変換ブロック毎に算出した入力音響信号の知
    覚エントロピーを算出する知覚エントロピー算出手段
    と、 該知覚エントロピー算出手段によって算出された知覚エ
    ントロピーの最大値と最小値との差を求める最大・最小
    値差算出手段と、 該最大値と最小値との差と、入力音響信号のサンプリン
    グ周波数毎に予め定めた閾値とを比較する比較手段と、 該比較手段による比較結果に基づいて、複数の短い変換
    ブロックのグループ分けを行うグルーピング手段と、 該グルーピング手段によって分けられたグループの数に
    よって音響信号のブロックをロングブロック又はショー
    トブロックのいずれかで変換するかを判定するロング/
    ショートブロック判定手段とを具備することを特徴とす
    るデジタル音響信号符号化装置。
  2. 【請求項2】 デジタル音響信号を時間軸に沿って入力
    してブロック化し、各ブロック毎にサブバンド分割や周
    波数領域への変換等の処理を施し、該音響信号を複数の
    帯域に分割し、各帯域毎に符号化ビットを割り当て、割
    り当てた符号化ビット数に応じて正規化係数を求め、前
    記音響信号を前記正規化係数で量子化することにより圧
    縮符号化するデジタル音響信号符号化装置であって、前
    記周波数領域への変換を行う際に、ブロック化した前記
    音響信号を1つの長い変換ブロック又は複数の短い変換
    ブロックのいずれかにて変換し、短い変換ブロックを用
    いる場合は当該複数の短い変換ブロックを、それぞれ1
    つまたは複数の短い変換ブロックを含むような複数のブ
    ロックにグループ化し、同一グループ内に含まれる1つ
    または複数の短い変換ブロックには共通の正規化係数を
    対応させて音響信号を量子化するデジタル音響信号符号
    化装置において、 各々の短い変換ブロック毎に算出した入力音響信号の第
    1の知覚エントロピーを算出する第1の知覚エントロピ
    ー算出手段と、 各々の長い変換ブロック毎に算出した入力音響信号の第
    2の知覚エントロピーを算出する第2の知覚エントロピ
    ー算出手段と、 前記第1の知覚エントロピーの最大値と最小値との差を
    求める第1の最大・最小値差算出手段と、 前記第2の知覚エントロピーの最大値と最小値との差を
    求める第2の最大・最小値差算出手段と、 前記第1の知覚エントロピーの最大値と最小値との差
    と、入力音響信号のサンプリング周波数毎に予め定めた
    閾値とを比較する第1の比較手段と、 前記第2の知覚エントロピーの最大値と最小値との差
    と、入力音響信号のサンプリング周波数毎に予め定めた
    閾値とを比較する第2の比較手段と、 前記第1の比較手段及び前記第2の比較手段による各比
    較結果に基づいて、複数の短い変換ブロックのグループ
    分けを行うグルーピング手段と、 該グルーピング手段によって分けられたグループの数、
    前記第1の知覚エントロピー算出手段によって算出され
    た各短い変換ブロック毎の第1の知覚エントロピー及び
    前記第2の知覚エントロピー算出手段によって算出され
    た各長い変換ブロック毎の第2の知覚エントロピーによ
    って音響信号のブロックを1つの長いブロック又は複数
    の短いブロックのいずれかで周波数帯域で変換するかを
    判定するロング/ショートブロック判定手段とを具備す
    ることを特徴とするデジタル音響信号符号化装置。
  3. 【請求項3】 デジタル音響信号を時間軸に沿って入力
    してブロック化し、各ブロック毎にサブバンド分割や周
    波数領域への変換等の処理を施し、該音響信号を複数の
    帯域に分割し、各帯域毎に符号化ビットを割り当て、割
    り当てた符号化ビット数に応じて正規化係数を求め、前
    記音響信号を前記正規化係数で量子化することにより圧
    縮符号化するデジタル音響信号符号化方法であって、前
    記周波数領域への変換を行う際に、ブロック化した前記
    音響信号を1つの長い変換ブロック又は複数の短い変換
    ブロックのいずれかにて変換し、短い変換ブロックを用
    いる場合は当該複数の短い変換ブロックを、それぞれ1
    つまたは複数の短い変換ブロックを含むような複数のブ
    ロックにグループ化し、同一グループ内に含まれる1つ
    または複数の短い変換ブロックには共通の正規化係数を
    対応させて音響信号を量子化するデジタル音響信号符号
    化方法において、 各々の短い変換ブロック毎に算出した音響信号の知覚エ
    ントロピーと入力音響信号のサンプリング周波数毎に予
    め定めた閾値とを用いて、複数の短い変換ブロックのグ
    ループ分けを行い、分けられたグループの数によって音
    響信号のブロックをロングブロック又はショートブロッ
    クのいずれかで変換するかを判定することを特徴とする
    デジタル音響信号符号化方法。
  4. 【請求項4】 デジタル音響信号を時間軸に沿って入力
    してブロック化し、各ブロック毎にサブバンド分割や周
    波数領域への変換等の処理を施し、該音響信号を複数の
    帯域に分割し、各帯域毎に符号化ビットを割り当て、割
    り当てた符号化ビット数に応じて正規化係数を求め、前
    記音響信号を前記正規化係数で量子化することにより圧
    縮符号化するデジタル音響信号符号化方法であって、前
    記周波数領域への変換を行う際に、ブロック化した前記
    音響信号を1つの長い変換ブロック又は複数の短い変換
    ブロックのいずれかにて変換し、短い変換ブロックを用
    いる場合は当該複数の短い変換ブロックを、それぞれ1
    つまたは複数の短い変換ブロックを含むような複数のブ
    ロックにグループ化し、同一グループ内に含まれる1つ
    または複数の短い変換ブロックには共通の正規化係数を
    対応させて音響信号を量子化するデジタル音響信号符号
    化方法において、 短い変換ブロック毎及び長い変換ブロックに算出した各
    音響信号の各知覚エントロピーと、各知覚エントロピー
    に関する、入力音響信号のサンプリング周波数毎に予め
    定めた各閾値とを用いて、複数の短い変換ブロックのグ
    ループ分けを行い、グループの数、各知覚エントロピー
    によって音響信号のブロックを1つの長いブロック又は
    複数の短いブロックのいずれかで周波数帯域で変換する
    かを判定することを特徴とするデジタル音響信号符号化
    方法。
  5. 【請求項5】 コンピュータにより、デジタル音響信号
    を時間軸に沿って入力してブロック化し、各ブロック毎
    にサブバンド分割や周波数領域への変換等の処理を施
    し、該音響信号を複数の帯域に分割し、各帯域毎に符号
    化ビットを割り当て、割り当てた符号化ビット数に応じ
    て正規化係数を求め、前記音響信号を前記正規化係数で
    量子化することにより圧縮符号化するデジタル音響信号
    符号化方法であって、前記周波数領域への変換を行う際
    に、ブロック化した前記音響信号を1つの長い変換ブロ
    ック又は複数の短い変換ブロックのいずれかにて変換
    し、短い変換ブロックを用いる場合は当該複数の短い変
    換ブロックを、それぞれ1つまたは複数の短い変換ブロ
    ックを含むような複数のブロックにグループ化し、同一
    グループ内に含まれる1つまたは複数の短い変換ブロッ
    クには共通の正規化係数を対応させて音響信号を量子化
    するように実行するデジタル音響信号符号化プログラム
    を記録した媒体において、 各々の短い変換ブロック毎に算出した音響信号の知覚エ
    ントロピーと入力音響信号のサンプリング周波数毎に予
    め定めた閾値とを用いて、複数の短い変換ブロックのグ
    ループ分けを行い、分けられたグループの数によって音
    響信号のブロックをロングブロック又はショートブロッ
    クのいずれかで変換するかを判定する機能を有するデジ
    タル音響信号符号化プログラムを記録した媒体。
  6. 【請求項6】 コンピュータにより、デジタル音響信号
    を時間軸に沿って入力してブロック化し、各ブロック毎
    にサブバンド分割や周波数領域への変換等の処理を施
    し、該音響信号を複数の帯域に分割し、各帯域毎に符号
    化ビットを割り当て、割り当てた符号化ビット数に応じ
    て正規化係数を求め、前記音響信号を前記正規化係数で
    量子化することにより圧縮符号化するデジタル音響信号
    符号化方法であって、前記周波数領域への変換を行う際
    に、ブロック化した前記音響信号を1つの長い変換ブロ
    ック又は複数の短い変換ブロックのいずれかにて変換
    し、短い変換ブロックを用いる場合は当該複数の短い変
    換ブロックを、それぞれ1つまたは複数の短い変換ブロ
    ックを含むような複数のブロックにグループ化し、同一
    グループ内に含まれる1つまたは複数の短い変換ブロッ
    クには共通の正規化係数を対応させて音響信号を量子化
    するように実行するデジタル音響信号符号化プログラム
    を記録した媒体において、 短い変換ブロック毎及び長い変換ブロックに算出した各
    音響信号の各知覚エントロピーと、各知覚エントロピー
    に関する、入力音響信号のサンプリング周波数毎に予め
    定めた各閾値とを用いて、複数の短い変換ブロックのグ
    ループ分けを行い、グループの数、各知覚エントロピー
    によって音響信号のブロックを1つの長いブロック又は
    複数の短いブロックのいずれかで周波数帯域で変換する
    かを判定する機能を有するデジタル音響信号符号化プロ
    グラムを記録した媒体。
JP11080372A 1999-03-24 1999-03-24 デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 Pending JP2000276198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11080372A JP2000276198A (ja) 1999-03-24 1999-03-24 デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11080372A JP2000276198A (ja) 1999-03-24 1999-03-24 デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Publications (1)

Publication Number Publication Date
JP2000276198A true JP2000276198A (ja) 2000-10-06

Family

ID=13716461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11080372A Pending JP2000276198A (ja) 1999-03-24 1999-03-24 デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Country Status (1)

Country Link
JP (1) JP2000276198A (ja)

Similar Documents

Publication Publication Date Title
JP3762579B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP3739959B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP7091411B2 (ja) マルチチャネル信号の符号化方法およびエンコーダ
RU2555221C2 (ru) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
US9305558B2 (en) Multi-channel audio encoding/decoding with parametric compression/decompression and weight factors
JP4676139B2 (ja) マルチチャネルオーディオのエンコーディングおよびデコーディング
JP5091272B2 (ja) オーディオの量子化および逆量子化
US20070185706A1 (en) Quality improvement techniques in an audio encoder
US11335355B2 (en) Estimating noise of an audio signal in the log2-domain
JP4021124B2 (ja) デジタル音響信号符号化装置、方法及び記録媒体
KR100695125B1 (ko) 디지털 신호 부호화/복호화 방법 및 장치
RU2752520C1 (ru) Управление полосой частот в кодерах и/или декодерах
JP2003110429A (ja) 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体
JP3813025B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2000276198A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP2000206990A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2002182695A (ja) 高能率符号化方法及び装置
KR100590340B1 (ko) 디지털 오디오 부호화 방법 및 장치
JP2005003835A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム
JPH0591062A (ja) オーデイオ信号処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20070123

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071009