JP2000206990A - デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 - Google Patents

デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Info

Publication number
JP2000206990A
JP2000206990A JP11004856A JP485699A JP2000206990A JP 2000206990 A JP2000206990 A JP 2000206990A JP 11004856 A JP11004856 A JP 11004856A JP 485699 A JP485699 A JP 485699A JP 2000206990 A JP2000206990 A JP 2000206990A
Authority
JP
Japan
Prior art keywords
audio signal
block
short
pure tone
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11004856A
Other languages
English (en)
Inventor
Sadafumi Araki
禎史 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP11004856A priority Critical patent/JP2000206990A/ja
Publication of JP2000206990A publication Critical patent/JP2000206990A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 音響信号の純音性と人間の耳のマスキング特
性の周波数依存性を考慮して音質が劣化しないように適
切にロング/ショートブロックの別を判定できるデジタ
ル音響信号符号化装置及び方法を提供する。 【解決手段】 音響信号に含まれる音響成分の純音性の
度合いを示す純音性指標を算出する純音性指標算出手段
(12)と、該純音性指標算出手段(12)によって算
出された純音性指標と予め定めた閾値とを比較する比較
手段(13)と、該比較手段(13)による比較結果に
基づいて、音響信号のブロックをロングブロック又はシ
ョートブロックのいずれかで変換するかを判定するロン
グ/ショートブロック判定手段(14)とを具備する.

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はデジタル音響信号符
号化装置、デジタル音響信号符号化方法及びデジタル音
響信号符号化プログラムを記録した媒体に関し、特に例
えばDVD、デジタル放送等に利用するデジタル音響信
号の圧縮・符号化に関する。
【0002】
【従来の技術】従来より、デジタル音響信号の高品質圧
縮・符号化においては、人間の聴覚心理特性が利用され
ている。その特性は、小さな音が大きな音によってマス
キングされて聴こえなくなるというものである。即ち、
ある周波数で大きな音が発生すると、その近傍の周波数
の小さな音はマスクされて人間の耳には感知されなくな
る。ここで、マスクされて聴こえなくなる限界の強度を
マスキング閾値という。一方、人間の耳はマスキングと
は無関係に、4kHz付近の音に対して最も感度が良
く、それより上下の帯域になればなるほど次第に感度が
悪くなっていくという性質もある。この性質は、静寂な
状況で音を感知し得る限界の強度として表され、これを
絶対可聴閾値という。
【0003】これらのことを音響信号の強度分布を示す
図8に従って説明する。太い実線(A)が音響信号の強
度分布、点線(B)がこの音響信号に対するマスキング
閾値、そして、細い実線(C)が絶対可聴閾値を、それ
ぞれ表す。同図に示すように、人間の耳には、音響信号
に対するマスキング閾値及び絶対可聴閾値よりも大きな
強度の音のみ感知できる。従って、音響信号の強度分布
の中で、音響信号に対するマスキング閾値及び絶対可聴
閾値よりも大きな部分の情報のみを取りだしても、聴覚
的には元の音響信号と同じように感じられるのである。
【0004】このことは、音響信号の符号化において
は、図8の斜線で示した部分のみに符号化ビットを割り
当てることと等価である。ただし、ここでのビット割り
当ては、音響信号の全体域を複数の小帯域に分割して、
その分割帯域(D)の単位で行っている。各斜線の領域
の横幅は、その分割体域幅に相当する。
【0005】各分割帯域で、斜線領域の下限の強度以下
の音は耳に聴こえない。よって、原音と符号/復号化音
の強度の誤差がこの下限を超えなければ両者の差を感知
できない。その意味で、この下限の強度を許容誤差強度
と呼ぶ。音響信号を量子化して圧縮するに際し、原音に
対する符号/復号化音の量子化誤差強度が許容誤差強度
以下になるように量子化すれば、原音の音質を損なわず
に音響信号を圧縮できる。よって、図8の斜線領域のみ
に符号化ビットを割り当てるということは、各分割帯域
での量子化誤差強度がちょうど許容誤差強度になるよう
に量子化することと等価である。
【0006】この音響信号の符号化方式としては、MP
EG(Moving Picture Experts
Group) AudioやDolby Digit
al等があるが、いずれもここで説明したような性質を
用いている。その中で、現在最も符号化効率がよいとさ
れているが、ISO/IEC 13818−7にて標準
化されているMPEG−2AudioAAC(Adva
nced AudioCoding)という方式であ
る。
【0007】図9はAACの符号化の基本的な構成を示
すブロック図である。同図において、聴覚心理モデル部
91は時間軸に沿ってブロック化された入力音響信号の
各分割帯域毎に許容誤差強度を算出する。一方、同じく
ブロック化された入力信号に対して、ゲインコントロー
ル92及びフィルタバンク93ではMDCT(Modi
fied Discrete Cosine Tran
sform)による周波数領域への変換を行い、TNS
(Temporal Noise Shaping)9
4、予測器96では予測符号化、そしてインテンシティ
/カップリング95及びMSステレオ(Middle
Side Stereo)(以下M/Sと略す)97で
は、ステレオ相関符号化処理を、それぞれ行う。その
後、正規化係数98を決定し、量子化器99ではその正
規化係数98を基に音響信号を量子化する。この正規化
係数は図8の許容誤差強度に対応するもので、各分割帯
域毎に定められる。量子化後、ノイズレスコーディング
100では予め定められたハフマン符号表に基づいて、
正規化係数と量子化値にそれぞれハフマン符号を与えて
ノイズレスコーディングを行い、最後にマルチプレクサ
101にて符号ビットストリームを形成する。
【0008】さて、上述のフィルタバンク93における
MDCTとは、図10に示すように時間軸に沿って変換
領域を50%ずつオーバーラップさせながらDCTを施
すものである。これによって、各変換領域の境界部での
歪みの発生が抑えられる。また、生成されるMDCT係
数の数は変換領域のサンプル数の半分である。AACで
は入力音響信号ブロックに対して、2048サンプルの
長い変換領域(ロングブロック)、又は各256サンプ
ルの8個の短い変換領域(ショートブロック)のいずれ
かを適用する。よって、MDCT係数の数はロングの場
合は1024、ショートでは128となる。ショートブ
ロックは常に8ブロックを連続して適用することによ
り、ロングブロックを用いた場合とMDCT係数の数を
合わせるようになっている。
【0009】一般に、図11のように信号波形の変化の
少ない定常的な部分にはロングブロックを、図12よう
に変化の激しいアタック部にはショートブロックを用い
る。この両者の使い分けは重要で、もし図12のような
信号にロングブロックを適用すると、本来のアタックの
前にプリエコーとよばれるノイズが発生する。また、図
11のような信号にショートブロックを適用すると、周
波数領域での解像度の不足から適切なビット割り当てが
なされずに符号化効率が低下し、やはりノイズが発生
し、特に低周波数の音に対しては顕著である。
【0010】ショートブロックについては、さらに、グ
ループ分けの問題がある。グループ分けとは、上記の8
つのショートブロックを、正規化係数の同じ連続するブ
ロックごとにまとめてグループ化することである。グル
ープ内で正規化係数を共通化することで、情報量の削減
効果が上がる。具体的には、図9のノイズレスコーディ
ング100にて正規化係数にハフマン符号を割り当てる
際に、各ショートブロック単位ではなく、グループ単位
で割り当てるのである。図13にグループ分けの一例を
示す。ここではグループ数が3で、各グループ内のブロ
ック数は、最初の第0グループでは5、次の第1グルー
プでは1、最後の第2グループでは2、となっている。
グループ分けを適切に行わないと、符号量の増加や音質
の低下を招く。グループの分割数が多きすぎると、本来
共通化できるはずの正規化係数を重複して符号化するこ
とになり、符号化効率が低下する。逆に、グループ数が
少なすぎると、音響信号の変化が激しいにも拘わらず共
通の正規化係数で量子化することになるので、音質が低
下する。なお、ISO/IEC13818−7では、グ
ループ分けに関して、符号のシンタクスの規定はあるも
のの、具体的なグループ分けの基準や手法については考
慮されていない。
【0011】前述のように、符号化に際しては入力音響
信号ブロックに対して適切にロングブロックとショート
ブロックを区別して適用しなければならない。このロン
グ/ショートの判定を行うのは図9の聴覚心理モデル部
91である。ISO/IEC13818−7では、聴覚
心理モデル部91における、各着目ブロックに対するロ
ング/ショートの判定方法の一例が示されている。その
判定処理の概要を以下に説明する。
【0012】ステップ1:音響信号の再構築 ロングブロック用に1024サンプル(ショートブロッ
ク用には128サンプル)を新たに読み込み、前ブロッ
クにて既に読み込んでいる1024サンプル(128サ
ンプル)と合わせて2048サンプル(256サンプ
ル)の信号系列を再構築する。
【0013】ステップ2:ハン窓の掛け合わせとFFT ステップ1にて構築した2048サンプル(256サン
プル)の音響信号にハン窓を掛け合わせ、さらに、FF
T(Fast Fourier Transform)
を施して1024個(128個)のFFT係数を算出す
る。
【0014】ステップ3:FFT係数の予測値の計算 先行する2ブロック分のFFT係数の実数部と虚数部か
ら、現在着目しているブロックのFFT係数の実数部と
虚数部を予測し、それぞれ1024個(128個)の予
測値を算出する。
【0015】ステップ4:非予測可能性値の計算 ステップ2にて算出した各FFT係数の実数部と虚数部
と、ステップ3にて算出した各FFT係数の実数部と虚
数部の予測値から、それぞれの非予測可能性値を算出す
る。ここで、非予測可能性値は0から1の間の値をと
り、0に近いほど音響信号の純音性が高く、1に近いほ
ど雑音性が高い、言い替えれば純音性が低いことを示
す。
【0016】ステップ5:各分割帯域での音響信号の強
度と非予測可能性値の計算 ここでの分割帯域は、図8で示したものに相当する。各
分割帯域毎に、ステップ2にて算出した各FFT係数を
基にして音響信号の強度を算出する。さらに、ステップ
4にて算出した非予測可能性値を強度で重み付けして、
各分割帯域毎の非予測可能性値を算出する。
【0017】ステップ6:広がり関数を掛けた強度と非
予測可能性値の畳み込み 各分割帯域における他の分割帯域の音響信号強度及び非
予測可能性値の影響を広がり関数で求め、それぞれを畳
み込んで正規化する。
【0018】ステップ7:純音性指標の計算 各分割帯域bにおいて、ステップ6にて算出した畳み込
み非予測可能性値(cb(b))を基に、純音性指標t
b(b)(=−0.299−0.43loge(cb
(b)))を算出する。さらに、純音性指標を0から1
の間に制限する。ここで、指標が1に近いほど音響信号
の純音性が高く、0に近いほど雑音性が高いことを示
す。
【0019】ステップ8:S/N比の計算 各分割帯域において、ステップ7にて算出した純音性指
標を基に、S/N比を算出する。ここで、一般に雑音成
分のほうが純音成分よりもマスキング効果が大きいとい
う性質を利用する。
【0020】ステップ9:強度比の計算 各分割帯域において、ステップ8にて算出したS/N比
を基に、畳み込み音響信号強度とマスキング閾値の比を
算出する。
【0021】ステップ10:許容誤差強度の計算 各分割帯域において、ステップ6にて算出した畳み込み
音響信号強度と、ステップ9にて算出した音響信号強度
とマスキング閾値の比を基に、マスキング閾値を算出す
る。
【0022】ステップ11:プリエコー調整と絶対可聴
閾値の考慮 各分割帯域において、ステップ10にて算出したマスキ
ング閾値を、前ブロックでの許容誤差強度を用いてプリ
エコー調整する。さらに、この調整値と絶対可聴閾値の
大きい方の値を、現ブロックでの許容誤差強度とする。
【0023】ステップ12:知覚エントロピーの計算 ロングブロック用とショートブロック用のそれぞれにつ
いて、式(1)で定義される知覚エントロピー(Per
ceptual Entropy(PE))を算出す
る。
【0024】
【数1】
【0025】ただし、w(b)は分割帯域bの幅、nb
(b)はステップ11にて算出した分割帯域bにおける
許容誤差強度、e(b)はステップ5にて算出した分割
帯域bにおける音響信号の強度、をそれぞれ示す。ここ
で、PEは図8におけるビット割り当て領域(斜線領
域)の面積の総和に対応すると考えられる。
【0026】ステップ13:ロング/ショートブロック
の判定(図14に示すロング/ショートブロック判定動
作フローを参照) ステップ12にて算出したロングブロック用のPEの値
(ステップS1401)が、予め定められた定数(sw
itch_pe)より大きい場合は、着目ブロックをシ
ョートブロックと判定し(ステップS1402,S14
03)、小さい場合はロングブロックと判定する(ステ
ップS1402,S1404)。ここで、switch
_peはアプリケーションに依存して決められる値であ
る。
【0027】以上が、ISO/IEC13818−7に
て記載されたロング/ショートの判定方法である。
【0028】一方、特開平9−232964号公報で
は、入力信号を所定区間毎に取り込んで2乗和をそれぞ
れ求め、各区間毎に2乗和された信号の少なくとも2以
上の区間にわたる変化度によって上記信号の過渡状態を
検出するように過渡状態検出回路2を構成し、直交変換
処理やフィルタ処理を行わずに、時間軸上の入力信号の
2乗和計算を行うだけで過渡状態、即ち、ロング/ショ
ートが変化する部分を検出することができるようにして
いる。
【0029】
【発明が解決しようとする課題】しかしながら、上述の
ISO/IEC13818−7にて記載されたロング/
ショートブロックの判定方法では、必ずしも適切な判定
がなされない。つまり、本来ショートと判定すべき部分
をロングと判定して(またはその逆で)、音質の劣化を
生じる場合がある。
【0030】また、上記従来例の公開公報の方法では入
力信号の2乗和のみを用いて、知覚エントロピーを考慮
していないので、必ずしも聴覚上の特性に合致した判定
ができず、音質が劣化する恐れがある。
【0031】本発明はこれらの問題点を解決するための
ものであり、音響信号の純音性と人間の耳のマスキング
特性の周波数依存性を考慮して音質が劣化しないように
適切にロング/ショートブロックの別を判定できる、デ
ジタル音響信号装置、デジタル音響信号符号化方法及び
デジタル音響信号符号化プログラムを記録した媒体を提
供することを目的とする。
【0032】
【課題を解決するための手段】本発明は前記問題点を解
決するために、デジタル音響信号を時間軸に沿って入力
してブロック化し、各ブロック毎にサブバンド分割や周
波数領域への変換等の処理を施し、該音響信号を複数の
周波数帯域に分割し、各周波数帯域毎に符号化ビットを
割り当て、割り当てた符号化ビット数に応じて正規化係
数を求め、音響信号を正規化係数で量子化することによ
り圧縮符号化するデジタル音響信号符号化装置であっ
て、周波数領域への変換を行う際に、ブロック化した音
響信号を1つの長い変換ブロック又は複数の短い変換ブ
ロックのいずれかにて変換し、1つの長いまたは複数の
短い変換ブロックに共通の正規化係数を対応させて音響
信号を量子化するデジタル音響信号符号化装置におい
て、音響信号に含まれる音響成分の純音性の度合いを示
す純音性指標を算出する純音性指標算出手段と、該純音
性指標算出手段によって算出された純音性指標と予め定
めた閾値とを比較する比較手段と、該比較手段による比
較結果に基づいて、音響信号のブロックをロングブロッ
ク又はショートブロックのいずれかで変換するかを判定
するロング/ショートブロック判定手段とを具備するこ
とに特徴がある。また、純音性指標算出手段は、分割し
た前記各周波数帯域毎の音響信号に含まれる音響成分の
純音性の度合いを示す純音性指標を算出し、又は分割し
た複数の短い変換ブロック毎の音響信号に含まれる音響
成分の前記純音性指標を算出する。よって、予め定めた
1つ又は複数の分割周波数帯域として低周波数領域の分
割帯域を設定すれば低周波数領域で純音性指標の高い成
分を含む音響信号に関しては常に1つのロングブロック
で周波数領域に変換することになり、ショートブロック
に起因する周波数領域での解像度の不足によって元の音
響信号のエネルギーが周辺の周波数帯域に分散し、それ
が人間の耳の低周波成分におけるマスキングの幅を越え
て広がることで結果的に音質の劣化を感じるという従来
の問題点を解決できる。
【0033】また、別の方法として、デジタル音響信号
を時間軸に沿って入力してブロック化し、各ブロック毎
にサブバンド分割や周波数領域への変換等の処理を施
し、該音響信号を複数の帯域に分割し、各帯域毎に符号
化ビットを割り当て、割り当てた符号化ビット数に応じ
て正規化係数を求め、音響信号を正規化係数で量子化す
ることにより圧縮符号化するデジタル音響信号符号化方
法であって、周波数領域への変換を行う際に、ブロック
化した音響信号を1つの長い変換ブロック又は複数の短
い変換ブロックのいずれかにて変換し、短い変換ブロッ
クを用いる場合は当該複数の短い変換ブロックを、それ
ぞれ1つまたは複数の短い変換ブロックを含むような複
数のブロックにグループ化し、同一グループ内に含まれ
る1つまたは複数の短い変換ブロックには共通の正規化
係数を対応させて音響信号を量子化するデジタル音響信
号符号化方法において、入力された音響信号に含まれる
音響成分の純音性の度合いを示す純音性指標を用いて、
音響信号のブロックを1つの長い変換ブロック又は複数
の短いブロックのいずれかで周波数領域に変換するかを
判定することに特徴がある。よって、音響信号の純音性
と人間の耳のマスキング特性の周波数依存性を考慮して
音質が劣化しないように適切にロング/ショートブロッ
クの別を判定できる。
【0034】更なる別の発明として、分割した各周波数
帯域における各音響信号に含まれる各音響成分の純音性
の度合いを示す純音性指標が予め定めた閾値より大きい
変換ブロックが少なくとも1つ存在するときは入力され
た音響信号を1つの長い変換ブロックで周波数領域に変
換すると判定し、分割した各周波数帯域における各音響
信号に含まれる各音響成分の純音性指標が予め定めた閾
値より小さいときは判定不能とすることに特徴がある。
よって、純音性指標が予め定めた閾値より小さい場合は
本発明による判定方法では判定不能として他のロング/
ショートロングの判定方法による判定結果に従うので音
響信号の特性をより良く反映した適切な周波数領域への
変換がなされ、符号化効率や音質がより向上する。
【0035】また、別の発明として、コンピュータによ
り、デジタル音響信号を時間軸に沿って入力してブロッ
ク化し、各ブロック毎にサブバンド分割や周波数領域へ
の変換等の処理を施し、該音響信号を複数の周波数帯域
に分割し、各周波数帯域毎に符号化ビットを割り当て、
割り当てた符号化ビット数に応じて正規化係数を求め、
音響信号を正規化係数で量子化することにより圧縮符号
化するデジタル音響信号符号化装置であって、周波数領
域への変換を行う際に、ブロック化した音響信号を1つ
の長い変換ブロック又は複数の短い変換ブロックのいず
れかにて変換し、1つの長いまたは複数の短い変換ブロ
ックに共通の正規化係数を対応させて音響信号を量子化
するように実行するデジタル音響信号符号化プログラム
を記録した媒体において、入力された音響信号に含まれ
る音響成分の純音性の度合いを示す純音性指標を用い
て、音響信号のブロックを1つの長い変換ブロック又は
複数の短いブロックのいずれかで周波数領域に変換する
かを判定する機能を有するデジタル音響信号符号化プロ
グラムを記録した媒体に特徴がある。よって、既存のシ
ステムを変えることなく、かつ符号化システムを構築す
る装置を汎用的に使用することができる。
【0036】
【発明の実施の形態】音響信号に含まれる音響成分の純
音性の度合いを示す純音性指標を算出する純音性指標算
出手段と、該純音性指標算出手段によって算出された純
音性指標と予め定めた閾値とを比較する比較手段と、該
比較手段による比較結果に基づいて、音響信号のブロッ
クをロングブロック又はショートブロックのいずれかで
変換するかを判定するロング/ショートブロック判定手
段とを具備する。
【0037】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明の一実施例に係るデジタル音響信号
符号化装置の構成を示すブロックである。同図に示す本
実施例のデジタル音響信号符号化装置は、入力された音
響信号を所定の数、以下の説明では8つの連続するブロ
ックに分割するブロック分割手段11、分割された各ブ
ロックの純音性指標を上述した算出式によって計算する
純音性指標算出手段12、算出された純音性指標と予め
定めた閾値とを比較する比較手段13、比較結果に応じ
てロングブロック又はショートブロックのいずれかを判
定するロング/ショートブロック判定手段14及び各手
段の動作を制御する制御手段15を含んで構成されてい
る。ここで、図2はデジタル音響信号符号化装置の動作
を示すフローチャートである。以下、両図を用いて本実
施例の具体的な動作を説明する。その際、入力音響信号
の例として、図3の音響データを用いる。これは図12
の音響データと同様のものであるが、図3では連続する
8つの各ショートブロックに対応する通し番号を付して
いる。
【0038】先ず、ブロック分割手段11によって入力
された音響信号は連続する8つのショートブロックi
(0≦i≦7)に関し、純音性指標算出手段12によっ
て各分割帯域sfbでの純音性指標をそれぞれ計算し、
これらをtb[i][sfb]とする(ステップS10
1)。ここで、sfbは図4に示すように、各分割帯域
を識別するための通し番号である。なお、この純音性指
標の計算は、上述ISO/IEC13818−7におけ
る各着目ブロックに対するロング/ショートの判定ステ
ップの内ステップ7にて説明した方法による。次に、t
onal_flag=0と初期化する(ステップS10
2)。更に、ショートブロックの通し番号iをi=0と
初期化する(ステップS103)。そして、ショートブ
ロックiに関し、比較手段13によって予め定めた1つ
又は複数の分割領域において各純音性指標がそれぞれの
分割帯域について予め定めた閾値より大きいかどうかを
調べる(ステップS104)。図2の例では、sfb=
7,8,9である分割領域に関して調べており、それぞ
れ純音性指標の閾値を、th7,th8,th9として
いる。
【0039】さて、ここにおける例では、それぞれのシ
ョートブロックiに関し、stb=7,8,9における
純音性指標の値が図5に示したようなものであったとす
る。また、th7=0.6,th8=0.9,th9=
0.8と定められているものとする。すると、最初のi
=0のときは、tb[0][7]=0.12<0.6=
th7,tb予[0][8]=0.08<0.9=th
8,tb[0][9]=0.15<0.8=th9なの
で、比較手段13によるステップS104における判定
はnoとなり、次のステップS106に進む。そして、
iの値が1つだけインクリメントされてi=1となり、
ステップS107の判定を経て、再びステップS104
に戻る。
【0040】その後、以上説明した動作と同様の動作が
i=5まで続く。i=6となった後(ステップS10
6)、ステップS107を経て再びステップS104に
戻る。今後は、tb[6][7]=0.67>0.6=
th7,tb[6][8]=0.95>0.9=th
8,tb[6][9]=0.89>0.8=th9なの
で、比較手段13によるステップS104における判定
はyesとなり、ステップS105に進む。そして、t
onal_flag=1となる(ステップS105)。
次に、i=7となり(ステップS106)、ステップS
107を経てまたステップS104へ戻る。i=7では
tb[7][7]=0.42<0.6=th7,tb
[7][8]=0.84<0.9=th8,tb[7]
[9]=0.81>0.8=th9なので、比較手段1
3によるステップS104の判定はnoであり、ステッ
プS106へ進む。一方、tonal_flag=1の
まま変わらない。そして、i=8となった後(ステップ
S106)、ステップS107の判定を経て今度はステ
ップS108へ進む。そして、tonal_flagの
値を調べる(ステップS108)。この例ではtona
l_flag=1なので判定はyesとなりステップS
109へ進む。よって、ロング/ショートブロック判定
手段14によって、入力された音響ブロックを1つのロ
ングブロックによってMDCT変換するものと判定され
る。
【0041】次に、別の例として、sfb=7,8,9
における純音性指標の値が図6に示したような場合を考
える。ただし、th7=0.6,th8=0.9,th
9=0.8は上記図5の例と同様に変わらないものとす
る。この場合は図5の例とは異なり、tb[i][7]
>0.6=th7、かつtb[i][8]>0.9=t
h8、かつtb[i][9]>0.8=th9となるよ
うなショートブロックiは存在しない。よって、比較手
段13によるステップS104における判定は常にno
となり、ステップS105を通過することはない。その
結果、tonal_flagの値は初期値のtonal
_flag=0のままステップS108へ進むことにな
る。
【0042】そして、ステップS108での判定がno
となるので、次のステップS110へ進み、上述の従来
の判定方法、ISO/IEC13818−7にて記載さ
れたロング/ショートの判定方法などの他の判定手段に
よるロング/ショートの判定を行いその判定結果に従
う。
【0043】なお、図2のステップS104にて純音性
指標の判定に用いる分割帯域は上記の例のようにsfb
=7,8,9に限るものではなく、また各閾値もth7
=0.6,th8=0.9,th9=0.8に限らな
い。
【0044】次に、図7は本発明のシステム構成を示す
ブロック図である。つまり、同図は上記実施例における
デジタル音響信号符号化方法によるソフトウェアを実行
するマイクロプロセッサ等から構築するハードウェアを
示すものである。同図において、デジタル音響信号符号
化システムはインターフェース(以下I/Fと略す)7
1、CPU72、ROM73、RAM74、表示装置7
5、ハードディスク76、キーボード77及びCD−R
OMドライブ78を含んで構成されている。また、汎用
の処理装置を用意し、CD−ROM79などの読取可能
な記録媒体には、本発明のデジタル音響信号符号化方法
を実行するプログラムが記録されている。更に、I/F
71を介して外部装置から制御信号が入力され、キーボ
ード77によって操作者による指令又は自動的に本発明
のプログラムが起動される。そして、CPU72は当該
プログラムに従って上述のデジタル音響信号符号化方法
に伴う符号化制御処理を施し、その処理結果をRAM7
4やハードディスク76等の記憶装置に格納し、必要に
より表示装置75などに出力する。以上のように、本発
明のデジタル音響信号符号化方法を実行するプログラム
が記録した媒体を用いることにより、既存のシステムを
変えることなく、かつ符号化システムを構築する装置を
汎用的に使用することができる。
【0045】なお、本発明は上記実施例に限定されるも
のではなく、特許請求の範囲内に記載であれば多種の変
形や置換可能であることは言うまでもない。
【0046】
【発明の効果】以上説明しように、本発明によれば、予
め定めた1つ又は複数の分割周波数帯域として低周波数
領域の分割帯域を設定すれば低周波数領域で純音性の度
合いを示す純音性指標の高い成分を含む音響信号に関し
ては常に1つのロングブロックで周波数領域に変換する
ことになり、ショートブロックに起因する周波数領域で
の解像度の不足によって元の音響信号のエネルギーが周
辺の周波数帯域に分散し、それが人間の耳の低周波成分
におけるマスキングの幅を越えて広がることで結果的に
音質の劣化を感じるという従来の問題点を解決できる。
【0047】また、音響信号の純音性と人間の耳のマス
キング特性の周波数依存性を考慮して音質が劣化しない
ように適切にロング/ショートブロックの別を判定でき
る。
【0048】更に、純音性の度合いを示す純音性指標が
予め定めた閾値より小さい場合は本発明による判定方法
では判定不能として他のロング/ショートロングの判定
方法による判定結果に従うので音響信号の特性をより良
く反映した適切な周波数領域への変換がなされ、符号化
効率や音質がより向上する。
【0049】また、本発明のデジタル音響信号符号化方
法を実行するプログラムが記録した媒体を用いることに
より、既存のシステムを変えることなく、かつ符号化シ
ステムを構築する装置を汎用的に使用することができ
る。
【図面の簡単な説明】
【図1】本発明の一実施例に係るデジタル音響信号符号
化装置の構成を示すブロック図である。
【図2】本発明の一実施例に係るデジタル音響信号符号
化方法の動作を示すフローチャートである。
【図3】本実施例における音響信号の一例の信号波形を
示す図である。
【図4】本実施例における分割領域識別番号の付与の様
子を示す図である。
【図5】ショートブロック別の純音性指標の関係の一例
を示す図である。
【図6】ショートブロック別の純音性指標の関係の別の
一例を示す図である。
【図7】本発明のシステム構成を示すブロック図であ
る。
【図8】音響信号とマスキング閾値及び絶対可聴閾値の
強度分布を示す図である。
【図9】AACの符号化の基本的な構成を示すブロック
図である。
【図10】MDCTの変換領域を示す図である。
【図11】変化の少ない信号波形の場合のMDCTの変
換領域を示す図である。
【図12】変化の激しい信号波形の場合のMDCTの変
換領域を示す図である。
【図13】グループ分けの一例を示す図である。
【図14】ISO/IEC13818−7におけるロン
グ/ショートブロック判定動作を示すフローチャートで
ある。
【符号の説明】
11 ブロック分割手段 12 純音性指標算出手段 13 比較手段 14 ロング/ショートブロック判定手段 15 制御手段 71 I/F 72 CPU 73 ROM 74 RAM 75 表示装置 76 ハードディスク 77 キーボード 78 CD−ROMドライブ 79 CD−ROM

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 デジタル音響信号を時間軸に沿って入力
    してブロック化し、各ブロック毎にサブバンド分割や周
    波数領域への変換等の処理を施し、該音響信号を複数の
    周波数帯域に分割し、各周波数帯域毎に符号化ビットを
    割り当て、割り当てた符号化ビット数に応じて正規化係
    数を求め、前記音響信号を前記正規化係数で量子化する
    ことにより圧縮符号化するデジタル音響信号符号化装置
    であって、前記周波数領域への変換を行う際に、ブロッ
    ク化した前記音響信号を1つの長い変換ブロック又は複
    数の短い変換ブロックのいずれかにて変換し、1つの長
    いまたは複数の短い変換ブロックに共通の正規化係数を
    対応させて音響信号を量子化するデジタル音響信号符号
    化装置において、 前記音響信号に含まれる音響成分の純音性の度合いを示
    す純音性指標を算出する純音性指標算出手段と、 該純音性指標算出手段によって算出された前記純音性指
    標と予め定めた閾値とを比較する比較手段と、 該比較手段による比較結果に基づいて、音響信号のブロ
    ックをロングブロック又はショートブロックのいずれか
    で変換するかを判定するロング/ショートブロック判定
    手段とを具備することを特徴とするデジタル音響信号符
    号化装置。
  2. 【請求項2】 前記純音性指標算出手段は、分割した前
    記各周波数帯域毎の音響信号に含まれる音響成分の前記
    純音性指標を算出する請求項1記載のデジタル音響信号
    符号化装置。
  3. 【請求項3】 前記純音性指標算出手段は、分割した複
    数の短い変換ブロック毎の音響信号に含まれる音響成分
    の前記純音性指標を算出する請求項1記載のデジタル音
    響信号符号化装置。
  4. 【請求項4】 デジタル音響信号を時間軸に沿って入力
    してブロック化し、各ブロック毎にサブバンド分割や周
    波数領域への変換等の処理を施し、該音響信号を複数の
    帯域に分割し、各帯域毎に符号化ビットを割り当て、割
    り当てた符号化ビット数に応じて正規化係数を求め、前
    記音響信号を前記正規化係数で量子化することにより圧
    縮符号化するデジタル音響信号符号化方法であって、前
    記周波数領域への変換を行う際に、ブロック化した前記
    音響信号を1つの長い変換ブロック又は複数の短い変換
    ブロックのいずれかにて変換し、短い変換ブロックを用
    いる場合は当該複数の短い変換ブロックを、それぞれ1
    つまたは複数の短い変換ブロックを含むような複数のブ
    ロックにグループ化し、同一グループ内に含まれる1つ
    または複数の短い変換ブロックには共通の正規化係数を
    対応させて音響信号を量子化するデジタル音響信号符号
    化方法において、 入力された音響信号に含まれる音響成分の純音性の度合
    いを示す純音性指標を用いて、音響信号のブロックを1
    つの長い変換ブロック又は複数の短いブロックのいずれ
    かで周波数領域に変換するかを判定することを特徴とす
    るデジタル音響信号符号化方法。
  5. 【請求項5】 デジタル音響信号を時間軸に沿って入力
    してブロック化し、各ブロック毎にサブバンド分割や周
    波数領域への変換等の処理を施し、該音響信号を複数の
    帯域に分割し、各帯域毎に符号化ビットを割り当て、割
    り当てた符号化ビット数に応じて正規化係数を求め、前
    記音響信号を前記正規化係数で量子化することにより圧
    縮符号化するデジタル音響信号符号化方法であって、前
    記周波数領域への変換を行う際に、ブロック化した前記
    音響信号を1つの長い変換ブロック又は複数の短い変換
    ブロックのいずれかにて変換し、短い変換ブロックを用
    いる場合は当該複数の短い変換ブロックを、それぞれ1
    つまたは複数の短い変換ブロックを含むような複数のブ
    ロックにグループ化し、同一グループ内に含まれる1つ
    または複数の短い変換ブロックには共通の正規化係数を
    対応させて音響信号を量子化するデジタル音響信号符号
    化方法において、 分割した各周波数帯域における各音響信号に含まれる各
    音響成分の純音性の度合いを示す純音性指標が予め定め
    た閾値より大きい変換ブロックが少なくとも1つ存在す
    るときは入力された音響信号を1つの長い変換ブロック
    で周波数領域に変換すると判定し、分割した各周波数帯
    域における各音響信号に含まれる各音響成分の純音性指
    標が予め定めた閾値より小さいときは判定不能とするこ
    とに特徴があるデジタル音響信号符号化方法。
  6. 【請求項6】 コンピュータにより、デジタル音響信号
    を時間軸に沿って入力してブロック化し、各ブロック毎
    にサブバンド分割や周波数領域への変換等の処理を施
    し、該音響信号を複数の周波数帯域に分割し、各周波数
    帯域毎に符号化ビットを割り当て、割り当てた符号化ビ
    ット数に応じて正規化係数を求め、前記音響信号を前記
    正規化係数で量子化することにより圧縮符号化するデジ
    タル音響信号符号化装置であって、前記周波数領域への
    変換を行う際に、ブロック化した前記音響信号を1つの
    長い変換ブロック又は複数の短い変換ブロックのいずれ
    かにて変換し、1つの長いまたは複数の短い変換ブロッ
    クに共通の正規化係数を対応させて音響信号を量子化す
    るように実行するデジタル音響信号符号化プログラムを
    記録した媒体において、 入力された音響信号に含まれる音響成分の純音性の度合
    いを示す純音性指標を用いて、音響信号のブロックを1
    つの長い変換ブロック又は複数の短いブロックのいずれ
    かで周波数領域に変換するかを判定する機能を有するデ
    ジタル音響信号符号化プログラムを記録した媒体。
JP11004856A 1999-01-12 1999-01-12 デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 Pending JP2000206990A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11004856A JP2000206990A (ja) 1999-01-12 1999-01-12 デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11004856A JP2000206990A (ja) 1999-01-12 1999-01-12 デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Publications (1)

Publication Number Publication Date
JP2000206990A true JP2000206990A (ja) 2000-07-28

Family

ID=11595331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11004856A Pending JP2000206990A (ja) 1999-01-12 1999-01-12 デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Country Status (1)

Country Link
JP (1) JP2000206990A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008817A1 (ja) * 2004-07-22 2006-01-26 Fujitsu Limited オーディオ符号化装置及びオーディオ符号化方法
JP2013515291A (ja) * 2009-12-22 2013-05-02 クゥアルコム・インコーポレイテッド 定常ビットレートアプリケーションのための最適なビット割当を備えるオーディオ及びスピーチ処理

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008817A1 (ja) * 2004-07-22 2006-01-26 Fujitsu Limited オーディオ符号化装置及びオーディオ符号化方法
JP2013515291A (ja) * 2009-12-22 2013-05-02 クゥアルコム・インコーポレイテッド 定常ビットレートアプリケーションのための最適なビット割当を備えるオーディオ及びスピーチ処理
US8781822B2 (en) 2009-12-22 2014-07-15 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications

Similar Documents

Publication Publication Date Title
JP3762579B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP3739959B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US9443525B2 (en) Quality improvement techniques in an audio encoder
US9305558B2 (en) Multi-channel audio encoding/decoding with parametric compression/decompression and weight factors
US8615391B2 (en) Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
KR101343267B1 (ko) 주파수 세그먼트화를 이용한 오디오 코딩 및 디코딩을 위한 방법 및 장치
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
US7752041B2 (en) Method and apparatus for encoding/decoding digital signal
JP3784993B2 (ja) 音響信号の符号化・量子化方法
JP3186292B2 (ja) 高能率符号化方法及び装置
KR20090110244A (ko) 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
JP4021124B2 (ja) デジタル音響信号符号化装置、方法及び記録媒体
US7835915B2 (en) Scalable stereo audio coding/decoding method and apparatus
JP3813025B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2000206990A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
KR100640833B1 (ko) 디지털 오디오의 부호화 방법
JPH0918348A (ja) 音響信号符号化装置及び音響信号復号装置
Teh et al. Subband coding of high-fidelity quality audio signals at 128 kbps
JPH09274500A (ja) ディジタルオーディオ信号の符号化方法
JP2000276198A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
KR100590340B1 (ko) 디지털 오디오 부호화 방법 및 장치
JPH0746137A (ja) 音声高能率符号化装置
JP2005003835A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム
JPH11177435A (ja) 量子化装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050607