JPH07295594A - オーディオ信号符号化方法 - Google Patents

オーディオ信号符号化方法

Info

Publication number
JPH07295594A
JPH07295594A JP6091545A JP9154594A JPH07295594A JP H07295594 A JPH07295594 A JP H07295594A JP 6091545 A JP6091545 A JP 6091545A JP 9154594 A JP9154594 A JP 9154594A JP H07295594 A JPH07295594 A JP H07295594A
Authority
JP
Japan
Prior art keywords
tone
bits
spectrum
tones
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6091545A
Other languages
English (en)
Other versions
JP3465341B2 (ja
Inventor
Robaato Hedoru
ロバート ヘドル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP09154594A priority Critical patent/JP3465341B2/ja
Publication of JPH07295594A publication Critical patent/JPH07295594A/ja
Application granted granted Critical
Publication of JP3465341B2 publication Critical patent/JP3465341B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 一定のビットレートにおいてより高い音質を
有するようなビット割り当てがなされるオーディオ信号
符号化方法を提供する。 【構成】 入力オーディオ信号を時間−周波数変換して
得られる複数のスペクトルについて、トーン性成分を識
別し(S73)、トーン性成分よりトーンを抽出し、こ
れを予め決められたビット数にて量子化し(S75)、
上記複数のスペクトルについて、高パワー周波数領域を
分離しパワー量子化ユニットとして分類し(S78)、
相対的に量子化雑音が聴取されないようなビット数で量
子化し(S79)、残りのスペクトルを残ったビットで
量子化する(S81〜S83)。 【効果】 利用可能なビットをトーン成分とパワー量子
化ユニットと残りのスペクトルとの間で割り当て、音響
心理学的側面で量子化エラーを最小限に抑えて、効率の
よい信号圧縮を実現できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、オーディオ信号符号化
方法に関し、特に、ディジタルオーディオ信号のスペク
トル成分を、一定のビット数のデータに圧縮するような
圧縮処理を伴った符号化を施すオーディオ信号符号化方
法に関する。
【0002】
【従来の技術】いわゆるコンパクトディスク等として広
く知られるデジタル・オーディオは、高音質な再生信号
が簡単に得られるため、広く消費者に普及している。し
かし、コンパクトディスクに見られるような、圧縮され
ないデジタルオーディオ信号は、大量にデータ記憶領域
を必要とし、これが媒体寸法および/または伝送帯域幅
条件における欠点となる。このため、人間の聴覚特性、
あるいは音響心理学的特性等を利用して、冗長なデータ
を削除するような圧縮デジタルオーディオシステムが開
発された。最近発表になったデジタルオーディオ媒体や
装置等の製品においては、オーディオデータのデータ量
を減少するために、上述のような圧縮デジタルオーディ
オシステムを使用しているものも多い。
【0003】このような圧縮デジタルオーディオシステ
ムは、一般に、まずオーディオデータに対して時間周波
数変換を行なう。この変換は、帯域分割または変換符号
化方式またはこれらの組み合わせに基づくのが普通であ
る。変換したデータはいわゆる量子化ユニット(Quanti
zation Unit )にグループ化される。一般には、単一量
子化ユニット内の全データは同一ワード長で再量子化さ
れ、またブロック・フローティング量子化を用いる場合
には同一スケールファクタで再量子化される。データ圧
縮は、本来の入力データより短いワード長を用いて行な
う。また各量子化ユニットのワード長は可変とするのが
普通である。この際、音響心理学的技術を用いて量子化
ユニットの間に利用可能なビットを割り当て、再量子化
による可聴域の音質劣化、例えば量子化雑音を最小限に
抑えるようになしている。
【0004】スペクトル係数グループ化の方法について
は、本件出願人が先に提案した、例えば、特願平5−1
83322号、特願平5−241189号、及び特願平
5−275218号の各明細書及び図面等により開示さ
れている。これらのシステムでは、信号のもつトーン性
あるいはトーナリティ成分を抽出して別々に量子化する
方法を提供する。通常、例えば5程度の少数の周波数領
域のスペクトル係数をトーンとして決定する。このトー
ンのスペクトル係数は多くのビット数を用いることなく
正確に量子化することができる。残りのいわゆるノイズ
性のスペクトルを次に低い精度で量子化する。デコーダ
でトーン性部分とノイズ性部分を合成して得られた信号
は、同一ビットレートを用いる従来技術のシステムに比
べて、特にトーン性の高い入力信号で、高い音質を有す
る。
【0005】
【発明の解決しようとする課題】ところで、エンコーダ
はそれぞれの入力信号のトーン性部分とノイズ性部分に
何ビットを割り当てるか決定しなければならない。決定
が不適当な場合、音質面の最大限の改善は実現されない
ことになる。
【0006】本発明は、このような実情に鑑みてなされ
たものであり、信号のトーン性成分およびノイズ性成分
の間に可能な最善のビット割り当てが達成されるオーデ
ィオ信号符号化方法を提供することを目的とするもので
ある。
【0007】本発明の他の目的は、トーン性成分および
ノイズ性成分両方を用いて信号を符号化するオーディオ
エンコーダ用のビット割り当て方法を提供することであ
る。本ビット割り当て法は各種のスペクトル測定を用い
トーン性成分およびノイズ性成分について入力信号を分
析し、これらの測定に基づいて、可能な最良の音質が得
られるように利用可能なビットを割り当て得るオーディ
オ信号符号化方法を提供することである。
【0008】
【課題を解決するための手段】本発明に係るオーディオ
信号符号化方法は、入力オーディオ信号に対して所定の
変換、例えば時間−周波数分析あるいは直交変換を施す
ことにより、複数のスペクトルを得て、各スペクトルに
聴覚特性に応じたビットを割り当てて符号化するオーデ
ィオ信号符号化方法であって、上記複数のスペクトルに
ついて、トーン性成分を識別し、上記トーン性成分より
トーンを抽出し、これを予め決められたビット数にて量
子化し、上記複数のスペクトルの残りの部分について、
高パワー周波数領域を分離し、パワー量子化ユニットと
して分類し、相対的に量子化雑音が聴取されないような
ビット数で量子化し、残りのスペクトルを残ったビット
にて量子化することにより、上述の課題を解決する。割
り当てビット数としては、通常の場合、上記トーンが最
も多く、次にパワー量子化ユニットが多く、残りのスペ
クトルが最も少なくなる。
【0009】ここで、上記トーンの抽出は、さらに上記
トーンを通常トーン、または大トーンのいずれかとして
分類し、上記大トーンは上記通常トーンより多くのビッ
トで量子化することが好ましい。
【0010】また、上記残ったビットによる上記残りの
スペクトルの量子化は、同一ワード長で量子化すること
が好ましい。
【0011】さらに、上記トーンの抽出としては、まず
所定周波数範囲あるいは所定スペクトル数、例えば25
スペクトル毎のローカルピークを求め、このローカルピ
ークについて、所定数スペクトル範囲内に、例えば4ス
ペクトル以内に2つのローカルピークが存在する場合に
は、パワーの大きな方の単一のトーンをトーンとして抽
出することが挙げられ、また、スペクトルの平均値/中
央値の比に基づきトーン抽出することや、上記スペクト
ルのトーナリティに基づきトーン抽出することが挙げら
れる。
【0012】また本発明は、入力デジタルオーディオ信
号と、時間と周波数に部分する係数へと信号を変換する
時間周波数変換と、一組の該係数に割り当て可能な最大
ビット数を表わす数と、該係数をトーン性部分とノイズ
性部分とに分割しこれら2つの部分の間でビット割り当
てを行なう最適なビット割り当て方法を有するオーディ
オ信号符号化方法を提供する。
【0013】
【作用】入力オーディオ信号のスペクトルの内のトーン
性成分を抽出して量子化し、次に高パワー周波数領域を
パワー量子化ユニットとして分離して相対的に量子化雑
音が聴取されないようなビット数で量子化し、最後に残
ったスペクトルを残ったビット数で量子化することによ
り、音響心理学的に、聴感上で重要な部分から順に多く
のビットを割り当てるような効率的なビット配分による
符号化が行え、低いビットレートで高品質のオーディオ
信号符号化を実現できる。
【0014】また、トーンを通常トーンと大トーンとに
分類し、大トーンにより多くのビットを割り当てること
により、さらに効率を上げ、音質を高めることができ
る。
【0015】また、残りのスペクトルを同一ワード長で
量子化することにより、ビット配分処理を簡略化でき
る。
【0016】さらに、オーバーラップしない単一のトー
ンだけをトーンとして抽出することにより、高精度のト
ーン検出が行える。また、スペクトルの平均値/中央値
の比に基づきトーンを抽出することや、上記スペクトル
のトーナリティに基づきトーンを抽出することにより、
トーンの誤検出を防止でき、適切なトーン検出が行え
る。
【0017】
【実施例】以下、本発明に係るいくつかの好ましい実施
例について、図面を参照しながら説明する。
【0018】図1は、本発明に係るオーディオ信号符号
化方法が適用されるオーディオエンコーダ/デコーダシ
ステムの一般的構成を概略的に示す図である。
【0019】この図1において、入力端子10に供給さ
れた入力オーディオ信号は、オーディオエンコーダ11
に送られ、このオーディオエンコーダ11は、音響心理
学的原理に従って、聴取可能な音質の劣化を最小限に抑
えるように動作する。オーディオエンコーダ11からの
出力信号である符号化データは、伝送又は記録媒体を介
して伝送され又は記録再生されて、オーディオデコーダ
12に送られる。オーディオデコーダ12は、入力され
た符号化データからオーディオ信号を再構成して、出力
端子16より出力する。
【0020】図2は、上記音響心理学的なオーディオエ
ンコーダ11の具体例を示すブロック図である。
【0021】この図2において、まず、時間−周波数分
析ブロック21で入力オーディオ信号を時間周波数係数
に分割する。次に、これらの周波数成分をブロックフロ
ーティングアルゴリズムを用いて、スペクトル量子化ブ
ロック23で量子化する。上記時間周波数係数の各ブロ
ックのワード長とスケールファクタは、ビット割当制御
ブロック22のビット割当アルゴリズムにより決定す
る。最後に、スペクトル量子化ブロック23からの量子
化スペクトル係数を出力端子13より取り出し、ビット
割当制御ブロック22からのビット割当表のパラメータ
を出力端子14より取り出して、例えば記録媒体に書き
込む。あるいは伝送する。
【0022】スペクトル量子化ブロック23で生成され
る量子化雑音が人間の耳には聴取不可能または最小限に
聴取される程度に留まるようにするために、ビット割当
制御ブロック22のビット割当アルゴリズムは、音響心
理学的モデル出力ブロック24からの、最小可聴曲線、
等ラウドネス曲線、同時マスキング特性、テンポラルマ
スキング特性等による音響心理学的モデルに基づくもの
となっている。
【0023】ここで、時間−周波数分析ブロック21
は、帯域別符号化、変換符号化またはこれら2種類の組
み合わせのいずれかに基づくのが一般的である。図3
は、このような2種類の組み合せ(ハイブリッド)の場
合の時間−周波数分析ブロック21の一例を示してい
る。
【0024】この図3において、まずクォドラチュアミ
ラーフィルタ(Quadrature MirrorFilter、以下QMF
という)31により、入力端子10からの入力信号を高
周波帯域と低周波帯域に分割する。この後、低周波帯域
を第2のQMF32でさらに分割する。第2のQMF3
2による処理遅延を補償する目的で、高周波帯域を遅延
回路33により遅延する。これらの各帯域の範囲は、高
域側から順に、例えば11〜22kHz、5.5〜11k
Hz、0〜5.5kHzとすればよい。これらの各帯域の信
号を改良ディスクリートコサイン変換(MDCT)変換
ブロック34、35、36でそれぞれ周波数領域のスペ
クトル係数に変換し、出力端子37、38、39を介し
てそれぞれ取り出している。
【0025】ここで、本実施例が適用されるオーディオ
エンコーダシステムのスペクトル量子化ブロック23
は、供給されたスペクトル係数のトーン性の部分と、そ
の他の部分とを量子化する必要がある。これらの2つの
部分とは、スペクトルの可変数の小グループから成り周
波数領域上の位置が変動し得るトーン性の部分と、周波
数領域上で帯域と領域が決まっている一組のもっと大き
なグループ(量子化ユニット)の集合である。
【0026】図4には、スペクトル量子化ブロック23
の一具体例のブロック図を示す。この図4において、ト
ーン性成分抽出回路41では、入力端子40より供給さ
れたスペクトル係数からトーン性成分を抽出する。次
に、抽出されたトーンはトーン性成分量子化回路42に
より量子化され、さらに残りのスペクトルはノイズ性成
分量子化回路43により量子化ユニット単位で量子化さ
れる。
【0027】次に、上述したスペクトル係数におけるト
ーン性成分及びノイズ性成分の具体例について、図5を
参照しながら説明する。この図5は、MDCT変換ブロ
ック34、35、36で周波数領域に変換されるオーデ
ィオ信号のスペクトルの分布を示す。
【0028】図5の例において、破線で示されたスペク
トル係数がトーン性の部分TCA 、TCB 、TCC 、T
D を示し、実線で示されたスペクトル係数がノイズ性
の部分を示す。これらのトーン性成分は、図5の例のよ
うに少数のスペクトル信号に集中して分布しているた
め、これらの成分を精度よく量子化しても、全体として
あまり多くのビット数は必要とならない。
【0029】また、図5の実線に示すノイズ性成分につ
いては、各量子化ユニットの帯域、例えば5つの帯域b
1〜b5において、上記元のスペクトルから上記破線の
トーン性成分が取り除かれているため、各量子化ユニッ
トにおける正規化係数は小さな値となり、従って、少な
いビット数でも発生する量子化雑音を小さくすることが
できる。なお、実際には、オーディオ信号の全スペクト
ルを例えば25バンド程度の帯域に分割しており、これ
らの帯域は人間の聴覚特性を考慮した高域ほど帯域幅が
広くなるようないわゆる臨界帯域幅で分割されている。
【0030】次に、上記図2のビット割当制御ブロック
22は、割り当て可能な全ビットについて、音響心理学
的に意味のある方法でトーン性成分とノイズ性成分とに
対してビットを割り当てることが必要とされる。
【0031】図6は、本実施例のオーディオ信号符号化
方法に用いられるビット割り当て方法の一例の要部を概
略的に示すフローチャートである。このフローチャート
では、各部分にビットを割り当てる順序を示している。
【0032】まずステップS62において、信号のトー
ン性成分を識別し、トーンを抽出し、これを量子化す
る。これらのトーンは、所定数のスペクトルで定義され
たローカル周波数範囲を単位としてローカルエネルギ基
準を用いて検出しているところから、ローカルトーンと
呼ぶ。ローカルトーンは、ローカル周波数範囲内の大部
分の信号エネルギを含むような一群のスペクトルとして
定義される。トーンは、通常トーンまたは大トーンのい
ずれかとして分類される。大トーンは通常トーンより大
きなエネルギを有し、そのためスペクトルごとに余分の
ビットを用いて量子化される。信号のトーナリティも計
算しており、トーン成分内に含まれる全エネルギが信号
の全エネルギの大部分を含む場合には、信号をトーンと
見なす。信号をトーンと見なす場合、トーンには余分の
ビットを割り当てる。
【0033】トーン成分を検出し、また抽出したなら、
信号の高パワーの周波数領域を分離して妥当な精度で量
子化することにより、残りの重要なスペクトル成分の認
識を行なう。このパワーは、トーンとしてまたはいわゆ
るパワー量子化ユニットとして量子化することが出来
る。本アルゴリズムにおいては、先ずステップS63で
パワートーンを検出し、次いでステップS64でパワー
量子化ユニットを検出している。これまでの方法ではト
ーンとして検出されなかったような単一トーンが顕著な
比率の信号パワーを含む場合には、正確に量子化するた
めおよび量子化ユニット内の残りスペクトルをより正確
に量子化するため、さらなる抽出を行なうことがある。
単一の量子化ユニットが高いパワー密度、すなわちスペ
クトルあたりのパワーを含む場合には、パワー量子化ユ
ニットとして分類し、相対的に量子化雑音が聴取されな
いように充分なビット数で量子化する。
【0034】最後に、ステップS65で残りのスペクト
ルを可能な限り正確に量子化する。この時点では、マス
クされないスペクトルだけを考慮していることに注意す
る。通常は、パワー強度の順に残りのビットを量子化ユ
ニットに単純に割り当てることでスペクトルを量子化す
るが、場合によっては多数のスペクトルを含む量子化ユ
ニットからトーンを抽出することも有り得る。これによ
り残りのスペクトルでのスケールファクタが低下するの
で、同一ワード長でより正確に量子化する。このような
トーンをスケールファクタトーンと称する。
【0035】図7は、本実施例に用いられるビット割り
当て方法の主要な段階の具体例を示すフローチャートで
ある。
【0036】最初のステップS72では、ビットを割り
当てる前に、マスキング閾値を計算している。このマス
キング閾値は、重要な各帯域内のパワーを加算してから
マスカー(masker)展開関数を適用することで計算す
る。展開関数は隣接する臨界帯域に由来するマスキング
を決定するものであり、展開関数の一例を図8に示す。
最終的なマスキング関数以下に収まる信号の展開成分
(図中斜線の領域)はいずれも聴取されないので、符号
化する必要はない。
【0037】マスキング計算後、このアルゴリズムは、
いわゆるローカルトーンの検出ステップS73に進む。
ローカルトーンは、信号のローカルエネルギの大部分を
含む一群のスペクトルと定義される。トーンは例えば5
スペクトルのグループとして定義され、ローカル周波数
範囲は例えば25スペクトルと定義される。これらの2
つの範囲の信号パワーの比を計算し、この値をローカル
レートRloc という。すなわち図9において、最初のス
テップS92で例えば25スペクトルについてのローカ
ルパワーPloc を計算し、次のステップS93で例えば
5スペクトルについてのトーンパワーPtoneを計算し、
最後のステップS94でこれらの比としてのローカルレ
ートRloc (=Ptone/Ploc )を計算している。
【0038】トーン閾値は例えば0.75に設定し、ロ
ーカル周波数範囲のエネルギの75%を含む例えば5ス
ペクトルからなるグループをトーンとして予めフラグを
立てておく。しかし、単一の高エネルギのスペクトルに
よる影響のため、幾つかの近接スペクトルをトーンとし
て分類することも有り得る点に注意しなくてはならな
い。従って、重複しないトーンだけ、すなわち中心スペ
クトルが少なくとも4スペクトルだけ離されているトー
ンだけを許容する。2つまたはそれ以上のトーンが互い
に4スペクトル以内の位置に存在する場合、上記ローカ
ルレートRloc が最大の値をとるトーンだけをトーンと
して分類する。
【0039】上述のアルゴリズムは、パワーの比にだけ
依存したものであって、トーンスペクトル内のパワー分
布を考慮していない。従ってトーンは必ずしも単一のト
ーンピークを含むとは限らず、ローカル周波数範囲のパ
ワーの例えば15%をそれぞれが含むほぼ大きさの等し
い5つのスペクトルを含むことがある。この場合、スペ
クトルは実際のトーンではなく、通常の量子化ユニット
として量子化する方がよい。
【0040】この条件を検出するには、図10に示すフ
ローチャートにて、平均/中央値レートRmean_medの計
算を行なう。これはローカルスペクトルの中央値に対す
るローカルスペクトルの平均値の比である。ここで中央
値は、いわゆるメジアンであり、量子化ユニットの各値
の内、中央の大きさの値である。図10のステップS1
02では、例えば25個のローカルスペクトルの中央値
を計算しており、25スペクトルを値の小さいものから
大きさの順に並べた場合、中央値は13番目の値とな
る。次のステップS103では平均値を計算しており、
この平均値は、例えば25個のローカルスペクトルの算
術平均である。一般には総加平均が用いられる。次のス
テップS104では、上記各ステップS102、S10
3で求めた中央値と平均値を用いて、平均値/中央値の
値を計算している。
【0041】よって、平均/中央値レートR
mean_medは、ローカル中央値に対するローカル平均値の
比率であると定義されることになる。平均/中央値レー
トRmean_medの計算を、上述のパワーに基づいた方法で
選択したそれぞれのトーンに対して行なう。平均/中央
値レートRmean_medが例えば2.5以下の値を有するよ
うなトーンの場合、誤検出トーンと見なして量子化のト
ーン性成分に含める。
【0042】再び図7に戻って、以上でステップS73
におけるローカルトーン検出が行われたので、次のステ
ップS74で信号のトーナリティを計算する。具体的に
は、ローカルトーンにおけるエネルギの和が全エネルギ
の例えば98%以上であれば、信号はトーナリティがあ
ると見なす。
【0043】次に、ステップS75に進んで、ローカル
トーンにビットを割り当てる。割当ビット数は、上述の
計算による信号のトーナリティおよび各トーンの包括す
る全エネルギの比率に依存する。より詳細には、全エネ
ルギはスペクトル全部のエネルギの和として計算され
る。トーンエネルギは前記と同一である。トータルレー
トRtot は全エネルギに対するトーンエネルギの比率と
定義される。
【0044】このトータルレートRtot の計算について
図11を参照しながら説明する。図11において、ステ
ップS112で全スペクトルのトータルパワーPtot
計算し、次のステップS113で5スペクトルのトーン
パワーPtoneを計算し、次のステップS114でトータ
ルレートRtot をPtone/Ptot を計算することにより
求める。
【0045】このようにして求められたトータルレート
tot が0.18(全エネルギの18%)以上の場合に
は、トーンは大トーンと見なされ、それ以外の場合は通
常トーンとされる。これらの各トーンには、例えば次の
ようなビット数を割り当てるものとする。 大トーン トーン性成分:5ビット 非トーン性成
分:4ビット 通常トーン トーン性成分:4ビット 非トーン性成
分:3ビット これらのビット数はトーン内の各スペクトルに割り当て
るビット数の一具体例を表わす。
【0046】次に、図7のステップS76にてパワート
ーンを検索する。パワートーンは信号の全エネルギの例
えば40%以上を含むトーンと定義される。全エネルギ
はスペクトル全部のエネルギの和で計算する。トーンエ
ネルギは前述のように5スペクトルにわたり計算する。
このときのトータルレートRtot2は、全エネルギに対す
るトーンエネルギの比率と定義される。これは大トーン
と通常トーンの間で行なう上述のテストと同様である。
【0047】このようなエネルギ計算は、ローカルトー
ン検出方法がトーンスペクトルとしてすでに決定したス
ペクトルについてのみ適用することに注意されたい。例
えば0.4以上のトータルレートRtot2を有するスペク
トルは予めパワートーンとして検出する。前述のよう
に、幾つかの近接するスペクトルを単一の高エネルギス
ペクトルの影響によりトーンとして分類することが有り
得るから、重複しないパワートーンのみ、すなわち中心
スペクトルが例えば少なくとも4スペクトルだけ離れて
いるようなトーンだけを受け入れる。2つまたはそれ以
上のトーンが互いに4スペクトルの範囲内に存在する場
合には、トータルレートRtot2が最大値を有するトーン
のみをパワートーンとして分類する。
【0048】次のステップS77においては、このよう
にして検出されたパワートーンにビットを割り当てる。
パワートーンは必ず大トーンとして量子化する。もし何
らかのパワートーンを検出した場合には、前述のトーナ
リティ検出で非トーンとしてそのブロックにフラグを立
てるが、トーナリティ測定のためにはローカルトーンに
信号エネルギの例えば98%が含まれる必要がある点に
に注意されたい。従ってパワートーンは例えば4ビット
に量子化される。
【0049】次に、本アルゴリズムによれば、ステップ
S78に進んでいわゆるパワー量子化ユニットを検出
し、ステップS79でビットを割り当てる。量子化ユニ
ットはトーンとして量子化されなかった主要な信号成分
を含む。パワー量子化ユニットとして量子化されない量
子化ユニットは一般に重要でないスペクトル成分または
マスクした信号成分を含む。本アルゴリズムでは、例え
ば少なくとも3ビットまたは4ビットでパワー量子化ユ
ニットを量子化しようとする。
【0050】図7に示したように、パワー量子化ユニッ
トの選択は反復的に行なう。本アルゴリズムでは、ステ
ップS80に示すように、これ以上パワー量子化ユニッ
トが見つからなくなるまで、または別のパワー量子化ユ
ニットに割り当てるのに充分なビットがなくなるまで、
繰り返してパワー量子化ユニットを検出し、また必要な
だけビットを割り当てる。
【0051】各繰り返し毎に、すでに検出したパワー量
子化ユニットを除いて、各量子化ユニットのパワー強度
を計算する。量子化ユニットのパワー密度DQUは、トー
ンスペクトルを除く量子化ユニットの全スペクトルのパ
ワーPQUを加算し量子化ユニット内のスペクトル総数で
除算することにより計算される。パワー密度を残りのス
ペクトルについて計算し、これを先に検出したパワー量
子化ユニットとトーンとして分類したスペクトル以外の
全スペクトルと定義する。
【0052】図12には、残りのスペクトルのパワー密
度Drem の計算を示すフローチャートを示している。
【0053】この図12において、最初のステップS1
22ではスペクトルの総数をNSPECとし、ステップS1
23、S124、S125ではそれぞれ初期値設定とし
て、残りパワーPrem を0.0とし、スペクトル番号i
を0とし、残りスペクトルのカウント値nを0としてい
る。次のステップS126では、i番目のスペクトルsp
ec[i]は上記パワー量子化ユニットに分類されるか否か
を判別し、YESのときはステップS130に、NOの
ときはステップS127に、それぞれ進んでいる。ステ
ップS127では、i番目のスペクトルspec[i]は上記
トーンに分類されるか否かを判別し、YESのときはス
テップS130に、NOのときはステップS128にそ
れぞれ進んでいる。ステップS128では、残りパワー
rem をそれまでの残りパワーPrem といまのスペクト
ルのパワーspec[i]×spec[i]との和に置き換えて、ス
テップS129に進み、残りスペクトルのカウント値n
をインクリメントしている。次のステップS130で
は、上記iが上記総数NSPECに達したか否かを判別して
おり、NOのときはステップS132に進んでiをイン
クリメントして上記ステップS126に戻り、YESの
ときはステップS131に進んで残りのスペクトルのパ
ワー密度Drem をPrem /nにより求めて出力してい
る。
【0054】すなわちDrem は、これらの残りのスペク
トルの総パワーPrem を計算したのち、パワー計算に含
めたスペクトル数nで除算して求めている。この数nは
一般にスペクトル総数NSPECと等しくないことに留意さ
れたい。
【0055】本アルゴリズムにおいては、それぞれの量
子化ユニットを検査してパワー量子化ユニットの要件に
適合するかを調べる。検査結果に従ってパワー量子化ユ
ニットにビットを割り当てる。
【0056】ここで図13は、上記検出とビット割り当
ての具体例を表わすフローチャートを示している。
【0057】この図13において、まずステップS14
2では、密度レートRdens、すなわち、上記残りスペク
トルパワー密度Drem に対する量子化ユニットのパワー
密度DQUの比を計算する。また次のステップS143で
は、トータルレートRtot2を計算する。これは、全ての
トーンおよびパワー量子化ユニットを含めた、スペクト
ル全体の総エネルギPtot に対する、量子化ユニット内
のエネルギPQUの比と定義される。
【0058】次のステップS144では、上記密度レー
トRdensが例えば14より大きいか否かを判別してお
り、YESのときはステップS145に、NOのときは
ステップS147にそれぞれ進んでいる。ステップS1
45では、上記トータルレートRtot2が例えば0.18
よりも大きいか否かを判別しており、YESのときはス
テップS147に進んで量子化ユニットに4ビットを割
り当て、NOのときはステップS148に進んで量子化
ユニットに3ビットを割り当てている。ステップS14
6では、上記トータルレートRtot2が例えば0.35よ
りも大きいか否かを判別しており、YESのときはステ
ップS148に進んで量子化ユニットに3ビットを割り
当て、NOのときはステップS149に進んでいる。ス
テップS149では、残りパワーレートRrem をPQU
rem により計算し、ステップS150にてこのRrem
が例えば0.9より大きいか否かを判別し、YESのと
きはステップS148に進んで量子化ユニットに3ビッ
トを割り当て、NOのときは処理を終了している。
【0059】すなわち、この図13の具体例では、上記
密度レートRdensが14より大きくかつ上記トータルレ
ートRtot2が0.18より大きい場合には、量子化ユニ
ットに4ビットを割り当てる。これ以外の場合で、上記
densが14より大きくかつ上記Rtot2が0.18以下
の場合、又は上記Rdensが14以下でかつ上記Rtot2
0.35より大きい場合には3ビットを割り当てる。最
後に、上述のいずれの例にも当てはまらない場合には、
上記Rrem をPQU/Prem により計算し、このRrem
0.9より大きい場合には量子化ユニットに3ビットを
割り当て、それ以外では、パワー量子化ユニットとして
検出せずに次の量子化ユニットを検査する。図7に図示
したように、パワー量子化ユニットとして量子化ユニッ
トが検出されなくなるまで、この反復ループを繰返す。
【0060】次に、もし残りのビットがあれば、残りの
ビットを用いて、可能な方法により残りのマスクされて
いないスペクトルを量子化する。ここで、信号の重要な
スペクトル成分が、トーンまたはパワー量子化ユニット
として識別されたものと仮定する。本アルゴリズムにお
いては、ステップS81に示すように、例えば少なくと
も2ビットを残りのマスクされていないスペクトルに割
り当てることを目標としている。しかし、これを行うた
めに十分なビット数が残っていない場合も有り得るの
で、本アルゴリズムでは量子化ユニットのパワー密度の
順番に従って、各量子化ユニットにビットを配分してい
る。
【0061】パワー密度は、最初にマスクされていない
量子化ユニットパワーを計算し、次にパワーを量子化ユ
ニット内のスペクトル数で除算することにより計算す
る。パワー計算にはトーンスペクトルとして検出されな
かったマスキングされないスペクトルのみを含む。マス
キングされないスペクトルは大きさがその量子化ユニッ
トのマスキング閾値より大きなスペクトルからなる。さ
らにパワー強度の減少する順番に量子化ユニットを並べ
替える。本アルゴリズムは、量子化ユニットパワーが0
以上のマスキングされないスペクトルを有し、これまで
にビット割り当てしていない、すなわちパワー量子化ユ
ニットとしてビットを割り当てていない各量子化ユニッ
トに対して、それぞれ2ビットの割り当てを試みる。
【0062】さらにビットが残っている場合、本アルゴ
リズムは非パワー量子化ユニットの量子化の改善を試み
る。これは、ステップS82に示すように、剰余ビット
(2から3ビット)を量子化ユニットに加えることによ
り、またはいわゆるスケールファクタトーンを割り当て
ることにより行なう。スケールファクタトーンを用い
て、最大値を排除することにより量子化ユニット内のス
ケールファクタを減少させる。つまり残りの値はさらに
ビットを付加しなくともより正確に量子化されることに
なる。本アルゴリズムでは、剰余ビットの追加とスケー
ルファクタトーンの割り当てのどちらを行なうかの判断
を、いずれかの動作を実行するのに必要なビット数に従
って、またどちらの動作の方が少ない量子化エラーを生
成するかによって行なっている。
【0063】最後に、本アルゴリズムでは、ステップS
83において、残りビットがあれば残りの量子化ユニッ
トに割り当てる。最初に3ビットパワー量子化ユニット
に割り当て(4ビットに高品質化)、次いでマスキング
していないスペクトルを有する他の量子化ユニットに割
り当ててから、最後に全ての残りの量子化ユニットに割
り当てる。
【0064】本アルゴリズムが何らかの残りビットと共
に最終段階にたどり着くことは希であり、本アルゴリズ
ムのこの部分は特に必須なものではなく、一般に、極度
にトーン性の高い信号の場合に到達するのみである。
【0065】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、分割帯域数やトーン性識別の
ためのスペクトルの本数、あるいは各割当ビット数等は
上記具体的な数値に限定されず、ビットレートや音質等
を考慮して適宜設定すればよいことは勿論である。
【0066】
【発明の効果】本発明に係るオーディオ信号符号化方法
によれば、入力オーディオ信号のスペクトルの内のトー
ン性成分を抽出して量子化し、次に高パワー周波数領域
をパワー量子化ユニットとして分離して相対的に量子化
雑音が聴取されないようなビット数で量子化し、最後に
残ったスペクトルを残ったビット数で量子化することに
より、聴感上で重要な部分から順に多くのビットを割り
当てるような効率的なビット配分による符号化が行え、
低いビットレートで高品質のオーディオ信号符号化を実
現できる。
【0067】また、トーンを通常トーンと大トーンとに
分類し、大トーンにより多くのビットを割り当てること
により、さらに符号化効率を上げることができ、同じビ
ットレートでは音質を高めることができる。
【0068】また、残りのスペクトルを同一ワード長で
量子化することにより、ビット配分処理を簡略化でき
る。
【0069】さらに、所定数スペクトル範囲に2つのロ
ーカルピークが存在する場合には、パワーの大きな方の
単一のトーンをトーンとして抽出することにより、重複
したトーン検出が回避できる。また、スペクトルの平均
値/中央値の比に基づきトーンを抽出することや、上記
スペクトルのトーナリティに基づきトーンを抽出するこ
とにより、トーンの誤検出を防止でき、適切なトーン検
出が行える。
【図面の簡単な説明】
【図1】本発明に係るオーディオ信号符号化方法の実施
例が適用されるオーディオエンコーダ/デコーダシステ
ムの概略構成を示すブロック図である。
【図2】本発明に係るオーディオ信号符号化方法の実施
例が適用されるオーディオエンコーダの一例を示すブロ
ック図である。
【図3】図2のエンコーダ内の時間−周波数分析ブロッ
ク21の構造の一例を示すブロック回路図である。
【図4】本発明に係るオーディオ信号符号化方法の実施
例に用いられるスペクトル量子化ブロックを示すブロッ
ク回路図である。
【図5】本発明の実施例のオーディオ信号符号化方法に
おけるオーディオ信号のスペクトルのトーン性部分とノ
イズ性部分の一例を説明するための図である。
【図6】本発明の実施例に用いられるビット割り当て方
法の概要を示すフローチャートである。
【図7】本発明の実施例に用いられるビット割り当て方
法の動作の一例を示すフローチャートである。
【図8】典型的なマスキング展開関数を表わすグラフで
ある。
【図9】上記図7のビット割り当て方法の動作における
トーン測定のためのローカルレート計算の一例を示すフ
ローチャートである。
【図10】上記図7のビット割り当て方法の動作におけ
るトーン測定のための平均/中央値レートの計算の一例
を示すフローチャートである。
【図11】上記図7のビット割り当て方法の動作におけ
るトーン測定のためのトータルレート計算の一例を示す
フローチャートである。
【図12】上記図7のビット割り当て方法の動作におけ
るパワー量子化ユニット検出に用いる残りスペクトルの
パワー密度計算の一例を示すフローチャートである。
【図13】上記図7のビット割り当て方法の動作におけ
る各種検査結果に応じたビット割当の具体例を示すフロ
ーチャートである。
【符号の説明】
11 オーディオエンコーダ 21 時間−周波数分析ブロック 22 ビット割当制御ブロック 23 スペクトル量子化ブロック 24 音響心理学的モデル出力ブロック 41 トーン性成分抽出回路 42 トーン性成分量子化回路 43 ノイズ性成分量子化回路

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】入力オーディオ信号に所定の変換を施すこ
    とにより複数のスペクトルを得て、各スペクトルに聴覚
    特性に応じたビットを割り当てて符号化するオーディオ
    信号符号化方法であって、 上記複数のスペクトルについて、トーン性成分を識別
    し、 上記トーン性成分よりトーンを抽出し、これを予め決め
    られたビット数にて量子化し、 上記複数のスペクトルについて、高パワー周波数領域を
    分離し、パワー量子化ユニットとして分類して、相対的
    に量子化雑音が聴取されないビット数で量子化し、 残りのスペクトルを残ったビットにて量子化することを
    特徴とするオーディオ信号符号化方法。
  2. 【請求項2】上記トーンの抽出は、 さらに上記トーンを通常トーン、または大トーンのいず
    れかとして分類し、 上記大トーンは上記通常トーンより多くのビットで量子
    化することを特徴とする請求項1記載のオーディオ信号
    符号化方法。
  3. 【請求項3】上記残ったビットによる量子化は、 同一ワード長で量子化することを特徴とする請求項1記
    載のオーディオ信号符号化方法。
  4. 【請求項4】上記トーンの抽出は、 まずローカルピークを求め、このローカルピークについ
    て、所定数スペクトル範囲に2つのローカルピークが存
    在する場合には、パワーの大きな方の単一のトーンをト
    ーンとして抽出することを特徴とする請求項1記載のオ
    ーディオ信号符号化方法。
  5. 【請求項5】上記トーンの抽出は、 スペクトルの平均値/中央値の比に基づき抽出すること
    を特徴とする請求項1記載のオーディオ信号符号化方
    法。
  6. 【請求項6】上記トーンの抽出は、 上記スペクトルのトーナリティに基づき、抽出すること
    を特徴とする請求項1記載のオーディオ信号符号化方
    法。
JP09154594A 1994-04-28 1994-04-28 オーディオ信号符号化方法 Expired - Fee Related JP3465341B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09154594A JP3465341B2 (ja) 1994-04-28 1994-04-28 オーディオ信号符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09154594A JP3465341B2 (ja) 1994-04-28 1994-04-28 オーディオ信号符号化方法

Publications (2)

Publication Number Publication Date
JPH07295594A true JPH07295594A (ja) 1995-11-10
JP3465341B2 JP3465341B2 (ja) 2003-11-10

Family

ID=14029461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09154594A Expired - Fee Related JP3465341B2 (ja) 1994-04-28 1994-04-28 オーディオ信号符号化方法

Country Status (1)

Country Link
JP (1) JP3465341B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002103682A1 (en) * 2001-06-15 2002-12-27 Sony Corporation Acoustic signal encoding method and apparatus, acoustic signal decoding method and apparatus, and recording medium
WO2005104094A1 (ja) * 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
EP2093758A2 (en) 2008-02-19 2009-08-26 Fujitsu Limited Device, method and computer program for encoding audio signal in the spectral domain
JP2010510540A (ja) * 2006-11-17 2010-04-02 サムスン エレクトロニクス カンパニー リミテッド オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
USRE43099E1 (en) 1996-12-19 2012-01-10 Alcatel Lucent Speech coder methods and systems

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE43099E1 (en) 1996-12-19 2012-01-10 Alcatel Lucent Speech coder methods and systems
WO2002103682A1 (en) * 2001-06-15 2002-12-27 Sony Corporation Acoustic signal encoding method and apparatus, acoustic signal decoding method and apparatus, and recording medium
US7447640B2 (en) 2001-06-15 2008-11-04 Sony Corporation Acoustic signal encoding method and apparatus, acoustic signal decoding method and apparatus and recording medium
WO2005104094A1 (ja) * 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
JP4741476B2 (ja) * 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
JP2010510540A (ja) * 2006-11-17 2010-04-02 サムスン エレクトロニクス カンパニー リミテッド オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
EP2093758A2 (en) 2008-02-19 2009-08-26 Fujitsu Limited Device, method and computer program for encoding audio signal in the spectral domain
US9076440B2 (en) 2008-02-19 2015-07-07 Fujitsu Limited Audio signal encoding device, method, and medium by correcting allowable error powers for a tonal frequency spectrum

Also Published As

Publication number Publication date
JP3465341B2 (ja) 2003-11-10

Similar Documents

Publication Publication Date Title
US5341457A (en) Perceptual coding of audio signals
KR100269213B1 (ko) 오디오신호의부호화방법
JP3277692B2 (ja) 情報符号化方法、情報復号化方法及び情報記録媒体
KR100397690B1 (ko) 데이터부호화장치및그방법
KR100295217B1 (ko) 신호스펙트럼-의존양자화비트할당및노이즈스펙트럼-의존양자화비트할당으로서디지탈입력신호를압축하는장치
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
US5758315A (en) Encoding/decoding method and apparatus using bit allocation as a function of scale factor
US7650278B2 (en) Digital signal encoding method and apparatus using plural lookup tables
JP3297240B2 (ja) 適応的符号化システム
CA2075156A1 (en) Digital encoder with dynamic quantization bit allocation
KR100289733B1 (ko) 디지탈 오디오 부호화 방법 및 장치
KR0137472B1 (ko) 오디오 신호 코딩 방법
JPH09134200A (ja) ディジタル・オーディオ符号化方法及びその装置
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JP3465341B2 (ja) オーディオ信号符号化方法
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
KR100300957B1 (ko) 룩업테이블을이용한디지탈오디오부호화방법및장치
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH0750589A (ja) サブバンド符号化装置
JP2993324B2 (ja) 音声高能率符号化装置
Teh et al. Subband coding of high-fidelity quality audio signals at 128 kbps
KR100351772B1 (ko) 디지털부호화장치,디지털기록신호도출장치및디지털신호데이터도출방법
KR100340368B1 (ko) 고능률부호화장치,복호화장치및디지털데이터도출방법
KR0144841B1 (ko) 음향신호의 적응적 부호화 및 복호화장치

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030729

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090829

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100829

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees