JP2000347679A - オーディオ符号化装置及びオーディオ符号化方法 - Google Patents

オーディオ符号化装置及びオーディオ符号化方法

Info

Publication number
JP2000347679A
JP2000347679A JP11159523A JP15952399A JP2000347679A JP 2000347679 A JP2000347679 A JP 2000347679A JP 11159523 A JP11159523 A JP 11159523A JP 15952399 A JP15952399 A JP 15952399A JP 2000347679 A JP2000347679 A JP 2000347679A
Authority
JP
Japan
Prior art keywords
initial value
ratio
coefficient
value
scaling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11159523A
Other languages
English (en)
Inventor
Tetsuro Wada
哲朗 和田
Hideaki Ebisawa
秀明 海老沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP11159523A priority Critical patent/JP2000347679A/ja
Publication of JP2000347679A publication Critical patent/JP2000347679A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 従来、最適なパラメータ初期値が設定できな
いと、所望の符号量を満足するための最適な符号化パラ
メータが得られるまでの時間が長くなるという課題があ
った。 【解決手段】 入力されたオーディオデータを直交変換
して変換係数を算出する直交変換部11、オーディオデ
ータを分析して許容歪み量を算出する聴覚モデル部1
2、変換係数をスケーリングするスケーリング部13、
スケーリングされた変換係数を量子化する量子化部1
4、量子化された変換係数を可変長符号化して出力する
可変長符号化部15、適切な評価結果が得られるまでス
ケーリング係数及び量子化ステップを更新して反復処理
を指示する符号量/歪み制御部30、及び量子化ステッ
プの初期値を最適制御する初期値制御部31を備えた。 【効果】 目標符号量に収束させるまでの収束時間を短
くでき、また、同品質の符号化を行うために必要な演算
処理装置の負荷が少なくて済む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、オーディオデー
タを効率的に符号化するオーディオ符号化装置及びオー
ディオ符号化方法に関し、特に、オーディオデータを直
交変換後、可変長符号化によって圧縮符号化した後の符
号量を、高速に所望の目標符号量に制御するオーディオ
符号化装置及びオーディオ符号化方法に関するものであ
る。
【0002】
【従来の技術】オーディオ符号化方法には、オーディオ
データを複数のブロックに分割し、ブロック毎にオーデ
ィオデータを直交変換して変換係数を得、これを適切な
スケーリング係数でスケーリングし、さらに適切な量子
化ステップで量子化し、この量子化した値をハフマン符
号などを用いた可変長符号化により符号化する方法があ
る。
【0003】このような符号化方法には、例えばISO
/IEC、13818−7として規格化された「MPE
G−2 Advanced Audio Coding
(AAC)」符号化方式がある。この符号化における符
号量制御の方法は、直交変換後の変換係数に対し、スケ
ーリング係数および量子化ステップの2つのパラメータ
を適応的に変化させながら、ハフマン符号による可変長
符号化後の符号量を別途定められた目標符号量に近づけ
るというものである。なお、ここでいう符号量とは符号
化に必要なビット量のことであり、目標符号量とは、ブ
ロック毎に対して設定される値で、例えばあらかじめ設
定された符号化ビットレートから算出されるものであっ
て、ブロック毎に固定であっても可変であってもよい。
【0004】従来のオーディオ符号化装置について図面
を参照しながら説明する。図12は、従来のオーディオ
符号化装置の構成を示すブロック図である。
【0005】図12において、11は直交変換部、12
は聴覚モデル部、13はスケーリング部、14は量子化
部、15は可変長符号化部、30は符号量/歪み制御部
である。
【0006】入力端子20には、オーディオデータが入
力される。このオーディオデータは、通常、時系列のデ
ータであり、特定のサンプリング周波数でサンプリング
されさらに特定の量子化ビット数で量子化されたディジ
タルデータである。オーディオ符号化の場合、サンプリ
ング周波数として48kHz、量子化ビット数として1
6ビットというパラメータが選択されることが多い。
【0007】直交変換部11は、変形離散コサイン変換
(MDCT:Modified Discrete C
osine Transform)等の直交変換により
時系列のオーディオデータを周波数系列の変換係数に変
換する。変換後の変換係数の各値は周波数軸成分、すな
わちスペクトルデータを表している。なお、MDCTに
よる直交変換の場合には、例えば変換ブロックサイズに
は2048サンプル相当が選択され、ブロック間では1
/2のオーバーラッピングが施される。直交変換部11
からの出力である変換係数22は、スケーリング部13
に入力される。
【0008】入力端子20のオーディオデータは、直交
変換部11に入力されるのと並行して聴覚モデル部12
にも入力される。この聴覚モデル部12では、オーディ
オデータを人間の聴覚特性に基づいて分析し許容歪み量
を算出する。もともと人間の耳には絶対的に音を聞き取
る限界が周波数に応じて存在しており、これを最小可聴
限という。これに対して、各種の音が存在する状況下で
の聞き取る限界をマスキングしきい値と呼んでいる。例
えば、人と会話をしている時に上空を飛行機が飛ぶよう
な場合に、これまで聞こえていた相手の話し声が飛行機
の騒音によって聞き取れなくなることがある。これは飛
行機の騒音によってマスキングしきい値が上昇したこと
を意味し、この現象をマスキング効果という。許容歪み
量とは、後述する量子化部14において変換係数を量子
化することによって発生する量子化歪みが、マスキング
効果により聞き取れなくなる限界を示すしきい値であ
る。この許容歪み量28は、符号量/歪み制御部30に
入力される。
【0009】スケーリング部13は、直交変換部11か
ら出力されるブロック単位の変換係数22を、符号量/
歪み制御部30から与えられる適切なスケーリング係数
23を用いてスケーリングを行う。スケーリングは、周
波数軸上の区分であるスケールファクタバンド毎に行わ
れ、効率的なスケーリングが行われるようスケーリング
係数はスケールファクタバンド毎に適応的に決定されて
いる。
【0010】量子化部14は、スケーリング部13でス
ケーリングされた変換係数に対し、符号量/歪み制御部
30から与えられる適切な量子化ステップ25を用いて
量子化を行う。量子化された変換係数は可変長符号化部
15に入力されると共に符号量/歪み制御部30に入力
される。
【0011】可変長符号化部15は、例えばハフマン符
号等を用いて量子化部14からの変換係数を符号に置き
換え冗長圧縮符号化を行う。ハフマン符号表はあらかじ
め定められており、効率の良い圧縮符号化が行えるよ
う、複数用意されている中から最適なものを選択する場
合もある。適切なハフマン符号表に基づいて符号化され
た後の符号データ27は、符号量/歪み制御部30と出
力端子21に対して送られる。出力端子21には、記憶
装置や通信回線が接続され、一連の処理を経て得られた
符号データは記憶装置に蓄積されたり、通信回線を通し
て伝送されたりする。
【0012】符号量/歪み制御部30は、スケーリング
部13に対しては最適なスケーリング係数23を与え、
量子化部14に対しては最適な量子化ステップ25を与
える。また、量子化部14の出力する変換係数の量子化
値26を、量子化部14に与えた量子化ステップ25で
逆量子化し、さらにスケーリング13に与えたスケーリ
ング係数23で逆スケーリングを行い、量子化歪み量を
算出する。
【0013】同時に、符号量/歪み制御部30は、可変
長符号化部15の出力する符号27の全符号量を計算す
る。さらに、算出した量子化歪み量と上記の許容歪み量
28とを比較することによって、新たにスケーリング係
数23を更新する。また、計算した符号量と上記の目標
符号量29とを比較することによって、新たに量子化ス
テップ25を更新する。更新されたスケーリング係数及
び量子化ステップは再びスケーリング部13及び量子化
部14に与えられる。この様に、符号量/歪み制御部3
0では、特定の条件を満たすまで、スケーリング係数と
量子化ステップを変更して対応する処理部に対して出力
する。
【0014】上記符号量/歪み制御部30においては、
例えばAAC符号化方式では、以下のような方法で符号
量の制御を行っている。制御ステップの構成は大きく3
つに分かれる。第1制御ステップは、初期処理及び外ル
ープ処理と呼ばれる第2制御ステップの実行呼び出しを
行う。さらに、この第2制御ステップは、内ループ処理
と呼ばれる第3制御ステップの実行呼び出しを行う。つ
まり、制御ステップ全体は、2重ループの構成になって
いる。
【0015】図13は、メインとなる第1制御ステップ
の処理フローを示している。ステップ1300におい
て、目標とする符号量を設定し、次のステップ1301
において、符号化のパラメータであるスケーリング係数
と量子化ステップの初期値を定め、次のステップ130
2〜1303において、変換係数が全て零でない場合の
み第2制御ステップ以降を実行する。変換係数が全て零
の場合には符号化をする必要がなく、従って符号量制御
処理も実行する必要はない。ここでスケーリング係数と
量子化ステップとは以下の通りに定義される。
【0016】例えば、変換係数のi番目の要素をSP
[i]とすると、スケーリング後の変換係数であるSS
[i]は以下の式(1)で与えられる。
【0017】 SS[i]=(SP[i]*2^(1/4*α[sb]))^3/4 ・・・式(1)
【0018】式(1)におけるα[sb]がsb番目の
スケールファクタバンドに対するスケーリング係数であ
る。ここでスケールファクタバンドとは、複数の変換係
数を同一のスケーリング係数でスケーリングを行う区分
のことであり、全ての変換係数はオクターブバンドに類
似した形で複数のスケールファクタバンドに区分されて
いる。式(1)より、スケーリング係数αの値が大きく
なるに従ってスケーリング後の変換係数SSも大きくな
ることが判る。つまりスケーリング係数を大きくするに
従って、スケーリング後の変換係数SSのダイナミック
レンジを広くとれる。これは、この後の量子化の際に発
生する量子化歪み量を少なくできることを意味する。
【0019】スケーリング後の変換係数SS[i]に対
し、変換係数の量子化値SQ[i]は以下の式(2)で
与えられる。
【0020】 SQ[i]=int(SS[i]*2^(−3/16*QT)+M) ・・・式(2)
【0021】式(2)におけるQTが全ての変換係数に
対する量子化ステップである。また、Mは整数値への丸
めを行うint関数のための補助定数である。式(2)
より、量子化ステップQTの値が大きくなるに従って量
子化後の変換係数の値SQは小さくなることが判る。つ
まり量子化ステップを大きくするに従って、変換係数の
量子化値SQは絶対値が小さくなると共にダイナミック
レンジが狭くなるため、この後に続く可変長符号化部1
5における符号化の際に必要な符号量が少なくなること
を意味する。同時に、int関数による整数値への丸め
の際に発生する小数値の切り捨て量または切り上げ量
が、量子化を行う前の変換係数を基準にした場合には大
きくなることが判る。これが量子化歪み量である。前述
した通り、式(1)及び式(2)の関係から、スケーリ
ング係数を大きくすることにより量子化歪み量を少なく
できることが判る。
【0022】上記に示したスケーリング及び量子化を行
う際には、まず初めにスケーリング係数及び量子化ステ
ップの初期値を設定する。次の式(3)に示すように、
スケーリング係数の初期値αinitは、全スケールフ
ァクタバンドに対して零とする。
【0023】 αinit[sb]=0 ・・・式(3)
【0024】量子化ステップの初期値は、絶対値が最大
の変換係数を量子化する際、量子化値のダイナミックレ
ンジの範囲内に納められるように選択する。図14は、
その選択の方法である。ステップ1400において、全
ての変換係数の中から絶対値が最も大きなものSPma
xを検出する。ステップ1401において、この変換係
数の絶対値に対して、以下の式(4)を適用する。
【0025】 QTinit=16/3*log2(SPmax^3/4/MAX_QUAN T) ・・・式(4)
【0026】ここで、MAX_QUANTは、量子化値
の取り得る値の範囲を定義する定数である。
【0027】符号量/歪み制御部30では、上記の初期
値を用いて第1回目の試行を行う。試行の結果から得ら
れる量子化歪み量と符号量を評価し、必要があれば第2
回目の試行を行うことになる。その際、スケーリング係
数については、図13の第2制御ステップにおいて量子
化歪み量を徐々に減らす方向へ変化させる。ここで収束
条件としては、聴覚モデル部12から得られる許容歪み
量28の範囲内に収まるようにする。量子化ステップ2
5については、図13の第3制御ステップにおいて、符
号化後の符号量を徐々に減らす方向へと変化させる。
【0028】ところで、一連のスケーリング及び量子化
処理は式(1)及び式(2)から次の式(5)の通りと
なる。
【0029】 SQ[i]=int(((SP[i]*2^(1/4*α[sb]))^3/4)*2^(-3/16*QT)+M) =int(((SP[i]^3/4*2^(3/16*(α[sb]−QT)))+M) ・・・式(5)
【0030】すなわち、変換係数の量子化は、スケーリ
ング係数α[sb]と量子化ステップQTのトレードオ
フで決定していることが判る。符号量/歪み制御部30
がこのトレードオフの関係にある2つのパラメータを制
御する手法について以下に述べる。
【0031】図13は、符号量/歪み制御部30が行う
第1の制御ステップである。目標とする符号量を設定
し、スケーリング係数と量子化ステップの初期値を定
め、変換係数が全て零でない場合のみ第2制御ステップ
及び第3制御ステップを実行する。変換係数が全て零の
場合は符号化をする必要がなく、従って以降の制御処理
を実行する必要はない。
【0032】図15及び図16は、それぞれ第2制御ス
テップ及び第3制御ステップの処理フローである。第1
制御ステップから呼び出された第2制御ステップでは、
ステップ1500において、始めに第3制御ステップを
呼び出す。第3制御ステップでは、ステップ1600に
おいて、その時点で最適と判断しているスケーリング係
数及び量子化ステップをそれぞれスケーリング部13ま
たは量子化部14に対して出力する。これに対し、スケ
ーリング部13ではスケーリングが行われ、量子化部1
4では量子化が行われ、可変長符号化部15では符号化
が行われる。符号量/歪み制御部30では、可変長符号
化部15の出力である符号27を調べることにより符号
量を計量する。計量した符号量見積りの値が目標符号量
29と比較してオーバーしている場合は量子化ステップ
を更新ステップ幅分だけ変更する。
【0033】ここで、この更新ステップ幅を小さくする
と細かな符号量制御が行えるが、その分だけ更新の回数
が増加する場合が発生する。更新ステップ幅を大きくす
ると一度に多くの符号量制御を行えるが、その分微妙な
制御が難しくなる。この様なことを考慮して、この更新
ステップ幅については固定にしても新たに制御部を設け
て適応的に変更しても良い。ここでは簡単のため更新ス
テップ幅は1と考える。更新ステップ幅で更新された量
子化ステップは改めて量子化部14に対して出力され
る。第3制御ステップでは、ステップ1602におい
て、符号量見積りが目標符号量以下になるまで前記の処
理を繰り返し実行する。
【0034】第3制御ステップにおいて、処理を繰り返
すことにより符号量見積りが目標符号量を下回った場合
に、第2制御ステップに戻る。第2制御ステップに戻る
とまず、ステップ1501において、第3制御ステップ
の終了時点での量子化歪み量を計算する。この量子化歪
み量は、量子化部14から出力される量子化値を逆量子
化及び逆スケーリング処理し、直交変換直後の変換係数
との差分を算出することにより求める。その計算式は、
次の式(6)の通りである。
【0035】 E[i]=(SP[i]−(SQ[i]*2^(-3/16(α[sb]−QT)))^4/3)^2 ・・・式(6)
【0036】ここで、E[i]は、変換係数の1つの要
素に対する量子化歪み量であり、スケールファクタバン
ド内の量子化歪み量E[sb]はそれぞれの総和を求め
ればよい。次に、スケールファクタバンド毎に量子化歪
み量E[sb]と聴覚モデル部12から得た許容歪み量
AD[sb]とを比較し、E[sb]>AD[sb]で
あれば、そのスケールファクタバンドに対するスケーリ
ング係数を更新ステップ幅分だけ変更する。
【0037】ここで、この更新ステップ幅を小さくする
と細かな歪み量制御が行えるが、その分だけ更新の回数
が増加する場合が発生する。更新ステップ幅を大きくす
ると一度に多くの歪み量制御を行えるが、その分微妙な
制御が難しくなる。この様なことを考慮して、この更新
ステップ幅については固定にしても新たに制御部を設け
て適応的に変更しても良い。ここでは簡単のため更新ス
テップ幅は1と考える。また、このスケーリング係数の
更新は、1つのループ内で、E[sb]>AD[sb]
であると判定された全てのスケールファクタバンドに対
して行うこととしているが、E[sb]−AD[sb]
の値が最大となるスケールファクタバンドに対してのみ
行うものであっても、また新たに制御部を設けて適応的
にスケールファクタバンドを選択するものであっても良
い。更新ステップ幅で更新されたスケーリング係数は改
めてスケーリング部13に対して出力される。第2制御
ステップでは千スケールファクタバンドにおいてスケー
リング係数の更新ができないか、またはE[sb]>A
D[sb]であるスケールファクタバンドがなくなるま
で前記の処理を繰り返し実行する。
【0038】
【発明が解決しようとする課題】上述したような従来の
オーディオ符号化装置では、1ブロック毎にオーディオ
データを直交変換し、その変換係数をあるスケーリング
係数でスケーリングし、ある量子化ステップで量子化
し、さらに可変長符号化した結果の符号量が所望の目標
符号量以下にならない場合は、スケーリング係数または
量子化ステップを変えて再試行する、いわゆるフィード
バック方式が採られている。この様な単純なフィードバ
ック方式では、最初の試行のスケーリング係数および量
子化ステップ、すなわち初期値にどの様な値を選択する
かによって、目標符号量への収束時間、すなわちフィー
ドバック回数が左右されてしまう。また、スケーリング
係数及び量子化ステップの変更方法において、最小ステ
ップ幅で刻みながら変更する場合には、収束時間が増大
し、すなわちフィードバックの回数も増大する。
【0039】従って、最適なパラメータ初期値が設定で
きないと、所望の符号量を満足するための最適な符号化
パラメータが得られるまでの時間が長くなり、リアルタ
イムによる符号化ができないという問題点があった。
【0040】また、制御を高速に行うためには高機能の
演算処理装置が必要であった。この様な問題は、目標符
号量が少ない場合、すなわち低ビットレート符号化の際
に特に顕著であった。
【0041】この発明は、前述した問題点を解決するた
めになされたもので、フィードバックによる符号化パラ
メータ決定までの所要時間を短くでき、符号量制御が高
速に収束することができるオーディオ符号化装置及びオ
ーディオ符号化方法を得ることを目的とする。
【0042】
【課題を解決するための手段】この発明の請求項1に係
るオーディオ符号化装置は、入力されたオーディオデー
タを直交変換して変換係数を算出する直交変換手段と、
入力されたオーディオデータを分析して許容歪み量を算
出する聴覚モデル手段と、前記変換係数を指示されたス
ケーリング係数でスケーリングするスケーリング手段
と、前記スケーリングされた変換係数を指示された量子
化ステップで量子化する量子化手段と、前記量子化され
た変換係数を可変長符号化して出力する可変長符号化手
段と、量子化後の量子化歪み量及び符号化後の符号量の
評価を行い、適切な評価結果が得られるまで前記スケー
リング係数及び前記量子化ステップを更新して反復処理
を指示する符号量歪み制御手段と、前記量子化ステップ
の初期値を最適制御する初期値制御手段とを備えたもの
である。
【0043】この発明の請求項2に係るオーディオ符号
化装置は、前記初期値制御手段が、前記変換係数の最大
値を検出し、前記変換係数の平均値を算出し、さらにそ
の比を求め、この比を前記変換係数の最大値に乗じて量
子化ステップの初期値とするものである。
【0044】この発明の請求項3に係るオーディオ符号
化装置は、前記初期値制御手段が、前記変換係数及び前
記許容歪み量の比を算出し、この比の最大値を検出し、
そして前記比の最大値を変換係数の最大値に乗じて量子
化ステップの初期値とするものである。
【0045】この発明の請求項4に係るオーディオ符号
化装置は、前記初期値制御手段が、前記変換係数の最大
値を検出し、前記許容歪み量の平均値を算出し、さらに
その比を求め、この比を変換係数の最大値に乗じて量子
化ステップの初期値とするものである。
【0046】この発明の請求項5に係るオーディオ符号
化装置は、前記初期値制御手段が、前記変換係数の平均
値から求めた値を量子化ステップの初期値とするもので
ある。
【0047】この発明の請求項6に係るオーディオ符号
化装置は、前記初期値制御手段が、前記変換係数及び前
記許容歪み量の比を算出し、この比が最大となる時の変
換係数から求めた値を量子化ステップの初期値とするも
のである。
【0048】この発明の請求項7に係るオーディオ符号
化装置は、入力されたオーディオデータを直交変換して
変換係数を算出する直交変換手段と、入力されたオーデ
ィオデータを分析して許容歪み量を算出する聴覚モデル
手段と、前記変換係数を指示されたスケーリング係数で
スケーリングするスケーリング手段と、前記スケーリン
グされた変換係数を指示された量子化ステップで量子化
する量子化手段と、前記量子化された変換係数を可変長
符号化して出力する可変長符号化手段と、量子化後の量
子化歪み量及び符号化後の符号量の評価を行い、適切な
評価結果が得られるまで前記スケーリング係数及び前記
量子化ステップを更新して反復処理を指示する符号量歪
み制御手段と、前記スケーリング係数の初期値を最適制
御する初期値制御手段とを備えたものである。
【0049】この発明の請求項8に係るオーディオ符号
化装置は、前記初期値制御手段が、全ての変換係数の最
大値を検出し、スケールファクタバンド毎の変換係数の
最大値を検出し、さらにその比を求め、この比を所定の
定数に乗じた値をスケーリング係数の初期値とするもの
である。
【0050】この発明の請求項9に係るオーディオ符号
化装置は、前記初期値制御手段が、スケールファクタバ
ンド毎の変換係数の最大値を検出すると共に許容歪み量
との第1の比を求め、前記第1の比の最大値を検出し、
前記第1の比及び前記第1の比の最大値の第2の比を求
め、この第2の比を所定の定数に乗じた値をスケーリン
グ係数の初期値とするものである。
【0051】この発明の請求項10に係るオーディオ符
号化方法は、入力されたオーディオデータを直交変換し
て変換係数を算出する直交変換ステップと、入力された
オーディオデータを分析して許容歪み量を算出する聴覚
モデルステップと、前記変換係数を指示されたスケーリ
ング係数でスケーリングするスケーリングステップと、
前記スケーリングされた変換係数を指示された量子化ス
テップで量子化する量子化ステップと、前記量子化され
た変換係数を可変長符号化する可変長符号化ステップ
と、前記スケーリング係数の初期値及び前記量子化ステ
ップの初期値を最適制御する初期値制御ステップと、量
子化後の量子化歪み量及び符号化後の符号量の評価を行
い、適切な評価結果が得られるまでスケーリング係数と
量子化ステップを更新して反復処理を指示する符号量歪
み制御ステップとを含むものである。
【0052】この発明の請求項11に係るオーディオ符
号化方法は、前記初期値制御ステップが、前記変換係数
の最大値を検出し、前記変換係数の平均値を算出し、さ
らにその比を求め、この比を前記変換係数の最大値に乗
じて量子化ステップの初期値とするものである。
【0053】この発明の請求項12に係るオーディオ符
号化方法は、前記初期値制御ステップが、前記変換係数
及び前記許容歪み量の比を算出し、この比の最大値を検
出し、そして前記比の最大値を変換係数の最大値に乗じ
て量子化ステップの初期値とするものである。
【0054】この発明の請求項13に係るオーディオ符
号化方法は、前記初期値制御ステップが、前記変換係数
の最大値を検出し、前記許容歪み量の平均値を算出し、
さらにその比を求め、この比を変換係数の最大値に乗じ
て量子化ステップの初期値とするものである。
【0055】この発明の請求項14に係るオーディオ符
号化方法は、前記初期値制御ステップが、前記変換係数
の平均値から求めた値を量子化ステップの初期値とする
ものである。
【0056】この発明の請求項15に係るオーディオ符
号化方法は、前記初期値制御ステップが、前記変換係数
及び前記許容歪み量の比を算出し、この比が最大となる
時の変換係数から求めた値を量子化ステップの初期値と
するものである。
【0057】この発明の請求項16に係るオーディオ符
号化方法は、前記初期値制御ステップが、全ての変換係
数の最大値を検出し、スケールファクタバンド毎の変換
係数の最大値を検出し、さらにその比を求め、この比を
所定の定数に乗じた値をスケーリング係数の初期値とす
るものである。
【0058】この発明の請求項17に係るオーディオ符
号化方法は、前記初期値制御ステップが、スケールファ
クタバンド毎の変換係数の最大値を検出すると共に許容
歪み量との第1の比を求め、前記第1の比の最大値を検
出し、前記第1の比及び前記第1の比の最大値の第2の
比を求め、この第2の比を所定の定数に乗じた値をスケ
ーリング係数の初期値とするものである。
【0059】
【発明の実施の形態】実施の形態1.この発明の実施の
形態1に係るオーディオ符号化装置について図面を参照
しながら説明する。図1は、この発明の実施の形態1に
係るオーディオ符号化装置の構成を示すブロック図であ
る。また、図2は、この発明の実施の形態1に係るオー
ディオ符号化装置の第1制御ステップ(メイン)の動作
を示すフローチャートである。なお、各図中、同一符号
は同一又は相当部分を示す。
【0060】図1において、初期値制御部31以外は、
従来装置と同じ働きをするものでありその詳細は従来例
で述べた通りである。
【0061】以下に、初期値制御部31に関し、図2に
示す第1制御ステップにおけるスケーリング係数の初期
値αinitと量子化ステップの初期値QTinitの
決定方法(ステップ201)について具体的な数値を例
にあげて詳述する。符号量/歪み制御部30は、スケー
リング係数及び量子化ステップの初期値を適応的に制御
する初期値制御部31を含む構成となっている。
【0062】図3は、初期値制御部31におけるスケー
リング係数の初期値αinitの決定方法を示してい
る。ステップ300に示すように、全てのスケールファ
クタバンド対してそれぞれの初期値αinit[sb]
=0にする。従って、第1回目の試行においてスケーリ
ング部13でのスケーリングは式(1)から式(7)の
通りとなる。
【0063】 SS[i]=SP[i]^3/4 ・・・式(7)
【0064】図4は、量子化ステップの初期値QTin
itの決定方法を示している。まず、ステップ400に
おいて、全ての変換係数の中から絶対値が最も大きなも
のSPmaxを検出する。次に、ステップ401におい
て、全ての変換係数SP[i]の平均値SPaveを算
出する。さらに、ステップ402において、その比Q=
SPave/SPmaxを算出する。最後に、ステップ
403において、これらのパラメータを基に以下の式
(8)を適用する。
【0065】 QTinit=16/3*log2((1/Q*SPmax)^3/4/MA X_QUANT) ・・・式(8)
【0066】例えば、SPmax=65536(=2^
16)、SPave=4096(=2^12)、MAX
_QUANT=8192(=2^13)の場合、式
(8)よりQTinit=32/3となる。
【0067】上記の初期値αinit及びQTinit
を用いて変換係数の要素の1つであるSPmaxを量子
化することを考えると、その量子化値SQmaxは式
(5)から、以下のようになる。
【0068】SQmax=int(2^12*2^(−
2))=2^10
【0069】ここでは簡単のためM=0としている。な
お、従来の方式によって得られる量子化値SQmaxp
はSQmaxp=2^13である。
【0070】ここで、この2つの量子化値SQmax及
びSQmaxpを可変長符号化することを考える。可変
長符号化においては、生起確率が大きいシンボルに対し
て短い語長の符号を割り当て、生起確率が小さいシンボ
ルに対して長い語長の符号を割り当てるというハフマン
符号を用いる。一般に、変換係数の量子化値の生起確率
は量子化値が大きいほど小さいことが知られており、従
って量子化値が大きいほど可変長符号化に必要な符号量
は増加する。
【0071】2つの量子化値SQmax、SQmaxp
を可変長符号化した結果の符号量を比較するとSQma
xの方が少ないことが判る。言い換えれば、本実施の形
態1による量子化ステップの初期値の決定方法を採れ
ば、量子化値のダイナミックレンジを限定することによ
り、第1回目の試行の可変長符号化後の符号量を抑える
ことが可能となる。符号量/歪み制御部30は、前述し
た通り、この初期符号量を基にスケーリング係数と量子
化ステップを更新しながら最終的な結果を得るよう反復
処理を行う。この場合の符号量の収束の様子が図5であ
る。本実施の形態1では第1回目の試行の結果の符号量
が目標符号量に近いため、その後の反復処理回数が少な
くてすむ。
【0072】なお、量子化ステップの初期値QTini
tの決定方法を以下のようにしても良い。図6は、量子
化ステップの初期値QTinitの決定方法の一例であ
る。まず、ステップ600において、全ての変換係数S
P[i]における、変換係数とその変換係数が属するス
ケールファクタバンドの許容歪み量AD[sb]との比
Qad[i]を算出する。次に、ステップ601におい
て、全てのQad[i]の中から最大値Qadmaxを
検出する。そして、ステップ602において、Q=1/
Qadmaxとし、ステップ603において、式(8)
を適用する。
【0073】また、量子化ステップの初期値QTini
tの決定方法を以下のようにしても良い。図7は、量子
化ステップの初期値QTinitの決定方法の一例であ
る。まず、ステップ700において、全ての変換係数S
P[i]の中から絶対値が最も大きなものSPmaxを
検出する。次に、ステップ701において、全てのスケ
ールファクタバンドにおける許容歪み量AD[sb]の
平均値ADaveを算出する。さらに、ステップ702
において、この2つの値の比Q=ADave/SPma
xを算出し、ステップ703において、式(8)を適用
する。
【0074】また、量子化ステップの初期値QTini
tの決定方法を以下のようにしても良い。図8は、量子
化ステップの初期値QTinitの決定方法の一例であ
る。ステップ800において、全ての変換係数SP
[i]の平均値SPaveを算出する。そして、ステッ
プ801において、この値を式(4)におけるSPma
xの代用とするものである。
【0075】さらに、量子化ステップの初期値QTin
itの決定方法を以下のようにしても良い。図9は、量
子化ステップの初期値QTinitの決定方法の一例で
ある。まず、ステップ900において、全ての変換係数
SP[i]における、変換係数とその変換係数が属する
スケールファクタバンドの許容歪み量AD[sb]との
比Qad[i]を算出する。次に、ステップ901にお
いて、全てのQad[i]の中から最大値Qadmax
を検出する。次に、ステップ902において、Qadm
axを生成する基となった変換係数をSPadとする。
そして、ステップ903において、この値を式(4)に
おけるSPmaxの代用とするものである。
【0076】このように本実施の形態1では、変換係数
全体の相互関係を考慮したパラメータを導入して量子化
ステップの初期値を決定することによって、また、人間
の聴覚特性パラメータを導入して量子化ステップの初期
値を決定することによって、特に入力オーディオデータ
の特性に則した符号量制御を行うことができ、目標符号
量に収束させるまでの収束時間を短くすることができ
る。従って、リアルタイム処理も可能となる。また、同
品質の符号化を行うために必要な演算処理装置の負荷が
少なくて済み、装置規模を小さくすることが可能とな
る。
【0077】実施の形態2.この発明の実施の形態2に
係るオーディオ符号化装置について図面を参照しながら
説明する。
【0078】前述の実施の形態1においては、各スケー
ルファクタバンドのスケーリング係数の初期値αini
t[sb]を一律にαinit[sb]=0としてい
た。しかし、一般にオーディオ信号の周波数成分が大き
い場合、すなわち変換係数の値が大きな場合は、スケー
リング係数を大きくして量子化歪み量を減少するよう制
御する必要がある。本実施の形態2は、この考えに基づ
いてスケーリング係数の初期値αinit[sb]をス
ケールファクタバンド毎に適応的に決定するものであ
る。以下にその方法を詳述する。
【0079】図10は、スケーリング係数の初期値αi
nit[sb]の決定方法を示している。まず、ステッ
プ1000において、全ての変換係数SP[i]の中か
ら絶対値が最も大きなものSPmaxを検出する。次
に、ステップ1001において、各スケールファクタバ
ンドにおいてスケールファクタバンド内の絶対値が最も
大きな変換係数SPBmax[sb]を検出する。さら
に、ステップ1002において、この2つの値の比R=
SPBmax/SPmaxを求める。最後に、ステップ
1003において、下記の式(9)によりスケーリング
係数の初期値αinit[sb]とする。
【0080】 αinit[sb]=B*R ・・・式(9)
【0081】この式(9)において、Bは、例えば目標
符号量に比例して設定される定数である。例えば、SP
maxを65536(2^16)、SPBmaxを40
96(2^12)とすると、SPmaxを含むスケール
ファクタバンドsbaにおいてはR=1、SPBmax
を含むスケールファクタバンドsbbにおいてはR=1
/16となる。定数B=10とすれば、式(9)よりα
init[sba]=10、αinit[sbb]=1
となる。ここで、簡単のため小数点以下は四捨五入して
いる。
【0082】上記の様な方法によれば、あらかじめ大き
な値の変換係数、すなわち大きな音を含むスケールファ
クタバンドに対して適応的に量子化歪み量を調節するよ
うなスケーリング係数の初期値を選択することができ
る。従って、一律に同じ初期値を与えた場合と比較し
て、各スケーリング係数が上記選択方法による初期値に
至るまでの量子化歪み量の制御ループ処理を省略するこ
とが可能となる。なお、上記の手法においては、Rの代
わりにRの対数をとったものをBから減算してもよい。
【0083】また、スケーリング係数の初期値αini
t[sb]の決定方法を以下のようにしても同様の効果
が得られる。図11は、スケーリング係数の初期値αi
nitの決定方法の一例である。まず、ステップ110
0において、各スケールファクタバンドにおいてスケー
ルファクタバンド内の絶対値が最も大きな変換係数SP
Bmax[sb]を検出する。次に、ステップ1101
において、聴覚モデル部12から得られる許容歪み量と
の比QBad[sb]=SPBmax[sb]/AD
[sb]を算出する。次に、ステップ1102におい
て、QBad[sb]の最大値QBmaxを検出する。
さらに、ステップ1103において、この2つの値の比
R=QBad/QBmaxを求める。最後に、ステップ
1104において、式(9)によりスケーリング係数の
初期値αinit[sb]とする。
【0084】上記のスケーリング係数の初期値の決定方
法をとれば、各スケールファクタバンド毎に量子化歪み
を抑えるために適応的スケーリング係数の初期値を与え
ることができ、初期値を全て零にしたときと比べて、各
スケーリング係数が実施の形態1による初期値に至るま
での量子化歪み量の制御ループ処理を省略することが可
能となる。つまり、符号量/歪み制御部30全体とし
て、制御ループ回数の軽減になり、最終的に符号量を目
標符号量に収束させる時間が短くなる。
【0085】なお、上述した各実施の形態においては、
量子化ステップの初期値の決定方法とスケーリング係数
の初期値の決定方法分別していたが、各々を同時に行う
ものであってももちろん構わない。各々の初期値設定に
より相乗効果が得られ、目標符号量の制御処理、量子化
歪み量の制御処理の反復回数を削減することが可能であ
る。
【0086】
【発明の効果】この発明の請求項1に係るオーディオ符
号化装置は、以上説明したとおり、入力されたオーディ
オデータを直交変換して変換係数を算出する直交変換手
段と、入力されたオーディオデータを分析して許容歪み
量を算出する聴覚モデル手段と、前記変換係数を指示さ
れたスケーリング係数でスケーリングするスケーリング
手段と、前記スケーリングされた変換係数を指示された
量子化ステップで量子化する量子化手段と、前記量子化
された変換係数を可変長符号化して出力する可変長符号
化手段と、量子化後の量子化歪み量及び符号化後の符号
量の評価を行い、適切な評価結果が得られるまで前記ス
ケーリング係数及び前記量子化ステップを更新して反復
処理を指示する符号量歪み制御手段と、前記量子化ステ
ップの初期値を最適制御する初期値制御手段とを備えた
ので、入力オーディオデータの特性に則した符号量制御
を行うことができ、目標符号量に収束させるまでの収束
時間を短くでき、また、同品質の符号化を行うために必
要な演算処理装置の負荷が少なくて済み、装置規模を小
さくすることができるという効果を奏する。
【0087】この発明の請求項2に係るオーディオ符号
化装置は、以上説明したとおり、前記初期値制御手段
が、前記変換係数の最大値を検出し、前記変換係数の平
均値を算出し、さらにその比を求め、この比を前記変換
係数の最大値に乗じて量子化ステップの初期値とするの
で、入力オーディオデータの特性に則した符号量制御を
行うことができ、目標符号量に収束させるまでの収束時
間を短くでき、また、同品質の符号化を行うために必要
な演算処理装置の負荷が少なくて済み、装置規模を小さ
くすることができるという効果を奏する。
【0088】この発明の請求項3に係るオーディオ符号
化装置は、以上説明したとおり、前記初期値制御手段
が、前記変換係数及び前記許容歪み量の比を算出し、こ
の比の最大値を検出し、そして前記比の最大値を変換係
数の最大値に乗じて量子化ステップの初期値とするの
で、入力オーディオデータの特性に則した符号量制御を
行うことができ、目標符号量に収束させるまでの収束時
間を短くでき、また、同品質の符号化を行うために必要
な演算処理装置の負荷が少なくて済み、装置規模を小さ
くすることができるという効果を奏する。
【0089】この発明の請求項4に係るオーディオ符号
化装置は、以上説明したとおり、前記初期値制御手段
が、前記変換係数の最大値を検出し、前記許容歪み量の
平均値を算出し、さらにその比を求め、この比を変換係
数の最大値に乗じて量子化ステップの初期値とするの
で、入力オーディオデータの特性に則した符号量制御を
行うことができ、目標符号量に収束させるまでの収束時
間を短くでき、また、同品質の符号化を行うために必要
な演算処理装置の負荷が少なくて済み、装置規模を小さ
くすることができるという効果を奏する。
【0090】この発明の請求項5に係るオーディオ符号
化装置は、以上説明したとおり、前記初期値制御手段
が、前記変換係数の平均値から求めた値を量子化ステッ
プの初期値とするので、入力オーディオデータの特性に
則した符号量制御を行うことができ、目標符号量に収束
させるまでの収束時間を短くでき、また、同品質の符号
化を行うために必要な演算処理装置の負荷が少なくて済
み、装置規模を小さくすることができるという効果を奏
する。
【0091】この発明の請求項6に係るオーディオ符号
化装置は、以上説明したとおり、前記初期値制御手段
が、前記変換係数及び前記許容歪み量の比を算出し、こ
の比が最大となる時の変換係数から求めた値を量子化ス
テップの初期値とするので、入力オーディオデータの特
性に則した符号量制御を行うことができ、目標符号量に
収束させるまでの収束時間を短くでき、また、同品質の
符号化を行うために必要な演算処理装置の負荷が少なく
て済み、装置規模を小さくすることができるという効果
を奏する。
【0092】この発明の請求項7に係るオーディオ符号
化装置は、以上説明したとおり、入力されたオーディオ
データを直交変換して変換係数を算出する直交変換手段
と、入力されたオーディオデータを分析して許容歪み量
を算出する聴覚モデル手段と、前記変換係数を指示され
たスケーリング係数でスケーリングするスケーリング手
段と、前記スケーリングされた変換係数を指示された量
子化ステップで量子化する量子化手段と、前記量子化さ
れた変換係数を可変長符号化して出力する可変長符号化
手段と、量子化後の量子化歪み量及び符号化後の符号量
の評価を行い、適切な評価結果が得られるまで前記スケ
ーリング係数及び前記量子化ステップを更新して反復処
理を指示する符号量歪み制御手段と、前記スケーリング
係数の初期値を最適制御する初期値制御手段とを備えた
ので、制御ループ回数を軽減でき、最終的に符号量を目
標符号量に収束させる時間を短くすることができるとい
う効果を奏する。
【0093】この発明の請求項8に係るオーディオ符号
化装置は、以上説明したとおり、前記初期値制御手段
が、全ての変換係数の最大値を検出し、スケールファク
タバンド毎の変換係数の最大値を検出し、さらにその比
を求め、この比を所定の定数に乗じた値をスケーリング
係数の初期値とするので、制御ループ回数を軽減でき、
最終的に符号量を目標符号量に収束させる時間を短くす
ることができるという効果を奏する。
【0094】この発明の請求項9に係るオーディオ符号
化装置は、以上説明したとおり、前記初期値制御手段
が、スケールファクタバンド毎の変換係数の最大値を検
出すると共に許容歪み量との第1の比を求め、前記第1
の比の最大値を検出し、前記第1の比及び前記第1の比
の最大値の第2の比を求め、この第2の比を所定の定数
に乗じた値をスケーリング係数の初期値とするので、制
御ループ回数を軽減でき、最終的に符号量を目標符号量
に収束させる時間を短くすることができるという効果を
奏する。
【0095】この発明の請求項10に係るオーディオ符
号化方法は、以上説明したとおり、入力されたオーディ
オデータを直交変換して変換係数を算出する直交変換ス
テップと、入力されたオーディオデータを分析して許容
歪み量を算出する聴覚モデルステップと、前記変換係数
を指示されたスケーリング係数でスケーリングするスケ
ーリングステップと、前記スケーリングされた変換係数
を指示された量子化ステップで量子化する量子化ステッ
プと、前記量子化された変換係数を可変長符号化する可
変長符号化ステップと、前記スケーリング係数の初期値
及び前記量子化ステップの初期値を最適制御する初期値
制御ステップと、量子化後の量子化歪み量及び符号化後
の符号量の評価を行い、適切な評価結果が得られるまで
スケーリング係数と量子化ステップを更新して反復処理
を指示する符号量歪み制御ステップとを含むので、目標
符号量の制御処理、量子化歪み量の制御処理の反復回数
を削減することができるという効果を奏する。
【0096】この発明の請求項11に係るオーディオ符
号化方法は、以上説明したとおり、前記初期値制御ステ
ップが、前記変換係数の最大値を検出し、前記変換係数
の平均値を算出し、さらにその比を求め、この比を前記
変換係数の最大値に乗じて量子化ステップの初期値とす
るので、目標符号量の制御処理、量子化歪み量の制御処
理の反復回数を削減することができるという効果を奏す
る。
【0097】この発明の請求項12に係るオーディオ符
号化方法は、以上説明したとおり、前記初期値制御ステ
ップが、前記変換係数及び前記許容歪み量の比を算出
し、この比の最大値を検出し、そして前記比の最大値を
変換係数の最大値に乗じて量子化ステップの初期値とす
るので、目標符号量の制御処理、量子化歪み量の制御処
理の反復回数を削減することができるという効果を奏す
る。
【0098】この発明の請求項13に係るオーディオ符
号化方法は、以上説明したとおり、前記初期値制御ステ
ップが、前記変換係数の最大値を検出し、前記許容歪み
量の平均値を算出し、さらにその比を求め、この比を変
換係数の最大値に乗じて量子化ステップの初期値とする
ので、目標符号量の制御処理、量子化歪み量の制御処理
の反復回数を削減することができるという効果を奏す
る。
【0099】この発明の請求項14に係るオーディオ符
号化方法は、以上説明したとおり、前記初期値制御ステ
ップが、前記変換係数の平均値から求めた値を量子化ス
テップの初期値とするので、目標符号量の制御処理、量
子化歪み量の制御処理の反復回数を削減することができ
るという効果を奏する。
【0100】この発明の請求項15に係るオーディオ符
号化方法は、以上説明したとおり、前記初期値制御ステ
ップが、前記変換係数及び前記許容歪み量の比を算出
し、この比が最大となる時の変換係数から求めた値を量
子化ステップの初期値とするので、目標符号量の制御処
理、量子化歪み量の制御処理の反復回数を削減すること
ができるという効果を奏する。
【0101】この発明の請求項16に係るオーディオ符
号化方法は、以上説明したとおり、前記初期値制御ステ
ップが、全ての変換係数の最大値を検出し、スケールフ
ァクタバンド毎の変換係数の最大値を検出し、さらにそ
の比を求め、この比を所定の定数に乗じた値をスケーリ
ング係数の初期値とするので、目標符号量の制御処理、
量子化歪み量の制御処理の反復回数を削減することがで
きるという効果を奏する。
【0102】この発明の請求項17に係るオーディオ符
号化方法は、以上説明したとおり、前記初期値制御ステ
ップが、スケールファクタバンド毎の変換係数の最大値
を検出すると共に許容歪み量との第1の比を求め、前記
第1の比の最大値を検出し、前記第1の比及び前記第1
の比の最大値の第2の比を求め、この第2の比を所定の
定数に乗じた値をスケーリング係数の初期値とするの
で、目標符号量の制御処理、量子化歪み量の制御処理の
反復回数を削減することができるという効果を奏する。
【図面の簡単な説明】
【図1】 この発明の実施の形態1に係るオーディオ符
号化装置の構成を示すブロック図である。
【図2】 この発明の実施の形態1に係るオーディオ符
号化装置のメイン動作(第1制御ステップ)を示すフロ
ーチャートである。
【図3】 この発明の実施の形態1に係るオーディオ符
号化装置のスケーリング係数の初期値の決定方法を示す
フローチャートである。
【図4】 この発明の実施の形態1に係るオーディオ符
号化装置の量子化ステップの初期値の決定方法を示すフ
ローチャートである。
【図5】 この発明の実施の形態1に係るオーディオ符
号化装置の符号量の収束の様子を示す図である。
【図6】 この発明の実施の形態1に係るオーディオ符
号化装置の量子化ステップの初期値の他の決定方法を示
すフローチャートである。
【図7】 この発明の実施の形態1に係るオーディオ符
号化装置の量子化ステップの初期値の他の決定方法を示
すフローチャートである。
【図8】 この発明の実施の形態1に係るオーディオ符
号化装置の量子化ステップの初期値の他の決定方法を示
すフローチャートである。
【図9】 この発明の実施の形態1に係るオーディオ符
号化装置の量子化ステップの初期値の他の決定方法を示
すフローチャートである。
【図10】 この発明の実施の形態2に係るオーディオ
符号化装置のスケーリング係数の初期値の決定方法を示
すフローチャートである。
【図11】 この発明の実施の形態2に係るオーディオ
符号化装置のスケーリング係数の初期値の他の決定方法
を示すフローチャートである。
【図12】 従来のオーディオ符号化装置の構成を示す
ブロック図である。
【図13】 従来のオーディオ符号化装置のメイン動作
(第1制御ステップ)を示すフローチャートである。
【図14】 従来のオーディオ符号化装置の量子化ステ
ップの初期値の決定方法を示すフローチャートである。
【図15】 従来のオーディオ符号化装置の第2制御ス
テップを示すフローチャートである。
【図16】 従来のオーディオ符号化装置の第3制御ス
テップを示すフローチャートである。
【符号の説明】
11 直交変換部、12 聴覚モデル部、13 スケー
リング部、14 量子化部、15 可変長符号化部、3
0 符号量/歪み制御部、31 初期値制御部。

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 入力されたオーディオデータを直交変換
    して変換係数を算出する直交変換手段と、 入力されたオーディオデータを分析して許容歪み量を算
    出する聴覚モデル手段と、 前記変換係数を指示されたスケーリング係数でスケーリ
    ングするスケーリング手段と、 前記スケーリングされた変換係数を指示された量子化ス
    テップで量子化する量子化手段と、 前記量子化された変換係数を可変長符号化して出力する
    可変長符号化手段と、 量子化後の量子化歪み量及び符号化後の符号量の評価を
    行い、適切な評価結果が得られるまで前記スケーリング
    係数及び前記量子化ステップを更新して反復処理を指示
    する符号量歪み制御手段と、 前記量子化ステップの初期値を最適制御する初期値制御
    手段とを備えたことを特徴とするオーディオ符号化装
    置。
  2. 【請求項2】 前記初期値制御手段は、前記変換係数の
    最大値を検出し、前記変換係数の平均値を算出し、さら
    にその比を求め、この比を前記変換係数の最大値に乗じ
    て量子化ステップの初期値とすることを特徴とする請求
    項1記載のオーディオ符号化装置。
  3. 【請求項3】 前記初期値制御手段は、前記変換係数及
    び前記許容歪み量の比を算出し、この比の最大値を検出
    し、そして前記比の最大値を変換係数の最大値に乗じて
    量子化ステップの初期値とすることを特徴とする請求項
    1記載のオーディオ符号化装置。
  4. 【請求項4】 前記初期値制御手段は、前記変換係数の
    最大値を検出し、前記許容歪み量の平均値を算出し、さ
    らにその比を求め、この比を変換係数の最大値に乗じて
    量子化ステップの初期値とすることを特徴とする請求項
    1記載のオーディオ符号化装置。
  5. 【請求項5】 前記初期値制御手段は、前記変換係数の
    平均値から求めた値を量子化ステップの初期値とするこ
    とを特徴とする請求項1記載のオーディオ符号化装置。
  6. 【請求項6】 前記初期値制御手段は、前記変換係数及
    び前記許容歪み量の比を算出し、この比が最大となる時
    の変換係数から求めた値を量子化ステップの初期値とす
    ることを特徴とする請求項1記載のオーディオ符号化装
    置。
  7. 【請求項7】 入力されたオーディオデータを直交変換
    して変換係数を算出する直交変換手段と、 入力されたオーディオデータを分析して許容歪み量を算
    出する聴覚モデル手段と、 前記変換係数を指示されたスケーリング係数でスケーリ
    ングするスケーリング手段と、 前記スケーリングされた変換係数を指示された量子化ス
    テップで量子化する量子化手段と、 前記量子化された変換係数を可変長符号化して出力する
    可変長符号化手段と、 量子化後の量子化歪み量及び符号化後の符号量の評価を
    行い、適切な評価結果が得られるまで前記スケーリング
    係数及び前記量子化ステップを更新して反復処理を指示
    する符号量歪み制御手段と、 前記スケーリング係数の初期値を最適制御する初期値制
    御手段とを備えたことを特徴とするオーディオ符号化装
    置。
  8. 【請求項8】 前記初期値制御手段は、全ての変換係数
    の最大値を検出し、スケールファクタバンド毎の変換係
    数の最大値を検出し、さらにその比を求め、この比を所
    定の定数に乗じた値をスケーリング係数の初期値とする
    ことを特徴とする請求項7記載のオーディオ符号化装
    置。
  9. 【請求項9】 前記初期値制御手段は、スケールファク
    タバンド毎の変換係数の最大値を検出すると共に許容歪
    み量との第1の比を求め、前記第1の比の最大値を検出
    し、前記第1の比及び前記第1の比の最大値の第2の比
    を求め、この第2の比を所定の定数に乗じた値をスケー
    リング係数の初期値とすることを特徴とする請求項7記
    載のオーディオ符号化装置。
  10. 【請求項10】 入力されたオーディオデータを直交変
    換して変換係数を算出する直交変換ステップと、 入力されたオーディオデータを分析して許容歪み量を算
    出する聴覚モデルステップと、 前記変換係数を指示されたスケーリング係数でスケーリ
    ングするスケーリングステップと、 前記スケーリングされた変換係数を指示された量子化ス
    テップで量子化する量子化ステップと、 前記量子化された変換係数を可変長符号化する可変長符
    号化ステップと、 前記スケーリング係数の初期値及び前記量子化ステップ
    の初期値を最適制御する初期値制御ステップと、 量子化後の量子化歪み量及び符号化後の符号量の評価を
    行い、適切な評価結果が得られるまでスケーリング係数
    と量子化ステップを更新して反復処理を指示する符号量
    歪み制御ステップとを含むことを特徴とするオーディオ
    符号化方法。
  11. 【請求項11】 前記初期値制御ステップは、前記変換
    係数の最大値を検出し、前記変換係数の平均値を算出
    し、さらにその比を求め、この比を前記変換係数の最大
    値に乗じて量子化ステップの初期値とすることを特徴と
    する請求項10記載のオーディオ符号化方法。
  12. 【請求項12】 前記初期値制御ステップは、前記変換
    係数及び前記許容歪み量の比を算出し、この比の最大値
    を検出し、そして前記比の最大値を変換係数の最大値に
    乗じて量子化ステップの初期値とすることを特徴とする
    請求項10記載のオーディオ符号化方法。
  13. 【請求項13】 前記初期値制御ステップは、前記変換
    係数の最大値を検出し、前記許容歪み量の平均値を算出
    し、さらにその比を求め、この比を変換係数の最大値に
    乗じて量子化ステップの初期値とすることを特徴とする
    請求項10記載のオーディオ符号化方法。
  14. 【請求項14】 前記初期値制御ステップは、前記変換
    係数の平均値から求めた値を量子化ステップの初期値と
    することを特徴とする請求項10記載のオーディオ符号
    化方法。
  15. 【請求項15】 前記初期値制御ステップは、前記変換
    係数及び前記許容歪み量の比を算出し、この比が最大と
    なる時の変換係数から求めた値を量子化ステップの初期
    値とすることを特徴とする請求項10記載のオーディオ
    符号化方法。
  16. 【請求項16】 前記初期値制御ステップは、全ての変
    換係数の最大値を検出し、スケールファクタバンド毎の
    変換係数の最大値を検出し、さらにその比を求め、この
    比を所定の定数に乗じた値をスケーリング係数の初期値
    とすることを特徴とする請求項10記載のオーディオ符
    号化方法。
  17. 【請求項17】 前記初期値制御ステップは、スケール
    ファクタバンド毎の変換係数の最大値を検出すると共に
    許容歪み量との第1の比を求め、前記第1の比の最大値
    を検出し、前記第1の比及び前記第1の比の最大値の第
    2の比を求め、この第2の比を所定の定数に乗じた値を
    スケーリング係数の初期値とすることを特徴とする請求
    項10記載のオーディオ符号化方法。
JP11159523A 1999-06-07 1999-06-07 オーディオ符号化装置及びオーディオ符号化方法 Pending JP2000347679A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11159523A JP2000347679A (ja) 1999-06-07 1999-06-07 オーディオ符号化装置及びオーディオ符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11159523A JP2000347679A (ja) 1999-06-07 1999-06-07 オーディオ符号化装置及びオーディオ符号化方法

Publications (1)

Publication Number Publication Date
JP2000347679A true JP2000347679A (ja) 2000-12-15

Family

ID=15695637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11159523A Pending JP2000347679A (ja) 1999-06-07 1999-06-07 オーディオ符号化装置及びオーディオ符号化方法

Country Status (1)

Country Link
JP (1) JP2000347679A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003101418A (ja) * 2001-09-26 2003-04-04 Tokai Univ 量子化ステップパラメータ初期値決定装置および量子化ステップパラメータ初期値決定方法、並びに量子化ステップパラメータ初期値決定プログラム
JP2007017659A (ja) * 2005-07-07 2007-01-25 Fujitsu Ltd オーディオ符号化方法及び装置
JP2007507750A (ja) * 2003-09-29 2007-03-29 ソニー エレクトロニクス インク オーディオ符号化におけるレート−歪み制御方法
US7613603B2 (en) 2003-06-30 2009-11-03 Fujitsu Limited Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム
KR20150066565A (ko) * 2012-11-07 2015-06-16 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003101418A (ja) * 2001-09-26 2003-04-04 Tokai Univ 量子化ステップパラメータ初期値決定装置および量子化ステップパラメータ初期値決定方法、並びに量子化ステップパラメータ初期値決定プログラム
JP4528924B2 (ja) * 2001-09-26 2010-08-25 学校法人東海大学 量子化ステップパラメータ初期値決定装置および量子化ステップパラメータ初期値決定方法、並びに量子化ステップパラメータ初期値決定プログラム
US7613603B2 (en) 2003-06-30 2009-11-03 Fujitsu Limited Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
JP2007507750A (ja) * 2003-09-29 2007-03-29 ソニー エレクトロニクス インク オーディオ符号化におけるレート−歪み制御方法
JP2007017659A (ja) * 2005-07-07 2007-01-25 Fujitsu Ltd オーディオ符号化方法及び装置
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム
KR20150066565A (ko) * 2012-11-07 2015-06-16 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산
US9378748B2 (en) 2012-11-07 2016-06-28 Dolby Laboratories Licensing Corp. Reduced complexity converter SNR calculation
KR101726205B1 (ko) * 2012-11-07 2017-04-12 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산

Similar Documents

Publication Publication Date Title
JP4579273B2 (ja) ステレオ音響信号の処理方法と装置
JP4212591B2 (ja) オーディオ符号化装置
US10121480B2 (en) Method and apparatus for encoding audio data
JPH05304479A (ja) オーディオ信号の高能率符号化装置
CA2770622C (en) Frequency band scale factor determination in audio encoding based upon frequency band signal energy
US20090083042A1 (en) Encoding Method and Encoding Apparatus
JP2002023799A (ja) 音声符号化装置及びそれに用いる心理聴覚分析方法
KR20060113999A (ko) 정보 신호의 양자화 방법 및 장치
JP5201375B2 (ja) チャネル間及び一時的冗長度抑圧を用いた音声信号符号化
JP2000347679A (ja) オーディオ符号化装置及びオーディオ符号化方法
KR20130109793A (ko) 잡음 감쇄를 위한 오디오 신호 부호화 방법 및 장치
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
US10650834B2 (en) Audio processing method and non-transitory computer readable medium
US20040230425A1 (en) Rate control for coding audio frames
JP2005345707A (ja) 音声処理装置及び音声符号化方法
JP2001306095A (ja) オーディオ符号化装置及びオーディオ符号化方法
JP4409733B2 (ja) 符号化装置、符号化方法、及びその記録媒体
JP2002311997A (ja) オーディオ信号符号化装置
JP2001331198A (ja) 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
KR100396749B1 (ko) 디지털 오디오 부호화 방법
KR100640833B1 (ko) 디지털 오디오의 부호화 방법
JP4516345B2 (ja) 音声符号化情報処理装置および音声符号化情報処理プログラム
JP6629256B2 (ja) 符号化装置、方法及びプログラム
JP2000137497A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2006080927A (ja) 符号化方法、符号化装置、復号化方法及び復号化装置