JP2002311993A - オーディオ符号化装置 - Google Patents

オーディオ符号化装置

Info

Publication number
JP2002311993A
JP2002311993A JP2001118609A JP2001118609A JP2002311993A JP 2002311993 A JP2002311993 A JP 2002311993A JP 2001118609 A JP2001118609 A JP 2001118609A JP 2001118609 A JP2001118609 A JP 2001118609A JP 2002311993 A JP2002311993 A JP 2002311993A
Authority
JP
Japan
Prior art keywords
amount
scaling
scaling coefficient
coefficient
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001118609A
Other languages
English (en)
Inventor
Tetsuro Wada
哲朗 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001118609A priority Critical patent/JP2002311993A/ja
Publication of JP2002311993A publication Critical patent/JP2002311993A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 フィードバックによる所望の符号量を満足す
るための最適な第1スケーリング係数および第2スケー
リング係数を決定するまでの収束時間を短くし、符号量
制御が高速に収束するオーディオ符号化装置を得る。 【解決手段】 フィードバック処理による第1スケーリ
ング係数および第2スケーリング係数の更新量を適応的
に変化させるための指標として、符号量および量子化雑
音量、またはフィードバックループの実行回数の中から
優先すべき指標を選択して使用するようにした符号化制
御部60を備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、オーディオ信号
を効率的に符号化する符号化装置に関し、特にオーディ
オ信号を直交変換後、可変長符号化によって圧縮符号化
した後の符号量を、オーディオ信号から得られる特徴量
を利用して高速に所望の目標符号量に収束制御するオー
ディオ符号化装置に関するものである。
【0002】
【従来の技術】オーディオ信号を効率的に符号化する様
々な方法が提案されている。その中に、音楽信号等の2
0kHz以上の周波数帯域を有するオーディオ信号に対
し、この信号を複数の時間ブロックに分割し、ブロック
毎にオーディオデータを直交変換して変換係数を得て、
これを適切なスケーリング係数でスケーリングし、スケ
ーリング後の変換係数を量子化し、この量子化値をハフ
マン符号等を用いた可変長符号化により符号化する方法
がある。
【0003】このような符号化方法には、例えばISO
/IEC 13818−7として規格化されたMPEG
−2 Advanced Audio Coding
(AAC)符号化方式がある。この符号化における符号
量制御の方法は、変換係数を複数の周波数区分に分割す
る帯域区分において、全ての帯域区分に共通である第1
スケーリング係数と帯域区分毎に異なる第2スケーリン
グ係数を、聴覚特性を考慮した量子化雑音分布となるよ
う適応的に変化させ、その時のハフマン符号による可変
長符号化後の符号量を別途定められた目標符号量に近づ
けるというものである。
【0004】なお、ここでいう符号量とは符号化に必要
なビット量のことであり、目標符号量とは、時間ブロッ
ク毎に対して設定される値で、例えば予め設定された符
号化ビットレートから算出されるものであって、時間ブ
ロック毎に固定であっても可変であっても良い。
【0005】図11は例えばISO/IEC 1381
8−7に規定された従来のオーディオ符号化装置を示す
ブロック構成図であり、図において、101は入力端
子、1は入力されたオーディオ信号を直交変換し変換係
数を算出する直交変換部、2は入力されたオーディオ信
号を分析し許容雑音量を算出する聴覚特性分析部、3は
直交変換部1により算出された変換係数を正規化するス
ケーリング部、4はスケーリング部3により正規化され
た変換係数を量子化する量子化部、5は量子化部4によ
り量子化された変換係数を可変長符号化する可変長符号
化部、6はスケーリング部3、量子化部4、および可変
長符号化部5を統括制御する符号化制御部、7は可変長
符号化部5により可変長符号化された符号データを多重
する多重部、102は出力端子である。
【0006】次に動作について説明する。直交変換部1
には入力端子101を経てオーディオ信号が入力され
る。このオーディオ信号は通常時系列のデータであり、
特定のサンプリング周波数でサンプリングされ、さらに
は特定の量子化ビットで量子化されたデータである。直
交変換部1では、変形離散コサイン変換(MDCT:M
odified Discrete Cosine T
ransform)等の直交変換により時系列のデータ
を周波数系列のデータに変換する。直交変換後のデータ
列を変換係数と呼ぶ。変換後の変換係数は周波数軸成
分、すなわちスペクトルデータを表している。
【0007】また、入力端子101からのオーディオ信
号は、聴覚特性分析部2にも入力される。聴覚特性分析
部2では人間の聴覚特性をモデル化した分析が行われ
る。聴覚特性の一つにマスキング効果という特性があ
り、これはある音によってその他の音が聞こえなくなる
という現象のことである。この特性を利用して、符号化
の過程において発生する量子化雑音を人間の耳に知覚さ
せないよう、量子化雑音の発生量を適応的に制御するた
めの指標を算出する。この指標はマスキングしきい値や
許容雑音量等と呼ばれる。
【0008】また、聴覚特性分析部2は、入力信号の特
性を調べその急峻性に応じて直交変換の変換長を決定す
る。これは直交変換部1での入力信号の分解能を時間分
解能を優先するか周波数分解能を優先するかを決定付け
ることになる。すなわち入力信号を解析した結果、入力
信号の時間的変化が緩やかな場合は周波数分解能を優先
するため時間的に長い変換長にし、逆に入力信号の時間
的変化が急峻な場合は時間分解能を優先するため時間的
に短い変換長にする。
【0009】直交変換部1から出力される変換係数は、
複数の周波数帯域区分に分割され、スケーリング部3で
正規化され、量子化部4において、この帯域区分毎に適
応的な量子化が行われる。この周波数帯域区分としては
人間の聴覚特性を考慮した区分を用いることが多い。す
なわち高域ほど帯域幅の広い臨界帯域区分等である。ま
た、帯域区分毎の量子化においては、量子化効率を高め
るため、帯域区分毎に求めた係数によって事前に正規化
が行われる。
【0010】スケーリング部3で帯域区分毎に正規化さ
れた変換係数は、量子化部4で量子化される。例えば、
MPEG−2 AAC方式においては、変換係数の正規
化および量子化に次式(1)が用いられる。 xq[i]=int((abs(coeff[i])*2^ (1/4*(scf[sb]−gscf)))^3/4+α) ・・・(1) ここで、coeff[i]はi番目の変換係数、gsc
fは正規化の際に全帯域共通に使用する第1スケーリン
グ係数、scf[sb]は正規化の際に帯域区分sb毎
に使用する第2スケーリング係数、αは量子化のための
補正値、xq[i]はi番目の変換係数に対応する量子
化値であり、scf[sb]およびgscfは0または
自然数とする。なお、int()は小数値を切り捨てて
整数値化する関数で、abs()は絶対値化する関数を
示す。
【0011】また、上記式(1)における第2スケーリ
ング係数scf[sb]の初期値scf init[s
b]、および第1スケーリング係数gscfの初期値g
scf initは、次の式(2)および式(3)によ
り決定される。 scf init[sb]=0 ・・・(2) gscf init=16/3*log2 (((max coeff^(3/4))/MAX QUANT))・・(3) ここで、max coeffは全ての変換係数のうち最
大値をとる変換係数である。MAX QUANTは量子
化値の値域の最大を示す定数である。また、量子化値の
値域の条件により、gscfはgscf initより
も小さい値となってはならない制限がある。このよう
に、第1スケーリング係数の初期値gscf init
は入力オーディオ信号の性質に依存することがわかる。
また、第2スケーリング係数の初期値scf init
[sb]についても、第1スケーリング係数の初期値g
scf initと同様に入力オーディオ信号の性質に
依存して設定することも可能である。
【0012】量子化部4において求められた量子化値
は、可変長符号化部5において、帯域区分毎に最適なコ
ードブックを用いて可変長符号化される。最適なコード
ブックとは符号化後の符号量が最小となるようなコード
ブックであり、コードブック別の正確な符号量を求める
ためには選択可能なコードブック毎に実際に符号化を行
い符号量を求める必要がある。また、式(1)における
スケーリング係数が更新されれば、量子化値も変わるた
め、新たに最適なコードブックを選択し直し、その時の
符号量を再計算する必要がある。なお、MPEG−2
AAC方式においては、ハフマン符号を用いたハフマン
コードブックが用いられている。
【0013】符号化制御部6は、スケーリング部3、量
子化部4、可変長符号化部5を統括して制御する。符号
化制御部6では、聴覚特性分析部2で求めた帯域区分毎
の許容雑音量に基づいて第2スケーリング係数scf
[sb]を指定し、また、可変長符号化部5で算出され
る符号量の大小によって第1スケーリング係数gscf
を指定する。符号化制御部6は、この2つのスケーリン
グ係数を1ステップずつ更新しながら繰り返し指定する
ことによって、指定されたスケーリング係数を使用した
結果において、変換係数を可変長符号化した後の符号量
が目標符号量の範囲内にあり、かつ変換係数を量子化す
る際に発生する量子化雑音量が聴覚的に最適な分布とな
るようなトレードオフの関係を調整する。
【0014】一般に、上記式(1)においては、第1ス
ケーリング係数gscfを小さくするほど、または、第
2スケーリング係数scf[sb]を大きくするほど、
量子化値は大きくなり、相対的に量子化雑音は減少し、
かつ符号量は増加する関係にある。逆に、第1スケーリ
ング係数gscfを大きくするほど、または、第2スケ
ーリング係数scf[sb]を小さくするほど、量子化
値は小さくなり、相対的に量子化雑音量は増加し、かつ
符号量は減少する関係にある。
【0015】図12は従来の符号化制御部の処理手順を
示すフローチャートである。まず、上記式(2)および
式(3)により、第1スケーリング係数の初期値gsc
init、第2スケーリング係数の初期値scf
nit[sb]を設定し(ST101)、設定された第
1スケーリング係数の初期値gscf init、第2
スケーリング係数の初期値scf init[sb]を
用いて、式(1)により正規化および量子化を行い変換
係数の量子化値を求める(ST102、ST103)。
【0016】求めた量子化値に対して、帯域区分毎に最
適なコードブックを用いて可変長符号化を行い(ST1
04)、可変長符号化した際の全ての帯域区分トータル
での符号量を計算し目標符号量との比較において評価判
定を行う(ST105)。例えば、第1の条件判定とし
て符号量が目標符号量を上回っている場合は否判定と
し、符号量が目標符号量を下回っていれば次の条件判定
に進む。第2の条件判定として符号量が目標符号量に対
してあるしきい値よりも下回っていれば否判定とし、そ
のしきい値よりも上回っていれば合判定とする。否判定
の場合には、符号量が目標符号量に近づくように第1ス
ケーリング係数gscfを1ステップ更新する(ST1
06)。符号量が目標符号量を上回っていれば、 gscf next=gscf+1 ・・・(4) とし、符号量がしきい値よりも下回っていれば、 gscf next=gscf−1 ・・・(5) とする。ここで、gscf nextは、更新後の第1
スケーリング係数である。
【0017】ST105で合判定と判定した場合には、
帯域区分毎に量子化雑音の発生量に関する評価判定を行
う(ST107)。量子化雑音の発生量が聴覚的に最適
な条件を満たしていなければ否判定となり、最適な条件
を満たしていれば合判定となる。否判定となった場合に
は、量子化雑音の発生量を変化させるよう第2スケーリ
ング係数scf[sb]を1ステップ更新する(ST1
08)。例えば、量子化雑音が許容雑音量を上回ってい
れば、 scf next[sb]=scf[sb]+1 ・・・(6) とし、量子化雑音量が許容雑音量に対してあるしきい値
よりも下回っていれば、 scf next[sb]=scf[sb]−1 ・・・(7) とする。ここで、scf next[sb]は、更新後
の第2スケーリング係数である。
【0018】上記の様にこれらST102〜ST108
のステップは順次繰り返され、ST107で合判定とな
った場合に繰り返しを終了する。この一連の繰り返しス
テップを終了したとき、第1スケーリング係数gscf
および第2スケーリング係数scf[sb]は、可変長
符号化後の符号量が目標符号量の範囲内に収まり、かつ
発生する量子化雑音が最も知覚されにくいように選択さ
れている。
【0019】最後に、直交変換部1から得られる変換係
数は、最終的に決定された第1スケーリング係数gsc
fおよび第2スケーリング係数scf[sb]を使用し
て正規化され、さらに量子化された後に可変長符号化さ
れ、これらの処理の結果得られる符号化された変換係数
の情報は、スケーリング係数やコードブック等の情報と
共に決められたフォーマットに従って多重部7で多重化
される。
【0020】以上のように、従来のオーディオ符号化装
置では、単位時間ブロック毎にオーディオデータを直交
変換し、その変換係数を第1スケーリング係数gscf
および第2スケーリング係数scf[sb]で正規化
し、正規化後の変換係数を量子化し、さらにこの量子化
値を可変長符号化し、その結果の符号量が所望の目標符
号量以下にならない場合は上記2つのスケーリング係数
を1ステップずつ更新して再試行する、いわゆるフィー
ドバック方式が採られている。この様な単純なフィード
バック方式では、最初の試行のスケーリング係数、すな
わち第1スケーリング係数の初期値gscf init
および第2スケーリング係数の初期値scf init
[sb]の設定値によっては、目標符号量への収束時
間、すなわちフィードバック回数が大きく左右されてし
まう。
【0021】
【発明が解決しようとする課題】従来のオーディオ符号
化装置は以上のように構成されているので、第1スケー
リング係数の初期値gscf initおよび第2スケ
ーリング係数の初期値scf init[sb]の設定
値によっては、所望の符号量を満足するための最適な第
1スケーリング係数gscfと第2スケーリング係数s
cf[sb]が得られるまでの収束時間が長くなり、リ
アルタイムに符号化を行うことができないという課題が
あった。また、制御を高速に行うためには処理能力の高
い演算処理装置が必要であるという課題があった。
【0022】この発明は上記のような課題を解決するた
めになされたものであり、フィードバックによる所望の
符号量を満足するための最適な第1スケーリング係数お
よび第2スケーリング係数を決定するまでの収束時間を
短くし、符号量制御が高速に収束するオーディオ符号化
装置を得ることを目的とする。
【0023】
【課題を解決するための手段】この発明に係るオーディ
オ符号化装置は、符号化制御手段において、第1スケー
リング係数および第2スケーリング係数を更新しながら
制御する過程において、フィードバック処理毎にその更
新量を適応的に変化させるようにしたものである。
【0024】この発明に係るオーディオ符号化装置は、
符号化制御手段において、第1スケーリング係数の更新
量を適応的に変化させるための指標として、符号量を使
用するようにしたものである。
【0025】この発明に係るオーディオ符号化装置は、
符号化制御手段において、第1スケーリング係数の更新
量を適応的に変化させるための指標として、フィードバ
ックループの実行回数を使用するようにしたものであ
る。
【0026】この発明に係るオーディオ符号化装置は、
符号化制御手段において、第1スケーリング係数の更新
量を適応的に変化させるための指標として、符号量およ
びフィードバックループの実行回数の中から優先すべき
指標を選択して使用するようにしたものである。
【0027】この発明に係るオーディオ符号化装置は、
符号化制御手段において、第2スケーリング係数の更新
量を適応的に変化させるための指標として、量子化雑音
量を使用するようにしたものである。
【0028】この発明に係るオーディオ符号化装置は、
符号化制御手段において、第2スケーリング係数の更新
量を適応的に変化させるための指標として、フィードバ
ックループの実行回数を使用するようにしたものであ
る。
【0029】この発明に係るオーディオ符号化装置は、
符号化制御手段において、第2スケーリング係数の更新
量を適応的に変化させるための指標として、量子化雑音
量およびフィードバックループの実行回数の中から優先
すべき指標を選択して使用するようにしたものである。
【0030】この発明に係るオーディオ符号化装置は、
符号化制御手段において、符号化条件を考慮して第1ス
ケーリング係数および第2スケーリング係数の更新量に
重み付けを行うようにしたものである。
【0031】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1によるオ
ーディオ符号化装置を示すブロック構成図であり、図に
おいて、101は入力端子、1は入力されたオーディオ
信号を直交変換し変換係数を算出する直交変換部(直交
変換手段)、2は入力されたオーディオ信号を分析し許
容雑音量を算出する聴覚特性分析部(聴覚特性分析手
段)、3は直交変換部1により算出された変換係数を正
規化するスケーリング部(スケーリング手段)、4はス
ケーリング部3により正規化された変換係数を量子化す
る量子化部(量子化手段)、5は量子化部4により量子
化された変換係数を可変長符号化する可変長符号化部
(可変長符号化手段)である。60はスケーリング部
3、量子化部4、および可変長符号化部5を統括制御す
ると共に、複数の周波数ブロックに分割した帯域区分に
関して、全ての帯域区分に共通に適用される第1スケー
リング係数、および帯域区分毎に適用される第2スケー
リング係数を更新しながらスケーリング部3、量子化部
4、および可変長符号化部5を繰り返しフィードバック
処理して、所望の符号量および聴覚特性分析部2により
算出された許容雑音量を満たす雑音量になるように第1
スケーリング係数および第2スケーリング係数を最適化
する符号化制御部(符号化制御手段)である。なお、こ
の符号化制御部60は、第1スケーリング係数および第
2スケーリング係数を更新しながら制御する過程におい
て、フィードバック処理毎にその更新量を適応的に変化
させるものである。また、この符号化制御部60におい
て、61は第1スケーリング係数更新制御部、62は第
2スケーリング係数更新制御部である。7は符号化制御
部60により第1スケーリング係数および第2スケーリ
ング係数が最適化された符号データを多重する多重部
(多重手段)、102は出力端子である。
【0032】次に動作について説明する。直交変換部1
には入力端子101を経てオーディオ信号が入力され
る。このオーディオ信号は通常時系列のデータであり、
特定のサンプリング周波数でサンプリングされ、さらに
は特定の量子化ビットで量子化されたデータである。直
交変換部1では、変形離散コサイン変換等の直交変換に
より時系列のデータを周波数系列のデータに変換する。
直交変換後のデータ列を変換係数と呼ぶ。変換後の変換
係数は周波数軸成分、すなわちスペクトルデータを表し
ている。
【0033】また、入力端子101からのオーディオ信
号は、聴覚特性分析部2にも入力される。聴覚特性分析
部2では人間の聴覚特性をモデル化した分析が行われ
る。聴覚特性の一つにマスキング効果という特性があ
り、これはある音によってその他の音が聞こえなくなる
という現象のことである。この特性を利用して、符号化
の過程において発生する量子化雑音を人間の耳に知覚さ
せないよう、量子化雑音の発生量を適応的に制御するた
めの指標を算出する。この指標はマスキングしきい値や
許容雑音量等と呼ばれる。
【0034】また、聴覚特性分析部2は、入力信号の特
性を調べその急峻性に応じて直交変換の変換長を決定す
る。これは直交変換部1での入力信号の分解能を時間分
解能を優先するか周波数分解能を優先するかを決定付け
ることになる。すなわち入力信号を解析した結果、入力
信号の時間的変化が緩やかな場合は周波数分解能を優先
するため時間的に長い変換長にし、逆に入力信号の時間
的変化が急峻な場合は時間分解能を優先するため時間的
に短い変換長にする。
【0035】直交変換部1から出力される変換係数は、
複数の周波数帯域区分に分割され、スケーリング部3で
正規化され、量子化部4において、この帯域区分毎に適
応的な量子化が行われる。この周波数帯域区分としては
人間の聴覚特性を考慮した区分を用いることが多い。す
なわち高域ほど帯域幅の広い臨界帯域区分等である。ま
た、帯域区分毎の量子化においては、量子化効率を高め
るため、帯域区分毎に求めた係数によって事前に正規化
が行われる。
【0036】スケーリング部3で帯域区分毎に正規化さ
れた変換係数は、量子化部4で量子化される。例えば、
MPEG−2 AAC方式においては、変換係数の正規
化および量子化に次式(1)が用いられる。 xq[i]=int((abs(coeff[i])*2^ (1/4*(scf[sb]−gscf)))^3/4+α) ・・・(1) ここで、coeff[i]はi番目の変換係数、gsc
fは正規化の際に全帯域共通に使用する第1スケーリン
グ係数、scf[sb]は正規化の際に帯域区分sb毎
に使用する第2スケーリング係数、αは量子化のための
補正値、xq[i]はi番目の変換係数に対応する量子
化値であり、scf[sb]およびgscfは0または
自然数とする。なお、int()は小数値を切り捨てて
整数値化する関数で、abs()は絶対値化する関数を
示す。
【0037】また、上記式(1)における第2スケーリ
ング係数scf[sb]の初期値scf init[s
b]、および第1スケーリング係数gscfの初期値g
scf initは、次の式(2)および式(3)によ
り決定される。 scf init[sb]=0 ・・・(2) gscf init=16/3*log2 (((max coeff^(3/4))/MAX QUANT))・・(3) ここで、max coeffは全ての変換係数のうち最
大値をとる変換係数である。MAX QUANTは量子
化値の値域の最大を示す定数である。また、量子化値の
値域の条件により、gscfはgscf initより
も小さい値となってはならない制限がある。このよう
に、第1スケーリング係数の初期値gscf init
は入力オーディオ信号の性質に依存することがわかる。
また、第2スケーリング係数の初期値scf init
[sb]についても、第1スケーリング係数の初期値g
scf initと同様に入力オーディオ信号の性質に
依存して設定することも可能である。
【0038】量子化部4において求められた量子化値
は、可変長符号化部5において、帯域区分毎に最適なコ
ードブックを用いて可変長符号化される。最適なコード
ブックとは符号化後の符号量が最小となるようなコード
ブックであり、コードブック別の正確な符号量を求める
ためには選択可能なコードブック毎に実際に符号化を行
い符号量を求める必要がある。また、式(1)における
スケーリング係数が更新されれば、新たに最適なコード
ブックを選択し直し、その時の符号量を再計算する必要
がある。なお、MPEG−2 AAC方式においては、
ハフマン符号を用いたハフマンコードブックが用いられ
ている。
【0039】符号化制御部60は、スケーリング部3、
量子化部4、可変長符号化部5を統括して制御する。符
号化制御部60では、聴覚特性分析部2で求めた帯域区
分毎の許容雑音量に基づいて第2スケーリング係数sc
f[sb]を指定し、また、可変長符号化部5で算出さ
れる符号量の大小によって第1スケーリング係数gsc
fを指定する。符号化制御部60は、この2つのスケー
リング係数を、フィードバック処理毎にその更新量を適
応的に変化させることによって、指定されたスケーリン
グ係数を使用した結果において、変換係数を可変長符号
化した後の符号量が目標符号量の範囲内にあり、かつ変
換係数を量子化する際に発生する量子化雑音量が聴覚的
に最適な分布となるようなトレードオフの関係を調整す
る。
【0040】一般に、上記式(1)においては、第1ス
ケーリング係数gscfを小さくするほど、または、第
2スケーリング係数scf[sb]を大きくするほど、
量子化値は大きくなり、相対的に量子化雑音は減少し、
かつ符号量は増加する関係にある。逆に、第1スケーリ
ング係数gscfを大きくするほど、または、第2スケ
ーリング係数scf[sb]を小さくするほど、量子化
値は小さくなり、相対的に量子化雑音量は増加し、かつ
符号量は減少する関係にある。
【0041】図2はこの発明の実施の形態1による符号
化制御部の処理手順を示すフローチャートである。ま
ず、式(2)および式(3)により、第1スケーリング
係数の初期値gscf init、第2スケーリング係
数scf init[sb]を設定し(ST201)、
設定された第1スケーリング係数の初期値gscf
nitおよび第2スケーリング係数の初期値scf
nit[sb]を用いて、式(1)により正規化および
量子化を行い変換係数の量子化値を求める(ST20
2、ST203)。
【0042】求めた量子化値に対して、帯域区分毎に符
号量が最小となるような最適なコードブック選択して可
変長符号化を行い(ST204)、可変長符号化した際
の全ての帯域区分トータルでの符号量を計算し目標符号
量との比較において評価判定を行う(ST205)。例
えば、第1の条件判定として符号量が目標符号量を上回
っている場合は否判定とし、符号量が目標符号量を下回
っていれば次の条件判定に進む。第2の条件判定として
符号量が目標符号量に対してあるしきい値よりも下回っ
ていれば否判定とし、そのしきい値よりも上回っていれ
ば合判定とする。ST205において符号量に関する評
価判定の結果、合判定が下された場合はすなわち、符号
量が所望の範囲内に収まっていることを示す。
【0043】否判定の場合には、符号量が目標符号量に
近づくように第1スケーリング係数gscfを更新する
ための更新ステップサイズstep gscfを求める
(ST206)。例えば、現在の符号量が目標符号量に
対して約35%の状態である場合を考える。図3は第1
スケーリング係数の更新ステップサイズ判定テーブルを
示す概念図であり、この時、図3に示す第1スケーリン
グ係数の更新ステップサイズ判定テーブルから、現在の
符号量の状態に応じた更新ステップサイズを選択する。
図3は、現在の符号量が目標符号量に対して大きくかけ
離れている場合には第1スケーリング係数を大きく変動
させ、一度のスケーリング係数更新によって目標符号量
に近づくような更新ステップサイズが選択されている。
これは、予め統計的な調査によって定めたものであって
も、学習機能によって随時改訂されていくものであって
も良い。
【0044】すなわち、現在の符号量が目標符号量に対
して約35%の状態である場合には、図3から更新ステ
ップサイズとしてstep gscf=−2が選択され
る。選択された更新ステップサイズは、現在の第1スケ
ーリング係数gscfに対して、式(8)によって適用
される(ST207)。 gscf next=gscf+step gscf ・・・(8) ここで、gscf nextは、更新後の第1スケーリ
ング係数である。
【0045】図4はこの発明の実施の形態1によるオー
ディオ符号化装置における第1スケーリング係数更新制
御部を示すブロック構成図である。更新ステップサイズ
決定部611は、入力端子1101から入力される目標
符号量と符号量をパラメータとして、更新ステップサイ
ズ判定テーブル6111を基に更新ステップサイズを決
定する。決定された更新ステップサイズは、スケーリン
グ係数更新部612によって、現在の第1スケーリング
係数に適用され、更新された新たな第1スケーリング係
数が生成され、出力端子1102から出力される。更新
後の第1スケーリング係数は出力端子1102から出力
される。
【0046】この様に、目標符号量に対する現在の符号
量の状態に応じて、第1スケーリング係数を更新する更
新ステップサイズを適応的に変化させることによって、
符号量を目標符号量に近づける処理時間を削減すること
が可能になる。すなわち、低処理能力の演算装置でも符
号化を実現することが可能になり、装置の小型化/低価
格化が可能となる。
【0047】ST205で合判定が下された場合、次に
量子化雑音に関する評価判定を行う(ST208)。こ
こでの量子化雑音量の評価とは、聴覚特性分析部2で求
めた許容雑音量と量子化部4の結果として得られる量子
化雑音量の相対関係から、マスキング効果の度合いを判
定するものである。例えば、ある帯域区分sbにおいて
許容雑音量と量子化雑音量の大小を比較し、量子化雑音
量の方が許容雑音量よりも小さければ、マスキング効果
が十分にあると判定し、第2スケーリング係数の更新は
不要とする。つまり合判定を下す。逆に、量子化雑音量
の方が許容雑音量よりも大きければ、マスキング効果が
不十分であり、符号化品質の劣化が生じると判定し、第
2スケーリング係数を更新するよう判定する。つまり否
判定を下す。
【0048】ST208では最終的に、全ての帯域区分
において合判定が出た場合にのみ一連の処理を完了す
る。それ以外の場合には、以降のステップにおいて否判
定の下された帯域区分について第2スケーリング係数の
更新処理を行う。
【0049】ST208で否判定とされた帯域区分にお
いて量子化雑音量を減少させるために、第2スケーリン
グ係数を更新するための更新ステップサイズstep
scf[sb]を決定する(ST209)。例えば、許
容雑音量と現在の量子化雑音量の比が約10dBの状態
である場合を考える。図5は第2スケーリング係数の更
新ステップサイズ判定テーブルを示す概念図であり、こ
の時、図5に示す第2スケーリング係数の更新ステップ
サイズ判定テーブルから、現在の量子化雑音の発生状態
に応じた更新ステップサイズを選択する。図5は、現在
の量子化雑音量が許容雑音量に対して大きくかけ離れて
いる場合には第2スケーリング係数を大きく変動させ、
一度のスケーリング係数更新によって許容雑音量以下に
近づくような更新ステップサイズが選択されている。こ
れは、予め統計的な調査によって定めたものであって
も、学習機能によって随時改訂されていくものであって
も良い。
【0050】すなわち、許容雑音量と現在の量子化雑音
量の比が約10dBである場合には、図5から更新ステ
ップサイズとしてstep scf[sb]=8が選択
される。選択された更新ステップサイズは、現在の第2
スケーリング係数scf[sb]に対して、式(9)に
よって適用される(ST210)。 scf next[sb]=scf[sb]+step scf[sb] ・・・(9) ここで、scf next[sb]は、帯域区分sbに
おける更新後の第2スケーリング係数である。
【0051】図6はこの発明の実施の形態1によるオー
ディオ符号化装置における第2スケーリング係数更新制
御部を示すブロック構成図である。帯域選択部621
は、入力端子1201から入力される符号化制御部60
のST208での帯域区分毎の判定結果をもとに、否判
定となった帯域を選択する。更新ステップサイズ決定部
622は、入力端子1202から入力される許容雑音量
と量子化雑音量をパラメータとして、更新ステップサイ
ズ判定テーブル6221を基に更新ステップサイズを決
定する。決定された更新ステップサイズは、スケーリン
グ係数更新部623によって、現在の第2スケーリング
係数に適用され、更新された新たな第2スケーリング係
数が生成され、出力端子1203から出力される。な
お、帯域選択部621で選択する帯域区分は1つずつで
も同時に複数でも良い。
【0052】この様に、帯域区分毎に、許容雑音量に対
する現在の量子化雑音量との比に応じて第2スケーリン
グ係数を更新する更新ステップサイズを適応的に変化さ
せることによって、量子化雑音量を許容雑音量以下に近
づけるための処理時間を削減することが可能になる。す
なわち、低処理能力の演算装置でも符号化を実現するこ
とが可能になり、装置の小型化/低価格化が可能とな
る。
【0053】以上のように、この実施の形態1によれ
ば、符号化制御のためのフィードバックループにおい
て、第1スケーリング係数についてはその更新ステップ
サイズを目標符号量と現在の符号量の関係から求め、ま
た、第2スケーリング係数についてはその更新ステップ
サイズを許容雑音量と現在の量子化雑音量の関係から求
め、これをフィードバックループ毎に繰り返して求める
ことによって、所望の符号量と量子化雑音の発生分布の
状態とするための最適な第1スケーリング係数gscf
および第2スケーリング係数scf[sb]を得るまで
のフィードバックによる収束時間を短くでき、符号量制
御を高速に収束することができるという効果が得られ
る。
【0054】実施の形態2.この実施の形態2によるオ
ーディオ符号化装置の構成は、実施の形態1の図1に示
す構成と基本的に同じであり、第1スケーリング係数更
新制御部61および第2スケーリング係数更新制御部6
2のブロック構成が異なるだけである。また、符号化制
御部60の処理の流れは、実施の形態1の図2に示すフ
ローチャートと基本的に同等である。
【0055】次に動作について説明する。図7はこの発
明の実施の形態2によるオーディオ符号化装置における
第1スケーリング係数更新制御部の構成を示すブロック
図である。特徴量選択部633は、実施の形態1の第1
スケーリング係数の更新ステップサイズ決定部611で
使用する目標符号量と現在の符号量の関係の他、一つあ
るいは複数の指標のなかから優先すべき最適な指標を選
択する。例えば、入力端子1301からは目標符号量と
現在の符号量の他、フィードバックループの現在の実行
回数が入力される。
【0056】特徴量選択部633では、予め与えられて
いるフィードバックループが実時間処理を実現するため
の実行可能回数の限界値に対して、現在の実行回数がど
の程度であるかを評価する。現在の実行回数が限界値に
近づいている場合には、残された実行可能回数の範囲内
でフィードバック処理を完了させなければならない。こ
のため、通常通り、符号量に基づいて更新ステップサイ
ズを決定し続ければ実時間処理が破綻する可能性が高
い。従って、このような場合には、符号量の関係の代わ
りに実行回数の関係を選択し、さらには、残された実行
回数に応じて更新ステップサイズが割り振られている更
新ステップサイズ判定テーブルと共に、更新ステップサ
イズ決定部631に出力する。
【0057】更新ステップサイズ決定部631は、特徴
量選択部633からの残された実行回数とこれに対応し
た更新ステップサイズ判定テーブル6311を使用し
て、更新ステップサイズを決定する。決定された更新ス
テップサイズは、スケーリング係数更新部632によっ
て、現在の第1スケーリング係数に適用され、更新され
た新たな第1スケーリング係数が生成される。更新後の
第1スケーリング係数は出力端子1302から出力され
る。
【0058】なお、特徴量選択部633は、残された実
行回数に応じて更新ステップサイズ決定部631が予め
保有している図3に示した更新ステップサイズ判定テー
ブルに対して、重み付け係数を決定するものであっても
良い。例えば、残された実行回数があるしきい値を下回
ったら重み付け係数を2として更新ステップサイズを2
倍にする。
【0059】図8はこの発明の実施の形態2によるオー
ディオ符号化装置における第2スケーリング係数更新制
御部を示すブロック構成図である。帯域選択部641
は、入力端子1401から入力される符号化制御部60
のST208での帯域区分毎の判定結果をもとに、否判
定となった帯域を選択する。特徴量選択部644は、実
施の形態1の第2スケーリング係数の更新ステップサイ
ズ決定部622で使用する許容雑音量と現在の量子化雑
音量の関係の他、一つあるいは複数の指標の中から優先
すべき最適な指標を選択する。例えば、入力端子140
2からは許容雑音量と現在の量子化雑音量の他、フィー
ドバックループの現在の実行回数が入力される。
【0060】特徴量選択部644では、予め与えられて
いるフィードバックループが実時間処理を実現するため
の実行可能回数の限界値に対して、現在の実行回数がど
の程度であるかを評価する。現在の実行回数が限界値に
近づいている場合には、残された実行可能回数の範囲内
でフィードバック処理を完了させなければならない。こ
のため、通常通り、雑音量に基づいて更新ステップサイ
ズを決定し続ければ実時間処理が破綻する可能性が高
い。従って、このような場合には、雑音量の関係の代わ
りに実行回数の関係を選択し、さらには、残された実行
回数に応じて更新ステップサイズが割り振られている更
新ステップサイズ判定テーブルと共に、更新ステップサ
イズ決定部642に出力する。
【0061】更新ステップサイズ決定部642は、特徴
量選択部644からの残された実行回数とこれに対応し
た更新ステップサイズ判定テーブル6421を使用し
て、更新ステップサイズを決定する。決定された更新ス
テップサイズは、スケーリング係数更新部643によっ
て、現在の第2スケーリング係数に適用され、更新され
た新たな第2スケーリング係数が生成される。更新後の
第2スケーリング係数は出力端子1403から出力され
る。
【0062】なお、特徴量選択部644は、残された実
行回数に応じて更新ステップサイズ決定部642が予め
保有している図5に示した更新ステップサイズ判定テー
ブルに対して、重み付け係数を決定するものであっても
良い。例えば、残された実行回数があるしきい値を下回
ったら重み付け係数を2として更新ステップサイズを2
倍にする。この重み付け係数の適用は全ての帯域区分に
対して実施しても良く、また特定の個数を選択した一部
の帯域区分に実施するものであっても良い。
【0063】この様に、第1スケーリング係数及び第2
スケーリング係数の更新に関して、更新ステップサイズ
を決定するための基準となる複数の指標の中から状況に
応じて最適な指標を選択し、その指標を用いて更新する
ステップサイズを決定することによって、フィードバッ
クループの処理時間を削減することが可能になる。すな
わち、低処理能力の演算装置でも符号化を実現すること
が可能になり、装置の小型化/低価格化が可能となる。
【0064】以上のように、この実施の形態2によれ
ば、符号化制御のためのフィードバックループにおい
て、通常は、第1スケーリング係数についてはその更新
ステップサイズを目標符号量と現在の符号量の関係から
求め、また、第2スケーリング係数についてはその更新
ステップサイズを許容雑音量と現在の量子化雑音量の関
係から求め、同時に、フィードバックループの実行可能
回数に対する現在の実行回数の関係を考慮し、いずれか
優先する指標を選択しつつフィードバックループ毎に繰
り返して求めることによって、所望の符号量と量子化雑
音の発生分布の状態とするための最適な第1スケーリン
グ係数gscfおよび第2スケーリング係数scf[s
b]を得るまでのフィードバックによる収束時間を短く
でき、かつ、処理時間の上限を越えることを防ぐことが
可能になるので、実時間処理を破綻無く実現することが
できるという効果が得られる。
【0065】実施の形態3.この実施の形態3によるオ
ーディオ符号化装置の構成は、実施の形態1の図1に示
す構成と基本的に同じであり、第1スケーリング係数更
新制御部61および第2スケーリング係数更新制御部6
2のブロック構成が異なるだけである。また、符号化制
御部60の処理の流れは、実施の形態1の図2に示すフ
ローチャートと基本的に同等である。
【0066】次に動作について説明する。図9はこの発
明の実施の形態3によるオーディオ符号化装置における
第1スケーリング係数更新制御部の構成を示すブロック
図である。特徴量選択部653は、実施の形態2の構成
に加えて外部から符号化条件654が与えられている。
この符号化条件654は、フィードバック処理の間中変
化のない条件、例えば符号化ビットレートの他、符号化
の対象となるチャネル数等である。
【0067】ここで、符号化の対象となるチャネル数に
ついて考える。特徴量選択部653は、符号化の対象と
なるチャネル数として2チャネルが与えられた場合、選
択した指標における更新ステップサイズ判定テーブルに
対して、重み付け係数2.0を選択する。すなわち、符
号化の対象となるチャネル数に比例した重み付け係数を
選択し、更新ステップサイズ決定部651に出力する。
【0068】更新ステップサイズ決定部651は、特徴
量選択部653から得られた重み付け係数を更新ステッ
プサイズ判定テーブル6311に掛け合わせて重み付け
を行い、更新ステップサイズを決定する。
【0069】図10はこの発明の実施の形態3によるオ
ーディオ符号化装置における第2スケーリング係数更新
制御部の構成を示すブロック図である。特徴量選択部6
64は、実施の形態2の構成に加えて外部から符号化条
件665が与えられている。フィードバック処理の間中
変化のない条件、例えば符号化ビットレートの他、符号
化の対象となるチャネル数等である。
【0070】ここで、符号化の対象となるチャネル数に
ついて考える。特徴量選択部664は、符号化の対象と
なるチャネル数として2チャネルが与えられた場合、選
択した指標における更新ステップサイズ判定テーブル6
421に対して、重み付け係数2.0を選択する。すな
わち、符号化の対象となるチャネル数に比例した重み付
け係数を選択し、更新ステップサイズ決定部662に出
力する。
【0071】更新ステップサイズ決定部662は、特徴
量選択部664から得られた重み付け係数を更新ステッ
プサイズ判定テーブル6421に掛け合わせて重み付け
を行い、更新ステップサイズを決定する。
【0072】この様に、第1スケーリング係数および第
2スケーリング係数の更新に関して、符号化条件を考慮
して重み付けを行った更新ステップサイズを決定するこ
とによって、その符号化条件に応じたフィードバックル
ープの処理時間を制御することが可能になる。すなわ
ち、新たに演算装置を追加することなく、同一の装置に
おいて各種の符号化条件における符号化処理を実現する
ことが可能となる。
【0073】以上のように、この実施の形態3によれ
ば、符号化制御のためのフィードバックループにおい
て、通常は、第1スケーリング係数についてはその更新
ステップサイズを目標符号量と現在の符号量の関係から
求め、また、第2スケーリング係数についてはその更新
ステップサイズを許容雑音量と現在の量子化雑音量の関
係から求め、同時に、フィードバックループの実行可能
回数に対する現在の実行回数の関係を考慮していずれか
優先する指標を選択し、さらには符号化条件に合った重
み付けを行いながらフィードバックループ毎に繰り返し
て求めることによって、所望の符号量と量子化雑音の発
生分布の状態とするための最適な第1スケーリング係数
gscfおよび第2スケーリング係数scf[sb]を
得るまでのフィードバックによる収束時間を短くでき、
かつ、処理時間の上限を越えることを防ぐことが可能に
なるので、符号化条件に関わらず、同一装置上で実時間
処理を破綻無く実現することができるという効果が得ら
れる。
【0074】
【発明の効果】以上のように、この発明によれば、符号
化制御手段は、第1スケーリング係数および第2スケー
リング係数を更新しながら制御する過程において、フィ
ードバック処理毎にその更新量を適応的に変化させるよ
うに構成したので、最適な第1スケーリング係数、およ
び第2スケーリング係数を得るまでのフィードバックに
よる収束時間を短くでき、符号量制御を高速に収束させ
ることができ、装置の小型化/低価格化が可能となると
いう効果がある。
【0075】この発明によれば、符号化制御手段は、第
1スケーリング係数の更新量を適応的に変化させるため
の指標として、符号量を使用するように構成したので、
第1スケーリング係数については、その更新量を、例え
ば、目標符号量と現在の符号量の関係から求め、これを
フィードバックループ毎に繰り返して求めることによっ
て、所望の符号量とするための最適な第1スケーリング
係数を得るまでのフィードバックによる収束時間を短く
でき、符号量制御を高速に収束させることができるとい
う効果がある。
【0076】この発明によれば、符号化制御手段は、第
1スケーリング係数の更新量を適応的に変化させるため
の指標として、フィードバックループの実行回数を使用
するように構成したので、第1スケーリング係数につい
ては、その更新量を、例えば、フィードバックループの
実行可能回数に対する現在の実行回数の関係から求め、
これをフィードバックループ毎に繰り返して求めること
によって、処理時間の上限を越えることを防ぐことが可
能になるので、実時間処理を破綻無く実現することがで
きるという効果がある。
【0077】この発明によれば、符号化制御手段は、第
1スケーリング係数の更新量を適応的に変化させるため
の指標として、符号量およびフィードバックループの実
行回数の中から優先すべき指標を選択して使用するよう
に構成したので、符号化制御のためのフィードバックル
ープにおいて、例えば通常は、第1スケーリング係数に
ついてはその更新量を目標符号量と現在の符号量の関係
から求め、同時に、フィードバックループの実行可能回
数に対する現在の実行回数の関係を考慮し、いずれか優
先する指標を選択しつつフィードバックループ毎に繰り
返して求めることによって、所望の符号量とするための
最適な第1スケーリング係数を得るまでのフィードバッ
クによる収束時間を短くでき、かつ、処理時間の上限を
越えることを防ぐことが可能になるので、実時間処理を
破綻無く実現することができるという効果がある。
【0078】この発明によれば、符号化制御手段は、第
2スケーリング係数の更新量を適応的に変化させるため
の指標として、量子化雑音量を使用するように構成した
ので、第2スケーリング係数については、その更新量
を、例えば、許容雑音量と現在の量子化雑音量の関係か
ら求め、これをフィードバックループ毎に繰り返して求
めることによって、所望の量子化雑音の発生分布の状態
とするための最適な第2スケーリング係数を得るまでの
フィードバックによる収束時間を短くでき、符号量制御
を高速に収束させることができるという効果がある。
【0079】この発明によれば、符号化制御手段は、第
2スケーリング係数の更新量を適応的に変化させるため
の指標として、フィードバックループの実行回数を使用
するように構成したので、第2スケーリング係数につい
ては、その更新量を、例えば、フィードバックループの
実行可能回数に対する現在の実行回数の関係から求め、
これをフィードバックループ毎に繰り返して求めること
によって、処理時間の上限を越えることを防ぐことが可
能になるので、実時間処理を破綻無く実現することがで
きるという効果がある。
【0080】この発明によれば、符号化制御手段は、第
2スケーリング係数の更新量を適応的に変化させるため
の指標として、量子化雑音量およびフィードバックルー
プの実行回数の中から優先すべき指標を選択して使用す
るように構成したので、符号化制御のためのフィードバ
ックループにおいて、例えば通常は、第2スケーリング
係数についてはその更新量を許容雑音量と現在の量子化
雑音量の関係から求め、同時に、フィードバックループ
の実行可能回数に対する現在の実行回数の関係を考慮
し、いずれか優先する指標を選択しつつフィードバック
ループ毎に繰り返して求めることによって、所望の量子
化雑音の発生分布の状態とするための最適な第2スケー
リング係数を得るまでのフィードバックによる収束時間
を短くでき、かつ、処理時間の上限を越えることを防ぐ
ことが可能になるので、実時間処理を破綻無く実現する
ことができるという効果がある。
【0081】この発明によれば、符号化制御手段は、符
号化条件を考慮して第1スケーリング係数および第2ス
ケーリング係数の更新量に重み付けを行うように構成し
たので、符号化条件に合った重み付けを行いながらフィ
ードバックループ毎に繰り返して求めることによって、
符号化条件に関わらず、同一装置上で実時間処理を破綻
無く実現することができるという効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1によるオーディオ符
号化装置を示すブロック構成図である。
【図2】 この発明の実施の形態1による符号化制御部
の処理手順を示すフローチャートである。
【図3】 第1スケーリング係数の更新ステップサイズ
判定テーブルを示す概念図である。
【図4】 この発明の実施の形態1によるオーディオ符
号化装置における第1スケーリング係数更新制御部を示
すブロック構成図である。
【図5】 第2スケーリング係数の更新ステップサイズ
判定テーブルを示す概念図である。
【図6】 この発明の実施の形態1によるオーディオ符
号化装置における第2スケーリング係数更新制御部を示
すブロック構成図である。
【図7】 この発明の実施の形態2によるオーディオ符
号化装置における第1スケーリング係数更新制御部の構
成を示すブロック図である。
【図8】 この発明の実施の形態2によるオーディオ符
号化装置における第2スケーリング係数更新制御部を示
すブロック構成図である。
【図9】 この発明の実施の形態3によるオーディオ符
号化装置における第1スケーリング係数更新制御部の構
成を示すブロック図である。
【図10】 この発明の実施の形態3によるオーディオ
符号化装置における第2スケーリング係数更新制御部の
構成を示すブロック図である。
【図11】 従来のオーディオ符号化装置を示すブロッ
ク構成図である。
【図12】 従来の符号化制御部の処理手順を示すフロ
ーチャートである。
【符号の説明】
1 直交変換部(直交変換手段)、2 聴覚特性分析部
(聴覚特性分析手段)、3 スケーリング部(スケーリ
ング手段)、4 量子化部(量子化手段)、5可変長符
号化部(可変長符号化手段)、7 多重部(多重手
段)、60 符号化制御部(符号化制御手段)、61
第1スケーリング係数更新制御部、62第2スケーリン
グ係数更新制御部、101,1101,1201,12
02,1301,1401,1402 入力端子、10
2,1102,1203,1302,1403 出力端
子、611,622,631,642,651,662
更新ステップサイズ決定部、612,623,632,
643 スケーリング係数更新部、621,641 帯
域選択部、633,644,653,664 特徴量選
択部、654,665 符号化条件、6111,622
1,6311,6421 更新ステップサイズ判定テー
ブル。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 DA20 5J064 AA03 BA09 BA16 BB02 BB07 BB12 BC02 BC16 BC17 BC25 BD02

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力されたオーディオ信号を直交変換し
    変換係数を算出する直交変換手段と、入力されたオーデ
    ィオ信号を分析し許容雑音量を算出する聴覚特性分析手
    段と、上記直交変換手段により算出された変換係数を正
    規化するスケーリング手段と、上記スケーリング手段に
    より正規化された変換係数を量子化する量子化手段と、
    上記量子化手段により量子化された変換係数を可変長符
    号化する可変長符号化手段と、複数の周波数ブロックに
    分割した帯域区分に関して、全ての帯域区分に共通に適
    用される第1スケーリング係数、および帯域区分毎に適
    用される第2スケーリング係数を更新しながら上記スケ
    ーリング手段、上記量子化手段、および上記可変長符号
    化手段を繰り返しフィードバック処理して、所望の符号
    量および上記聴覚特性分析手段により算出された許容雑
    音量を満たす雑音量になるように第1スケーリング係数
    および第2スケーリング係数を最適化する符号化制御手
    段と、上記符号化制御手段により第1スケーリング係数
    および第2スケーリング係数が最適化された符号データ
    を多重する多重手段とを備え、上記符号化制御手段は、
    第1スケーリング係数および第2スケーリング係数を更
    新しながら制御する過程において、フィードバック処理
    毎にその更新量を適応的に変化させることを特徴とする
    オーディオ符号化装置。
  2. 【請求項2】 符号化制御手段は、第1スケーリング係
    数の更新量を適応的に変化させるための指標として、符
    号量を使用することを特徴とする請求項1記載のオーデ
    ィオ符号化装置。
  3. 【請求項3】 符号化制御手段は、第1スケーリング係
    数の更新量を適応的に変化させるための指標として、フ
    ィードバックループの実行回数を使用することを特徴と
    する請求項1記載のオーディオ符号化装置。
  4. 【請求項4】 符号化制御手段は、第1スケーリング係
    数の更新量を適応的に変化させるための指標として、符
    号量およびフィードバックループの実行回数の中から優
    先すべき指標を選択して使用することを特徴とする請求
    項1記載のオーディオ符号化装置。
  5. 【請求項5】 符号化制御手段は、第2スケーリング係
    数の更新量を適応的に変化させるための指標として、量
    子化雑音量を使用することを特徴とする請求項1記載の
    オーディオ符号化装置。
  6. 【請求項6】 符号化制御手段は、第2スケーリング係
    数の更新量を適応的に変化させるための指標として、フ
    ィードバックループの実行回数を使用することを特徴と
    する請求項1記載のオーディオ符号化装置。
  7. 【請求項7】 符号化制御手段は、第2スケーリング係
    数の更新量を適応的に変化させるための指標として、量
    子化雑音量およびフィードバックループの実行回数の中
    から優先すべき指標を選択して使用することを特徴とす
    る請求項1記載のオーディオ符号化装置。
  8. 【請求項8】 符号化制御手段は、符号化条件を考慮し
    て第1スケーリング係数および第2スケーリング係数の
    更新量に重み付けを行うことを特徴とする請求項1から
    請求項7のうちのいずれか1項記載のオーディオ符号化
    装置。
JP2001118609A 2001-04-17 2001-04-17 オーディオ符号化装置 Pending JP2002311993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001118609A JP2002311993A (ja) 2001-04-17 2001-04-17 オーディオ符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001118609A JP2002311993A (ja) 2001-04-17 2001-04-17 オーディオ符号化装置

Publications (1)

Publication Number Publication Date
JP2002311993A true JP2002311993A (ja) 2002-10-25

Family

ID=18968978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001118609A Pending JP2002311993A (ja) 2001-04-17 2001-04-17 オーディオ符号化装置

Country Status (1)

Country Link
JP (1) JP2002311993A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007017659A (ja) * 2005-07-07 2007-01-25 Fujitsu Ltd オーディオ符号化方法及び装置
JP2007507750A (ja) * 2003-09-29 2007-03-29 ソニー エレクトロニクス インク オーディオ符号化におけるレート−歪み制御方法
JP2008065162A (ja) * 2006-09-08 2008-03-21 Toshiba Corp オーディオ符号化装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007507750A (ja) * 2003-09-29 2007-03-29 ソニー エレクトロニクス インク オーディオ符号化におけるレート−歪み制御方法
KR101103004B1 (ko) * 2003-09-29 2012-01-05 소니 일렉트로닉스 인코포레이티드 오디오 인코딩 시의 레이트-왜곡 제어 구조
JP2007017659A (ja) * 2005-07-07 2007-01-25 Fujitsu Ltd オーディオ符号化方法及び装置
JP2008065162A (ja) * 2006-09-08 2008-03-21 Toshiba Corp オーディオ符号化装置

Similar Documents

Publication Publication Date Title
US6871106B1 (en) Audio signal coding apparatus, audio signal decoding apparatus, and audio signal coding and decoding apparatus
US8924201B2 (en) Audio encoder and decoder
JP5551694B2 (ja) 多くのスペクトルエンベロープを計算するための装置および方法
JP4212591B2 (ja) オーディオ符号化装置
US9754601B2 (en) Information signal encoding using a forward-adaptive prediction and a backwards-adaptive quantization
EP0910067B1 (en) Audio signal coding and decoding methods and audio signal coder and decoder
RU2335809C2 (ru) Аудиокодирование
KR100904605B1 (ko) 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법
US20110075855A1 (en) method and apparatus for processing audio signals
JP2016505168A (ja) 音声信号復号化または符号化の時間領域レベル調整
KR20080049116A (ko) 오디오 코딩
RU2719008C1 (ru) Аудиокодер для кодирования аудиосигнала, способ для кодирования аудиосигнала и компьютерная программа, учитывающие детектируемую спектральную область пиков в верхнем частотном диапазоне
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR102512359B1 (ko) 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
CN105144288A (zh) 高级量化器
US7974848B2 (en) Method and apparatus for encoding audio data
US20040002859A1 (en) Method and architecture of digital conding for transmitting and packing audio signals
JP2003140692A (ja) 符号化装置及び復号化装置
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3684751B2 (ja) 信号符号化方法及び装置
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP5539992B2 (ja) レート制御装置、レート制御方法及びレート制御プログラム
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071108

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071108

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071108