JP2007525716A - 量子化器のステップサイズを求める装置および方法 - Google Patents

量子化器のステップサイズを求める装置および方法 Download PDF

Info

Publication number
JP2007525716A
JP2007525716A JP2007501150A JP2007501150A JP2007525716A JP 2007525716 A JP2007525716 A JP 2007525716A JP 2007501150 A JP2007501150 A JP 2007501150A JP 2007501150 A JP2007501150 A JP 2007501150A JP 2007525716 A JP2007525716 A JP 2007525716A
Authority
JP
Japan
Prior art keywords
quantizer
step size
interference
threshold
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007501150A
Other languages
English (en)
Other versions
JP4531805B2 (ja
Inventor
ベアンハード グリル
ミヒャエル シュグ
ボードー ティヒマン
ニコラウス レッテルバッハ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2007525716A publication Critical patent/JP2007525716A/ja
Application granted granted Critical
Publication of JP4531805B2 publication Critical patent/JP4531805B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Paper (AREA)
  • Soil Working Implements (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Length Measuring Devices With Unspecified Measuring Means (AREA)
  • Measurement Of Optical Distance (AREA)

Abstract

オーディオまたはビデオ情報を含む信号を量子化するための量子化器のステップサイズを求めるために、第1の量子化器のステップサイズとともに干渉閾値が生成される(502)。次に、第1の量子化器のステップサイズにより、実際に導入された干渉が求められ(504)、干渉閾値と比較する(506)。実際に導入した干渉が閾値を超えていることが、比較によりわかっているという事実にもかかわらず、第2の、より粗い量子化器のステップサイズをやはり用いて(508)、より粗い、第2の量子化器のステップサイズにから導入された干渉が閾値を下回っていること、または第1の量子化器のステップサイズにより導入された干渉を下回っていることが判明した場合は(512)、次にこれを量子化に用いる(514)。従って、量子化を粗くしながらも、量子化の干渉を低減するので、圧縮利得が増加する。
【選択図】図5b

Description

本発明は、オーディオコーダに関し、特に、変換ベースのオーディオコーダに関する。すなわち、コーダパイプラインの最初に、時間的表現をスペクトル表現に変換するオーディオコーダである。
従来技術の変換ベースのオーディオコーダを、図3に示す。図3に示すコーダは、国際標準ISO/IEC14496−3:2001(E)、サブパート4、4ページに示され、この技術でAACコーダとしても知られている。
従来技術のコーダについて、以下に示す。符号化するオーディオ信号は、入力1000に供給される。このオーディオ信号は、当初、スケーリングステージ1002に供給される。ここで、オーディオ信号のレベルを設定するいわゆるAAC利得制御が行われる。ブロック1002とブロック1004との間の矢印で示すように、スケーリングからの副情報はビットストリームフォーマッタ1004に供給される。次に、スケール変更したオーディオ信号が、MDCTフィルタバンク1006に供給される。AACコーダでは、フィルタバンクが、50%オーバーラップウィンドウを有する変形離散コサイン変換を実行する。ウィンドウ長を、ブロック1008により求める。
一般に、ブロック1008は、過渡信号に比較的短いウィンドウを与え、定常する傾向のある信号に比較的長いウィンドウを与えるようにするために存在する。これにより、比較的短いウィンドウのために、(周波数分解能を犠牲にして)過渡信号の時間分解能のレベルがより高くなり、より長いウィンドウのために、(時間分解能を犠牲にして)周波数分解能がより高くなる。より長いウィンドウが好まれる傾向があるのは、符号化利得がより高くなるからである。フィルタバンク1006の出力には、時間的に連続するブロックの、スペクトル値のブロックが存在する。これは、フィルタバンクの実施形態により、MDCT係数、フーリエ係数またはサブバンド信号とすることができる。各サブバンド信号は、フィルタバンク1006のそれぞれのサブバンドチャネルで指定された特定の制限のある帯域幅を有し、各サブバンド信号は、特定の数のサブバンドサンプルを有している。
次に続くのは、例示として表されるこの場合では、フィルタバンクが、MDCTスペクトル係数の時間的に連続するブロックを出力する。これは一般に、入力1000にあるオーディオ信号の、連続する短いスペクトルを表す。次に、ブロックとなっているMDCTスペクトル値が、TNS処理ブロック1010(TNS=暫定ノイズ整形(temporary noise shaping))に供給され、ここで暫定ノイズ整形が行われる。TNS技術を用いて、各変換ウィンドウ内で、量子化ノイズの時間的形状を整形する。これは、各チャネルのスペクトルデータそれぞれにフィルタ処理を行うことにより実現する。ウィンドウ毎に符号化は行われる。特に、TNSツールをスペクトルデータのウィンドウに、すなわち、ブロックとなっているスペクトル値に用いるために、以下の工程を行う。
初めに、TNSツールの周波数範囲が選択される。適した選択範囲は、フィルタを用いる1.5kHzの周波数範囲から、最も高い可能なスケールファクタ帯域までに及ぶ。AAC標準(ISO/IEC14496−3:2001(E))で規定されるように、この周波数範囲は、サンプリングレートに依存することに注意されたい。
続いて、正確にいうと、選択された目標周波数範囲内に存在するスペクトルMDCT係数を用いて、LPC(LPC=線形予測符号化(linear predictive coding))の計算が実行される。安定性を高めるために、2.5kHzより小さい周波数に対応する係数がこの処理から除外される。オーディオ処理から周知である、一般的なLPC手順をLPCの算出に用いることもできる。例えば、周知のレヴィンソン−ダービンの算法(Levinson−Durbin algorithm)である。算出を行って、ノイズ整形フィルタの最大許容次数を求めるために、計算が実行される。
LPCの算出の結果、しかるべき予測利得PGが得られる。さらに、反射係数、すなわち、PARCOR係数が得られる。
予測利得が指定の閾値を超えていない場合は、TNSツールは適用されない。この場合は、TNS処理の行われなかったことをデコーダがわかるように、制御情報の1つが、ビットストリームに書き込まれる。
しかしながら、予測利得が閾値を超えている場合は、TNS処理が適用される。
次の工程では、反射係数が量子化される。反射係数アレイの配列の“末尾”から、閾値より小さい絶対値を有する全反射係数を除くことにより、用いるノイズ整形フィルタの次数が求められる。残りの反射係数の数は、およそノイズ整形フィルタの大きさである。適した閾値は0.1である。
通常、残りの反射係数は線形予測係数に変換される。この技術も、“ステップアップ”手順として周知である。
次に、算出されたLPC係数は、コーダノイズ整形フィルタ係数、すなわち、予測フィルタ係数として用いられる。このFIRフィルタは、指定した目標周波数範囲でフィルタを行うために、用いられる。自己回帰フィルタが復号化に用いられ、いわゆる移動平均フィルタが符号化に用いられる。最終的に、図3のTNS処理ブロック1010とビットストリームフォーマッタ1004との間の矢印で示すように、TNSツールの副情報がビットストリームフォーマッタに供給される。
次に、図3に図示しない、長期予測ツール、強度/結合ツール、予測ツール、ノイズ置換ツール等の、いくつかのオプションのツールを経て、ようやくミッド/サイドコーダ1012にたどり着く。符号化すべきオーディオ信号がマルチチャネル信号の場合は、すなわち、左側チャネルおよび右側チャネルを有するステレオ信号の場合は、ミッド/サイドコーダ1012がアクティブになる。今までのところ、すなわち、図3のブロック1012上流側では、左側および右側のステレオチャネル、すなわち、スケール変更したチャネルが処理され、フィルタバンクで変換され、TNS処理されたり、されなかったりして、互いに別々に処理されている。
ミッド/サイドコーダではまず、ミッド/サイド符号化が意味をなすかどうか、すなわち、符号化利得を少しでも得るかどうか、検証が行われる。左側チャネルおよび右側チャネルが同じような傾向である場合には、ミッド/サイド符号化では符号化利得を得る。この場合は、1/2倍のスケーリングを別にして中央チャネル、すなわち、左側チャネルおよび右側チャネルの和が、左側チャネルまたは右側チャネルとほぼ等しいからである。サイドチャネルが非常に小さい値しか持っていないのは、これが左側チャネルと右側チャネルとの差に等しいからである。結果として、左側チャネルおよび右側チャネルほぼ同じ場合は、差はほぼゼロであるか、きわめて小さい値しか含まないことがわかる。期待されていることは、この値を次の量子化器1014で量子化するとゼロになることである。従って、これを非常に効率的な方法で送ることができるのは、エントロピーコーダ1016が量子化器1014の下流側に接続されているからである。
心理音響モデル1020により、量子化器1014に、スケールファクタ帯域につき1つの許容される干渉を供給する。量子化器は、繰り返して動作する。すなわち、まず外部繰り返しループが呼び出され、これが次に内部繰り返しループを呼び出す。一般に、量子化器ステップサイズの開始値から開始して、まず量子化器1014の入力で、ブロックとなっている値に対して量子化を行う。特に、内部ループがMDCT係数を量子化し、ビットの特定の数をこの処理で使用する。内部ループを再び呼び出して、外部ループが、スケールファクタを用いて歪みおよび係数の変形エネルギーを算出する。特定の条件句を満たすまで、この処理を繰り返す。外部繰り返しループ内での各繰り返しでは、量子化により導入された干渉を算出して、これを心理音響モデル1020が供給する許容される干渉と比較するように、信号が復元される。また、この比較を行った後でもやはり干渉すると考えられる、これらの周波数帯域のスケールファクタを、1以上の段階を繰り返し、繰り返し行って、正確にいうと、外部繰り返しループのそれぞれの繰り返しを行って、拡大する。
一旦、量子化により導入された量子化干渉が心理音響モデルで求めた許容される干渉を下回り、同時にビット要件を満たす場合、正確にいうと、最大ビットレートを超えていない状態になった場合は、繰り返し、すなわち、合成による分析方法を終了して、得られたスケールファクタをブロック1014に示すように符号化して、ブロック1014とブロック1004との間の矢印で示されるように、符号化した形態でビットストリームフォーマッタ1004に供給する。次に、量子化した値は、エントロピーコーダ1016に供給される。これは通常、量子化した値をバイナリ形式に変換するように、ハフマン符号表をいくつか用いて、各種のスケールファクタ帯域に対してエントロピー符号化を行う。周知のように、ハフマン符号化の形式のエントロピー符号化では、予想信号統計値に基づいて生成した符号表をよりどころとする必要が有り、頻繁に生じる値には、さほど頻繁に生じない値よりも短いコード語が与えられる。次に、エントロピー符号化値が実際の主情報として、ビットストリームフォーマッタ1004に供給される。これは次に、特定のビットストリームシンタックスに従って、出力側で符号化音声信号を出力する。
量子化器のステップサイズにより導入された干渉が閾値よりも大きい場合は、すでに説明したように、より微細な量子化器のステップサイズをこの繰り返し量子化に用いる。これは、実行する量子化がより微細なので、量子化ノイズが低減されるように期待して行われる。
より微細な量子化器のステップサイズのせいで、送信するデータ量がおのずと増加するので、圧縮利得が低減するという点で、この概念には欠点がある。
本発明の目的は、一方では低い量子化の干渉を提供し、他方では高い圧縮利得を得る、量子化器のステップサイズを求める概念を提供することである。
この目的は、請求項1に記載の量子化器のステップサイズを求める装置、請求項8に記載の量子化器のステップサイズを求める方法、または請求項9に記載のコンピュータプログラムにより達成される。
本発明は、以下の知見に基づいている。一方では干渉力をさらに低減させること、そして同時に、符号化利得を増加したり、あるいは少なくとも保存したりすることを、従来技術で行われていたように、より微細な量子化を行うのではなく、導入された干渉が閾値よりも大きい場合でも、少なくともいくつかのより粗い量子化器のステップサイズを試行することにより達成することができることである。より粗い量子化器のステップサイズを用いても、正確にいうとこれらの場合では、より微細な量子化器のステップサイズで行うよりも、より粗い量子化器のステップサイズにより、量子化される値に“ヒット”すると、量子化により導入された干渉を低減することができるということがわかった。この作用は、量子化誤差が、量子化器のステップサイズばかりでなく、量子化される値にも当然依存するという事実に基づいている。量子化される値が、より粗い量子化器のステップサイズそれぞれのステップサイズに非常に近似している場合は、(量子化がより粗いので)圧縮利得を増加させながら、量子化ノイズを低減することになる。
第1の量子化器のステップサイズに対して、非常に良好な推定の量子化器のステップサイズがすでにある場合は、進歩性のある概念は、特に非常に有益である。これに基づいて閾値比較が行われるからである。従って、本発明の好適な実施の形態では、予想される最悪の筋書に基づかないで、平均ノイズエネルギーに基づいて直接算出することにより、第1の量子化器のステップサイズを求めることが好ましい。従って、従来技術による繰り返しループを、今では相当低減することができるし、あるいは、全く用いなくてよいことになる。
次に、量子化される値を“良好にヒットする”という前述の作用を活かすように、実施の形態のさらにより粗い量子化器のステップサイズで、進歩性のある量子化器のステップサイズの後処理を一度だけ試行する。続いてより粗い量子化器のステップサイズから得られた干渉が前の干渉より小さいこと、あるいは閾値より小さいということが判明した場合は、さらにより粗い量子化器のステップサイズを試行して、さらに繰り返してもよい。導入された干渉が再び増加するまで、量子化器のステップサイズを粗くしていくこの手順を続ける。次に、終了条件に達するので、最も小さい導入された干渉として提供した量子化器のステップサイズで量子化を行って、必要な場合は、符号化手順を継続する。
第1の量子化器のステップサイズを推定する、本発明の別の実施の形態では、終了条件に達するまで、従来技術のように合成による分析アプローチを行うこともできる。次に、進歩性のある後処理を用いて、より粗い量子化器のステップサイズを用いて同様に良好な干渉結果、またはさらに良好な干渉結果が得られるかどうか、最後に検証することもできる。導入された干渉に関して、より粗い量子化器のステップサイズが同様に良好である、あるいは、さらに良好であることが判明した場合は、このステップサイズを量子化に用いる。しかしながら、より粗い量子化から、よい作用が得られないことが判明した場合は、例えば分析/合成方法により元々求めてあった量子化器のステップサイズにより、最後の量子化を行うことになる。
従って、本発明によれば、任意の量子化器のステップサイズを用いて、第1の閾値比較を実行することができる。この第1の量子化器のステップサイズが、すでに分析/合成方法により求められているか、または量子化器のステップサイズを直接算出することにより求められているかどうかには無関係である。
本発明の好適な実施の形態では、この概念を用いて、周波数範囲に存在するオーディオ信号を量子化する。しかしながら、この概念を用いて、オーディオ情報および/またはビデオ情報を含む時間領域信号を量子化することもできる。
また、比較に用いる閾値は、心理音響学または視覚心理学的に許容される干渉、あるいは以下に該当する所望の別の閾値であることに注意されたい。例えば、この閾値は、心理音響モデルが提供する実際の許容される干渉であってもよい。しかしながら、この閾値は、オリジナルの量子化器のステップサイズ、あるいは任意の他の閾値に対する、前に求めた導入される干渉であってもよい。
量子化した値は必ずしもハフマン符号化を行った値でなくてよいが、算術符号化等の別のエントロピー符号化を用いて符号化してもよいことに留意されたい。あるいは、量子化した値をバイナリ法により符号化してもよいのは、この符号化も、以下の作用があるからである。より小さい値またはゼロに等しい値送信するためには、より大きい値、つまり、一般にゼロと等しくない値を送信するのに必要なビット数よりも少ない数のビットで送信する必要があるという作用である。
開始値、すなわち、1の量子化器のステップサイズを求めるには、直接ノイズエネルギーを推定することから量子化器のステップサイズを求める場合は、好ましくは、繰り返しアプローチを全て省くこともできるし、または少なくとも大半を省くこともできる。正確なノイズエネルギー推定値から量子化器のステップサイズを算出することが、合成による分析ループで算出することよりも相当速いのは、算出する値が直接存在するからである。符号化に好都合な量子化器のステップサイズが判明するまで、初めから量子化を何回も行って比較する必要はない。
しかしながら、用いられる量子化器特性曲線は非線形特性曲線なので、ノイズエネルギー推定では、非線形特性曲線を考慮に入れる必要がある。単純なノイズエネルギー推定を直線量子化器に用いることがもはやできないのは、これは十分正確でないからである。本発明によれば、次の量子化特性曲線を有する量子化器を用いる。
Figure 2007525716
上記の式では、xiは量子化されるスペクトル値である。開始値はyiと記述されているので、yiが量子化したスペクトル値である。qは量子化器のステップサイズである。Roundは丸め関数である。これは、好ましくはnint関数である。“nint”は、“最近隣数”を表す。量子化器を非線形量子化器にする指数を、αと呼び、これは1ではない。通常、指数αは、1より小さいので、量子化器は圧縮特性を有している。レイヤ3、およびAACでは、指数αは0.75に等しい。パラメータsは、付加定数である。これは、任意の値を有するが、やはりゼロではない。
本発明によれば、次の関係を用いて量子化器のステップサイズを算出する。
Figure 2007525716
αが3/4に等しい場合は、次の式になる。
Figure 2007525716
これらの式では、左側の項は、干渉THRを表す。これは、周波数帯域で許容され、心理音響モジュールが、i1に等しいiからi2に等しいiまでの周波数系列を有するスケールファクタ帯域に提供するものである。上記の式により、1でない指数αを有する上記の量子化器特性曲線を有する非線形量子化器に対して、量子化器ステップサイズqにより導入された干渉を、ほぼ正確に推定することが可能になる。量子化器の式からのnint関数により、次の整数を丸める、実際の量子化器の式を行う。
nint関数の代わりに、所望の丸めを行う任意の丸め関数を用いることもできることに留意されたい。特に、例えば、次の偶数または次の奇数を丸めたり、次の数の10を丸めたりすることなどである。一般に、丸め関数は、特定の数の許容値から、より小さい特定の第2の数の値を有する値の集合までの値をマッピングするものである。
本発明の好適な実施の形態では、ミッド/サイドコーダを起動するようなチャネルであるならば、提供されるものが、例えば、ミッド/サイド符号化へのステレオ信号の場合は、量子化したスペクトル値には以前にTNS処理が行われている。
従って、各スケールファクタ帯域に対するスケールファクタを、直接表すことができ、量子化器のステップサイズとスケールファクタとの間に関係を有するそれぞれのオーディオコーダに供給することができる。これは、次の式から与えられる。
Figure 2007525716
スケールファクタは、次の式から得られる。
Figure 2007525716
本発明の好適な実施の形態では、合成による分析原理に基づいて、後処理を繰り返すことにより用いられるので、実際の最適条件を得られるように、各スケールファクタ帯域に対して量子化器のステップサイズがわずかに異なっている。これは、繰り返しを行わずに直接算出されたものである。
しかしながら、従来技術と比較すると、大多数の場合では、下流側の繰り返しを全て省いてもよいことがわかっているが、開始値を今では非常に正確に算出しているので、これにより短い繰り返しが可能になる。
従って、平均ノイズエネルギーを用いてステップサイズを算出することに基づく好適な概念により、良好で現実的な推定を提供できるのは、従来技術と異なり、予想される最悪の筋書ではなく、量子化誤差の予想値をベースに用いるので、主観的に品質が同等の、ビット数を相当低減した、より効率的なデータ符号化が可能になるからである。また、繰り返しを完全に省くことができ、および/または繰り返し工程数を明らかに低減することができるという事実により、相当速度の速いコーダを達成することができる。これが注目に値するのは、特に、従来技術コーダの繰り返しループが、コーダの全体的な時間要件に対して不可欠であったからである。従って、1つまたはより少ない数の繰り返し工程が低減するとしても、これにより、コーダの全体的な時間を少なからず節減することになる。
添付の図面を参照して、本発明の好適な実施の形態について詳細に説明する。
図1は、量子化したオーディオ信号を求める装置のブロック図である。
図2は、本発明の好適な実施の形態による後処理を示すフローチャートである。
図3は、AAC標準による従来技術のコーダのブロック図を示す。
図4は、量子化器のステップサイズをより粗くして、量子化の干渉を低減する図である。
図5aは、信号を量子化するための量子化器のステップサイズを求める進歩性のある装置のブロック図を示す。
図5bは、信号を量子化するための量子化器のステップサイズを求める進歩性のある装置のブロック図を示す。
図5を参照して、進歩性のある概念について以下に示す。図5は、音声またはビデオ情報を含み、信号入力500を介して提供される信号を量子化するための量子化器のステップサイズを求める装置の概略図を示す。この信号を、第1の量子化器のステップサイズ(QSS)を提供し、以下の導入可能な干渉とも呼ばれる、干渉閾値を提供する手段502に供給する。この干渉閾値は任意の閾値でよいことに留意されたい。しかしながら、好ましくは、これは心理音響または視覚心理学的に導入可能な干渉である。干渉を導入した信号が、人間の聴取者または視聴者から干渉があると知覚されないように、この閾値が選択される。
閾値(THR)とともに第1の量子化器のステップサイズは、第1の量子化器のステップサイズにより導入した実際の第1の干渉を求める手段504に供給される。実際に導入した干渉を求めるには、好ましくは、第1の量子化器のステップサイズを用いて量子化を行い、第1の量子化器のステップサイズを用いて再量子化を行い、オリジナルの信号と再量子化した信号との間の距離を算出することにより行う。好ましくは、スペクトル値を処理する場合は、対応する元々の信号のスペクトル値と再量子化した信号のスペクトル値とを二乗して、次に、二乗した値の差を求める。別の方法で距離を求めてもよい。
手段504は、第1の量子化器のステップサイズにより実際に導入した第1の干渉の値を提供する。この第1の干渉は、閾値THRとともに比較手段506に供給される。手段506は、閾値THRと実際に導入した第1の干渉との比較を行う。実際に導入した第1の干渉が閾値よりも大きい場合は、手段506は、第2の量子化器のステップサイズを選択する手段508を起動する。手段508は、第1の量子化器のステップサイズよりも粗い、すなわち、大きい第2の量子化器のステップサイズを選択するように構成されている。手段508により選択された第2の量子化器のステップサイズは、実際に導入した第2の干渉を求める手段510に供給される。このために、手段510は、オリジナルの信号とともに第2の量子化器のステップサイズを取得して、第2の量子化器のステップサイズを用いた量子化と、第2の量子化器のステップサイズを用いた再量子化と、再量子化した信号とオリジナルの信号との間の距離の算出とを再び行って、実際に導入した第2の干渉の大きさを比較する手段512に供給する。比較手段512は、実際に導入した第2の干渉を、実際に導入した第1の干渉または閾値THRと比較する。実際に導入した第2の干渉が実際に導入した第1の干渉よりも小さい場合、または閾値THRよりも小さい場合は、第2の量子化器のステップサイズを用いて信号を量子化する。
図5に示す概念は単に概略的なものであることに留意されたい。当然、ブロック506および512で比較を行う比較手段を必ずしも別々に設ける必要ないが、そのように制御される1つの比較手段を設けることも可能である。実際に導入した干渉を求める手段504および510にも、同じことがあてはまる。これらについても、必ずしも別々の手段として構成する必要はない。
また、量子化手段を必ずしも手段510から独立した手段として構成する必要はないことに留意されたい。正確にいうと、第2の量子化器のステップサイズにより量子化した信号は通常、手段510が、実際に導入した干渉を求めるために、量子化および再量子化を行ったとき、すぐに手段510で生成される。ここで得られた量子化した値を保存して、比較手段512が正の結果を提供する場合に、量子化した信号として出力してもよいので、量子化手段514があたかも実際に導入した第2の干渉を求める手段510と“統合”したようになる。
本発明の好適な実施の形態では、閾値THRは、心理音響的な方法で求められた最大の導入可能な干渉である。この場合は、信号はオーディオ信号である。ここでは、閾値THRは、心理音響モデルにより提供される。これは、従来の方法で動作し、各スケールファクタ帯域に対して、推定の導入可能な最大の量子化の干渉をこのスケールファクタ帯域に提供する。マスキング閾値と全く同じであるか、またはマスキング閾値から導出されたものであるという点で、最大の導入可能な干渉は、マスキング閾値に基づいている。例えば、安全な間隔を有する符号化を行うという意味である。これは、特に、許容される干渉がマスキング閾値を超えるという意味で、導入可能な干渉がマスキング閾値より小さくなるように、あるいは、ビットレートの低減という点から攻撃的符号化を行うようにするものである。
第1の量子化器のステップサイズを提供する手段502を実施する好適な方法について、図1を参照して説明する。この点で、図2の手段50の機能および図5の手段502の機能は同じである。好ましくは、手段502を、図1の手段10の機能および手段12の機能を有するように構成する。また、図5の量子化器514を、この例における図1の量子化器14と全く同じになるように構成する。
なお、導入された干渉が閾値を超える場合は、より粗い量子化器のステップサイズとなるようにする全手順について、図2を参照して説明する。
また、進歩性のある概念を示す図2の左側の分岐では、導入された干渉が閾値を超えていて、量子化器のステップサイズを粗くしても効果が得られない場合は、そして、ビットレート要件が特に厳格でなく、および/または“ビット節減バンク”にまだいくらか間隙がある場合は、より小さい、すなわち、より微細な量子化器のステップサイズを用いて繰り返し実行することが示されている。
そして、本発明が基づく作用について、図4を参照して説明する。特に、量子化器のステップサイズを粗くするにも関わらず、量子化ノイズを低減して、これに付随して、圧縮利得を増加する作用について、説明する。
図1は、スペクトル値の形でスペクトル表現として与えられる、量子化したオーディオ信号を求める装置を示す。特に、図3を参照すると、TNS処理およびミッド/サイド符号化のいずれも行われなかった場合は、スペクトル値は直接、フィルタバンクの開始値であることに留意されたい。しかしながら、TNS処理だけ行われ、ミッド/サイド符号化を行わない場合には、量子化器1015に供給するスペクトル値は、TNS予測フィルタから生成された、スペクトル残留値である。
ミッド/サイド符号化を含むTNS処理を用いる場合は、進歩性のある装置に供給するスペクトル値は、中央チャネルのスペクトル値、あるいはサイドチャネルのスペクトル値である。
まず初めに、本発明は、図1に10として示す、許容される干渉を提供する手段を含む。図3に図示の心理音響モデル1020は通常、各スケールファクタ帯域、すなわち、スペクトルが互いに隣り合っている、一群のいくつかのスペクトル値に対し、許容される干渉またはTHRとも呼ばれる閾値を提供するように構成され、これは、許容される干渉を提供する手段として動作する。許容される干渉は、心理音響マスキング閾値に基づいており、人間の耳に感知される干渉エネルギーを持たない、オリジナルの音声信号に導入されるエネルギー量を示している。換言すれば、許容される干渉は、(量子化により)人工的に与えられた、実際のオーディオ信号によりマスキングされた、信号部分である。
示される手段10は、周波数帯域に対し、好ましくはスケールファクタ帯域に対し、許容される干渉THRを算出し、これを下流側の手段12に供給するために伝えられる。手段12は、許容される干渉THRを示した周波数帯域に対して、1つの量子化器のステップサイズ情報を算出するものである。手段12は、1つの量子化器のステップサイズ情報qを下流側の量子化手段14に供給するように構成されている。量子化手段14は、ブロック14に示す量子化規格に従って動作する。図1に示す場合では、量子化器のステップサイズ情報を用いて、初めにスペクトル値xiをqの値で除算し、次にその結果を1に等しくない指数αで累乗し、次に、場合によって、付加係数sを加算する。
続いて、この結果が丸め関数に供給され、図1に示す実施の形態では、次の整数を選択する。定義によると、小数点以下を切り捨てることにより、すなわち、“常に切り捨てる”ことにより、整数を再び生成してもよい。あるいは、0.499へ切り捨てて、0.5から切り上げることにより、次の整数を生成してもよい。別の例として、個々の実施例により、“常に切り上げる”ことにより、次の整数を求めることもできる。しかしながら、nint関数の代わりに、一般に、端数を丸める値をマッピングする、任意の他の丸め関数を用いることもできる。これにより、第1の、より大きい値の集合から、第2の、より小さい値の集合へ端数を丸める。
次に、量子化したスペクトル値は、手段14の出力で、周波数帯域に存在することになる。ブロック14に示す式からわかるように、量子化器のステップサイズqの他に、手段14には、検討される周波数帯域内の量子化されるスペクトル値が当然供給されることになる。
手段12は、量子化器のステップサイズqを必ずしも直接算出する必要はないが、別の量子化器のステップサイズ情報として、従来技術の変換ベースのオーディオコーダに用いられるようなスケールファクタを算出してもよいことに留意されたい。スケールファクタは、図1のブロック12の右側に示す関係を介して、実際の量子化器のステップサイズにリンクされている。算出手段がさらに、量子化器のステップサイズ情報として、スケールファクタscfを算出するように構成されている場合には、このスケールファクタを量子化手段14に供給することになる。次に、この手段は、値qの代わりに、21/4scfの値を用いて、ブロック14で量子化の算出を行う。
ブロック12で与えられる形式の導出は、以下に与えられる。
前述のように、ブロック14に示すような指数法則量子化器は、次の関係に従う。
Figure 2007525716
逆演算は、以下に示すようになる。
Figure 2007525716
従って、この式は、再量子化に必要な演算を表している。yiは量子化したスペクトル値で、xiは再量子化したスペクトル値である。さらに、qは、図1のブロック12の右側に示す関係を介して、スケールファクタに対応付けられている、量子化器のステップサイズである。
予想したように、αが1と等しい場合は、結果はこの式と一致している。
上記の式を、スペクトル値のベクトルに対して合計すると、指数iから求められる帯域内の総雑音電力は、次のように与えられる。
Figure 2007525716
要約すると、ベクトルの量子化ノイズ予想値は、量子化器のステップサイズqおよびベクトル成分量分布を記述するいわゆるフォームファクタから求められる。
上記の式でもっとも右側の項であるフォームファクタは、実際の入力値に依存し、程度を変更したい干渉レベルTHRに対して上記の式を算出する場合でも、一回だけ算出すればよい。
すでに述べたように、aが3/4に等しいこの式を、次のように簡素化する。
Figure 2007525716
従って、この式の左側は量子化ノイズエネルギーの推定値であり、これは、aボーダーラインの場合では、許容ノイズエネルギー(閾値)に一致する。
従って、次のアプローチを構成する。
Figure 2007525716
式の右側部分の周波数系列の根の中の合計は、周波数系列の均一性の基準に対応し、エンコーダにおいて、早くから好ましいフォームファクタとして周知のものである。
Figure 2007525716
従って、次のようになる。
Figure 2007525716
ここで、qは量子化器のステップサイズに対応する。AACでは、次のように指定される。
Figure 2007525716
scfはスケールファクタである。スケールファクタを求める場合は、ステップサイズとスケールファクタとの間の関係に基づいて、式を次のように算出することもできる。
Figure 2007525716
Figure 2007525716
従って、本発明は、特定のフォームファクタを有するスケールファクタ帯域に対し、通常心理音響モデルから生成される、特定の干渉閾値THRが与えられるスケールファクタ帯域に対し、スケールファクタscf間の限定された関係を提供する。
すでに述べたように、平均ノイズエネルギーを用いてステップサイズを算出することにより、より良好な予想値を提供するのは、用いるベースが、予想される最悪の筋書を用いるのではなく、量子化誤差の予想値であるからである。
従って、進歩性のある概念は、量子化器のステップサイズおよび/またはこれと同等の、繰り返しを全く行わない、スケールファクタ帯域に対するスケールファクタを求めるのに適している。
しかしながら、算出時間要件がさほど厳格でない場合は、図2に示すように、以下に示す後処理を行うこともできる。図2の第1のステップでは、第1の量子化器のステップサイズが推定される(ステップ50)。図1に示す手順を用いて、第1の量子化器のステップサイズ(QSS)を推定する。続いて、ステップ52で、第1の量子化器のステップサイズを用いて量子化を行う。好ましくは、図1のブロック14に示す量子化器を用いて行う。続いて、次に導入された干渉を算出するように、第1の量子化器のステップサイズで得た値を再量子化する。直ちに、ステップ54で、導入された干渉があらかじめ定義した閾値を超えているかどうか、検証する。
ブロック12で表す関係により算出した、量子化器のステップサイズq(またはscf)は、近似値であることに注意されたい。図1のブロック12で与えられる関係が実際に正確ならば、ブロック54で、導入された干渉が正確に閾値に対応することを確かめる必要がある。しかしながら、図1に示すブロック12の関係の近似値の性質のために、導入された干渉が、閾値THRを下回ることもある。
また、存在するとしても、閾値から導出した値が、特に大きくないことに留意されたい。ステップ54で、第1の量子化器のステップサイズを用いて、導入された干渉が閾値を下回った場合は、すなわち、ステップ54で、問題が否定して答えられる場合は、図3の右側分岐を採用することになる。導入された干渉が閾値を下回る場合は、これは、図1のブロック12の推定値もやはり良くないことを意味しているので、ステップ56で、第2の量子化器のステップサイズより粗い量子化器のステップサイズが設定される。
第1の量子化器のステップサイズと比較して、第2の量子化器のステップサイズをより粗い度合いのものを選択しても良い。しかしながら、比較的小さく増加していくことが好ましいのは、ブロック50の推定値が、いまでは比較的正確であるからである。
第2のより粗い(より大きい)量子化器のステップサイズを用いて、ステップ58で、スペクトル値を量子化し、次に再量子化して、第2の量子化器ステップサイズと対応する第2の干渉を算出する。
次に、ステップ(60)では、第2の量子化器のステップサイズに対応する第2の干渉が、やはりオリジナルの閾値を下回るかどうか、検証を行う。下回る場合は、第2の量子化器のステップサイズを保存して(62)、ステップ(56)で、さらにより粗い量子化器のステップサイズを設定するように、新規に繰り返しを開始する。次に、新規の繰り返しを再び開始するように、さらにより粗い量子化器のステップサイズを用いて、ステップ60、そして場合により、ステップ62を再び行う。ステップ60の繰り返しの間に、第2の干渉が閾値を下回らないと判明した場合は、すなわち、閾値を超える場合は、終了条件に達し、終了条件に達したら直ちに、前回保存した量子化器のステップサイズを用いて、量子化を行う(64)。
第1の推定の量子化器のステップサイズがすでに比較的良好な値になると、推定が十分でない開始値よりも、繰り返しを行う回数を低減する。これにより、符号化する際の、算出時間を著しく節減するのは、量子化器のステップサイズを算出する繰り返しが、コーダの算出時間の最大部分を占めるからである。
導入された干渉が実際に閾値を超える場合に用いられる進歩性のある手順について、図2の左側分岐を参照して以下に説明する。
導入された干渉がすでに閾値を超えているという事実に関わらず、本発明による、さらにより粗い第2の量子化器のステップサイズを設定し(70)、ステップ72で行う第2の量子化器のステップサイズに対応する、第2のノイズ干渉を、量子化し、再量子化し、算出する。その後、ステップ74で、第2のノイズ干渉がやはり閾値を下回るかどうか、検証を行う。下回る場合は、ステップ74の問題が“イエス”として答えられるので、第2の量子化器のステップサイズを保存する(76)。しかしながら、第2のノイズ干渉が閾値を超えていると判明した場合は、保存した量子化器のステップサイズを用いて量子化を行うか、あるいは、もっと良好な第2の量子化器のステップサイズが保存されていない場合は、繰り返しをスキップして、従来技術のように、より微細な第2の量子化器のステップサイズを選択して、閾値を下回る導入された干渉を“押し出す”ことができる。
さらにより粗い量子化器のステップサイズを用いる場合に、特に導入された干渉が閾値を超えている場合でも、やはり向上できる理由について、以下に説明する。いままでのところ、より微細な量子化器のステップサイズにより、より小さい量子化エネルギーが導入されるようになることと、より大きい量子化器のステップサイズにより、より高い量子化干渉が導入されるようになること、という想定に基づいて行ってきた。平均して、これは事実であるが、いつも当てはまるわけではなく、特に、スケールファクタ帯域の密度が低い場合には、そして、特に、量子化器が非線形特性曲線を有している場合には、逆のことが当てはまることもある。本発明によれば、大多数の場合、実際より低く見積もられずに、より粗い量子化器のステップサイズによって、より小さい干渉が導入されてしまうことが判明した。このことは、より粗い量子化器のステップサイズが、より微細な量子化器のステップサイズよりも良好な、量子化されるスペクトル値をヒットする場合もあるという事実について調べることができる。これについて、図4を参照して、以下に説明する。
例示によるが、図4は、0から1の間の入力信号を量子化する場合、量子化特性曲線(60)が4つの量子化段階0、1、2、3を提供することを示している。量子化した値は、0.0、0.25、0.5、0.75に対応している。比較すると、別の、より粗い量子化特性曲線が、点線で図4(62)に示されている。これは、3つの量子化段階しかなく、0.0、0.33、0.66の絶対値に対応している。従って、第1の場合、すなわち、量子化器特性曲線60では、量子化器のステップサイズは0.25と等しくなり、第2の場合、すなわち、量子化器特性曲線62では、量子化器のステップサイズは0.33と等しくなる。従って、第2の量子化器特性曲線(62)は、微細な量子化特性曲線を表す第1の量子化器特性曲線(60)より粗い量子化器のステップサイズを有している。量子化される値xi=0.33について検討する場合は、4つの段階を持つ微細な量子化器を用いて量子化を行う際の誤差は、0.33と0.25との間の差と等しいので、0.08となることが、図4からわかる。対比すると、量子化器が、量子化される値をそのまま正確に“ヒット”するという事実により、3つの段階を用いて量子化を行う際の誤差は、ゼロに等しくなる。
従って、より粗い量子化を行うことは、微細な量子化より小さい量子化誤差となることが、図4からわかる。
また、より粗い量子化が、必要とするより小さい開始ビットレートの決定要因となるのは、4つの段階0、1、2、3を通知する必要がある、より微細な量子化器の場合と異なり、考えられる状態が、3つの状態しかないから、すなわち、0、1、2しかないからである。また、より粗い量子化器のステップサイズは、より微細な量子化器のステップサイズを用いるよりも、より多い値が0に“量子化していく”ことにより、より少ない数の値を“0”に量子化していくという利点がある。1つのスケールファクタ帯域内のいくつかのスペクトル値を検討する場合は、“0に量子化していく”ことにより、量子化誤差が増加するようになるとしても、このことが必ずしも問題にならないのは、より粗い量子化器のステップサイズが、より正確なやり方で、他の、もっと重要なスペクトル値をヒットするからである。よって、他のスペクトル値をより粗く量子化することにより、量子化誤差を相殺して、さらに過補償して、より小さいビットレートを同時に生成する。
換言すれば、全体としては、得られるコーダ結果が“より良好”であるのは、進歩性のある概念により、通知すべき状態の数がより小さい数になり、同時に、量子化段階を“ヒットする”ことが向上するからである。
本発明によれば、図2の左側分岐に示すように、導入された干渉が閾値を超えている場合には、図4を用いて表した作用からメリットを得るように、推定値(図2のステップ50)から開始して、さらにより粗い量子化器のステップサイズを試行している。また、この作用は、図4に示す、2つの直線量子化器特性曲線の場合よりも、非線形量子化器でさらに有効であることが判明した。
従って、量子化器のステップサイズの後処理および/またはスケールファクタの後処理で示した概念は、スケールファクタ推定量の結果を向上させるように作用する。
スケールファクタ推定量(図2の50)で求められる量子化器のステップサイズから開始して、できるだけ大きく、誤差エネルギーがあらかじめ定義した閾値の値を下回る、新規の量子化器のステップサイズが、合成による分析ステップで求められる。
従って、スペクトルが、算出した量子化器のステップサイズを用いて量子化され、誤差信号のエネルギー、すなわち、好ましくは、オリジナルのスペクトル値と量子化したスペクトル値との差の二乗和を求める。あるいは、誤差を求めるには、スペクトル値を用いることが好適であるとしても、対応する時間信号を用いても良い。
これまでに得られた最も良好な結果として、量子化器のステップサイズおよび誤差信号を保存する。算出した干渉が閾値の値を超える場合は、次のアプローチを採用する。
あらかじめ定義した範囲内のスケールファクタは、元々算出した値前後に変化される。特に、より粗い量子化器のステップサイズから構成されるように用いる(70)。
各新規のスケールファクタに対して、スペクトルが再量子化され、誤差信号のエネルギーが算出される。誤差信号がこれまでに算出した最も小さいものより小さい場合は、これまでに得られた最も良い結果として、対応付けられた誤差信号のエネルギーとともに、現在の量子化器のステップサイズはラッチされる。
本発明によれば、特に、量子化器が非線形量子化器である場合は、図4を参照して説明した概念からメリットを得るために、比較的小さいスケーリングファクタだけでなく、比較的大きいスケーリングファクタについてもここで考慮に入れる。
しかしながら、算出した干渉が閾値の値を下回る場合は、すなわち、推定ステップ50で行った推定が悪すぎる場合は、元々算出した値の前後の、あらかじめ定義した範囲内で、スケールファクタを変更することになる。
各新規のスケールファクタに対して、スペクトルは再量子化され、誤差信号のエネルギーが算出される。
誤差信号がこれまで算出した最も小さいものより小さい場合は、これまでに得られた最も良い結果として、対応付けられた誤差信号のエネルギーとともに、現在の量子化器のステップサイズをラッチする。
しかしながら、オーディオスペクトルを符号化するのに必要なビット数を低減するように、比較的粗いスケーリングファクタだけをここで考慮に入れる。
状況に依存して、進歩性のある方法を、ハードウェアまたはソフトウェアで実施しても良い。この方法を実行するようなプログラム可能なコンピュータシステムと協働する、電子的に読取可能な制御信号を有するデジタル記憶媒体、特にディスクまたはCD上で、実施しても良い。
従って、一般に、コンピュータプログラム製品をコンピュータ上で実行する場合は、本発明は、進歩性のある方法を実行するために、プログラムコードを有し、機械読み取り可能なキャリア上に保存した、コンピュータプログラム製品からなる。換言すれば、従って、コンピュータプログラムをコンピュータ上で実行する場合は、本発明は、方法を実行するプログラムコードを有するコンピュータプログラムとして実施することもできる。
量子化したオーディオ信号を求める装置のブロック図である。 本発明の好適な実施の形態による後処理を示すフローチャートである。 AAC標準による従来技術のコーダのブロック図を示す。 量子化器のステップサイズをより粗くして、量子化の干渉を低減する図である。 信号を量子化するための量子化器のステップサイズを求める進歩性のある装置のブロック図を示す。 信号を量子化するための量子化器のステップサイズを求める進歩性のある装置のブロック図を示す。

Claims (10)

  1. オーディオまたはビデオ情報を含む信号を量子化するための量子化器のステップサイズを求める装置であって、
    第1の量子化器のステップサイズおよび干渉閾値を提供する手段(502)と、
    前記第1の量子化器のステップサイズにより第1の導入された干渉を求める手段(504)と、
    前記第1の量子化器ステップサイズにより前記導入された干渉を前記干渉閾値とを比較する手段(506)と、
    前記第1の導入された干渉が前記干渉閾値を超える場合は、前記第1の量子化器のステップサイズより大きい第2の量子化器のステップサイズを選択する手段(508)と、
    前記第2の量子化器のステップサイズにより第2の導入された干渉を求める手段(510)と、
    前記第2の導入された干渉と前記干渉閾値または前記第1の導入された干渉とを比較する手段(512)と、
    前記第2の導入された干渉が前記第1の導入された干渉より小さい場合、または前記干渉閾値より小さい場合は、前記第2の量子化器のステップサイズを用いて前記信号を量子化する手段(514)とを備える、装置。
  2. 前記信号がオーディオ信号であって、前記オーディオ信号のスペクトル表現であるスペクトル値を含み、前記提供手段(502)が、心理音響的にマスキングされた閾値に基づいて、周波数帯域に対し、許容される干渉を算出する心理音響モデルとして構成されている、請求項1に記載の装置。
  3. 前記第1の導入された干渉を求める前記手段(504)または前記第2の導入された干渉を算出する前記手段(510)が、量子化器のステップサイズを用いて量子化を行い、前記量子化器のステップサイズを用いて再量子化を行い、前記再量子化した信号と、前記導入される干渉を得るための前記信号との間の距離の算出を行うために構成されている、請求項1または請求項2に記載の装置。
  4. 前記第1の量子化器のステップサイズを提供する前記手段(502)が、次の式に従って、前記量子化器のステップサイズを算出するために構成され、
    Figure 2007525716
    量子化手段(514)が、次の式に従って、量子化を行うように構成され、
    Figure 2007525716
    iが、量子化されるスペクトル値であり、qが、前記量子化器のステップサイズ情報を表し、sが、ゼロと異なる値またはゼロと等しい値で、aが、“1”と異なる指数で、roundが、第1の、より大きい範囲の値から、第2の、より小さい範囲の値までマッピングする丸め関数で、
    Figure 2007525716
    (THR)が、前記許容される干渉で、iが、前記周波数帯域におけるスペクトル値に対する実行指数である、請求項1ないし請求項3のいずれかに記載の装置。
  5. 前記導入された干渉が、前記許容される干渉より小さい場合は、前記選択手段(508)がさらに、より大きい量子化器のステップサイズを選択するために構成されている、請求項1ないし請求項4のいずれかに記載の装置。
  6. 前記提供手段(502)が、分析/合成判定結果として、前記第1の量子化器のステップサイズを提供するために構成されている、請求項1ないし請求項5のいずれかに記載の装置。
  7. 前記選択手段(508)が、別の周波数帯域に対する量子化器のステップサイズと独立して、1つの周波数帯域に対する量子化器のステップサイズを変更するために構成されている、請求項1ないし請求項6のいずれかに記載の装置。
  8. 前記提供手段(502)が、前記量子化器のステップサイズを粗くすることによる前の繰り返しステップの結果として、前記第1の量子化器のステップサイズを求めるために構成され、前記干渉閾値が、前記第1の量子化器のステップサイズを求める前記前の繰り返しステップにおける、導入された干渉である、請求項1ないし請求項7のいずれかに記載の装置。
  9. オーディオまたはビデオ情報を含む信号を量子化するための量子化器のステップサイズを求める方法であって、
    第1の量子化器のステップサイズおよび干渉閾値を提供し(502)、
    前記第1の量子化器のステップサイズにより第1の導入された干渉を求め(504)、
    前記第1の量子化器のステップサイズにより前記導入された干渉と、前記干渉閾値とを比較し(506)、
    前記第1の導入された干渉が前記干渉閾値を超える場合は、前記第1の量子化器のステップサイズより大きい第2の量子化器のステップサイズを選択し(508)、
    前記第2の量子化器のステップサイズにより第2の導入された干渉を求め(510)、
    前記第2の導入された干渉と前記干渉閾値または前記第1の導入された干渉とを比較し(512)、
    前記第2の導入された干渉が、前記第1の導入された干渉より小さい場合、または前記干渉閾値より小さい場合は、前記第2の量子化器のステップサイズを用いて前記信号を量子化する(514)ことを含む、方法。
  10. コンピュータプログラムをコンピュータ上で動作する場合は、請求項9に記載の方法を実行するプログラムコードを有するコンピュータプログラム。
JP2007501150A 2004-03-01 2005-02-17 量子化器のステップサイズを求める装置および方法 Active JP4531805B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004009955A DE102004009955B3 (de) 2004-03-01 2004-03-01 Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
PCT/EP2005/001652 WO2005083681A1 (de) 2004-03-01 2005-02-17 Vorrichtung und verfahren zum ermitteln einer quantisierer-schrittweite

Publications (2)

Publication Number Publication Date
JP2007525716A true JP2007525716A (ja) 2007-09-06
JP4531805B2 JP4531805B2 (ja) 2010-08-25

Family

ID=34745332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007501150A Active JP4531805B2 (ja) 2004-03-01 2005-02-17 量子化器のステップサイズを求める装置および方法

Country Status (17)

Country Link
US (2) US7574355B2 (ja)
EP (1) EP1687810B1 (ja)
JP (1) JP4531805B2 (ja)
KR (1) KR100852481B1 (ja)
CN (1) CN1922656B (ja)
AT (1) ATE386320T1 (ja)
AU (1) AU2005217508B2 (ja)
BR (1) BRPI0507229A (ja)
CA (1) CA2557777C (ja)
DE (2) DE102004009955B3 (ja)
ES (1) ES2302185T3 (ja)
HK (1) HK1093596A1 (ja)
IL (1) IL176688A (ja)
NO (1) NO338935B1 (ja)
PT (1) PT1687810E (ja)
RU (1) RU2329549C2 (ja)
WO (1) WO2005083681A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009530653A (ja) * 2006-03-13 2009-08-27 フランス テレコム 音源信号を符号化するための方法、対応する符号化装置、復号方法および装置、信号、コンピュータプログラム製品
JP2013525829A (ja) * 2010-04-09 2013-06-20 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004009955B3 (de) 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7702161B2 (en) * 2005-10-28 2010-04-20 Aspeed Technology Inc. Progressive differential motion JPEG codec
US8655652B2 (en) 2006-10-20 2014-02-18 Dolby International Ab Apparatus and method for encoding an information signal
KR101149448B1 (ko) * 2007-02-12 2012-05-25 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
CN101308655B (zh) * 2007-05-16 2011-07-06 展讯通信(上海)有限公司 一种音频编解码方法与装置
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8559742B2 (en) * 2008-10-10 2013-10-15 Accusoft Corporation Image encoding methods and apparatus providing improved visual results
EP2707873B1 (en) 2011-05-09 2015-04-08 Dolby International AB Method and encoder for processing a digital stereo audio signal
US20130132100A1 (en) * 2011-10-28 2013-05-23 Electronics And Telecommunications Research Institute Apparatus and method for codec signal in a communication system
WO2013113351A1 (en) * 2012-01-30 2013-08-08 Nokia Siemens Networks Oy Processing a signal in station apparatus
CN104412512B (zh) * 2012-06-21 2017-05-24 三菱电机株式会社 编码装置、解码装置、编码方法以及解码方法
CN105723454B (zh) * 2013-09-13 2020-01-24 三星电子株式会社 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备
WO2019049543A1 (ja) * 2017-09-08 2019-03-14 ソニー株式会社 音声処理装置、音声処理方法及びプログラム
KR102589303B1 (ko) * 2017-11-02 2023-10-24 삼성전자주식회사 고정 소수점 타입의 뉴럴 네트워크를 생성하는 방법 및 장치
DE102018112215B3 (de) * 2018-04-30 2019-07-25 Basler Ag Quantisiererbestimmung, computerlesbares Medium und Vorrichtung, die mindestens zwei Quantisierer implementiert
US10762910B2 (en) 2018-06-01 2020-09-01 Qualcomm Incorporated Hierarchical fine quantization for audio coding
US11701278B2 (en) 2019-08-23 2023-07-18 Hill-Rom Services. Inc. Technologies for efficiently tracking the location of a patient bed
TWI726822B (zh) 2019-10-08 2021-05-01 創未來科技股份有限公司 訊號轉換裝置
CN115052309A (zh) * 2021-03-09 2022-09-13 中兴通讯股份有限公司 干扰检测方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07225598A (ja) * 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JPH0944198A (ja) * 1995-07-25 1997-02-14 Victor Co Of Japan Ltd 音声の準可逆符号化装置
JP2007522511A (ja) * 2004-02-13 2007-08-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ符号化
JP2007522509A (ja) * 2004-02-13 2007-08-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 情報信号を量子化するための方法および装置
JP2007522510A (ja) * 2004-02-13 2007-08-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ符号化

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751736A (en) * 1985-01-31 1988-06-14 Communications Satellite Corporation Variable bit rate speech codec with backward-type prediction and quantization
EP0267344B1 (en) * 1986-10-30 1993-09-01 International Business Machines Corporation Process for the multi-rate encoding of signals, and device for carrying out said process
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5542008A (en) * 1990-02-28 1996-07-30 Victor Company Of Japan, Ltd. Method of and apparatus for compressing image representing signals
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US5664057A (en) * 1993-07-07 1997-09-02 Picturetel Corporation Fixed bit rate speech encoder/decoder
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5754742A (en) * 1995-05-12 1998-05-19 Intel Corporation Setting quantization level to match DCT coefficients
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP3784993B2 (ja) * 1998-06-26 2006-06-14 株式会社リコー 音響信号の符号化・量子化方法
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
TW499672B (en) * 2000-02-18 2002-08-21 Intervideo Inc Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders
EP1377070A4 (en) * 2001-03-28 2010-08-11 Sony Corp QUANTIZATION DEVICE, QUANTIZATION PROCESS, QUANTIZATION PROGRAM AND RECORDING MEDIUM
WO2002082425A1 (en) * 2001-04-09 2002-10-17 Koninklijke Philips Electronics N.V. Adpcm speech coding system with specific step-size adaptation
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US20040002859A1 (en) * 2002-06-26 2004-01-01 Chi-Min Liu Method and architecture of digital conding for transmitting and packing audio signals
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
JP2008000002A (ja) * 2004-09-30 2008-01-10 Sysmex Corp リブロース2リン酸カルボキシラーゼスモールチェーン1A(RBCS−1A)遺伝子及び/又は該遺伝子のmRNAを検出するための核酸増幅用プライマ、及び内部標準として該遺伝子及び/又は該遺伝子のmRNAを用いた検査方法。
US7668715B1 (en) * 2004-11-30 2010-02-23 Cirrus Logic, Inc. Methods for selecting an initial quantization step size in audio encoders and systems using the same
JP4765521B2 (ja) * 2005-09-30 2011-09-07 株式会社日立製作所 可変利得増幅器
JP4921180B2 (ja) * 2006-01-25 2012-04-25 キヤノン株式会社 放射線検出装置及び放射線撮像システム
JP4554561B2 (ja) * 2006-06-20 2010-09-29 株式会社シマノ 釣り用グローブ
US8655652B2 (en) * 2006-10-20 2014-02-18 Dolby International Ab Apparatus and method for encoding an information signal
US8204744B2 (en) * 2008-12-01 2012-06-19 Research In Motion Limited Optimization of MP3 audio encoding by scale factors and global quantization step size

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07225598A (ja) * 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JPH0944198A (ja) * 1995-07-25 1997-02-14 Victor Co Of Japan Ltd 音声の準可逆符号化装置
JP2007522511A (ja) * 2004-02-13 2007-08-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ符号化
JP2007522509A (ja) * 2004-02-13 2007-08-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 情報信号を量子化するための方法および装置
JP2007522510A (ja) * 2004-02-13 2007-08-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ符号化

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009530653A (ja) * 2006-03-13 2009-08-27 フランス テレコム 音源信号を符号化するための方法、対応する符号化装置、復号方法および装置、信号、コンピュータプログラム製品
JP2013525829A (ja) * 2010-04-09 2013-06-20 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
US9111530B2 (en) 2010-04-09 2015-08-18 Dolby International Ab MDCT-based complex prediction stereo coding
US9159326B2 (en) 2010-04-09 2015-10-13 Dolby International Ab MDCT-based complex prediction stereo coding
US9378745B2 (en) 2010-04-09 2016-06-28 Dolby International Ab MDCT-based complex prediction stereo coding
US9761233B2 (en) 2010-04-09 2017-09-12 Dolby International Ab MDCT-based complex prediction stereo coding
US9892736B2 (en) 2010-04-09 2018-02-13 Dolby International Ab MDCT-based complex prediction stereo coding
US10276174B2 (en) 2010-04-09 2019-04-30 Dolby International Ab MDCT-based complex prediction stereo coding
US10283127B2 (en) 2010-04-09 2019-05-07 Dolby International Ab MDCT-based complex prediction stereo coding
US10283126B2 (en) 2010-04-09 2019-05-07 Dolby International Ab MDCT-based complex prediction stereo coding
US10347260B2 (en) 2010-04-09 2019-07-09 Dolby International Ab MDCT-based complex prediction stereo coding
US10360920B2 (en) 2010-04-09 2019-07-23 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US10475460B2 (en) 2010-04-09 2019-11-12 Dolby International Ab Audio downmixer operable in prediction or non-prediction mode
US10475459B2 (en) 2010-04-09 2019-11-12 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US10553226B2 (en) 2010-04-09 2020-02-04 Dolby International Ab Audio encoder operable in prediction or non-prediction mode
US10586545B2 (en) 2010-04-09 2020-03-10 Dolby International Ab MDCT-based complex prediction stereo coding
US10734002B2 (en) 2010-04-09 2020-08-04 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US11217259B2 (en) 2010-04-09 2022-01-04 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US11264038B2 (en) 2010-04-09 2022-03-01 Dolby International Ab MDCT-based complex prediction stereo coding
US11810582B2 (en) 2010-04-09 2023-11-07 Dolby International Ab MDCT-based complex prediction stereo coding

Also Published As

Publication number Publication date
KR100852481B1 (ko) 2008-08-18
KR20060121973A (ko) 2006-11-29
AU2005217508A1 (en) 2005-09-09
CA2557777A1 (en) 2005-09-09
US7574355B2 (en) 2009-08-11
PT1687810E (pt) 2008-05-23
EP1687810B1 (de) 2008-02-13
EP1687810A1 (de) 2006-08-09
CA2557777C (en) 2012-07-31
US20060293884A1 (en) 2006-12-28
CN1922656A (zh) 2007-02-28
US8756056B2 (en) 2014-06-17
NO338935B1 (no) 2016-10-31
RU2006130966A (ru) 2008-03-20
WO2005083681A1 (de) 2005-09-09
WO2005083681A8 (de) 2008-03-27
US20090274210A1 (en) 2009-11-05
RU2329549C2 (ru) 2008-07-20
DE502005002824D1 (de) 2008-03-27
DE102004009955B3 (de) 2005-08-11
CN1922656B (zh) 2010-04-14
ES2302185T3 (es) 2008-07-01
IL176688A (en) 2011-01-31
IL176688A0 (en) 2006-10-31
NO20064439L (no) 2006-11-29
BRPI0507229A (pt) 2007-06-26
AU2005217508B2 (en) 2008-05-15
HK1093596A1 (en) 2007-03-02
ATE386320T1 (de) 2008-03-15
JP4531805B2 (ja) 2010-08-25

Similar Documents

Publication Publication Date Title
JP4531805B2 (ja) 量子化器のステップサイズを求める装置および方法
KR100814673B1 (ko) 오디오 부호화
KR101953648B1 (ko) 오디오 신호 디코딩 또는 인코딩을 위한 시간 도메인 레벨 조정
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
US7340391B2 (en) Apparatus and method for processing a multi-channel signal
KR100852482B1 (ko) 추정을 결정하는 방법 및 장치
EP1600946A1 (en) Method and apparatus for encoding/decoding a digital signal
MXPA05000653A (es) Codificacion de audio de baja tasa de transferencia de bitios.
KR20080049116A (ko) 오디오 코딩
KR101754094B1 (ko) 고급 양자화기
KR100813193B1 (ko) 정보 신호의 양자화 방법 및 장치
WO2003107329A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR101363206B1 (ko) 인터채널과 시간적 중복감소를 이용한 오디오 신호 인코딩
KR100848370B1 (ko) 오디오 부호화
US8825494B2 (en) Computation apparatus and method, quantization apparatus and method, audio encoding apparatus and method, and program
US9202454B2 (en) Method and apparatus for audio encoding for noise reduction
US7181079B2 (en) Time signal analysis and derivation of scale factors
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
KR101789085B1 (ko) 분포 양자화 및 코딩을 사용하는 오디오 신호 엔벨로프의 분할에 의한 오디오 신호 엔벨로프 인코딩, 처리 및 디코딩을 위한 장치 및 방법
JP4273062B2 (ja) 符号化方法、符号化装置、復号化方法及び復号化装置
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
EP3008726A1 (en) Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding
JP3886851B2 (ja) オーディオ信号符号化装置
KR100640833B1 (ko) 디지털 오디오의 부호화 방법
MXPA06009932A (en) Device and method for determining a quantiser step size

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100217

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100601

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100609

R150 Certificate of patent or registration of utility model

Ref document number: 4531805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250