JP4954087B2 - 平方値に線形従属する計算結果の表示を生成する方法 - Google Patents

平方値に線形従属する計算結果の表示を生成する方法 Download PDF

Info

Publication number
JP4954087B2
JP4954087B2 JP2007545932A JP2007545932A JP4954087B2 JP 4954087 B2 JP4954087 B2 JP 4954087B2 JP 2007545932 A JP2007545932 A JP 2007545932A JP 2007545932 A JP2007545932 A JP 2007545932A JP 4954087 B2 JP4954087 B2 JP 4954087B2
Authority
JP
Japan
Prior art keywords
spectral
bit
value
representation
logarithmic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007545932A
Other languages
English (en)
Other versions
JP2008523450A (ja
Inventor
マルク ゲイヤー
マンフレード ルツキ
マルクス ローヴァッサー
サッシャ ディスヒ
ジョーハン ヒルペアト
シュテファン ガヤーズベアガー
ベルンハルト グリル
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2008523450A publication Critical patent/JP2008523450A/ja
Application granted granted Critical
Publication of JP4954087B2 publication Critical patent/JP4954087B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/544Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/499Denomination or exception handling, e.g. rounding or overflow
    • G06F7/49942Significance control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/499Denomination or exception handling, e.g. rounding or overflow
    • G06F7/49936Normalisation mentioned as feature only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/544Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
    • G06F7/5443Sum of products
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Description

本発明は、例えば、心理音響モデルに従って、該周波数グループの信号エネルギーを使ってさらなる符号化を行い、周波数グループを形成するために、周波数ラインを組み合わせ、一部の音声エンコーダで必要とされる数値グループの平方和のような、平方値に線形従属する計算結果の表示の生成に関する。
MPEGレイヤ3またはMPEG AACのような、フィルタバンクベースの近年の音声符号化方法では、エンコーダ中で心理音響モデルが使われる。この心理音響モデルでは、周波数レンジに変換された音声信号のスペクトルは、周波数グループ毎にさまざまな幅、および/またはさまざまな数の周波数ラインを持つ個別の周波数グループに分割される。心理音響可聴閾値の計算、中央/サイドのステレオ符号化を使うべきかどうかの判断、および、音声エンコーダの量子化モジュール中のスケール係数の評価、および/または計算のため、該心理音響モデルにおいて個々の周波数グループ中の音声信号部分の信号エネルギーが計算される。これは、各個別の周波数ラインを平方し、これよりライン別のエネルギーを得、次いで、個別周波数グループ中のすべてのラインエネルギーの和からその周波数グループのバンドエネルギーが形成される。そのエネルギー数は、MPEG AACの場合、音声チャンネルあたり約40〜60とすることができる。
以下に、固定小数点プロセッサにおいて、このような方法を実行する特定のアプリケーションを検討することにする。
固定小数点表示において、周波数ラインは、例えば、24ビットまたは32ビットのワード幅で表される。16ビットのワード幅では不十分である。グローバルスケーリング係数またはシフト係数が使われるが、これは、あるエンコーダ内で処理される、ある音声チャンネルの全周波数ライン、さらにそのエンコーダ内で処理される全音声チャンネルの全周波数ラインに適用され、元のスケーリングを再現するため各周波数ライン値のポジションをいくつ左または右にシフトする必要があるかを定めるもので、これをブロック浮動小数点表示という。これは、少なくとも一つの音声チャンネルのすべての周波数ラインは、等しくゲート出力され、および/または同じスケーリングレベルにされるということである。個別周波数ライン振幅の一般的に大きなダイナミクス幅から考えると、この方式では、例えば、一部の周波数ラインは、24ビットのワード幅で有効ビットが22、または32ビットのワード幅で有効ビット30といった比較的高い精度で表示され、他方のラインでは、これほどの有効ビットが取れず、従ってかなりの低精度で表示されることになる。
前述のフィルタバンクベースの固定小数点プロセッサによる音声符号化方法の実行では、下記のような問題が生じることになる。
第一に、信号エネルギー自体の表示に関する問題がある。周波数ラインの平方の合計である信号エネルギーは、平方計算を使っているため、全体の精度を維持しようとすれば元の周波数ラインの倍のダイナミクスを得ることになってしまう。
信号エネルギーを表すのに実にさまざまな実現性がある。一つのやり方は、周波数ラインの表示に使われたデータタイプのワード幅の倍のワード幅を持つデータタイプ、すなわち、例えば、48ビットまたは64ビットのワード幅を持つデータタイプによる信号エネルギー表示である。例えば、24ビットのデータタイプで表示される22の有効ビットを持つある周波数ラインを考えてみよう。周波数ラインを併せた合計信号エネルギーは、少なくとも44の有効ビットを有し、および、48ビットのデータタイプによって表示することができよう。しかしながら、このやり方は、少なくとも64ビットのエネルギー、すなわち、周波数ラインが32ビットデータタイプで表される場合に対しては使えない、というのは、従来型のほとんどの固定小数点プロセッサは、64ビットデータタイプを全くサポートしていないか、さもなければ、64ビットデータタイプを使ったメモリアクセス動作および計算するのが、例えば、32ビットのアクセス動作および計算と比べて極端に遅いからである。さらに、64ビットデータの場合メモリ消費が大幅に増えることになる。
信号エネルギー表示の別の実現性は、仮数と指数との手段を使った浮動小数点データによる表示である。再度、24ビットデータタイプで表された有効ビット22の周波数ラインの前述の例を考えてみる。この場合、それぞれのグループの信号エネルギーは、符号ビットを含む16ビットの仮数と8ビットの指数とを備えた、標準的な、または、独自仕様の浮動小数点データタイプによって表されることになろう。ここで、データタイプが、IEEE−P754のような標準的浮動小数点データタイプか、任意に選定された仮数および指数幅を持つ独自の浮動小数点データタイプであるかは問わない。浮動小数点計算ユニットを持たない固定小数点プロセッサにおいては、浮動小数点データタイプの計算は、必ずいくつかの計算ステップが競合し、従って極度に遅くなるので、このやり方は使えない。
固定小数点プロセッサによる、前述のフィルタバンクベースの音声符号化の実行におけるさらなる問題の分野は、符号化法の過程における信号エネルギーの再処理である。信号エネルギー、および、これから導かれた可聴閾値は、例えば、信号エネルギーと可聴閾値との間の比率または指数の計算をするために、アルゴリズムのさまざまな多くの箇所において、音声エンコーダの追加的ルーティン中に使用される。固定小数点プロセッサで、必要な除算を実施するのは容易ではない。
固定小数点プロセッサで除算を行う一つの実現性は、シングルビット除算命令を使うことであり、これは、一部の固定小数点プロセッサに備えられ、コールの都度、商に追加精度ビットを補充する。これによれば、例えば、48ビット精度の除算を行うため、2つの信号エネルギーの間、または、信号エネルギーと可聴閾値との間の一回の除算に対し、48回の個別除算命令が必要なことになろう。これには、高い計算時間コストが必要で非常に非効率的で、実用性がない。
固定小数点プロセッサで除算を実施する別の実現性は、除算結果の精度を向上させるための後続の反復ステップと関連させてもよい、表の使用である。しかしながら、このやり方は、必要な除算結果精度を得るため、非常に大きな表を使う必要があり、また、これにより大量の計算時間が要求されるので多くの場合実用性はない。
前述の両方の方法を、固定小数点プロセッサで、固定小数点データタイプ、またはソフトウエア毎にエミュレートされた浮動小数点データタイプに関連させて使用することができるが、同時に存在する結果の精度と共に、計算時間およびメモリ消費に関し十分に効率的な使用法を提供することはできない。
GPP(General Purpose Processor、汎用プロセッサ)を使った場合、前述の問題は生じないであろう。しかしながら、多くの用途において、浮動小数点計算ユニットのない固定小数点プロセッサよりも高い性能を備えたプロセッサの使用は、高価格が重荷となり、部品数も多くなることから、自動的に問題外となる。こういった用途の例として携帯電話およびPDA類がある。
米国特許第6,754,618B1号は、信号エネルギーと可聴閾値との間の比率の計算であるSMR計算の問題に対応しており、固定小数点DSPチップの状況に取り組んでいる。この中で提案されているやり方によれば、最初に、通常の窓処理と、その後の音声信号をそのスペクトル成分へ分解するためのフーリエ変換とが行われ、次いで、それぞれの周波数ラインの値の実数部と虚数部とから、各入力信号、および/または周波数ライン信号のエネルギー、すなわち、ラインエネルギーが計算される。周波数ラインのグループの信号エネルギーの生成をさらに行わなくても、これらのグループの信号エネルギーに基づけば、この方法を続けて行くことができる。上記文書に書かれているのは、ほとんどの固定小数点DSPチップが備えるデータ幅は16〜24ビットしかないのに、MPEG規格では、101dBのダイナミックレンジに対応する34ビットのデータ幅が要求されることになるため、エネルギーである入力データのほとんどが過大なダイナミックレンジを有するとの問題が生じ、これを除去しようとする試みである。従って、まず、エネルギーをスケーリングすることが必要になる。具体的には、今までのやり方と異なり、2つの異なるスケーリング値を用いるという提案がされている。さらに詳しくは、上記文書によれば、対数レンジに変換され、対数レンジに転換された計算結果を16ビットで十分表すために、さらに、16ビットの対数レンジでSMR比を計算できるようにするために、エネルギーは、閾値と比較され、上下それぞれの向きにスケールされる。上向きまたは下向きどちらへのスケーリングを行うのかによって、異なる閾値テーブルが使われる。対数化について、dB単位が得られるように、10倍した常用対数が用いられる。上向きにスケールされたラインエネルギーを対数化した結果がゼロの場合、該上向きにスケールされたラインエネルギーの対数から、閾値エネルギーの対数を10倍した値をマイナスすることによって、SMR比を計算がされることになる。それ以外の場合は、上向きにスケールされたラインエネルギーと下向きにスケールされたラインエネルギーとは、相互に組み合わされる。
米国特許第6,754,618B1号で提案されたやり方は、対数レンジでSMR比の計算を提案することによって、信号エネルギーの再処理に関する前述の問題の一部を回避している。これによって、複雑な除算計算が除去される。しかしながら、このやり方では、16ビットDSP固定小数点プロセッサに適した16ビット固定小数点表示に対する値のレンジは、対数計算の後でしか設定されず、その前に、大きなダイナミクス幅を持つエネルギーに対し、こういった対数化が行われ、このため、エネルギー値毎に事実上2つの対数計算を行う必要が生じ、相対的に見ると対数計算が依然として複雑である、という不利点がある。
従って、ダイナミクスの損失を生じさせないで、対数レンジへの変換を簡明にすることが望まれる。
米国特許第5,608,663号は、対数固定小数点フォーマットへ変換し、対数レンジで加算し、続いて逆変換するという方法による、浮動小数点数字の並行乗算の高速実行を取り扱っている。
米国特許第5,197,024号は、指数/対数計算と関連装置とを全体として取り扱っている。
米国特許第6,732,071号は、音声符号化のレート制御、および、終了条件を伴ったループ反復計算を使った量子化パラメータ値の算定に対する効率的対処法を取り扱っており、該算定法によれば、量子化パラメータは、最大周波数ライン値に基づく項の基底2対数(logarithm dualis)から導き出された項と比較される。
米国特許第6,351,730号は、音声符号化におけるゲイン計算に対する基底2対数の使用について記載している。ゲイン値は、MDCT符号化音声コーデックにおけるビット配分に使われる。
米国特許第6,351,730号は、音声信号エネルギーの表示への自然対数の使用について記載している。対数レンジへの変換についての詳細説明はされていない。
米国特許第6,754,618号 米国特許第5,608,663号 米国特許第5,197,024号 米国特許第6,732,071号 米国特許第6,351,730号
本発明の目的は、平方値に線形従属する計算結果の表示を、より単純化され、より低いハードウエアコストで可能な計算によって生成する方法および装置を提供することである。
この目的は、請求項1による音声エンコーダ、および請求項20による音声符号化方法によって達成される。
平方値に線形従属する計算結果の表示を生成するための本発明の装置であって、該計算結果は対数化されてないxビットで表示されており、前記装置は、
該値に線形従属する計算結果を得るために、対数化されていない値のxビット表示の処理を行う処理手段であって、該処理手段は、計算結果が該実効スケーリング係数に基づいてスケールされるように、実効スケーリング係数を用いるために、構成されている処理手段と、
計算結果のyビットによる表示に対し対数関数を適用するための対数化手段であって、該計算結果は対数化されておらず、対数化された計算結果のスケールされた表示、および/またはスケールされた計算結果の対数化表示を得るために、前記処理手段による処理作業から直接的あるいは間接的に、例えば、ビットポジションから選出するなどして得られたものであり、yはxの2倍より小さい、対数化手段と、
スケールされた対数表示に対し補正値を加算、減算をそれぞれ行うための再スケーリング手段であって、前記補正値は、実効スケーリング係数を適用されたスケールされた対数のような対数関数に対応し、スケール化された対数計算結果の表示を得るための再スケーリング手段とを含む。
本発明の発見は、対数レンジへの転換においては、平方値に線形従属する計算結果の全ビット幅を対象にする必要はない、ということである。すなわち、xビットより少ない計算結果の表示でも対数表示を得るベースとして十分なように、xビット値の計算結果をスケールすることが可能である。得られた対数表示に対するスケーリング係数の影響については、スケーリング係数に適用された対数関数によって得られた補正値を、スケールされた対数表示に加算または減算することによって、一切のダイナミクスの損失なく、キャンセルすることができる。
従って、本発明の一つの利点は、本発明の方法では、複数の計算結果を、引き続き、ダイナミクスを実質的に維持しながら、それらのすべてに対するスケーリングレベルが同一になるように、対数表示に変換することができることである。
本発明のある実施形態によれば、xビットの値表示の処理内容は、該値に線形従属する計算結果を得るために、値のグループの平方和を生成する。しかしながら、平方和の計算後に実効スケーリング係数を適用する代わりに、その前にもxビット表示は、共通スケーリング係数でスケールされる。共通スケーリング係数は、値の数から、および/またはxビット値の表示グループの中の有効ポジションの最大数を使って算定される。このやり方によって、xビットの値表示の始めの状態から、変わらずに、xビット表示フォーマットを維持することができる。このことは、個々の値の平方、およびそれら個別平方値の和にも同様に適用される。ここで、共通スケーリング係数は、合計した結果の平方和がオーバーフローを起こさないように設定される。この実施形態によれば、平方和の対数が取られるのでなく、xビット表示のある部分に対して対数関数が実行される。また、この実施形態においても、いくつかの値グループに対し、一方で、個々のグループの値が、異なる共通スケーリング係数でスケールされ、他方で、それらのすべての平方和の対数表示に対して、後のスケーリングレベルが同一になるようにするやり方が、いくつかの値のグループに対して使えるという利点は維持されている。
本発明の別の好適な実施形態によれば、1/yより小さいかこれと等しい係数と共に、対数関数として基底2対数が使われる。こうすれば、計算結果のyビット表示と、計算結果のスケールされた対数化表示との間のマッピングを、両方の表示の値範囲を最適に利用しながら実施することが可能になる。
本発明の別の実施形態によれば、音声符号化のため、グループのスペクトルライン値が、グループ毎に、前述のやり方で平方和を生成しやすい。すなわち、平方和を計算する前に、これらスペクトルライン値はスケーリングされ、得られた単一の平方値を合計することによって、周波数ライン値は対数化されていないxビット固定小数点データフォーマットで表されており、これらもまたxビット固定小数点データフォーマットで表されなければならないが、基底2対数による対数化と1/xより小さいかこれと等しい係数によるスケーリングとを含む対数関数を該平方値の和に適用し、対数関数により共通スケーリング係数から得られた補正値を、対数化された上記計算結果のxビット固定小数点表示に加算または減算する。このようにして、すべてのスペクトルグループの個別のエネルギーは、ダイナミクスを減ずることなく同一のスケーリングレベルに維持される。さらに、xビットの固定小数点数値だけを処理するために構成された計算ユニットの手段によって、各々の演算を実施することができる。従って、この実施形態には、音声符号化を16または24ビットの固定小数点DSPで、計算時間コストの増大を伴う複雑なプログラミングを必要とせず、音声符号化を実行することができるという利点がある。
以下に、添付の図面を関連させながら、本発明の好適な実施形態についてさらに詳しく説明する。
図1は、32ビット固定小数点データフォーマットの構成を示す概略図である。
図2aおよび2bは、64ビットの計算結果に対し、過小な値の影響を示すための32ビット固定小数点データ値の平方計算の概略図である。
図3は、本発明の実施形態による対数関数のグラフである。
図4は、本発明の実施形態による、平方和を生成するための装置の概略ブロック図である。
図5は、図4の装置の可能な構成のブロック図である。
図6は、図5による装置の機能を示すフローチャートである。
図7は、本発明の実施形態による音声エンコーダを示す概略ブロック図である。
以下に、図面を参照し、しばしば、音声信号処理、特に音声信号の符号化を背景として本発明を説明する。図面の説明を追って詳細な説明をすることになるが、本発明は、この用途分野に限定されるものでなく、この背景設定が理解促進の上で大いに役立つからである。
本発明の実施形態をさらに詳細に説明する前に、以下に、図1〜3を参照しながら、一種の概観説明、また以降の実施形態をよりよく理解するための手助けでとして、これら実施形態の導入説明を行う。
図2は、あり得る32ビット固定小数点データフォーマットの構成を示し、これは、以下に説明する実施形態の典型的ベースとなる。示された32ビットのデータフォーマットは、他のビット数にも容易に適用することができる。図から分かるように、32ビット固定小数点データフォーマットに格納された値は、32ビットを含む。従って、32ビットレジスタは、32ビット固定小数点データフォーマットのこの値を格納するのに十分なものである。このようなレジスタを10として示す。最下位ビット(LSB)から最上位ビット(MSB)までX0…X31の番号を付された個々の二乗によって、32のビットのポジションが示唆されている。該32ビット固定小数点データフォーマットに従って、個々のビットポジションの意味が、個別ビットポジションの下に示唆されている。図からわかるように、最重要ビットは、正負符号、すなわち、+または−、を表している。残りのビットX30−X0は、値の大きさを表わす。図1の実施形態によれば、これらのビットは、真の小数(true fraction)を表す、すなわち、データフォーマット10は小数固定小数点データフォーマットであり、慣例的に、点またはカンマは、最左ポジション、すなわちX30ビットの左側に置かれている。従って、レジスタ10中の値は次のように表すことができる。
Figure 0004954087
容易に分かるように、小数固定小数点データフォーマットの表示可能な値範囲は、おおむね、もっぱら−1〜1の幅となる。
本発明の導入部分で説明したように、信号エネルギーは、例えば、ある周波数グループ中の周波数ラインを平方しすべての平方化周波数ラインを合計することによって、ラインエネルギーとして得られる。周波数グループに包含されるラインの数は、MPEGレイヤ3およびMPEG AACの例では、4〜96個の範囲にわたる。
これも本発明の導入部で説明したように、ある音声チャンネルのすべての周波数ライン、さらには、あるエンコーダの中で処理されるすべての音声チャンネルのすべての周波数ラインに適用されるグローバルなスケーリング係数であって、元のスケーリングを再現するため、復号器側で、各周波数ラインの値をどの位のポジション左右にシフトするのかを設定する係数を使って、固定小数点データフォーマット中の周波数ライン値を表すことが可能である。このような32ビット固定小数点データフォーマットを、32ビットワード幅を持つ固定小数点プロセッサ上で音声信号エネルギーの計算のため平方の合計に使うためには、周波数ラインからの音声信号エネルギーの計算を効率的に実施するため、以下の基本的要件が満たされなければならない。
− 周波数ラインが、32ビットのワード幅で表されていること。16ビットでは不十分である。
− 音声信号エネルギーも、固定小数点データフォーマットで表されており、浮動小数点データフォーマットではないこと。
− 音声信号エネルギーは、32ビット以下のワード幅を有するデータタイプで表されていること。これにより、音声信号エネルギーのための32ビットのワード幅に結果として生じる。
以下に説明する本発明のいくつかの特定の実施形態は、これらすべての基本要件を満たすが、これらすべての要件が満たされているのでなければ、実施効率が低下する可能性がある。後記で説明するが、例えば、音声信号エネルギーのワード幅を32ビットに制限することが絶対に必要なのではない。音声信号の再処理が32ビットの固定小数点表示に限定されるだけである。
前記の要件から、音声信号エネルギーの計算で以下のような問題が生じる。32ビットの周波数ライン値を平方することで、64ビットのワード幅を持つラインエネルギーが最初に生成されるが、32ビット、以下の実施形態の場合は低位の32ビットは、以下の処理においては放棄され、上位32ビットだけについて小数計算が継続される。
これを例示するために、図2aおよび図2bを参照する。これらの図は、入力被乗数レジスタ12aおよび12bに同一の値を書き込むことで、平方器として使われる乗算器の2つの入力レジスタ12aおよび12bを示す。レジスタ12aおよび12b双方は、32ビットレジスタである。さらに、図2aおよび12bは、上位部分14aおよび下位部分14bで構成される64ビットの出力レジスタ14を示す。
図2aおよび2bに表されていない乗算器は、32ビット固定小数点データフォーマットにおけるレジスタ12aおよび12bのレジスタ内容を読み取り、2つの値を乗算16して64ビットの計算結果を生成するために構成されており、該計算結果は64ビット固定小数点データフォーマットの出力レジスタ14の中に出力される。従って、出力レジスタ14の上位部分14aは、カンマの後の始めの31個のバイナリポジションをカバーし、下位部分14bは残りのバイナリポジションをカバーする。
図2aと図2bとは、入力レジスタ12aおよび12bに異なる周波数ラインの値が書き込まれ、出力レジスタ14にも異なる計算結果が生成されている状況が示されている。
図2aは、0x12345678と周波数ライン値が高い状況を具体的に示している。高いレベルの周波数ライン値が調整出力されれば、すなわち、32ビットデータワード中を多数の有効ビットが占めているならば、出力レジスタ14中の、実際上の64ビット幅の計算結果の上位32ビットは、計算結果、および/または平方値を表示するために十分な精度を持つ。誤差は、仮に図2aの場合で言えば、0x00000003be9b080といった値にしか達しないような計算結果に、上位部分14aだけが使われた場合に発生する。
図2bは、入力レジスタ12aおよび12bにそれぞれに小さな周波数ライン値、0x00004321、が入っているケースを示す。このような周波数ライン値は、すなわち、既に記載したように、少なくとも一つの音声チャンネルの、すべての周波数ラインがあるグローバルスケーリング係数を持ち、これにより、典型的には、多数の周波数ラインが32ビットデータワード中の少数の有効ビットしか占めない状況、すなわち、振幅が小さい状況でも生じる。図2bを見ると分かるように、小さな周波数ライン値の場合には、出力レジスタ14の上位の32ビットは、十分な精度で平方計算結果を表さない。従って、信号エネルギー値を形成するために、そのようなラインエネルギーをいくつか合計することは、具体的には、不正確な計算結果、例えば、ゼロ、をもたらすことになり、音声符号化の後の進行において音声品質の低下を招くことになる。図2bの例においては、実際の結果値は0x0000000023349482であるが、出力レジスタの上位部分はゼロの計算結果を示すことになる。
図2aおよび2bの例を参照すると、信号エネルギーの次の処理において、まず、出力レジスタ14の64ビットすべてのビットを対象とする必要があるように見える。しかしながら、これは、複雑な64ビット演算、すなわち、64ビットのオペランドの演算が必要となり、前記の効率的実行についての基本的要件に反することになる。
しかしながら、出力レジスタ14中の、各信号エネルギーの上位32ビットだけを実際に使うことにする場合、平方計算をする前に周波数グループ中のすべての周波数ライン値を同じビット数左へシフトし、これにより計算結果として64ビット計算結果の上位32ビット部分の中により多数の有効ビットが含まれるようにするか、あるいは、結果レジスタ14中の計算結果をシフトする改善を、始めに実施することができる。
次いで、信号エネルギーのそれぞれの上位部分14aに対し、対数関数計算のための計算ユニットを、各信号エネルギー値の上位部分14aに適用することによって、対数レンジに変換することができよう。該計算ユニットは、32ビット固定小数点データ値を得るために、32ビット固定小数点データ値の対数を取る能力だけを持たせることができよう。値xを値yに変換する対数関数を、y=log2(x)/64とすることができ、その関数グラフを図3に示す。図3は、該対数関数のx∈ ]0,1[の対応範囲だけを示しており、32ビット固定小数点データフォーマットでの平方信号エネルギー値に対しては唯一適切なものである。ここで、スケーリング係数1/64は、出力値の対象範囲も、可能な最小値、すなわち、2-63(符号のため最低限1ビットは留保される)のエネルギー信号値単位で処理できることを確実にし、該出力範囲は、固定小数点表示の場合、図3の対数関数に従い対数化された値であるエネルギー信号値が、64ビット固定小数点値であっても、もっぱら−1〜1の間に分布する。
しかしながら、このやり方は十分満足できるものではない、というのは、エンコーダ内の音声符号化の後の処理ステップにおいてすべての信号エネルギーが必ず同一のスケーリングレベルでなければならず、これにより、左へのシフト、および/または精度向上のスケーリング係数は、まさしくこの同一スケーリングレベルとは相いれないものだからである。
まさしくこの点において、対数化することの肯定的な効果が示される。前記のように、周波数ライン、および/または振幅領域において、ビットポジションを左へ、例えば、s個シフトする所定方法によって、および/または、信号エネルギー領域において、前記の安全距離に達する実効的な22sのスケーリングを行うことによって、ラインエネルギーの表示を最高の精度にする。一時的に、この周波数グループで行われる左シフトの数、すなわち値sを銘記しておくことにする。図3中に示された対数関数、以下これをLD64()という、による信号エネルギー値は、前記のように高い精度で計算されたものであり、この値は対数レンジ、−以下LD64フォーマットとも呼ぶ−、に変換されても、同様に可能な最高の精度を有する。この周波数ライン値を左へ1ビットシフトするのは、例えば、リニアな非対数レンジにおいて、すなわち、平方後に、信号エネルギーを左に2ビットシフトするのに等しく、またこれは、2/64=log2(22)64=LD64(22)なので対数レンジに2/64を加算することに等しい。
LD64フォーマットにおける信号エネルギーの元のスケーリングを回復するために、2*s/64の減算だけを実行すればよく、sは、前に銘記したグループの周波数ラインの左シフト数に相当する。しかしながら、この減算は、線形レンジにおける右シフトの場合と同様に、有効ビットの喪失、および/またはシフトアウトは生じないので、精度の低下は起こらない。従って、信号エネルギーは、LD64フォーマットで表され、以下で説明するように、これには、高い精度とすべての信号エネルギー値に対し同一のスケーリングとを使って後の音声後の符号化の各種計算を行える利点がある。
上記で、本発明の実施例の原理と利点とを論じてきたので、以下では、本発明のこれらの好適な実施形態について、図4〜7を参照しながらさらに詳細に説明する。
図4は、一方でダイナミックレンジを維持しつつ他方でハードウエアコストを合理的範囲に保つ、N個のxビット固定小数点値のグループの平方和を計算するための装置の概略図を示す。該装置は前述の構想に基づく。
以下これを20で表す図4の装置は、Nビットの固定小数点値を格納するためのxビットのレジスタグループ221、222…22Nと、可調整の実効スケーリング係数によってスケールされた非対数レンジ値におけるレジスタ221〜22N中の平方和を算定するための平方和手段24と、平方和手段24からの計算結果を取り込むための第一の結果レジスタ26と、結果レジスタ26中の計算結果をLD64フォーマットに変換するための対数化手段28と、対数化手段28の計算結果を取り込むための第二の結果レジスタ30と、結果レジスタ30中の計算結果の再スケーリング、および/または再スケーリングの逆変換を行うための再スケーリング手段32と、再スケーリング手段32の出力を受けて最終計算結果を取り込むための出力レジスタ34と、平方和手段24により行われたスケーリングが再スケーリング手段32の再スケーリングによって逆変換されることを確実にし、共通スケーリング係数をさらに算定するための制御手段36とを含む。
装置20の個別構成要素について説明したので、次に、平方和の生成における、これらの協働について説明するものとし、各々の作用はそれぞれ矢印で示される。
前述したように、平方和の対象となる値は、最初に、xビットの固定小数点フォーマットで、レジスタ221〜22N中に存在する。これも前述したように、周波数ライン値とするこれらの値は、これらの有効ビットの数に関して相互に明確に分岐することができる。
次いで、平方和手段24は、それらの平方和を生成するために、レジスタ221〜22N中のこれら値を受信し、これらレジスタ221〜22Nの値の平方和は、制御手段36が少なくとも間接的に調整できる実効スケーリング係数によってスケールされ、最終的に、固定小数点表示でレジスタ26に送る。ここで、平方和手段24の平方和計算結果の書き込み先である結果レジスタ26は、必ずしも2xのビットを有する必要はない。レジスタ26の一部に点線表示で示したように、平方和手段24が、計算結果のyビット固定小数点表示を供給すれば十分であり、望ましくはy=xである。
以下に、具体的な2つの実現性を取り上げ、平方和手段24が、スケールされた計算結果をレジスタ26中に出力するために、どのようにして制御手段36からスケーリング係数の情報を取り入れるのか、また、制御手段36は、有効ビットが失われたりオーバーフローしたりすることなくレジスタ26中の計算結果がスケールされるような、スケーリング係数情報、および/または実効スケーリング係数をいかにして設定できるのかを示すことにする。
前記の記載に基づけば、第一の実現性は、レジスタ221〜22N中の値の後の平方値の合計によってオーバーフローが生じないよう、前もって実効的なスケール値を算定するために、レジスタ221〜22Nの内容を分析する制御手段36から成る。前記のようなオーバーフローが存在しないようにするには、図4に38で示す、平方和手段24の加算ユニット中にオーバーフロービットがあり得ないようにするか、または、いくら遅くとも、「オーバーフローした」平方、および/またはエネルギー値が、レジスタ26の場合のように、絶対にオーバーフローが出ないメモリセル中に書き込むしかない。従って、制御手段36は、Nの数の、およびレジスタ221〜22N中の自由ビットの最大数、および/またはxからレジスタ221〜22N中の個別値の有効ポジションの最大数を差し引いた差に基づいて、レジスタ26への出力にオーバーフローが発生しないように、および/または計算結果がもっぱら−1〜1の範囲を外れないように、スケーリング係数を調整する。
具体的には、前述のように、制御手段36は、実効スケーリング係数を調整し、該係数によって、共通スケーリング係数を介してレジスタ26中の計算結果がスケールされる。共通スケーリング係数は、当初に、すなわち、平方計算40の前に、平方和手段24が、レジスタ内容221〜22Nをスケールする際に用いたものである。具体的には、前で説明したように、共通スケーリング係数は、2の指数に対応させ、左シフト演算によって、レジスタ221〜22N中の値のスケーリングを進展させることができる。この場合、前述のように、平方和手段24は、計算結果をレジスタ26に出力するため、2x固定小数点データフォーマットで個別のスケールされたレジスタ内容の平方計算40中間結果を、加算38する必要はなく、平方和手段24は、中間平方計算結果421…42Nのyビット固定小数点表示を必要とするだけである。すべての中間平方計算結果421〜42Nを合計38した平方和手段24の最終計算結果が、レジスタ26中に生成される。
スケーリング係数を算定し取り入れるためのさらに別の実現性では、まず、2x固定小数点データフォーマットによる中間計算結果421〜42Nを得るために、平方和手段24は、レジスタ内容221〜22Nを順次に平方計算40する。同結果は、次いで平方和手段24によって加算38されることになる。後者が、計算結果を結果レジスタ26に入力する前に、平方和手段24による2xビットの平方和結果での各ビットの数によって左へシフト演算の対応を実行するために、不使用ビットの数、および/または制御手段36によって、2xと有効ポジションとの差に対して、2x固定小数点平方和計算が検査される。このやり方の最初に述べた方法と比べての不利点は、平方計算手段24における内部での計算負担が増えることである、というのは、値421〜42Nを2xのワード幅で処理しなければならず、具体的には、この形で合計38をする必要があるからである。このため、より高い処理能力を持つ加算ユニットが必要となるか、あるいは、オーバーフロービット割り当てを持つyビット固定小数点データフォーマットの加算ユニットをより頻繁に制御しなければならない。この実現性においては、平方和手段24は、まず、レジスタ221〜22N中の値を個別に平方し、次いで、2xビット固定小数点平方値421〜42Nを合計38し、その後に、制御手段36からのスケーリング係数情報に従って計算結果をスケールし、それをレジスタ26に出力する。
望ましくはx=24ビットで実行される実施形態において、レジスタ26は、y=2xのポジションの長さを持つ。望ましくはx=32ビットで実行される別の実施形態において、421〜42Nのレジスタ中での平方計算において、早急に、平方計算中、またはその後直ちに、だが、該レジスタに結果が収納される前に、x個のポジションへのポジション低減が行われる。次いで、xビットのワード幅を使って合計が行われる。従って、ここで、レジスタ26は、y=xだけのポジションを含む。対数化手段も同様に、望ましくはx個のポジションを含む。
実効スケーリング係数の手段を使って、結果レジスタ26中の有効ビット数をほぼ最適に調整することができる。次に、対数化手段28は、yビット固定小数点表示値をレジスタ26から受信し、必要な場合、残っている高精度部のビットポジションを割除し、その結果をzビット固定小数点データフォーマットの形でレジスタ30に入力するために、該表示値を前に図3に関連して説明したLD64フォーマットに変換する。ここで望ましくはz=yであり、望ましくはy=xである。
結果レジスタ30中の計算結果は、レジスタ221〜22Nの値の平方和のスケールされた対数表示を表す。次いで、再スケーリング手段32が、レジスタ30中のスケールされた値から、補正値44を減算することによって、逆スケーリングを行い、該補正値は、制御手段36から受信したものである。LD64フォーマットの場合、前記のように補正値は、LD64(s)の値となる、ここで、sは結果レジスタ26中の平方和がスケールされた実行スケーリング係数である。
次いで、計算結果は、再スケーリング手段32によって、固定小数点データフォーマットの形でレジスタ34に出力される。
図4を参照しながら、可能なハードウエア実行形態にさらに踏み込むことはなく、本発明の好適な実施形態の機能の大まかな概要を説明した。図5は、図4の装置の可能な実行形態をもう少し詳しく示す。大まかに60に示す図5の装置は、メモリ62と、制御手段64と、シフト手段66と、平方器68と、加算器70と、対数化器72と、除算器74と、減算器76とを含む。すべてのモジュール62〜76は、例えば、バス、またはその他のプログラムインタフェース78と連通接続されている。手段66〜76については、ハードウエアに構成できるが、それぞれの作業を実施させるために、それぞれ制御手段64によって実行するプログラムコードの一部とすることもできる。モジュール66〜76には、xビット固定小数点データフォーマットのオペランドだけを処理する能力をもたせるものとする。モジュール66〜76の中で、モジュール66〜70は平方和手段80を形成し、対数化器72と除算器74とは、対数化手段82を形成するために、組み合わされる。
例えば、制御手段64は、プログラム制御であり、xビットのメモリ域841…84Nのメモリ62中に、xビット固定小数点データフォーマットの形で保存された対象値の平方和を生成させる。制御手段64の正確な機能について図6を関連させながら説明する。ここで、特に、メモリ域841〜84N中のxビット固定小数点値は、周波数グループの周波数ライン値であると想定する。
最初に、制御手段100は、メモリ域841〜84N中のグループの周波数ライン値を検査して共通スケーリング係数を調整する。前に説明したように、ステップ100におけるこの調整は、Nの数と、メモリ域841〜84N中の不使用ビットポジションの最小数とに基づいて行われる。具体的には、同手段は、共通スケーリング係数を2sのように2の累乗で調整する。あるいは、制御手段64は、シフト値sを調整し、該シフト値は共通スケーリング係数2sに相当する。制御手段は、内部または外部の取り込みレジスタ101に値、sまたは2sを入力する。
次のステップ102において、制御手段64は、シフト手段66に、グループの周波数ライン値を含むメモリ域841〜84Nの内容を、共通スケーリング係数、および/またはシフト値に従ったs個のビットポジションによって左にシフトさせる。
ステップ104において、制御手段64は、次いで、平方器68に、メモリ域841〜84N中の各値を平方させ、得られた2xビットの計算結果の上位半分を、それぞれのメモリ域841〜84N中に逆書き込みさせる。平方器68は、例えば、乗算器であり、制御手段104が、メモリ域841〜84Nからのそれぞれの平方計算対象値を、該乗算器の両方のxビットの被乗数レジスタに書き込むようにする。平方器の内部には、例えば、2xビットの計算結果レジスタを含め、一方、制御手段64は、上位半分すなわちxビットの固定小数点平方値だけが、それぞれのメモリ域841〜84N中に逆書き込みされるのを確実にさせるようにすることができる。これに代えて、平方器は、前もってxビットの表示一つだけを計算し、従ってxビット出力レジスタ一つだけを持つようにする。
この後、ステップ106において、制御手段64は、加算器70を使って、メモリポジション841〜84Nのすべての内容の通算和を生成する。これを最初の2つの値の和から開始し、計算結果を、xビット固定小数点データフォーマットでxビットの合計レジスタ86中に書き込むことができる。その後、制御手段64は、後続の値を順々にメモリポジション86に加えるために、加算器70を使い、得られた合計をメモリ域86の各々の以前の値に上書きするなどできよう。あるいは、制御手段64は、合計がメモリポジション841〜84Nの一つの中に書き込まれ、そこに累積されるのを確実にするようにしてもよい。
ステップ108において、制御手段64は、メモリ域86の中の和の対数計算をするために、次いで、対数化器72に命令し、その後、除算器74に計算結果を64で除算させる。対数化器72による中間結果は、例えば、メモリ域86中に逆書き込みされ、例えば、除算器74の計算結果についても同様である。除数が2の累乗指数の場合、除算器は、単純なシフト手段として構成されることになる。
前記により、ステップ108の後、メモリ域86には、スケールされた平方和の対数化された表示が存在する。これにより、ステップ110において、制御手段は、メモリ域86において除算され対数化された値から、ラッチ101に格納されているスケーリング係数s、すなわち、値2*s/64に基づく値を減算させるために、減算器76に命令する。
以上、本発明の好適な実施形態を、図4〜6を関連させて説明したので、次に、音声エンコーダについての実施形態を説明することとし、この中には、これら実施形態による装置が実装される。
大まかに150で示す図7の音声エンコーダは、変換手段152と、グループエネルギー計算手段154と、符号ストリーム生成器156とを含み、これらは、エンコーダ150の入力部158と出力部160との間に直列につながれている。符号ストリーム生成器156は、心理音響モデル162を用い、例えば、入力部158からの符号化対象音声信号164から重要でない情報を除去し、その程度は、出力部160からの符号化データストリームの音響品質には僅かな影響しかないか全く影響のないレベルである。図7には示していないが、符号ストリーム生成器156を、フィードバックパスを介して変換手段152、またはグループエネルギー計算手段154に結合しておくこともできよう。
入力部158での音声信号164は、例えば、所定のサンプリング周期でサンプルされた音声サンプリング値のシーケンスの形で存在する。例えば、音声信号164をPCMフォーマットとすることができよう。164において、音声信号は、時間tに沿ったプロットで表されており、縦軸は、任意の単位の振幅Aを表す。
次の変換手段152は、音声信号164をそのスペクトル成分に分解することにより、音声信号164を時間レンジからスペクトルレンジに変換する。変換手段152を、具体的に、例えば、32個のバンドパスフィルタを有する分析フィルタバンクで構成することができる。もっと正確に言えば、変換手段152は、セクション毎に音声信号164をスペクトル成分に分解する。スペクトル成分分解実施の対象セクション、またはフレーム166は、時間的に、例えば、50%オーバーラップされる。変換手段152によって生成されるスペクトル分布168中で、図の点線域で示された連続する各々のフレームに対して、各スペクトル成分毎にスペクトル値、および/または周波数ライン値が生成される。このように、周波数ライン値グループのシーケンスから、スペクトル成分毎に周波数ラインが生成され、これら周波数ラインは水平矢印168で示されており、166に示された3つだけのフレームに対する周波数ライン値グループが縦に分けられている。スペクトル分布168において、任意の数の周波数ラインが、スペクトル軸または周波数軸fに沿って配列される、但し、実際の周波数ラインの数は図よりは多い。
このように生成されたスペクトル分布168に基づいて、符号ストリーム生成器156は、符号化されたデータストリームを生成する。しかしながら、これを行うため、符号ストリーム生成器156は、スペクトル成分のスペクトル分解のすべては必要とはせず、または、常にすべては必要としない。周波数ライングループは、心理音響的な側面から、丸で囲んで示したようにグループ170に分けられる。
各々のグループ170に対する符号ストリーム生成のため、符号ストリーム生成器156は、次いでフレーム166の各々に対する関連する具体的な信号エネルギー値、すなわち、振幅値の平方和、つまり、周波数ライン値の平方和を必要とする。
この計算は、グループエネルギー計算手段154によって行われる。該手段は、周波数ラインの各々のグループ170の信号エネルギーを、周波数ラインの平方和として計算し、グループエネルギー計算手段154は、例えば、図4および5に示されたように、および/または、図4〜6に記載された機能として構成される。グループエネルギー計算手段154の計算結果は、信号エネルギー値のシーケンス172、すなわちグループ170毎に一つのシーケンス172となる。従って、信号エネルギーのシーケンス172は、フレーム166毎に一つの信号エネルギー値を有しており、該フレームは矢印172に沿った点線によって示される。
次いで、これら信号エネルギー値のシーケンス172に基づき、符号ストリーム生成器156は、心理音響モデル162をベースとして符号化データストリーム160生成する。ここで、手段156による信号エネルギー値の再処理による一つの利点は、周波数ライン値が表されていたのと同じビット数を有する固定小数点データフォーマットの形の値が得られるばかりでなく、これらの値が対数レンジ形式で得られることにある、というのは、このレンジによって、乗算、累乗、および除算の演算が、対数レンジでのより簡単な加算/減算、および乗算/除算に転換されて、より容易な計算実行が可能になるからである。
これを説明するために、図7のエンコーダがMPEGデータストリームを出力するケースを考えてみる。
図7の音声エンコーダは、例えば、MPEG AACエンコーダである。このケースでは、符号ストリーム生成器156は、TNS(temporal noise shaping、時間領域雑音整形)モジュールを含み、これにより符号ストリーム生成器156は、エネルギー重み付きスペクトルを効率的に計算する。具体的には、TNSモジュールは、x=1/√SEの形式で信号エネルギーの計算を行う。これは、グループエネルギー計算手段154により用いられる、対数フォーマットLD64の形の信号エネルギーにより容易に達成できる。TNSモジュールは、XをLD64-1(−LD64_SE>>1)の形で簡単に計算する。ここで、a>>bは、左側のaオペランドを、右側のbのビット数により、右へシフトすることを示し、LD64-1()は対数関数LD64()の逆関数であり、LD64_SEは、グループエネルギー計算手段154が出力する対数LD64フォーマットでの信号エネルギー値である。従って「>>1」は、1ビット右側にシフトすることを表し、これは2で除算することに相当する。対数レンジで行われる2による除算は、線形レンジの平方根計算に相当する。負の符号は、線形レンジにおける逆関数1/xに相当する。LD64-1関数の計算は、累乗根を計算し計算結果の逆数を取るよりも簡単に実行でき、この計算は、線形レンジにおいて信号エネルギーが符号ストリーム生成器156に供給された場合などに必要なものである。
符号ストリーム生成器156は、符号化されたMPEG4 AACデータストリームも生成することができ、PNS(perceptual noise substitution、知覚ノイズ置換)モジュールを含む。PNSモジュールは、その中で可聴閾値と周波数グループ170における信号エネルギーとの間の距離を計算する。ノイズ置換が可能で実施すべきか否かを具体的に判断は、PNSモジュールは、可聴閾値と信号エネルギーとの間の距離の手段によって判断する。グループエネルギー計算ユニット154から出力される信号エネルギーの対数表示のダイナミクスの大きさ、および関連精度と、これも対数表示LD64の形で提供される、符号ストリーム生成器156の中の可聴閾値とは、正確なPNS判定のための必須の寄与要素である。具体的には、PNSモジュール中のコヒーレンス関数において、Y=SE1/√(SE2・SE3)の形による除算と根計算が行われ、ここで、SE1、SE2、およびSE3は、グループエネルギー計算手段154によって出力された信号エネルギーである。信号エネルギーの対数表示により、この計算は大幅に容易になり速くなる。具体的には、符号ストリーム生成器156中のRNSモジュールは、以下の式を計算することにより、LD64_Y、すなわち、LD64フォーマットのYの計算を行うことができる。
LD64_Y=LD64_SE1−((LD64_SE2+LD64_SE3))>>1)
ここで、LD64_#は、グループエネルギー計算手段154から出力されるそれぞれの信号エネルギーSE#の対数表示である。
また、符号ストリーム生成器156は、例えば、中央/サイド符号化の判断を行う中央/サイド(CS)ステレオモジュールを含む。このCSモジュールでは、中央/サイドの符号化を使うべきか否かの判断のため、数多くの除算、すなわち、可聴閾値から信号エネルギーへの計算が行われる。グループエネルギー計算手段154から出力されるLD64フォーマットを用いることによって、これらの判断は簡単な減算に変換される。CS符号化の使用閾値は定数なので、ソースコードで前もって対数レンジに変換しておくことができ、こうすれば、プログラムのランタイムにその計算時間を加える必要はない。このことは、LD64の計算に関連する変形コードに使われる数多くの定数にも適用される。前記は、MPEGレイヤ3、またはAACエンコーダのインテンシティステレオモジュールに特に適用される。
符号ストリーム生成器156には、ラウドネスの計算を行うスケール係数推定器をさらに含めることができる。スケール係数推定器は、例えば、符号ストリーム生成器156の量子化モジュールの中に配置され、その中では、可聴閾値の4乗根の計算、すなわち、ラウドネスの計算が実行される。対数データフォーマット、すなわち、LD64を使って、可聴閾値を表示することによって、この4乗根の計算は、対数表示閾値を単に右へ2ビットシフトすることで極めて効率よく実施することができる。また、逆のステップ、すなわち、4のインボリューションも2ビット左へシフトすることで非常に簡単に実施することができる。
符号ストリーム生成器156のスケール係数推定器で、さらに、例えば、変形可聴閾値LTと信号エネルギーSEとから、量子化ステップ幅の一部を成すスケール係数SCFを計算することができる。該計算は、SCF=log(k*LT/SE)の形の計算ステップを含み、log()は常用対数であり、kは定数である。この計算を、LD64フォーマットと方式に対応する変換とを使って、非常に簡潔かつ効率的に行うことができる。スケール係数推定器は、具体的には、SCF=log(k)+log2*64*(LD64_LT−LD64_SE)といった計算を実施することになろう。
符合ストリーム生成器156内で使用できるモジュール類の前記の例は、対数データフォーマットLD64の使用によって固定小数点プロセッサの効率向上が促進されることを示すためのものである。多くのケースにおける対数データフォーマットLD64は、特定の音声品質が不十分な場合を除き、使われるほとんどのプラットフォーム上で高い音声品質のオーディオコーディックを実現する。
符合ストリーム生成器156の中で可能なモジュール類についての前記の例は、信号エネルギー、および可聴閾値の処理において、ほとんどの計算ステップが除算または乗算を使って行われるので、信号エネルギー、可聴閾値、およびその他エネルギー値を対数データフォーマットで表示することは極めて適応性が高いことを具体的に示している。これにより、除算は減算に、乗算は加算に変換され、前述の対数データフォーマットの手段を使って、音声エンコーダにおいて、信号エネルギーおよび可聴閾値の効率的表示と処理とが得られる。線形レンジ、すなわち、非対数レンジにおける信号エネルギーは、−1.0〜+0.99999…の値範囲の小数固定小数点データフォーマットで表示される。
前記の実施形態では、2を基底とした対数、基底2対数LDが使われた。基底2対数においては、線形レンジにおける0.25の信号エネルギー値は、−2のLD値に相当する。線形レンジでの0.3の信号エネルギー値は、−1.7369656のLD値に相当する。固定小数点プロセッサでは、通常、整数値、または小数値のいずれかを表示できるが、その混在は表示できない。そこで、前述の実施形態では、LD64フォーマットとの関連で、小数値だけが得られるようにLD値がスケールされた。当然ながら、整数値だけが得られるようにスケーリングを選択する別のやり方もあろう。係数1/64によるスケーリングについては、特に、この係数が64ビットまでのワード幅すべてに適用でき、これにより、標準的なワード幅の48ビット、および32ビットをカバーできるので選定した。1/64でスケールされた基底2対数、すなわち、LD64フォーマットの計算は、y=log2(x)/64=LD64(x)式に従って行われる。移植性の広さを犠牲にすれば、当然、この係数を増大、すなわち、1/yを増大することもできよう、ここで、yは対数化する前のスケールされた平方和のビット数である。
図3は、前記対数関数のグラフを示す。ここで対数関数の特徴を認識することができ、対数レンジの固定小数点表示では、入力値xが小さくなる(0.0により近くなる)ほど、実際上は低精度になり、より多くの出力値y、すなわち、低分解度のyを提供し、また、値が大きくなるほど、すなわち、−1.0に近づくほど固定小数点表示の精度が増す。前記の実施形態によれば、平方計算の前に共通スケーリング係数、および/または共通シフト値を適用することによって、対数レンジに転換する前の信号エネルギーの計算での精度の低下が回避された。
従って、図7の実施形態は、信号エネルギーおよび可聴閾値の表示と処理に対して、心理音響モデル、および/または量子化モジュールにおける、スケールされた、場合によっては、スケールなしの対数データフォーマットを用いるエンコーダを表す。なお、基底2対数、および1/64によるスケーリングについての前記の説明内容は、あくまでも単なる例である。どのようなケースでも、この対数表示は、中央/サイド判断モジュールおよび量子化モジュールのスケール係数推定器におけるような、数多くの計算をより速く達成するために役立つものである、すなわち、前に説明したように、対数フォーマットを使用することによって、実施されている除算が簡単な減算に変換され、固定小数点プロセッサはこれを何倍も速く計算できる。同じことが平方根、4乗根などの計算のような根計算にも適用され、これらは簡単な右シフトに変換される。対数レンジへの変換に使われる計算負担は、アルゴリズムの後のステップにおける速度向上利得ではるかに上回って補償される。従って、前記の実施形態の利点は、具体的には、対数表示使用による処理速度の向上はもとより、対数で表された値の精度の高さである。
なお、前記の記載内容に関し、本発明は、固定小数点データフォーマットに限定されない。値の平方和の生成に関する前記の実施形態は、固定小数点データフォーマットでなく整数データフォーマットで表された値に対しても合理的に適用できる。この場合、2xビットの平方和計算結果の高位値のyビットが対数化に使われることになろう。
前記の実施形態によれば、1/64のスケーリングが行われる対数関数が用いられた。この係数は、同一の符号化が異なるプラットフォームで、異なる固定小数点データフォーマットを使って実行される場合に合理的である。但し、対数関数中の該係数が単にxより大きくなる、すなわち、平方の合計に加算される値のビット数より大きくすることも可能である。
なお、前記の実施形態に関し、本発明は、平方和の生成に限定されない。例えば、一つの値しか持たず一つの符号化しか行われないようなグループが存在したとしても、本発明は有用であろう。このケースでは、制御手段36は、当然、スケーリング係数情報を前処理する必要は全くないことになる。この場合、平方計算の前の値のスケーリングに使われる係数は、有効ビット数、および/または不使用ビット数から自動的にもたらされよう。本発明を、平方の値に線形従属する計算結果の表示を生成するために広く一般的に使用することができる。
さらに、当然ながら、前記の記載内容に関し、本発明は音声符号化に関連する使用に限定されない。前記の音声符号化に関する、すなわち、ダイナミックレンジを維持しながら個別の信号エネルギーに対し同じスケーリングレベルを実現し、同時に音声符号化コストの削減を実現することに関する利点と同じ利点を、他の用途分野、例えば、電子透かしなどを入れた音声ファイル作成でも得ることができる。
さらに、状況に応じて本発明のスキームをソフトウエアに実装することが可能である。この実装を、デジタル記憶媒体、具体的には、電子的に可読の制御信号を備えたフロッピー(登録商標)ディスクまたはCDに行い、プログラム可能なコンピュータと協働してそれぞれの方法を実施させることができる。一般に、本発明は、マシン可読のキャリヤに格納され、コンピュータプログラム製品がコンピュータで実行されると本発明の方法を実施するプログラムコードを備えたコンピュータプログラム製品からも成る。すなわち、このように、コンピュータプログラムがコンピュータ上で実行されると本方法を実施するプログラムコードを備えたコンピュータプログラムとして本発明を実現することができる。
32ビット固定小数点データフォーマットの構成を示す概略図である。 64ビットの計算結果に対し、過小な値の影響を示すための32ビット固定小数点データ値の平方計算の概略図である。 64ビットの計算結果に対し、過小な値の影響を示すための32ビット固定小数点データ値の平方計算の概略図である。 本発明の実施形態による対数関数のグラフである。 本発明の実施形態による、平方和を生成するための装置の概略ブロック図である。 図4の装置の可能な構成のブロック図である。 図5による装置の機能を示すフローチャートである。 本発明の実施形態による音声エンコーダを示す概略ブロック図である。

Claims (20)

  1. 音声エンコーダであって、
    情報振幅信号のスペクトルグループの信号エネルギーを計算するための装置であって、前記装置は、
    スペクトル値のシーケンスを含む各スペクトルラインであり、xビットの対数化されていない表示で表され、前記スペクトルラインは、異なるスペクトルグループ(170)に割り当てられ、情報振幅信号(164)を前記スペクトルラインに分解するための変換手段(152)と、
    それぞれのスペクトル平方値を得るために、各スペクトル値(221〜22N;841〜84N)の前記xビットの対数化されていない表示を平方(40;68)し、前記それぞれのスペクトルグループに対する前記対数化されていない表示(26)の計算結果として平方和を得るために、前記スペクトル平方値を合計(38;70)する処理手段(24;80)であって、前記処理手段(24;80)は、前記計算結果の前記対数化されていない表示(26)を実効スケーリング係数によりスケールするように構成されている、処理手段と、
    前記異なるスペクトルグループの各々に対して、前記それぞれのスペクトルグループに対する前記それぞれの実効スケーリング係数が、前記それぞれのスペクトルグループの前記スペクトル値の数(N)によって決まるように、前記処理手段(24;80)を駆動する制御手段(36;64)と、
    yは、xの2倍に等しいかこれより小さく、前記計算結果の対数化されたスケールされた表示(30)を得るために、各前記異なるスペクトルグループに対する前記計算結果のために、前記計算結果のyビットの前記対数化されていない表示(26)に、対数関数を適用するための、対数化手段(28;82)と、
    前記異なるスペクトルグループの前記信号エネルギーが、互いに同一のスケールレベルを有するように、前記それぞれのスペクトルグループの信号エネルギーとして前記計算結果の対数表示(34)を得るために、前記計算結果の前記それぞれのスケールされた対数表示(30)に対し、前記それぞれのスペクトルグループに対する前記それぞれの実効スケーリング係数に適用された前記対数関数に対応する値の補正値を、前記異なるスペクトルグループごとに減算(44)するための、再スケーリング手段(32;76)と、
    前記スペクトルグループの前記信号エネルギーに基づいて、前記情報振幅信号(164)の符号化バージョンを表す符号化データストリームを生成するための符号ストリーム生成器(156)とを含む装置を有する音声エンコーダ。
  2. 前記処理手段(24;80)は、固定小数点データフォーマットにおいて前記それぞれのスペクトルグループの各スペクトル値の前記xビット表示(221〜22N;841〜84N)を前処理するよう構成されている、請求項1に記載の音声エンコーダ。
  3. 前記制御手段(36;64)は、前記それぞれの実効スケーリング係数による前記スケーリング前記異なるスペクトルグループごとに、前記それぞれのスペクトルグループに対する前記計算結果の前記対数化されていない表示(26)の中の有効ポジションの数を前記実スケーリング係数をなしとするものよりも大きい結果を得るよう前記処理手段(24;80)を駆動するよう構成されている、請求項1または請求項2に記載の音声エンコーダ。
  4. 前記制御手段(64)は、前記スペクトルグループの前記スペクトル値の数(N)に基づいてそれぞれの共通スケーリング係数を、各スペクトルグループに対して、調整するよう構成され、前記処理手段(80)は、
    xビット表示においてスケールされたスペクトル値を得るために、前記それぞれの共通スケーリング係数に基づいて、前記それぞれのスペクトルグループの各スペクトル値の前記xビットの対数化されていない表示(841〜84N)をスケーリングするための、スケーリング手段(66)と、
    スケールされた平方スペクトル値を得るために、各スケールされたスペクトル値の前記xビット表示を平方するための、平方手段(68)と、
    平方和を得るために、前記スケールされた平方スペクトル値を合計する合計手段(70)とを含む、請求項1ないし請求項のいずれかに記載の音声エンコーダ。
  5. 各スペクトル値の前記対数化されない前記xビット表示(841〜84N)は、固定小数点データフォーマットで表され、前記制御手段(64)は、前記スペクトル値の前記xビット表示における不使用ビットポジションの最小数に基づいて前記調整をさらに実施するように構成されている、請求項に記載の音声エンコーダ。
  6. 前記制御手段(64)は、前記共通スケーリング係数を2のk乗に調整するよう構成され、前記スケーリング手段(66)は、xビット値のレジスタにおける前記グループのスペクトル値の前記xビット表示をkビット数シフトするよう構成されている、請求項または請求項に記載の音声エンコーダ。
  7. 前記平方手段(68)は、2xビットの結果レジスタにおいて、2xビット表示の前記スケールされた平方スペクトル値のうち所定のスケールされた平方スペクトル値を取り込むために、前記2xビットの結果レジスタは構成され、前記合計手段(70)は、前記yビット部分を、他のスケールされた平方スペクトル値の前記yビット部分と一緒に合計し、前記平方値の和をyビットレジスタに書き込むために、前記2xビットの結果レジスタからの前記2xビット表示のyビット部分を読み取り、前記2xビットの結果レジスタ中の前記残りのビットを放棄するように構成されている、請求項ないし請求項のいずれかに記載の音声エンコーダ。
  8. 前記対数化手段(28;72)は、前記対数化されたスケールされた表示(30)が、yより大きいかこれと等しい数で除算された前記yビットの対数化されていない表示の基底2対数の結果を伴っている前記yビットの対数化されていない表示(26)の前記基底2対数のyビットで表示したものと一致するように、前記yビットの対数化されていない表示(26)を処理するよう構成されており、前記再スケーリング手段(32)は、前記数で除算された前記実効スケーリング係数の前記基底2対数に相当する量を、前記スケールされ、対数化された表示(30)に加算またはこれから減算するよう構成されている、請求項1ないし請求項のいずれかに記載の音声エンコーダ。
  9. 前記数は、64であり、およびy=x=32である、請求項に記載の音声エンコーダ。
  10. 固定小数点データフォーマットにおいて演算するために、前記処理手段(24;80)、前記対数化手段(28;82)、および前記再スケーリング手段(32)が構成されている、請求項1ないし請求項のいずれかに記載の音声エンコーダ。
  11. 固定小数点プロセッサに実装される、請求項1ないし請求項1のいずれかに記載の音声エンコーダ。
  12. yは、xに等しい、請求項1ないし請求項1のいずれかに記載の音声エンコーダ。
  13. 前記情報振幅信号は音声信号である、請求項1ないし請求項1のいずれかに記載の音声エンコーダ。
  14. 前記符号ストリーム生成器(156)は、さらに心理音響モデル(162)に基づいて前記符号化データストリームを生成するよう構成されている、請求項1ないし請求項13のいずれかに記載の音声エンコーダ。
  15. 前記符号ストリーム生成器は、MPEG1/2レイヤ3エンコーダまたはMPEG2/4AACエンコーダである、請求項1ないし請求項1のいずれかに記載の音声エンコーダ。
  16. 前記符号ストリーム生成器(156)は、さらに、
    各スペクトルグループの信号エネルギーに対して、前記対数関数の逆関数の計算を(−SE>>1)に適用して実行することによりエネルギー重み付けスペクトルを計算するためのTNSモジュールであって、SEは、前記それぞれのスペクトルグループの前記計算結果の対数表示(34)を示し、および>>1は、1ビット右側にシフトすることを示す、TNSモジュールを含む、請求項1ないし請求項1のいずれかに記載の音声エンコーダ。
  17. 前記符号ストリーム生成器(156)は、さらに、
    SE1−((SE2+SE3)>>1)の計算を実行するモジュールであって、SE1、SE2およびSE3は、スペクトルグループの信号エネルギーを示し、および、>>1は、1ビット右側にシフトすることを示す、モジュールを含む、請求項1ないし請求項1のいずれかに記載の装置。
  18. 前記符号ストリーム生成器(156)は、さらに、
    LTとSEとの間の減法を経由して、除算“/”を計算することによって、log(k*LT/SE)に等しい、量子化ステップ幅の一部を成す前記スペクトルグループに対するスケール係数を計算するスケール係数推定器を含む量子化モジュールであって、SEは、前記それぞれのスペクトルグループの前記計算結果の対数表示(34)を示し、“log()”は、常用対数(すなわち、log10)を表し、およびLTは、対数関数を用いて対数化されたフォーマットにおける可聴閾値を示し、kは、定数である、量子化モジュールを含む、請求項1ないし請求項1のいずれかに記載の装置。
  19. 音声符号化方法であって、前記方法は、
    情報振幅信号のスペクトルグループの信号エネルギーを計算する工程を含み、前記計算する工程は、
    スペクトル値のシーケンスを含む各スペクトルラインであり、xビットの対数化されていない表示で表され、前記スペクトルラインは、異なるスペクトルグループ(170)に割り当てられ、情報振幅信号(164)を前記スペクトルラインに分解する工程と、
    それぞれ一つのスペクトル平方値を得るために、各スペクトル値(221〜22N;841〜84N)の前記xビットの対数化されていない表示を平方(40;68)し、前記それぞれのスペクトルグループに対する前記対数化されていない表示(26)の計算結果として平方和を得るために、前記スペクトル平方値を合計(38;70)する工程であって、前記工程(24;80)は、前記計算結果の前記対数化されていない表示(26)は、実効スケーリング係数によりスケールされるように実行する工程であって前記異なるスペクトルグループの各々に対して、前記それぞれのスペクトルグループに対する前記それぞれの実効スケーリング係数が、前記それぞれのスペクトルグループの前記スペクトル値の数(N)によって決まる、実行する工程と、
    yは、xの2倍に等しいかこれより小さく、前記計算結果の対数化されたスケールされた表示(30)を得るために、各前記異なるスペクトルグループに対する前記計算結果のために、前記計算結果のyビットの前記対数化されていない表示(26)に、対数関数を適用する工程と、
    前記異なるスペクトルグループの前記信号エネルギーが、互いに同一のスケールレベルを有するように、前記それぞれのスペクトルグループの前記信号エネルギーとして、前記計算結果の対数表示(34)を得るために、前記計算結果の前記それぞれのスケールされた対数表示(30)に対し、前記それぞれのスペクトルグループに対する前記それぞれの実効スケーリング係数に適用された前記対数関数に対応する値の補正値を、前記異なるスペクトルグループごとに減算(44)する工程と、
    前記スペクトルグループの前記信号エネルギーに基づいて、前記情報振幅信号(164)の符号化バージョンを表す符号化データストリームを生成する工程と、
    を含む音声符号化方法。
  20. コンピュータプログラムがコンピュータ上で動作する場合、請求項19に記載の前記方法を実行するプログラムコードを有するコンピュータプログラム。
JP2007545932A 2004-12-13 2005-12-13 平方値に線形従属する計算結果の表示を生成する方法 Active JP4954087B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004059979.3 2004-12-13
DE102004059979A DE102004059979B4 (de) 2004-12-13 2004-12-13 Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals
PCT/EP2005/013383 WO2006063797A2 (de) 2004-12-13 2005-12-13 Verfahren zum bilden einer darstellung eines von einem quadrat eines wertes linear abhängigen berechnungsergebnisses

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007212119A Division JP4953978B2 (ja) 2004-12-13 2007-08-16 平方値に線形従属する計算結果の表示を生成する方法

Publications (2)

Publication Number Publication Date
JP2008523450A JP2008523450A (ja) 2008-07-03
JP4954087B2 true JP4954087B2 (ja) 2012-06-13

Family

ID=36390168

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007545932A Active JP4954087B2 (ja) 2004-12-13 2005-12-13 平方値に線形従属する計算結果の表示を生成する方法
JP2007212119A Active JP4953978B2 (ja) 2004-12-13 2007-08-16 平方値に線形従属する計算結果の表示を生成する方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2007212119A Active JP4953978B2 (ja) 2004-12-13 2007-08-16 平方値に線形従属する計算結果の表示を生成する方法

Country Status (19)

Country Link
US (1) US8037114B2 (ja)
EP (2) EP1825356B1 (ja)
JP (2) JP4954087B2 (ja)
KR (1) KR100921795B1 (ja)
CN (1) CN101147122B (ja)
AU (1) AU2005315826B2 (ja)
BR (1) BRPI0517176B1 (ja)
CA (1) CA2590509C (ja)
DE (1) DE102004059979B4 (ja)
ES (1) ES2596275T3 (ja)
HK (1) HK1105233A1 (ja)
IL (1) IL183835A (ja)
IN (1) IN266829B (ja)
MX (1) MX2007006805A (ja)
NO (1) NO341726B1 (ja)
PL (1) PL1825356T3 (ja)
PT (1) PT1825356T (ja)
RU (1) RU2375743C2 (ja)
WO (1) WO2006063797A2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004059979B4 (de) 2004-12-13 2007-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals
GB0817977D0 (en) * 2008-10-01 2008-11-05 Craven Peter G Improved lossy coding of signals
US8311843B2 (en) * 2009-08-24 2012-11-13 Sling Media Pvt. Ltd. Frequency band scale factor determination in audio encoding based upon frequency band signal energy
EP2490006A4 (en) * 2009-10-14 2018-05-02 Nippon Paper Industries Co., Ltd. Method for measuring degree of contaminant deposition
JP2012235832A (ja) * 2011-05-10 2012-12-06 Canon Inc 被検体情報取得装置
EP2980801A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US10020002B2 (en) * 2015-04-05 2018-07-10 Qualcomm Incorporated Gain parameter estimation based on energy saturation and signal scaling
US10559315B2 (en) * 2018-03-28 2020-02-11 Qualcomm Incorporated Extended-range coarse-fine quantization for audio coding
DE102022200283A1 (de) * 2022-01-13 2023-07-13 Robert Bosch Gesellschaft mit beschränkter Haftung Radarsystem und Verfahren zum Betreiben eines Radarsystems

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3587251T2 (de) * 1984-12-20 1993-07-15 Gte Laboratories Inc Anpassbares verfahren und vorrichtung fuer sprachkodierung.
JPS61188624A (ja) * 1985-02-15 1986-08-22 Fujitsu Ltd 固定小数点演算装置
US5197024A (en) 1989-06-14 1993-03-23 Pickett Lester C Method and apparatus for exponential/logarithmic computation
JP2948378B2 (ja) * 1991-09-28 1999-09-13 富士ゼロックス株式会社 重力多体系および電気力多体系用相互作用力計算用処理装置
JP3217576B2 (ja) * 1993-02-22 2001-10-09 テキサス インスツルメンツ インコーポレイテツド 集積オーディオデコーダ装置及び動作方法
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5570454A (en) * 1994-06-09 1996-10-29 Hughes Electronics Method for processing speech signals as block floating point numbers in a CELP-based coder using a fixed point processor
JPH08237497A (ja) * 1995-02-23 1996-09-13 Canon Inc 画像処理装置及び方法
US5608663A (en) * 1995-03-03 1997-03-04 Motorola, Inc. Computational array circuit for providing parallel multiplication
KR0154387B1 (ko) * 1995-04-01 1998-11-16 김주용 음성다중 시스템을 적용한 디지탈 오디오 부호화기
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5719998A (en) 1995-06-12 1998-02-17 S3, Incorporated Partitioned decompression of audio data using audio decoder engine for computationally intensive processing
JP3110288B2 (ja) * 1995-07-21 2000-11-20 日本電気株式会社 指数対数変換回路
US5864802A (en) * 1995-09-22 1999-01-26 Samsung Electronics Co., Ltd. Digital audio encoding method utilizing look-up table and device thereof
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JPH11242585A (ja) * 1998-02-24 1999-09-07 Sony Corp 除算回路およびグラフィック演算装置
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
DE19826252C2 (de) * 1998-06-15 2001-04-05 Systemonic Ag Verfahren zur digitalen Signalverarbeitung
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
JP2000151414A (ja) * 1998-11-12 2000-05-30 Matsushita Electric Ind Co Ltd ディジタルオーディオ符号化装置、同符号化方法、及び同符号化プログラムを記録した記録媒体
US6341300B1 (en) * 1999-01-29 2002-01-22 Sun Microsystems, Inc. Parallel fixed point square root and reciprocal square root computation unit in a processor
US6516049B1 (en) * 2000-06-06 2003-02-04 Ikanos Communications, Inc. Method and apparatus for insertion loss estimation in wireline communications
US6754618B1 (en) * 2000-06-07 2004-06-22 Cirrus Logic, Inc. Fast implementation of MPEG audio coding
JP2002196792A (ja) * 2000-12-25 2002-07-12 Matsushita Electric Ind Co Ltd 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
US6732071B2 (en) 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
DE10234130B3 (de) 2002-07-26 2004-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
SG135920A1 (en) 2003-03-07 2007-10-29 St Microelectronics Asia Device and process for use in encoding audio data
DE102004059979B4 (de) 2004-12-13 2007-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals

Also Published As

Publication number Publication date
PL1825356T3 (pl) 2017-01-31
AU2005315826B2 (en) 2009-06-11
PT1825356T (pt) 2016-11-04
CA2590509A1 (en) 2006-06-22
CN101147122A (zh) 2008-03-19
NO341726B1 (no) 2018-01-08
AU2005315826A1 (en) 2006-06-22
EP1825356A2 (de) 2007-08-29
RU2375743C2 (ru) 2009-12-10
RU2007126655A (ru) 2009-01-20
BRPI0517176A (pt) 2008-09-30
DE102004059979A1 (de) 2006-06-14
EP1843246A3 (de) 2008-01-02
WO2006063797A2 (de) 2006-06-22
JP2008523450A (ja) 2008-07-03
KR100921795B1 (ko) 2009-10-15
ES2596275T3 (es) 2017-01-05
IL183835A (en) 2013-07-31
IL183835A0 (en) 2007-10-31
EP1843246A2 (de) 2007-10-10
KR20070086097A (ko) 2007-08-27
IN266829B (ja) 2015-06-04
BRPI0517176B1 (pt) 2022-05-17
CA2590509C (en) 2014-10-28
JP4953978B2 (ja) 2012-06-13
CN101147122B (zh) 2012-07-18
EP1825356B1 (de) 2016-08-03
HK1105233A1 (zh) 2008-02-06
MX2007006805A (es) 2007-07-20
US20070276889A1 (en) 2007-11-29
DE102004059979B4 (de) 2007-11-22
NO20072916L (no) 2007-09-13
JP2008026912A (ja) 2008-02-07
WO2006063797A3 (de) 2006-09-21
US8037114B2 (en) 2011-10-11

Similar Documents

Publication Publication Date Title
JP4953978B2 (ja) 平方値に線形従属する計算結果の表示を生成する方法
CN106990937B (zh) 一种浮点数处理装置和处理方法
US7188133B2 (en) Floating point number storage method and floating point arithmetic device
US7593851B2 (en) Precision piecewise polynomial approximation for Ephraim-Malah filter
JP4398979B2 (ja) 変換表現に転換するか、または変換表現を逆変換するための装置および方法
CN110931035B (zh) 音频处理方法、装置、设备及存储介质
KR100771401B1 (ko) 프로그래머블 프로세서에서 mpeg-2 또는 mpeg-4aac 오디오 복호 알고리즘을 처리하기 위한 연산 회로및 연산 방법
TWI662543B (zh) 應用動態範圍壓縮之方法和設備以及一種非暫態電腦可讀取儲存媒體
US20070033024A1 (en) Method and apparatus for encoding audio data
KR20070015789A (ko) 프로그래머블 프로세서에서 mpeg-2 또는 mpeg-4aac 오디오 복호 알고리즘을 처리하기 위한 연산 회로및 연산 방법
KR20010042988A (ko) 음성 신호를 디코딩하기 위한 방법 및 장치
JP5704018B2 (ja) オーディオ信号符号化方法および装置
US8601039B2 (en) Computation apparatus and method, quantization apparatus and method, and program
CN115686436A (zh) 定点数除法的计算方法及装置
US20090319589A1 (en) Using fractional exponents to reduce the computational complexity of numerical operations
JP3365346B2 (ja) 音声符号化装置及び方法並びに音声符号化プログラムを記録した記憶媒体
JP2006162774A (ja) 信号処理装置
Hee et al. Novel non-linear inverse quantization algorithm and its architecture for digital audio codecs
KR20060088689A (ko) 산술연산 논리 유닛
JP2002215196A (ja) 0.75乗計算装置及び0.75乗計算方法並びにそれに用いるプログラム
JP2002539477A (ja) 再帰デジタルオシレータを使用してデジタルオーディオ信号の加法合成を行う装置および方法
US20060036666A1 (en) Method, circuit, codec and computer program product for performing a modified discrete cosine transform
Sabuwala Towards a Real-time Implementation of Loudness Enhancement Algorithms on a Motorola DSP 56600
JP2002108608A (ja) 信号処理装置、信号処理方法、プログラム記録媒体及びコンピュータプログラム
JPH0480799A (ja) 音声分析方法と音声分析装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110223

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110302

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110328

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110404

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110427

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110628

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110927

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120313

R150 Certificate of patent or registration of utility model

Ref document number: 4954087

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250