JP2007507750A - オーディオ符号化におけるレート−歪み制御方法 - Google Patents

オーディオ符号化におけるレート−歪み制御方法 Download PDF

Info

Publication number
JP2007507750A
JP2007507750A JP2006533977A JP2006533977A JP2007507750A JP 2007507750 A JP2007507750 A JP 2007507750A JP 2006533977 A JP2006533977 A JP 2006533977A JP 2006533977 A JP2006533977 A JP 2006533977A JP 2007507750 A JP2007507750 A JP 2007507750A
Authority
JP
Japan
Prior art keywords
initial
bits
common conversion
coefficient
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006533977A
Other languages
English (en)
Inventor
ユン、ジェングナム
Original Assignee
ソニー エレクトロニクス インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー エレクトロニクス インク filed Critical ソニー エレクトロニクス インク
Publication of JP2007507750A publication Critical patent/JP2007507750A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

初期共通換算係数に関連する初期のビット数を決定し、初期ビット数及び目標ビット数を用いて初期のインクリメント値を算出し、初期のインクリメント値により初期共通換算係数をインクリメントする。更に、目標ビット数に基づいて、インクリメントされた共通換算係数を調整し、調整された共通換算係数及び許容歪みに基づいて、複数の個々の換算係数を算出する。複数の個々の換算係数に関連する現在のビット数が目標ビット数を超えている場合、ビット数が目標ビット数を超えなくなるまで、調整された共通換算係数を変更する。

Description

本発明は、包括的には、オーディオ符号化に関する。詳しくは、本発明は、オーディオ符号化におけるレート−歪み制御(rate-distortion control)の方式に関する。
著作権表示/許諾
この明細書の開示内容の一部は、著作権保護の対象となるマテリアルを含む。著作権所有者は、この明細書が特許商標庁への特許出願であると認められるファックスコピーに対しては異議を唱えないが、この他のあらゆる全ての著作権を主張する。以下の表示は、後述するソフトウェア及びデータ、並びに添付の図面に適用される。:著作権(c)2001:全ての著作権はソニーエレクトロニクスインク社に帰属する(Copyright (c) 2001, Sony Electronics, Inc., All Rights Reserved)。
標準化組織であるモーションピクチャエキスパートグループ(Motion Picture Experts Group:MPEG)は、例えば、MPEG−2アドバンスドオーディオ符号化(advanced audio coding:AAC)規格(ISO/IEC13818−7参照)及びMPEG−4AAC規格(ISO/IEC14496−3参照)等の仕様書において、データ圧縮方法を開示している。本明細書では、これらの規格を総称的にMPEG規格と呼ぶ。
MPEG規格が定義するオーディオエンコーダは、入力パルスコード変調(pulse code modulation:PCM)信号を受信し、修正離散コサイン変換(modified discrete cosine transform:MDCT)処理によってPCM信号を周波数スペクトルデータに変換し、レート−歪み制御メカニズムを用いて周波数スペクトルデータを量子化するための最適な換算係数を決定する。更に、オーディオエンコーダは、最適な換算係数を用いて周波数スペクトルデータを量子化し、この結果得られる量子化されたスペクトル係数を換算係数帯域(scalefactor band)にグループ化し、量子化され、グループ化された係数にハフマン符号化を施す。
MPEG規格では、レート−歪み制御メカニズム(rate-distortion control mechanism)は、2つの主要な要求を満たすスペクトルデータを生成できる換算係数を繰り返し選択する。まず、量子化雑音(音質)は、スペクトルデータに重畳しても人間の耳に聞こえない最大量の雑音に対応する許容歪みを超えてはならない。許容歪みは、通常人間の聴覚の心理音響モデリングに基づいて決定される。次に、ハフマン符号化の結果として使用されるビット量は、符号化により指定されるビットレートから算出される許容できるビット量を超えてはならない。
レート−歪み制御メカニズムは、通常、個々の換算係数と共通換算係数を定義する。個々の換算係数は、フレーム内で異なる換算係数帯域毎に変化し、共通換算係数は、フレーム内で変化しない。MPEG規格では、レート−歪み制御処理は、ハフマン符号化により生成される使用されるビット量と、符号化が指定するビットレートから算出される許容できるビット量との間の差分を最小化するように、初期の(可能な最小の)共通換算係数を繰り返しインクリメントする。そして、レート−歪み制御処理は、個々の換算係数帯域の歪みが許容歪みを超えているかどうかを確認し、換算係数帯域を拡大し、再び共通換算係数ループを呼び出す。このレート−歪み制御処理は、量子化された周波数スペクトルの雑音が許容歪みより小さくなり、量子化に必要なビット量が許容できるビット量より小さくなるまで繰り返される。
上述したレート−歪み制御処理は、多くの可能な換算係数を処理しなければならないので、演算負荷が大きい。更に、この処理では、低いビットレート(64キロビット/秒以下)が要求される場合、最適な換算係数を選ぶことができない。
初期共通換算係数に関連する初期のビット数を決定し、初期ビット数及び目標ビット数を用いて初期のインクリメント値を算出し、初期のインクリメント値により初期共通換算係数をインクリメントする。更に、目標ビット数に基づいて、インクリメントされた共通換算係数を調整し、調整された共通換算係数及び許容歪みに基づいて、複数の個々の換算係数を算出する。複数の個々の換算係数に関連する現在のビット数が目標ビット数を超えている場合、ビット数が目標ビット数を超えなくなるまで、調整された共通換算係数を変更する。
本発明は、以下の詳細な説明及び本発明の様々な実施形態を示す添付の図面によって、より明瞭になるが、これらは、本発明を説明するために本発明を例示的に示すものであり、本発明は、特定の実施形態に制限されるものではない。
以下、添付の図面を用いて、本発明の実施例を詳細に説明する。添付の図面においては、類似する要素には、類似する参照符号を付す。添付の図面は、本発明を実現する特定の実施例を例示的に示している。これらの実施例については、当業者が本発明を実施することができるよう、詳細に説明するが、この他の実施例も可能であり、本発明の範囲から逸脱することなく、論理的、機械的、電気的、機能的及びこの他の変更を行うことができる。したがって、以下の詳細な説明は、限定的には解釈されず、本発明の範囲は、添付の請求の範囲によってのみ定義される。
まず、図1に示す符号化装置100の一実施形態により、本発明の動作の概観について説明する。符号化装置100は、本明細書では総称的にMPEG規格と呼ぶMPEG音声符号化規格(例えば、MPEG−2AAC規格、MPEG−4AAC規格等)に準拠する。符号化装置100は、フィルタバンクモジュール102と、符号化ツール104と、心理音響モデラ106と、量子化モジュール110と、ハフマン符号化モジュール114とを備える。
フィルタバンクモジュール102は、パルスコード変調(pulse code modulation:PCM)信号を受信し、修正離散コサイン変換(modified discrete cosine transform:MDCT)処理を実行し、オーディオ信号を周波数領域にマッピングする。窓関数は、解析される信号を時間的に拡張し、周波数分解能を向上させるロングウィンドウタイプ及び解析される信号を時間的に縮小し、時間分解能を向上させるショートウィンドウタイプの2つのタイプのウィンドウを用いて信号を処理する。ロングウィンドウタイプは、安定した信号のみが存在する場合に使用され、ショートウィンドウタイプは、急速な信号変化がある場合に使用される。解析される信号の特性に基づくこれらの2つのタイプの処理を用いることによって、時間分解能が不十分な場合に生じるプレエコーと呼ばれる不快な雑音の発生を防止することができる。MDCT処理は、時間領域信号を周波数スペクトルデータの複数のサンプルに変換する。
符号化ツール104は、スペクトル処理の任意のツールのセットを含む。例えば、符号化ツール104は、予測符号化を実行するためのゆらぎ雑音シェーピング(temporal noise shaping:TNS)ツール及び予測ツールを含む。TNSツールを用いて、変換の各ウィンドウ内で雑音の時間的なシェープを制御し、プレエコー問題を解決することができる。また、予測ツールを用いて、サンプル間の相関性を排除することができる。
心理音響モデラ106は、サンプルを分析し、聴覚マスキング曲線を決定する。聴覚マスキング曲線は、各サンプルに重畳しても、人間の耳には聞こえない雑音の最大レベルを示す。ここで、人間の耳に聞き取られるレベルは、人間の聴覚の心理音響モデルに基づいて判定される。聴覚マスキング曲線は、望ましい雑音スペクトルの推定値として機能する。
量子化モジュール110は、周波数スペクトルデータの最適な換算係数を選択する。換算係数選択処理は、後述するようにマスキング曲線から算出された許容歪み及び符号化の際に指定されるビットレートから算出された許容できるビット数(ここでは、目標ビット数と呼ぶ。)に基づいて行われる。最適な換算係数が選択されると、量子化モジュール110は、これらの最適な換算係数を用いて、周波数スペクトルデータを量子化する。この結果得られる量子化されたスペクトル係数は、換算係数帯域(scalefactor band:SFB)にグループ化される。各SFBは、同じ換算係数を用いて生成された係数を含む。
ハフマン符号化モジュール114は、量子化されたスペクトル係数の各グループについて、最適なハフマンコードブックを選択し、この最適なハフマンコードブックを用いてハフマン符号化処理を実行する。そして、これにより得られる可変長符号(variable length code:VLC)、符号化で用いられたコードブックを特定するデータ、量子化モジュール110によって選択された換算係数及びこの他の何らかの情報を組み合わせて、ビットストリームが生成される。
一実施形態においては、量子化モジュール110は、レート−歪み制御部108及び量子化/逆量子化部112を備える。レート−歪み制御部108は、スペクトルデータの各フレームについて、換算係数選択処理を繰り返し実行する。この処理では、レート−歪み制御部108は、全体のフレームについて、最適な共通換算係数を発見し、及びフレーム内の異なる換算係数帯域について、最適の個々の換算係数を発見する。
一実施形態においては、レート−歪み制御部108は、まず、初期共通換算係数を前フレーム又は他のチャンネルの共通換算係数の値に設定する。量子化/逆量子化部112は、初期共通換算係数を用いて、フレーム内のスペクトルデータを量子化し、量子化されたスペクトルデータをハフマン符号化モジュール114に渡し、ハフマン符号化モジュール114は、量子化されたスペクトルデータをハフマン符号化し、これにより得られるVLCによって用いられるビット数を決定する。レート−歪み制御部108は、この使用ビット数及び符号化が指定するビットレートから算出される目標ビット数に基づいて、初期共通換算係数の第1のインクリメント値を決定する。初期共通換算係数に第1のインクリメント値が加算されると、インクリメントされた共通換算係数は、目標ビット数に比較的近いビット数を生成する。レート−歪み制御部108は、これにより得られる使用ビット数を目標ビット数により近付けるように、更にインクリメントされた共通換算係数を調整する。
更に、レート−歪み制御部108は、フレーム内の換算係数帯域について、個々の換算係数を算出する。後により詳細に説明するように、個々の換算係数は、調整された共通換算係数及び許容歪みに基づいて算出される。一実施形態においては、個々の換算係数の演算では、特定の個々の換算係数に関連するエネルギ誤差が許容歪みを下回るまで、個々の換算係数を繰り返し変更する。一実施形態においては、エネルギ誤差は、量子化/逆量子化部112により、所定の換算係数を用いて換算係数帯域の周波数スペクトルデータを量子化し、この量子化データを所定の換算係数で逆量子化し、元の(予め量子化された)周波数スペクトルデータと逆量子化されたスペクトルデータとの間の差分を算出することによって算出される。
個々の換算係数が算出されると、レート−歪み制御部108は、個々の換算係数及び調整された共通換算係数を用いて生成されたビット数が目標ビット数を超えているかを判定する。これに該当する場合、レート−歪み制御部108は、更に、使用ビット数が目標ビット数を超えなくなるまで、調整された共通換算係数を変更する。算出された個々の換算係数は、量子化雑音シェープの所望のプロファイルを生成するので、調整された共通換算係数が変更されれば、個々の換算係数は、再計算する必要はない。
図2〜図6は、本発明の様々な実施形態に基づき、図1の量子化モジュール110が実行する換算係数選択処理のフローチャートである。この処理は、ハードウェア(例えば回路、専用ロジック等)、ソフトウェア(汎用コンピュータシステム又は専用マシン上で実行されるソフトウェア)又はこれらの両方の組合せを含む処理ロジックによって実行してもよい。ソフトウェアによって実現できる処理については、これらのフローチャートを用いて本発明を説明することにより、当業者は、適切に構成されたコンピュータによってこの処理を実行するための命令を含むプログラムを開発することができる(コンピュータのプロセッサは、メモリを含むコンピュータにより読取可能な媒体から命令を読み出し、実行する)。コンピュータにより実行可能な命令は、コンピュータプログラミング言語として書いてもよく、ファームウェアロジックとして実現してもよい。一般的に認知されている規格に準拠するプログラミング言語で書いた場合、このような命令は、様々なオペレーティングシステムにインタフェースされ、様々な種類のハードウェアプラットホームで実行できる。更に、本発明では、如何なる特定のプログラミング言語にも基づくことなく、本発明を説明する。ここに開示する本発明の処理を実現するために、様々なプログラミング言語を用いてることができることは明らかである。更に、当分野においては、動作を行い又は結果を生じるものとして、ソフトウェアを様々な呼び方で呼ぶことがある(例えば、プログラム、手続き、プロセス、アプリケーション、モジュール、ロジック等)。これらの表現は、コンピュータによるソフトウェアの実行によって、コンピュータのプロセッサが動作を実行し又は結果を生じるということを単に簡略的に表現しているに過ぎない。また、本発明の範囲から逸脱することなく、図2〜図6に示す処理ステップを省略してもよく、他のステップを追加してもよく、更に、ここで説明する処理ステップの実行順序を変更してもよい。
図2は、フレーム内のデータについて最適な換算係数を選択するための処理200の一実施形態のフローチャートである。
図2に示すように、処理ロジックは、まず、処理するフレーム内のデータの初期共通換算係数を決定する(処理ステップ202)。フレームのデータは、例えば、MDCT周波数スペクトル係数等の周波数スペクトル係数を含んでいてもよい。一実施形態においては、処理ロジックは、フレーム内の最大の絶対値を有するスペクトル係数がゼロにならないようにし、初期共通換算係数を前フレーム又は他のチャンネルの共通換算係数に設定することにより、フレームの初期共通換算係数を決定する。例えば、チャンネル0の初期共通換算係数を前フレームの共通換算係数に設定し、チャンネル1の初期共通換算係数をチャンネル0の共通換算係数に設定してもよい。フレーム内で最大の値を有するスペクトル係数がゼロになった場合、処理ロジックは、初期共通換算係数を予め定義された数(例えば、30)に設定してもよく、この数は、経験的に定義してもよい。
次に、処理ロジックは、初期共通換算係数を用いてフレーム内のデータを量子化し(処理ステップ204)、これにより得られる量子化データの妥当性を検査する(判定ステップ206)。一実施形態においては、絶対値が閾値数(例えば、MPEG規格では8191)を超えていなければ、量子化されたスペクトル係数は、妥当である。生成される量子化データが妥当でない場合、処理ロジックは、例えば初期共通換算係数を経験的に定義される定数(例えば、5)分インクリメントする(処理ステップ208)。
生成される量子化データが妥当な場合、処理ロジックは、ハフマン符号化で用いられる量子化データのビット数を決定し(処理ステップ210)、使用ビット数及び目標ビット数に基づいて、初期共通換算係数の第1のインクリメント値を算出し(処理ステップ212)、第1のインクリメント値を初期共通換算係数に加算する(処理ステップ214)。上述のように、目標ビット数は、符号化により特定されるビットレートから算出できる。
一実施形態においては、第1のインクリメント値は、以下の式により算出される。
initial_increment=10*(initial_bits−target_bits)/target_bits
ここで、initial_incrementは、第1のインクリメント値であり、initial_bitsは、使用ビット数であり、target_bitsは、目標ビット数である。この式は、使用ビット数を目標ビット数に速やかに収束させるための動的なインクリメント方式を提供するために(例えば、一連の実験により)導出された。すなわち、インクリメントされた共通換算係数は、目標ビット数に比較的近い使用ビット数を生成する。しかしながら、この時点で、生成される使用ビット数は、目標ビット数より未だ大きい又は小さい場合もある。
次に、処理ロジックは、更に、使用ビット数が目標ビット数により近付くように、インクリメントされた共通換算係数を調整する(処理ステップ220)。調整処理の一実施形態については、図3を用いて後に更に詳細に説明する。
処理ステップ222において、処理ロジックは、調整された共通換算係数及び許容歪みを用いて、フレーム内の換算係数帯域の個々の換算係数を算出する。一実施形態においては、許容歪みは、図1の心理音響モデラ106から得られるマスキング曲線に基づいて算出される。算出された個々の換算係数の処理の一実施形態については、図5を用いて後に詳細に説明する。
更に、処理ロジックは、算出された個々の換算係数及び調整された共通換算係数を用いて生成される使用ビット数を決定し(処理ステップ224)、この使用ビット数が目標ビット数を超えているかを判定する(判定ステップ226)。これに該当する場合、処理ロジックは、生成される使用ビット数が目標ビット数を超えなくなるまで、調整された共通換算係数を更に変更する(処理ステップ228)。最終的な共通換算係数を決定するための処理の一実施形態については、図6を用いて後に詳細に説明する。上述のように、共通換算係数が変更される場合、個々の換算係数を再計算する必要はない。
図3は、共通換算係数を調整するための処理300の一実施形態のフローチャートである。
図3に示すように、処理ロジックは、まず、現在の共通換算係数を用いてフレームのデータを量子化する(処理ステップ302)。一実施形態においては、現在の共通換算係数は、図2の処理ステップ214において算出したインクリメントされた換算係数である。
次に、処理ロジックは、量子化データが妥当であるかを判定する(判定ステップ304)。これに該当しない場合、処理ロジックは、現在の換算係数を定数(例えば、5)分インクリメントする(処理ステップ306)。これに該当する場合、処理ロジックは、ハフマン符号化で用いられる量子化スペクトルデータのビット数を決定する(処理ステップ308)。
更に、処理ロジックは、使用ビット数が目標ビット数を超えているかを判定する(判定ステップ310)。これに該当しない場合、ハフマン符号化の後に伝送されるデータに更なるビットを加えることができる。したがって、処理ロジックは、ビット増加変更ロジック(increase-bit modification logic)を用いて現在の共通換算係数を変更する(処理ステップ312)。一方、判定ステップ310の判定の結果が該当する場合、処理ロジックは、ビット削減変更ロジック(decrease-bit modification logic)を用いて現在の共通換算係数を変更する(処理ステップ314)。
図4A〜図4Cは、共通換算係数を変更する際のビット増加/ビット削減変更ロジックを用いる処理400の一実施形態のフローチャートである。
図4A〜図4Cに示すように、処理ロジックは、まず、量子化変更フィールド(quanitzer change field)の現在の値を予め定義された数(例えば、4)に設定し、1組のフラグを初期化する(処理ステップ402)。このフラグの組は、使用ビット数の変更の好ましい方向(すなわち、この数を増加するべきか削減するべきか)を示すレート変更フラグ「over_budget」と呼ぶ。)を含む。更に、このフラグの組は、上抜けフラグ(upcrossed flag)及び下抜けフラグ(downcrossed flag)を含む。上抜けフラグは、増加することが望まれる使用ビット数が、目標ビット数を上に抜けた(すなわち、目標ビット数以上になった)ことを示す。下抜けフラグは、削減することが望まれる使用ビット数が、目標ビット数を下に抜けた(すなわち、目標ビット数以下になった)ことを示す。
判定ステップ403では、処理ロジックは、量子化変更フィールドの現在の値が0であるかを判定する。これに該当する場合、処理400は、終了する。これ以外の場合、処理400は継続し、処理ロジックは、現在の共通換算係数を用いて、処理中のフレーム内のスペクトルデータを量子化し、ハフマン符号化で用いられる量子化されたスペクトルデータのビット数を決定する(処理ステップ404)。
判定ステップ406において、処理ロジックは、使用ビット数が目標ビット数を下回っているかを判定する。これに該当し、且つこの処理が最初の繰返しではない場合(判定ステップ408)、レート変更フラグは、ビットの増加方向を示す値(例えば、over_budget=1)に設定されたまま残される。これ以外の場合、又はこの処理が最初の繰返しである場合(判定ステップ408)、処理ロジックは、レート変更フラグを、ビットの削減方向を示す値(例えば、over_budget=0)に更新する(処理ステップ410)。
更に、レート変更フラグがビットの増加方向を示す場合(判定ステップ412)、処理ロジックは、上抜けフラグが1に設定されているかを判定する(判定ステップ414)。これに該当する場合、処理ロジックは、quantizer_change=quantizer_change>>1により量子化変更フィールドの現在の値を算出し(処理ステップ416)、使用ビット数が目標ビット数を下回っているかを判定する(判定ステップ418)。これに該当しない場合、処理ロジックは、現在の共通換算係数から量子化変更フィールドの値を減算し(処理ステップ420)、判定ステップ404に進む。これ以外の場合、処理ロジックは、現在の共通換算係数に量子化変更フィールドの値を加算し(処理ステップ422)、判定ステップ404に進む。
上抜けフラグが0に設定されている場合(判定ステップ414)、処理ロジックは、使用ビット数が目標ビット数を下回っているかを判定する(判定ステップ424)。これに該当する場合、処理ロジックは、現在の共通換算係数から量子化変更フィールドの現在の値を減算し(処理ステップ426)、判定ステップ404に進む。これ以外の場合、処理ロジックは、上抜けフラグを1に設定し、quantizer_change=quantizer_change>>1により量子化変更フィールドの新たな値を算出し、現在の共通換算係数から量子化変更フィールドの新たな値を減算し(処理ステップ428)、判定ステップ404に進む。
レート変更フラグがビットの削減方向を示す場合(判定ステップ412)、処理ロジックは、下抜けフラグが1に設定されているかを判定する(判定ステップ430)。これに該当する場合、処理ロジックは、quantizer_change=quantizer_change>>1により量子化変更フィールドの現在の値を算出し(処理ステップ432)、使用ビット数が目標ビット数を下回っているかを判定する(判定ステップ434)。これに該当しない場合、処理ロジックは、現在の共通換算係数に量子化変更フィールドの現在の値を加算し(処理ステップ436)、判定ステップ404に進む。これに該当する場合、処理ロジックは、現在の共通換算係数から量子化変更フィールドの現在の値を減算し(処理ステップ438)、判定ステップ404に進む。
下抜けフラグが0に設定されている場合(判定ステップ430)、処理ロジックは、使用ビット数が目標ビット数を下回っているかを判定する(判定ステップ440)。これに該当しない場合、処理ロジックは、現在の共通換算係数に量子化変更フィールドの現在の値を加算し(処理ステップ442)、判定ステップ404に進む。この判定の結果が肯定的である場合、処理ロジックは、下抜けフラグを1に設定し、quantizer_change=quantizer_change>>1により量子化変更フィールドの現在の値を算出し、現在の共通換算係数から量子化変更フィールドの新たな値を減算し(処理ステップ444)、判定ステップ404に進む。
図5は、個々の換算係数を算出するための処理500の一実施形態のフローチャートである。
図5に示すように、処理ロジックは、まず、第1の個々の換算係数(scale factor:SF)を共通換算係数の値に設定し、現在のインクリメントフィールドを第1の定数A(例えば、=1)に設定する(処理ステップ502)。そして処理ロジックは、現在のインクリメント値により個々の換算係数をインクリメントし(処理ステップ504)、インクリメントされた個々の換算係数を用いて対応するスペクトル係数を量子化し(処理ステップ506)、同じ個々の換算係数で量子化された係数を逆量子化し(処理ステップ508)、元の(予め量子化された)スペクトル係数と逆量子化されたスペクトル係数との間の差分に基づいて、この個々の換算係数に関連するエネルギ誤差を算出する(処理ステップ510)。
判定ステップ512において、処理ロジックは、Kを定数とし、許容される量子化誤差(許容歪みとも呼ばれる。)をallowed_distortion_energyとして、算出されたエネルギ誤差がK*allowed_distortion_energyを上回っているかを判定する。一実施形態においては、許容歪みは、図1の心理音響モデラ106が提供するマスキング曲線に基づいて算出される。
判定ステップ512における判定の結果が該当しない場合、処理ロジックは、現在のインクリメントフィールドを第1の定数Aに設定する(処理ステップ514)。この他の場合、処理ロジックは、現在のインクリメントフィールドを第2の定数B(例えば、B=3)に設定する(処理ステップ516)。一実施形態においては、パラメータA、B及びKは、良好な結果が得られるように、経験的に定義される。
更に、処理ロジックは、算出されたエネルギ誤差が許容歪みを下回っているかを判定する(判定ステップ518)。これに該当しない場合、処理ロジックは、処理ステップ504に戻り、ステップ504〜ステップ518を繰り返す。これに該当する場合、個々の換算係数の値を最終的な値とし、処理ロジック次の個々の換算係数の処理に移行する(処理ステップ522)。このフレームの全ての換算係数が処理されると(判定ステップ520)、処理500は、終了する。
図6は、共通換算係数の最終値を決定するための処理600の一実施形態のフローチャートである。
図6に示すように、処理ロジックは、まず、オフセットフィールドの値を第1の定数(例えばoffset=3)に設定する(処理ステップ602)。次に、処理ロジックは、算出された個々の換算係数及び現在の共通換算係数を用いて、処理するフレーム内のスペクトルデータを量子化し(処理ステップ604)、ハフマン符号化で用いられる量子化データのビット数を決定する(処理ステップ606)。
更に、処理ロジックは、使用ビット数が目標ビット数を超えているかを判定する(判定ステップ608)。これに該当する場合、処理ロジックは、現在の共通換算係数にオフセット値を加算し(処理ステップ610)、オフセット値を第2の定数(例えば、offset=1)に設定し(処理ステップ612)、処理ステップ604に戻る。この他の場合、使用ビット数が目標ビット数を超えていれば、処理600は、終了する。
以下に示す図7を参照した説明は、本発明の実施に適したコンピュータハードウェア及び他の操作コンポーネントに関する概要を明らかにするためのものであるが、これは、適用可能な環境を制限するものではない。図7は、コンピュータシステムの一実施形態を示す図1の符号化装置100又は量子化モジュール110の実現に好適なコンピュータシステムを示している。
コンピュータシステム740は、それぞれがシステムバス765に接続されたプロセッサ750と、メモリ755と、入出力装置(input/output capability)760とを備える。メモリ755は、プロセッサ750によって実行されることにより、ここに説明する処理を実現する命令を格納するよう構成されている。入出力装置760は、プロセッサ750によってアクセス可能なあらゆる種類のストレージ装置を含む、様々な種類の、コンピュータにより読取可能な媒体を含んでいる。なお、「コンピュータにより読取可能な媒体」という用語は、デジタル信号がエンコードされた搬送波をも含むことは、当業者にとって明らかである。コンピュータシステム740は、メモリ755において実行されるオペレーティングシステムソフトウェアによって制御される。入出力装置760及びこれに関連する媒体は、このオペレーティングシステムソフトウェアと、本発明に基づく処理とに関する命令と、アクセスユニットとを格納している。図1に示す量子化モジュール110は、プロセッサ750に接続されたそれぞれ独立した要素であってもよく、プロセッサ750に接続されたそれぞれ独立した要素であってもよく、プロセッサ750によって実行される、コンピュータにより実行可能な命令として実現してもよい。一実施例においては、コンピュータシステム740は、インターネットサービスプロバイダ(Internet Service Provider:以下、ISPという。)の一部であってもよく、或いは、入出力装置760を介してISPに接続され、インターネットを介してアクセスユニットを送受信してもよい。なお、本発明は、インターネットアクセス及びインターネットウェブサイトに限定されるものではなく、直接接続されたコンピュータシステム及びプライベートネットワークに適用してもよいことは明らかである。
なお、コンピュータシステム740は、異なるアーキテクチャを有する様々な可能なコンピュータシステムの一例に過ぎないことは明らかである。一般的なコンピュータシステムは、少なくともプロセッサと、メモリと、プロセッサ及びメモリを接続するバスとを備えている場合が多い。なお、本発明は、マルチプロセッサシステム、ミニコンピュータ、メインフレームコンピュータ等を含む、他のコンピュータシステム構成によっても実現できることは当業者にとって明らかである。更に、本発明は、通信ネットワークを介してリンクされたリモートの処理装置によってタスクが実行される分散型コンピュータシステム環境によっても実現することができる。
最適な換算係数を選択する様々な側面について説明した。ここでは、特定の実施の形態を示したが、ここに示した特定の実施の形態に代えて、同じ目的を達成する如何なる構成を用いてもよいことは当業者にとって明らかである。したがって、本出願は、本発明のあらゆる適応例及び変形例を包含するものとする。
符号化装置の一実施形態のブロック図である。 データのフレーム内で最適な換算係数を選択するための処理の一実施形態のフローチャートである。 共通換算係数を調整するための処理の一実施形態のフローチャートである。 共通換算係数を変更する際、ビット増加/ビット削減変更ロジックを用いる処理の一実施形態のフローチャートである。 図4Aの続きである。 図4Aの続きである。 算出された個々の換算係数の処理の一実施形態のフローチャートである。 共通換算係数の最終値を決定するための処理の一実施形態のフローチャートである。 本発明の実施形態の実現に適するコンピュータ環境のブロック図である。

Claims (25)

  1. 初期共通換算係数に関連する初期ビット数を決定するステップと、
    上記初期ビット数及び目標ビット数を用いて初期のインクリメント値を算出するステップと、
    上記初期のインクリメント値により上記初期共通換算係数をインクリメントするステップと、
    上記目標ビット数に基づいて、上記インクリメントされた共通換算係数を調整するステップと、
    上記調整された共通換算係数及び許容歪みに基づいて、複数の個々の換算係数を算出するステップと、
    上記複数の個々の換算係数に関連する現在のビット数が上記目標ビット数を超えている場合、該ビット数が上記目標ビット数を超えなくなるまで、上記調整された共通換算係数を変更するステップとを有する歪み制御方法。
  2. 上記初期共通換算係数を決定するステップを更に有する請求項1記載の歪み制御方法。
  3. 上記初期共通換算係数を決定するステップは、
    フレーム内の最大のスペクトル係数を選択するステップと、
    上記最大のスペクトル係数が0である場合、上記初期共通換算係数を30に設定するステップと、
    上記最大のスペクトル係数が0ではない場合、上記初期共通換算係数を先の共通換算係数に設定するステップとを有することを特徴とする請求項2記載の歪み制御方法。
  4. 上記先の共通換算係数は、前フレームの共通換算係数又は他のチャンネルの共通換算係数のいずれかであることを特徴とする請求項3記載の歪み制御方法。
  5. 上記初期のインクリメント値は、第1のインクリメント値をinitial_incrementとし、使用ビット数をinitial_bitsとし、目標ビット数をtarget_bitsとして、initial_increment=10*(initial_bits−target_bits)/target_bitsにより算出されることを特徴とする請求項1記載の歪み制御方法。
  6. 上記インクリメントされた共通換算係数を調整するステップは、
    上記インクリメントされた共通換算係数を用いて、フレーム内のスペクトルデータを量子化するステップと、
    上記量子化されたスペクトルデータが妥当であるかを判定するステップと、
    上記インクリメントされた共通換算係数に関連する現在のビット数を決定するステップと、
    上記現在のビット数が上記目標ビット数を超えている場合、上記インクリメントされた共通換算係数をビット削減順に変更するステップと、
    上記現在のビット数が上記目標ビット数を超えていない場合、上記インクリメントされた共通換算係数をビット増加順に変更するステップとを有することを特徴とする請求項1記載の歪み制御方法。
  7. 上記インクリメントされた共通換算係数は、現在のインクリメントが0になるまで変更されることを特徴とする請求項6記載の歪み制御方法。
  8. 上記複数の個々の換算係数を算出するステップは、
    上記複数の個々の換算係数を、該複数の個々の換算係数の調整に関連するエネルギ誤差が許容歪みを下回るまで、繰り返し調整するステップとを有することを特徴とする請求項1記載の歪み制御方法。
  9. 上記複数の個々の換算係数を調整するステップは、
    上記複数の個々の換算係数を現在のインクリメント値によりインクリメントするステップと、
    上記インクリメントされた個々の換算係数に関連するエネルギ誤差を算出するステップと、
    上記算出されたエネルギ誤差のタイプを判定するステップと、
    上記算出されたエネルギ誤差が第1のタイプである場合、上記現在のインクリメント値を第1の定数に設定するステップと、
    上記算出されたエネルギ誤差が第2のタイプである場合、上記現在のインクリメント値を第2の定数に設定するステップと、
    上記算出されたエネルギ誤差が上記許容歪みを下回っているか否かを判定するステップとを有する請求項8記載の歪み制御方法。
  10. 上記算出されたエネルギ誤差のタイプを判定するステップは、上記インクリメントされた個々の換算係数に関連する算出されたエネルギ誤差をerror_energy(sb)とし、第3の定数をKとし、許容歪みをallowed_distortionとして、
    error_energy(sb)>K*allowed_distortionの場合、上記算出されたエネルギ誤差を第1のタイプとし、
    error_energy(sb)≦K*allowed_distortionの場合、上記算出されたエネルギ誤差を第2のタイプとすることを特徴とする請求項9記載の歪み制御方法。
  11. 上記第1の定数、第2の定数及び第3の定数の値は、経験的に定義されることを特徴とする請求項10記載の歪み制御方法。
  12. 上記調整された共通換算係数を変更するステップは、
    上記複数の個々の換算係数に関連する現在のビット数が上記目標ビット数を超えているかを判定するステップと、
    上記調整された共通換算係数にオフセット値を加算し、修正された共通換算係数を算出するステップと、
    上記複数の個々の換算係数及び上記修正された共通換算係数に関連するビット数を算出するステップとを有することを特徴とする請求項1記載の歪み制御方法。
  13. 上記調整された共通換算係数が変更される場合、上記複数の個々の換算係数の再算出を省略するステップを更に有する請求項12記載の歪み制御方法。
  14. プロセッサにより実行されて、該プロセッサに歪み制御方法を実行させる命令を提供するコンピュータにより読取可能な媒体において、該歪み制御方法は、
    初期共通換算係数に関連する初期のビット数を決定するステップと、
    上記初期ビット数及び目標ビット数を用いて初期のインクリメント値を算出するステップと、
    上記初期のインクリメント値により上記初期共通換算係数をインクリメントするステップと、
    上記目標ビット数に基づいて、上記インクリメントされた共通換算係数を調整するステップと、
    上記調整された共通換算係数及び許容歪みに基づいて、複数の個々の換算係数を算出するステップと、
    上記複数の個々の換算係数に関連する現在のビット数が上記目標ビット数を超えている場合、該ビット数が上記目標ビット数を超えなくなるまで、上記調整された共通換算係数を変更するステップとを有するコンピュータにより読取可能な媒体。
  15. 上記歪み制御方法は、上記初期共通換算係数を決定するステップを更に有することを特徴とする請求項14記載のコンピュータにより読取可能な媒体。
  16. 上記初期共通換算係数を決定するステップは、
    フレーム内の最大のスペクトル係数を選択するステップと、
    上記最大のスペクトル係数が0である場合、上記初期共通換算係数を30に設定するステップと、
    上記最大のスペクトル係数が0ではない場合、上記初期共通換算係数を先の共通換算係数に設定するステップとを有することを特徴とする請求項15記載のコンピュータにより読取可能な媒体。
  17. 上記先の共通換算係数は、前フレームの共通換算係数又は他のチャンネルの共通換算係数のいずれかであることを特徴とする請求項16記載のコンピュータにより読取可能な媒体。
  18. メモリと、
    上記メモリに接続された、少なくとも1つのプロセッサとを備えるコンピュータシステムにおいて、
    上記少なくとも1つのプロセッサは、一連のインストラクションを実行することにより、
    初期共通換算係数に関連する初期のビット数を決定し、
    上記初期ビット数及び目標ビット数を用いて初期のインクリメント値を算出し、
    上記初期のインクリメント値により上記初期共通換算係数をインクリメントし、
    上記目標ビット数に基づいて、上記インクリメントされた共通換算係数を調整し、
    上記調整された共通換算係数及び許容歪みに基づいて、複数の個々の換算係数を算出し、
    上記複数の個々の換算係数に関連する現在のビット数が上記目標ビット数を超えている場合、該ビット数が上記目標ビット数を超えなくなるまで、上記調整された共通換算係数を変更するコンピュータシステム。
  19. 上記少なくとも1つのプロセッサは、一連のインストラクションを実行することにより、上記初期共通換算係数を決定することを特徴とする請求項18記載のコンピュータシステム。
  20. 上記少なくとも1つのプロセッサは、フレーム内の最大のスペクトル係数を選択し、上記最大のスペクトル係数が0である場合、上記初期共通換算係数を30に設定し、上記最大のスペクトル係数が0でない場合、上記初期共通換算係数を先の共通換算係数に設定することにより上記初期共通換算係数を決定することを特徴とする請求項19記載のコンピュータシステム。
  21. 上記先の共通換算係数は、前フレームの共通換算係数又は他のチャンネルの共通換算係数のいずれかであることを特徴とする請求項20記載のコンピュータシステム。
  22. 初期共通換算係数に関連する初期のビット数を決定するハフマン符号化モジュールと、
    上記初期ビット数及び目標ビット数を用いて初期のインクリメント値を算出し、上記初期のインクリメント値により上記初期共通換算係数をインクリメントし、上記目標ビット数に基づいて、上記インクリメントされた共通換算係数を調整し、上記調整された共通換算係数及び許容歪みに基づいて、複数の個々の換算係数を算出し、上記複数の個々の換算係数に関連する現在のビット数が目標ビット数を超えている場合、該ビット数が目標ビット数を超えなくなるまで、上記調整された共通換算係数を変更する量子化モジュールとを備える符号化装置。
  23. 上記量子化モジュールは、上記初期共通換算係数を決定することを特徴とする請求項22記載の符号化装置。
  24. 上記量子化モジュールは、フレーム内の最大のスペクトル係数を選択し、上記最大のスペクトル係数が0である場合、上記初期共通換算係数を30に設定し、上記最大のスペクトル係数が0でない場合、上記初期共通換算係数を先の共通換算係数に設定することにより上記初期共通換算係数を決定することを特徴とする請求項23記載の符号化装置。
  25. 初期共通換算係数に関連する初期のビット数を決定する決定手段と、
    上記初期ビット数及び目標ビット数を用いて初期のインクリメント値を算出する算出手段と、
    上記初期のインクリメント値により上記初期共通換算係数をインクリメントするインクリメント手段と、
    上記目標ビット数に基づいて、上記インクリメントされた共通換算係数を調整する調整手段と、
    上記調整された共通換算係数及び許容歪みに基づいて、複数の個々の換算係数を算出する算出手段と、
    上記複数の個々の換算係数に関連する現在のビット数が上記目標ビット数を超えている場合、該ビット数が上記目標ビット数を超えなくなるまで、上記調整された共通換算係数を変更する変更手段とを備える歪み制御装置。
JP2006533977A 2003-09-29 2004-09-23 オーディオ符号化におけるレート−歪み制御方法 Pending JP2007507750A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/674,945 US7349842B2 (en) 2003-09-29 2003-09-29 Rate-distortion control scheme in audio encoding
PCT/US2004/031312 WO2005033859A2 (en) 2003-09-29 2004-09-23 Rate-distortion control scheme in audio encoding

Publications (1)

Publication Number Publication Date
JP2007507750A true JP2007507750A (ja) 2007-03-29

Family

ID=34393516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006533977A Pending JP2007507750A (ja) 2003-09-29 2004-09-23 オーディオ符号化におけるレート−歪み制御方法

Country Status (7)

Country Link
US (1) US7349842B2 (ja)
EP (1) EP1671213B1 (ja)
JP (1) JP2007507750A (ja)
KR (1) KR101103004B1 (ja)
CN (1) CN1867967B (ja)
DE (1) DE602004028745D1 (ja)
WO (1) WO2005033859A2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005027096A1 (en) 2003-09-15 2005-03-24 Zakrytoe Aktsionernoe Obschestvo Intel Method and apparatus for encoding audio
KR20070061843A (ko) * 2004-09-28 2007-06-14 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치 및 스케일러블 부호화 방법
WO2006118179A1 (ja) * 2005-04-28 2006-11-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
RU2008114382A (ru) 2005-10-14 2009-10-20 Панасоник Корпорэйшн (Jp) Кодер с преобразованием и способ кодирования с преобразованием
JP4548348B2 (ja) * 2006-01-18 2010-09-22 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
US20070168197A1 (en) * 2006-01-18 2007-07-19 Nokia Corporation Audio coding
KR100738109B1 (ko) * 2006-04-03 2007-07-12 삼성전자주식회사 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
JP2007293118A (ja) * 2006-04-26 2007-11-08 Sony Corp 符号化方法および符号化装置
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
JP4396683B2 (ja) * 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
US8548816B1 (en) 2008-12-01 2013-10-01 Marvell International Ltd. Efficient scalefactor estimation in advanced audio coding and MP3 encoder
KR101078378B1 (ko) * 2009-03-04 2011-10-31 주식회사 코아로직 오디오 부호화기의 양자화 방법 및 장치
CN110706715B (zh) 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07336229A (ja) * 1994-06-09 1995-12-22 Matsushita Electric Ind Co Ltd 高能率符号化装置
JP2000082964A (ja) * 1998-06-26 2000-03-21 Ricoh Co Ltd 音響信号の符号化・量子化方法
JP2000347679A (ja) * 1999-06-07 2000-12-15 Mitsubishi Electric Corp オーディオ符号化装置及びオーディオ符号化方法
JP2001154698A (ja) * 1999-11-29 2001-06-08 Victor Co Of Japan Ltd オーディオ符号化装置及びその方法
JP2001306095A (ja) * 2000-04-18 2001-11-02 Mitsubishi Electric Corp オーディオ符号化装置及びオーディオ符号化方法
JP2002311993A (ja) * 2001-04-17 2002-10-25 Mitsubishi Electric Corp オーディオ符号化装置
WO2003044778A1 (en) * 2001-11-20 2003-05-30 Cirrus Logic Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US4964113A (en) * 1989-10-20 1990-10-16 International Business Machines Corporation Multi-frame transmission control for token ring networks
US5642437A (en) * 1992-02-22 1997-06-24 Texas Instruments Incorporated System decoder circuit with temporary bit storage and method of operation
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
IL104636A (en) * 1993-02-07 1997-06-10 Oli V R Corp Ltd Apparatus and method for encoding and decoding digital signals
US5729556A (en) * 1993-02-22 1998-03-17 Texas Instruments System decoder circuit with temporary bit storage and method of operation
US5748763A (en) * 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
WO1995032499A1 (fr) * 1994-05-25 1995-11-30 Sony Corporation Procede de codage, procede de decodage, procede de codage-decodage, codeur, decodeur et codeur-decodeur
JP3046224B2 (ja) * 1994-07-26 2000-05-29 三星電子株式会社 固定ビット率の符号化方法および装置とこれを利用した高速探索のためのトラッキング方法
TW316302B (ja) * 1995-05-02 1997-09-21 Nippon Steel Corp
EP0772925B1 (en) * 1995-05-03 2004-07-14 Sony Corporation Non-linearly quantizing an information signal
US5864802A (en) * 1995-09-22 1999-01-26 Samsung Electronics Co., Ltd. Digital audio encoding method utilizing look-up table and device thereof
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5893066A (en) * 1996-10-15 1999-04-06 Samsung Electronics Co. Ltd. Fast requantization apparatus and method for MPEG audio decoding
JP3484908B2 (ja) * 1997-01-27 2004-01-06 三菱電機株式会社 ビットストリーム再生装置
US5982935A (en) * 1997-04-11 1999-11-09 National Semiconductor Corporation Method and apparatus for computing MPEG video reconstructed DCT coefficients
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
US6108622A (en) * 1998-06-26 2000-08-22 Lsi Logic Corporation Arithmetic logic unit controller for linear PCM scaling and decimation in an audio decoder
US6298087B1 (en) * 1998-08-31 2001-10-02 Sony Corporation System and method for decoding a variable length code digital signal
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
JP3352406B2 (ja) * 1998-09-17 2002-12-03 松下電器産業株式会社 オーディオ信号の符号化及び復号方法及び装置
US6282631B1 (en) * 1998-12-23 2001-08-28 National Semiconductor Corporation Programmable RISC-DSP architecture
JP3739959B2 (ja) * 1999-03-23 2006-01-25 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP3323175B2 (ja) * 1999-04-20 2002-09-09 松下電器産業株式会社 符号化装置
JP2000323993A (ja) * 1999-05-11 2000-11-24 Mitsubishi Electric Corp Mpeg1オーディオレイヤiii復号処理装置およびコンピュータをmpeg1オーディオレイヤiii復号処理装置として機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体
JP4242516B2 (ja) * 1999-07-26 2009-03-25 パナソニック株式会社 サブバンド符号化方式
JP3762579B2 (ja) * 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6542863B1 (en) * 2000-06-14 2003-04-01 Intervideo, Inc. Fast codebook search method for MPEG audio encoding
US20030079222A1 (en) * 2000-10-06 2003-04-24 Boykin Patrick Oscar System and method for distributing perceptually encrypted encoded files of music and movies
JP2002311996A (ja) * 2001-02-09 2002-10-25 Sony Corp コンテンツ供給システム
JP3639216B2 (ja) * 2001-02-27 2005-04-20 三菱電機株式会社 音響信号符号化装置
US6587057B2 (en) * 2001-07-25 2003-07-01 Quicksilver Technology, Inc. High performance memory efficient variable-length coding decoder
US6732071B2 (en) * 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
EP1440433B1 (en) * 2001-11-02 2005-05-04 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
US6662154B2 (en) * 2001-12-12 2003-12-09 Motorola, Inc. Method and system for information signal coding using combinatorial and huffman codes
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
DE60323331D1 (de) * 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US20030215013A1 (en) * 2002-04-10 2003-11-20 Budnikov Dmitry N. Audio encoder with adaptive short window grouping
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
KR100547113B1 (ko) * 2003-02-15 2006-01-26 삼성전자주식회사 오디오 데이터 인코딩 장치 및 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07336229A (ja) * 1994-06-09 1995-12-22 Matsushita Electric Ind Co Ltd 高能率符号化装置
JP2000082964A (ja) * 1998-06-26 2000-03-21 Ricoh Co Ltd 音響信号の符号化・量子化方法
JP2000347679A (ja) * 1999-06-07 2000-12-15 Mitsubishi Electric Corp オーディオ符号化装置及びオーディオ符号化方法
JP2001154698A (ja) * 1999-11-29 2001-06-08 Victor Co Of Japan Ltd オーディオ符号化装置及びその方法
JP2001306095A (ja) * 2000-04-18 2001-11-02 Mitsubishi Electric Corp オーディオ符号化装置及びオーディオ符号化方法
JP2002311993A (ja) * 2001-04-17 2002-10-25 Mitsubishi Electric Corp オーディオ符号化装置
WO2003044778A1 (en) * 2001-11-20 2003-05-30 Cirrus Logic Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression

Also Published As

Publication number Publication date
KR101103004B1 (ko) 2012-01-05
KR20060084437A (ko) 2006-07-24
EP1671213A2 (en) 2006-06-21
WO2005033859A2 (en) 2005-04-14
US7349842B2 (en) 2008-03-25
EP1671213B1 (en) 2010-08-18
CN1867967B (zh) 2011-01-05
EP1671213A4 (en) 2008-08-20
US20050075871A1 (en) 2005-04-07
CN1867967A (zh) 2006-11-22
WO2005033859A3 (en) 2006-06-22
DE602004028745D1 (de) 2010-09-30

Similar Documents

Publication Publication Date Title
JP4794452B2 (ja) オーディオ符号化におけるmdctデータに基づくウィンドウタイプ決定方法
US11621009B2 (en) Audio processing for voice encoding and decoding using spectral shaper model
KR100469002B1 (ko) 오디오 코딩 방법 및 장치
EP0967593B1 (en) Audio coding and quantization method
JP2007507750A (ja) オーディオ符号化におけるレート−歪み制御方法
KR20090009784A (ko) 부호화 방법 및 부호화 장치
EP2555191A1 (en) Method and device for audio signal denoising
JP4750707B2 (ja) オーディオ符号化におけるショートウィンドウグループ化方法
JP2007510170A (ja) オーディオ符号化における高速コードブック選択方法
KR101987565B1 (ko) 오디오 파라미터 양자화
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
JPH09288498A (ja) 音声符号化装置
JP2001331198A (ja) 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
JP2003066998A (ja) 音響信号符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070823

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080612

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080612

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100712

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101206