JP2017037311A - 広義知覚類似性(wide−sense perceptual similarity)を使用するデジタルメディアスペクトルデータの効率的な復号 - Google Patents

広義知覚類似性(wide−sense perceptual similarity)を使用するデジタルメディアスペクトルデータの効率的な復号 Download PDF

Info

Publication number
JP2017037311A
JP2017037311A JP2016171531A JP2016171531A JP2017037311A JP 2017037311 A JP2017037311 A JP 2017037311A JP 2016171531 A JP2016171531 A JP 2016171531A JP 2016171531 A JP2016171531 A JP 2016171531A JP 2017037311 A JP2017037311 A JP 2017037311A
Authority
JP
Japan
Prior art keywords
band
shape
coefficients
spectral
spectral coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016171531A
Other languages
English (en)
Other versions
JP6262820B2 (ja
Inventor
メーロトラ サンジーブ
Sanjeev Mehrotra
メーロトラ サンジーブ
ウェイ−ジ チェン
Wei-Ge Chen
ウェイ−ジ チェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of JP2017037311A publication Critical patent/JP2017037311A/ja
Application granted granted Critical
Publication of JP6262820B2 publication Critical patent/JP6262820B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Lubricants (AREA)

Abstract

【課題】全部より少ないスペクトル係数を符号化することによってコーディングビットレートを保存することがあり、再構築時に、ぼやけた、低域通過した音が生成される可能性がある。
【解決手段】広義知覚類似性を使用するオーディオエンコーダは、すでにコード化されているスペクトルのスケーリングされたバージョンとして表された、省略されたスペクトル係数の知覚的に類似のバージョンを符号化する。省略されたスペクトル係数は、いくつかのサブバンドに分割され、サブバンドは、スケールファクタと、シェープパラメータとして符号化される。シェープパラメータは、すでにコード化されているスペクトルの一部分を指すモーションベクトル、固定コードブック内のスペクトル形状に対するインデックス、またはランダムノイズベクトルの形態にでき、復号時にスペクトルの似た形状の一部分のスケーリングされたバージョンが表される。
【選択図】図1

Description

本発明は、一般に、広義知覚類似性に基づくデジタルメディア(例えば、オーディオ、ビデオ、静止画など)符号化および復号に関する。
オーディオのコーディングには、人の聴力の様々な知覚モデルを利用するコーディング技法が使用される。例えば、強い音に近接する多数のより弱い音は覆い隠され、その結果、より弱い音はコード化することを必要としない。従来の知覚オーディオコーディングでは、これが様々な周波数データの適応量子化として利用される。知覚的に重要な周波数データには、より多くのビット、したがってより細かい量子化が割り振られ、逆も同様である。非特許文献1を参照されたい。
しかし、知覚コーディングは、広い意味に取ることができる。例えば、スペクトルのいくつかの部分は、適切にシェーピングされたノイズと共にコード化することができる。非特許文献2を参照されたい。この手法を取るとき、コード化された信号は、原形の正確な、またはほぼ正確なバージョンを表そうとしない可能性がある。目標はむしろ、原形に比べて同様に、また快く響かせることである。
これらの知覚効果はすべて、オーディオ信号のコーディングに必要とされるビットレートを削減するために使用することができる。これは、いくつかの周波数成分が、元の信号内にある場合のように正確に表現されることを必要とせず、コード化しない、あるいは原形における場合と同じ知覚効果を与える何かと置き換えることができるからである。
米国特許出願第10/020,708号明細書 米国特許出願第10/016,918号明細書 米国特許出願第10/017,702号明細書 米国特許出願第10/017,861号明細書 米国特許出願第10/017,694号明細書 Painter, T. and Spanias, A., "Perceptual Coding Of Digital Audio," Proceedings Of The IEEE, vol. 88, Issue 4, April 2000, pp. 451-515 Schulz, D., "Improving Audio Codecs By Noise Substitution," Journal Of The AES, vol. 44, no. 7/8, July/August 1996, pp. 593-598 ITU-R BS 1387
本明細書に述べられているデジタルメディア(例えば、オーディオ、ビデオ、静止画など)符号化/復号技法は、シェーピングされたノイズ、または他の周波数成分のシェーピングされたバージョン、あるいは両者の組合せを使用して、いくつかの周波数成分を知覚的に良好に、または部分的に表すことができることを利用する。より具体的には、いくつかの周波数帯域は、すでにコード化されている他の帯域のシェーピング済みバージョンとして、知覚的に良好に表すことができる。実際のスペクトルは、この合成バージョンから逸脱する可能性があるが、依然として、品質を落とすことなしにオーディオ信号符号化のビットレートを著しく減じるために使用することができる、知覚的に良好に表現されたも
のである。
大抵のオーディオコーデックは、変形離散コサイン変換(MDCT)またはMLT(Modulated Lapped Transform)など、サブバンド変換または重ね合わせ直交変換(overlapped orthogonal transform)を使用してスペクトル分解を使用し、オーディオ信号を時間領域表現からスペクトル係数のブロックまたは組に変換する。次いで、これらのスペクトル係数は、コード化され、デコーダに送られる。これらのスペクトル係数の値のコーディングが、オーディオコーデック内で使用される大抵のビットレートを構成する。低いビットレートでは、係数すべてを粗くコード化し、不十分な品質で再構成されるように、あるいは、より少ない係数をコード化し、こもった、低域通過した響きの信号となるように設計することができる。本明細書に述べられているオーディオ符号化/復号技法は、これらの後者を行うとき(すなわち、オーディオコーデックが少ない係数、すなわち、必ずしも下位互換性のためではないが、一般に低いビットレートをコード化することを選んだとき)オーディオ品質を改善するために使用することができる。
少ない係数が符号化されるだけのとき、コーデックは、再構築の際に、ぼやけた、低域通過した音を生成する。この品質を改善するために、この述べられている符号化/復号技法は、全ビットレートの小さな割合を費やして、欠けているスペクトル係数の知覚的に快いバージョンを追加し、完全な、より豊かな音を生み出す。これは、欠けている係数を実際にコード化することによってではなく、欠けている係数を、すでにコード化されているもののスケーリングされたバージョンとして知覚的に表すことによって達成される。一例では、(Microsoft Windows(登録商標)Media Audio(WMA)など)MLT分解を使用するコーデックは、ある割合の帯域幅までコード化する。次いで、述べられている符号化/復号技法のこのバージョンは、残りの係数を(それぞれが典型的には64個または128個のスペクトル係数からなるサブバンドなど)ある数の帯域に分割する。これらの帯域のそれぞれについて、このバージョンの符号化/復号技法は、2つのパラメータ、すなわち、その帯域内の全エネルギーを表すスケールファクタと、その帯域内でのスペクトルの形状を表すためのシェープパラメータ(shape parameter)とを使用して、その帯域を符号化する。スケールファクタパラメータは、単にその帯域内の係数のrms(2乗平均平方根)値とすることができる。シェープパラメータは、スペクトルの正規化バージョンを、すでにコード化されたスペクトルの同様な部分から単にコピーして符号化するモーションベクトルとすることができる。場合によっては、シェープパラメータは、代わりに、正規化されたランダムノイズベクトルを、または単に何らかの他の固定されたコードブックからのベクトルを指定することができる。スペクトルの別の部分から一部分をコピーすることは、オーディオにおいて有用である。というのは、一般に多数の音信号には、スペクトル全体にわたって繰り返す高調波成分があるからである。ノイズまたは何らかの他の固定コードブックの使用により、スペクトルの任意のすでにコード化された部分によって十分に表されない成分の低ビットレートコーディングが可能になる。このコーディング技法は、本質的に、これらの帯域の利得形状(gain−shape)ベクトル量子化コーディングであり、ベクトルは、スペクトル係数の周波数帯域であり、コードブックは、先にコード化されたスペクトルから取られ、他の固定ベクトルまたはランダムノイズベクトルをも含むことができる。また、スペクトルのこのコピーされた部分が、その同じ部分の従来のコーディングに追加される場合には、この追加は、残余コーディングである。これは、信号の従来のコーディングにより、少ないビットでコード化することが容易である基本表現(例えば、スペクトルフロアのコーディング)が得られ、残りの部分が新しいアルゴリズムでコード化される場合に有用となる可能性がある。
したがって、述べられている符号化/復号技法は、既存のオーディオコーデックを改善
する。具体的には、この技法は、所与の品質でのビットレートの削減を、または固定ビットレートでの品質の改善を可能にする。この技法を使用し、様々なモード(例えば、連続ビットレートまたは可変ビットレート、ワンパスまたはマルチパス)でオーディオコーデックを改善することができる。
本発明の追加の特徴および利点は、添付の図面を参照しながら進む以下の諸実施形態の詳細な説明から明らかになる。
本コーディング技法を組み込むことができるオーディオエンコーダのブロック図である。 本コーディング技法を組み込むことができるオーディオデコーダのブロック図である。 図1の一般的なオーディオエンコーダに組み込むことができる、広義知覚類似性を使用する効率的なオーディオコーディングを実装するベースバンドコーダおよび拡張帯域コーダのブロック図である。 図3の拡張帯域コーダ内で、広義知覚類似性を使用する効率的なオーディオコーディングで帯域を符号化する流れ図である。 図2の一般的なオーディオデコーダに組み込むことができるベースバンドデコーダおよび拡張帯域デコーダのブロック図である。 図5の拡張帯域デコーダ内で、広義知覚類似性を使用する効率的なオーディオコーディングで帯域を復号する流れ図である。 図1のオーディオエンコーダ/デコーダを実装するための好適なコンピューティング環境のブロック図である。
以下の詳細な説明は、本発明による広義知覚類似性を使用するデジタルメディアスペクトルデータのデジタルメディア符号化/復号を備えるデジタルメディアエンコーダ/デコーダ実施形態に対処する。より具体的には、以下の説明は、オーディオに対するこれらの符号化/復号技法の応用について述べている。これらは、他のデジタルメディアタイプ(例えば、ビデオ、静止画など)の符号化/復号に適用することもできる。そのオーディオへの応用では、このオーディオ符号化/復号は、シェーピングされたノイズ、または他の周波数成分のシェーピングされたバージョン、あるいは両者の組合せを使用していくつかの周波数成分を表す。より詳細には、いくつかの周波数帯域が、すでにコード化されている他の帯域のシェーピング済みバージョンとして表される。これは、所与の品質でのビットレートの削減を、または固定ビットレートでの品質の改善を可能にする。
1.一般化されたオーディオエンコーダ/デコーダ
図1および図2は、本明細書に述べられている、広義知覚類似性を使用するオーディオスペクトルデータのオーディオ符号化/復号のための技法を組み込むことができる一般化オーディオエンコーダ(100)および一般化オーディオデコーダ(200)のブロック図である。エンコーダおよびデコーダ内のモジュール間で示されている関係は、エンコーダおよびデコーダ内の情報の主流を示し、話を簡単にするために、他の関係は示されていない。実装と望まれる圧縮のタイプとに応じて、エンコーダまたはデコーダのモジュールは、追加する、割愛する、複数のモジュールに分ける、他のモジュールと組み合わせる、かつ/または同様なモジュールと置き換えることができる。代替の実施形態では、異なるモジュールおよび/またはモジュールの他の構成を有するエンコーダまたはデコーダが、知覚的なオーディオ品質を測定する。
広義知覚類似性オーディオスペクトルデータ符号化/復号を組み込むことができるオー
ディオエンコーダ/デコーダのさらなる詳細は、2001年12月14日に出願された特許文献1、2001年12月14日に出願された特許文献2、2001年12月14日に出願された特許文献3、2001年12月14日に出願された特許文献4、2001年12月14日に出願された特許文献5に述べられており、これらの開示を参照により本明細書に組み込む。
A.一般化オーディオエンコーダ
一般化オーディオエンコーダ(100)は、周波数トランスフォーマ(110)、多重チャネルトランスフォーマ(120)、知覚モデラ(130)、ウェイタ(weighter)(140)、量子化器(150)、エントロピーエンコーダ(160)、レート/品質コントローラ(170)、ビットストリームマルチプレクサ[MUX](180)を含む。
エンコーダ(100)は、表1に示されているものなどのフォーマットで入力オーディオサンプル(105)の時間系列を受け取る。複数のチャネルを有する入力(例えば、ステレオモード)の場合、エンコーダ(100)は、各チャネルを独立して処理し、多重チャネルトランスフォーマ(120)の後で、一緒にコード化されたチャネルを扱うことができる。エンコーダ(100)は、オーディオサンプル(105)を圧縮し、エンコーダ(100)の様々なモジュールによって生成された情報を多重化して、WMA[Windows(登録商標)Media Audio]またはASF[Advanced Streaming Format]など、あるフォーマットでビットストリーム(195)を出力する。別法として、エンコーダ(100)は、他の入力フォーマットおよび/または出力フォーマットを扱うことができる。
周波数トランスフォーマ(110)は、オーディオサンプル(105)を受け取り、それらを周波数領域内のデータに変換する。周波数トランスフォーマ(110)は、可変の時間的分解能(temporal resolution)を可能にするように可変のサイズを有することができるブロックに、オーディオサンプル(105)を分ける。小さなブロックは、入力オーディオサンプル(105)内の短いが活動的な遷移セグメントで時間詳細をより多く保存することを可能にするが、何らかの周波数分解能を犠牲にする。それに対して、より大きなブロックは、周波数分解能が良くなり時間分解能が悪化し、通常、より長く、あまり活動的でないセグメントで、より高い圧縮効率を可能にする。ブロックは重なり合うことができ、普通なら後の量子化によって導入されるはずの、ブロック間の知覚可能な不連続を低減する。周波数トランスフォーマ(110)は、周波数係数データのブロックを多重チャネルトランスフォーマ(120)に出力し、ブロックサイズなど側面情報をMUX(180)に出力する。周波数トランスフォーマ(110)は、周波数係数データと側面情報を共に知覚モデラ(130)に出力する。
周波数トランスフォーマ(110)は、オーディオ入力サンプル(105)のフレームを、時間依存性のサイズを有する、重なり合うサブフレームブロックに区分し、時間依存性のMLTをサブフレームブロックに適用する。可能なサブフレームサイズは、128、256、512、1024、2048、4096個のサンプルを含む。MLTは、時間ウィンドウ関数によって変調されたDCTのように演算し、このウィンドウ関数は、時間依存性であり、サブフレームサイズのシーケンスによって決まる。MLTは、サンプルの所与の重なり合うブロックx[n],0≦n<subframe_sizeを、周波数係数のブロックX[k],0≦k<subframe_size/2に変換する。周波数トランスフォーマ(110)はまた、将来のフレームの複雑さの推定値をレート/品質コントローラ(170)に出力することができる。代替の実施形態は、他の様々なMLTを使用する。さらに他の代替の実施形態では、周波数トランスフォーマ(110)は、DCT、FFT、または他のタイプの変調もしくは非変調、重ね合わせもしくは非重ね合わせ周波
数変換を適用し、あるいは、サブバンドまたはウェーブレットコーディングを使用する。
多重チャネルオーディオデータの場合、周波数トランスフォーマ(110)によって生成された周波数係数データの複数のチャネルは、しばしば相関関係にある。この相関を利用するために、多重チャネルトランスフォーマ(120)は、複数の元の、独立してコード化されたチャネルを、一緒にコード化されたチャネルに変換することができる。例えば、入力がステレオモードである場合、多重チャネルトランスフォーマ(120)は、左右のチャネルを和と差のチャネルに変換することができる。すなわち
Figure 2017037311
あるいは、多重チャネルトランスフォーマ(120)は、左右のチャネルを、独立してコード化されたチャネルとして通過させることができる。より一般的には、2つ以上のいくつかの入力チャネルの場合、多重チャネルトランスフォーマ(120)は、元の独立してコード化されたチャネルを変更しないで通過させ、または、元のチャネルを、一緒にコード化されたチャネルに変換する。独立してコード化されたチャネルか、それとも一緒にコード化されたチャネルを使用する判断は、所定のものとすることができ、あるいは、符号化中、ブロックなどごとに順応して判断を行うことができる。多重チャネルトランスフォーマ(120)は、MUX(180)に対する側面情報を生成し、使用されているチャネル変換モードを示す。
知覚モデラ(130)は、所与のビットレートについて、再構築されたオーディオ信号の品質を改善するために、人の聴覚系の特性をモデル化する。知覚モデラ(130)は、周波数係数の可変サイズブロック励振パターンを計算する。最初に、知覚モデラ(130)は、ブロックのサイズおよび振幅スケールを正規化する。これは、後続の時間的なスミアリングを可能にし、品質測定のための一貫したスケールを確立する。任意選択で、知覚モデラ(130)は、外/中耳伝達関数をモデル化するために、ある周波数で係数を減衰する。知覚モデラ(130)は、ブロック内の係数のエネルギーを計算し、25個の臨界帯域によってエネルギーを集める。別法として、知覚モデラ(130)は、別の数の臨界帯域(例えば、55または109)を使用する。臨界帯域のための周波数範囲は実装によって決まり、多数の選択肢が周知である。例えば、非特許文献3、またはそこに述べられている参照を参照されたい。知覚モデラ(130)は、帯域エネルギーを処理し、同時および時間的なマスキングを調節する。代替の実施形態では、知覚モデラ(130)は、非特許文献3に記載され、または述べられているものなど、異なる聴覚モデルに従ってオーディオデータを処理する。
ウェイタ(140)は、知覚モデラ(130)から受け取られた励振パターンに基づいて、重み係数(あるいは、量子化行列と呼ばれる)を生成し、その重み係数を、多重チャネルトランスフォーマ(120)から受け取られたデータに適用する。重み係数は、オーディオデータ内の複数の量子化帯域のそれぞれについて重みを含む。量子化帯域は、エンコーダ(100)内のどこかで使用された臨界帯域と、数または位置を同じとすることも、異なるものとすることもできる。重み係数は、ノイズがその量子化帯域全体にわたって拡散される比率を示し、ノイズがあまり聞き取れない帯域内に、より多くのノイズを置くことによってノイズの可聴性を最小限に抑え、またその逆にすることを目標とする。重み
係数は、量子化帯域の振幅および数がブロック間で変わる可能性がある。一実装では、量子化帯域の数は、ブロックサイズに従って変わり、ブロックが小さいと、大きいブロックより量子化帯域が少なくなる。例えば、128個の係数を有するブロックは、13個の量子化帯域を有し、256個の係数を有するブロックは、15個の量子化帯域を有し、2048個の係数を有するブロックについての25個の量子化帯域に至る。ウェイタ(140)は、独立して、または一緒にコード化されたチャネル内の多重チャネルオーディオデータの各チャネルについて、1組の重み係数を生成し、あるいは、一緒にコード化されたチャネルについて重み係数の単一の組を生成する。代替の実施形態では、ウェイタ(140)は、励振パターン以外に、または励振パターンに加えて、情報から重み係数を生成する。
ウェイタ(140)は、係数データの加重ブロックを量子化器(150)に出力し、重み係数の組など側面情報をMUX(180)に出力する。ウェイタ(140)はまた、レート/品質コントローラ(170)、またはエンコーダ(100)内の他のモジュールに重み係数を出力することができる。重み係数の組は、より効率的に提示するために圧縮することができる。重み係数が不可逆圧縮される場合、再構築後の重み係数は、一般に、係数データのブロックを加重するために使用される。ブロックの帯域内のオーディオ情報が、何らかの理由(例えば、ノイズ置換または帯域トランケーション)で完全に省略される場合、エンコーダ(100)は、そのブロックについて量子化行列の圧縮をさらに改善することが可能となる。
量子化器(150)は、ウェイタ(140)の出力を量子化し、エントロピーエンコーダ(160)に対して量子化された係数データを、また、MUX(180)に対して量子化ステップサイズを含む側面情報を生成する。量子化は、情報の不可逆な損失を導入するが、エンコーダ(100)がレート/品質コントローラ(170)と共に出力ビットストリーム(195)のビットレートを調節することも可能になる。図1では、量子化器(150)は適応性の均一なスカラ量子化器である。量子化器(150)は、各周波数係数に同じ量子化ステップサイズを適用するが、量子化ステップサイズそれ自体は、反復1回ごとに変化し、エントロピーエンコーダ(160)出力のビットレートに影響を及ぼす可能性がある。代替の実施形態では、量子化器は、不均一量子化器、ベクトル量子化器、および/または非適応量子化器である。
エントロピーエンコーダ(160)は、量子化器(150)から受け取られた量子化済み係数データを可逆圧縮する。例えば、エントロピーエンコーダ(160)は、マルチレベルランレングス符号化、バリアブルトゥバリアブルレングス符号化(variable−to−variable length coding)、ランレングス符号化、ハフマン符号化、辞書符号化、算術符号化、LZ符号化、上記の組合せ、または何らかの他のエントロピー符号化技法を使用する。
レート/品質コントローラ(170)は、量子化器(150)と共に働き、エンコーダ(100)の出力のビットレートおよび品質を調節する。レート/品質コントローラ(170)は、エンコーダ(100)の他のモジュールから情報を受け取る。一実装では、レート/品質コントローラ(170)は、周波数トランスフォーマ(110)から将来の複雑さの推定値を、知覚モデラ(130)からサンプリングレート、ブロックサイズ情報、元のオーディオデータの励振パターン、ウェイタ(140)から重み係数を、MUX(180)から(例えば、量子化、再構築、または符号化された)何らかの形態の量子化済みオーディオ情報のブロックとバッファ状況情報とを受け取る。レート/品質コントローラ(170)は、オーディオデータを量子化された形態から再構築するために、逆量子化器、逆ウェイタ、逆多重チャネルトランスフォーマ、またおそらくはエントロピーデコーダおよび他のモジュールを含むことができる。
レート/品質コントローラ(170)は、現在の条件を与えられると、所望の量子化ステップサイズを決定するために情報を処理し、量子化ステップサイズを量子化器(150)に出力する。次いで、レート/品質コントローラ(170)は、下記で述べるように、その量子化ステップサイズで量子化された再構築後オーディオデータのブロックの品質を測定する。測定された品質、ならびにビットレート情報を使用して、レート/品質コントローラ(170)は、瞬間的にも長期的にもビットレート制約および品質制約を満たすという目標を用いて、量子化ステップサイズを調整する。代替の実施形態では、レート/品質コントローラ(170)は、異なる、または追加の情報を扱い、あるいは、様々な技法を適用し、品質およびビットレートを調節する。
レート/品質コントローラ(170)と共に、エンコーダ(100)は、ノイズ置換、帯域トランケーション、および/または多重チャネル再マトリックス化をオーディオデータのブロックに適用することができる。低ビットレートおよび中間ビットレートでは、オーディオエンコーダ(100)は、ノイズ置換を使用し、ある帯域内で情報を搬送することができる。帯域トランケーションでは、あるブロックについて測定された品質が、不十分な品質であることを示す場合、エンコーダ(100)は、ある(通常、より高い周波数の)帯域内の係数を省略し、残りの帯域内で全体的な品質を改善することができる。多重チャネル再マトリックス化では、一緒にコード化されたチャネル内の低ビットレートの多重チャネルオーディオデータについて、エンコーダ(100)は、あるチャネル(例えば、差のチャネル)内の情報を抑制し、残りのチャネル(例えば、和のチャネル)の品質を改善することができる。
MUX(180)は、オーディオエンコーダ(100)の他のモジュールから受け取られた側面情報を、エントロピーエンコーダ(160)から受け取られたエントロピー符号化データと共に多重化する。MUX(180)は、その情報をWMAで、またはオーディオデコーダが認識する別のフォーマットで出力する。
MUX(180)は、エンコーダ(100)によって出力すべきビットストリーム(195)を格納する仮想バッファを含む。この仮想バッファは、オーディオ内の複雑さの変化によるビットレートの短期揺らぎを滑らかにするために、所定の期間のオーディオ情報(例えば、ストリーミングオーディオについて5秒)を格納する。次いで、この仮想バッファは、比較的一定のビットレートでデータを出力する。バッファの現在の満杯度、バッファの満杯度の変化率、バッファの他の特性は、レート/品質コントローラ(170)が品質およびビットレートを調節するために使用することができる。
B.一般化オーディオデコーダ
図2を参照すると、一般化オーディオデコーダ(200)は、ビットストリームデマルチプレクサ[DEMUX](210)、エントロピーデコーダ(220)、逆量子化器(230)、ノイズ発生器(240)、逆ウェイタ(250)、逆多重チャネルトランスフォーマ(260)、逆周波数トランスフォーマ(270)を含む。デコーダ(200)はレート/品質制御のためのモジュールを含まないため、デコーダ(200)は、エンコーダ(100)より単純である。
デコーダ(200)は、WMAまたは別のフォーマットの圧縮済みオーディオデータのビットストリーム(205)を受け取る。ビットストリーム(205)は、エントロピー符号化データと、デコーダ(200)がそこからオーディオサンプル(295)を再構築する側面情報とを含む。複数のチャネルを有するオーディオデータの場合、デコーダ(200)は、各チャネルを独立して処理し、逆多重チャネルトランスフォーマ(260)の前に、一緒にコード化されたチャネルを扱うことができる。
DEMUX(210)は、ビットストリーム(205)内の情報を解析し、デコーダ(200)のモジュールに情報を送る。DEMUX(210)は、オーディオの複雑さの揺らぎ、ネットワークジッタ、および/または他の要因によるビットレートの短期変動を補償するために、1つまたは複数のバッファを含む。
エントロピーデコーダ(220)は、DEMUX(210)から受け取られたエントロピー符号を可逆伸張し、量子化された周波数係数データを生成する。エントロピーデコーダ(220)は、一般に、エンコーダ内で使用されたエントロピー符号化技法の逆を適用する。
逆量子化器(230)は、DEMUX(210)から量子化ステップサイズを受け取り、エントロピーデコーダ(220)から量子化周波数係数データを受け取る。逆量子化器(230)は、量子化ステップサイズを量子化周波数係数データに適用し、周波数係数データを部分的に再構築する。代替の実施形態では、逆量子化器は、エンコーダ内で使用された何らかの他の量子化技法の逆を適用する。
ノイズ発生器(240)は、DEMUX(210)から、データのブロック内のどの帯域がノイズ置換されているかという指示と、ノイズの形態のための任意のパラメータとを受け取る。ノイズ発生器(240)は、示された帯域のためのパターンを生成し、その情報を逆ウェイタ(250)に渡す。
逆ウェイタ(250)は、DEMUX(210)から重み係数を、ノイズ発生器(240)から任意のノイズ置換帯域のためのパターンを、逆量子化器(230)から部分的に再構築された周波数係数データを受け取る。必要に応じて、逆ウェイタ(250)は、重み係数を伸張する。逆ウェイタ(250)は、ノイズ置換されていない帯域について、部分的に再構築された周波数係数データに重み係数を適用する。次いで、逆ウェイタ(250)は、ノイズ発生器(240)から受け取られたノイズパターンを加える。
逆多重チャネルトランスフォーマ(260)は、逆ウェイタ(250)から再構築済み周波数係数データを、DEMUX(210)からチャネル変換モード情報を受け取る。多重チャネルデータが、独立してコード化されたチャネル内にある場合、逆多重チャネルトランスフォーマ(260)は、そのチャネルを通過させる。多重チャネルデータが、一緒にコード化されたチャネル内にある場合、逆多重チャネルトランスフォーマ(260)は、そのデータを、独立してコード化されたチャネル内に変換する。望むなら、デコーダ(200)は、この時点で、再構築された周波数係数データの品質を測定することができる。
逆周波数トランスフォーマ(270)は、逆多重チャネルトランスフォーマ(260)によって出力された周波数係数データと、DEMUX(210)からのブロックサイズなど側面情報とを受け取る。逆周波数トランスフォーマ(270)は、エンコーダ内で使用された周波数変換の逆を適用し、再構築されたオーディオサンプル(295)のブロックを出力する。
2.広義知覚類似性を用いる符号化/復号
図3は、図1および図2の一般化オーディオエンコーダ(100)およびデコーダ(200)の全体的なオーディオ符号化/復号プロセス内に組み込むことができる、広義知覚類似性を用いる符号化を使用するオーディオエンコーダ(300)の一実装を示す。この実施では、オーディオエンコーダ(300)は、MDCTまたはMLTなどサブバンド変換または重ね合わせ直交変換を使用して、変換(320)においてスペクトル分解を実行
し、オーディオ信号の各入力ブロックについて1組のスペクトル係数を生成する。従来周知であるように、オーディオエンコーダは、出力ビットストリーム内でデコーダに送るために、これらのスペクトル係数をコード化する。これらのスペクトル係数の値のコーディングが、オーディオコーデック内で使用される大抵のビットレートを構成する。低いビットレートでは、オーディオエンコーダ(300)は、ベースバンドコーダ340を使用して、スペクトルのより低い部分、またはベースバンド部分など、より少ないスペクトル係数(すなわち、周波数トランスフォーマ(110)から出力されるスペクトル係数の帯域幅のある割合内で符号化することができるいくつかの係数)をコード化することを選択する。ベースバンドコーダ340は、上記で一般化オーディオエンコーダについて述べられているように、これらのベースバンドスペクトル係数を、従来周知のコーディング構文を使用して符号化する。これにより、一般に、再構築されたオーディオは、こもって響く、または低域通過ろ波されることになる。
オーディオエンコーダ(300)は、広義知覚類似性を使用して、割愛されたスペクトル係数をもコード化することによって、こもった/低域通過効果を回避する。ベースバンドコーダ340によるコーディングから割愛された(ここでは「拡張帯域スペクトル係数」と呼ばれる)スペクトル係数は、シェーピングされたノイズ、または他の周波数成分のシェーピングされたバージョン、あるいはこの2つの組合せとして、拡張帯域コーダ350によってコード化される。より具体的には、拡張帯域スペクトル係数は、いくつかの(例えば、典型的には64個または128個のスペクトル係数の)サブバンドに分割され、これらのサブバンドは、シェーピングされたノイズ、または他の周波数成分のシェーピングされたバージョンとしてコード化される。これは欠けているスペクトル係数の知覚的に快いバージョンを追加し、完全な、より豊かな音を提供する。実際のスペクトルは、この符号化から得られる合成バージョンから逸脱する可能性があるが、この拡張帯域コーディングは、原形における場合と同様な知覚効果をもたらす。
いくつかの実装では、ベースバンドの幅(すなわち、ベースバンドコーダ340を使用してコード化されるベースバンドスペクトル係数の数)、ならびに拡張帯域のサイズまたは数が変わる可能性がある。そのような場合には、ベースバンドの幅、および拡張帯域コーダ(350)を使用してコード化される拡張帯域の数(またはサイズ)を、出力ストリーム(195)内にコード化することができる。
オーディオエンコーダ(300)内におけるベースバンドスペクトル係数と拡張帯域係数の間のビットストリームの区分は、ベースバンドコーダのコーディング構文に基づいて既存のデコーダとの下位互換性を確保するし、その結果、そのような既存のデコーダが、拡張部分を無視しながら、ベースバンドでコード化された部分を復号することができるように行われる。その結果、より新しいデコーダだけが、拡張帯域でコード化されたビットストリームによってカバーされる完全なスペクトルを表す能力を有し、一方、より旧型のデコーダは、エンコーダが既存の構文を用いて符号化することを選んだ部分を表すことができるだけである。周波数境界は、柔軟かつ時間依存性とすることができる。信号特性に基づいてエンコーダが判断し、デコーダに明示的に送ることも、送ることを必要としないように、復号されたスペクトルの関数とすることもできる。既存のデコーダは、既存の(ベースバンド)コーデックを使用してコード化される部分を復号することができるだけであるため、これは、スペクトルのより低い部分が既存のコーデックでコード化され、より高い部分は、広義知覚類似性を使用して、拡張帯域コーディングを使用してコード化されることを意味する。
そのような下位互換性が必要とされない他の実装では、エンコーダは、周波数位置を考えることなしに、信号特性と符号化のコストだけに基づいて、従来のベースバンドコーディングと拡張帯域(広義知覚類似性手法)との間で自由に選ぶことができる。例えば、自
然信号では非常に可能性が低いが、より高い周波数を従来のコーデックで、また、より低い部分を、拡張コーデックを使用して符号化するほうがよい可能性がある。
図4は、拡張帯域スペクトル係数を符号化するために、図3の拡張帯域コーダ(350)によって実行されるオーディオ符号化プロセス(400)を示す流れ図である。このオーディオ符号化プロセス(400)では、拡張帯域コーダ(350)は、拡張帯域スペクトル係数をいくつかのサブバンドに分割する。典型的な実装では、これらのサブバンドは、一般にそれぞれ64個または128個のスペクトル係数で構成されることになる。別法として、他のサイズのサブバンド(例えば、16、32、または他の数のスペクトル係数)を使用することができる。サブバンドは、互いに素なものとすることも、(ウィンドウイングを使用して)重なり合うものとすることもできる。重なり合うサブバンドの場合、より多くの帯域がコード化される。例えば、サイズ64のサブバンドを用いる拡張帯域コーダを使用して、128個のスペクトル係数をコード化しなければならない場合、2つの互いに素な帯域を使用して係数をコード化する、すなわち、係数0から63を一方のサブバンドとして、また係数64から127を他方としてコード化することができる。別法として、50%の重なり合いで3つの重なり合う帯域を使用する、すなわち、0から63を1つの帯域として、また32から95を別の帯域として、また64から127を第3の帯域としてコード化することができる。
これらのサブバンドのそれぞれについて、拡張帯域コーダ(350)は、2つのパラメータを使用して帯域を符号化する。一方のパラメータ(「スケールパラメータ」)は、帯域内の全エネルギーを表すスケールファクタである。他方のパラメータ(概してモーションベクトルの形態の「シェープパラメータ」)は、帯域内のスペクトルの形状を表すために使用される。
図4の流れ図に示されているように、拡張帯域コーダ(350)は、拡張帯域の各サブバンドについて処理(400)を実行する。最初に(420で)拡張帯域コーダ(350)は、スケールファクタを計算する。一実装では、スケールファクタは、単に現在のサブバンド内の係数のrms(2乗平均平方根)値である。これは、係数すべての平均2乗値の平方根をとることによって見出される。平均2乗値は、サブバンド内の係数すべての2乗値の和をとり、係数の数で割ることによって見出される。
次いで、拡張帯域コーダ(350)は、シェープパラメータを決定する。シェープパラメータは、通常、スペクトルの正規化バージョンを、すでにコード化されたスペクトルの一部分(すなわち、ベースバンドコーダでコード化されたベースバンドスペクトル係数の一部分)から単にコピーして符号化することを示すモーションベクトルである。場合によっては、シェープパラメータは、代わりに、正規化されたランダムノイズベクトルを、または単に、固定されたコードブックからのスペクトル形状のためのベクトルを指定することができる。スペクトルの別の部分から形状をコピーすることは、オーディオにおいて有用である。というのは、一般に多数の音信号には、スペクトル全体にわたって繰り返す高調波成分があるからである。ノイズまたは何らかの他の固定コードブックの使用により、スペクトルの、ベースバンドでコード化された部分で十分に表されない成分の低ビットレートコーディングが可能になる。したがって、プロセス(400)は、本質的にこれらの帯域の利得形状ベクトル量子化コーディングであり、ベクトルがスペクトル係数の周波数帯域であり、コードブックが、先にコード化されたスペクトルから取られ、他の固定ベクトルまたはランダムノイズベクトルをも含むことができるコーディングの方法を提供する。すなわち、拡張帯域コーダによってコード化された各サブバンドは、「a」がスケールパラメータであり「X」がシェープパラメータによって表されるベクトルであるa・Xとして表され、先にコード化されたスペクトル係数の正規化バージョン、固定されたコードブックからのベクトル、またはランダムノイズベクトルとすることができる。また、スペ
クトルのこのコピーされた部分が、その同じ部分の従来のコーディングに追加される場合には、この追加は、残余コーディングである。これは、信号の従来のコーディングにより、少ないビットでコード化することが容易である基本表現(例えば、スペクトルフロアのコーディング)が得られ、残りの部分が新しいアルゴリズムでコード化される場合に有用となる可能性がある。
より具体的には、アクション(430)で、拡張帯域コーダ(350)は、同様な帯域のためのベースバンドスペクトル係数を、拡張帯域の現在のサブバンドと同様な形状を有するベースバンドスペクトル係数から探索する。拡張帯域コーダは、ベースバンドの各部分の正規化バージョンに対する最小平均2乗比較を使用して、ベースバンドのどの部分が現在のサブバンドに最も似ているか判定する。例えば、入力ブロックから変換(320)によって生成された256個のスペクトル係数があり、拡張帯域サブバンドは、それぞれ幅が16個のスペクトル係数であり、ベースバンドコーダは、(0から127と採番された)最初の128個のスペクトル係数をベースバンドとして符号化する場合を考えてみる。次いで、探索により、係数位置0から111(すなわち、この場合には、ベースバンド内でコード化された合計112個の可能な、異なるスペクトル形状)で始まるベースバンドの各16スペクトル係数部分の正規化バージョンに対して、各拡張帯域内の正規化された16個のスペクトル係数の最小平均2乗比較が実行される。最も低い最小平均2乗値を有するベースバンド部分が、現在の拡張帯域に形状が最も近い(最も似ている)と見なされる。アクション(432)で、拡張帯域コーダは、ベースバンドスペクトル係数からのこの最も似ている帯域が、現在の拡張帯域に形状において十分に近い(例えば、最小平均2乗値が予め選択された閾値より低い)かどうか検査する。近い場合には、アクション(434)で、拡張帯域コーダは、ベースバンドスペクトル係数のこの最も近い合致帯域を指すモーションベクトルを決定する。このモーションベクトルは、ベースバンド内の開始係数位置(例えば、この例では0から111)とすることができる。(調性対非調性を検査することなど)他の方法もまた、ベースバンドスペクトル係数からの最も似ている帯域が、現在の拡張帯域に形状において十分に近いかどうか確かめるために使用することができる。
ベースバンドの十分に近い部分が見出せない場合には、拡張帯域コーダは、現在のサブバンドを表すためにスペクトル形状の固定コードブックを見る。拡張帯域コーダは、現在のサブバンドのスペクトル形状に似たスペクトル形状があるかどうか、この固定コードブックを探索する。見出された場合、拡張帯域コーダは、アクション(444)で、コードブック内のそのインデックスをシェープパラメータとして使用する。そうでない場合、アクション(450)で、拡張帯域コーダは、現在のサブバンドの形状を、正規化されたランダムノイズベクトルとして表すことを決定する。
代替の実装では、拡張帯域コーダは、ベースバンド内の最良のスペクトル形状があるかどうか探索する前でさえも、ノイズを使用してスペクトル係数を表すことができるかどうか判断することができる。このようにして、十分近いスペクトル形状がベースバンド内で見出された場合でも、拡張帯域コーダは、依然としてその部分を、ランダムノイズを使用してコード化することになる。これにより、ベースバンド内の位置に対応するモーションベクトルを送ることに比べたとき、ビットが少なくなる可能性がある。
アクション(460)で、拡張帯域コーダは、予測符号化、量子化、および/またはエントロピー符号化を使用して、スケールパラメータおよびシェープパラメータ(すなわち、この実装では、スケーリングファクタとモーションベクトル)を符号化する。一実装では、例えば、スケールパラメータは、直前の拡張サブバンドに基づいて予測符号化される(拡張帯域のサブバンドのスケーリングファクタは、一般に値が似ており、その結果、連続するサブバンドは、一般に値が近いスケーリングファクタを有する)。換言すれば、拡
張帯域の最初のサブバンドについてのスケーリングファクタの完全な値が符号化される。後続のサブバンドは、それらの実際の値の、それらの予測値からの差としてコード化される(すなわち、予測値は、先行するサブバンドのスケーリングファクタである)。多重チャネルオーディオの場合、各チャネル内の拡張帯域の最初のサブバンドが、その完全な値として符号化され、後続のサブバンドのスケーリングファクタが、そのチャネル内の先行するサブバンドのスケーリングファクタから予測される。代替の実装では、スケールパラメータはまた、変形形態の中でもとりわけ、2つ以上の他のサブバンドから、またはベースバンドスペクトルから、または以前のオーディオ入力ブロックからチャネル全体にわたって予測することができる。
さらに拡張帯域コーダは、均一量子化または不均一量子化を使用して、スケールパラメータを量子化する。一実装では、スケールパラメータの不均一量子化が使用され、スケーリングファクタの対数が128個のビンに不均一に量子化される。次いで、得られた量子化値が、ハフマン符号化を使用してエントロピー符号化される。
シェープパラメータの場合、拡張帯域コーダはまた、(スケールパラメータの場合と同様に先行するサブバンドから予測することができる)予測符号化、64個のビンへの量子化、および(例えば、ハフマン符号化を用いる)エントロピー符号化を使用する。
いくつかの実装では、拡張帯域サブバンドは、サイズが可変であるものとすることができる。そのような場合、拡張帯域コーダはまた、拡張帯域の構成を符号化する。
より具体的には、例示的な一実装では、拡張帯域コーダは、以下のコード表内の擬似コードリストによって示されているように、スケールパラメータおよびシェープパラメータを符号化する。
Figure 2017037311
上記のコードリストでは、帯域構成(すなわち、帯域の数、およびそのサイズ)を指定するためのコーディングは、拡張帯域コーダを使用してコード化すべきスペクトル係数の数によって決まる。拡張帯域コーダを使用してコード化される係数の数は、拡張帯域の開始位置およびスペクトル係数の総数を使用して見出すことができる(拡張帯域コーダを使用してコード化されるスペクトル係数の数=スペクトル係数の総数−開始位置)。次いで、帯域構成は、許されるすべての可能な構成のリスト内へのインデックスとしてコード化
される。このインデックスは、n_config=log2(構成の数)個のビットを有する固定長符号を使用してコード化される。許される構成は、この方法を使用してコード化されるスペクトル係数の数の関数である。例えば、128個の係数をコード化すべき場合、デフォルト構成は、サイズ64の2帯域である。例えば、以下の表にリストされているように、他の構成も可能とすることができる。
Figure 2017037311
したがって、この例では、5つの可能な帯域構成がある。そのような構成では、係数のためのデフォルト構成は、「n」個の帯域を有するものとして選ばれる。各帯域が分かれる、またはマージする(1レベルだけ)ことを可能にすると、5(n/2)個の可能な構成が
有り、これは、コード化するために(n/2)log2(5)個のビットを必要とする。他の実装では、可変長コーディングを使用し、構成をコード化することができる。
上記で論じたように、スケールファクタは、予測符号化を使用してコード化され、予測は、同じチャネル内の以前の帯域からの、または同じタイル内の以前のチャネルからの、または先に復号されたタイルからの先にコード化されたスケールファクタからとることができる。所与の実装について、予測のための選択は、(同じ拡張帯域、チャネル、またはタイル(入力ブロック)内の)以前のどの帯域に最も高い相関が与えられるか見ることによって行うことができる。一実装例では、帯域は、次のように予測符号化される。すなわち、
タイル内のスケールファクタをx[i][j]とする。ただし、i=チャネルインデックス、j=帯域インデックス
For i==0&&j==0(最初のチャネル、最初の帯域)、予測なし
For i!==0&&j==0(他のチャネル、最初の帯域)、予測はx[0][0](最初のチャネル、最初の帯域)
For i!==0&&j!==0(他のチャネル、他の帯域)、予測はx[i][j−1](同じチャネル、以前の帯域)
上記のコード表では、「シェープパラメータ」は、以前のスペクトル係数の位置を指定するモーションベクトル、または固定コードブックからのベクトル、またはノイズである。以前のスペクトル係数は、同じチャネル内から、または以前のチャネルから、または以前のタイルからのものとすることができる。シェープパラメータは予測を使用してコード化され、予測は、同じチャネル内の、または同じタイル内の以前のチャネル内の、または以前のタイルからの以前の帯域についての以前の位置からとられる。
図5は、オーディオエンコーダ(300)によって生成されたビットストリーム用のオーディオデコーダ(500)を示す。このデコーダでは、符号化されたビットストリーム(205)が、(例えば、コード化されたベースバンド幅および拡張帯域構成に基づいて)ビットストリームデマルチプレクサ(210)によって、ベースバンド符号ストリームと拡張帯域符号ストリームに逆多重化され、ベースバンド符号ストリームと拡張帯域符号ストリームは、ベースバンドデコーダ(540)および拡張帯域デコーダ(550)内で復号される。ベースバンドデコーダ(540)は、ベースバンドコーデックの従来のデコーディングを使用して、ベースバンドスペクトル係数を復号する。拡張帯域デコーダ(550)は、シェープパラメータのモーションベクトルによって指されているベースバンド
スペクトル係数の一部分をコピーすること、およびスケールパラメータのスケーリングファクタによってスケーリングすることによるを含めて、拡張帯域符号ストリームを復号する。ベースバンドスペクトル係数および拡張帯域スペクトル係数は、オーディオ信号を再構築するために逆変換580によって変換される単一のスペクトルに組み合わされる。
図6は、図5の拡張帯域デコーダ(550)内で使用される復号プロセス(600)を示す。拡張帯域符号ストリーム内の拡張帯域の各コード化済みサブバンドについて(アクション(610))、拡張帯域デコーダは、スケールファクタを(アクション(620))、またモーションベクトルを(アクション(630))復号する。次いで、拡張帯域デコーダは、モーションベクトル(シェープパラメータ)によって指定されたベースバンドサブバンド、固定コードブックベクトル、ランダムノイズベクトルをコピーする。拡張ベースバンドデコーダは、コピーされたスペクトル帯域またはベクトルをスケーリングファクタによってスケーリングし、拡張帯域の現在のサブバンドについてスペクトル係数を生成する。
3.コンピューティング環境
図7は、例示的な諸実施形態を実施することができる好適なコンピューティング環境(700)の一般化された例を示す。本発明は、様々な汎用または専用コンピューティング環境で実施することができるため、コンピューティング環境(700)は、本発明の使用または機能の範囲についてどんな制限も暗示しないものとする。
図7を参照すると、コンピューティング環境(700)は、少なくとも1つの処理装置(710)およびメモリ(720)を含んでいる。図7では、この最も基本的な構成(730)が破線内に含まれている。処理装置(710)はコンピュータ実行可能命令を実行し、実プロセッサとすることも仮想プロセッサとすることもできる。多重処理システムでは、複数の処理装置がコンピュータ実行可能命令を実行し、処理力を高める。メモリ(720)は、揮発性メモリ(例えば、レジスタ、キャッシュ、RAM)、不揮発性メモリ(例えば、ROM、EEPROM、フラッシュメモリなど)、またはこれら2つの何らかの組合せとすることができる。メモリ(720)は、オーディオエンコーダを実装するソフトウェア(780)を記憶する。
コンピューティング環境は、追加の特徴を有することができる。例えば、コンピューティング環境(700)は、記憶装置(740)、1つまたは複数の入力デバイス(750)、1つまたは複数の出力デバイス(760)、1つまたは複数の通信接続(770)を含む。バス、コントローラ、ネットワークなど相互接続機構(図示せず)が、コンピューティング環境(700)の構成要素を相互接続する。一般に、オペレーティングシステムソフトウェア(図示せず)が、コンピューティング環境(700)内で実行する他のソフトウェアのための動作環境を提供し、コンピューティング環境(700)の構成要素の活動を調整する。
記憶装置(740)は、取外し式または非取外し式とすることができ、磁気ディスク、磁気テープもしくはカセット、CD−ROM、CD−RW、DVD、または、情報を記憶するために使用することができる、また、コンピューティング環境(700)内でアクセスを受けることができる任意の他の媒体を含む。記憶装置(740)は、オーディオエンコーダを実装するソフトウェア(780)用の命令を記憶する。
入力デバイス(750)は、キーボード、マウス、ペン、またはトラックボールなどタッチ入力デバイス、音声入力デバイス、走査デバイス、あるいは、コンピューティング環境(700)に入力を提供する別のデバイスとすることができる。オーディオの場合、入力デバイス(750)は、サウンドカード、または、オーディオ入力をアナログ形態もし
くはデジタル形態で受け入れる類似のデバイスとすることができる。出力デバイス(760)は、ディスプレイ、プリンタ、スピーカ、または、コンピューティング環境(700)からの出力を提供する別のデバイスとすることができる。
通信接続(770)は、通信媒体を介して別のコンピューティングエンティティに対する通信を可能にする。通信媒体は、コンピュータ実行可能命令、圧縮されたオーディオもしくはビデオ情報、または、変調データ信号内の他のデータなど、情報を搬送する。変調データ信号は、情報を信号に符号化するようにその特性の1つまたは複数が設定された、または変化した信号である。限定ではなく例を挙げると、通信媒体には、電気、光、RF、赤外線、音響、または他の搬送波と共に実施される有線技法または無線技法が含まれる。
本発明については、コンピュータ可読媒体の一般的な状況で述べることができる。コンピュータ可読媒体は、コンピューティング環境内でアクセスを受けることができる任意の使用可能な媒体である。限定ではなく例を挙げると、コンピューティング環境(700)と共に、コンピュータ可読媒体には、メモリ(720)、記憶装置(740)、通信媒体、および上記のいずれかの組合せが含まれる。
本発明については、コンピューティング環境内で、ターゲットの実プロセッサまたは仮想プロセッサ上で実行される、プログラムモジュール内に含まれるものなどコンピュータ実行可能命令の一般的な状況で述べることができる。概して、プログラムモジュールは、特定のタスクを実行する、または特定の抽象データタイプを実施するルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構造などを含む。プログラムモジュールの機能は、様々な実施形態で望まれるように、組み合わせることも、プログラムモジュール間で分けることもできる。プログラムモジュール用のコンピュータ実行可能命令は、ローカルまたは分散型コンピューティング環境内で実行することができる。
提示するために、詳細な説明では、「determine(決定(判定)する)」「get」「adjust(調整する)」「apply(適用する)」のような用語を使用し、コンピューティング環境内のコンピュータの動作について述べる。これらの用語は、コンピュータによって実行される動作について高レベルで抽象化したものであり、人間によって行われる動作と混同すべきでない。これらの用語に対応する実際のコンピュータの動作は、実装に応じて変わる。
本発明の原理を適用することができる多数の可能な実施形態に鑑みて、本発明者等は、以下の特許請求の範囲とその均等物の範囲および精神内に入るそのような実施形態すべてを本発明として主張する。
100 オーディオエンコーダ
110 周波数トランスフォーマ
120 多重チャネルトランスフォーマ
130 知覚モデラ
140 ウェイタ
150 量子化器
160 エントロピーエンコーダ
170 レート/品質コントローラ
180 ビットストリームMUX
200 オーディオデコーダ
210 ビットストリームDEMUX
220 エントロピーデコーダ
230 逆量子化器
240 ノイズ発生器
250 逆ウェイタ
260 逆多重チャネルトランスフォーマ
270 逆周波数トランスフォーマ

Claims (12)

  1. エンコーダにおいて、符号化されたオーディオビットストリームを得るステップであって、
    複数の拡張帯域の各々について、
    1または複数のベースバンドスペクトル係数の部分のうちのいずれか、当該拡張帯域に形状がより似ているかを判定するために探索を実行し、
    判定された前記部分が、当該拡張帯域に形状が十分似ているか判定し、
    十分似ている場合に、当該拡張帯域を、判定された前記部分の前記形状のスケーリングされたバージョンとして符号化し、
    十分似ていない場合に、
    固定されたコードブック内で表された形状の中で、当該拡張帯域により似ている形状があるかどうか探索を実行し、
    当該似ている形状が前記固定されたコードブック内で見出された場合に、当該拡張帯域を、前記固定されたコードブック内の当該似ている形状のスケーリングされたバージョンとして符号化し、
    当該似ている形状が前記固定されたコードブック内で見出されない場合に、当該拡張帯域を、ランダムノイズベクトルのスケーリングされたバージョンとして符号化する
    ステップ
    を含む、ステップと、
    デコーダにおいて、前記符号化されたオーディオビットストリームから1または複数のベースバンドスペクトル係数を復号するステップと、
    前記デコーダにおいて、
    スケーリングファクタを復号し、
    コピーすべき1または複数のベースバンドスペクトル係数を識別するモーションベクトル、固定されたコードブックからのスペクトル形状のためのベクトル及び正規化されたランダムノイズベクトルの何れかが指定されるように構成されたシェープパラメータに応じて、1若しくは複数の識別されたベースバンドスペクトル係数、固定されたコードブックからのスペクトル形状のためのベクトルに対応する1若しくは複数の係数または正規化されたランダムノイズベクトルに対応する1若しくは複数の係数を選択的にコピーし、かつ
    前記スケーリングファクタに応じて、コピーされた前記1または複数の係数をスケーリングすること
    により、複数の拡張帯域の各々における1または複数の拡張帯域スペクトル係数を復号するステップと
    を含む方法。
  2. 前記スケーリングファクタは、前記符号化されたオーディオビットストリームを符号化したスペクトル係数の帯域の全エネルギーを表すことを特徴とする請求項1に記載の方法。
  3. 前記スケーリングファクタは前記符号化されたオーディオビットストリームを符号化したスペクトル係数の二乗平均平方根の値であることを特徴とする請求項1に記載の方法。
  4. 復号された前記1または複数のベースバンドスペクトル係数および復号された前記1または複数の拡張帯域スペクトル係数を入力オーディオ信号ブロックの複製に変換する逆変換操作を実行するステップをさらに含むことを特徴とする請求項1に記載の方法。
  5. 方法をコンピュータ・システムに実行させるプログラムであって、前記方法は、
    符号化されたオーディオビットストリームを得るステップであって、
    複数の拡張帯域の各々について、
    1または複数のベースバンドスペクトル係数の部分のうちのいずれか、当該拡張帯域に形状がより似ているかを判定するために探索を実行し、
    判定された前記部分が、当該拡張帯域に形状が十分似ているか判定し、
    十分似ている場合に、当該拡張帯域を、判定された前記部分の前記形状のスケーリングされたバージョンとして符号化し、
    十分似ていない場合に、
    固定されたコードブック内で表された形状の中で、当該拡張帯域により似ている形状があるかどうか探索を実行し、
    当該似ている形状が前記固定されたコードブック内で見出された場合に、当該拡張帯域を、前記固定されたコードブック内の当該似ている形状のスケーリングされたバージョンとして符号化し、
    当該似ている形状が前記固定されたコードブック内で見出されない場合に、当該拡張帯域を、ランダムノイズベクトルのスケーリングされたバージョンとして符号化する
    ステップ
    を含む、ステップと、
    前記符号化されたオーディオビットストリームから1または複数のベースバンドスペクトル係数を復号するステップと、
    スケーリングファクタを復号し、
    コピーすべき1または複数のベースバンドスペクトル係数を識別するモーションベクトル、固定されたコードブックからのスペクトル形状のためのベクトル及び正規化されたランダムノイズベクトルの何れかが指定されるように構成されたシェープパラメータに応じて、1若しくは複数の識別されたベースバンドスペクトル係数、固定されたコードブックからのスペクトル形状のためのベクトルに対応する1若しくは複数の係数または正規化されたランダムノイズベクトルに対応する1若しくは複数の係数を選択的にコピーし、かつ
    前記スケーリングファクタに応じて、コピーされた前記1または複数の係数をスケーリングすること
    により、複数の拡張帯域の各々における1または複数の拡張帯域スペクトル係数を復号するステップと
    を含む、プログラム。
  6. 前記スケーリングファクタは、前記符号化されたオーディオビットストリームを符号化したスペクトル係数の帯域の全エネルギーを表すことを特徴とする請求項5に記載のプログラム。
  7. 前記スケーリングファクタは前記符号化されたオーディオビットストリームを符号化したスペクトル係数の二乗平均平方根の値であることを特徴とする請求項5に記載のプログラム。
  8. 前記方法は復号された前記1または複数のベースバンドスペクトル係数および復号された前記1または複数の拡張帯域スペクトル係数を入力オーディオ信号ブロックの複製に変換する逆変換操作を実行するステップをさらに含むことを特徴とする請求項5に記載のプログラム。
  9. 処理ユニットと、
    方法を前記処理ユニットに実行させるように構成された命令を含む1または複数のコンピュータ読み取り可能な記憶媒体と
    を備えたコンピュータ・システムであって、前記方法は、
    符号化されたオーディオビットストリームを得るステップであって、
    複数の拡張帯域の各々について、
    1または複数のベースバンドスペクトル係数の部分のうちのいずれか、当該拡張帯域に形状がより似ているかを判定するために探索を実行し、
    判定された前記部分が、当該拡張帯域に形状が十分似ているか判定し、
    十分似ている場合に、当該拡張帯域を、判定された前記部分の前記形状のスケーリングされたバージョンとして符号化し、
    十分似ていない場合に、
    固定されたコードブック内で表された形状の中で、当該拡張帯域により似ている形状があるかどうか探索を実行し、
    当該似ている形状が前記固定されたコードブック内で見出された場合に、当該拡張帯域を、前記固定されたコードブック内の当該似ている形状のスケーリングされたバージョンとして符号化し、
    当該似ている形状が前記固定されたコードブック内で見出されない場合に、当該拡張帯域を、ランダムノイズベクトルのスケーリングされたバージョンとして符号化する
    ステップ
    を含む、ステップと、
    前記符号化されたオーディオビットストリームから1または複数のベースバンドスペクトル係数を復号するステップと、
    前記符号化されたオーディオビットストリームから、拡張帯域のある帯域に対するスケーリングファクタを復号し、
    コピーすべき1または複数のベースバンドスペクトル係数を識別するモーションベクトル、固定されたコードブックからのスペクトル形状のためのベクトル及び正規化されたランダムノイズベクトルの何れかが指定されるように構成されたシェープパラメータに応じて、スペクトル帯域の形状を記述する1若しくは複数の識別されたベースバンドスペクトル係数、固定されたコードブックからのスペクトル形状のためのベクトルに対応する1若しくは複数の係数または正規化されたランダムノイズベクトルに対応する1若しくは複数の係数を選択的にコピーし、かつ
    前記ある帯域に対する復号された前記スケーリングファクタに応じて、コピーされた前記1または複数の係数をスケーリングすること
    により、前記符号化されたオーディオビットストリームから複数の拡張帯域の各々における1または複数の拡張帯域スペクトル係数を復号するステップと、
    復号された前記1または複数のベースバンドスペクトル係数および復号された前記1または複数の拡張帯域スペクトル係数に逆変換を実行して、再構成されたオーディオ信号を作成するステップと
    を含むことを特徴とするコンピュータ・システム。
  10. 前記ある帯域に対する復号された前記スケーリングファクタは、前記符号化されたオーディオビットストリームを符号化したスペクトル係数の二乗平均平方根の値であることを特徴とする請求項9に記載のコンピュータ・システム。
  11. 前記シェープパラメータは、前記スペクトル帯域の形状の伸張を表す値を更に含むことを特徴とする請求項9に記載のコンピュータ・システム。
  12. 前記スケーリングファクタは、前記オーディオビットストリームから以前に復号されたスケーリングファクタからとられた予測復号を使用して復号されることを特徴とする請求項1に記載の方法。
JP2016171531A 2004-01-23 2016-09-02 広義知覚類似性(wide−sense perceptual similarity)を使用するデジタルメディアスペクトルデータの効率的な復号 Active JP6262820B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US53904604P 2004-01-23 2004-01-23
US60/539,046 2004-01-23
US10/882,801 US7460990B2 (en) 2004-01-23 2004-06-29 Efficient coding of digital media spectral data using wide-sense perceptual similarity
US10/882,801 2004-06-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014145907A Division JP2014240963A (ja) 2004-01-23 2014-07-16 広義知覚類似性(wide−senseperceptualsimilarity)を使用するデジタルメディアスペクトルデータの効率的な復号

Publications (2)

Publication Number Publication Date
JP2017037311A true JP2017037311A (ja) 2017-02-16
JP6262820B2 JP6262820B2 (ja) 2018-01-17

Family

ID=34798916

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2006551037A Active JP4745986B2 (ja) 2004-01-23 2004-07-29 広義知覚類似性(wide−senseperceptualsimilarity)を使用するデジタルメディアスペクトルデータの効率的なコーディング
JP2011063064A Withdrawn JP2011186479A (ja) 2004-01-23 2011-03-22 広義知覚類似性(wide−senseperceptualsimilarity)を使用するデジタルメディアスペクトルデータの効率的な復号
JP2014145907A Ceased JP2014240963A (ja) 2004-01-23 2014-07-16 広義知覚類似性(wide−senseperceptualsimilarity)を使用するデジタルメディアスペクトルデータの効率的な復号
JP2016171531A Active JP6262820B2 (ja) 2004-01-23 2016-09-02 広義知覚類似性(wide−sense perceptual similarity)を使用するデジタルメディアスペクトルデータの効率的な復号

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2006551037A Active JP4745986B2 (ja) 2004-01-23 2004-07-29 広義知覚類似性(wide−senseperceptualsimilarity)を使用するデジタルメディアスペクトルデータの効率的なコーディング
JP2011063064A Withdrawn JP2011186479A (ja) 2004-01-23 2011-03-22 広義知覚類似性(wide−senseperceptualsimilarity)を使用するデジタルメディアスペクトルデータの効率的な復号
JP2014145907A Ceased JP2014240963A (ja) 2004-01-23 2014-07-16 広義知覚類似性(wide−senseperceptualsimilarity)を使用するデジタルメディアスペクトルデータの効率的な復号

Country Status (8)

Country Link
US (2) US7460990B2 (ja)
EP (1) EP1730725B1 (ja)
JP (4) JP4745986B2 (ja)
KR (3) KR101083572B1 (ja)
CN (1) CN1813286B (ja)
AT (1) ATE451684T1 (ja)
DE (1) DE602004024591D1 (ja)
WO (1) WO2005076260A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018123602A1 (ja) 2016-12-27 2018-07-05 三井化学株式会社 マウスピース

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
DE60330198D1 (de) 2002-09-04 2009-12-31 Microsoft Corp Entropische Kodierung mittels Anpassung des Kodierungsmodus zwischen Niveau- und Lauflängenniveau-Modus
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
TWI231656B (en) * 2004-04-08 2005-04-21 Univ Nat Chiao Tung Fast bit allocation algorithm for audio coding
TWI275074B (en) * 2004-04-12 2007-03-01 Vivotek Inc Method for analyzing energy consistency to process data
US20050232497A1 (en) * 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
BRPI0513255B1 (pt) * 2004-07-14 2019-06-25 Koninklijke Philips Electronics N.V. Dispositivo e método para converter um primeiro número de canais de áudio de entrada em um segundo número de canais de áudio de saída, sistema de áudio, e, meio de armazenamento legível por computador
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US20070118361A1 (en) * 2005-10-07 2007-05-24 Deepen Sinha Window apparatus and method
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953595B2 (en) 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
US7966175B2 (en) 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
EP2101318B1 (en) * 2006-12-13 2014-06-04 Panasonic Corporation Encoding device, decoding device and corresponding methods
JPWO2008072733A1 (ja) * 2006-12-15 2010-04-02 パナソニック株式会社 符号化装置および符号化方法
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8116936B2 (en) * 2007-09-25 2012-02-14 General Electric Company Method and system for efficient data collection and storage
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8457958B2 (en) * 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
JPWO2009125588A1 (ja) * 2008-04-09 2011-07-28 パナソニック株式会社 符号化装置および符号化方法
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8447591B2 (en) * 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
JP5224219B2 (ja) * 2008-06-26 2013-07-03 独立行政法人科学技術振興機構 オーディオ信号圧縮装置、オーディオ信号圧縮方法、オーディオ信号復号装置及びオーディオ信号復号方法
CA2730198C (en) * 2008-07-11 2014-09-16 Frederik Nagel Audio signal synthesizer and audio signal encoder
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US20100225473A1 (en) * 2009-03-05 2010-09-09 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Postural information system and method
WO2010111841A1 (zh) * 2009-04-03 2010-10-07 华为技术有限公司 频域脉冲解码的预测方法和预测装置及解码器
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US9245529B2 (en) * 2009-06-18 2016-01-26 Texas Instruments Incorporated Adaptive encoding of a digital signal with one or more missing values
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
WO2011058752A1 (ja) * 2009-11-12 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5746974B2 (ja) * 2009-11-13 2015-07-08 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置およびこれらの方法
JP5507971B2 (ja) 2009-11-16 2014-05-28 アイシン精機株式会社 衝撃吸収具及び車両用バンパ装置
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
ES2559981T3 (es) * 2010-07-05 2016-02-17 Nippon Telegraph And Telephone Corporation Método de codificación, método de decodificación, dispositivo, programa y medio de registro
KR101850724B1 (ko) * 2010-08-24 2018-04-23 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
EP3975177B1 (en) 2010-09-16 2022-12-14 Dolby International AB Cross product enhanced subband block based harmonic transposition
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
WO2012108798A1 (en) * 2011-02-09 2012-08-16 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals
RU2648595C2 (ru) 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио
US9591318B2 (en) * 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
PL397008A1 (pl) * 2011-11-17 2013-05-27 Politechnika Poznanska Sposób kodowania obrazu
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
WO2013147709A1 (en) * 2012-03-28 2013-10-03 Agency For Science, Technology And Research Method for transmitting a digital signal, method for receiving a digital signal, transmission arrangement and communication device
EP2830065A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
GB2545434B (en) * 2015-12-15 2020-01-08 Sonic Data Ltd Improved method, apparatus and system for embedding data within a data stream
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
ES2930374T3 (es) 2017-11-17 2022-12-09 Fraunhofer Ges Forschung Aparato y método para codificar o decodificar parámetros de codificación de audio direccional utilizando diferentes resoluciones de tiempo/frecuencia
US10950251B2 (en) 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08147000A (ja) * 1994-11-18 1996-06-07 Yamaha Corp ベクトル量子化による符号化復号方式
JP2003186499A (ja) * 2001-12-14 2003-07-04 Matsushita Electric Ind Co Ltd 符号化装置及び復号化装置
JP2004004530A (ja) * 2002-01-30 2004-01-08 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置およびその方法
US6680972B1 (en) * 1997-06-10 2004-01-20 Coding Technologies Sweden Ab Source coding enhancement using spectral-band replication
US20060287853A1 (en) * 2001-11-14 2006-12-21 Mineo Tsushima Encoding device and decoding device

Family Cites Families (235)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3240380A (en) * 1957-08-07 1966-03-15 Mueller Co Line stopping and valve inserting apparatus and method
US3684838A (en) 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
US4251688A (en) * 1979-01-15 1981-02-17 Ana Maria Furner Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals
EP0064119B1 (fr) 1981-04-30 1985-08-28 International Business Machines Corporation Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné
JPS5921039B2 (ja) 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
CA1253255A (en) 1983-05-16 1989-04-25 Nec Corporation System for simultaneously coding and decoding a plurality of signals
GB8421498D0 (en) 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
US4609686A (en) 1985-04-19 1986-09-02 The Standard Oil Company 100 percent solids epoxy, nitrile coating compositions and method of making same
US4776014A (en) 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US4953196A (en) 1987-05-13 1990-08-28 Ricoh Company, Ltd. Image transmission system
US4922537A (en) * 1987-06-02 1990-05-01 Frederiksen & Shu Laboratories, Inc. Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals
US4907276A (en) * 1988-04-05 1990-03-06 The Dsp Group (Israel) Ltd. Fast search method for vector quantizer communication and pattern recognition systems
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
US5357594A (en) 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
CA2140678C (en) 1989-01-27 2001-05-01 Louis Dunn Fielder Coder and decoder for high-quality audio
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
US5479562A (en) 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
US5142656A (en) 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE59008047D1 (de) * 1989-03-06 1995-02-02 Bosch Gmbh Robert Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale.
US5539829A (en) 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JP2921879B2 (ja) 1989-09-29 1999-07-19 株式会社東芝 画像データ処理装置
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5040217A (en) 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JP2560873B2 (ja) * 1990-02-28 1996-12-04 日本ビクター株式会社 直交変換符号化復号化方法
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
JP3033156B2 (ja) 1990-08-24 2000-04-17 ソニー株式会社 ディジタル信号符号化装置
ATE186607T1 (de) * 1990-12-21 1999-11-15 British Telecomm Sprachcodierung
EP0520068B1 (en) * 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5274740A (en) 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
US5559900A (en) 1991-03-12 1996-09-24 Lucent Technologies Inc. Compression of signals for perceptual quality by selecting frequency bands having relatively high energy
US5870497A (en) * 1991-03-15 1999-02-09 C-Cube Microsystems Decoder for compressed video signals
AU1996292A (en) 1991-05-17 1992-12-30 Analytic Sciences Corporation, The Continuous-tone image compression
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
US5487086A (en) * 1991-09-13 1996-01-23 Comsat Corporation Transform vector quantization for adaptive predictive coding
JP3141450B2 (ja) 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
EP0551705A3 (en) 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
US5369724A (en) 1992-01-17 1994-11-29 Massachusetts Institute Of Technology Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
FR2688371B1 (fr) * 1992-03-03 1997-05-23 France Telecom Procede et systeme de spatialisation artificielle de signaux audio-numeriques.
DE4209544A1 (de) 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
US5295203A (en) * 1992-03-26 1994-03-15 General Instrument Corporation Method and apparatus for vector coding of video transform coefficients
JP2693893B2 (ja) 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3343965B2 (ja) 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3343962B2 (ja) 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3186307B2 (ja) 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
ES2165370T3 (es) * 1993-06-22 2002-03-16 Thomson Brandt Gmbh Metodo para obtener una matriz decodificadora multicanal.
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
TW272341B (ja) 1993-07-16 1996-03-11 Sony Co Ltd
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
US5737720A (en) * 1993-10-26 1998-04-07 Sony Corporation Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3277677B2 (ja) 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
US5574824A (en) 1994-04-11 1996-11-12 The United States Of America As Represented By The Secretary Of The Air Force Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
US5635930A (en) 1994-10-03 1997-06-03 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus and recording medium
ATE214524T1 (de) 1994-11-04 2002-03-15 Koninkl Philips Electronics Nv Kodierung und dekodierung eines breitbandigen digitalen informationssignals
US5654702A (en) 1994-12-16 1997-08-05 National Semiconductor Corp. Syntax-based arithmetic coding for low bit rate videophone
US5629780A (en) * 1994-12-19 1997-05-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error
JP2956548B2 (ja) * 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
JP3189614B2 (ja) * 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
EP0820624A1 (en) * 1995-04-10 1998-01-28 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US6940840B2 (en) 1995-06-30 2005-09-06 Interdigital Technology Corporation Apparatus for adaptive reverse power control for spread-spectrum communications
ZA965340B (en) * 1995-06-30 1997-01-27 Interdigital Tech Corp Code division multiple access (cdma) communication system
US5790759A (en) 1995-09-19 1998-08-04 Lucent Technologies Inc. Perceptual noise masking measure based on synthesis filter frequency response
US5960390A (en) 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
DE19537338C2 (de) 1995-10-06 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren von Audiosignalen
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
US5777678A (en) 1995-10-26 1998-07-07 Sony Corporation Predictive sub-band video coding and decoding using motion compensation
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5686964A (en) 1995-12-04 1997-11-11 Tabatabai; Ali Bit rate control mechanism for digital image and video data compression
EP0880235A1 (en) 1996-02-08 1998-11-25 Matsushita Electric Industrial Co., Ltd. Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium
US5682152A (en) 1996-03-19 1997-10-28 Johnson-Grace Company Data compression using adaptive bit allocation and hybrid lossless entropy encoding
US5852806A (en) 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
SE506341C2 (sv) 1996-04-10 1997-12-08 Ericsson Telefon Ab L M Metod och anordning för rekonstruktion av en mottagen talsignal
US5822370A (en) 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
DE19628293C1 (de) 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
US5870480A (en) * 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
US5969750A (en) 1996-09-04 1999-10-19 Winbcnd Electronics Corporation Moving picture camera with universal serial bus interface
US5745275A (en) * 1996-10-15 1998-04-28 Lucent Technologies Inc. Multi-channel stabilization of a multi-channel transmitter through correlation feedback
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
FI970266A (fi) * 1997-01-22 1998-07-23 Nokia Telecommunications Oy Menetelmä solukkoradiojärjestelmän ohjauskanavien kantaman pidentämiseksi ja solukkoradiojärjestelmä
DE69829783T2 (de) 1997-02-08 2005-09-01 Matsushita Electric Industrial Co., Ltd., Kadoma Quantisierungsmatrix für die Codierung von Stand- und Bewegtbildern
US20010017941A1 (en) 1997-03-14 2001-08-30 Navin Chaddha Method and apparatus for table-based compression with embedded coding
KR100265112B1 (ko) 1997-03-31 2000-10-02 윤종용 디브이디 디스크와 디브이디 디스크를 재생하는 장치 및 방법
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
US6741965B1 (en) 1997-04-10 2004-05-25 Sony Corporation Differential stereo using two coding techniques
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
JP4627880B2 (ja) * 1997-09-16 2011-02-09 ドルビー ラボラトリーズ ライセンシング コーポレイション リスナーの周囲にある音源の空間的ひろがり感を増強するためのステレオヘッドホンデバイス内でのフィルタ効果の利用
JPH11122120A (ja) * 1997-10-17 1999-04-30 Sony Corp 符号化方法及び装置、並びに復号化方法及び装置
US6959220B1 (en) 1997-11-07 2005-10-25 Microsoft Corporation Digital audio signal filtering mechanism and method
US6253185B1 (en) 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
US6249614B1 (en) 1998-03-06 2001-06-19 Alaris, Inc. Video compression and decompression using dynamic quantization and/or encoding
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
US6029126A (en) 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP3998330B2 (ja) * 1998-06-08 2007-10-24 沖電気工業株式会社 符号化装置
US6266003B1 (en) 1998-08-28 2001-07-24 Sigma Audio Research Limited Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals
DE19840835C2 (de) 1998-09-07 2003-01-09 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
SE519552C2 (sv) 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6498865B1 (en) 1999-02-11 2002-12-24 Packetvideo Corp,. Method and device for control and compatible delivery of digitally compressed visual data in a heterogeneous communication network
US6778709B1 (en) 1999-03-12 2004-08-17 Hewlett-Packard Development Company, L.P. Embedded block coding with optimized truncation
JP4610087B2 (ja) 1999-04-07 2011-01-12 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
US6952774B1 (en) * 1999-05-22 2005-10-04 Microsoft Corporation Audio watermarking with dual watermarks
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6658162B1 (en) 1999-06-26 2003-12-02 Sharp Laboratories Of America Image coding method using visual optimization
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6496798B1 (en) 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6418405B1 (en) 1999-09-30 2002-07-09 Motorola, Inc. Method and apparatus for dynamic segmentation of a low bit rate digital voice message
US6836761B1 (en) 1999-10-21 2004-12-28 Yamaha Corporation Voice converter for assimilation by frame synthesis with temporal alignment
FI19992351A (fi) 1999-10-29 2001-04-30 Nokia Mobile Phones Ltd Puheentunnistus
US7096240B1 (en) 1999-10-30 2006-08-22 Stmicroelectronics Asia Pacific Pte Ltd. Channel coupling for an AC-3 encoder
US6738074B2 (en) * 1999-12-29 2004-05-18 Texas Instruments Incorporated Image compression system and method
US6499010B1 (en) 2000-01-04 2002-12-24 Agere Systems Inc. Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
AU2000250291A1 (en) 2000-02-10 2001-08-20 Telogy Networks, Inc. A generalized precoder for the upstream voiceband modem channel
JP3576942B2 (ja) 2000-08-29 2004-10-13 株式会社ケンウッド 周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体
US6601032B1 (en) 2000-06-14 2003-07-29 Intervideo, Inc. Fast code length search method for MPEG audio encoding
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
US6836739B2 (en) 2000-06-14 2004-12-28 Kabushiki Kaisha Kenwood Frequency interpolating device and frequency interpolating method
EP1175030B1 (en) 2000-07-07 2008-02-20 Nokia Siemens Networks Oy Method and system for multichannel perceptual audio coding using the cascaded discrete cosine transform or modified discrete cosine transform
US6771723B1 (en) 2000-07-14 2004-08-03 Dennis W. Davis Normalized parametric adaptive matched filter receiver
JP3576936B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
JP3881836B2 (ja) * 2000-10-24 2007-02-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US6463408B1 (en) 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
US7177808B2 (en) * 2000-11-29 2007-02-13 The United States Of America As Represented By The Secretary Of The Air Force Method for improving speaker identification by determining usable speech
JP3887531B2 (ja) * 2000-12-07 2007-02-28 株式会社ケンウッド 信号補間装置、信号補間方法及び記録媒体
KR100433516B1 (ko) * 2000-12-08 2004-05-31 삼성전자주식회사 트랜스코딩 방법
KR100909971B1 (ko) * 2000-12-22 2009-07-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 다중-채널 오디오 변환기
US7062445B2 (en) 2001-01-26 2006-06-13 Microsoft Corporation Quantization loop with heuristic approach
JP3468464B2 (ja) 2001-02-01 2003-11-17 理化学研究所 形状と物性を統合したボリュームデータ生成方法
EP1231793A1 (en) * 2001-02-09 2002-08-14 STMicroelectronics S.r.l. A process for changing the syntax, resolution and bitrate of MPEG bitstreams, a system and a computer program product therefor
GB0103245D0 (en) 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
GB0108080D0 (en) 2001-03-30 2001-05-23 Univ Bath Audio compression
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
AU2002307533B2 (en) 2001-05-10 2008-01-31 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
CN1235192C (zh) * 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
JP4106624B2 (ja) 2001-06-29 2008-06-25 株式会社ケンウッド 信号の周波数成分を補間するための装置および方法
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
AU2002343151A1 (en) 2001-11-23 2003-06-10 Koninklijke Philips Electronics N.V. Perceptual noise substitution
US7027982B2 (en) 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7460993B2 (en) 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7110941B2 (en) 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7310598B1 (en) 2002-04-12 2007-12-18 University Of Central Florida Research Foundation, Inc. Energy based split vector quantizer employing signal representation in multiple transform domains
US7158539B2 (en) 2002-04-16 2007-01-02 Microsoft Corporation Error resilient windows media audio coding
JP2003316394A (ja) 2002-04-23 2003-11-07 Nec Corp 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7072726B2 (en) 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
US7308232B2 (en) 2002-06-21 2007-12-11 Lucent Technologies Inc. Method and apparatus for estimating a channel based on channel statistics
KR100981699B1 (ko) 2002-07-12 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US7043423B2 (en) * 2002-07-16 2006-05-09 Dolby Laboratories Licensing Corporation Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
KR20050021484A (ko) 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
EP1527442B1 (en) 2002-08-01 2006-04-05 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band replication
US7146315B2 (en) 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7069212B2 (en) 2002-09-19 2006-06-27 Matsushita Elecric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing adjustment
WO2004029935A1 (en) * 2002-09-24 2004-04-08 Rad Data Communications A system and method for low bit-rate compression of combined speech and music
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
US7243064B2 (en) * 2002-11-14 2007-07-10 Verizon Business Global Llc Signal processing of multi-channel data
KR100908117B1 (ko) 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
JP2004198485A (ja) 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
US6965859B2 (en) 2003-02-28 2005-11-15 Xvd Corporation Method and apparatus for audio compression
SG135920A1 (en) 2003-03-07 2007-10-29 St Microelectronics Asia Device and process for use in encoding audio data
RU2005135650A (ru) * 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Синтез аудиосигнала
WO2004098105A1 (en) 2003-04-30 2004-11-11 Nokia Corporation Support of a multichannel audio extension
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
CN100508030C (zh) 2003-06-30 2009-07-01 皇家飞利浦电子股份有限公司 一种编码/解码音频信号的方法及相应设备
WO2005031704A1 (en) * 2003-09-29 2005-04-07 Koninklijke Philips Electronics N.V. Encoding audio signals
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR20060090995A (ko) * 2003-10-23 2006-08-17 마쓰시다 일렉트릭 인더스트리얼 컴패니 리미티드 스펙트럼 부호화 장치, 스펙트럼 복호화 장치, 음향 신호송신 장치, 음향 신호 수신장치 및 이들의 방법
ATE354160T1 (de) * 2003-10-30 2007-03-15 Koninkl Philips Electronics Nv Audiosignalcodierung oder -decodierung
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
ATE390683T1 (de) 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
CN102122509B (zh) 2004-04-05 2016-03-23 皇家飞利浦电子股份有限公司 多信道解码器和多信道解码方法
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
SE0400997D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
EP1749296B1 (en) 2004-05-28 2010-07-14 Nokia Corporation Multichannel audio extension
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
US7352858B2 (en) 2004-06-30 2008-04-01 Microsoft Corporation Multi-channel echo cancellation with round robin regularization
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US20060025991A1 (en) * 2004-07-23 2006-02-02 Lg Electronics Inc. Voice coding apparatus and method using PLP in mobile communications terminal
JP4963962B2 (ja) 2004-08-26 2012-06-27 パナソニック株式会社 マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7508863B2 (en) 2004-12-13 2009-03-24 Alcatel-Lucent Usa Inc. Method of processing multi-path signals
US20060259303A1 (en) 2005-05-12 2006-11-16 Raimo Bakis Systems and methods for pitch smoothing for text-to-speech synthesis
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7684981B2 (en) * 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7562021B2 (en) 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
CN101288309B (zh) * 2005-10-12 2011-09-21 三星电子株式会社 处理/发送以及接收/处理比特流的方法和设备
US20070094035A1 (en) * 2005-10-21 2007-04-26 Nokia Corporation Audio coding
US20070168197A1 (en) 2006-01-18 2007-07-19 Nokia Corporation Audio coding
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
JP2009534713A (ja) * 2006-04-24 2009-09-24 ネロ アーゲー 低減ビットレートを有するデジタル音声データを符号化するための装置および方法
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08147000A (ja) * 1994-11-18 1996-06-07 Yamaha Corp ベクトル量子化による符号化復号方式
US6680972B1 (en) * 1997-06-10 2004-01-20 Coding Technologies Sweden Ab Source coding enhancement using spectral-band replication
US20060287853A1 (en) * 2001-11-14 2006-12-21 Mineo Tsushima Encoding device and decoding device
JP2003186499A (ja) * 2001-12-14 2003-07-04 Matsushita Electric Ind Co Ltd 符号化装置及び復号化装置
JP2004004530A (ja) * 2002-01-30 2004-01-08 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置およびその方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018123602A1 (ja) 2016-12-27 2018-07-05 三井化学株式会社 マウスピース

Also Published As

Publication number Publication date
JP2011186479A (ja) 2011-09-22
JP4745986B2 (ja) 2011-08-10
ATE451684T1 (de) 2009-12-15
US8645127B2 (en) 2014-02-04
US20090083046A1 (en) 2009-03-26
KR20110093953A (ko) 2011-08-18
EP1730725B1 (en) 2009-12-09
JP2007532934A (ja) 2007-11-15
WO2005076260A1 (en) 2005-08-18
US20050165611A1 (en) 2005-07-28
CN1813286B (zh) 2010-11-24
KR101130355B1 (ko) 2012-03-27
EP1730725A4 (en) 2007-05-30
KR101083572B1 (ko) 2011-11-14
KR20060121655A (ko) 2006-11-29
CN1813286A (zh) 2006-08-02
US7460990B2 (en) 2008-12-02
KR101251813B1 (ko) 2013-04-09
JP2014240963A (ja) 2014-12-25
EP1730725A1 (en) 2006-12-13
JP6262820B2 (ja) 2018-01-17
KR20110042137A (ko) 2011-04-22
DE602004024591D1 (de) 2010-01-21

Similar Documents

Publication Publication Date Title
JP6262820B2 (ja) 広義知覚類似性(wide−sense perceptual similarity)を使用するデジタルメディアスペクトルデータの効率的な復号
JP5456310B2 (ja) ディジタル・メディア・スペクトル・データの効率的コーディングに使用される辞書内のコードワードの変更
JP5313669B2 (ja) ディジタルメディアの効率的コーディング用のバンドを入手するための周波数セグメント化
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP2019079057A (ja) 先進量子化器
JP2011522291A (ja) オーバーラッピング変換の2つのブロック変換への因数分解
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171214

R150 Certificate of patent or registration of utility model

Ref document number: 6262820

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250