JP2002534702A - オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 - Google Patents

オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置

Info

Publication number
JP2002534702A
JP2002534702A JP2000591732A JP2000591732A JP2002534702A JP 2002534702 A JP2002534702 A JP 2002534702A JP 2000591732 A JP2000591732 A JP 2000591732A JP 2000591732 A JP2000591732 A JP 2000591732A JP 2002534702 A JP2002534702 A JP 2002534702A
Authority
JP
Japan
Prior art keywords
spectral
raster
code
codeword
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000591732A
Other languages
English (en)
Other versions
JP3580777B2 (ja
Inventor
スペルシュナイダー、ラルフ
ディーツ、マルティン
エーレト、アンドレアス
ブランデンブルク、カールハインツ
ゲルハオイサー、ハインツ
ノブバクート−イラニ、アリ
ラオバー、ピエレ
ビット、ローラント
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority claimed from PCT/EP1998/008475 external-priority patent/WO2000039933A1/de
Publication of JP2002534702A publication Critical patent/JP2002534702A/ja
Application granted granted Critical
Publication of JP3580777B2 publication Critical patent/JP3580777B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/35Unequal or adaptive error protection, e.g. by providing a different level of protection according to significance of source information or by adapting the coding according to the change of transmission channel characteristics
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/662Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a time/frequency relationship, e.g. time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Probability & Statistics with Applications (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 符号化されたビットストリームを得るためにオーディオ信号を符号化する方法において、スペクトル値を得るために、オーディオ信号の離散時間型サンプルが周波数領域に変換される。このスペクトル値は、暗語によって符号化されたスペクトル値を得るために、限られた数の互いに異なる長さの暗語を有するコード表を用いて符号化される。スペクトル値に与えられる暗語の長さは、そのスペクトル値が発生する可能性が高ければ高いほど、短いものである。符号化されたビットストリームのためにラスターが規定される。このラスターは等距離で並ぶラスターポイントを含み、ラスターポイント間距離は使用されるコード表に基づくものである。誤差許容ハフマンコーディングのために、優先暗語、つまり、他のスペクトル値よりも心理音響的に重要な特別なスペクトル値を表す暗語が、ラスター内に、各優先暗語の始まりがラスターポイントと一致するように配列される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は誤差許容エントロピー符号化又は復号化、特に誤差許容ハフマンコー
ディング又はデコーディングを実行することができる、オーディオ信号又はビッ
トストリームを符号化あるいは復号化するための方法及び装置に関する。
【0002】
【従来の技術と課題】
最近のオーディオ符号化あるいは復号化の方法は、例えば、MPEG層3標準
によるものであるが、信号の質の明らかな低下を生じることなく、例えば因数1
2によってオーディオ信号のデータレートを圧縮することが可能である。このよ
うな高いデータレートの圧縮を可能にするためには、オーディオ信号をサンプリ
ングし、結果的に一連の離散時間型サンプルとなる。この種の技術において知ら
れているように、ウィンドウされた時間的なサンプル群を得るために、この一連
の離散時間型サンプルは、適当なウィンドウ機能を使用してウィンドウされる。
ある一つのウィンドウされた時間的なサンプル群は、フィルタバンク、変形離散
コサイン変換(MDCT)あるいは他の適当な方法によって周波数領域に変更さ
れ、それにより、周波数領域における、そのオーディオ信号、つまり、その離散
時間型サンプル群からなるその時間的部分を表すスペクトル値を得る。通常、5
0%重なる時間群が生成され、MCDTによって周波数領域に変換される。MD
CTの特性のために、例えば1024の離散時間型サンプルは、常に1024の
スペクトル値になる。
【0003】 人間の耳の感受性はオーディオ信号そのものの時間的なスペクトルによること
が知られている。これはいわゆる心理聴覚モデルに反映されている。このモデル
を利用して、時間的スペクトルによるマスキング閾値を計算することが可能であ
った。マスキングとは、ある特定のトーン又はスペクトル部分が、例えば、その
隣り合うスペクトル領域が比較的高いエネルギーを有する時、聞こえないものと
判断されることである。このマスキング現象は、変換後のスペクトル値をできる
だけ粗く量子化するために利用される。従って、目的は、できる限り少ないビッ
トを符号化、あるいはここでは量子化し、復号化されたオーディオ信号には可聴
範囲の妨害を避けることである。量子化により引き起こされる妨害、つまり、量
子化ノイズはマスキング閾値以下であり、従って可聴域外であるべきである。周
知の方法によれば、スペクトル値は従っていわゆる倍率帯域に予備分割され、こ
れは、人間の聴覚の周波数群を反映している。ある倍率群のスペクトル値には、
倍率帯域全体のスペクトル値を調整するために、ある倍率を掛ける。そして、倍
率で調整された倍率帯域は量子化され、量子化されたスペクトル値を生成する。
もちろん、倍率帯域にグルーピングすることは重要でない。しかし、この手順は
MPEG層3標準及びMPEG−2 AAC (AACは上級オーディオ符号化)
標準に使用されている。
【0004】 データ圧縮の非常に重要な要素は、量子化されたスペクトル値のエントロピー
符号化である。普通、ハフマンコーディングがこれに利用される。ハフマンコー
ディングは長さが変動する符号化を伴う。つまり、符号化されるべき値のための
暗語の長さは、この値が起こりうる可能性に基づいている。論理的には、最も起
こり易い記号が最も短い符号、つまり、暗語を割り当てられ、その結果、ハフマ
ンコーディングによって非常に良好な余分な部分の削減が達成できる。よく知ら
れている長さ変動の符号化の一つの例は、モールス式符号である。
【0005】 オーディオ符号化の際、ハフマンコードは量子化されたスペクトル値を符号化
するために用いられる。例えば、MPEG−2 AAC標準で作動する最近のオ
ーディオコーダは、量子化されたスペクトル値を符号化するために、部分ごとに
特定の標準に基づき、スペクトルに割り当てられる、複数の異なるハフマンコー
ド表を使用する。ここでは、二つ又は四つのスペクトル値が常に一体的に一つの
暗語に符号化される。
【0006】 MPEG−2 AACに基づく方法がMPEG層3の方法と異なる点の一つは
、異なる倍率帯域、つまり、異なるスペクトル値が、任意の数のスペクトル部分
にグループ分けされることである。AACにおいて、一つのスペクトル部分は少
なくとも四つのスペクトル値、好ましくはそれ以上のスペクトル値を含んでいる
。スペクトル値の全周波数領域は、このようにして隣接するいくつかの部分、そ
れぞれの部分は周波数帯域を表すのだが、に分割され、結果的に、これら全ての
部分が変換前のスペクトル値に渡る全ての周波数領域をカバーする。
【0007】 余分な部分の削減を最大にするために、MPEG層3による方法と同様に、い
わゆるハフマン表、複数のこのようなハフマン表のうちの一つが各部分に割り当
てられる。AAC方法のビットストリームでは、普通1024のスペクトル値を
含み、これらのスペクトル値のためのハフマン暗語は周波数が高くなって行く順
に並んでいる。各周波数部分で使用される表の情報はサイド情報として送られる
。この状況を図2に示す。
【0008】 図2に一例として示すケースでは、ビットストリームは10のハフマン暗語を
含んでいる。もし一つの暗語が常に一つのスペクトラル値から形成されるならば
、10個のスペクトル値がここで符号化できる。しかし、通常、2個又は4個の
スペクトル値が常に一体的に一つの暗語に符号化されるので、図2は20個又は
40個のスペクトル値を含む符号化されたビットスリームの一部を示しているこ
とになる。各ハフマン暗語が2個のスペクトル値を含んでいる場合、番号1で示
されている暗語は最初の2個のスペクトル値を表している。この暗語の長さは比
較的短く、この最初の二つのスペクトル値、つまり、最も低い二つの周波数係数
は比較的頻繁に起こることを意味している。他方、番号2で示されている暗語は
比較的長く、この符号化されたオーディオ信号では3番目及び4番目のスペクトル
係数の発生は比較的まれで、それ故にこれらのスペクトル係数は比較的大きなビ
ット数で符号化される。図2に示すように、番号3,4,5で示される暗語はス
ペクトル係数5,6,7,8,9,10を表しているが、これらの各暗語は比較
的短いので、これらの係数は比較的頻繁に発生する。番号6〜10で示されてい
る暗語についても同様の考え方ができる。
【0009】 前述したように、図2からも明らかなように、符号化されたスペクトル値のた
めのハフマン暗語は、周知の符号化装置によって生成されるビットストリームの
場合、そのビットストリーム中に周波数が高くなっていく順に一列に並んでいる
【0010】 エラーが発生するチャンネルにおけるハフマンコーディングの最大の不利益は
、そのエラーを伝達してしまうことである。例えば、図2中の番号2で示される
暗語が伝えられる際に、この暗語2の長さが変更されるかもしれないという無意
味とは言えない可能性がある。このようにして正しい長さとは異なる場合がある
。図2の場合、もし暗語2の長さが妨害により変更されたなら、デコーダはもは
や、暗語3−10がどこから始まるのかを判断できなくなり、つまり、そのオー
ディオ信号のほとんど全ての部分が影響を受けることになる。このように、妨害
された暗語に続く他の全ての暗語さえも正確に復号化されなくなる。それは、こ
れらの暗語がどこから始まるのかわからなくなり、この誤差のために、間違った
開始点が選ばれてしまうからである。
【0011】 このようなエラー伝達の問題を解決するために、ヨーロッパ特許第06121
56号は、一つの暗語の始まりが、完全な復号化をしなくても、あるいは誤った
伝達の場合にでも、より簡単に確認できるように、長さの異なる暗語のいくつか
をラスター配列させ、他の暗語を残りの隙間に配置させることを提案している。
【0012】 この周知の方法の効率を決定づけるパラメータは、そのラスターが実際どのよ
うに定義されるのか、つまり、いくつのラスターポイントが必要なのか、ラスタ
ーポイント間のラスター距離等である。しかし、ヨーロッパ特許第061215
6号は、誤差の伝達を抑えるためにラスターが利用されるべきであるという一般
的な提案を超えるものではなく、誤差許容と同時に効率的な符号化を達成するた
めにどのようにしてラスターを効率的に構築するのかについて、何の詳細な説明
もない。
【0013】 本発明の目的は、誤差許容にもかかわらず効率的なオーディオ信号又はビット
ストリームの符号化及び復号化のための概念を提供することにある。
【0014】
【発明の構成、作用及び効果】
前記目的は、請求項1又は請求項9に係るオーディオ信号の符号化方法、請求
項21又は請求項22に係るオーディオ信号の符号化装置、請求項23又は請求
項24に係るビットストリームの復号化方法及び請求項25又は請求項26に係
るビットストリームの復号化装置により達成される。
【0015】 本発明は、既に提案されているラスターは誤差許容符号化/復号化だけでなく
、効率的な符号化/復号化を可能にするように形成または使用されなければなら
ないという発見に基づくものである。ここで最も重要なことは、ハフマンコーデ
ィングという形でのエントロピー符号化によって得られる暗語は本質的に長さの
異なるものである。最も大きな符号化の成果は、最も頻繁に起こる値に最も短い
暗語を与える場合、現れる。他方、比較的まれに起こる値は、たとえ長い暗語を
与えても、統計上、データ量としては最適値になる。ハフマンコーディングによ
って得られる暗語は、本質的に異なる長さを有するものである。
【0016】 本発明の第1の特徴点によると、いわゆる優先暗語がラスターポイントに配置
され、これにより、たとえビットストリーム中にエラーがあっても、ラスターを
通してデコーダが間違いなく各優先暗語の始まりを認知することができる。優先
暗語は、心理音響的に重要な暗語である。このことは、いわゆる優先暗語によっ
て符号化されたスペクトル値が、復号化されたオーディオ信号の聴感覚に実質的
に貢献するということを意味している。オーディオ信号が高い割合でスピーチを
含んでいる場合、優先暗語は低いスペクトル値を表す暗語である。なぜならば、
この場合、重要なスペクトル情報はスペクトルの低い領域にあるからである。オ
ーディオ信号がスペクトルの中領域にあるトーン群を持っている場合、優先暗語
は周波数領域のこれに相当する中領域のスペクトル値に割り当てられた暗語であ
る。なぜならば、これらが心理音響的に重要なスペクトル値であるからである。
心理音響的に重要なスペクトル値は、また、その規模つまり信号エネルギーがス
ペクトル内の他のスペクトル値に比べて大きいものである。他方、心理音響的に
さほど重要でない暗語、いわゆる非優先暗語がこのラスターを埋める。従って、
これらの暗語はラスターポイントと共には位置しないが、優先暗語がラスターポ
イントに配置された後、残りの空間に「はめ込まれる」。
【0017】 従って、本発明の第1の特徴点によれば、優先暗語、つまり、心理音響的に重
要なスペクトル値に与えられた暗語が、これらの優先暗語の開始点とラスターポ
イントが一致するようにラスター配列される。
【0018】 本発明の第2の特徴点によると、スペクトル値はスペクトル部分にグループ分
けされ、異なるコード表が各スペクトル部分に与えられる。スペクトル部分への
コード表の割り当ては、信号の統計的な考慮に基づいて、例えば、あるスペクト
ル部分の符号化に最も適するコード表はどれかということに基づいてなされる。
スペクトル部分へのコード表の割り当ては、すでにこの技術分野では周知である
【0019】 等距離で配列されたラスターポイントのグループがいくつか集まったラスター
が使用されることになる。一つのラスターポイントグループ内のラスターポイン
ト間の距離は、一つのスペクトル部分の符号化に使用されるコード表に基づいて
いる。他の別のスペクトル部分では、最適なデータ圧縮を行うために別のコード
表が使用される。この別のコード表は、別のグループの等距離で配列されている
ラスターポイントに割り当てられ、このラスターポイントグループ内の二つのラ
スターポイントの距離はその関連するコード表に基づいている。互いに異なるラ
スターポイントグループの二つのラスターポイントの距離は、少なくとも三つの
方法で決定することができる。
【0020】 最初に、一のコード表の暗語の最大長さを確定する。このコード表が与えられ
たラスターポイントグループ内の二つのラスターポイントの距離は、そのコード
表の暗語の最大長さと同じか又は最大長さよりも大きいので、ラスターにはこの
コード表の最長の暗語のための空間がある。別のコード表に関連する別のラスタ
ーポイントグループ内の二つのラスターポイントの距離は、この別のコード表の
暗語の最大長さに基づき、同様の方法で決定される。
【0021】 以下に説明する2番目の方法は、ラスターポイントの数の増加にも貢献する。
ハフマンコードの本質的な特性のために、あまり頻繁に発生しない暗語は、より
頻繁に発生する暗語よりも長い。ラスターポイント間の距離を、ある表の暗語の
最大長さと同じか又はそれよりも大きく設定する場合、そのラスターに挿入され
る暗語は通常そのラスターポイント間距離よりも短い。従って、ラスターポイン
ト間距離は、ある表の暗語の最大長さよりも短く設定することも可能である。符
号化の際にそのラスターに入りきらない暗語が現れた場合、ラスターに入らない
残りの部分は、ビットストリームのラスター配列外の他の適当な場所に挿入され
る。結果として、この分断された暗語はもはやエラー伝達から有効に保護されな
い。これは非常にまれなことであり、ラスターポイントの数の増加という利益の
ために受け入れられるものである。
【0022】 異なるラスターポイント間距離を決定する第3の方法は、コード表の暗語の最
大長さではなく、符号化されたスペクトル部分に実際に生じるビットストリーム
中の暗語の最大長さを考慮することである。
【0023】 本発明の第3の特徴点によると、本質的に周波数に関して直線的に高くなる順
番によるビットストリーム中の暗語の配列に代わり、暗語が周波数領域に渡り分
散される配列が使用され、これはまた「スクランブリング」として知られている
方法である。これはいわゆる「突発的なエラー」が、全周波数帯域の間違った複
合化につながることはなく、単にいくつかの異なる周波数領域で小さな妨害が見
られる程度であるという利点を有している。
【0024】 本発明の第4の特徴点によると、本質的に周波数に関して直線的に高くなる順
番による暗語の配列に代わり、例えばn番目ごと(例えば、2番目ごと、3番目
ごと、又は4番目ごと)の暗語だけがラスターに配列されるという配列方法が使
用され得る。この方法では、可能なラスターポイントの数が優先暗語の数よりも
小さい場合、優先暗語を使用するスペクトル領域を可能な限り大きくすること、
つまり、エラー伝達を防止することが可能になる。
【0025】 さらに、効率的な作動を達成するような方法で優先暗語を決定することに優先
権が与えられる。好ましくは、このことは心理音響的に重要な暗語、つまり優先
暗語が低周波のスペクトル値を符号化するものであるという仮説を放棄すること
を意味する。このような場合はしばしばあるが、常にそうであるとは限らない。
【0026】 通常、優先暗語は心理音響的に重要なスペクトルラインを符号化するものであ
り、これらは通常高いエネルギーを有するスペクトル値である。高いエネルギー
を有するスペクトルラインはエラーによっては生じない。
【0027】 本発明によると、すでに暗黙的に決定されたインディケータが使用される。こ
のインディケータは使用されるコード表に基づくものである。AAC標準におい
て、例えば、異なる絶対値域を有する11のコード表がある。コード表1は例え
ば−1〜+1の絶対値を持つスペクトル値を含み、コード表11は−8191〜
+8191のスペクトル値を符号化する。コード表番号が大きくなればなるほど
、それが符号化できる値域が大きくなる。このことは、小さい番号のコード表は
比較的小さな値のみを表し、それ故に比較的小さなエラーを引き起こすだけであ
り、大きな番号のコード表は比較的大きな値域を表し、比較的大きなエラーを引
き起こすことを意味している。
【0028】 小さな番号のコード表においてエラーが発生しても、それはよく聞こえないも
のであり、間違ったスペクトルラインの結果は、元々の正しいスペクトルライン
とさほど違わないものとなる。しかし、最も大きな番号のコード表においてエラ
ーが発生した場合、このエラーは原則としてこのコード表の絶対値のいくつかと
なり得る。最も大きな番号のコード表で符号化されたスペクトルラインが小さい
値を有し、例えば伝達の間に生じたエラーのために、デコーダ内で、このコード
表によって最も高い絶対値を持つスペクトルラインとして複合化された場合、こ
の間違ったスペクトルラインは確かに聞こえるものとなる。
【0029】 誤差許容に関して、最も重要なコード表は従って最も大きな番号のコード表(
AAC標準ではコード表11)である。なぜならば、このコード表は、値を−2 13 +1(−8191)〜+213−1(+8191)の間に逃してしまうからであ
る。
【0030】 本発明のさらなる特徴点によると、短いウィンドウがAAC標準の伝達信号の
ために使用される。短いウィンドウにより、周波数分解能はより高い時間的分解
能のために減じられる。優先暗語は、心理音響的に重要なスペクトル値、つまり
低周波のスペクトル値又は番号の大きいコード表からのスペクトル値がラスター
ポイント上に確かに配置されるように、決定される。倍率帯域のインターリービ
ングは、これはAAC標準の特徴であるが、この目的のために解除される。
【0031】
【発明の実施形態】
本発明の好ましい実施形態を添付図面を参照しながら説明する。
【0032】 本発明を説明するために、図2に優先暗語を斜線で示す。図2は、周知の異な
る長さの暗語の配列を示しているが、これは周波数に関して直線的に高くなる順
番によるものである。図2では、優先暗語が暗語1〜5である。前述したように
、オーディオ信号が例えば高い割合でスピーチを含んでいる場合、または多くの
低周波音を含んでいる場合、低周波のスペクトル値に与えられる暗語が優先暗語
である。図2中、暗語6〜10は高周波のスペクトル値に関連するものであり、
これらのスペクトル値は復号化された信号の全体的な印象に貢献するものの、聴
感覚には大して影響せず、従って心理音響的にあまり重要ではない。
【0033】 図1は、ラスターポイント10〜18を有するビットストリームを示す。図1
中、ラスターポイント10とラスターポイント12の間の距離をD1、ラスター
ポイント14とラスターポイント16の間の距離をD2とする。
【0034】 本発明の第1の特徴点の説明に関して、ラスターポイント10からラスターポ
イント14の間のビットストリームだけを考える。優先暗語1,2は、図2に示
された例では低周波域に位置している重要なスペクトル部分であるが、これが復
号化の際にエラー伝達の対象とならないように、ラスターに配列されている。非
優先暗語、図1、図2において斜線を符していないものであるが、これらは優先
暗語の後に、ラスターを埋めるように配置される。ハフマン暗語の長さは暗語そ
のものからわかるので、非優先暗語を一固まりでラスターに入れ込む必要はない
。デコーダは、読み取ったものが暗語の単に一部だけであるのかどうかを判別で
きる。この場合、デコーダは自動的に、暗語の最初の部分に、次のラスターポイ
ントの後の優先暗語に引き続き、ある特定のビット数を付加する。従って、非優
先暗語7,8,9のそれぞれがビットストリーム中二つに分けられ、つまり、7
a,7b、8a,8b、9a,9bに分けられるように、非優先暗語の最初の部
分をラスターの最初の空き場所に挿入し、残りの部分を他の場所に挿入すること
が可能である。
【0035】 既に説明したように、図1のビットストリームの第2の部分は本発明の第2の
特徴点を説明している。ラスター距離D1が小さなラスター距離D2に変更され
なければ、優先暗語1〜5のどれでもが入る距離D1を有するラスターは、いわ
ば、ラスターの残りの部分を埋めるだけの十分な非優先暗語がないというような
長いビットストリームを作る結果となりうる。従って、ビットストリームに挿入
されるべき多くの優先暗語だけをオーディオ信号から抜き出し、根本的に空き場
所を残さないようにし、ビットストリームが不必要に延長されることがないよう
にする。
【0036】 本発明の第2の特徴点を、図1を参照しながら詳細に説明する。MPEG−2
AAC標準に基づく符号化方法の場合において、11の異なるハフマンコード
表が符号化のために使用される。これらの表の大部分にとって、可能な限りの最
大の暗語長さは10〜20ビットである。しかし、特別な表、いわゆる「逃し表
」は49ビットの最大長さを含む。もし全ての表のうちで最長暗語の長さをラス
ター距離Dとして使用するならば、49ビットのラスター距離を設定することに
なる。この結果、非常に大きな幅のラスターとなり、全ての優先暗語がラスター
ポイントに配列された場合、ビットストリームはあまりにも長すぎるものとなる
ので、ほとんど全ての表にとって非効率的なものとなる。従って、本発明による
と、ラスターの幅は使用されるコード表に基づき調整される。前述したように、
スペクトル値はいくつかのスペクトル部分にグループ分けされ、各スペクトル部
分には、信号の統計的要素を考慮して最適なコード表が与えられる。ひとつのコ
ード表における最大の暗語長さは、普通、他のコード表における最大の暗語長さ
とは異なる。
【0037】 暗語1,2で表されるスペクトル値は第1のスペクトル部分に属し、暗語3〜
10で表されるスペクトル値は第2のスペクトル部分に属すると仮定する。この
場合、ビットストリームは二つのラスターポイントグループによってラスターさ
れる。第1のラスターポイントグループはラスターポイント10,12,14か
らなり、第2のラスターポイントグループはラスターポイント14,16,18
からなる。さらに、スペクトル部分0はハフマンコード表nを与えられ、スペク
トル部分1はハフマンコード表mを与えられ、また、暗語2はスペクトル部分0
に与えられた表nのうちの最長暗語である。第1のラスターポイントグループの
ラスター距離は表nの最大の暗語長さ、つまりこの例での暗語2の長さよりも大
きいか、あるいは好ましくはそれと等しい。
【0038】 他方、ラスターポイント14と暗語10でのビットストリームの終点との間の
部分からわかるように、この例ではコード表mにおける最長の暗語は現れない。
従って、グループ2で示されるビットストリームのラスターには長さD2の暗語
はない。
【0039】 本発明の第2の特徴点によれば、ラスターの幅は使用されるコード表に基づい
て選択される。しかし、この場合、使用される表はデコーダで復号化される際に
認識されなければならない。しかし、コード表番号が各スペクトル部分のサイド
情報として常に送信されるならば、デコーダは、ある特定の異なる、この例では
11の、ハフマン表のうちのどのコード表であるかを認識することができる。
【0040】 前述したように、ラスター距離が使用されるコード表により決定されても、4
9ビットの暗語を含む逃し表を考えるとわかるように、最適なデータ圧縮が達成
されるわけではない。この逃し表の場合、ラスター距離は最大サイズのスペクト
ル値を符号化できるように49ビットに調節されることになるからである。逃し
表は、短いコード表を持つために、逃し表と共に短いコード表を使用して比較的
大きい値を符号化できるように、使用される。一つのコード表の値域を超える値
の場合、このスペクトル値のための暗語はある特定の値になり、このことは、コ
ーダ内で逃し表もまた使用されたということをデコーダに示すことになる。ある
コード表が値0〜2を含んでいる場合、例えば、そのコード表の3の値がデコー
ダに逃し表が使用されたことを示すことになる。「基礎」のコード表の値3を有
する暗語は同時に、その基礎コード表の最大値と共に、該当するスペクトル値を
形成する逃し表の値を与える。
【0041】 本発明のさらなる実施形態によると、一つのグループ(例えばグループ1又は
グループ2)内のラスターポイント間距離は、もはやあるコード表における最長
暗語の長さと同じではなく、あるコード表に属するビットストリームに実際に発
生する最長暗語の長さと同じである。本発明の第2の特徴点の第1実施形態にお
いては、逃し表における符号化効率は未だ最適ではないので、この実施形態では
これをさらに改良した。この表の暗語の最大長さ(スペクトル内で)は通常、技
術的符号化の理由からかなり短いものである。逃し表の最長の暗語は例えば49
ビットである。
【0042】 通常のオーディオ信号中に実際に発生する最も長い逃し表の暗語は、典型的に
は約20ビットの長さである。従って、ラスターポイントの数、及び一つのブロ
ック内の最長暗語の長さを送信することによりラスターポイントに配列され得る
優先暗語の数をさらに増すことができる。そしてラスターの長さは実際に発生す
る最長暗語の長さか又は現在使用されている表の論理的な最長暗語の長さのうち
のどちらか最小値である方に等しい。最小値を決定するために、各コード表の実
際に発生する暗語又は単に一つのオーディオフレームで使用される全てのコード
表の最長暗語のどちらかを使用することができる。この選択は非逃し表、つまり
「基礎」ハフマン表にも利用できるが、逃し表ほどには効率的ではない。
【0043】 あるスペクトル部分又はスペクトルブロック内の最長暗語の長さを送信するこ
とは別の有利な副作用を生み出す。デコーダは、既に発生した最大長さから、妨
害されたかもしれないより長い暗語がそのビットストリームの中に存在するかど
うかを検知することができる。長い暗語は普通、スペクトル値の高いエネルギー
を表している。非常に長い暗語が伝達エラーのために発生した場合、これは非常
に可聴な妨害となる。最大長さを送信することは、ほとんどの場合このようなエ
ラーを感知し、それに対して策を講じる手段を与えることになる。エラーに対す
る対向策とは、長すぎる暗語を単に空白にしておくか又は何かもっと複雑な隠蔽
工作であろう。
【0044】 誤差許容と同時に効率的な符号化のためにはできる限り多くのラスターポイン
トが望ましいということを銘記しておくことは重要である。しかし、ラスターポ
イントの数はビットストリームの全長によって制限される。これはもちろんラス
タリングの結果として長くされるべきではなく、なぜならば、ビットストリーム
中に使用されない場所ができてしまい、全体的なデータ圧縮の理論とは矛盾する
ことになるからである。しかし、応用によっては、ビットストリームの延長は高
い程度での誤差許容のためには受け入れられることもあるということも、また指
摘しておかねばならない。考慮すべき別の点は、ラスターはできるだけ多くの暗
語がラスターポイントから始まるように構築されることが好ましいということで
ある。よって、本発明は、先行技術に比べてラスターポイント間距離の選択に関
して有効な融通性がある。全く理想的な場合には、この融通性によって全ての暗
語がラスターポイント上に配置されるが、このためには非常に大きな技術努力が
必要である。前述のラスターポイントの配置方法、つまり各スペクトル部分での
ラスターポイント間距離を関連するコード表に基づいて決定する方法は、この最
適ケースに非常に近いものを可能とする。しかし、これは特に、全ての暗語が心
理音響的に重要なものではなく、ビットストリーム中に使用されない場所を残さ
ないために、心理音響的にさほど重要でない暗語は、ビットストリーム内に、ラ
スター配列された心理音響的に重要な暗語の間に挿入されるからである。
【0045】 本発明の第3の特徴点によれば、暗語は、ビットストリーム中に、もはや周波
数に関して高くなる順に直線状に並べられてはいず、異なるスペクトル値の暗語
が「スクランブル」されている。図1において、暗語の周波数に関わる交互的な
直線的配列がある程度見られる。斜線で示された優先暗語は周波数が高くなる順
に配列され、斜線を施されていない非優先暗語も、周波数が高くなる順にビット
ストリーム中に挿入されているからである。いわゆる「突発的」エラーが図1に
示すビットストリーム中に発生した場合、すなわち、引き続くいくつかの暗語の
崩壊につながるような妨害が発生した場合、例えば暗語6,7a,2,3,7b
が同時に影響を受けることになる。
【0046】 これに相当する復号化されたオーディオ信号には、スペクトル的に比較的広く
故にはっきりと聞こえる妨害が、優先暗語2,3によって示されるスペクトル帯
域内に発生することになる。突発的なエラーの問題については、図1の非常に単
純な例からはあまり明らかではない。しかし、実際、5個以上のラスターポイン
トがあり、突発的エラーがしばしば複数のラスターポイントに跨って発生するこ
とが考えられ、このような場合には、比較的広い周波数帯域でのデータの損失と
なり得る。この理由から、本発明の第3の特徴点によれば、スペクトル値の優先
暗語は周波数の高くなる順に配列されないことが好ましく、周波数に関してラン
ダムなあるいはランダムに見えるような配列になるように「スクランブル」にす
る方が好ましい。非優先暗語もまた同様に取り扱ってもよい。ランダムのような
配列の場合、この分散状況はデコーダに前もってセットできるので、この分散に
ついてはサイド情報として送信する必要はない。結果として、ビットストリーム
中の連続する暗語の損失が完全な一つの周波数帯域の損失とはならず、単にいく
つかの周波数帯域での非常に小さい損失となるだけである。この妨害が聞こえる
ことはめったになく、一つの周波数帯域全体の損失よりも効果的に隠すことがで
きる。
【0047】 本発明の第4の特徴点によれば、優先暗語及び非優先暗語の周波数に関して高
くなる順の直線的な配列に代わり、例えばn番目ごとの暗語がラスター配列され
、残りの暗語はそれらの間に挿入されるという配列が使用可能である。前述した
ように、一つのビットストリームのためのラスターポイントの数は全長及びラス
ターポイント間距離によって限定される。例えば、低い帯域幅でのサンプリング
の場合を考えると、大多数の暗語が心理音響的に重要な暗語である。16kHz
のサンプリングレートが使用された場合、信号全てが論理的に使用可能な8kH
zの帯域幅を有しているからである。経験的には、暗語のうちの30%だけがラ
スターポイント上に配列され、残りの70%はラスターを完全に埋めるように配
列されなければならない。しかし、このことは、重要な周波数領域、例えばスピ
ーチ信号の場合は0〜4kHzであるが、これがラスターポイント上に配置され
た暗語によってカバーあるいは「保護」され得ないということを意味している。
従って、重要な周波数領域でのエラー伝達を適切に阻止するために、全ての優先
暗語をラスターポイント上に配置する代わりに、2番目ごと、3番目ごと、4番
目ごと等の優先暗語のみをこのように配置し、他の優先暗語は一直線に並べられ
るのではなく、ラスターを埋めるように配置される。例えば、2番目ごと、3番
目ごと等のスペクトル値が低周波領域にあることがわかり、点在する暗語が伝達
の間に崩壊する場合、例えば予測等のエラー隠蔽技術を使用してデコーダ内でこ
れらの暗語を再構築することも可能である。
【0048】 ビットストリームを復号化するための方法及び装置は前述の符号化を反映する
ように働く。
【0049】 符号化されたビットストリームが一つのコード表に異なる長さの暗語と等距離
のラスターポイント(10,12,14)を持つラスターを有し、これらの暗語
は、他のスペクトル値と比べて心理音響的に重要なあるスペクトル値を表す優先
暗語を含み、優先暗語はラスターポイントによって配列されているという符号化
されたオーディオ信号で表されるビットストリームを復号化するための一般的な
方法では、(a)二つのラスターポイント間の距離D1が決定される。二つのラ
スターポイント間の距離がわかれば、(b)ラスターポイントに配列されている
符号化されたビットストリーム中の優先暗語が、周波数に関して直線的な順で、
各優先暗語の始まりがラスターポイントと一致する配列となるように、再分類さ
れる。これにより優先暗語は図2に示す一般的な周波数に関する直線的な配列と
なり、(c)復号化されたスペクトル値を得るために、関連するコード表を用い
てこれらの優先暗語を復号化することができる。(d)復号化されたスペクトル
値を時間領域に戻すように変換して、復号化されたオーディオ信号が得られ、例
えばラウドスピーカに送り込めるように何らかのよく知られた方法で加工するこ
とができる。
【0050】 ビットストリームがただ一つのコード表を使用して符号化された場合、ラスタ
ーポイント間距離は、どの表が符号化のために使用されたのかをビットストリー
ムのサイド情報から見つけ出すことによって、極めて簡単に設定することができ
る。符号化によっては、この距離はこの表の最長暗語の長さであるかもしれず、
それはそのコーダに永久的にセットされ得る。その距離が、コード表が与えられ
たビットストリームの一部に実際に発生する最長暗語の長さであれば、このこと
はビットストリームに伴うサイド情報等でデコーダに発信される。
【0051】 デコーダは、優先暗語及び非優先暗語の再分類を、例えば符号化されたビット
ストリームにポインタを当てることによって行う。デコーダがラスター距離を認
識しており、優先暗語が周波数に関して直線的に配列されている場合、デコーダ
はラスターポイントに飛び越し、そこから始まる暗語を読むことができる。一つ
の暗語を読み終えると、ポインタは次のラスターポイントへ飛び、このようなプ
ロセスを繰り返す。全ての優先暗語が読まれても、ビットストリームはまだ非優
先暗語を含んでいる。ビットストリーム中の優先暗語と非優先暗語の直線的配列
が選択された場合、非優先暗語はすでに周波数に関して直線的に配列されており
、さらなる分類をすることなしに、復号化及び元の状態への変換がなされる。
【0052】 本発明の第3又は第4の特徴点に係る符号化が選択されると、スクランブル情
報がサイド情報として送られるか、またはスクランブル状態の分布が前もって固
定され、それにより最初からデコーダはこのことがわかる。同じ考慮が第4の特
徴点にも当てはまる。一定の分布を規定するか、またはデコーダにサイド情報と
して連絡された可変の分布を選択することは常に可能である。
【0053】 ここで、優先暗語を決定し操作する有利な方法を説明する。ただ一つのコード
表を使用する場合には一つのラスター距離を、あるいは多数のコード表を使用す
る場合には複数のラスター距離を設定することによって符号化されたビットスト
リームのためのラスターを決定した後、優先暗語は、それぞれがラスターポイン
トと一致するようにラスターに配置されなければならない。
【0054】 本発明の好ましい実施形態では、この配置は、暗語を一種のソート表から本来
は空のラスターに順に挿入していくことによって達成される。表の最初の暗語か
ら始められる。従って、優先暗語は表中の暗語の並びによって影響されるが、優
先暗語は常にラスターの場所にある暗語、つまり、ラスターポイントが使用可能
である暗語である。もはやラスターポイントがない表中の暗語に関しては、ビッ
トストリーム中の残りの空間にそれらを挿入していく以外に選択の余地はない。
これらの暗語は従って本発明の感覚からすると、優先暗語ではない。
【0055】 優先暗語の数は前もっては決定されない。符号化されたビットストリームのた
めのメモリが満たされるまでは、すなわち、もはや優先暗語が書き込めなくなる
までは、優先暗語が書き込まれる。このメモリの大きさは、そのスペクトルデー
タのために以前に使用されたビットの合計と同じである。つまり、それ以上のビ
ットはラスタリングによって要求されない。メモリは、このように符号化の効率
がラスター処理の結果として落ち込むのを阻止するために、暗語の数によって制
限される。もちろん、誤差を許容することができるように、全ての暗語がラスタ
ーポイント上に配置されてもよい。しかし、この場合、ラスターポイント間に空
のビットが使用されないままになるので、符号化効率の顕著な低下につながる。
【0056】 本発明の第1の特徴点は優先暗語、つまり、他のスペクトル値に比べて心理音
響的に重要なスペクトル値を表す暗語の決定に係わるものである。心理音響的に
重要なスペクトルラインとは、例えば、他のスペクトルラインよりも大きなエネ
ルギーを含んでいるスペクトルラインである。概略的に言えば、大きなエネルギ
ーを有していればいるほど、そのスペクトルラインはより重要である。従って、
高いエネルギーを有するスペクトルラインが妨害されないことと、それと同様に
、高いエネルギーを有するスペクトルラインがエラーの結果として発生すること
はないということが重要である。
【0057】 これまでは、高いエネルギーを有するスペクトルラインが主にスペクトルの低
い部分に位置しているという仮定で説明してきた。これは多くの場合事実である
が、全ての場合ではない。本発明は、一つの暗語に符号化されたスペクトルライ
ンの、または複数のスペクトルラインが一つの暗語に符号化されている場合はこ
れら複数のスペクトルラインのエネルギーを概算するための含蓄されたインディ
ケータを使用することによって、この仮説を無視するものである。
【0058】 このインディケータは、使用されるハフマンコード表のようなコードブック又
はコード表である。例えばAAC標準では、11個の表が使用される。これらの
表の値域はかなり違っている。表1〜11の最大絶対値は以下の通りである。
【0059】 1;1;2;2;4;4;7;7;12;12;8191.
【0060】 これらの異なる値域の結果として、最大エラーは表による。各表の表示を考え
ると、これは表の中から確認可能であるか、または表以外から送信されてくるが
、最大エラーは前記絶対値の2倍になる。本発明によれば、優先暗語の決定は使
用されるコード表に基づいてなされ、そのインディケータは最大絶対値と含蓄的
にコード表番号である。まず、そのコード表が最大の値域を有している暗語を考
える。次に、そのコード表が2番目に大きい値を有する暗語が続き、という手順
である。従って、AAC標準の場合、表11が最初に考慮され、表9,10が続
き、表1,2が優先順位の最後である。ラスターポイントに配置される優先暗語
は、このように、ラスターポイントがそれのために使用され得るソート表の中に
ある暗語である。
【0061】 暗語を決定するこの方法の利点は、使用される表がサイド情報で送信され、こ
の情報からデコーダは送信中に使用される暗語の並びを決めることができるので
、他の付加的な情報をデコーダに送信する必要はない。
【0062】 本発明の第2の特徴点は、オーディオ信号を表すスペクトル値を得るためにそ
の周波数領域内でのオーディオ信号の離散時間型サンプルを変換するために、長
いウィンドウに対向するものとして、短い(サンプリング)ウィンドウを使用す
ることに関する。短いウィンドウはAAC標準及び標準層3で定義される。短い
ウィンドウの場合、一つの長いMDCTの代わりに多数の短いMDCTが使用さ
れる。
【0063】 AAC標準では、それぞれが128の出力値を有する8個のMDCTからなる
グループが、例えば1024の出力値を有する一つのMDCTの代わりに使用さ
れる。これはコーダの周波数分解能を犠牲にして時間的分解能を高めることにな
る。一般的に短いウィンドウは一時的な信号に使用される。例えば短いウィンド
ウがAACと共に使用される場合、8つの連続した完全なスペクトル、すなわち
それぞれのセットが全スペクトルを含む8セットのスペクトル値が得られるが、
スペクトル値間の距離もまた8倍の大きさである。これは周波数分解能の低下を
表し、そしてこれは時間的分解能の高まりを伴う。
【0064】 AAC標準ではグループ分けが行われる。すなわち、8つのスペクトルからグ
ループが形成される。これらのグループのために1セットの倍率がある。最も単
純な場合、各グループが一つのウィンドウを含んでいる。この場合、8セットの
倍率が送信されなければならない。より強い圧縮を達成するためには、一般的に
心理音響的な必要条件を考慮して、複数のウィンドウがAAC標準の一つのグル
ープに集められる。これは送信されるべき倍率の数を減少させ、より良いデータ
圧縮となる。スペクトルデータはグループ毎に順に符号化されたビットストリー
ムに記載されて送信される。グループ内では倍率帯域の交互配置が行われる。
【0065】 このことは下記の例によって示される。ここでは三つのグループに分けられる
。第1グループは二つのウィンドウを含み、第2グループは三つのウィンドウを
含み、第3グループも三つのウィンドウを含んでいる。各スペクトルは12の倍
率帯域を有する。グループ分けは下記の通りである。
【0066】 第1グループ、第1ウィンドウ、第1倍率帯域 第1グループ、第2ウィンドウ、第1倍率帯域 第1グループ、第1ウィンドウ、第2倍率帯域 第1グループ、第2ウィンドウ、第2倍率帯域 ... 第1グループ、第2ウィンドウ、第12倍率帯域 第2グループ、第3ウィンドウ、第1倍率帯域 第2グループ、第4ウィンドウ、第1倍率帯域 第2グループ、第5ウィンドウ、第1倍率帯域 第2グループ、第3ウィンドウ、第2倍率帯域 ...
【0067】 この配列は、プレソーティング(予備分類)、あるいはソート表から暗語をラ
スターに挿入するのには適さない。なぜならば、連続的な挿入がなされる場合、
第1グループの全スペクトルは保護されるが最後のグループのスペクトルは保護
されないからである。この理由で、本発明の第2の特徴点に係るプレソーティン
グは、短いウィンドウのために行われる。AAC標準の場合、グループ分けと倍
率帯域によるアプローチは放棄される。新しいプレソーティングは、今度はスペ
クトルラインのユニットという形で行われる。
【0068】 本発明の好ましい実施形態において、各ユニットは四つのスペクトルラインを
含む。AAC標準では従って各ウィンドウは、128のスペクトルラインに相当
する32のユニットを含む。スペクトルデータは下記の通りである。
【0069】 第1ウィンドウ、第1ユニット 第2ウィンドウ、第1ユニット ... 第8ウィンドウ、第1ユニット 第1ウィンドウ、第2ユニット 第2ウィンドウ、第2ユニット ... 第8ウィンドウ、第2ユニット 第1ウィンドウ、第3ユニット ...
【0070】 このプレソーティングは全てのウィンドウの個々のスペクトル領域は互いに近
くに位置する、つまり、低いスペクトル値は、周波数に基づき、より高い周波数
を有するスペクトル値の前に、個々のセットのスペクトル値から短い表の前部分
に書き込まれる。低いスペクトル領域のスペクトル値は心理音響的に特に重要で
あり、ソート表の前述のプレソーティングは、スペクトル値をソート表からラス
ターに挿入するための基礎を与える。この暗語のプレソーティング、つまり、優
先暗語を決定することにより、いかなる付加的情報をも送る必要はない。なぜな
らば、デコーダはサイド情報からこのブロック又はフレームでは短いウィンドウ
が使用されたことを認識し、ユニットを生成するためのコーダの分類アルゴリズ
ムが常に一定とされ、故にそれがデコーダに永久的にプログラムされるからであ
る。
【0071】 暗語をソート表にプレソーティングすることは優先暗語を決定することに相当
することを銘記しておくことは重要である。なぜなら、ラスターポイントに位置
する暗語、つまり、優先暗語がソート表の最初、つまり前又は上の部分にある可
能性が高いので、この表はそれ自体、高い可能性で、どの暗語がラスターポイン
トに書かれ得るのかを決定するからである。
【0072】 この好ましい実施形態以外では、このプレソーティングはソート表によっては
行われず、個々の暗語を指し、指し示された暗語がビットストリーム中に書き入
れられる順番を決定することで行われる。
【0073】 AAC標準から、いくつかのコード表は2次元又は4次元的であること、すな
わち、一つの暗語が2個又は4個のスペクトル値を符号化することが知られてい
る。従って、四つのスペクトルライン又はその倍数を一つのユニットにグループ
化することが有利である。このようにすれば同じ周波数領域を符号化する暗語が
直接互いに連続するように分類されるからである。一つのユニットのスペクトル
ラインの数はそのコード表の異なる次元によって割り切れることが好ましい。す
なわち、ユニットごとのラインの数は暗語ごとのラインの数の公倍数であり、最
小公倍数ならば最適である。
【0074】 本発明は第1、第2の特徴点が組み合わされたとき、特に効果的である。本発
明に係るユニットへの再分類が短いウィンドウのために行われ、次にコード表の
インディケータを用いて優先暗語の決定が行われ、その際、高い程度のエラー防
止を達成するために高いコード表からの暗語が一定のラスターポイント上に配置
されることを確実にするために、ユニットへの再分類の結果が再び再分類される
。 この組み合わせは必ずしも必要ではないが、最良の結果を導くものである。
【図面の簡単な説明】
【図1】 暗語を含む符号化されたビットストリームの、本発明の第2の特徴点に係るラ
スタリングの一例を示す。
【図2】 従来技術による、周波数に関して直線的に高くなる順番による暗語の配列を示
す。
【手続補正書】
【提出日】平成13年7月17日(2001.7.17)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0012
【補正方法】変更
【補正の内容】
【0012】 この周知の方法の効率を決定づけるパラメータは、そのラスターが実際どのよ
うに定義されるのか、つまり、いくつのラスターポイントが必要なのか、ラスタ
ーポイント間のラスター距離等である。しかし、ヨーロッパ特許第061215
6号は、誤差の伝達を抑えるためにラスターが利用されるべきであるという一般
的な提案を超えるものではなく、誤差許容と同時に効率的な符号化を達成するた
めにどのようにしてラスターを効率的に構築するのかについて、何の詳細な説明
もない。 EP−A−0717503は、音楽信号の離散時間型サンプルを周波数領域に 変換し、得られたスペクトル値を量子化及びエントロピー符号化するデジタル符 号化及び復号化の方法を開示している。このエントロピー符号化は、長さの異な るある特定の数の暗語を生み出し、これらの暗語のいくつかはラスター配列され 、他のものはラスターの残りの空間に挿入されている。 EP−A−0492537は、情報が小さなピクセル群に分けられ、各ピクセ ル群は直交変換手段によって直交する成分に変換される、ビデオ及びオーディオ 情報の記録装置に関する。そして、直交する成分は、長さの異なる暗語を有する コードを用いて符号化される。符号化された暗語のいくつかは第1メモリに書き 込まれる。もし暗語が、第1メモリに書込み可能なものよりも多くのビットを有 している場合、その暗語の残りのビットは別のメモリに書き込まれる。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 エーレト、アンドレアス ドイツ国、D−91058 エルランゲン、ゲ ルハルト−ハオプトマン−ストラーセ 1 (72)発明者 ブランデンブルク、カールハインツ ドイツ国、D−91054 エルランゲン、ハ ーグストラーセ 32 (72)発明者 ゲルハオイサー、ハインツ ドイツ国、D−91344 バイシェンフェル ト、サオゲンドルフ 17 (72)発明者 ノブバクート−イラニ、アリ ドイツ国、D−91052 エルランゲン、ヴ ィヒェルンストラーセ 18 (72)発明者 ラオバー、ピエレ ドイツ国、D−90419 ニュルンベルク、 リルケストラーセ 30 (72)発明者 ビット、ローラント ドイツ国、D−90453 ニュルンベルク、 アルフォンス−スタオダー−ストラーセ 77 Fターム(参考) 5D045 DA20 5J064 AA01 BA09 BA16 BC01 BC16 BD01

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 符号化されたビットストリームを得るためにオーディオ信号を
    符号化する方法であり、以下のステップを含む、 (a)オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
    散時間型サンプルを周波数領域に変換する、 (b)暗語で符号化されたスペクトル値を得るために、異なる長さを有する限
    られた数の暗語を含むコード表を用いてスペクトル値を符号化する、各スペクト
    ル値に与えられる各暗語の長さは、概して、スペクトル値が発生する可能性が高
    ければ高いほど短いものである、 (c)符号化されたビットストリームのためにラスターを決定する、このラス
    ターにおいては、等距離のラスターポイント(10,12,14)があり、ラス
    ターポイント間の距離(D1)はそのコード表によるものである、 (d)他のスペクトル値に比べて心理音響的に重要な特別なスペクトル値を表
    す優先暗語を、各優先暗語の始まりがラスターポイントと一致するように、ラス
    ターに配置する。
  2. 【請求項2】 請求項1記載の方法であり、 複数のウィンドウが使用され、これにより、複数セットのスペクトル値が得ら
    れ、各スペクトル値セットは全スペクトルを含み、 下記のステップが前記ステップ(d)の前に実行される、 それぞれのセットからの同じ周波数のスペクトル値を符号化する暗語を優先暗
    語として定義する。
  3. 【請求項3】 請求項1又は請求項2記載の方法であり、コード表の暗語が複
    数のスペクトルラインを符号化し、これらのスペクトルラインはグループ又はユ
    ニットにまとめられ、その際、一つのグループ中のスペクトルラインの数は一つ
    の暗語が符号化するスペクトルラインの数によって割り切れるようになされる。
  4. 【請求項4】 請求項3記載の方法であり、異なる次元を有する多種のコード
    表、つまり、暗語ごとのスペクトルラインが異なるコード表が使用され、一つの
    ユニットはn個のスペクトルライン(nは発生する全ての次元の公倍数である)
    を有している。
  5. 【請求項5】 請求項1、請求項2又は請求項3記載の方法であり、低周波に
    与えられるスペクトル値セットのスペクトルラインを符号化する暗語が優先暗語
    として定義される。
  6. 【請求項6】 請求項5記載の方法であり、優先暗語を定義するステップは以
    下のステップを含んでいる、 暗語を、優先暗語がソート表の前の部分の暗語になるように、従って表のそれ
    より後に位置する暗語よりもラスターポイント上に位置され易くなるように、ソ
    ート表に順に置き、ソート表の暗語の順番が暗語の中での優先分布を設定し、こ
    れにより優先暗語を作成する、 ラスターポイントが無くなるまで、暗語をこのソート表からラスターポイント
    上へ順に配置していく、 残りの暗語を、ソート表から未だ空いているラスターの場所に配置する。
  7. 【請求項7】 請求項1、請求項2、請求項3、請求項4、請求項5又は請求
    項6記載の方法であり、優先暗語は低周波及び/又は高いエネルギーを有するス
    ペクトル値を符号化する暗語である。
  8. 【請求項8】 請求項1、請求項2、請求項3、請求項4、請求項5、請求項
    6又は請求項7記載の方法であり、ラスターポイント間距離は、コード表の最長
    暗語の長さよりも小さいか、それに等しいか、又はそれよりも大きい、あるいは
    、ビットストリーム中に実際に現れる最長の暗語の長さと等しいか又はそれより
    も大きいものである。
  9. 【請求項9】 符号化されたビットストリームを得るためにオーディオ信号を
    符号化する方法であり、以下のステップを含む、 (a)オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
    散時間型サンプルを周波数領域に変換する、 (b)そのスペクトル値を隣り合うスペクトル部分に、各スペクトル部分が少
    なくとも一つのスペクトル値を有するように、グループ分けする、 (c)予め決められた数のコード表から、少なくとも二つのコード表を二つの
    異なるスペクトル部分に与え、この際、そのスペクトル部分のスペクトル値の符
    号化に最も適するコード表を与える、 (d)スペクトル部分のスペクトル値を、そのスペクトル部分に与えられたコ
    ード表を用いて符号化し、各スペクトル値に与えられる暗語の長さは、概して、
    スペクトル値が発生する可能性が高ければ高いほど短いものである。 (e)符号化されたビットストリームのためのラスターを、そのラスターが少
    なくとも二つのラスターポイントグループ(10,12,14と14,16,1
    8)を有し、各グループのラスターポイントは互いに等距離に位置し、各グルー
    プのラスターポイント間距離(D1又はD2)は、前記少なくとも二つの異なる
    コード表のうちの適当なコード表に基づくように、規定する、 (f)他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す優先
    暗語をラスター内に、各コード表の各優先暗語の始まりがそれに相当するラスタ
    ーポイントグループのラスターポイント(10,12,14又は14,16,1
    8)と一致するように、配置する。
  10. 【請求項10】 請求項9記載の方法であり、前記ステップ(f)の前に以下
    のステップを含む、 インディケータが優先権を示すとき、暗語を優先暗語として定義する、該イン
    ディケータはその暗語が引き出されるコード表に基づくものである。
  11. 【請求項11】 請求項10記載の方法であり、前記インディケータは、それ
    が基づくコード表が全てのコード表のうちの最も高い絶対値を有している場合、
    最高の優先権を示す。
  12. 【請求項12】 請求項9、請求項10又は請求項11記載の方法であり、複
    数のコード表が使用され、各表にインディケータが存在し、そのインディケータ
    はそれぞれの表の最も高い絶対値より決定され、より大きな最大絶対値を有する
    表のインディケータは、より小さい最大絶対値を有する表のインディケータがす
    るよりも、その表からの暗語に対してより高い優先権を示す。
  13. 【請求項13】 請求項9、請求項10、請求項11又は請求項12記載の方
    法であり、各ラスターポイントグループのラスターポイント間距離(D1,D2
    )は、相当するコード表の最長暗語の長さよりも、小さいか、それに等しいか又
    はそれよりも大きい。
  14. 【請求項14】 請求項9、請求項10、請求項11又は請求項12記載の方
    法であり、各ラスターポイントグループのラスターポイント間距離(D1,D2
    )は、相当するスペクトル部分のスペクトル値のための実際の最長暗語の長さに
    等しく、 スペクトル部分の実際の最長暗語の長さはビットストリームにサイド情報とし
    て送信される。
  15. 【請求項15】 請求項9、請求項10、請求項11又は請求項12記載の方
    法であり、各ラスターポイントグループのラスターポイント間距離は、グループ
    分けされた全てのスペクトル部分の実際の最長暗語とこのグループのコード表の
    最長暗語のうちの最小値に等しく、実際の最長暗語はデコーダにサイド情報とし
    て送信される。
  16. 【請求項16】 請求項1、請求項2、請求項3、請求項4、請求項5、請求
    項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、
    請求項13、請求項14又は請求項15記載の方法であり、優先暗語及び非優先
    暗語の両方に関して、暗語の周波数に関して実質的に直線的な配列を保持して、
    ビットストリームのラスターへ配列する。
  17. 【請求項17】 請求項1、請求項2、請求項3、請求項4、請求項5、請求
    項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、
    請求項13、請求項14又は請求項15記載の方法であり、符号化されたスペク
    トル値を表す暗語は、相当するスペクトル値の周波数とは関係なく、ビットスト
    リームのラスターに配列される。
  18. 【請求項18】 請求項17記載の方法であり、周波数とは無関係の分布が予
    め決定されていない場合、周波数と暗語の間の相応関係に関する情報がサイド情
    報としてビットストリーム中に挿入される。
  19. 【請求項19】 請求項1、請求項2、請求項3、請求項4、請求項5、請求
    項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、
    請求項13、請求項14又は請求項15、請求項16、請求項17又は請求項1
    8記載の方法であり、優先暗語のうちのn番目ごとの暗語だけがビットストリー
    ムのラスターに配列され、残りの優先暗語及び非優先暗語はラスターポイントに
    配置されない。
  20. 【請求項20】 請求項1、請求項2、請求項3、請求項4、請求項5、請求
    項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、
    請求項13、請求項14又は請求項15、請求項16、請求項17、請求項18
    又は請求項19記載の方法であり、スペクトル値は、符号化に先立ち、心理音響
    モデルを考慮して量子化される。
  21. 【請求項21】 符号化されたビットストリームを得るためにオーディオ信号
    を符号化するための装置、以下のものを含む、 (a)オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
    散時間型サンプルを周波数領域に変換するユニット、 (b)暗語で符号化されたスペクトル値を得るために、異なる長さを有する限
    られた数の暗語を含むコード表を用いてスペクトル値を符号化するユニット、各
    スペクトル値に与えられる各暗語の長さは、概して、スペクトル値が発生する可
    能性が高ければ高いほど短いものである、 (c)符号化されたビットストリームのためにラスターを決定するユニット、
    このラスターにおいては、等距離のラスターポイント(10,12,14)があ
    り、ラスターポイント間の距離(D1)はそのコード表によるものである、 (d)他のスペクトル値に比べて心理音響的に重要な特別なスペクトル値を表
    す優先暗語を、各優先暗語の始まりがラスターポイントと一致するように、ラス
    ターに配置するユニット。
  22. 【請求項22】 符号化されたビットストリームを得るためにオーディオ信号
    を符号化するための装置、以下のものを含む、 (a)オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
    散時間型サンプルを周波数領域に変換するユニット、 (b)そのスペクトル値を隣り合うスペクトル部分に、各スペクトル部分が少
    なくとも一つのスペクトル値を有するように、グループ分けするユニット、 (c)予め決められた数のコード表から、少なくとも二つのコード表を二つの
    異なるスペクトル部分に与えるユニット、そのスペクトル部分のスペクトル値の
    符号化に最も適するコード表を与える、 (d)スペクトル部分のスペクトル値を、そのスペクトル部分に与えられたコ
    ード表を用いて符号化するユニット、各スペクトル値に与えられる暗語の長さは
    、概して、スペクトル値が発生する可能性が高ければ高いほど短いものである、 (e)符号化されたビットストリームのためのラスターを、そのラスターが少
    なくとも二つのラスターポイントグループ(10,12,14と14,16,1
    8)を有し、各グループのラスターポイントは互いに等距離に位置し、各グルー
    プのラスターポイント間距離(D1又はD2)は、前記少なくとも二つの異なる
    コード表のうちの適当なコード表に基づくように、規定するユニット、 (f)他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す優先
    暗語をラスター内に、各コード表の各優先暗語の始まりがそれに相当するラスタ
    ーポイントグループのラスターポイント(10,12,14又は14,16,1
    8)と一致するように、配置するユニット。
  23. 【請求項23】 符号化されたオーディオ信号を表すビットストリームを復号
    化する方法であり、この符号化されたビットストリームは一のコード表から引き
    出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10
    ,12,14)を持つラスターを有しており、暗語は、他の暗語に比べて心理音
    響的に重要な特別なスペクトル値を表す優先暗語を含み、優先暗語はラスターポ
    イントによって配列されている、該方法は以下のステップを含む、 (a)二つの隣り合うラスターポイントの距離(D1)を検知する、 (b)ビットストリーム中に、始まりがラスターポイントと一致するように、
    ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
    配列になるように再分類する、 (c)復号化されたスペクトル値を得るために、関連するコード表を用いて優
    先暗語を復号化する、 (d)復号化されたオーディオ信号を得るために、復号化されたスペクトル値
    を時間領域に戻すように変換する。
  24. 【請求項24】 符号化されたオーディオ信号を表すビットストリームを復号
    化する方法であり、この符号化されたビットストリームは少なくとも二つのコー
    ド表から引き出された互いに長さの異なる暗語を含み、少なくとも二つの、等距
    離で並ぶラスターポイントのグループ(10,12,14と14,16,18)
    を持つラスターを有し、暗語は、他の暗語に比べて心理音響的に重要な特別なス
    ペクトル値を表す優先暗語を含み、優先暗語はラスターポイントによって配列さ
    れている、該方法は以下のステップを含む、 (a)二つの隣り合うラスターポイントの距離(D1,D2)を検知する、 (b)ビットストリーム中に、始まりがラスターポイントと一致するように、
    ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
    配列になるように再分類する、 (c)一のスペクトル部分に関連するコード表を認識する、 (d)復号化されたオーディオ信号を得るために、一のスペクトル部分の優先
    暗語をそれに関連するコード表を用いて復号化する、 (e)復号化されたオーディオ信号を得るために、復号化されたスペクトル値
    を時間領域に戻すように変換する。
  25. 【請求項25】 符号化されたオーディオ信号を表すビットストリームを復号
    化する装置であり、この符号化されたビットストリームは一のコード表から引き
    出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10
    ,12,14)を持つラスターを有しており、暗語は、他の暗語に比べて心理音
    響的に重要な特別なスペクトル値を表す優先暗語を含み、優先暗語はラスターポ
    イントによって配列されている、該装置は以下のものを含む、 (a)二つの隣り合うラスターポイントの距離(D1)を検知するユニット、 (b)ビットストリーム中に、始まりがラスターポイントと一致するように、
    ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
    配列になるように再分類するユニット、 (c)復号化されたスペクトル値を得るために、関連するコード表を用いて優
    先暗語を復号化するユニット、 (d)復号化されたオーディオ信号を得るために、復号化されたスペクトル値
    を時間領域に戻すように変換するユニット。
  26. 【請求項26】 符号化されたオーディオ信号を表すビットストリームを復号
    化する装置であり、この符号化されたビットストリームは少なくとも二つのコー
    ド表から引き出された互いに長さの異なる暗語を含み、少なくとも二つの、等距
    離で並ぶラスターポイントのグループ(10,12,14と14,16,18)
    を持つラスターを有し、暗語は、他の暗語に比べて心理音響的に重要な特別なス
    ペクトル値を表す優先暗語を含み、優先暗語はラスターポイントによって配列さ
    れている、該装置は以下のものを含む、 (a)二つの隣り合うラスターポイントの距離(D1,D2)を検知するユニ
    ット、 (b)ビットストリーム中に、始まりがラスターポイントと一致するように、
    ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
    配列になるように再分類するユニット、 (c)一のスペクトル部分に関連するコード表を認識するユニット、 (d)復号化されたオーディオ信号を得るために、一のスペクトル部分の優先
    暗語をそれに関連するコード表を用いて復号化するユニット、 (e)復号化されたオーディオ信号を得るために、復号化されたスペクトル値
    を時間領域に戻すように変換するユニット。
JP2000591732A 1998-12-28 1998-12-28 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 Expired - Lifetime JP3580777B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP1998/008475 WO2000039933A1 (de) 1997-10-24 1998-12-28 Verfahren und vorrichtungen zum codieren bzw. decodieren eines audiosignals bzw. eines bitstroms

Related Child Applications (3)

Application Number Title Priority Date Filing Date
JP2004099419A Division JP3978194B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの復号化のための装置及び方法
JP2004099418A Division JP3902642B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
JP2004099417A Division JP4168000B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置

Publications (2)

Publication Number Publication Date
JP2002534702A true JP2002534702A (ja) 2002-10-15
JP3580777B2 JP3580777B2 (ja) 2004-10-27

Family

ID=8167173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000591732A Expired - Lifetime JP3580777B2 (ja) 1998-12-28 1998-12-28 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置

Country Status (5)

Country Link
US (1) US6975254B1 (ja)
JP (1) JP3580777B2 (ja)
KR (1) KR100391935B1 (ja)
AU (1) AU754877B2 (ja)
CA (1) CA2356869C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514032A (ja) * 2005-10-26 2009-04-02 クゥアルコム・インコーポレイテッド オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術
JP2013543146A (ja) * 2010-10-07 2013-11-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ビットストリーム・ドメインにおけるコード化オーディオフレームのレベルを推定する装置及び方法

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19907728C2 (de) 1999-02-23 2001-03-01 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
DE19907729C2 (de) 1999-02-23 2001-02-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines Datenstroms aus Codeworten variabler Länge und Verfahren und Vorrichtung zum Lesen eines Datenstroms aus Codeworten variabler Länge
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
US7428684B2 (en) * 2002-04-29 2008-09-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Device and method for concealing an error
US7724827B2 (en) 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US20060218459A1 (en) * 2004-08-13 2006-09-28 David Hedberg Coding systems and methods
US7698623B2 (en) * 2004-08-13 2010-04-13 David Hedberg Systems and methods for decreasing latency in a digital transmission system
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7199735B1 (en) * 2005-08-25 2007-04-03 Mobilygen Corporation Method and apparatus for entropy coding
JP4548348B2 (ja) * 2006-01-18 2010-09-22 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
CN101290771B (zh) * 2007-04-20 2011-07-13 中兴通讯股份有限公司 一种基于先进音频编码器的比特消耗控制方法
CA2689876C (en) * 2007-06-01 2012-12-04 Research In Motion Limited Determination of compression state information for use in interactive compression
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
GB2454190A (en) * 2007-10-30 2009-05-06 Cambridge Silicon Radio Ltd Minimising a cost function in encoding data using spectral partitioning
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
SG11201505911SA (en) 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Low-frequency emphasis for lpc-based coding in frequency domain
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN109903776B (zh) 2013-09-12 2024-03-01 杜比实验室特许公司 用于各种回放环境的动态范围控制
CA2982017A1 (en) * 2015-04-10 2016-10-13 Thomson Licensing Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation
CN117316168A (zh) * 2016-04-12 2023-12-29 弗劳恩霍夫应用研究促进协会 用于对音频信号进行编码的音频编码器以及方法
US10699725B2 (en) 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US10756755B2 (en) 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
US10770088B2 (en) 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
EP3455854B1 (en) * 2016-05-10 2020-09-16 Immersion Services LLC Adaptive audio codec method and apparatus
US10885921B2 (en) * 2017-07-07 2021-01-05 Qualcomm Incorporated Multi-stream audio coding
EP3738074A4 (en) 2018-01-08 2021-10-13 Immersion Networks, Inc. PROCESSES AND APPARATUS FOR THE PRODUCTION OF REGULAR REPRESENTATIONS OF A MOVEMENT OF ENTRY IN TIME AND SPACE
WO2020164751A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
WO2020165265A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3736898A (en) * 1970-11-18 1973-06-05 Mitsui Shipbuilding Eng Device for controlling list and level of pontoon
US4270025A (en) * 1979-04-09 1981-05-26 The United States Of America As Represented By The Secretary Of The Navy Sampled speech compression system
CA1211219A (en) * 1982-06-30 1986-09-09 Hideo Kuroda Digital data code conversion circuit for variable- word-length data code
EP0235566B1 (en) * 1986-01-27 1993-09-08 Fuji Photo Film Co., Ltd. Method of image signal encoding by orthogonal transformation
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
US4813056A (en) * 1987-12-08 1989-03-14 General Electric Company Modified statistical coding of digital signals
US4942467A (en) * 1988-12-05 1990-07-17 General Electric Company Predictor controlled encoder for digital transmission systems
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
JP2766302B2 (ja) * 1989-04-06 1998-06-18 株式会社東芝 可変長符号並列解読方法および装置
US5146577A (en) * 1989-04-10 1992-09-08 Motorola, Inc. Serial data circuit with randomly-accessed registers of different bit length
DE3943880B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
JPH04221465A (ja) 1990-12-21 1992-08-11 Matsushita Electric Ind Co Ltd 記録装置
KR940010433B1 (ko) * 1992-06-09 1994-10-22 대우전자 주식회사 가변길이 코드 디코딩장치
JPH06164409A (ja) * 1992-11-17 1994-06-10 Matsushita Electric Ind Co Ltd 帯域分割符号化方法
JP3446240B2 (ja) 1993-03-31 2003-09-16 ソニー株式会社 符号化方法および符号化装置
US5563593A (en) * 1994-03-18 1996-10-08 Lucent Technologies Inc. Video coding with optimized low complexity variable length codes
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
JP3274284B2 (ja) * 1994-08-08 2002-04-15 キヤノン株式会社 符号化装置およびその方法
KR960020018A (ko) * 1994-11-17 1996-06-17 배순훈 가변길이복호화장치
KR100209877B1 (ko) * 1994-11-26 1999-07-15 윤종용 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치
JP3732867B2 (ja) * 1995-03-09 2006-01-11 株式会社ルネサステクノロジ 画像伸張装置
KR100207385B1 (ko) * 1995-08-31 1999-07-15 전주범 가변 길이 복호화 장치
US5663726A (en) * 1995-12-01 1997-09-02 U.S. Philips Corporation High speed variable-length decoder arrangement with reduced memory requirements for tag stream buffering
US5835035A (en) * 1995-12-28 1998-11-10 Philips Electronics North America Corporation High performance variable length decoder with two-word bit stream segmentation and related method
US5650905A (en) * 1995-12-28 1997-07-22 Philips Electronics North America Corporation Variable length decoder with adaptive acceleration in processing of Huffman encoded bit streams
CA2249792C (en) * 1997-10-03 2009-04-07 Matsushita Electric Industrial Co. Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification
US6690307B2 (en) * 2002-01-22 2004-02-10 Nokia Corporation Adaptive variable length coding of digital video

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514032A (ja) * 2005-10-26 2009-04-02 クゥアルコム・インコーポレイテッド オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術
US8620644B2 (en) 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
JP2013543146A (ja) * 2010-10-07 2013-11-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ビットストリーム・ドメインにおけるコード化オーディオフレームのレベルを推定する装置及び方法
RU2553084C2 (ru) * 2010-10-07 2015-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для оценки уровня кодированных аудио кадров в области битового потока
US11238873B2 (en) 2010-10-07 2022-02-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for codebook level estimation of coded audio frames in a bit stream domain to determine a codebook from a plurality of codebooks

Also Published As

Publication number Publication date
AU754877B2 (en) 2002-11-28
AU2163699A (en) 2000-07-31
JP3580777B2 (ja) 2004-10-27
CA2356869A1 (en) 2000-07-06
CA2356869C (en) 2004-11-02
KR100391935B1 (ko) 2003-07-16
US6975254B1 (en) 2005-12-13
KR20010108051A (ko) 2001-12-07

Similar Documents

Publication Publication Date Title
JP3580777B2 (ja) オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
US6807528B1 (en) Adding data to a compressed data frame
EP2267698B1 (en) Entropy coding by adapting coding between level and run-length/level modes.
US7526432B2 (en) Apparatus and method for producing a data stream and apparatus and method for reading a data stream
JP4242516B2 (ja) サブバンド符号化方式
KR20070110311A (ko) 데이터의 중요도에 따라 변형된 데이터 스트림을 생성하는장치 및 그 데이터 스트림을 해석하는 장치
CA2889942C (en) Speech audio encoding device, speech audio decoding device, speech audio encoding method, and speech audio decoding method
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
JP3978194B2 (ja) オーディオ信号又はビットストリームの復号化のための装置及び方法
US7657336B2 (en) Reduction of memory requirements by de-interleaving audio samples with two buffers
KR100685974B1 (ko) 워터마크 삽입/검출을 위한 장치 및 방법
JP3523845B2 (ja) 可変長のコードワードのデータストリーム生成方法及び装置並びに可変長のコードワードのデータストリーム読出方法及び装置
ES2329466T3 (es) Procedimientos y dispositivos para codificar o decodificar una señal de audio o un flujo de bits.
KR101644883B1 (ko) 오디오 신호 처리 방법 및 장치
JP2001242893A (ja) 帯域分割音声圧縮符号化方法および装置

Legal Events

Date Code Title Description
A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20031222

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040720

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080730

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090730

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100730

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100730

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110730

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110730

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term