JP2004234020A - オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 - Google Patents

オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 Download PDF

Info

Publication number
JP2004234020A
JP2004234020A JP2004099418A JP2004099418A JP2004234020A JP 2004234020 A JP2004234020 A JP 2004234020A JP 2004099418 A JP2004099418 A JP 2004099418A JP 2004099418 A JP2004099418 A JP 2004099418A JP 2004234020 A JP2004234020 A JP 2004234020A
Authority
JP
Japan
Prior art keywords
spectral
raster
code
value
bit stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004099418A
Other languages
English (en)
Other versions
JP3902642B2 (ja
Inventor
Ralph Sperschneider
スペルシュナイダー、ラルフ
Martin Dietz
ディーツ、マルティン
Andreas Ehret
エーレト、アンドレアス
Karlheinz Brandenburg
ブランデンブルク、カールハインツ
Heinz Gerhaeuser
ゲルハオイサー、ハインツ
Nowbakht-Irani Ali
ノブバクート−イラニ、アリ
Lauber Pierre
ラオバー、ピエレ
Bitto Roland
ビット、ローラント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to DE19747119A priority Critical patent/DE19747119C2/de
Priority claimed from DE19840853A external-priority patent/DE19840853B4/de
Priority to PCT/EP1998/008475 priority patent/WO2000039933A1/de
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to JP2004099417A priority patent/JP4168000B2/ja
Priority to JP2004099419A priority patent/JP3978194B2/ja
Priority to JP2004099418A priority patent/JP3902642B2/ja
Publication of JP2004234020A publication Critical patent/JP2004234020A/ja
Application granted granted Critical
Publication of JP3902642B2 publication Critical patent/JP3902642B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/662Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a time/frequency relationship, e.g. time compression or expansion
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/35Unequal or adaptive error protection, e.g. by providing a different level of protection according to significance of source information or by adapting the coding according to the change of transmission channel characteristics
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 誤差許容における効率的なオーディオ信号又はビットストリームの符号化、復号化のための概念を提供する。
【解決手段】 符号化されたビットストリームを得るためにオーディオ信号の符号化方法にて、スペクトル値を得るため、オーディオ信号の離散時間型サンプルが周波数領域に変換される。このスペクトル値は、暗語によって符号化されたスペクトル値を得るため、限られた数の互いに異なる長さの暗語を有するコード表を用いて符号化される。スペクトル値に与えられる暗語の長さは、そのスペクトル値が発生する可能性が高ければ高いほど、短いものである。符号化されたビットストリームのためラスターが規定され、このラスターは等距離で並ぶラスターポイントを含み、ラスターポイント間距離は使用されるコード表に基づく。誤差許容ハフマンコーディングのため、他のスペクトル値よりも心理音響的に重要な特別なスペクトル値を表す暗語が、ラスター内に、各優先暗語の始まりがラスターポイントと一致するよう配列される。
【選択図】 図1

Description

本発明は誤差許容エントロピー符号化又は復号化、特に誤差許容ハフマンコーディング又はデコーディングを実行することができる、オーディオ信号又はビットストリームを符号化あるいは復号化するための方法及び装置に関する。
最近のオーディオ符号化あるいは復号化の方法は、例えば、MPEG層3標準によるものであるが、信号の質の明らかな低下を生じることなく、例えば因数12によってオーディオ信号のデータレートを圧縮することが可能である。このような高いデータレートの圧縮を可能にするためには、オーディオ信号をサンプリングし、結果的に一連の離散時間型サンプルとなる。この種の技術において知られているように、ウィンドウされた時間的なサンプル群を得るために、この一連の離散時間型サンプルは、適当なウィンドウ機能を使用してウィンドウされる。ある一つのウィンドウされた時間的なサンプル群は、フィルタバンク、変形離散コサイン変換(MDCT)あるいは他の適当な方法によって周波数領域に変更され、それにより、周波数領域における、そのオーディオ信号、つまり、その離散時間型サンプル群からなるその時間的部分を表すスペクトル値を得る。通常、50%重なる時間群が生成され、MCDTによって周波数領域に変換される。MDCTの特性のために、例えば1024の離散時間型サンプルは、常に1024のスペクトル値になる。
人間の耳の感受性はオーディオ信号そのものの時間的なスペクトルによることが知られている。これはいわゆる心理聴覚モデルに反映されている。このモデルを利用して、時間的スペクトルによるマスキング閾値を計算することが可能であった。マスキングとは、ある特定のトーン又はスペクトル部分が、例えば、その隣り合うスペクトル領域が比較的高いエネルギーを有する時、聞こえないものと判断されることである。このマスキング現象は、変換後のスペクトル値をできるだけ粗く量子化するために利用される。従って、目的は、できる限り少ないビットを符号化、あるいはここでは量子化し、復号化されたオーディオ信号には可聴範囲の妨害を避けることである。量子化により引き起こされる妨害、つまり、量子化ノイズはマスキング閾値以下であり、従って可聴域外であるべきである。周知の方法によれば、スペクトル値は従っていわゆる倍率帯域に予備分割され、これは、人間の聴覚の周波数群を反映している。ある倍率群のスペクトル値には、倍率帯域全体のスペクトル値を調整するために、ある倍率を掛ける。そして、倍率で調整された倍率帯域は量子化され、量子化されたスペクトル値を生成する。もちろん、倍率帯域にグルーピングすることは重要でない。しかし、この手順はMPEG層3標準及びMPEG−2 AAC (AACは上級オーディオ符号化)標準に使用されている。
データ圧縮の非常に重要な要素は、量子化されたスペクトル値のエントロピー符号化である。普通、ハフマンコーディングがこれに利用される。ハフマンコーディングは長さが変動する符号化を伴う。つまり、符号化されるべき値のための暗語の長さは、この値が起こりうる可能性に基づいている。論理的には、最も起こり易い記号が最も短い符号、つまり、暗語を割り当てられ、その結果、ハフマンコーディングによって非常に良好な余分な部分の削減が達成できる。よく知られている長さ変動の符号化の一つの例は、モールス式符号である。
オーディオ符号化の際、ハフマンコードは量子化されたスペクトル値を符号化するために用いられる。例えば、MPEG−2 AAC標準で作動する最近のオーディオコーダは、量子化されたスペクトル値を符号化するために、部分ごとに特定の標準に基づき、スペクトルに割り当てられる、複数の異なるハフマンコード表を使用する。ここでは、二つ又は四つのスペクトル値が常に一体的に一つの暗語に符号化される。
MPEG−2 AACに基づく方法がMPEG層3の方法と異なる点の一つは、異なる倍率帯域、つまり、異なるスペクトル値が、任意の数のスペクトル部分にグループ分けされることである。AACにおいて、一つのスペクトル部分は少なくとも四つのスペクトル値、好ましくはそれ以上のスペクトル値を含んでいる。スペクトル値の全周波数領域は、このようにして隣接するいくつかの部分、それぞれの部分は周波数帯域を表すのだが、に分割され、結果的に、これら全ての部分が変換前のスペクトル値に渡る全ての周波数領域をカバーする。
余分な部分の削減を最大にするために、MPEG層3による方法と同様に、いわゆるハフマン表、複数のこのようなハフマン表のうちの一つが各部分に割り当てられる。AAC方法のビットストリームでは、普通1024のスペクトル値を含み、これらのスペクトル値のためのハフマン暗語は周波数が高くなって行く順に並んでいる。各周波数部分で使用される表の情報はサイド情報として送られる。この状況を図2に示す。
図2に一例として示すケースでは、ビットストリームは10のハフマン暗語を含んでいる。もし一つの暗語が常に一つのスペクトラル値から形成されるならば、10個のスペクトル値がここで符号化できる。しかし、通常、2個又は4個のスペクトル値が常に一体的に一つの暗語に符号化されるので、図2は20個又は40個のスペクトル値を含む符号化されたビットスリームの一部を示していることになる。各ハフマン暗語が2個のスペクトル値を含んでいる場合、番号1で示されている暗語は最初の2個のスペクトル値を表している。この暗語の長さは比較的短く、この最初の二つのスペクトル値、つまり、最も低い二つの周波数係数は比較的頻繁に起こることを意味している。他方、番号2で示されている暗語は比較的長く、この符号化されたオーディオ信号では3番目及び4番目のスペクトル係数の発生は比較的まれで、それ故にこれらのスペクトル係数は比較的大きなビット数で符号化される。図2に示すように、番号3,4,5で示される暗語はスペクトル係数5,6,7,8,9,10を表しているが、これらの各暗語は比較的短いので、これらの係数は比較的頻繁に発生する。番号6〜10で示されている暗語についても同様の考え方ができる。
前述したように、図2からも明らかなように、符号化されたスペクトル値のためのハフマン暗語は、周知の符号化装置によって生成されるビットストリームの場合、そのビットストリーム中に周波数が高くなっていく順に一列に並んでいる。
エラーが発生するチャンネルにおけるハフマンコーディングの最大の不利益は、そのエラーを伝達してしまうことである。例えば、図2中の番号2で示される暗語が伝えられる際に、この暗語2の長さが変更されるかもしれないという無意味とは言えない可能性がある。このようにして正しい長さとは異なる場合がある。図2の場合、もし暗語2の長さが妨害により変更されたなら、デコーダはもはや、暗語3−10がどこから始まるのかを判断できなくなり、つまり、そのオーディオ信号のほとんど全ての部分が影響を受けることになる。このように、妨害された暗語に続く他の全ての暗語さえも正確に復号化されなくなる。それは、これらの暗語がどこから始まるのかわからなくなり、この誤差のために、間違った開始点が選ばれてしまうからである。
このようなエラー伝達の問題を解決するために、ヨーロッパ特許第0612156号は、一つの暗語の始まりが、完全な復号化をしなくても、あるいは誤った伝達の場合にでも、より簡単に確認できるように、長さの異なる暗語のいくつかをラスター配列させ、他の暗語を残りの隙間に配置させることを提案している。
この周知の方法の効率を決定づけるパラメータは、そのラスターが実際どのように定義されるのか、つまり、いくつのラスターポイントが必要なのか、ラスターポイント間のラスター距離等である。しかし、ヨーロッパ特許第0612156号は、誤差の伝達を抑えるためにラスターが利用されるべきであるという一般的な提案を超えるものではなく、誤差許容と同時に効率的な符号化を達成するためにどのようにしてラスターを効率的に構築するのかについて、何の詳細な説明もない。
EP−A−0717503は、音楽信号の離散時間型サンプルを周波数領域に変換し、得られたスペクトル値を量子化及びエントロピー符号化するデジタル符号化及び復号化の方法を開示している。このエントロピー符号化は、長さの異なるある特定の数の暗語を生み出し、これらの暗語のいくつかはラスター配置され、他のものはラスターの残りの空間に挿入されている。
EP−A−0492537は、情報が小さなピクセル群に分けられ、各ピクセル群は直交変換手段によって直交する成分に変換される、ビデオ及びオーディオ情報の記録装置に関する。そして、直交する成分は、長さの異なる暗語を有するコードを用いて符号化される。符号化された暗語のいくつかは第1メモリに書き込まれる。もし暗語が、第1メモリに書込み可能なものよりも多くのビットを有している場合、その暗語の残りのビットは別のメモリに書き込まれる。
そこで、本発明の目的は、誤差許容にもかかわらず効率的なオーディオ信号又はビットストリームの符号化及び復号化のための概念を提供することにある。
前記目的は、請求項1に係るオーディオ信号の符号化方法、請求項5に係るオーディオ信号の符号化装置、請求項7に係るビットストリームの復号化方法及び請求項9に係るビットストリームの復号化装置により達成される。
本発明は、既に提案されているラスターは誤差許容符号化/復号化だけでなく、効率的な符号化/復号化を可能にするように形成または使用されなければならないという発見に基づくものである。ここで最も重要なことは、ハフマンコーディングという形でのエントロピー符号化によって得られる暗語は本質的に長さの異なるものである。最も大きな符号化の成果は、最も頻繁に起こる値に最も短い暗語を与える場合、現れる。他方、比較的まれに起こる値は、たとえ長い暗語を与えても、統計上、データ量としては最適値になる。ハフマンコーディングによって得られる暗語は、本質的に異なる長さを有するものである。
本発明の第1の特徴点によると、いわゆる優先暗語がラスターポイントに配置され、これにより、たとえビットストリーム中にエラーがあっても、ラスターを通してデコーダが間違いなく各優先暗語の始まりを認知することができる。優先暗語は、心理音響的に重要な暗語である。このことは、いわゆる優先暗語によって符号化されたスペクトル値が、復号化されたオーディオ信号の聴感覚に実質的に貢献するということを意味している。オーディオ信号が高い割合でスピーチを含んでいる場合、優先暗語は低いスペクトル値を表す暗語である。なぜならば、この場合、重要なスペクトル情報はスペクトルの低い領域にあるからである。オーディオ信号がスペクトルの中領域にあるトーン群を持っている場合、優先暗語は周波数領域のこれに相当する中領域のスペクトル値に割り当てられた暗語である。なぜならば、これらが心理音響的に重要なスペクトル値であるからである。心理音響的に重要なスペクトル値は、また、その規模つまり信号エネルギーがスペクトル内の他のスペクトル値に比べて大きいものである。他方、心理音響的にさほど重要でない暗語、いわゆる非優先暗語がこのラスターを埋める。従って、これらの暗語はラスターポイントと共には位置しないが、優先暗語がラスターポイントに配置された後、残りの空間に「はめ込まれる」。
従って、本発明の第1の特徴点によれば、優先暗語、つまり、心理音響的に重要なスペクトル値に与えられた暗語が、これらの優先暗語の開始点とラスターポイントが一致するようにラスター配列される。
本発明の第2の特徴点によると、スペクトル値はスペクトル部分にグループ分けされ、異なるコード表が各スペクトル部分に与えられる。スペクトル部分へのコード表の割り当ては、信号の統計的な考慮に基づいて、例えば、あるスペクトル部分の符号化に最も適するコード表はどれかということに基づいてなされる。スペクトル部分へのコード表の割り当ては、すでにこの技術分野では周知である。
等距離で配列されたラスターポイントのグループがいくつか集まったラスターが使用されることになる。一つのラスターポイントグループ内のラスターポイント間の距離は、一つのスペクトル部分の符号化に使用されるコード表に基づいている。他の別のスペクトル部分では、最適なデータ圧縮を行うために別のコード表が使用される。この別のコード表は、別のグループの等距離で配列されているラスターポイントに割り当てられ、このラスターポイントグループ内の二つのラスターポイントの距離はその関連するコード表に基づいている。互いに異なるラスターポイントグループの二つのラスターポイントの距離は、少なくとも三つの方法で決定することができる。
最初に、一のコード表の暗語の最大長さを確定する。このコード表が与えられたラスターポイントグループ内の二つのラスターポイントの距離は、そのコード表の暗語の最大長さと同じか又は最大長さよりも大きいので、ラスターにはこのコード表の最長の暗語のための空間がある。別のコード表に関連する別のラスターポイントグループ内の二つのラスターポイントの距離は、この別のコード表の暗語の最大長さに基づき、同様の方法で決定される。
以下に説明する2番目の方法は、ラスターポイントの数の増加にも貢献する。ハフマンコードの本質的な特性のために、あまり頻繁に発生しない暗語は、より頻繁に発生する暗語よりも長い。ラスターポイント間の距離を、ある表の暗語の最大長さと同じか又はそれよりも大きく設定する場合、そのラスターに挿入される暗語は通常そのラスターポイント間距離よりも短い。従って、ラスターポイント間距離は、ある表の暗語の最大長さよりも短く設定することも可能である。符号化の際にそのラスターに入りきらない暗語が現れた場合、ラスターに入らない残りの部分は、ビットストリームのラスター配列外の他の適当な場所に挿入される。結果として、この分断された暗語はもはやエラー伝達から有効に保護されない。これは非常にまれなことであり、ラスターポイントの数の増加という利益のために受け入れられるものである。
異なるラスターポイント間距離を決定する第3の方法は、コード表の暗語の最大長さではなく、符号化されたスペクトル部分に実際に生じるビットストリーム中の暗語の最大長さを考慮することである。
本発明の第3の特徴点によると、本質的に周波数に関して直線的に高くなる順番によるビットストリーム中の暗語の配列に代わり、暗語が周波数領域に渡り分散される配列が使用され、これはまた「スクランブリング」として知られている方法である。これはいわゆる「突発的なエラー」が、全周波数帯域の間違った複合化につながることはなく、単にいくつかの異なる周波数領域で小さな妨害が見られる程度であるという利点を有している。
本発明の第4の特徴点によると、本質的に周波数に関して直線的に高くなる順番による暗語の配列に代わり、例えばn番目ごと(例えば、2番目ごと、3番目ごと、又は4番目ごと)の暗語だけがラスターに配列されるという配列方法が使用され得る。この方法では、可能なラスターポイントの数が優先暗語の数よりも小さい場合、優先暗語を使用するスペクトル領域を可能な限り大きくすること、つまり、エラー伝達を防止することが可能になる。
さらに、効率的な作動を達成するような方法で優先暗語を決定することに優先権が与えられる。好ましくは、このことは心理音響的に重要な暗語、つまり優先暗語が低周波のスペクトル値を符号化するものであるという仮説を放棄することを意味する。このような場合はしばしばあるが、常にそうであるとは限らない。
通常、優先暗語は心理音響的に重要なスペクトルラインを符号化するものであり、これらは通常高いエネルギーを有するスペクトル値である。高いエネルギーを有するスペクトルラインはエラーによっては生じない。
本発明によると、すでに暗黙的に決定されたインディケータが使用される。このインディケータは使用されるコード表に基づくものである。AAC標準において、例えば、異なる絶対値域を有する11のコード表がある。コード表1は例えば−1〜+1の絶対値を持つスペクトル値を含み、コード表11は−8191〜+8191のスペクトル値を符号化する。コード表番号が大きくなればなるほど、それが符号化できる値域が大きくなる。このことは、小さい番号のコード表は比較的小さな値のみを表し、それ故に比較的小さなエラーを引き起こすだけであり、大きな番号のコード表は比較的大きな値域を表し、比較的大きなエラーを引き起こすことを意味している。
小さな番号のコード表においてエラーが発生しても、それはよく聞こえないものであり、間違ったスペクトルラインの結果は、元々の正しいスペクトルラインとさほど違わないものとなる。しかし、最も大きな番号のコード表においてエラーが発生した場合、このエラーは原則としてこのコード表の絶対値のいくつかとなり得る。最も大きな番号のコード表で符号化されたスペクトルラインが小さい値を有し、例えば伝達の間に生じたエラーのために、デコーダ内で、このコード表によって最も高い絶対値を持つスペクトルラインとして複合化された場合、この間違ったスペクトルラインは確かに聞こえるものとなる。
誤差許容に関して、最も重要なコード表は従って最も大きな番号のコード表(AAC標準ではコード表11)である。なぜならば、このコード表は、値を−213+1(−8191)〜+213−1(+8191)の間に逃してしまうからである。
本発明のさらなる特徴点によると、短いウィンドウがAAC標準の伝達信号のために使用される。短いウィンドウにより、周波数分解能はより高い時間的分解能のために減じられる。優先暗語は、心理音響的に重要なスペクトル値、つまり低周波のスペクトル値又は番号の大きいコード表からのスペクトル値がラスターポイント上に確かに配置されるように、決定される。倍率帯域のインターリービングは、これはAAC標準の特徴であるが、この目的のために解除される。
本発明の好ましい実施形態を添付図面を参照しながら説明する。
本発明を説明するために、図2に優先暗語を斜線で示す。図2は、周知の異なる長さの暗語の配列を示しているが、これは周波数に関して直線的に高くなる順番によるものである。図2では、優先暗語が暗語1〜5である。前述したように、オーディオ信号が例えば高い割合でスピーチを含んでいる場合、または多くの低周波音を含んでいる場合、低周波のスペクトル値に与えられる暗語が優先暗語である。図2中、暗語6〜10は高周波のスペクトル値に関連するものであり、これらのスペクトル値は復号化された信号の全体的な印象に貢献するものの、聴感覚には大して影響せず、従って心理音響的にあまり重要ではない。
図1は、ラスターポイント10〜18を有するビットストリームを示す。図1中、ラスターポイント10とラスターポイント12の間の距離をD1、ラスターポイント14とラスターポイント16の間の距離をD2とする。
本発明の第1の特徴点の説明に関して、ラスターポイント10からラスターポイント14の間のビットストリームだけを考える。優先暗語1,2は、図2に示された例では低周波域に位置している重要なスペクトル部分であるが、これが復号化の際にエラー伝達の対象とならないように、ラスターに配列されている。非優先暗語、図1、図2において斜線を符していないものであるが、これらは優先暗語の後に、ラスターを埋めるように配置される。ハフマン暗語の長さは暗語そのものからわかるので、非優先暗語を一固まりでラスターに入れ込む必要はない。デコーダは、読み取ったものが暗語の単に一部だけであるのかどうかを判別できる。この場合、デコーダは自動的に、暗語の最初の部分に、次のラスターポイントの後の優先暗語に引き続き、ある特定のビット数を付加する。従って、非優先暗語7,8,9のそれぞれがビットストリーム中二つに分けられ、つまり、7a,7b、8a,8b、9a,9bに分けられるように、非優先暗語の最初の部分をラスターの最初の空き場所に挿入し、残りの部分を他の場所に挿入することが可能である。
既に説明したように、図1のビットストリームの第2の部分は本発明の第2の特徴点を説明している。ラスター距離D1が小さなラスター距離D2に変更されなければ、優先暗語1〜5のどれでもが入る距離D1を有するラスターは、いわば、ラスターの残りの部分を埋めるだけの十分な非優先暗語がないというような長いビットストリームを作る結果となりうる。従って、ビットストリームに挿入されるべき多くの優先暗語だけをオーディオ信号から抜き出し、根本的に空き場所を残さないようにし、ビットストリームが不必要に延長されることがないようにする。
本発明の第2の特徴点を、図1を参照しながら詳細に説明する。MPEG−2 AAC標準に基づく符号化方法の場合において、11の異なるハフマンコード表が符号化のために使用される。これらの表の大部分にとって、可能な限りの最大の暗語長さは10〜20ビットである。しかし、特別な表、いわゆる「逃し表」は49ビットの最大長さを含む。もし全ての表のうちで最長暗語の長さをラスター距離Dとして使用するならば、49ビットのラスター距離を設定することになる。この結果、非常に大きな幅のラスターとなり、全ての優先暗語がラスターポイントに配列された場合、ビットストリームはあまりにも長すぎるものとなるので、ほとんど全ての表にとって非効率的なものとなる。従って、本発明によると、ラスターの幅は使用されるコード表に基づき調整される。前述したように、スペクトル値はいくつかのスペクトル部分にグループ分けされ、各スペクトル部分には、信号の統計的要素を考慮して最適なコード表が与えられる。ひとつのコード表における最大の暗語長さは、普通、他のコード表における最大の暗語長さとは異なる。
暗語1,2で表されるスペクトル値は第1のスペクトル部分に属し、暗語3〜10で表されるスペクトル値は第2のスペクトル部分に属すると仮定する。この場合、ビットストリームは二つのラスターポイントグループによってラスターされる。第1のラスターポイントグループはラスターポイント10,12,14からなり、第2のラスターポイントグループはラスターポイント14,16,18からなる。さらに、スペクトル部分0はハフマンコード表nを与えられ、スペクトル部分1はハフマンコード表mを与えられ、また、暗語2はスペクトル部分0に与えられた表nのうちの最長暗語である。第1のラスターポイントグループのラスター距離は表nの最大の暗語長さ、つまりこの例での暗語2の長さよりも大きいか、あるいは好ましくはそれと等しい。
他方、ラスターポイント14と暗語10でのビットストリームの終点との間の部分からわかるように、この例ではコード表mにおける最長の暗語は現れない。従って、グループ2で示されるビットストリームのラスターには長さD2の暗語はない。
本発明の第2の特徴点によれば、ラスターの幅は使用されるコード表に基づいて選択される。しかし、この場合、使用される表はデコーダで復号化される際に認識されなければならない。しかし、コード表番号が各スペクトル部分のサイド情報として常に送信されるならば、デコーダは、ある特定の異なる、この例では11の、ハフマン表のうちのどのコード表であるかを認識することができる。
前述したように、ラスター距離が使用されるコード表により決定されても、49ビットの暗語を含む逃し表を考えるとわかるように、最適なデータ圧縮が達成されるわけではない。この逃し表の場合、ラスター距離は最大サイズのスペクトル値を符号化できるように49ビットに調節されることになるからである。逃し表は、短いコード表を持つために、逃し表と共に短いコード表を使用して比較的大きい値を符号化できるように、使用される。一つのコード表の値域を超える値の場合、このスペクトル値のための暗語はある特定の値になり、このことは、コーダ内で逃し表もまた使用されたということをデコーダに示すことになる。あるコード表が値0〜2を含んでいる場合、例えば、そのコード表の3の値がデコーダに逃し表が使用されたことを示すことになる。「基礎」のコード表の値3を有する暗語は同時に、その基礎コード表の最大値と共に、該当するスペクトル値を形成する逃し表の値を与える。
本発明のさらなる実施形態によると、一つのグループ(例えばグループ1又はグループ2)内のラスターポイント間距離は、もはやあるコード表における最長暗語の長さと同じではなく、あるコード表に属するビットストリームに実際に発生する最長暗語の長さと同じである。本発明の第2の特徴点の第1実施形態においては、逃し表における符号化効率は未だ最適ではないので、この実施形態ではこれをさらに改良した。この表の暗語の最大長さ(スペクトル内で)は通常、技術的符号化の理由からかなり短いものである。逃し表の最長の暗語は例えば49ビットである。
通常のオーディオ信号中に実際に発生する最も長い逃し表の暗語は、典型的には約20ビットの長さである。従って、ラスターポイントの数、及び一つのブロック内の最長暗語の長さを送信することによりラスターポイントに配列され得る優先暗語の数をさらに増すことができる。そしてラスターの長さは実際に発生する最長暗語の長さか又は現在使用されている表の論理的な最長暗語の長さのうちのどちらか最小値である方に等しい。最小値を決定するために、各コード表の実際に発生する暗語又は単に一つのオーディオフレームで使用される全てのコード表の最長暗語のどちらかを使用することができる。この選択は非逃し表、つまり「基礎」ハフマン表にも利用できるが、逃し表ほどには効率的ではない。
あるスペクトル部分又はスペクトルブロック内の最長暗語の長さを送信することは別の有利な副作用を生み出す。デコーダは、既に発生した最大長さから、妨害されたかもしれないより長い暗語がそのビットストリームの中に存在するかどうかを検知することができる。長い暗語は普通、スペクトル値の高いエネルギーを表している。非常に長い暗語が伝達エラーのために発生した場合、これは非常に可聴な妨害となる。最大長さを送信することは、ほとんどの場合このようなエラーを感知し、それに対して策を講じる手段を与えることになる。エラーに対する対向策とは、長すぎる暗語を単に空白にしておくか又は何かもっと複雑な隠蔽工作であろう。
誤差許容と同時に効率的な符号化のためにはできる限り多くのラスターポイントが望ましいということを銘記しておくことは重要である。しかし、ラスターポイントの数はビットストリームの全長によって制限される。これはもちろんラスタリングの結果として長くされるべきではなく、なぜならば、ビットストリーム中に使用されない場所ができてしまい、全体的なデータ圧縮の理論とは矛盾することになるからである。しかし、応用によっては、ビットストリームの延長は高い程度での誤差許容のためには受け入れられることもあるということも、また指摘しておかねばならない。考慮すべき別の点は、ラスターはできるだけ多くの暗語がラスターポイントから始まるように構築されることが好ましいということである。よって、本発明は、先行技術に比べてラスターポイント間距離の選択に関して有効な融通性がある。全く理想的な場合には、この融通性によって全ての暗語がラスターポイント上に配置されるが、このためには非常に大きな技術努力が必要である。前述のラスターポイントの配置方法、つまり各スペクトル部分でのラスターポイント間距離を関連するコード表に基づいて決定する方法は、この最適ケースに非常に近いものを可能とする。しかし、これは特に、全ての暗語が心理音響的に重要なものではなく、ビットストリーム中に使用されない場所を残さないために、心理音響的にさほど重要でない暗語は、ビットストリーム内に、ラスター配列された心理音響的に重要な暗語の間に挿入されるからである。
本発明の第3の特徴点によれば、暗語は、ビットストリーム中に、もはや周波数に関して高くなる順に直線状に並べられてはいず、異なるスペクトル値の暗語が「スクランブル」されている。図1において、暗語の周波数に関わる交互的な直線的配列がある程度見られる。斜線で示された優先暗語は周波数が高くなる順に配列され、斜線を施されていない非優先暗語も、周波数が高くなる順にビットストリーム中に挿入されているからである。いわゆる「突発的」エラーが図1に示すビットストリーム中に発生した場合、すなわち、引き続くいくつかの暗語の崩壊につながるような妨害が発生した場合、例えば暗語6,7a,2,3,7bが同時に影響を受けることになる。
これに相当する復号化されたオーディオ信号には、スペクトル的に比較的広く故にはっきりと聞こえる妨害が、優先暗語2,3によって示されるスペクトル帯域内に発生することになる。突発的なエラーの問題については、図1の非常に単純な例からはあまり明らかではない。しかし、実際、5個以上のラスターポイントがあり、突発的エラーがしばしば複数のラスターポイントに跨って発生することが考えられ、このような場合には、比較的広い周波数帯域でのデータの損失となり得る。この理由から、本発明の第3の特徴点によれば、スペクトル値の優先暗語は周波数の高くなる順に配列されないことが好ましく、周波数に関してランダムなあるいはランダムに見えるような配列になるように「スクランブル」にする方が好ましい。非優先暗語もまた同様に取り扱ってもよい。ランダムのような配列の場合、この分散状況はデコーダに前もってセットできるので、この分散についてはサイド情報として送信する必要はない。結果として、ビットストリーム中の連続する暗語の損失が完全な一つの周波数帯域の損失とはならず、単にいくつかの周波数帯域での非常に小さい損失となるだけである。この妨害が聞こえることはめったになく、一つの周波数帯域全体の損失よりも効果的に隠すことができる。
本発明の第4の特徴点によれば、優先暗語及び非優先暗語の周波数に関して高くなる順の直線的な配列に代わり、例えばn番目ごとの暗語がラスター配列され、残りの暗語はそれらの間に挿入されるという配列が使用可能である。前述したように、一つのビットストリームのためのラスターポイントの数は全長及びラスターポイント間距離によって限定される。例えば、低い帯域幅でのサンプリングの場合を考えると、大多数の暗語が心理音響的に重要な暗語である。16kHzのサンプリングレートが使用された場合、信号全てが論理的に使用可能な8kHzの帯域幅を有しているからである。経験的には、暗語のうちの30%だけがラスターポイント上に配列され、残りの70%はラスターを完全に埋めるように配列されなければならない。しかし、このことは、重要な周波数領域、例えばスピーチ信号の場合は0〜4kHzであるが、これがラスターポイント上に配置された暗語によってカバーあるいは「保護」され得ないということを意味している。従って、重要な周波数領域でのエラー伝達を適切に阻止するために、全ての優先暗語をラスターポイント上に配置する代わりに、2番目ごと、3番目ごと、4番目ごと等の優先暗語のみをこのように配置し、他の優先暗語は一直線に並べられるのではなく、ラスターを埋めるように配置される。例えば、2番目ごと、3番目ごと等のスペクトル値が低周波領域にあることがわかり、点在する暗語が伝達の間に崩壊する場合、例えば予測等のエラー隠蔽技術を使用してデコーダ内でこれらの暗語を再構築することも可能である。
ビットストリームを復号化するための方法及び装置は前述の符号化を反映するように働く。
符号化されたビットストリームが一つのコード表に異なる長さの暗語と等距離のラスターポイント(10,12,14)を持つラスターを有し、これらの暗語は、他のスペクトル値と比べて心理音響的に重要なあるスペクトル値を表す優先暗語を含み、優先暗語はラスターポイントによって配列されているという符号化されたオーディオ信号で表されるビットストリームを復号化するための一般的な方法では、(a)二つのラスターポイント間の距離D1が決定される。二つのラスターポイント間の距離がわかれば、(b)ラスターポイントに配列されている符号化されたビットストリーム中の優先暗語が、周波数に関して直線的な順で、各優先暗語の始まりがラスターポイントと一致する配列となるように、再分類される。これにより優先暗語は図2に示す一般的な周波数に関する直線的な配列となり、(c)復号化されたスペクトル値を得るために、関連するコード表を用いてこれらの優先暗語を復号化することができる。(d)復号化されたスペクトル値を時間領域に戻すように変換して、復号化されたオーディオ信号が得られ、例えばラウドスピーカに送り込めるように何らかのよく知られた方法で加工することができる。
ビットストリームがただ一つのコード表を使用して符号化された場合、ラスターポイント間距離は、どの表が符号化のために使用されたのかをビットストリームのサイド情報から見つけ出すことによって、極めて簡単に設定することができる。符号化によっては、この距離はこの表の最長暗語の長さであるかもしれず、それはそのコーダに永久的にセットされ得る。その距離が、コード表が与えられたビットストリームの一部に実際に発生する最長暗語の長さであれば、このことはビットストリームに伴うサイド情報等でデコーダに発信される。
デコーダは、優先暗語及び非優先暗語の再分類を、例えば符号化されたビットストリームにポインタを当てることによって行う。デコーダがラスター距離を認識しており、優先暗語が周波数に関して直線的に配列されている場合、デコーダはラスターポイントに飛び越し、そこから始まる暗語を読むことができる。一つの暗語を読み終えると、ポインタは次のラスターポイントへ飛び、このようなプロセスを繰り返す。全ての優先暗語が読まれても、ビットストリームはまだ非優先暗語を含んでいる。ビットストリーム中の優先暗語と非優先暗語の直線的配列が選択された場合、非優先暗語はすでに周波数に関して直線的に配列されており、さらなる分類をすることなしに、復号化及び元の状態への変換がなされる。
本発明の第3又は第4の特徴点に係る符号化が選択されると、スクランブル情報がサイド情報として送られるか、またはスクランブル状態の分布が前もって固定され、それにより最初からデコーダはこのことがわかる。同じ考慮が第4の特徴点にも当てはまる。一定の分布を規定するか、またはデコーダにサイド情報として連絡された可変の分布を選択することは常に可能である。
ここで、優先暗語を決定し操作する有利な方法を説明する。ただ一つのコード表を使用する場合には一つのラスター距離を、あるいは多数のコード表を使用する場合には複数のラスター距離を設定することによって符号化されたビットストリームのためのラスターを決定した後、優先暗語は、それぞれがラスターポイントと一致するようにラスターに配置されなければならない。
本発明の好ましい実施形態では、この配置は、暗語を一種のソート表から本来は空のラスターに順に挿入していくことによって達成される。表の最初の暗語から始められる。従って、優先暗語は表中の暗語の並びによって影響されるが、優先暗語は常にラスターの場所にある暗語、つまり、ラスターポイントが使用可能である暗語である。もはやラスターポイントがない表中の暗語に関しては、ビットストリーム中の残りの空間にそれらを挿入していく以外に選択の余地はない。これらの暗語は従って本発明の感覚からすると、優先暗語ではない。
優先暗語の数は前もっては決定されない。符号化されたビットストリームのためのメモリが満たされるまでは、すなわち、もはや優先暗語が書き込めなくなるまでは、優先暗語が書き込まれる。このメモリの大きさは、そのスペクトルデータのために以前に使用されたビットの合計と同じである。つまり、それ以上のビットはラスタリングによって要求されない。メモリは、このように符号化の効率がラスター処理の結果として落ち込むのを阻止するために、暗語の数によって制限される。もちろん、誤差を許容することができるように、全ての暗語がラスターポイント上に配置されてもよい。しかし、この場合、ラスターポイント間に空のビットが使用されないままになるので、符号化効率の顕著な低下につながる。
本発明の第1の特徴点は優先暗語、つまり、他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す暗語の決定に係わるものである。心理音響的に重要なスペクトルラインとは、例えば、他のスペクトルラインよりも大きなエネルギーを含んでいるスペクトルラインである。概略的に言えば、大きなエネルギーを有していればいるほど、そのスペクトルラインはより重要である。従って、高いエネルギーを有するスペクトルラインが妨害されないことと、それと同様に、高いエネルギーを有するスペクトルラインがエラーの結果として発生することはないということが重要である。
これまでは、高いエネルギーを有するスペクトルラインが主にスペクトルの低い部分に位置しているという仮定で説明してきた。これは多くの場合事実であるが、全ての場合ではない。本発明は、一つの暗語に符号化されたスペクトルラインの、または複数のスペクトルラインが一つの暗語に符号化されている場合はこれら複数のスペクトルラインのエネルギーを概算するための含蓄されたインディケータを使用することによって、この仮説を無視するものである。
このインディケータは、使用されるハフマンコード表のようなコードブック又はコード表である。例えばAAC標準では、11個の表が使用される。これらの表の値域はかなり違っている。表1〜11の最大絶対値は以下の通りである。
1;1;2;2;4;4;7;7;12;12;8191.
これらの異なる値域の結果として、最大エラーは表による。各表の表示を考えると、これは表の中から確認可能であるか、または表以外から送信されてくるが、最大エラーは前記絶対値の2倍になる。本発明によれば、優先暗語の決定は使用されるコード表に基づいてなされ、そのインディケータは最大絶対値と含蓄的にコード表番号である。まず、そのコード表が最大の値域を有している暗語を考える。次に、そのコード表が2番目に大きい値を有する暗語が続き、という手順である。従って、AAC標準の場合、表11が最初に考慮され、表9,10が続き、表1,2が優先順位の最後である。ラスターポイントに配置される優先暗語は、このように、ラスターポイントがそれのために使用され得るソート表の中にある暗語である。
暗語を決定するこの方法の利点は、使用される表がサイド情報で送信され、この情報からデコーダは送信中に使用される暗語の並びを決めることができるので、他の付加的な情報をデコーダに送信する必要はない。
本発明の第2の特徴点は、オーディオ信号を表すスペクトル値を得るためにその周波数領域内でのオーディオ信号の離散時間型サンプルを変換するために、長いウィンドウに対向するものとして、短い(サンプリング)ウィンドウを使用することに関する。短いウィンドウはAAC標準及び標準層3で定義される。短いウィンドウの場合、一つの長いMDCTの代わりに多数の短いMDCTが使用される。
AAC標準では、それぞれが128の出力値を有する8個のMDCTからなるグループが、例えば1024の出力値を有する一つのMDCTの代わりに使用される。これはコーダの周波数分解能を犠牲にして時間的分解能を高めることになる。一般的に短いウィンドウは一時的な信号に使用される。例えば短いウィンドウがAACと共に使用される場合、8つの連続した完全なスペクトル、すなわちそれぞれのセットが全スペクトルを含む8セットのスペクトル値が得られるが、スペクトル値間の距離もまた8倍の大きさである。これは周波数分解能の低下を表し、そしてこれは時間的分解能の高まりを伴う。
AAC標準ではグループ分けが行われる。すなわち、8つのスペクトルからグループが形成される。これらのグループのために1セットの倍率がある。最も単純な場合、各グループが一つのウィンドウを含んでいる。この場合、8セットの倍率が送信されなければならない。より強い圧縮を達成するためには、一般的に心理音響的な必要条件を考慮して、複数のウィンドウがAAC標準の一つのグループに集められる。これは送信されるべき倍率の数を減少させ、より良いデータ圧縮となる。スペクトルデータはグループ毎に順に符号化されたビットストリームに記載されて送信される。グループ内では倍率帯域の交互配置が行われる。
このことは下記の例によって示される。ここでは三つのグループに分けられる。第1グループは二つのウィンドウを含み、第2グループは三つのウィンドウを含み、第3グループも三つのウィンドウを含んでいる。各スペクトルは12の倍率帯域を有する。グループ分けは下記の通りである。
第1グループ、第1ウィンドウ、第1倍率帯域
第1グループ、第2ウィンドウ、第1倍率帯域
第1グループ、第1ウィンドウ、第2倍率帯域
第1グループ、第2ウィンドウ、第2倍率帯域
...
第1グループ、第2ウィンドウ、第12倍率帯域
第2グループ、第3ウィンドウ、第1倍率帯域
第2グループ、第4ウィンドウ、第1倍率帯域
第2グループ、第5ウィンドウ、第1倍率帯域
第2グループ、第3ウィンドウ、第2倍率帯域
...
この配列は、プレソーティング(予備分類)、あるいはソート表から暗語をラスターに挿入するのには適さない。なぜならば、連続的な挿入がなされる場合、第1グループの全スペクトルは保護されるが最後のグループのスペクトルは保護されないからである。この理由で、本発明の第2の特徴点に係るプレソーティングは、短いウィンドウのために行われる。AAC標準の場合、グループ分けと倍率帯域によるアプローチは放棄される。新しいプレソーティングは、今度はスペクトルラインのユニットという形で行われる。
本発明の好ましい実施形態において、各ユニットは四つのスペクトルラインを含む。AAC標準では従って各ウィンドウは、128のスペクトルラインに相当する32のユニットを含む。スペクトルデータは下記の通りである。
第1ウィンドウ、第1ユニット
第2ウィンドウ、第1ユニット
...
第8ウィンドウ、第1ユニット
第1ウィンドウ、第2ユニット
第2ウィンドウ、第2ユニット
...
第8ウィンドウ、第2ユニット
第1ウィンドウ、第3ユニット
...
このプレソーティングは全てのウィンドウの個々のスペクトル領域は互いに近くに位置する、つまり、低いスペクトル値は、周波数に基づき、より高い周波数を有するスペクトル値の前に、個々のセットのスペクトル値から短い表の前部分に書き込まれる。低いスペクトル領域のスペクトル値は心理音響的に特に重要であり、ソート表の前述のプレソーティングは、スペクトル値をソート表からラスターに挿入するための基礎を与える。この暗語のプレソーティング、つまり、優先暗語を決定することにより、いかなる付加的情報をも送る必要はない。なぜならば、デコーダはサイド情報からこのブロック又はフレームでは短いウィンドウが使用されたことを認識し、ユニットを生成するためのコーダの分類アルゴリズムが常に一定とされ、故にそれがデコーダに永久的にプログラムされるからである。
暗語をソート表にプレソーティングすることは優先暗語を決定することに相当することを銘記しておくことは重要である。なぜなら、ラスターポイントに位置する暗語、つまり、優先暗語がソート表の最初、つまり前又は上の部分にある可能性が高いので、この表はそれ自体、高い可能性で、どの暗語がラスターポイントに書かれ得るのかを決定するからである。
この好ましい実施形態以外では、このプレソーティングはソート表によっては行われず、個々の暗語を指し、指し示された暗語がビットストリーム中に書き入れられる順番を決定することで行われる。
AAC標準から、いくつかのコード表は2次元又は4次元的であること、すなわち、一つの暗語が2個又は4個のスペクトル値を符号化することが知られている。従って、四つのスペクトルライン又はその倍数を一つのユニットにグループ化することが有利である。このようにすれば同じ周波数領域を符号化する暗語が直接互いに連続するように分類されるからである。一つのユニットのスペクトルラインの数はそのコード表の異なる次元によって割り切れることが好ましい。すなわち、ユニットごとのラインの数は暗語ごとのラインの数の公倍数であり、最小公倍数ならば最適である。
本発明は第1、第2の特徴点が組み合わされたとき、特に効果的である。本発明に係るユニットへの再分類が短いウィンドウのために行われ、次にコード表のインディケータを用いて優先暗語の決定が行われ、その際、高い程度のエラー防止を達成するために高いコード表からの暗語が一定のラスターポイント上に配置されることを確実にするために、ユニットへの再分類の結果が再び再分類される。 この組み合わせは必ずしも必要ではないが、最良の結果を導くものである。
暗語を含む符号化されたビットストリームの、本発明の第2の特徴点に係るラスタリングの一例を示す。 従来技術による、周波数に関して直線的に高くなる順番による暗語の配列を示す。

Claims (10)

  1. 符号化されたビットストリームを得るためにオーディオ信号を符号化する方法であって、該方法は以下のステップを含むことを特徴とする、
    符号化されたビットストリームのためにラスターを決定する、このラスターは等距離に配置されたラスターポイント(10,12,14)を有し、このラスターポイント間距離(D1)は、一つのスペクトル値に対して実際に発生する最も長い暗語の長さに等しいか又はそれよりも長い、
    前記暗語のうちで、他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す暗語を優先暗語として定義する、この際、オーディオ信号の離散時間型サンプル群を周波数領域に変換することによってそのオーディオ信号を示すスペクトル値群が得られ、異なる長さの限られた数の暗語を有するコード表でそのスペクトル値を符号化することによって暗語によって符合化されたスペクトル値が得られ、スペクトル値に与えられる暗語の長さは、概して、そのスペクトル値が発生する可能性が高ければ高いほど短くなるものである、
    前記スペクトル値群のうちの一つのスペクトル値を表す優先暗語の始まりが一つのラスターポイントに一致し、該スペクトル値群の別のスペクトル値を表す優先暗語の始まりが別のラスターポイントに一致するように、優先暗語をラスターに配置する、
    実際に発生する最も長い暗語に関する情報をサイド情報としてビットストリームに送信する。
  2. 請求項1記載の方法であり、スペクトル値を符号化する以前に、
    スペクトル値は隣り合うスペクトル部分に、各スペクトル部分が少なくとも一つのスペクトル値を有するようにグループ分けされ、
    予め与えられた数のコード表から、スペクトル部分がそのスペクトル値の符号化に適するコード表が与えられるように、少なくとも二つのコード表が二つの異なるスペクトル部分に与えられ、
    符号化において、それぞれのスペクトル部分のスペクトル値は、対応するスペクトル部分に与えられたコード表によって符号化される、
    前記方法において、
    前記ラスター決定ステップにおいて、このラスターは少なくとも二つのラスターポイント(10,12,14及び14,16,18)を有し、各グループのラスターポイントは互いに等距離に配置されており、各グループのラスターポイント間距離(D1又はD2)は、対応するスペクトル部分の一つのスペクトル値に対して実際に発生する最も長い暗語の長さに等しいか又はそれよりも長い、
    一つの部分に関して、実際に発生する最も長い暗語に関する情報をサイド情報としてビットストリームに送信する。
  3. 請求項1又は請求項2記載の方法であり、一ラスターポイントグループ内のラスターポイント間距離は、グループ分けされた全てのスペクトル部分で実際に発生する最も長い暗語のうちの最小のものに等しくなるように、また、このグループのコード表の最長暗語に等しくなるように決定される。
  4. 請求項1、請求項2又は請求項3記載の方法であり、スペクトル値は、心理音響モデルを考慮しての符合化に先立ち、量子化される。
  5. 符号化されたビットストリームを得るためにオーディオ信号を符号化する装置であって、該装置は以下のものを含むことを特徴とする、
    符号化されたビットストリームのためにラスターを決定するユニット、このラスターは等距離に配置されたラスターポイント(10,12,14)を有し、このラスターポイント間距離(D1)は、一つのスペクトル値に対して実際に発生する最も長い暗語の長さに等しいか又はそれよりも長い、
    前記暗語のうちで、他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す暗語を優先暗語として定義するユニット、この際、オーディオ信号の離散時間型サンプル群を周波数領域に変換することによってそのオーディオ信号を示すスペクトル値群が得られ、異なる長さの限られた数の暗語を有するコード表でそのスペクトル値を符号化することによって暗語によって符合化されたスペクトル値が得られ、スペクトル値に与えられる暗語の長さは、概して、そのスペクトル値が発生する可能性が高ければ高いほど短くなるものである、
    前記スペクトル値群のうちの一つのスペクトル値を表す優先暗語の始まりが一つのラスターポイントに一致し、該スペクトル値群の別のスペクトル値を表す優先暗語の始まりが別のラスターポイントに一致するように、優先暗語をラスターに配置するユニット、
    実際に発生する最も長い暗語に関する情報をサイド情報としてビットストリームに送信するユニット。
  6. 請求項5記載の装置であり、スペクトル値を符号化する以前に、
    スペクトル値は隣り合うスペクトル部分に、各スペクトル部分が少なくとも一つのスペクトル値を有するようにグループ分けされ、
    予め与えられた数のコード表から、スペクトル部分がそのスペクトル値の符号化に適するコード表が与えられるように、少なくとも二つのコード表が二つの異なるスペクトル部分に与えられる、
    それぞれのスペクトル部分のスペクトル値は、対応するスペクトル部分に与えられたコード表によって符号化される、
    前記装置において、
    前記ラスター決定ユニットは、符合化されたビットストリームのためのラスターを、少なくとも二つのラスターポイント(10,12,14及び14,16,18)を有し、各グループのラスターポイントは互いに等距離に配置されており、各グループのラスターポイント間距離(D1又はD2)は、対応するスペクトル部分の一つのスペクトル値に対して実際に発生する最も長い暗語の長さに等しいか又はそれよりも長くなるように決定する、
    送信ユニットは、一つの部分に関して、実際に発生する最も長い暗語に関する情報をサイド情報としてビットストリームに送信可能である。
  7. 符号化されたオーディオ信号を表すビットストリームを復号化する方法であり、この符号化されたビットストリームはコード表から引き出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10,12,14)を持つラスターを有しており、暗語は、他の暗語に比べて心理音響的に重要なスペクトル値群の特別なスペクトル値を表す優先暗語を含み、該スペクトル値群はオーディオ信号の時間的サンプル群のスペクトルを表し、優先暗語は、該スペクトル値群の一つのスペクトル値を表す優先暗語の始まりが一つのラスターポイントに一致し、該スペクトル値群の別のスペクトル値を表す別の優先暗語の始まりが別のラスターポイントに一致するように、ラスターポイントによって配列されており、該ビットストリームは、実際に発生する最も長い暗語の長さをサイド情報として含んでいるものである、
    前記方法は以下のステップを含むことを特徴とする、
    ビットストリーム中サイド情報として送信された実際に発生する最も長い暗語の長さに関する情報に基づき、二つの隣り合うラスターポイントの距離(D1)を検知する、
    ラスターポイントに配置され、その始まりがラスターポイントに一致する優先暗語を符合化されたビットストリームから読み出し、これにより、優先暗語が関連するコード表を用いて復号化されて復号化されたビットストリームが得られ、さらに時間領域に戻すように変換されて復号化されたオーディオ信号が得られる。
  8. 請求項7記載の方法であり、この符号化されたビットストリームは少なくとも二つのコード表から引き出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10,12,14及び14,16,18)の少なくとも二つのグループを持つラスターを有しており、一つの部分に関して、そのスペクトル部分で実際に発生する最も長い暗語の長さをサイド情報として含んでいる、
    前記方法は、各スペクトル部分に関連するコード表を認知するステップをさらに含み、
    前記検知ステップにおいて、スペクトル部分に関連するコード表の二つのラスターポイント間距離は、そのスペクトル部分で実際に発生する最も長い暗語の長さに等しく設定されており、
    復号化の際、一スペクトル部分の優先暗語はそれに関連するコード表によって復号化される。
  9. 符号化されたオーディオ信号を表すビットストリームを復号化する装置であり、この符号化されたビットストリームはコード表から引き出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10,12,14)を持つラスターを有しており、暗語は、他の暗語に比べて心理音響的に重要なスペクトル値群の特別なスペクトル値を表す優先暗語を含み、該スペクトル値群はオーディオ信号の時間的サンプル群のスペクトルを表し、優先暗語は、該スペクトル値群の一つのスペクトル値を表す優先暗語の始まりが一つのラスターポイントに一致し、該スペクトル値群の別のスペクトル値を表す別の優先暗語の始まりが別のラスターポイントに一致するように、ラスターポイントによって配列されており、該ビットストリームは、実際に発生する最も長い暗語の長さをサイド情報として含んでいるものである、
    前記装置は以下のものを含むことを特徴とする、
    ビットストリーム中サイド情報として送信された実際に発生する最も長い暗語の長さに関する情報に基づき、二つの隣り合うラスターポイントの距離(D1)を検知するユニット、
    ラスターポイントに配置され、その始まりがラスターポイントに一致する優先暗語を符合化されたビットストリームから読み出すユニット、これにより、優先暗語が関連するコード表を用いて復号化されて復号化されたビットストリームが得られ、さらに時間領域に戻すように変換されて復号化されたオーディオ信号が得られる。
  10. 請求項9記載の装置であり、この符号化されたビットストリームは少なくとも二つのコード表から引き出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10,12,14及び14,16,18)の少なくとも二つのグループを持つラスターを有しており、一つの部分に関して、そのスペクトル部分で実際に発生する最も長い暗語の長さをサイド情報として含んでいる、
    前記装置は、各スペクトル部分に関連するコード表を認知するユニットをさらに含み、
    前記検知ユニットにおいて、スペクトル部分に関連するコード表の二つのラスターポイント間距離は、そのスペクトル部分で実際に発生する最も長い暗語の長さに等しく設定されており、
    復号化の際、一スペクトル部分の優先暗語はそれに関連するコード表によって復号化される。
JP2004099418A 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 Expired - Lifetime JP3902642B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE19747119A DE19747119C2 (de) 1997-10-24 1997-10-24 Verfahren und Vorrichtungen zum Codieren bzw. Decodieren eines Audiosignals bzw. eines Bitstroms
PCT/EP1998/008475 WO2000039933A1 (de) 1997-10-24 1998-12-28 Verfahren und vorrichtungen zum codieren bzw. decodieren eines audiosignals bzw. eines bitstroms
JP2004099417A JP4168000B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
JP2004099419A JP3978194B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの復号化のための装置及び方法
JP2004099418A JP3902642B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
DE19747119A DE19747119C2 (de) 1997-10-24 1997-10-24 Verfahren und Vorrichtungen zum Codieren bzw. Decodieren eines Audiosignals bzw. eines Bitstroms
DE19840853A DE19840853B4 (de) 1997-10-24 1998-09-07 Verfahren und Vorrichtungen zum Codieren eines Audiosignals
PCT/EP1998/008475 WO2000039933A1 (de) 1997-10-24 1998-12-28 Verfahren und vorrichtungen zum codieren bzw. decodieren eines audiosignals bzw. eines bitstroms
JP2004099417A JP4168000B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
JP2004099419A JP3978194B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの復号化のための装置及び方法
JP2004099418A JP3902642B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000591732A Division JP3580777B2 (ja) 1998-12-28 1998-12-28 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置

Publications (2)

Publication Number Publication Date
JP2004234020A true JP2004234020A (ja) 2004-08-19
JP3902642B2 JP3902642B2 (ja) 2007-04-11

Family

ID=36972705

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2004099418A Expired - Lifetime JP3902642B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
JP2004099417A Expired - Lifetime JP4168000B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
JP2004099419A Expired - Lifetime JP3978194B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの復号化のための装置及び方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2004099417A Expired - Lifetime JP4168000B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
JP2004099419A Expired - Lifetime JP3978194B2 (ja) 1997-10-24 2004-03-30 オーディオ信号又はビットストリームの復号化のための装置及び方法

Country Status (3)

Country Link
JP (3) JP3902642B2 (ja)
DE (1) DE19747119C2 (ja)
WO (1) WO2000039933A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19907729C2 (de) 1999-02-23 2001-02-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines Datenstroms aus Codeworten variabler Länge und Verfahren und Vorrichtung zum Lesen eines Datenstroms aus Codeworten variabler Länge
DE19907728C2 (de) 1999-02-23 2001-03-01 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
US7610195B2 (en) 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3912605B4 (de) * 1989-04-17 2008-09-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
JPH04221465A (ja) * 1990-12-21 1992-08-11 Matsushita Electric Ind Co Ltd 記録装置

Also Published As

Publication number Publication date
JP3978194B2 (ja) 2007-09-19
JP2004264860A (ja) 2004-09-24
JP3902642B2 (ja) 2007-04-11
JP4168000B2 (ja) 2008-10-22
JP2004234021A (ja) 2004-08-19
DE19747119A1 (de) 1999-04-29
DE19747119C2 (de) 2003-01-16
WO2000039933A1 (de) 2000-07-06

Similar Documents

Publication Publication Date Title
JP3580777B2 (ja) オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
US11961527B2 (en) Methods and apparatus to perform audio watermarking and watermark detection and extraction
US6807528B1 (en) Adding data to a compressed data frame
US7003448B1 (en) Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal
KR100969731B1 (ko) 데이터의 중요도에 따라 변형된 데이터 스트림을 생성하는장치 및 그 데이터 스트림을 해석하는 장치
US7526432B2 (en) Apparatus and method for producing a data stream and apparatus and method for reading a data stream
JPH07311594A (ja) ビット割当にチャネルのマスキング特性を用いる符号化及び復号化装置及び方法
JP3978194B2 (ja) オーディオ信号又はビットストリームの復号化のための装置及び方法
KR100685974B1 (ko) 워터마크 삽입/검출을 위한 장치 및 방법
AU754371B2 (en) Method and device for generating a data flow from variable-length code words and a method and device for reading a data flow from variable-length code words
ES2329466T3 (es) Procedimientos y dispositivos para codificar o decodificar una señal de audio o un flujo de bits.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060509

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060802

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061229

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term