JP2002534702A - オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 - Google Patents
オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置Info
- Publication number
- JP2002534702A JP2002534702A JP2000591732A JP2000591732A JP2002534702A JP 2002534702 A JP2002534702 A JP 2002534702A JP 2000591732 A JP2000591732 A JP 2000591732A JP 2000591732 A JP2000591732 A JP 2000591732A JP 2002534702 A JP2002534702 A JP 2002534702A
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- raster
- code
- codeword
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000005236 sound signal Effects 0.000 title claims abstract description 47
- 230000003595 spectral effect Effects 0.000 claims abstract description 198
- 238000001228 spectrum Methods 0.000 claims description 23
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 11
- 230000002123 temporal effect Effects 0.000 description 8
- 238000012937 correction Methods 0.000 description 6
- 238000013144 data compression Methods 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/35—Unequal or adaptive error protection, e.g. by providing a different level of protection according to significance of source information or by adapting the coding according to the change of transmission channel characteristics
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/662—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a time/frequency relationship, e.g. time compression or expansion
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Probability & Statistics with Applications (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
ディング又はデコーディングを実行することができる、オーディオ信号又はビッ
トストリームを符号化あるいは復号化するための方法及び装置に関する。
によるものであるが、信号の質の明らかな低下を生じることなく、例えば因数1
2によってオーディオ信号のデータレートを圧縮することが可能である。このよ
うな高いデータレートの圧縮を可能にするためには、オーディオ信号をサンプリ
ングし、結果的に一連の離散時間型サンプルとなる。この種の技術において知ら
れているように、ウィンドウされた時間的なサンプル群を得るために、この一連
の離散時間型サンプルは、適当なウィンドウ機能を使用してウィンドウされる。
ある一つのウィンドウされた時間的なサンプル群は、フィルタバンク、変形離散
コサイン変換(MDCT)あるいは他の適当な方法によって周波数領域に変更さ
れ、それにより、周波数領域における、そのオーディオ信号、つまり、その離散
時間型サンプル群からなるその時間的部分を表すスペクトル値を得る。通常、5
0%重なる時間群が生成され、MCDTによって周波数領域に変換される。MD
CTの特性のために、例えば1024の離散時間型サンプルは、常に1024の
スペクトル値になる。
が知られている。これはいわゆる心理聴覚モデルに反映されている。このモデル
を利用して、時間的スペクトルによるマスキング閾値を計算することが可能であ
った。マスキングとは、ある特定のトーン又はスペクトル部分が、例えば、その
隣り合うスペクトル領域が比較的高いエネルギーを有する時、聞こえないものと
判断されることである。このマスキング現象は、変換後のスペクトル値をできる
だけ粗く量子化するために利用される。従って、目的は、できる限り少ないビッ
トを符号化、あるいはここでは量子化し、復号化されたオーディオ信号には可聴
範囲の妨害を避けることである。量子化により引き起こされる妨害、つまり、量
子化ノイズはマスキング閾値以下であり、従って可聴域外であるべきである。周
知の方法によれば、スペクトル値は従っていわゆる倍率帯域に予備分割され、こ
れは、人間の聴覚の周波数群を反映している。ある倍率群のスペクトル値には、
倍率帯域全体のスペクトル値を調整するために、ある倍率を掛ける。そして、倍
率で調整された倍率帯域は量子化され、量子化されたスペクトル値を生成する。
もちろん、倍率帯域にグルーピングすることは重要でない。しかし、この手順は
MPEG層3標準及びMPEG−2 AAC (AACは上級オーディオ符号化)
標準に使用されている。
符号化である。普通、ハフマンコーディングがこれに利用される。ハフマンコー
ディングは長さが変動する符号化を伴う。つまり、符号化されるべき値のための
暗語の長さは、この値が起こりうる可能性に基づいている。論理的には、最も起
こり易い記号が最も短い符号、つまり、暗語を割り当てられ、その結果、ハフマ
ンコーディングによって非常に良好な余分な部分の削減が達成できる。よく知ら
れている長さ変動の符号化の一つの例は、モールス式符号である。
するために用いられる。例えば、MPEG−2 AAC標準で作動する最近のオ
ーディオコーダは、量子化されたスペクトル値を符号化するために、部分ごとに
特定の標準に基づき、スペクトルに割り当てられる、複数の異なるハフマンコー
ド表を使用する。ここでは、二つ又は四つのスペクトル値が常に一体的に一つの
暗語に符号化される。
、異なる倍率帯域、つまり、異なるスペクトル値が、任意の数のスペクトル部分
にグループ分けされることである。AACにおいて、一つのスペクトル部分は少
なくとも四つのスペクトル値、好ましくはそれ以上のスペクトル値を含んでいる
。スペクトル値の全周波数領域は、このようにして隣接するいくつかの部分、そ
れぞれの部分は周波数帯域を表すのだが、に分割され、結果的に、これら全ての
部分が変換前のスペクトル値に渡る全ての周波数領域をカバーする。
わゆるハフマン表、複数のこのようなハフマン表のうちの一つが各部分に割り当
てられる。AAC方法のビットストリームでは、普通1024のスペクトル値を
含み、これらのスペクトル値のためのハフマン暗語は周波数が高くなって行く順
に並んでいる。各周波数部分で使用される表の情報はサイド情報として送られる
。この状況を図2に示す。
含んでいる。もし一つの暗語が常に一つのスペクトラル値から形成されるならば
、10個のスペクトル値がここで符号化できる。しかし、通常、2個又は4個の
スペクトル値が常に一体的に一つの暗語に符号化されるので、図2は20個又は
40個のスペクトル値を含む符号化されたビットスリームの一部を示しているこ
とになる。各ハフマン暗語が2個のスペクトル値を含んでいる場合、番号1で示
されている暗語は最初の2個のスペクトル値を表している。この暗語の長さは比
較的短く、この最初の二つのスペクトル値、つまり、最も低い二つの周波数係数
は比較的頻繁に起こることを意味している。他方、番号2で示されている暗語は
比較的長く、この符号化されたオーディオ信号では3番目及び4番目のスペクトル
係数の発生は比較的まれで、それ故にこれらのスペクトル係数は比較的大きなビ
ット数で符号化される。図2に示すように、番号3,4,5で示される暗語はス
ペクトル係数5,6,7,8,9,10を表しているが、これらの各暗語は比較
的短いので、これらの係数は比較的頻繁に発生する。番号6〜10で示されてい
る暗語についても同様の考え方ができる。
めのハフマン暗語は、周知の符号化装置によって生成されるビットストリームの
場合、そのビットストリーム中に周波数が高くなっていく順に一列に並んでいる
。
、そのエラーを伝達してしまうことである。例えば、図2中の番号2で示される
暗語が伝えられる際に、この暗語2の長さが変更されるかもしれないという無意
味とは言えない可能性がある。このようにして正しい長さとは異なる場合がある
。図2の場合、もし暗語2の長さが妨害により変更されたなら、デコーダはもは
や、暗語3−10がどこから始まるのかを判断できなくなり、つまり、そのオー
ディオ信号のほとんど全ての部分が影響を受けることになる。このように、妨害
された暗語に続く他の全ての暗語さえも正確に復号化されなくなる。それは、こ
れらの暗語がどこから始まるのかわからなくなり、この誤差のために、間違った
開始点が選ばれてしまうからである。
56号は、一つの暗語の始まりが、完全な復号化をしなくても、あるいは誤った
伝達の場合にでも、より簡単に確認できるように、長さの異なる暗語のいくつか
をラスター配列させ、他の暗語を残りの隙間に配置させることを提案している。
うに定義されるのか、つまり、いくつのラスターポイントが必要なのか、ラスタ
ーポイント間のラスター距離等である。しかし、ヨーロッパ特許第061215
6号は、誤差の伝達を抑えるためにラスターが利用されるべきであるという一般
的な提案を超えるものではなく、誤差許容と同時に効率的な符号化を達成するた
めにどのようにしてラスターを効率的に構築するのかについて、何の詳細な説明
もない。
ストリームの符号化及び復号化のための概念を提供することにある。
項21又は請求項22に係るオーディオ信号の符号化装置、請求項23又は請求
項24に係るビットストリームの復号化方法及び請求項25又は請求項26に係
るビットストリームの復号化装置により達成される。
、効率的な符号化/復号化を可能にするように形成または使用されなければなら
ないという発見に基づくものである。ここで最も重要なことは、ハフマンコーデ
ィングという形でのエントロピー符号化によって得られる暗語は本質的に長さの
異なるものである。最も大きな符号化の成果は、最も頻繁に起こる値に最も短い
暗語を与える場合、現れる。他方、比較的まれに起こる値は、たとえ長い暗語を
与えても、統計上、データ量としては最適値になる。ハフマンコーディングによ
って得られる暗語は、本質的に異なる長さを有するものである。
され、これにより、たとえビットストリーム中にエラーがあっても、ラスターを
通してデコーダが間違いなく各優先暗語の始まりを認知することができる。優先
暗語は、心理音響的に重要な暗語である。このことは、いわゆる優先暗語によっ
て符号化されたスペクトル値が、復号化されたオーディオ信号の聴感覚に実質的
に貢献するということを意味している。オーディオ信号が高い割合でスピーチを
含んでいる場合、優先暗語は低いスペクトル値を表す暗語である。なぜならば、
この場合、重要なスペクトル情報はスペクトルの低い領域にあるからである。オ
ーディオ信号がスペクトルの中領域にあるトーン群を持っている場合、優先暗語
は周波数領域のこれに相当する中領域のスペクトル値に割り当てられた暗語であ
る。なぜならば、これらが心理音響的に重要なスペクトル値であるからである。
心理音響的に重要なスペクトル値は、また、その規模つまり信号エネルギーがス
ペクトル内の他のスペクトル値に比べて大きいものである。他方、心理音響的に
さほど重要でない暗語、いわゆる非優先暗語がこのラスターを埋める。従って、
これらの暗語はラスターポイントと共には位置しないが、優先暗語がラスターポ
イントに配置された後、残りの空間に「はめ込まれる」。
要なスペクトル値に与えられた暗語が、これらの優先暗語の開始点とラスターポ
イントが一致するようにラスター配列される。
けされ、異なるコード表が各スペクトル部分に与えられる。スペクトル部分への
コード表の割り当ては、信号の統計的な考慮に基づいて、例えば、あるスペクト
ル部分の符号化に最も適するコード表はどれかということに基づいてなされる。
スペクトル部分へのコード表の割り当ては、すでにこの技術分野では周知である
。
が使用されることになる。一つのラスターポイントグループ内のラスターポイン
ト間の距離は、一つのスペクトル部分の符号化に使用されるコード表に基づいて
いる。他の別のスペクトル部分では、最適なデータ圧縮を行うために別のコード
表が使用される。この別のコード表は、別のグループの等距離で配列されている
ラスターポイントに割り当てられ、このラスターポイントグループ内の二つのラ
スターポイントの距離はその関連するコード表に基づいている。互いに異なるラ
スターポイントグループの二つのラスターポイントの距離は、少なくとも三つの
方法で決定することができる。
たラスターポイントグループ内の二つのラスターポイントの距離は、そのコード
表の暗語の最大長さと同じか又は最大長さよりも大きいので、ラスターにはこの
コード表の最長の暗語のための空間がある。別のコード表に関連する別のラスタ
ーポイントグループ内の二つのラスターポイントの距離は、この別のコード表の
暗語の最大長さに基づき、同様の方法で決定される。
ハフマンコードの本質的な特性のために、あまり頻繁に発生しない暗語は、より
頻繁に発生する暗語よりも長い。ラスターポイント間の距離を、ある表の暗語の
最大長さと同じか又はそれよりも大きく設定する場合、そのラスターに挿入され
る暗語は通常そのラスターポイント間距離よりも短い。従って、ラスターポイン
ト間距離は、ある表の暗語の最大長さよりも短く設定することも可能である。符
号化の際にそのラスターに入りきらない暗語が現れた場合、ラスターに入らない
残りの部分は、ビットストリームのラスター配列外の他の適当な場所に挿入され
る。結果として、この分断された暗語はもはやエラー伝達から有効に保護されな
い。これは非常にまれなことであり、ラスターポイントの数の増加という利益の
ために受け入れられるものである。
大長さではなく、符号化されたスペクトル部分に実際に生じるビットストリーム
中の暗語の最大長さを考慮することである。
番によるビットストリーム中の暗語の配列に代わり、暗語が周波数領域に渡り分
散される配列が使用され、これはまた「スクランブリング」として知られている
方法である。これはいわゆる「突発的なエラー」が、全周波数帯域の間違った複
合化につながることはなく、単にいくつかの異なる周波数領域で小さな妨害が見
られる程度であるという利点を有している。
番による暗語の配列に代わり、例えばn番目ごと(例えば、2番目ごと、3番目
ごと、又は4番目ごと)の暗語だけがラスターに配列されるという配列方法が使
用され得る。この方法では、可能なラスターポイントの数が優先暗語の数よりも
小さい場合、優先暗語を使用するスペクトル領域を可能な限り大きくすること、
つまり、エラー伝達を防止することが可能になる。
権が与えられる。好ましくは、このことは心理音響的に重要な暗語、つまり優先
暗語が低周波のスペクトル値を符号化するものであるという仮説を放棄すること
を意味する。このような場合はしばしばあるが、常にそうであるとは限らない。
り、これらは通常高いエネルギーを有するスペクトル値である。高いエネルギー
を有するスペクトルラインはエラーによっては生じない。
のインディケータは使用されるコード表に基づくものである。AAC標準におい
て、例えば、異なる絶対値域を有する11のコード表がある。コード表1は例え
ば−1〜+1の絶対値を持つスペクトル値を含み、コード表11は−8191〜
+8191のスペクトル値を符号化する。コード表番号が大きくなればなるほど
、それが符号化できる値域が大きくなる。このことは、小さい番号のコード表は
比較的小さな値のみを表し、それ故に比較的小さなエラーを引き起こすだけであ
り、大きな番号のコード表は比較的大きな値域を表し、比較的大きなエラーを引
き起こすことを意味している。
のであり、間違ったスペクトルラインの結果は、元々の正しいスペクトルライン
とさほど違わないものとなる。しかし、最も大きな番号のコード表においてエラ
ーが発生した場合、このエラーは原則としてこのコード表の絶対値のいくつかと
なり得る。最も大きな番号のコード表で符号化されたスペクトルラインが小さい
値を有し、例えば伝達の間に生じたエラーのために、デコーダ内で、このコード
表によって最も高い絶対値を持つスペクトルラインとして複合化された場合、こ
の間違ったスペクトルラインは確かに聞こえるものとなる。
AAC標準ではコード表11)である。なぜならば、このコード表は、値を−2 13 +1(−8191)〜+213−1(+8191)の間に逃してしまうからであ
る。
ために使用される。短いウィンドウにより、周波数分解能はより高い時間的分解
能のために減じられる。優先暗語は、心理音響的に重要なスペクトル値、つまり
低周波のスペクトル値又は番号の大きいコード表からのスペクトル値がラスター
ポイント上に確かに配置されるように、決定される。倍率帯域のインターリービ
ングは、これはAAC標準の特徴であるが、この目的のために解除される。
る長さの暗語の配列を示しているが、これは周波数に関して直線的に高くなる順
番によるものである。図2では、優先暗語が暗語1〜5である。前述したように
、オーディオ信号が例えば高い割合でスピーチを含んでいる場合、または多くの
低周波音を含んでいる場合、低周波のスペクトル値に与えられる暗語が優先暗語
である。図2中、暗語6〜10は高周波のスペクトル値に関連するものであり、
これらのスペクトル値は復号化された信号の全体的な印象に貢献するものの、聴
感覚には大して影響せず、従って心理音響的にあまり重要ではない。
中、ラスターポイント10とラスターポイント12の間の距離をD1、ラスター
ポイント14とラスターポイント16の間の距離をD2とする。
イント14の間のビットストリームだけを考える。優先暗語1,2は、図2に示
された例では低周波域に位置している重要なスペクトル部分であるが、これが復
号化の際にエラー伝達の対象とならないように、ラスターに配列されている。非
優先暗語、図1、図2において斜線を符していないものであるが、これらは優先
暗語の後に、ラスターを埋めるように配置される。ハフマン暗語の長さは暗語そ
のものからわかるので、非優先暗語を一固まりでラスターに入れ込む必要はない
。デコーダは、読み取ったものが暗語の単に一部だけであるのかどうかを判別で
きる。この場合、デコーダは自動的に、暗語の最初の部分に、次のラスターポイ
ントの後の優先暗語に引き続き、ある特定のビット数を付加する。従って、非優
先暗語7,8,9のそれぞれがビットストリーム中二つに分けられ、つまり、7
a,7b、8a,8b、9a,9bに分けられるように、非優先暗語の最初の部
分をラスターの最初の空き場所に挿入し、残りの部分を他の場所に挿入すること
が可能である。
特徴点を説明している。ラスター距離D1が小さなラスター距離D2に変更され
なければ、優先暗語1〜5のどれでもが入る距離D1を有するラスターは、いわ
ば、ラスターの残りの部分を埋めるだけの十分な非優先暗語がないというような
長いビットストリームを作る結果となりうる。従って、ビットストリームに挿入
されるべき多くの優先暗語だけをオーディオ信号から抜き出し、根本的に空き場
所を残さないようにし、ビットストリームが不必要に延長されることがないよう
にする。
AAC標準に基づく符号化方法の場合において、11の異なるハフマンコード
表が符号化のために使用される。これらの表の大部分にとって、可能な限りの最
大の暗語長さは10〜20ビットである。しかし、特別な表、いわゆる「逃し表
」は49ビットの最大長さを含む。もし全ての表のうちで最長暗語の長さをラス
ター距離Dとして使用するならば、49ビットのラスター距離を設定することに
なる。この結果、非常に大きな幅のラスターとなり、全ての優先暗語がラスター
ポイントに配列された場合、ビットストリームはあまりにも長すぎるものとなる
ので、ほとんど全ての表にとって非効率的なものとなる。従って、本発明による
と、ラスターの幅は使用されるコード表に基づき調整される。前述したように、
スペクトル値はいくつかのスペクトル部分にグループ分けされ、各スペクトル部
分には、信号の統計的要素を考慮して最適なコード表が与えられる。ひとつのコ
ード表における最大の暗語長さは、普通、他のコード表における最大の暗語長さ
とは異なる。
10で表されるスペクトル値は第2のスペクトル部分に属すると仮定する。この
場合、ビットストリームは二つのラスターポイントグループによってラスターさ
れる。第1のラスターポイントグループはラスターポイント10,12,14か
らなり、第2のラスターポイントグループはラスターポイント14,16,18
からなる。さらに、スペクトル部分0はハフマンコード表nを与えられ、スペク
トル部分1はハフマンコード表mを与えられ、また、暗語2はスペクトル部分0
に与えられた表nのうちの最長暗語である。第1のラスターポイントグループの
ラスター距離は表nの最大の暗語長さ、つまりこの例での暗語2の長さよりも大
きいか、あるいは好ましくはそれと等しい。
部分からわかるように、この例ではコード表mにおける最長の暗語は現れない。
従って、グループ2で示されるビットストリームのラスターには長さD2の暗語
はない。
て選択される。しかし、この場合、使用される表はデコーダで復号化される際に
認識されなければならない。しかし、コード表番号が各スペクトル部分のサイド
情報として常に送信されるならば、デコーダは、ある特定の異なる、この例では
11の、ハフマン表のうちのどのコード表であるかを認識することができる。
9ビットの暗語を含む逃し表を考えるとわかるように、最適なデータ圧縮が達成
されるわけではない。この逃し表の場合、ラスター距離は最大サイズのスペクト
ル値を符号化できるように49ビットに調節されることになるからである。逃し
表は、短いコード表を持つために、逃し表と共に短いコード表を使用して比較的
大きい値を符号化できるように、使用される。一つのコード表の値域を超える値
の場合、このスペクトル値のための暗語はある特定の値になり、このことは、コ
ーダ内で逃し表もまた使用されたということをデコーダに示すことになる。ある
コード表が値0〜2を含んでいる場合、例えば、そのコード表の3の値がデコー
ダに逃し表が使用されたことを示すことになる。「基礎」のコード表の値3を有
する暗語は同時に、その基礎コード表の最大値と共に、該当するスペクトル値を
形成する逃し表の値を与える。
グループ2)内のラスターポイント間距離は、もはやあるコード表における最長
暗語の長さと同じではなく、あるコード表に属するビットストリームに実際に発
生する最長暗語の長さと同じである。本発明の第2の特徴点の第1実施形態にお
いては、逃し表における符号化効率は未だ最適ではないので、この実施形態では
これをさらに改良した。この表の暗語の最大長さ(スペクトル内で)は通常、技
術的符号化の理由からかなり短いものである。逃し表の最長の暗語は例えば49
ビットである。
は約20ビットの長さである。従って、ラスターポイントの数、及び一つのブロ
ック内の最長暗語の長さを送信することによりラスターポイントに配列され得る
優先暗語の数をさらに増すことができる。そしてラスターの長さは実際に発生す
る最長暗語の長さか又は現在使用されている表の論理的な最長暗語の長さのうち
のどちらか最小値である方に等しい。最小値を決定するために、各コード表の実
際に発生する暗語又は単に一つのオーディオフレームで使用される全てのコード
表の最長暗語のどちらかを使用することができる。この選択は非逃し表、つまり
「基礎」ハフマン表にも利用できるが、逃し表ほどには効率的ではない。
とは別の有利な副作用を生み出す。デコーダは、既に発生した最大長さから、妨
害されたかもしれないより長い暗語がそのビットストリームの中に存在するかど
うかを検知することができる。長い暗語は普通、スペクトル値の高いエネルギー
を表している。非常に長い暗語が伝達エラーのために発生した場合、これは非常
に可聴な妨害となる。最大長さを送信することは、ほとんどの場合このようなエ
ラーを感知し、それに対して策を講じる手段を与えることになる。エラーに対す
る対向策とは、長すぎる暗語を単に空白にしておくか又は何かもっと複雑な隠蔽
工作であろう。
トが望ましいということを銘記しておくことは重要である。しかし、ラスターポ
イントの数はビットストリームの全長によって制限される。これはもちろんラス
タリングの結果として長くされるべきではなく、なぜならば、ビットストリーム
中に使用されない場所ができてしまい、全体的なデータ圧縮の理論とは矛盾する
ことになるからである。しかし、応用によっては、ビットストリームの延長は高
い程度での誤差許容のためには受け入れられることもあるということも、また指
摘しておかねばならない。考慮すべき別の点は、ラスターはできるだけ多くの暗
語がラスターポイントから始まるように構築されることが好ましいということで
ある。よって、本発明は、先行技術に比べてラスターポイント間距離の選択に関
して有効な融通性がある。全く理想的な場合には、この融通性によって全ての暗
語がラスターポイント上に配置されるが、このためには非常に大きな技術努力が
必要である。前述のラスターポイントの配置方法、つまり各スペクトル部分での
ラスターポイント間距離を関連するコード表に基づいて決定する方法は、この最
適ケースに非常に近いものを可能とする。しかし、これは特に、全ての暗語が心
理音響的に重要なものではなく、ビットストリーム中に使用されない場所を残さ
ないために、心理音響的にさほど重要でない暗語は、ビットストリーム内に、ラ
スター配列された心理音響的に重要な暗語の間に挿入されるからである。
数に関して高くなる順に直線状に並べられてはいず、異なるスペクトル値の暗語
が「スクランブル」されている。図1において、暗語の周波数に関わる交互的な
直線的配列がある程度見られる。斜線で示された優先暗語は周波数が高くなる順
に配列され、斜線を施されていない非優先暗語も、周波数が高くなる順にビット
ストリーム中に挿入されているからである。いわゆる「突発的」エラーが図1に
示すビットストリーム中に発生した場合、すなわち、引き続くいくつかの暗語の
崩壊につながるような妨害が発生した場合、例えば暗語6,7a,2,3,7b
が同時に影響を受けることになる。
故にはっきりと聞こえる妨害が、優先暗語2,3によって示されるスペクトル帯
域内に発生することになる。突発的なエラーの問題については、図1の非常に単
純な例からはあまり明らかではない。しかし、実際、5個以上のラスターポイン
トがあり、突発的エラーがしばしば複数のラスターポイントに跨って発生するこ
とが考えられ、このような場合には、比較的広い周波数帯域でのデータの損失と
なり得る。この理由から、本発明の第3の特徴点によれば、スペクトル値の優先
暗語は周波数の高くなる順に配列されないことが好ましく、周波数に関してラン
ダムなあるいはランダムに見えるような配列になるように「スクランブル」にす
る方が好ましい。非優先暗語もまた同様に取り扱ってもよい。ランダムのような
配列の場合、この分散状況はデコーダに前もってセットできるので、この分散に
ついてはサイド情報として送信する必要はない。結果として、ビットストリーム
中の連続する暗語の損失が完全な一つの周波数帯域の損失とはならず、単にいく
つかの周波数帯域での非常に小さい損失となるだけである。この妨害が聞こえる
ことはめったになく、一つの周波数帯域全体の損失よりも効果的に隠すことがで
きる。
くなる順の直線的な配列に代わり、例えばn番目ごとの暗語がラスター配列され
、残りの暗語はそれらの間に挿入されるという配列が使用可能である。前述した
ように、一つのビットストリームのためのラスターポイントの数は全長及びラス
ターポイント間距離によって限定される。例えば、低い帯域幅でのサンプリング
の場合を考えると、大多数の暗語が心理音響的に重要な暗語である。16kHz
のサンプリングレートが使用された場合、信号全てが論理的に使用可能な8kH
zの帯域幅を有しているからである。経験的には、暗語のうちの30%だけがラ
スターポイント上に配列され、残りの70%はラスターを完全に埋めるように配
列されなければならない。しかし、このことは、重要な周波数領域、例えばスピ
ーチ信号の場合は0〜4kHzであるが、これがラスターポイント上に配置され
た暗語によってカバーあるいは「保護」され得ないということを意味している。
従って、重要な周波数領域でのエラー伝達を適切に阻止するために、全ての優先
暗語をラスターポイント上に配置する代わりに、2番目ごと、3番目ごと、4番
目ごと等の優先暗語のみをこのように配置し、他の優先暗語は一直線に並べられ
るのではなく、ラスターを埋めるように配置される。例えば、2番目ごと、3番
目ごと等のスペクトル値が低周波領域にあることがわかり、点在する暗語が伝達
の間に崩壊する場合、例えば予測等のエラー隠蔽技術を使用してデコーダ内でこ
れらの暗語を再構築することも可能である。
ように働く。
のラスターポイント(10,12,14)を持つラスターを有し、これらの暗語
は、他のスペクトル値と比べて心理音響的に重要なあるスペクトル値を表す優先
暗語を含み、優先暗語はラスターポイントによって配列されているという符号化
されたオーディオ信号で表されるビットストリームを復号化するための一般的な
方法では、(a)二つのラスターポイント間の距離D1が決定される。二つのラ
スターポイント間の距離がわかれば、(b)ラスターポイントに配列されている
符号化されたビットストリーム中の優先暗語が、周波数に関して直線的な順で、
各優先暗語の始まりがラスターポイントと一致する配列となるように、再分類さ
れる。これにより優先暗語は図2に示す一般的な周波数に関する直線的な配列と
なり、(c)復号化されたスペクトル値を得るために、関連するコード表を用い
てこれらの優先暗語を復号化することができる。(d)復号化されたスペクトル
値を時間領域に戻すように変換して、復号化されたオーディオ信号が得られ、例
えばラウドスピーカに送り込めるように何らかのよく知られた方法で加工するこ
とができる。
ーポイント間距離は、どの表が符号化のために使用されたのかをビットストリー
ムのサイド情報から見つけ出すことによって、極めて簡単に設定することができ
る。符号化によっては、この距離はこの表の最長暗語の長さであるかもしれず、
それはそのコーダに永久的にセットされ得る。その距離が、コード表が与えられ
たビットストリームの一部に実際に発生する最長暗語の長さであれば、このこと
はビットストリームに伴うサイド情報等でデコーダに発信される。
ストリームにポインタを当てることによって行う。デコーダがラスター距離を認
識しており、優先暗語が周波数に関して直線的に配列されている場合、デコーダ
はラスターポイントに飛び越し、そこから始まる暗語を読むことができる。一つ
の暗語を読み終えると、ポインタは次のラスターポイントへ飛び、このようなプ
ロセスを繰り返す。全ての優先暗語が読まれても、ビットストリームはまだ非優
先暗語を含んでいる。ビットストリーム中の優先暗語と非優先暗語の直線的配列
が選択された場合、非優先暗語はすでに周波数に関して直線的に配列されており
、さらなる分類をすることなしに、復号化及び元の状態への変換がなされる。
報がサイド情報として送られるか、またはスクランブル状態の分布が前もって固
定され、それにより最初からデコーダはこのことがわかる。同じ考慮が第4の特
徴点にも当てはまる。一定の分布を規定するか、またはデコーダにサイド情報と
して連絡された可変の分布を選択することは常に可能である。
表を使用する場合には一つのラスター距離を、あるいは多数のコード表を使用す
る場合には複数のラスター距離を設定することによって符号化されたビットスト
リームのためのラスターを決定した後、優先暗語は、それぞれがラスターポイン
トと一致するようにラスターに配置されなければならない。
は空のラスターに順に挿入していくことによって達成される。表の最初の暗語か
ら始められる。従って、優先暗語は表中の暗語の並びによって影響されるが、優
先暗語は常にラスターの場所にある暗語、つまり、ラスターポイントが使用可能
である暗語である。もはやラスターポイントがない表中の暗語に関しては、ビッ
トストリーム中の残りの空間にそれらを挿入していく以外に選択の余地はない。
これらの暗語は従って本発明の感覚からすると、優先暗語ではない。
めのメモリが満たされるまでは、すなわち、もはや優先暗語が書き込めなくなる
までは、優先暗語が書き込まれる。このメモリの大きさは、そのスペクトルデー
タのために以前に使用されたビットの合計と同じである。つまり、それ以上のビ
ットはラスタリングによって要求されない。メモリは、このように符号化の効率
がラスター処理の結果として落ち込むのを阻止するために、暗語の数によって制
限される。もちろん、誤差を許容することができるように、全ての暗語がラスタ
ーポイント上に配置されてもよい。しかし、この場合、ラスターポイント間に空
のビットが使用されないままになるので、符号化効率の顕著な低下につながる。
響的に重要なスペクトル値を表す暗語の決定に係わるものである。心理音響的に
重要なスペクトルラインとは、例えば、他のスペクトルラインよりも大きなエネ
ルギーを含んでいるスペクトルラインである。概略的に言えば、大きなエネルギ
ーを有していればいるほど、そのスペクトルラインはより重要である。従って、
高いエネルギーを有するスペクトルラインが妨害されないことと、それと同様に
、高いエネルギーを有するスペクトルラインがエラーの結果として発生すること
はないということが重要である。
い部分に位置しているという仮定で説明してきた。これは多くの場合事実である
が、全ての場合ではない。本発明は、一つの暗語に符号化されたスペクトルライ
ンの、または複数のスペクトルラインが一つの暗語に符号化されている場合はこ
れら複数のスペクトルラインのエネルギーを概算するための含蓄されたインディ
ケータを使用することによって、この仮説を無視するものである。
はコード表である。例えばAAC標準では、11個の表が使用される。これらの
表の値域はかなり違っている。表1〜11の最大絶対値は以下の通りである。
ると、これは表の中から確認可能であるか、または表以外から送信されてくるが
、最大エラーは前記絶対値の2倍になる。本発明によれば、優先暗語の決定は使
用されるコード表に基づいてなされ、そのインディケータは最大絶対値と含蓄的
にコード表番号である。まず、そのコード表が最大の値域を有している暗語を考
える。次に、そのコード表が2番目に大きい値を有する暗語が続き、という手順
である。従って、AAC標準の場合、表11が最初に考慮され、表9,10が続
き、表1,2が優先順位の最後である。ラスターポイントに配置される優先暗語
は、このように、ラスターポイントがそれのために使用され得るソート表の中に
ある暗語である。
の情報からデコーダは送信中に使用される暗語の並びを決めることができるので
、他の付加的な情報をデコーダに送信する必要はない。
の周波数領域内でのオーディオ信号の離散時間型サンプルを変換するために、長
いウィンドウに対向するものとして、短い(サンプリング)ウィンドウを使用す
ることに関する。短いウィンドウはAAC標準及び標準層3で定義される。短い
ウィンドウの場合、一つの長いMDCTの代わりに多数の短いMDCTが使用さ
れる。
グループが、例えば1024の出力値を有する一つのMDCTの代わりに使用さ
れる。これはコーダの周波数分解能を犠牲にして時間的分解能を高めることにな
る。一般的に短いウィンドウは一時的な信号に使用される。例えば短いウィンド
ウがAACと共に使用される場合、8つの連続した完全なスペクトル、すなわち
それぞれのセットが全スペクトルを含む8セットのスペクトル値が得られるが、
スペクトル値間の距離もまた8倍の大きさである。これは周波数分解能の低下を
表し、そしてこれは時間的分解能の高まりを伴う。
ループが形成される。これらのグループのために1セットの倍率がある。最も単
純な場合、各グループが一つのウィンドウを含んでいる。この場合、8セットの
倍率が送信されなければならない。より強い圧縮を達成するためには、一般的に
心理音響的な必要条件を考慮して、複数のウィンドウがAAC標準の一つのグル
ープに集められる。これは送信されるべき倍率の数を減少させ、より良いデータ
圧縮となる。スペクトルデータはグループ毎に順に符号化されたビットストリー
ムに記載されて送信される。グループ内では倍率帯域の交互配置が行われる。
。第1グループは二つのウィンドウを含み、第2グループは三つのウィンドウを
含み、第3グループも三つのウィンドウを含んでいる。各スペクトルは12の倍
率帯域を有する。グループ分けは下記の通りである。
スターに挿入するのには適さない。なぜならば、連続的な挿入がなされる場合、
第1グループの全スペクトルは保護されるが最後のグループのスペクトルは保護
されないからである。この理由で、本発明の第2の特徴点に係るプレソーティン
グは、短いウィンドウのために行われる。AAC標準の場合、グループ分けと倍
率帯域によるアプローチは放棄される。新しいプレソーティングは、今度はスペ
クトルラインのユニットという形で行われる。
含む。AAC標準では従って各ウィンドウは、128のスペクトルラインに相当
する32のユニットを含む。スペクトルデータは下記の通りである。
くに位置する、つまり、低いスペクトル値は、周波数に基づき、より高い周波数
を有するスペクトル値の前に、個々のセットのスペクトル値から短い表の前部分
に書き込まれる。低いスペクトル領域のスペクトル値は心理音響的に特に重要で
あり、ソート表の前述のプレソーティングは、スペクトル値をソート表からラス
ターに挿入するための基礎を与える。この暗語のプレソーティング、つまり、優
先暗語を決定することにより、いかなる付加的情報をも送る必要はない。なぜな
らば、デコーダはサイド情報からこのブロック又はフレームでは短いウィンドウ
が使用されたことを認識し、ユニットを生成するためのコーダの分類アルゴリズ
ムが常に一定とされ、故にそれがデコーダに永久的にプログラムされるからであ
る。
することを銘記しておくことは重要である。なぜなら、ラスターポイントに位置
する暗語、つまり、優先暗語がソート表の最初、つまり前又は上の部分にある可
能性が高いので、この表はそれ自体、高い可能性で、どの暗語がラスターポイン
トに書かれ得るのかを決定するからである。
行われず、個々の暗語を指し、指し示された暗語がビットストリーム中に書き入
れられる順番を決定することで行われる。
わち、一つの暗語が2個又は4個のスペクトル値を符号化することが知られてい
る。従って、四つのスペクトルライン又はその倍数を一つのユニットにグループ
化することが有利である。このようにすれば同じ周波数領域を符号化する暗語が
直接互いに連続するように分類されるからである。一つのユニットのスペクトル
ラインの数はそのコード表の異なる次元によって割り切れることが好ましい。す
なわち、ユニットごとのラインの数は暗語ごとのラインの数の公倍数であり、最
小公倍数ならば最適である。
明に係るユニットへの再分類が短いウィンドウのために行われ、次にコード表の
インディケータを用いて優先暗語の決定が行われ、その際、高い程度のエラー防
止を達成するために高いコード表からの暗語が一定のラスターポイント上に配置
されることを確実にするために、ユニットへの再分類の結果が再び再分類される
。 この組み合わせは必ずしも必要ではないが、最良の結果を導くものである。
スタリングの一例を示す。
す。
うに定義されるのか、つまり、いくつのラスターポイントが必要なのか、ラスタ
ーポイント間のラスター距離等である。しかし、ヨーロッパ特許第061215
6号は、誤差の伝達を抑えるためにラスターが利用されるべきであるという一般
的な提案を超えるものではなく、誤差許容と同時に効率的な符号化を達成するた
めにどのようにしてラスターを効率的に構築するのかについて、何の詳細な説明
もない。 EP−A−0717503は、音楽信号の離散時間型サンプルを周波数領域に 変換し、得られたスペクトル値を量子化及びエントロピー符号化するデジタル符 号化及び復号化の方法を開示している。このエントロピー符号化は、長さの異な るある特定の数の暗語を生み出し、これらの暗語のいくつかはラスター配列され 、他のものはラスターの残りの空間に挿入されている。 EP−A−0492537は、情報が小さなピクセル群に分けられ、各ピクセ ル群は直交変換手段によって直交する成分に変換される、ビデオ及びオーディオ 情報の記録装置に関する。そして、直交する成分は、長さの異なる暗語を有する コードを用いて符号化される。符号化された暗語のいくつかは第1メモリに書き 込まれる。もし暗語が、第1メモリに書込み可能なものよりも多くのビットを有 している場合、その暗語の残りのビットは別のメモリに書き込まれる。
Claims (26)
- 【請求項1】 符号化されたビットストリームを得るためにオーディオ信号を
符号化する方法であり、以下のステップを含む、 (a)オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
散時間型サンプルを周波数領域に変換する、 (b)暗語で符号化されたスペクトル値を得るために、異なる長さを有する限
られた数の暗語を含むコード表を用いてスペクトル値を符号化する、各スペクト
ル値に与えられる各暗語の長さは、概して、スペクトル値が発生する可能性が高
ければ高いほど短いものである、 (c)符号化されたビットストリームのためにラスターを決定する、このラス
ターにおいては、等距離のラスターポイント(10,12,14)があり、ラス
ターポイント間の距離(D1)はそのコード表によるものである、 (d)他のスペクトル値に比べて心理音響的に重要な特別なスペクトル値を表
す優先暗語を、各優先暗語の始まりがラスターポイントと一致するように、ラス
ターに配置する。 - 【請求項2】 請求項1記載の方法であり、 複数のウィンドウが使用され、これにより、複数セットのスペクトル値が得ら
れ、各スペクトル値セットは全スペクトルを含み、 下記のステップが前記ステップ(d)の前に実行される、 それぞれのセットからの同じ周波数のスペクトル値を符号化する暗語を優先暗
語として定義する。 - 【請求項3】 請求項1又は請求項2記載の方法であり、コード表の暗語が複
数のスペクトルラインを符号化し、これらのスペクトルラインはグループ又はユ
ニットにまとめられ、その際、一つのグループ中のスペクトルラインの数は一つ
の暗語が符号化するスペクトルラインの数によって割り切れるようになされる。 - 【請求項4】 請求項3記載の方法であり、異なる次元を有する多種のコード
表、つまり、暗語ごとのスペクトルラインが異なるコード表が使用され、一つの
ユニットはn個のスペクトルライン(nは発生する全ての次元の公倍数である)
を有している。 - 【請求項5】 請求項1、請求項2又は請求項3記載の方法であり、低周波に
与えられるスペクトル値セットのスペクトルラインを符号化する暗語が優先暗語
として定義される。 - 【請求項6】 請求項5記載の方法であり、優先暗語を定義するステップは以
下のステップを含んでいる、 暗語を、優先暗語がソート表の前の部分の暗語になるように、従って表のそれ
より後に位置する暗語よりもラスターポイント上に位置され易くなるように、ソ
ート表に順に置き、ソート表の暗語の順番が暗語の中での優先分布を設定し、こ
れにより優先暗語を作成する、 ラスターポイントが無くなるまで、暗語をこのソート表からラスターポイント
上へ順に配置していく、 残りの暗語を、ソート表から未だ空いているラスターの場所に配置する。 - 【請求項7】 請求項1、請求項2、請求項3、請求項4、請求項5又は請求
項6記載の方法であり、優先暗語は低周波及び/又は高いエネルギーを有するス
ペクトル値を符号化する暗語である。 - 【請求項8】 請求項1、請求項2、請求項3、請求項4、請求項5、請求項
6又は請求項7記載の方法であり、ラスターポイント間距離は、コード表の最長
暗語の長さよりも小さいか、それに等しいか、又はそれよりも大きい、あるいは
、ビットストリーム中に実際に現れる最長の暗語の長さと等しいか又はそれより
も大きいものである。 - 【請求項9】 符号化されたビットストリームを得るためにオーディオ信号を
符号化する方法であり、以下のステップを含む、 (a)オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
散時間型サンプルを周波数領域に変換する、 (b)そのスペクトル値を隣り合うスペクトル部分に、各スペクトル部分が少
なくとも一つのスペクトル値を有するように、グループ分けする、 (c)予め決められた数のコード表から、少なくとも二つのコード表を二つの
異なるスペクトル部分に与え、この際、そのスペクトル部分のスペクトル値の符
号化に最も適するコード表を与える、 (d)スペクトル部分のスペクトル値を、そのスペクトル部分に与えられたコ
ード表を用いて符号化し、各スペクトル値に与えられる暗語の長さは、概して、
スペクトル値が発生する可能性が高ければ高いほど短いものである。 (e)符号化されたビットストリームのためのラスターを、そのラスターが少
なくとも二つのラスターポイントグループ(10,12,14と14,16,1
8)を有し、各グループのラスターポイントは互いに等距離に位置し、各グルー
プのラスターポイント間距離(D1又はD2)は、前記少なくとも二つの異なる
コード表のうちの適当なコード表に基づくように、規定する、 (f)他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す優先
暗語をラスター内に、各コード表の各優先暗語の始まりがそれに相当するラスタ
ーポイントグループのラスターポイント(10,12,14又は14,16,1
8)と一致するように、配置する。 - 【請求項10】 請求項9記載の方法であり、前記ステップ(f)の前に以下
のステップを含む、 インディケータが優先権を示すとき、暗語を優先暗語として定義する、該イン
ディケータはその暗語が引き出されるコード表に基づくものである。 - 【請求項11】 請求項10記載の方法であり、前記インディケータは、それ
が基づくコード表が全てのコード表のうちの最も高い絶対値を有している場合、
最高の優先権を示す。 - 【請求項12】 請求項9、請求項10又は請求項11記載の方法であり、複
数のコード表が使用され、各表にインディケータが存在し、そのインディケータ
はそれぞれの表の最も高い絶対値より決定され、より大きな最大絶対値を有する
表のインディケータは、より小さい最大絶対値を有する表のインディケータがす
るよりも、その表からの暗語に対してより高い優先権を示す。 - 【請求項13】 請求項9、請求項10、請求項11又は請求項12記載の方
法であり、各ラスターポイントグループのラスターポイント間距離(D1,D2
)は、相当するコード表の最長暗語の長さよりも、小さいか、それに等しいか又
はそれよりも大きい。 - 【請求項14】 請求項9、請求項10、請求項11又は請求項12記載の方
法であり、各ラスターポイントグループのラスターポイント間距離(D1,D2
)は、相当するスペクトル部分のスペクトル値のための実際の最長暗語の長さに
等しく、 スペクトル部分の実際の最長暗語の長さはビットストリームにサイド情報とし
て送信される。 - 【請求項15】 請求項9、請求項10、請求項11又は請求項12記載の方
法であり、各ラスターポイントグループのラスターポイント間距離は、グループ
分けされた全てのスペクトル部分の実際の最長暗語とこのグループのコード表の
最長暗語のうちの最小値に等しく、実際の最長暗語はデコーダにサイド情報とし
て送信される。 - 【請求項16】 請求項1、請求項2、請求項3、請求項4、請求項5、請求
項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、
請求項13、請求項14又は請求項15記載の方法であり、優先暗語及び非優先
暗語の両方に関して、暗語の周波数に関して実質的に直線的な配列を保持して、
ビットストリームのラスターへ配列する。 - 【請求項17】 請求項1、請求項2、請求項3、請求項4、請求項5、請求
項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、
請求項13、請求項14又は請求項15記載の方法であり、符号化されたスペク
トル値を表す暗語は、相当するスペクトル値の周波数とは関係なく、ビットスト
リームのラスターに配列される。 - 【請求項18】 請求項17記載の方法であり、周波数とは無関係の分布が予
め決定されていない場合、周波数と暗語の間の相応関係に関する情報がサイド情
報としてビットストリーム中に挿入される。 - 【請求項19】 請求項1、請求項2、請求項3、請求項4、請求項5、請求
項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、
請求項13、請求項14又は請求項15、請求項16、請求項17又は請求項1
8記載の方法であり、優先暗語のうちのn番目ごとの暗語だけがビットストリー
ムのラスターに配列され、残りの優先暗語及び非優先暗語はラスターポイントに
配置されない。 - 【請求項20】 請求項1、請求項2、請求項3、請求項4、請求項5、請求
項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、
請求項13、請求項14又は請求項15、請求項16、請求項17、請求項18
又は請求項19記載の方法であり、スペクトル値は、符号化に先立ち、心理音響
モデルを考慮して量子化される。 - 【請求項21】 符号化されたビットストリームを得るためにオーディオ信号
を符号化するための装置、以下のものを含む、 (a)オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
散時間型サンプルを周波数領域に変換するユニット、 (b)暗語で符号化されたスペクトル値を得るために、異なる長さを有する限
られた数の暗語を含むコード表を用いてスペクトル値を符号化するユニット、各
スペクトル値に与えられる各暗語の長さは、概して、スペクトル値が発生する可
能性が高ければ高いほど短いものである、 (c)符号化されたビットストリームのためにラスターを決定するユニット、
このラスターにおいては、等距離のラスターポイント(10,12,14)があ
り、ラスターポイント間の距離(D1)はそのコード表によるものである、 (d)他のスペクトル値に比べて心理音響的に重要な特別なスペクトル値を表
す優先暗語を、各優先暗語の始まりがラスターポイントと一致するように、ラス
ターに配置するユニット。 - 【請求項22】 符号化されたビットストリームを得るためにオーディオ信号
を符号化するための装置、以下のものを含む、 (a)オーディオ信号を表すスペクトル値を得るために、オーディオ信号の離
散時間型サンプルを周波数領域に変換するユニット、 (b)そのスペクトル値を隣り合うスペクトル部分に、各スペクトル部分が少
なくとも一つのスペクトル値を有するように、グループ分けするユニット、 (c)予め決められた数のコード表から、少なくとも二つのコード表を二つの
異なるスペクトル部分に与えるユニット、そのスペクトル部分のスペクトル値の
符号化に最も適するコード表を与える、 (d)スペクトル部分のスペクトル値を、そのスペクトル部分に与えられたコ
ード表を用いて符号化するユニット、各スペクトル値に与えられる暗語の長さは
、概して、スペクトル値が発生する可能性が高ければ高いほど短いものである、 (e)符号化されたビットストリームのためのラスターを、そのラスターが少
なくとも二つのラスターポイントグループ(10,12,14と14,16,1
8)を有し、各グループのラスターポイントは互いに等距離に位置し、各グルー
プのラスターポイント間距離(D1又はD2)は、前記少なくとも二つの異なる
コード表のうちの適当なコード表に基づくように、規定するユニット、 (f)他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す優先
暗語をラスター内に、各コード表の各優先暗語の始まりがそれに相当するラスタ
ーポイントグループのラスターポイント(10,12,14又は14,16,1
8)と一致するように、配置するユニット。 - 【請求項23】 符号化されたオーディオ信号を表すビットストリームを復号
化する方法であり、この符号化されたビットストリームは一のコード表から引き
出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10
,12,14)を持つラスターを有しており、暗語は、他の暗語に比べて心理音
響的に重要な特別なスペクトル値を表す優先暗語を含み、優先暗語はラスターポ
イントによって配列されている、該方法は以下のステップを含む、 (a)二つの隣り合うラスターポイントの距離(D1)を検知する、 (b)ビットストリーム中に、始まりがラスターポイントと一致するように、
ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
配列になるように再分類する、 (c)復号化されたスペクトル値を得るために、関連するコード表を用いて優
先暗語を復号化する、 (d)復号化されたオーディオ信号を得るために、復号化されたスペクトル値
を時間領域に戻すように変換する。 - 【請求項24】 符号化されたオーディオ信号を表すビットストリームを復号
化する方法であり、この符号化されたビットストリームは少なくとも二つのコー
ド表から引き出された互いに長さの異なる暗語を含み、少なくとも二つの、等距
離で並ぶラスターポイントのグループ(10,12,14と14,16,18)
を持つラスターを有し、暗語は、他の暗語に比べて心理音響的に重要な特別なス
ペクトル値を表す優先暗語を含み、優先暗語はラスターポイントによって配列さ
れている、該方法は以下のステップを含む、 (a)二つの隣り合うラスターポイントの距離(D1,D2)を検知する、 (b)ビットストリーム中に、始まりがラスターポイントと一致するように、
ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
配列になるように再分類する、 (c)一のスペクトル部分に関連するコード表を認識する、 (d)復号化されたオーディオ信号を得るために、一のスペクトル部分の優先
暗語をそれに関連するコード表を用いて復号化する、 (e)復号化されたオーディオ信号を得るために、復号化されたスペクトル値
を時間領域に戻すように変換する。 - 【請求項25】 符号化されたオーディオ信号を表すビットストリームを復号
化する装置であり、この符号化されたビットストリームは一のコード表から引き
出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10
,12,14)を持つラスターを有しており、暗語は、他の暗語に比べて心理音
響的に重要な特別なスペクトル値を表す優先暗語を含み、優先暗語はラスターポ
イントによって配列されている、該装置は以下のものを含む、 (a)二つの隣り合うラスターポイントの距離(D1)を検知するユニット、 (b)ビットストリーム中に、始まりがラスターポイントと一致するように、
ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
配列になるように再分類するユニット、 (c)復号化されたスペクトル値を得るために、関連するコード表を用いて優
先暗語を復号化するユニット、 (d)復号化されたオーディオ信号を得るために、復号化されたスペクトル値
を時間領域に戻すように変換するユニット。 - 【請求項26】 符号化されたオーディオ信号を表すビットストリームを復号
化する装置であり、この符号化されたビットストリームは少なくとも二つのコー
ド表から引き出された互いに長さの異なる暗語を含み、少なくとも二つの、等距
離で並ぶラスターポイントのグループ(10,12,14と14,16,18)
を持つラスターを有し、暗語は、他の暗語に比べて心理音響的に重要な特別なス
ペクトル値を表す優先暗語を含み、優先暗語はラスターポイントによって配列さ
れている、該装置は以下のものを含む、 (a)二つの隣り合うラスターポイントの距離(D1,D2)を検知するユニ
ット、 (b)ビットストリーム中に、始まりがラスターポイントと一致するように、
ラスターポイントによって配列されている優先暗語を、周波数に関して直線的な
配列になるように再分類するユニット、 (c)一のスペクトル部分に関連するコード表を認識するユニット、 (d)復号化されたオーディオ信号を得るために、一のスペクトル部分の優先
暗語をそれに関連するコード表を用いて復号化するユニット、 (e)復号化されたオーディオ信号を得るために、復号化されたスペクトル値
を時間領域に戻すように変換するユニット。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP1998/008475 WO2000039933A1 (de) | 1997-10-24 | 1998-12-28 | Verfahren und vorrichtungen zum codieren bzw. decodieren eines audiosignals bzw. eines bitstroms |
Related Child Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004099419A Division JP3978194B2 (ja) | 1997-10-24 | 2004-03-30 | オーディオ信号又はビットストリームの復号化のための装置及び方法 |
JP2004099418A Division JP3902642B2 (ja) | 1997-10-24 | 2004-03-30 | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 |
JP2004099417A Division JP4168000B2 (ja) | 1997-10-24 | 2004-03-30 | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002534702A true JP2002534702A (ja) | 2002-10-15 |
JP3580777B2 JP3580777B2 (ja) | 2004-10-27 |
Family
ID=8167173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000591732A Expired - Lifetime JP3580777B2 (ja) | 1998-12-28 | 1998-12-28 | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6975254B1 (ja) |
JP (1) | JP3580777B2 (ja) |
KR (1) | KR100391935B1 (ja) |
AU (1) | AU754877B2 (ja) |
CA (1) | CA2356869C (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009514032A (ja) * | 2005-10-26 | 2009-04-02 | クゥアルコム・インコーポレイテッド | オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術 |
JP2013543146A (ja) * | 2010-10-07 | 2013-11-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ビットストリーム・ドメインにおけるコード化オーディオフレームのレベルを推定する装置及び方法 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19907728C2 (de) | 1999-02-23 | 2001-03-01 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms |
DE19907729C2 (de) | 1999-02-23 | 2001-02-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines Datenstroms aus Codeworten variabler Länge und Verfahren und Vorrichtung zum Lesen eines Datenstroms aus Codeworten variabler Länge |
JP3469567B2 (ja) * | 2001-09-03 | 2003-11-25 | 三菱電機株式会社 | 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法 |
US7428684B2 (en) * | 2002-04-29 | 2008-09-23 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Device and method for concealing an error |
US7724827B2 (en) | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US20060218459A1 (en) * | 2004-08-13 | 2006-09-28 | David Hedberg | Coding systems and methods |
US7698623B2 (en) * | 2004-08-13 | 2010-04-13 | David Hedberg | Systems and methods for decreasing latency in a digital transmission system |
US8599925B2 (en) | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7199735B1 (en) * | 2005-08-25 | 2007-04-03 | Mobilygen Corporation | Method and apparatus for entropy coding |
JP4548348B2 (ja) * | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
CN101290771B (zh) * | 2007-04-20 | 2011-07-13 | 中兴通讯股份有限公司 | 一种基于先进音频编码器的比特消耗控制方法 |
CA2689876C (en) * | 2007-06-01 | 2012-12-04 | Research In Motion Limited | Determination of compression state information for use in interactive compression |
US7774205B2 (en) | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
GB2454190A (en) * | 2007-10-30 | 2009-05-06 | Cambridge Silicon Radio Ltd | Minimising a cost function in encoding data using spectral partitioning |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
SG11201505911SA (en) | 2013-01-29 | 2015-08-28 | Fraunhofer Ges Forschung | Low-frequency emphasis for lpc-based coding in frequency domain |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN109903776B (zh) | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CA2982017A1 (en) * | 2015-04-10 | 2016-10-13 | Thomson Licensing | Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation |
CN117316168A (zh) * | 2016-04-12 | 2023-12-29 | 弗劳恩霍夫应用研究促进协会 | 用于对音频信号进行编码的音频编码器以及方法 |
US10699725B2 (en) | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
US10756755B2 (en) | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
US10770088B2 (en) | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
EP3455854B1 (en) * | 2016-05-10 | 2020-09-16 | Immersion Services LLC | Adaptive audio codec method and apparatus |
US10885921B2 (en) * | 2017-07-07 | 2021-01-05 | Qualcomm Incorporated | Multi-stream audio coding |
EP3738074A4 (en) | 2018-01-08 | 2021-10-13 | Immersion Networks, Inc. | PROCESSES AND APPARATUS FOR THE PRODUCTION OF REGULAR REPRESENTATIONS OF A MOVEMENT OF ENTRY IN TIME AND SPACE |
WO2020164751A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment |
WO2020165265A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment |
US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3736898A (en) * | 1970-11-18 | 1973-06-05 | Mitsui Shipbuilding Eng | Device for controlling list and level of pontoon |
US4270025A (en) * | 1979-04-09 | 1981-05-26 | The United States Of America As Represented By The Secretary Of The Navy | Sampled speech compression system |
CA1211219A (en) * | 1982-06-30 | 1986-09-09 | Hideo Kuroda | Digital data code conversion circuit for variable- word-length data code |
EP0235566B1 (en) * | 1986-01-27 | 1993-09-08 | Fuji Photo Film Co., Ltd. | Method of image signal encoding by orthogonal transformation |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US4815134A (en) * | 1987-09-08 | 1989-03-21 | Texas Instruments Incorporated | Very low rate speech encoder and decoder |
US4813056A (en) * | 1987-12-08 | 1989-03-14 | General Electric Company | Modified statistical coding of digital signals |
US4942467A (en) * | 1988-12-05 | 1990-07-17 | General Electric Company | Predictor controlled encoder for digital transmission systems |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
JP2766302B2 (ja) * | 1989-04-06 | 1998-06-18 | 株式会社東芝 | 可変長符号並列解読方法および装置 |
US5146577A (en) * | 1989-04-10 | 1992-09-08 | Motorola, Inc. | Serial data circuit with randomly-accessed registers of different bit length |
DE3943880B4 (de) | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
JPH04221465A (ja) | 1990-12-21 | 1992-08-11 | Matsushita Electric Ind Co Ltd | 記録装置 |
KR940010433B1 (ko) * | 1992-06-09 | 1994-10-22 | 대우전자 주식회사 | 가변길이 코드 디코딩장치 |
JPH06164409A (ja) * | 1992-11-17 | 1994-06-10 | Matsushita Electric Ind Co Ltd | 帯域分割符号化方法 |
JP3446240B2 (ja) | 1993-03-31 | 2003-09-16 | ソニー株式会社 | 符号化方法および符号化装置 |
US5563593A (en) * | 1994-03-18 | 1996-10-08 | Lucent Technologies Inc. | Video coding with optimized low complexity variable length codes |
TW271524B (ja) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
JP3274284B2 (ja) * | 1994-08-08 | 2002-04-15 | キヤノン株式会社 | 符号化装置およびその方法 |
KR960020018A (ko) * | 1994-11-17 | 1996-06-17 | 배순훈 | 가변길이복호화장치 |
KR100209877B1 (ko) * | 1994-11-26 | 1999-07-15 | 윤종용 | 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치 |
JP3732867B2 (ja) * | 1995-03-09 | 2006-01-11 | 株式会社ルネサステクノロジ | 画像伸張装置 |
KR100207385B1 (ko) * | 1995-08-31 | 1999-07-15 | 전주범 | 가변 길이 복호화 장치 |
US5663726A (en) * | 1995-12-01 | 1997-09-02 | U.S. Philips Corporation | High speed variable-length decoder arrangement with reduced memory requirements for tag stream buffering |
US5835035A (en) * | 1995-12-28 | 1998-11-10 | Philips Electronics North America Corporation | High performance variable length decoder with two-word bit stream segmentation and related method |
US5650905A (en) * | 1995-12-28 | 1997-07-22 | Philips Electronics North America Corporation | Variable length decoder with adaptive acceleration in processing of Huffman encoded bit streams |
CA2249792C (en) * | 1997-10-03 | 2009-04-07 | Matsushita Electric Industrial Co. Ltd. | Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus |
DE19747132C2 (de) * | 1997-10-24 | 2002-11-28 | Fraunhofer Ges Forschung | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms |
US6006179A (en) * | 1997-10-28 | 1999-12-21 | America Online, Inc. | Audio codec using adaptive sparse vector quantization with subband vector classification |
US6690307B2 (en) * | 2002-01-22 | 2004-02-10 | Nokia Corporation | Adaptive variable length coding of digital video |
-
1998
- 1998-12-28 KR KR10-2001-7008203A patent/KR100391935B1/ko active IP Right Grant
- 1998-12-28 CA CA002356869A patent/CA2356869C/en not_active Expired - Lifetime
- 1998-12-28 US US09/869,401 patent/US6975254B1/en not_active Expired - Lifetime
- 1998-12-28 JP JP2000591732A patent/JP3580777B2/ja not_active Expired - Lifetime
- 1998-12-28 AU AU21636/99A patent/AU754877B2/en not_active Expired
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009514032A (ja) * | 2005-10-26 | 2009-04-02 | クゥアルコム・インコーポレイテッド | オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術 |
US8620644B2 (en) | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
JP2013543146A (ja) * | 2010-10-07 | 2013-11-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ビットストリーム・ドメインにおけるコード化オーディオフレームのレベルを推定する装置及び方法 |
RU2553084C2 (ru) * | 2010-10-07 | 2015-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для оценки уровня кодированных аудио кадров в области битового потока |
US11238873B2 (en) | 2010-10-07 | 2022-02-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for codebook level estimation of coded audio frames in a bit stream domain to determine a codebook from a plurality of codebooks |
Also Published As
Publication number | Publication date |
---|---|
AU754877B2 (en) | 2002-11-28 |
AU2163699A (en) | 2000-07-31 |
JP3580777B2 (ja) | 2004-10-27 |
CA2356869A1 (en) | 2000-07-06 |
CA2356869C (en) | 2004-11-02 |
KR100391935B1 (ko) | 2003-07-16 |
US6975254B1 (en) | 2005-12-13 |
KR20010108051A (ko) | 2001-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3580777B2 (ja) | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 | |
US6807528B1 (en) | Adding data to a compressed data frame | |
EP2267698B1 (en) | Entropy coding by adapting coding between level and run-length/level modes. | |
US7526432B2 (en) | Apparatus and method for producing a data stream and apparatus and method for reading a data stream | |
JP4242516B2 (ja) | サブバンド符号化方式 | |
KR20070110311A (ko) | 데이터의 중요도에 따라 변형된 데이터 스트림을 생성하는장치 및 그 데이터 스트림을 해석하는 장치 | |
CA2889942C (en) | Speech audio encoding device, speech audio decoding device, speech audio encoding method, and speech audio decoding method | |
JP3353868B2 (ja) | 音響信号変換符号化方法および復号化方法 | |
JP3978194B2 (ja) | オーディオ信号又はビットストリームの復号化のための装置及び方法 | |
US7657336B2 (en) | Reduction of memory requirements by de-interleaving audio samples with two buffers | |
KR100685974B1 (ko) | 워터마크 삽입/검출을 위한 장치 및 방법 | |
JP3523845B2 (ja) | 可変長のコードワードのデータストリーム生成方法及び装置並びに可変長のコードワードのデータストリーム読出方法及び装置 | |
ES2329466T3 (es) | Procedimientos y dispositivos para codificar o decodificar una señal de audio o un flujo de bits. | |
KR101644883B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
JP2001242893A (ja) | 帯域分割音声圧縮符号化方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20031222 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040318 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040713 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040720 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080730 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090730 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100730 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100730 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110730 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110730 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130730 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |