JP2023175750A

JP2023175750A - オーディオ送信プロセッサ、オーディオ受信プロセッサ、および関連方法ならびにコンピュータプログラム

Info

Publication number: JP2023175750A
Application number: JP2023145005A
Authority: JP
Inventors: エイドリアントマセク; Tomasek Adrian; ラルフスペルシュナイダー; Sperschneider Ralph; ヤンビューテ; Buethe Jan; アレクサンダーチェカリンスキー; Tschekalinskij Alexander; マンフレッドルツキー; Lutzky Manfred
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2019-02-13
Filing date: 2023-09-07
Publication date: 2023-12-12
Also published as: ZA202105720B; TW202044777A; AU2020221993B2; AU2020221602A1; TWI785309B; TW202101426A; SG11202108672XA; KR20210125534A; US20210375295A1; CN113491079A; KR20230147747A; BR112021015532A2; KR20230098370A; AU2020220383C1; ZA202105722B; EP4109444A1; US20220014310A1; WO2020164752A1; MX2021009729A; KR20210118948A

Abstract

【課題】符号化済みオーディオデータを使用してエラー保護済みフレームを効率的に生成するオーディオ送信器プロセッサ、方法及びプログラムを提供する。【解決手段】オーディオ送信器プロセッサにおいて、オーディオフレームのための符号化済みオーディオデータは、第１、第２の量の情報ユニットを含み、既定の合計数の符号語について基準位置を定義する符号語ラスタを有する符号語フレームを構築するために、前記符号語の第１の既定のサブセットの基準位置から始まる第１の量の情報ユニットを書き込み、前記符号語の第２の既定のサブセットの基準位置から始まる第２の量の情報ユニットを書き込み、第２の量の情報ユニットの始まりが符号語境界と一致するように、第１の量の情報ユニットと第２の量の情報ユニットとの間の境界を決定するフレームビルダー５０６と、誤り保護済みのフレームを表す複数の処理済み符号語を得るエラー保護コーダ５０８と、を含む。【選択図】図１３

Description

本願発明は、オーディオ処理、とりわけ、ワイヤレスチャンネル等、エラーを起こしやすい送信チャンネルの文脈において有用なオーディオ処理の応用に関する。

米国特許第５８５２４６９号は、動画符号化および／または復号化システムと、可変長符号化および／または復号化システムとを開示している。符号化装置は、符号化装置が供給したコードストリームを複数の符号列に分割する分割手段と、複数の符号列のうちの少なくとも１つを頭から終わりへの順方向に、そして他の符号列のうちの少なくとも１つを終わりから頭への逆方向に整列させるための並べ替え手段とを備える。可変長符号化システムは、複数の符号語を格納し、符号語がソースシンボルに対応するようにするための符号語テーブルを含む。また、符号化装置は、符号語テーブルから入力されたソースシンボルに相当する符号語を選択し、選択した符号語を符号化済みデータとして出力する。複数の符号語が、順方向または逆方向のいずれかで復号化することができる。複数の符号語は、コード間の休止を符号語の既定の重み、バイナリコードの場合には符号語内の数字「１」または「０」によって検出することができるように構成されている。

欧州特許第１１５５４９８号は、多数のラスタポイントを基準点として含むデータストリームを生成または読み込むための概念を開示しており、第１のセットの符号語のそれぞれの少なくとも一部がセグメントのラスタポイントから始まる第１の書き込み方向で書かれており、第２のセットの符号語のうちの符号語の少なくとも一部が、セグメントの第２ラスタポイントから始まる、第１の書き込み方向とは逆の第２の書き込み方向で、データストリームに書き込まれている。第２のセットの符号語がセグメントにフィットしない、または完全にはフィットしない場合、割り当てられたセグメントにフィットしないこの符号語の少なくとも一部またはこの符号語の剰余部分の一部は、既定のルールに従って、別の完全に満杯にはなっていないセグメントに書き込まれる。

この処理手順により、エラー伝播は確実に２つのラスタポイント間の空間に限定されることになる。

MPEG-4 Part 3 Audio[1]は、心理音響的な関連性がオーディオフレームにわたって線形に減少する、ビットスライス算術符号化を使用するＢＳＡＣを定義する。

MPEG-4 Part 3 Audio[1]は、ＡＡＣのビットストリームペイロードについてのエラー感度カテゴリーを定義する（[1]の表４．９４）

次いで、関連データが対応するエラー感度クラスのインスタンスに記憶され、ＥＲＡＡＣペイロードが形成される。これは後に、前方誤り訂正または検出手段を使用し個別に保護されることがある。データ要素のカテゴリーへの固定割り当てが明記される。エントロピー符号化により、これが可変長のクラスへとつながる。これらの長さは、ＥＲＡＡＣペイロードを復号化できるようにするために送信する必要があるが、これによって追加のオーバーヘッドが生じる。

DRM[2]は、ＡＡＣのビットストリームペイロードのための不均等なエラー保護を可能にするためのスーパーフレームを定義する（ａａｃ＿ｓｕｐｅｒ＿ｆｒａｍｅ）。スーパーフレームは既定の数（５個または１０個）のＡＡＣフレームから成る。心理音響的により重要性の高いＡＡＣフレームのビットはビットストリームペイロードの冒頭で得られると想定されている。したがって、最初のＮ個のビット（例えば２００個のビット）は各フレームからカットされ、スーパーフレームの冒頭に連続的に記憶される。これらのビットは次いでＣＲＣによって保護される。これらのフレームの残りのビットはその後、保護なしで記憶される。常に固定量のデータが高感度であるとして処理されるため、保護されたペイロードを復号化するために長さの情報が送信される必要はない（もちろん、スーパーフレームの個々のフレームの長さの情報は必要だが、現在の考察の範囲には含まれない）。

MPEG-4 Part 3 Audioに記載されるＢＳＡＣによって生成されるフレームは、心理音響的関連性によって既にソートされて、もたらされる。最も重要性の高いビットから始まり、最も重要性の低いビットで終わる。これは、スペクトル線の全てのビットの算術符号化／復号化のための計算の複雑性がより高いことによるコストによるものである。

MPEG-4 Part 3に記載の通り、ＡＡＣのアプローチの性質上、種々のエラー感度カテゴリーのインスタンスは可変長である。これは畳み込み符号にとっては問題とはならないが、固定量のデータの保護が必要となるブロックコードには不適切である。

ＤＲＭのアプローチは、ビットストリームペイロードが既に個々のビットの心理音響的重要性に基づいて並べられている場合にしか機能しない。

本願発明は、エラー保護済みフレームを生成するため、または受信したエラー保護済みフレームを処理するための、より良好且つ効率的な概念を提供することを目的とする。

この目的は、請求項１に記載のオーディオ送信プロセッサ、請求項２３に記載のオーディオ受信プロセッサ、請求項４４に記載のオーディオ送信処理方法、請求項４５に記載のオーディオ受信処理方法、または請求項４６に記載のコンピュータプログラムによって達成される。

エラー保護済みフレームを生成するためのオーディオ送信プロセッサは、オーディオフレームに対応する符号化済みオーディオデータを使用し、この符号化済みオーディオデータはビットやバイト等第１の量の情報ユニットと第２の量の情報ユニットを含む。フレームビルダーが既定の総量の符号語について基準位置を定める符号語ラスタを有するフレームを構築し、フレームビルダーは、第１の量の情報ユニットの情報ユニットを符号語の第１の既定のサブセットの基準位置から書き込み、第２の量の情報ユニットの情報ユニットを符号語の第２の既定のサブセットの基準位置から書き込むように構成され、フレームビルダーは、第２の量の情報ユニットの最初の情報ユニットが符号語の境界と一致するように、第１の量の情報ユニットと第２の量の情報ユニットとの間に境界を定める。オーディオ送信プロセッサは、既定の総量の符号語を個別に処理してエラー保護済みフレームを表す複数の処理済み符号語を得るため、および／または１つ以上の第１の既定のサブセットの符号語を処理して第１の処理結果を得る、および／または１つ以上の第２の既定のサブセットの符号語を処理して第２の処理結果を得て、既定の数の符号語に第１の処理結果または第２の処理結果を加算して複数の処理済み符号語を得るためのエラー保護コーダを備える。

受信側では、受信したエラー保護済みフレームを処理するためのオーディオ受信プロセッサは、エラー保護済みフレームを受信するための受信インターフェースを備える。オーディオ受信プロセッサは、エラー保護済みフレームを処理して符号化済みオーディオフレームを得るためのエラー保護プロセッサを備える。とりわけ、エラー保護プロセッサは、符号化済みオーディオフレームの符号語の第１の既定のサブセットがエラーを含んでいるかをチェックするように構成される。オーディオ受信プロセッサは、符号語の第１の既定のサブセットにエラーが検出された場合に（完全）フレーム損失隠蔽動作を実行する、または離れた場所でフレーム損失隠蔽動作の実行を指示するエラー隠蔽指示を生成・送信するように構成される、エラー隠蔽装置またはエラー隠蔽指示装置を備える。

符号語の第１の既定のサブセットと符号語の第２の既定のサブセットとを別個に処理すること、および受信側で符号語の第１の既定のサブセットに関する情報を使用することで、エラー保護済みフレームの生成に関する極めて効率的な処理およびエラーチェックに関する処理が得られる。第１のセットの符号語の既定のサブセットは予め定められており、ひいては、フレーム毎の信号伝達ビット等特定の追加の信号伝達なしでもデコーダにとって既知だからである。これは必須ではない。むしろ、エンコーダは第１の量の情報ユニットを書き込むのに第１の符号語の既定のサブセットを使用し、且つ受信またはオーディオ受信プロセッサはこの事前定義に依拠しているため、効率的なエラー保護と効率的なエラーチェックが利用可能となる。

好ましくは、受信側でのエラー保護処理は、符号語の第１のサブセットのうちの２つ以上についてのハッシュ値等の処理結果の個別の算出を許容するが、第２のセットからの符号語については一切なく、また同時に、ハッシュ値の確認のためにはすべての符号語ではなく所定の量の符号語のみを使用しなければならないため、符号語の第２の既定のサブセットの符号語のみからで第１のセットの符号語を含まないハッシュ値の計算によって、復号側で効率的なエラーチェック処理が可能になる。受信の処理の極めて初期において、重大なエラーがフレーム内で生じて最終的には完全フレーム損失隠蔽動作が必要になるのか、あるいは送信エラーの影響を受けたのは比較的重要性の低いオーディオデータだけでこの種のエラーに対処するために必要なのは品質がはるかに高い部分的フレーム損失隠蔽動作のみであるのか、または隠蔽動作が一切必要なくなったのかを決定することができる。

本願発明がオーディオ符号化とエラー保護処理との間に具体的なフレーム構築動作を介した架け橋を形成することにより、第１の量のデータを有する符号語の第１の既定のサブセットと第２の量のデータを有する符号語の第２の既定のサブセットについて別個にエラー保護処理を行うことによって、デコーダ側に対して極めて有効で極めて高品質且つ高性能なエラー処理手順を適用することができる。好ましくは、第１の量のデータは心理音響的により重要性の高いデータである、あるいはサイド情報および任意のＴＮＳデータおよび低スペクトル値の最上位または最下位ビットである一方、第２の量のデータは典型的に、心理音響的視点からはオーディオ知覚にとってはそれほど決定的でない、より高い周波数の最上位ビットおよび最下位ビットを含む。典型的に第２の量の情報ユニットに含まれるさらなる情報ユニットは、算術エンコーダによるビット消費が利用可能なビット予算を全て消費していない限り生成される、剰余データである。

とりわけ、第１の量の情報ユニットと第２の量の情報ユニットを、第１の量の情報ユニットと第２の量の情報ユニットとの境界が符号語境界に配置されている第１および第２の既定のサブセットに書き込むことで、より重要性の高い符号語、すなわち符号語の第２の既定のサブセット等のより重要性の低い符号語と比較して符号語の第１の既定のサブセットとの間での明確な分離が確実に得られることになる。オーディオコーダが適用する符号化動作が、最終的に、例えば符号化動作を制御し追加の残余ビットを算出することで固定フレームラスタに適合されたフレームのためのオーディオデータが可変長という結果をもたらす信号依存符号化動作であるシナリオにおいては、第１の量の情報ユニットと第２の量の情報ユニットの間の境界はフレーム毎に動的に変化する。それでも、低周波データ等心理音響的により重要性の高いデータは第１の既定のサブセットに含められ、従って送信側では符号語の第１の既定のサブセットをチェックするだけで完全フレーム損失隠蔽が実行される一方で、受信側では符号語の第１の既定のサブセットが一切のエラーなしで受信されたと判定された後でないと符号語の第２の既定のサブセットのチェック等のさらなる処理が実行されないという状況になる。したがって、符号語の第１の既定のサブセットにエラーがあれば、以前のフレームの反復または先行するフレームの修正反復あるいはそれに類するもの等の完全フレーム損失隠蔽動作が、受信したエラーのあるフレームをさらに処理するためにそれ以上のリソースを費やすことなく、実行される。

受信プロセッサは、符号語の第１の既定のサブセットおよび符号語の第２の既定のサブセットを識別する既定のフレーム読み込み手順に従って符号化済みオーディオフレームを読み取るためのフレームリーダーを備える。エンコーダ側のフレームビルダーによって適用されたオーディオデータ処理の順番は、実行しない／並び変えられることができる、あるいは、直接読み込み手順のためにデコーダに既知となって、第１の既定のサブセットについて無エラー状態が検出された場合には少なくとも第１の既定のサブセットについて、そして第２の既定のサブセットについても無エラー状態が判定された場合には第２の既定のサブセットについても、受信したフレームを構文解析できるようにすることができる。

フレームリーダーは典型的に、符号語の第１の既定のサブセットが無エラーの状態であることが判定された後にしか作動させないようにしなければならない。エラー保護プロセッサは、エラー保護プロセッサが出力したデータフレームにおける符号語の第１の既定のサブセットの位置を知らなければならないが、エラーチェックの目的においては、符号語が表す対応する位置において任意のデータがどの方向に書き込まれたかを知る必要はない。

好ましくは、心理音響的により重要性の低いデータはフレームの左側の境界またはフレームの右側の境界、またはフレーム内の既定数の符号語／基準位置でありうる、フレーム内の特定の位置に配置される。心理音響的により重要性の高いデータと心理音響的により重要性の低いデータを分離することが望ましい、あるいは心理音響的により重要性の高いデータと心理音響的により重要性の低いデータをオーディオフレーム内で並べ替えることが要求される。

並べ替えは例えば、符号化済みオーディオデータのフレームが未だ所定のエラー保護プロセッサと協働するようにカスタマイズされていない既定の標準化済みオーディオデコーダによって生成されている場合に、データを所定のエラー保護・検出スキームに並べるときに必要となる。この並べ替えにより、心理音響的により重要性の高いデータと心理音響的により重要性の低いデータの利用可能性に応じて、個々のフレーム損失隠蔽処理手順が可能になる。

本願発明の好ましい実施態様を、添付の図面に関連して、下記に論じる。

図１は、元のＬＣ３ビットストリームペイロードの例を図示したものである。図２は、図１に表されるＬＣ３ビットストリームペイロードの例の心理音響的関連性に基づくビット分布を図示したものである。図３は、ＬＣ３ビットストリームペイロードを並べ替えたものの例を図示している。図４は、バイト粒度に作用する算術エンコーダ／デコーダによりＬＣ３ビットストリームペイロードを並べ替えた別の例を図示している。図５は、オーディオ送信プロセッサの好ましい実施態様を図示したものである。図６は、フレーム構築を実施するための手順を図示したものである。図７は、図５のフレームビルダーが実行する好ましい手順を図示したものである。図８は、フレームビルダーの好ましい手順を示したものである。図９ａは、符号語の第１の既定のサブセットと符号語の第２の既定のサブセットの、図５のフレームビルダーが構築したフレーム内での位置の略図を図示したものである。図９ｂは、符号語の第１の既定のサブセットと符号語の第２の既定のサブセットの、図５のフレームビルダーが構築したフレーム内での位置の略図を図示したものである。図９ｃは、符号語の第１の既定のサブセットと符号語の第２の既定のサブセットの、図５のフレームビルダーが構築したフレーム内での位置の略図を図示したものである。図１０は、フレームビルダーによるフレームの直接書き込みの好ましい実施態様を図示したものである。図１１は、図５のフレームビルダーの並べ替え処理手順の好ましい実施態様を図示したものである。図１２は、図５のエラー保護コーダの好ましい実施態様を図示したものである。図１３は、本願発明に係るオーディオ受信プロセッサの好ましい実施態様を図示したものである。図１４は、エラー保護プロセッサおよびエラー隠蔽器の好ましい手順を図示したものである。図１５は、エラー保護プロセッサおよびエラー隠蔽器の別の好ましい実施態様を図示したものである。図１６は、部分的フレーム損失隠蔽の隠蔽スペクトル範囲の略図を図示したものである。図１７は、部分的フレーム損失隠蔽の別の実施態様を図示したものである。図１８は、図１３のフレームリーダーの好ましい実施態様を図示したものである。図１９は、標準化オーディオデコーダ等特定の基準によって要求されるフレームフォーマットへの受信したデータの並べ替えを実行するためのフレームリーダーの好ましい実施態様を図示したものである。図２０は、フレームリーダーがエラー保護済みフレームのオーディオデータの直接読み込みのために行う好ましい手順を図示したものである。図２１は、図５のオーディオエンコーダの好ましい実施態様を図示したものである。図２２は、図１３のオーディオデコーダの好ましい実施態様を図示したものである。

次に、所定の文脈における本願発明の好ましい実施態様について論じる。

ビットは符号化プロセス中に、心理音響的関連性に基づいて経時的に、しかし非空間的に書き込まれる。最も重要性の高いデータが最初に書き込まれ、最も重要性の低いデータが最後に書き込まれる。しかしながら、「通常の」オーディオフレーム内の心理音響的により重要性の低いビットの位置は、基調となる符号化済みデータに依存して、フレーム毎に変動することがある。これは例えば、一方からは算術的に符号化されたデータが書き込まれ、反対側から別の方法で符号化されたデータが同時に書き込まれ、データをフレームに両側から書き込んでいることによるものである場合がある。このようなアプローチの例がＬＣ３コーデックである。

２つのクラスのビットを伴うシステムが想定される。２つのクラスへのビットストリームペイロードの細分は、出力に対する関連性に基づいて行われる。
・歪んでいても部分的フレーム損失隠蔽が可能な、心理音響的により重要性の低いビットは、１つのクラスにまとめられる。
・歪んでいると完全フレーム損失隠蔽が必要とされる、心理音響的により重要性の高いビットは、別のクラスにまとめられる。

こうする理由は、２つのクラスの利用可能性に応じて、異なる隠蔽戦略を想定できるようにするためである。これら２つの異なる隠蔽戦略は、以下、完全フレーム損失隠蔽および部分的フレーム損失隠蔽と呼ばれる。
・完全フレーム損失隠蔽は、心理音響的により重要性の高いビットをカバーするクラスが喪失された場合に実行される。心理音響的により重要性の低いビットをカバーするクラスが利用できるかどうかは問題とはならず、データは評価されない。この場合、現在のフレームのデータは利用できず、よってフレームは最後に受信したフレームに基づいて完全に合成される。
・部分的フレーム損失隠蔽は、心理音響的により重要性の高いビットをカバーするクラスは利用可能だが、心理音響的により重要性の低いデータをカバーするクラスが失われている場合に実行されることがある。この場合、心理音響的により重要性の高いデータは利用可能であり、フレームを再構築するために使用することができる。心理音響的により重要性の低いデータのみを最後に完全に受信したフレームに基づいて合成する必要がある。部分的フレーム損失隠蔽は、多くの状況下において完全フレーム損失隠蔽よりもより良い品質（例えば、より少ないアーチファクトなど）を提供することを意図している。

２つのクラスの大きさは、例えばチャンネルコーダによって予め定められている。

前方誤り検出・訂正スキームは、好ましくはリード・ソロモン符号を利用し、符号語粒度で作用するところ、各符号語は複数のニブル（４ビット、半オクテットとも言う）から成る。本ケース（ＬＣ３）においては、１つの符号語は１３～１５ニブルから成る。好ましい実施態様において、このような前方誤り検出・訂正スキームは、消費されるオーバーヘッドに依存して様々な度合いのエラー検出・訂正を提供し、例えば
・符号語あたり４ニブルのオーバーヘッドによって、２ニブルの訂正が可能になり（エラー保護モード３）、
・符号語あたり６ニブルのオーバーヘッドによって、３ニブルの訂正が可能になる（エラー保護モード４）。

所定のビットレート総計に対し、正味のビットレートは選択されたエラー保護モードによって変わる。エラー検出・訂正能力が高いほど、利用可能な正味ビットレートは少なくなる。

両クラスについて個別のエラー検出が必要となる。所定のチャンネル符号化構成を考えると、１つのクラスの全てのビットを所定数の符号語に記憶させ、もう一方のクラスの全てのビットを残りの符号語の数に記憶させることが望ましい。

ビットストリーム内のビットのクラスへの細分は、常に所定数の符号語が１つのクラスのビットを含み、残りの数の符号語がもう一方のクラスのビットを含むように、行われる。

上記の通り、心理音響的により重要性の低いビットの位置は、基調にある符号化済みデータに応じてフレーム毎に変化する可能性がある。

しかしながら、目的は、所定数の心理音響的により重要性の低いビットを分離して並べ替えすることである（これにより、チャンネルコーデックが提供する固定の符号語サイズと位置との組合せで個別のエラー保護・検出が可能になる）。

並べ替えは、フレーム毎のベースで適応的に行わなければならない。このような並べ替えのためには、並べ替えを元に戻す、または並べ替えたビットストリームペイロードを復号化するために、追加のサイド情報（例えば長さ情報など）が要求されないものとする。

ビットストリームペイロードは通常、書き込みおよび読み込みルーティンが効率的に実施できるように、書き込まれる。心理音響的な重要性は通常何かの役割を果たすことはなく、ひいては心理音響的により重要性の低いビットと心理音響的により重要性の高いビットとが混在するビットストリームペイロードとなることができる。上記の所定の条件を背景として効率的な前方エラー保護を可能にするためには、このようなビットストリームペイロードは準最適であり、並べ替えが必要となる。

心理音響的により重要性の低いビットの位置は、基調にある符号化済みデータに基づいてフレーム毎に変化する可能性があるため、固定の符号語サイズと位置での直接のマッピングは不可能である。したがって、直截的なアプローチにおいては、関連するビットは次のように並べ替えられる。
・心理音響的により重要性の低いビットは事前ソートされたビットストリームペイロードの一端に記憶される。
・心理音響的により重要性の高いビットは事前ソートされたビットストリームペイロードのもう一方の端に記憶される。

心理音響的により重要性の低いビットの数は、エラー保護モードおよびチャンネル符号化済みフレームの大きさに基づいて、統計的に導出される。

しかしながら、心理音響的により重要性の低いビットの配置は動的に導出される。適応的に並べ替えルールが事前に定められていて、デコーダ側で並べ替えを無効にするために追加のサイド情報が必要とならないようになっている。適応ルールによって、心理音響的に重要性がより低いビットは確実に、常にビットストリームの選択された側の遠端に記憶されるようになっており、同時に、確実にデコーダが元のビットストリームペイロードをどのように再現するかを正確に知っていることとなる。

一方で、このような並べ替えは、エンコーダが「通常の」ビットストリームペイロードを完全に書き込んだ後のポスト処理工程で、且つデコーダが残りの「通常の」ペイロードを読み込む前に（並べ替えの一部では決してない）サイド情報を復号化した後の前処理工程として実行できる。

他方で、このような並べ替えは符号化済みのビットを直接適切な位置に書き込む符号化プロセス中に、および適切な位置からビットを直接読み込む復号化プロセス中に実行することもできる。

心理音響的により重要性の低いビットおよびより重要性の高いビットを専用の符号語に割り当てることは可能であることが指摘される。心理音響的により重要性の低いビットを最も左の符号語に割り当て、心理音響的により重要性の高いビットを最も右の符号語に割り当てることは、単に１つの好ましい実施態様である。したがって、選択した割り当てに依存して、並べ替えを異なる形で行うこともできる。唯一の必要条件は、割り当てが事前に定められていて、デコーダがビットストリーム内の追加情報なしでプロセスを逆行させることができるようになっているということである。

以下の適用シナリオが考えられる。

１．オーディオフレームは、心理音響的により重要性の低いビットがビットストリームの一方の端に集められるように書き込まれる。
ａ．より重要性の高いビットに対して設けられた領域に両側から書き込みを開始する。
ｂ．２つの書き込みポインタが互いに遭遇したときに停止する。
ｃ．より重要性の低いビットに対して設けられた領域に両側から書き込みを続ける。

２．オーディオフレームは「通常の」方法で書き込まれるが、心理音響的により重要性の低いビットがビットストリームの一方の端に集められるように並べ替えられる。
ａ．フレームの読み込みと構文解析を両側から開始する。
ｂ．より重要性の高いビットに対して規定されたビット量が読み込まれたら停止する。ここで、心理音響的により重要性の低いビットは２つの読み込みポインタの間の残りのビットとなる。
ｃ．左のポインタまでのデータを２つのポインタ間のデータと交換する。

３．オーディオフレームは、心理音響的により重要性の低いビットがビットストリームの一方の端に集められるが、「通常の方法で」並べ替えられるように、書き込まれる。
ａ．フレームの読み込みを両側から開始する。心理音響的により重要性の低いビットがビットストリームの左側に記憶されるのであれば、心理音響的により重要性の高いビットを左側から読み込み始めるための開始ポイントは、心理音響的により重要性の低いビットに対して規定されたビットの数から導出できる（同じであることを意味する）。心理音響的により重要性の低いビットがビットストリームの右側に記憶されるのであれば、心理音響的により重要性の高いビットを右側から読み込むための開始ポイントは、心理音響的により重要性の低いビットに対して規定されたビット数および総ビット数から導出することができる。
ｂ．２つの書き込みポインタが互いに遭遇すれば、停止する。
ｃ．心理音響的により重要性の高いビットを読み込むための開始ポイント（ａ．参照）までのデータと、この開始ポイントと２つのポインタの遭遇点の間のデータとを交換する。

４．心理音響的により重要性の低いビットがビットストリームの一方の端に集められるように書かれたオーディオフレームは、以下の通り読み込まれる。
ａ．フレームの読み込みを両側から開始する。心理音響的により重要性の低いビットがビットストリームの左側に記憶される場合、心理音響的により重要性の高いビットを左側から読み込むための開始ポイントは、心理音響的により重要性の低いビットのために規定されたビットの数から導出することができる。心理音響的により重要性の低いビットがビットストリームの右側に記憶されるのであれば、心理音響的により重要性の高いビットを右側から読み込むための開始ポイントは、心理音響的により重要性の低いビットに対して規定されたビット数および総ビット数から導出することができる。
ｂ．２つの書き込みポインタが互いに遭遇すれば、停止する。
ｃ．フレームの残りの部分の読み込みを両側から継続する。心理音響的により重要性の低いビットを右側から読み込むための開始ポイントは、心理音響的により重要性の高いビットを左側から読み込むための開始ポイント（ａ．参照）と同じである。

図５は、本願発明の好ましい実施態様にかかるオーディオ送信プロセッサを図示している。オーディオ送信プロセッサは好ましくは、フレームビルダー５０６とエラー保護コーダ５０８を備える。

オーディオ送信プロセッサへの入力は、典型的には可変長オーディオエンコーダであるオーディオエンコーダ５００に入力されたオーディオデータのフレームから導出される、いくつかのオーディオデータ等の符号化済みオーディオデータである。オーディオエンコーダが要求するビット量は符号化される信号によって異なるが、好ましい実施例においては、オーディオデータの出力は、典型的には符号化済みオーディオデータのフレームの形態で、固定長フレームである。従って、オーディオエンコーダは、典型的には符号化が困難な符号化されるオーディオデータのフレームが、最終的に、より低い品質の表現される一方で、符号化が容易な、すなわち、ある品質レベルに対してより低いビット数で符号化され得る符号化されるオーディオデータのフレームが最終的により高い品質の表現によってオーディオエンコーダ５００の出力において表現されるように、可変品質で符号化する。

典型的には、オーディオデータのある特定の、例えば時間領域部分についてのオーディオエンコーダの出力は、第１の量の情報ユニットと第２の量の情報ユニットを含む。重畳加算状態が５０％の場合には、時間領域部分はフレームのサイズの２倍、すなわちエンコーダに新たに入力された、あるいはデコーダの重畳加算ステージから出力されたオーディオサンプルの数となる。

例えば、並べ替え器５０２および次いで接続されたフレーム書き込み器５０４を備えることがある、あるいは、例えば、中間表現が問題にならない場合にのみフレーム書き込み器から成る、図５のフレームビルダー５０６は、当該フレームの既定の符号語の総数についての基準位置を定義する符号語ラスタを有するフレームを構築するように構成される。このようなフレームは、例えば、図９ａ、９ｂおよび９ｃに関して図示されており、例えば異なる符号語の配置がもたらされ、また、例えば既定の符号語の基準位置が垂直線で示され、これらの基準位置は符号語の冒頭または末尾またはその両方である。これらの基準位置またはラスタポイントは特殊な情報ユニットを一切必要とせず、いくつかのデータが書き込まれている所定のビットまたはバイト位置によってもたらされる。よって、基準位置またはラスタポイントは、オーバーヘッドを一切伴わず、典型的にはエラー保護プロセッサのための符号語の冒頭または末尾をマークする。

本願発明によれば、フレームビルダーは第１の量の情報ユニットのうち、符号語の第１の既定のサブセットの基準点から始まる第１の量の情報ユニットの情報ユニットを書き込むように構成される。

第２の量の情報ユニットの情報ユニットは、符号語の第２の既定のサブセットの基準位置からスタートして書き込まれる。とりわけ、フレームビルダー５０６は、第２の量の情報ユニットの始まりとなる情報ユニットが符号語の境界と一致するように、第１の量の情報ユニットと第２の量の情報ユニットとの間の境界を決定するように構成される。こうして、第１の量の情報ユニットと第２の量の情報ユニットとの間の明確な分離、および送信側と受信側とに対応して関連付けられたエラー保護処理手順が得られる。

オーディオ送信プロセッサは、既定の数の符号語を個別に処理してエラー保護済みフレームを表す複数の処理済み符号語を得るための、エラー保護コーダ５０８をさらに備える。この処理手順のためには、エラー保護コーダは、リード・ソロモンエンコーダ等のエントロピー加算エンコーダまたはブロックエンコーダを備えることがある。あるいは、またはそれに加えて、エラー保護コーダは、第１の既定のサブセットの１つ以上の符号語を処理して第１のハッシュ値等の第１の処理結果を得る、または第２の既定のサブセットの１つ以上の符号語を処理して第２のハッシュ値等の第２の処理結果を得て、処理結果または第１または第２の処理結果の一方を既定の数の符号語に加算して複数の処理済み符号語を得るＣＲＣまたはハッシュ値プロセッサ等符号語を個別に処理しない別の装置を備えることがある。第１の処理結果は第１の既定のサブセットからしか導出されず、第２の処理結果は第２の既定のサブセットからしか導出されない。好ましくは、エラー保護処理の順序は、第１および第２の処理結果が、リード・ソロモンその他のエラー保護ブロックエンコーダの入力における符号語等、まだエラー冗長性処理にかけられていない符号語から算出される。好ましくは、第１および第２の処理結果は、別個の追加の符号語として第１または第２の既定の符号語のセットに、あるいは第１または第２のセットのいずれかにおいてまだ利用可能な空きスペースのいずれかに加算され、符号語とハッシュ値等の処理結果とはリード・ソロモン符号化プロセッサによって保護される。

図５のエラー保護コーダ５０８によって得られたエラー保護済みフレームは、ＤＥＣＴ（デジタル強化コードレス電話）規格準拠デバイス等、好ましくはワイヤレス送信に転送される。したがってこの送信５１０は、エラー保護済みフレームをエラー率の高い（ワイヤレスの）チャンネルに送信する。

好ましくは、フレームビルダー５０６は第１の量の情報ユニットと第２の量の情報ユニットとの間の境界を、第２の既定のサブセットの情報容量が第２の量の情報ユニットの情報ユニット量と等しくなるように、第２の既定のサブセットの情報容量に基づいて決定するように構成される。フレーム書き込み器５０４がフレーム全体のデータ総量から第２の既定のサブセットの容量を除いたのと等しいデータ量を書き込むとすぐに、オーディオフレームの第１の量のデータは完了し、符号語の第２の既定のサブセットの最初の符号語の冒頭から第２の量のデータが始まる。

第１および第２の量の情報ユニットを生成するためのオーディオエンコーダ５００またはソースエンコーダは、フレーム毎処理に依拠し、オーディオ信号の既定の時間部分を使用する。情報ユニットは、算術エンコーダまたは一般的には可変長エンコーダによって生成されたデータ等の必須情報ユニットのセットを含んでいる。情報ユニットは、オーディオ信号の時間部分の高品質表現を提供する可変数の残余情報ユニットを有し、ビット予算が算術エンコーダによって満杯になっていない場合に、このデータはビットストリームに書き込まれる。ソースエンコーダ５００は、既定の時間部分について、信号に依存する数の情報ユニットをもたらす、可変長符号化規則を使用するように構成される。フレームビルダーは、符号化済みオーディオフレームが符号化済み情報ユニットにおいてサイズが固定されるように、符号化済みオーディオフレームを構築するように構成され、またオーディオエンコーダ５００は、可変数の残余情報ユニットを既定のフレームサイズと必須ビットの数との差分として決定するように構成される。

好ましくは、フレームビルダー５０４は第１の量の情報ユニットと第２の量の情報ユニットとの境界をフレーム毎に信号適応的に決定し、境界が、フレームのためのオーディオ信号に応じて、そのフレームの別のオーディオ情報に関連する、またはオーディオデコーダによって別の解釈をされる、境界情報ユニットを表すように構成される。好ましくは、境界情報ユニットは、好ましくはオーディオエンコーダ５００内で使用され、エンコーダについては図２１、デコーダについては図２２で後述するスペクトル領域オーディオコーダにおける特定のスペクトル値またはスペクトル値の特定の組合せを参照し、表現する。

本願発明の好ましい実施態様において、フレーム書き込み器５０４、あるいは一般的にはフレームビルダー５０６は、第１の量の情報ユニットを図６の６００に示される第１の既定のサブセットに書き込むように構成される。ステップ６０１において、第１のサブセットが情報ユニットで満杯になるとすぐに、第１の量の情報ユニットと第２の量の情報ユニット間の境界が決定される。アイテム６０２に記される通り、第２の量の情報ユニットが符号語の第２の既定のサブセットに書き込まれる。

好ましくは、図７に図示されるとおり、符号語の第１の既定のサブセットは、符号語の順番と特定の基準位置を有する。同じく好ましくは符号語の順番と基準位置を有する符号語の第２の既定のサブセットについても同様である。

図９ａは符号語のフレーム内で符号語の既定のサブセットを並べる第１の可能性を図示している。図９ａの実施態様において、符号語の第１のサブセットは符号語４、５、６、７であり、符号語の第２のサブセットは符号語１、２、３である。

好ましくは心理音響的により重要性の低いオーディオデータである第２の量の情報ユニットを受信する、符号語の第２のサブセットの符号語はすべて、互いに隣接してフレーム開始位置に配置される。好ましくは心理音響的により重要性の高いオーディオデータである第１の量の情報ユニットを受信する、符号語の第１のサブセットの符号語はすべて、互いに隣接してフレーム終了位置に配置される。

符号語の第１の既定のサブセットは、フレーム内の４番目の符号語によって、および符号語４から符号語５まで、符号語５から符号語６まで、符号語６から符号語７までの符号語の順番またはシーケンスによって事前に定められている。第１の既定のサブセットは、符号語および書き込み方向に対する符号語の順番を識別する。フレームビルダーは、好ましい実施態様において、符号語の第１のサブセットすなわち符号語の基準位置から始まる矢印に示される符号語４、５、６、７を書き込むように構成される。左から右への書き込み動作は、４番目の符号語の始まりを基準位置として開始され、反対方向への書き込みは７番目の符号語の終わりを基準位置として、すなわちフレーム終了位置から開始される。第２の既定のサブセットも同じく符号語および書き込み方向に対する符号語の順序に相応して特定する。

符号語の第２の既定のサブセットは、フレーム内の最初の符号語によって、および最初の符号語から２番目の符号語までと２番目の符号語から３番目の符号語までの順序またはシーケンスによって事前に定められている。符号語またはサブセットがすべて互いに隣接している場合、順番またはシーケンス情報は書き込みまたは読み込み方向から黙示的にもたらされる。ここでも、左から右への左方向での書き込みは、最初の符号語のフレーム開始位置からであり、第２のサブセットの右端すなわち符号語３からの書き込みは、３番目の符号語の末尾からフレーム開始位置の方向に向けてスタートする。

当然、第１のサブセットおよび第２のサブセットにおける符号語の数は自由に選択可能であり、第２のサブセットの符号語の数が多いほど、完全フレーム損失隠蔽の必要は少なくなる。しかしながら、図１３に図示されるオーディオ受信プロセッサが検出できる通り、第２のサブセットの全ての符号語、あるいは例えば図９ａの実施様態における第２のサブセットの符号語１および３がエラーである場合、許容できる品質での部分的フレーム損失隠蔽が可能なように、第１のサブセットの符号語の数は確実に、十分大きな数でなければならない。

図９ｂは、第１の既定のサブセットおよび第２の既定のサブセットの別の実施態様を図示している。ここでも、いずれのサブセットも互いに隣接する符号語を定義しているが、第１の既定のサブセットはフレーム開始位置に並べられており、符号語の第２の既定のサブセットはフレーム終了位置に並べられている。

図９ｃは第１のサブセットと第２のサブセットとが互いに隣接せずに、つまり第２のサブセットの符号語すなわち符号語２が、第１の既定のサブセットの２つの符号語すなわち符号語１と符号語３との間に散在して並べられている、別の選択肢を図示している。図９ｃはここでも個々の符号語の書き込み方向を示しており、例えば符号語番号５は両側から書き込まれ、該当する場合には、符号語の第２のサブセットを書き込むための書き込みポインタは符号語番号５内のどこかで互いに遭遇することになることが明らかになっている。

図９ａ～９ｃの実施態様においては、符号語表現の上側の矢印は、図８に関連して下記に論じられる、２つの書き込みポインタの好ましい実施態様が適用された場合の書き込み方向を示している。とりわけ、図９ａ～９ｃに関して論じたとおり、フレームビルダー５０６は、例えば図９ａに図示されるような符号化済みオーディオデータのフレームの片側にある既定の数の隣接する符号語を符号語の第２のサブセットとして使用する、あるいは、例えば図９ａまたは図９ｂに関連して図示されるような符号化済みオーディオデータのフレームのもう片側にある第１の既定数の隣接する符号語を符号語の第１のサブセットとして使用するように構成され、ここで符号語の第１の既定数と符号語の第２の既定数の合計は符号語の総既定数に等しい。あるいは、図９ｃに図示されるように、第１のサブセットの少なくとも１つの符号語は第２のサブセットの２つの符号語の間に配置される、あるいは第２のサブセットの少なくとも１つの符号語は第１のサブセットの２つの符号語の間に配置される。

好ましくは、フレームビルダー５０６は、符号語の第１のサブセットの基準位置を使用して、第１の量の情報ユニットを第１の既定のサブセットに書き込むように構成され、第１の既定のサブセットが満杯になったらすぐに、第２の量の情報ユニットが第２の既定のサブセットの基準位置に書き込まれ、フレームビルダー５０６は第１の既定のサブセットの最後の符号語に書き込まれた最後の情報ユニットまたは第２の既定のサブセットの最初の符号語の基準位置に書き込まれた最初の情報ユニットとして境界を決定するように構成される。好ましくは、第１および第２の量の情報ユニットは、第１の量の情報ユニットの全てまたは少なくとも過半数の情報ユニットが、第２の量の情報ユニットの過半数またはすべての情報ユニットよりも心理音響的により重要性が高くなるように選択される。

あるいは、またはさらに、また送信側についても論じたように、第２の量の情報ユニット内の情報ユニットのみの破損が検出された場合には、オーディオ受信プロセッサにおいて部分的フレーム損失隠蔽のみが想定され、第１の量の情報ユニット内で情報ユニットが破損していることが検出された場合には、オーディオ受信プロセッサにおいて完全フレーム損失隠蔽が想定される。

図１または図２に関して後述されるとおり、符号化済み情報ユニットは、固定長サイド情報、可変長サイド情報、時間ノイズ整形情報、スペクトルの第１周波数部分の１つ以上の最上位ビット、スペクトルの第１周波数部分より高い第２周波数部分の１つ以上の最上位ビット、第１周波数部分の１つ以上の最下位ビットまたは符号ビット、第２周波数部分の１つ以上の最下位ビットまたは符号ビットおよび残余ビットから成るカテゴリーグループから選択された少なくとも２つのカテゴリーから成り、固定長サイド情報、可変長サイド情報、時間ノイズ整形情報、第１周波数部分のスペクトルの１つ以上の最上位ビット、および第１周波数部分の１つ以上の最下位ビットまたは符号ビットは、オーディオエンコーダによって生成されれば、情報ユニットの第１合計のカテゴリーとして使用され、第２周波数部分の最上位ビット、第２周波数部分の１つ以上の最下位ビットまたは符号情報ユニットまたは残余ビットは、情報ユニットの第２合計のカテゴリーとして使用される。

図８に図示される好ましい実施態様において、２つの書き込みポインタ８１０、８１２が使用されている。第１書き込みポインタ８１０は第１の書き込み方向で動作して書き込むように構成され、第２書き込みポインタ８１２は第１の書き込み方向とは反対の第２の書き込み方向で動作して書き込むように構成される。第１書き込みポインタのためのデータは第１制御入力によって得られ、例えば、オーディオエンコーダ出力データが考えられるあらゆるフォーマットで存在する、あるいは例えば図１に関してＬＣ３（低複雑性コミュニケーションコーデック）オーディオエンコーダについて論じた標準化フォーマット等、特定の中間フォーマットが存在する、例えば入力バッファ８０２から取り込まれる。

最初の例のケースでは、入力バッファ内のデータはエンコーダから直接もたらされる。この場合、データはエンコーダから来た時のまま取り込まれる。この最初の例のケースのある例においては、エンコーダは、スペクトル線または第１制御入力８０４のスペクトル線タプルのＬＳＢおよび符号、ならびに第２制御入力８０６の同じスペクトル線またはスペクトル線タプルのＭＳＢを書き込む。

２番目の例のケースでは、データは既に書き込まれているフレームに由来する。そのうえで、コントローラがビットストリームまたはフレームを読み込み、制御入力にデータを読み込み／構文解析順で提供するビットストリームまたはフレーム構文解析器を適用する。この第２の例のケースのある例においては、構文解析器はスペクトル線またはスペクトル線タプルのＬＳＢおよび符号を読み込んでこのデータを第１制御入力８０４に提供し、構文解析器は同じスペクトル線またはスペクトル線タプルのＭＳＢを読み込んでこのデータを第２の制御入力８０６に提供する。

同じく入力バッファ８０２にアクセスし、第２の（反対の）方向に書き込むように構成される第２の書き込みポインタ８１２にデータを供給する、第２の制御入力８０６も存在する。コントローラ８００は、少なくとも第１および第２の書き込みポインタ８１０、８１２および好ましくはさらに入力８０４、８０６を制御するように構成される。コントローラは、入力として、第２のセットの符号語の数、またはそれに対応して、より重要性の低い情報ユニットの数すなわち符号語の第２の既定のサブセットの符号語の容量を受信する。コントローラは好ましくは、第１および第２の既定のサブセットならびに関連する順番についての情報、すなわちフレーム内の符号語の数／位置および／またはそれぞれのサブセットについての符号語の順番に関する情報を記憶している。

コントローラ８００は入力８０４、８０６を制御する。コントローラはさらに、第１の量の情報ユニットについて、第１および第２ポインタをフレーム内のスタート位置／アドレスにセットする。ポインタ８１０は増分され、ポインタ８１２は同期して減分されていく。

コントローラ８００は、第１のサブセットの全ての符号語が出力バッファに書き込まれたことを検出し、コントローラは第２の量の情報ユニットについて第１および第２ポインタのスタート位置／アドレスを設定し、そのうえで、さらに第２の量の情報ユニットの書き込みを追加で実行するために書き込みポインタを同期させて増分／減分させていく。好ましくは、コントローラ８００が行う処理手順の順番は図８に示されるものだが、異なった順番でも実行することができる。しかしながら、第１の量の情報ユニットがいつ書き込まれたのかに基づいて第２の量の情報ユニットのスタートを決定することは、オーディオエンコーダがオーディオ信号に依存して動作していても、第１および第２の量の情報ユニットをフレーム毎に決定するための機械的かつ低効率で複雑性も低い方法である。

図１０および図１１に関して論じられている通り、フレームビルダーにはいくつかのアプリケーションが存在する。とりわけ、図１０は直接書き込みが実行される処理手順を図示している。ステップ１００において、フレームビルダーはオーディオエンコーダから符号化済みオーディオデータを受信し、符号語の第１の既定のサブセットを決定する。書き込みは両側から行われ、１０１に示される通り書き込みポインタが互いに遭遇したときに書き込みが停止される。書き込みは、すべての情報ユニットが書き込まれるまで符号語の第２の既定のサブセットへと継続される。とりわけ、１０２に示されるとおり、書き込みは少なくとも１つの書き込みポインタに関しては、第２の既定のサブセットについてフレームの冒頭または末尾において継続される。

フレームビルダーは、ＬＣ３ビットストリームフォーマット等既存のビットストリームを並べ替えるのにも使用することができる。この手順においては、符号化されたオーディオフレームは、例えば第１のセットのための全ての符号語または第２のセットのための全ての符号語は、最終的に並べ替えられるフレームの左側または右側に互いに隣接して配置されている、特定の／標準化された中間フォーマットで存在している。

ステップ２００において、第１の既定のサブセットが決定される。ステップ２０２において、中間フォーマットが両側から読み込まれ、構文解析される。ステップ２０４では、第１の既定のサブセット内の情報ユニットの容量が読み込まれたときに、読み込みと構文解析が停止される。ステップ２０６では、例えば詳細を後述する図３に図示されるような特定の実施態様において、左のポインタまでのデータをポインタ間のデータと交換することで、フレームの書き込みが行われる。図１１の実施態様における書き込み動作はステップ２０６でしか行われない。というのも、ステップ２０２ないし２０４は読み込み、構文解析およびその他の処理手順を行うことにしか関連していないためである。書き込みは必ずしも、図１０に関連して論じた直接書き込みにおいてと同様に増分または減分書き込みである必要はなく、書き込みは所定の連続した量の情報ユニットを交換することで行われる。

図１２は、図５に図示されるエラー保護コーダ５０８の好ましい実施態様を図示している。最初のステップ２１０では、エラー保護プロセッサ５０８は、符号語の第２のサブセットからの符号語なしで、符号語の第１の既定のサブセットのみから第１のハッシュ値を算出する。ステップ２１２において、第２の既定のサブセットのみからすなわち第１の既定のサブセットからの符号語なしで、第２のハッシュ値が計算される。

ステップ２１４では、第１および第２のハッシュ値は２１４に示される通りフレームのサブセットに追加される。ステップ２１６では、例えばＤＥＣＴ準拠送信である好ましくはワイヤレスの送信５１０に転送されるエラー保護済みフレームを得るために、リード・ソロモン符号化等のブロック符号化がサブセットおよびハッシュ値に対して行われる。

図２１はオーディオエンコーダ５００等の典型的なオーディオエンコーダまたはソースエンコーダを図示しているが、オーディオエンコーダ５００は、可変長に動作する、すなわちオーディオ信号の時間部分について、品質が一定に保たれているときにフレーム毎に変動する所定の量のビットを生成する他の任意のオーディオエンコーダによって実施することもできる。

オーディオ信号は、好ましくは重畳して動作する、すなわちウィンドウの時間長よりも低い時刻進行値を有する分析ウィンドウ５２に入力される。このデータはフレームの（ウィンドウ化された）時間部分であり、好ましくはＭＤＣＴ（修正離散コサイン変換）として実施される時間周波数変換５４に入力される。

ブロック５６において、周波数に対する予測から成る任意の時間ノイズ整形動作が行われる。ＴＮＳステージ５６の出力は予測残差値であり、さらにＴＮＳサイド情報が算術コーダ等可変長エントロピーコーダであるエントロピーコーダ６０に好ましくは出力される。ＭＤＣＴ出力スペクトル値またはＴＮＳスペクトル残差値は心理音響的な制御を受けることも受けないこともある量子化器５８によって量子化され、量子化されたデータは算術コーダ等可変長エントロピーコーダに入力される。オーディオエンコーダは、可変長エントロピーコーダが利用可能なビット予算を完全には消費しなかった場合にフレームを追加ビットで満たすために必要な剰余ビットを生成するための剰余コーダをさらに備える。その他使用できるまたはできない可能性のある特徴としては、ノイズ充填、グローバルゲイン適用またはスペクトルノイズ整形がある。ブロック６０の出力において、ＭＳＢ、ＬＳＢ、符号またはその他のデータであり得るデータをブロック６０から受信するビットストリームマルチプレクサが配置される。

図２２に図示されるデコーダ側には、例えばここでも算術デコーダである可変長エントロピーデコーダがある。可変長エントロピーデコーダの成果が逆量子化器７４に入力され、逆量子化器７４の出力は、ＴＮＳ処理が利用可能な時には逆ＴＮＳプロセッサによって処理され、あるいはＴＮＳ処理が実行されないときには、逆量子化器７４の出力は、例えば図２２の７８に示される逆ＭＤＣＴ変換であり得る逆周波数時間変換に転送される。ブロック７８の出力は、最終的に時間領域復号化済みオーディオ信号を得る合成ウィンドウ化器および重畳／加算プロセッサ８０に送信される。逆ＴＮＳプロセッサ７４が使用するＴＮＳデータは典型的にビットストリームから導出され、さらに好ましくは可変長エントロピーデコーダから導出されるが、データを符号化・処理・送信するための他の方法も同様に使用することができる。

次に、図１～図４に関連して本願発明の好ましい実施を論じる。この実施態様は図９ａに図示される符号語の第１及び第２の既定のサブセットの順番および並びに依拠しているが、他の配置にも同様に適用することができる。以下の実施様態は、ビットレベルに至るまで明確に詳細を与えているが、当然具体的な数字は単なる実施態様であり、他の詳細な数字／数も同様に使用することができることは明らかである。

本セクションにおける主眼は、データを所与のエラー保護・検出スキームに並べて、心理音響的により重要性の高いデータおよび心理音響的により重要性の低いデータの利用可能性に依存した個々のフレーム損失隠蔽手順を可能にする並べ替えシナリオについて例示的なものである。

好ましい実施態様はＬＣ３ビットストリームペイロードに基づいて説明する。このビットストリームペイロードは大まかに以下のカテゴリー（前記参照）に細分することができる。
１．サイド情報、固定部分（赤塗りつぶし）および可変部分（赤白対角斜線）
２．算術的に符号化されたＴＮＳ（ＴＮＳ_arith）
３．算術的に符号化された、スペクトルのＭＳＢ（ＭＳＢＳｐｅｃ_arith）
４．スペクトルのＬＳＢおよび符号（ＬＳＢ－ＳｉｇｎＳｐｅｃ）
５．残余

スペクトルはスペクトルタプルで符号化され、各タプルは２つの後続のスペクトル線を示すことに留意されたい。

矢印は、書き込み・読み込み方向を示す。書き込み／読み込み順序は以下の通りとなる。
１．サイド情報の固定部分が右から左に書き込まれる。
２．サイド情報の可変部分が右から左に書き込まれる。
３．算術的に符号化されたＴＮＳデータが左から右に書き込まれる。
４．算術的に符号化されたスペクトルのＭＳＢならびにスペクトルのＬＳＢおよび符号が同期して（スペクトル線毎に、最低周波数を表すスペクトル線から）書き込まれ、算術的に符号化されたＭＳＢは左から右に書き込まれ、ＬＳＢおよび符号（算術的に符号化されていない）は右から左に書き込まれる。
５．これら２つのデータ部分の間にまだ残っているビットがある場合には、残余ビットは右から左に書き込まれる。

カテゴリー１および２は常に心理音響的に重要性が高いものとされ、カテゴリー３～５は概して心理音響的により重要性が低いものとされる。しかし、この領域内の全てのビットについて関連性は一定ではない。
・残余を表すビットは最も重要性が低い。
・カバーされるスペクトル線が表す周波数が高いほど、スペクトルタプルを表すビットは心理音響的により重要性が低い、すなわち
・周波数がより高いスペクトル線をカバーするスペクトルタプルを表すビットはより重要性が低い。
・周波数がより低いスペクトル線をカバーするスペクトルタプルを表すビットはより重要性が高い。

図１および図２は、心理音響的関連性に基づくビット分布を示している。赤は関連性が高いことを示す。緑は関連性が低いことを示す。移行フェーズが２つあり、いずれもフレーム毎のベースで動的に変化する。

ビットストリーム内で最後に書き込まれたビットは心理音響的により重要性の低いビットである。その配置は可変である。ビットストリームを書き込んでいるまたは読み込んでいる（および構文解析している）間に、心理音響的により重要性が低いとされる所与のビット数が残るまでチェックすることで、直接決定することができる。この所与の数は残余と所定数のスペクトル線のビット（ＭＳＢならびにＬＳＢおよび符号）をカバーする。スペクトルの適用範囲は最も高い周波数を表す線から始まる。より重要性の低いビットの所与の数が大きいほど、これらのより重要性の低いビットが歪められた場合に復号化を成功させることができる、上側周波数は低くなる。

心理音響的により重要性が低いとされる符号語の数Ｎ_pccwと、心理音響的により重要性が低いとされるビットの量は同調パラメータである。この同調パラメータは、好ましくはエラー保護コードの特性から決定される。ＬＣ３における１つの実施態様について、最適サイズは実験的に、チャネル符号化済みフレームのサイズ、すなわち総フレームサイズをバイトで明示するエラー保護コードの特性の例としての保護強度（エラー保護モードｍ）およびスロットのサイズＮｓに依存して導出された。このことは、以下の数式に具現化されている。

図３は、並べ替え前後のオーディオフレームならびにチャンネルコーデックが提供する符号語の割り当ての例を示している。また、デコーダ側の並べ替えたビットストリームペイロードの構文解析も示している。

この例における総ビットレートは１０ｍｓのフレーミングで７６８００ビット／秒であり、その結果フレームあたり９６バイトとなる。このフレーム長に対し、チャンネルコーデックは１３の符号語を提供する。３つの符号語は総サイズ７バイトで、１０個の符号語は総サイズ７．５バイトである。エラー保護モード４（＝オーバーヘッドで３バイトの保護）では、ｆｅｃ（前方誤り訂正）のオーバーヘッドは３９バイトであり、ペイロードに５７バイトが残され、正味サイズ４バイトの３つの符号語と正味サイズ４．５バイトの１０個の符号語にわたって分割（３）される。

図３Ａは、５７バイトのパケットに分離され、その結果総ビット数４５６［０：４５５］となったフレームのビットストリームペイロードを示している。赤いブロックは静的サイド情報に相当し、赤白の斜線領域は、符号化されたデータに依存してフレーム毎に変化する可能性のある、動的サイド情報に相当する。

より重要性が低いとされるビットは青で示され、ビット境界ｂ＿ｌｅｆｔとｂ＿ｒｉｇｈｔとで境界を画定されている（与えられている例では、ｂ＿ｌｅｆｔ＝１８４、ｂ＿ｒｉｇｈｔ＝３１５）。この領域は残余ビットと重複し、さらに「ＭＳＢＳｐｅｃ_arith」および最高周波数から始まる「ＬＳＢ＋ＳｉｇｎＳｐｅｃ」からのビットをさらにカバーする。「ＭＳＢＳｐｅｃ_arith」からのビット数は通常「ＬＳＢ＋ＳｉｇｎＳｐｅｃ」からのビット数よりも多い。通常、ＬＳＢおよび符号を符号化するよりもＭＳＢを符号化する方が、スペクトル線当たりの消費するビットがより多いからである。

ｂ＿ｌｅｆｔまでの「ＭＳＢＳｐｅｃ_arith」（左から右に書き込まれ、緑で表されている）とｂ＿ｒｉｇｈｔまでの「ＬＳＢ＋ＳｉｇｎＳｐｅｃ」（右から左に書き込まれ、白で表されている）は併せて、ゼロヘルツからその時点で符号化された最高周波数までにスペクトルタプルを表す。心理音響的により重要性が低いと見なされるスペクトルタプルがもう１つ多ければ、少なくとも１つの境界が外側に動く。心理音響的により重要性が高いとみなされるスペクトルタプルがもう１つ多ければ、少なくとも１つの境界が内側に動く。

図３Ｂは、並べ替えた後のフレームを示している。青い部分［１８４：３１５］は緑色の部分［０：１８３］と交換されている。青い部分は緑の部分よりも小さくても等しくても、大きくても良いことが指摘される。

図３Ｃはチャンネルコーデックに入力された１３の符号語のペイロードを表示している。

図３Ｄは受信したビットストリームペイロードを示している。例示的に２つの歪んだ符号語を示している。

図３Ｅは復号化プロセスを示している。例示的に、２つのビット境界ｂｅ＿ｂｐ＿ｌｅｆｔとｂｅ＿ｂｅｐ＿ｒｉｇｈｔに囲まれた、歪んだビットを示している。この範囲内のビットによって表わされるスペクトルタプルの周波数ビンは部分的フレーム損失隠蔽によって合成されるものとする。

当然、ビットストリームペイロード内のビットの２つの想定しているクラスへの割り当ては、チャンネルコーダによって提供された符号語を直接マッピングするものではない。

示されている例においては、図３Ａのｂ＿ｌｅｆｔからｂ＿ｒｉｇｈｔの間の部分［１８４：３１５］は第２クラスに割り当てられ、他のビット［０：１８３］および［３１６：４５５］は第１クラスに割り当てられる。ここで、図３Ａで第２クラスに割り当てられるビット［１８４：３１５］は第２クラスのための符号語の数を増大させない限り、図３Ｃの符号語構造には当てはまらない。第２クラスは符号語６［１８４：２０３］に部分的に、符号語７～９［２０４：３１１］には全面的に、そして符号語１０［３１２：３１５］には部分的に存在することになる。よって、図３Ｂに示されるような並べ替えが必要となる。こうすれば第２クラス［０：１３１］は完全に最初の４つの符号語１～４に当てはまることになる。

示されている例においては、４つの符号語が第２クラスに属し、９つの符号語が第１クラスに属している。いずれかのクラスに記憶されるビット数はこのクラスの符号語によって提供されるペイロードビットの量によって限定される。示されている例においては、符号語１～３はそれぞれ、４バイトのペイロードを提供しているが、符号語４～１３はそれぞれ４．５バイトのペイロードを提供している。その結果、
・心理音響的により重要性の低いビットについては３×４バイト＋１×４．５バイト＝１６．５バイト、
・心理音響的により重要性の高いビットについては９×４．５バイト＝４０．５バイト
となる。

心理音響的により重要性の低いビットの数（ｂｌｏｃｋ＿ｓｉｚｅ）は予め定められているが、境界（ｂ＿ｌｅｆｔおよびｂ＿ｒｉｇｈｔ）の位置はフレーム毎のベースで変動する。並べ替えの後、これらのビットは常に同じスポットに配置され、そのことによって効率的なチャンネル符号化が可能となる。

エンコーダ側では、ビットストリームｂｓ＿ｅｎｃは以下のように並べ替えられる。

ここで、ｌｅｎはビット単位でのフレームの正味サイズであり、ｂｌｏｃｋ＿ｓｉｚｅはより重要性の低いビットの数である。

デコーダ側では、「１．ＭＳＢＳｐｅｃ_arith」と「１．ＬＳＢ＋「ＳｉｇｎＳｐｅｃ」を読み込む２つのポインタが互いにぶつかる（図３Ｅ参照）境界である境界ｂ＿ｒｉｇｈｔは、ビットストリームを復号化している間に決定される。心理音響的により重要性の低いビットの数は前方エラー保護構成（エラー保護モードおよび符号語数Ｎ_pccw）から既知である。デコーダ側のフレームの並べ替えｂｓ＿ｒｅａｒｒａｎｇｅｄは以下のように行われる。

ｂｓ＿ｒｅａｒｒａｎｇｅｄフレームにビットエラーが適用されていなければ、ｂｓ＿ｅｎｃはｂｓ＿ｄｅｃと等しくなる。

前記の通り、並べ替えは後処理工程で行っても、または書き込み／読み込みプロセス中に直接行っても良い。

エンコーダ側では、各フレームについて以下を行う必要がある。
１．ビットストリームペイロードの右端から始まるサイド情報の固定部分を右から左に書き込む。
２．サイド情報の固定部分の左端から始まるサイド情報の可変部分を右から左に書き込む。
３．ＴＮＳデータ、ビットストリームペイロードの左端の最初のｂｌｏｃｋ＿ｓｉｚｅを左から右に書き込む。
４．ＴＮＳデータの右端から始まるスペクトルデータの複数のＭＳＢ「１．ＭＳＢＳｐｅｃ_arith」を左から右に、ｂ＿ｌｅｆｔ＋ｂｌｏｃｋ＿ｓｉｚｅ－１＝ｂ＿ｒｉｇｈｔまで書き込み、サイド情報の左端から始まるスペクトルデータのＬＳＢおよび符号「１．ＬＳＢ＋ＳｉｇｎＳｐｅｃ」を右から左に、ｂ＿ｌｅｆｔ＋ｂｌｏｃｋ＿ｓｉｚｅまで書き込む。ちなみに、ｂ＿ｌｅｆｔおよびｂ＿ｒｉｇｈｔは事前にはわかっていない点に注意されたい。
５．「１．ＭＳＢＳｐｅｃ_arith」および「１．ＬＳＢ＋ＳｉｇｎＳｐｅｃ」を読み込む２つのポインタが互いに遭遇したときに境界ｂ＿ｌｅｆｔ＋ｂｌｏｃｋ＿ｓｉｚｅ－１＝ｂ＿ｒｉｇｈｔが決定される（図３Ｅの矢印参照のこと）。
６．ビットストリームペイロードの左側境界から始まるスペクトルデータの複数のＭＳＢ「２．ＭＳＢＳｐｅｃ_arith」の左から右への書き込みを継続する。またｂｌｏｃｋ＿ｓｉｚｅ－１から始まるスペクトルデータのＬＳＢおよび符号「２．ＬＳＢ＋ＳｉｇｎＳｐｅｃ」の右から左への書き込みを継続する。
７．スペクトルデータのＬＳＢおよび符号の左端から始まる残余を右から左に書き込む。

デコーダ側の読み込みは、記載したエンコーダ側の書き込みと同様に行うことができる。

図３は並べ替えたビットストリームペイロードを書き込むまたは読み込むこのプロセスを図示したものである。図３Ａは「通常の」ビットストリームペイロードを示し、図３Ｂは並べ替えたビットストリームペイロードを示している。上記の通り、この並べ替えたビットストリームペイロードは即刻書き込むまたは読み込むことが可能である。あるいは並べ替えはエンコーダ側の事後プロセスまたはデコーダ側の事前プロセスとして行うこともできる。しかし、この並べ替えプロセスのためには、ビットストリームは次のように構文解析する必要がある。
・元の順番→並べ替えた順番：ｂ＿ｌｅｆｔおよびｂ＿ｒｉｇｈｔは書き込まれる残りのビットを数えることで探さなければならない。この数がｂｌｏｃｋ＿ｓｉｚｅに等しくなれば、境界に達したことになる。
・並べ替えた順番→元の順番：ｂ＿ｒｉｇｈｔは「１．ＭＳＢＳｐｅｃ_arith」および「１．ＬＳＢ＋ＳｉｇｎＳｐｅｃ」を読み込むポインタを観測して探さなければならない。両ポインタが互いに遭遇したときに、境界に達したことになる。

心理音響的により重要性の低いビットを表すビット範囲はチャンネルコーデックによってあらかじめ定められているが、ｂ＿ｌｅｆｔおよびｂ＿ｒｉｇｈｔは任意のビット位置にあっても良い。

ある好ましい実施態様において、算術エンコーダ／デコーダはバイト粒度で動作する。この例においては、ｂ＿ｌｅｆｔはすでにバイト境界に該当している。このことはｂ＿ｌｅｆｔ＝１８４である図３Ａに反映されている。

しかし、基調となるチャンネルコーダ（図３Ｃ）はニブル（４ビット）粒度で動作するため、ｂｌｏｃｋ＿ｓｉｚｅはバイトの倍数ではない場合があり、よってｂ＿ｒｉｇｈｔもバイト境界に該当しない場合もある。この場合、上記に記載した並べ替えの後にミスマッチが起こる可能性がある。示された例においては、このようなミスマッチがバイト１７［１２８：１３５］（図３Ｅ）に見られる。ここでは算術デコーダはバイト境界ではないビット位置１３２から復号化を始めなければならない。

これに対処するために、ｂｌｏｃｋ＿ｓｉｚｅは

として導出される。

図４は、この実施態様の例を、図３におけるのと同じパラメータを想定して示している。ここでは、ｂｌｏｃｋ＿ｓｉｚｅ＝１３６ビットすなわちｂ＿ｒｉｇｈｔはここでは同じくバイト境界にあり、この結果算術デコーダのスタート地点はビット１３６となり、ひいては整数バイト位置１７となる（図４Ｅでは、算術デコーダはＴＮＳ_arithを復号化することから始める）。バイト１７の右側ニブル［１３２：１３５］（青白の斜線で表示）はここでは、心理音響的により重要性の高いデータをカバーすることを意図している符号語を与えられているが、心理音響的により重要性が低いとされるビットを含んでいる。このことは以下の効果をもたらす。
・符号語５に修正不能なビットエラーがあった場合、エラーがバイト１７の右側のニブル、すなわちビット［１３２：１３５］のみに影響するとしても、フレーム全体を完全フレーム損失隠蔽で合成することになる。
・符号語５～１３が良好で、符号語４内に訂正不可能なビットエラーがある場合、それはバイト１７の左ニブルのみ、すなわちビット［１２８：１３２］に位置している場合、バイト１７の右ニブルはエラーのない符号語５で符号化されているので、依然、復号化することができる。

以下が指摘される。
・ｂ＿ｌｅｆｔは、図３に示される例のように既にバイト境界にある場合でなければ、次の左のバイト境界に多少ずらすことができる。
・心理音響的により重要性の低いデータに属するスペクトルタプルの数は多少増やすことができるが、心理音響的により重要性の高いデータに属するスペクトルタプルの数はそれに対応して多少減少することがある。したがって、損傷のある一部の状況においては、復号化できる周波数タプルの数がニブル／ビット粒度未満となる可能性もある。ただし、品質に関しては、影響はわずかであり、その一方で算術エンコーダ／デコーダのより効率的な実施が可能になる。

上記の例は粒度が互いに整数関係にある状況に対処するものであるが、粒度が非整数関係にある時または算術エンコーダの粒度がエラー保護粒度よりも低いときにも、同様の処理が使用される。

２つのビットストリーム書き込み器はビットストリームに同時に書き込む、または２つのビットストリーム読み込み器はビットストリームから同時に読み込む（本ケースでは異なる方向に）ため、ビットストリームの並べ替え（心理音響的により重要性の低いビットと心理音響的により重要性の高いビットとの分離）の好ましいアプローチの特徴は、オーディオエンコーダ／デコーダがビットを空間的にではなく経時的に、重要性の高いビットから始まり重要性の低いビットで終了するように書き込むまたは読み込むこと、および、可変長符号化のため、所定の量のデータが書き込みまたは読み込まれた時にこれらの２つの書き込みまたは読み込みポインタがどこにあるかという事前情報が提供されないことである。これらの位置は、所定の量のデータが書き込まれまたは読み込まれたこと、あるいは２つのポインタが書き込みまたは読み込みの間に互いに遭遇したことを理由に、この量のデータが書き込まれた後、あるいはこの量のデータが構文解析された（すなわち読み込まれ評価された）後のいずれにしかわからない。

符号化工程の後または復号化工程の前に事後処理または事前処理としての並べ替えは可能だが、並べ替えは追加の構文解析工程を必要とするため、並べ替えたビットストリームの直接書き込みまたは読み込みが好ましい。

次に、デコーダまたは受信側に関連する本願発明の好ましい実施態様を図１３～２０に関連して論じる。

図１３は、受信したエラー保護済みフレームを処理するためのオーディオ受信プロセッサを図示している。オーディオ受信プロセッサは、エラー保護済みフレームを受信し、エラー保護済みフレームをエラー保護プロセッサ３０２に出力するための受信インターフェース３００を備える。エラー保護プロセッサ３０２はエラー保護済みフレームを処理して符号化済みオーディオフレームを得るように構成される。とりわけ、エラー保護プロセッサは第１および第２の既定のサブセット、好ましくは第１の既定のサブセットのみ、さらには第１の既定のサブセットに属する符号語のみについての情報を受信する。この情報は、エラー保護プロセッサ３０２から導出された符号化済みオーディオフレームの符号語の既定のサブセットがエラーを含むかどうかをエラー保護プロセッサ３０２がチェックするのに十分である。

エラー保護プロセッサ３０２はエラー保護済みフレームを処理し、符号語を伴うフレームを出力し、さらに、典型的には固定長フレームである符号語を伴うフレームが符号語の第１の既定のサブセット内にエラーを含んでいるかについての情報を生成する。

この文脈において、図５のオーディオ送信プロセッサのエラー保護コーダ５０８に入力される符号語またはオーディオ受信プロセッサのエラー保護プロセッサ３０２が出力する符号語が、同じくペイロード符号語と見なされ得ること、およびオーディオ受信プロセッサのエラー保護プロセッサ３０２から出力される符号語または図５のオーディオ送信プロセッサのエラー保護コーダ５０８に入力される符号語が適正（ｊｕｓｔ）符号語と呼ばれることを指摘しておく。

オーディオ受信プロセッサは、符号語の第１の既定のサブセット内にエラーが検出された場合にフレーム損失隠蔽操作を行う、または例えば離れた場所でかかる隠蔽操作を行わなければならないことの指示を生成するように構成された、エラー隠蔽器またはエラー隠蔽指示器３０４を備える。

オーディオ受信プロセッサは、フレーム読み込み器３０６と、続いて接続されているオーディオデコーダ３０８とを備える。フレーム読み込み器３０６は、エラー保護プロセッサ３０２またはエラー隠蔽器またはエラー隠蔽指示器３０４によって制御できる。とりわけ、エラー保護プロセッサ３０２が符号語の第１の既定のサブセット内にエラーがあると判定し、その結果典型的な完全フレーム損失隠蔽が行われる場合、フレーム読み込み器３０６およびオーディオデコーダ３０８は、これらのブロックがこれ以上このフレームに対して動作を行わなくても済むように、制御することができる。

エラー保護プロセッサ３０２が符号語の第１の既定のサブセットではなく符号語の第２オ既定のサブセット内にエラーがあると判定した場合、フレーム読み込み器３０６は符号語の第１の既定のサブセットを読み込むが、エラーが検出されたために符号語の第２の既定のサブセットの読み込みをスキップすることができるように、あるいは符号語の第２の既定のサブセットの全ての符号語がエラーではない場合、少なくともエラーが検出された所定の符号語の読み込みをスキップすることができるように、制御される。

エラー保護プロセッサ３０２がいずれの符号語のサブセットもエラーがない、すなわちエラー保護プロセッサの処理手順によって修正されたエラーを含まないと決定した場合、フレームリーダー３０６は第１および第２の既定のサブセットについての既定の情報を用いて第１および第２の既定のサブセット内の符号化済みオーディオデータを読み込むように構成され、フレームリーダー３０６は読み込み済みオーディオデータをオーディオデコーダ３０８による処理のために、任意の形でまたは特定の中間フォーマットで出力することができる。

エラー隠蔽器またはエラー隠蔽指示器３０４はエラー保護プロセッサ３０２によって制御され、部分的フレーム損失隠蔽を実行し、エラー隠蔽器は合成オーディオデータを生成し、合成オーディオデータをオーディオデコーダ３０８に転送して、オーディオデコーダが送信されたが第２の符号語の第２のセット内のエラーの影響を受けたオーディオデータの代わりに、より高いスペクトル値や残余データ等のこの隠蔽データを使用することができるようにしている。実施方法に応じて、図１３のエラー隠蔽器またはエラー隠蔽指示器３０４、あるいはフレーム損失隠蔽器は、１つ以上の先行するフレームからのデータを使用し、隠蔽器３０４は互いの機能が互いに統合されるように、オーディオデコーダに組込まれることがある。エラー隠蔽指示器の場合には、隠蔽はエラー保護プロセッサから離れた場所で行われ、オーディオデコーダは装置３０４から隠蔽の実行の指示を受信する。

好ましくは、エラー保護済みフレームは２つのエラー保護工程を有する。最初のエラー保護工程は送信側のリード・ソロモンエンコーダ等のブロックコーダから導入された冗長性である。更なる２番目の保護の系統は、符号語の第１の既定のサブセットおよび符号語の第２の既定のサブセットに対する１つ以上のハッシュコードの算出である。

エラー保護プロセッサ、およびとりわけエラー保護プロセッサが適用するリード・ソロモン符号等のブロックコードは、いくつかのエラーを検出・修正することはできるが、いくつかのエラーは検出または修正されることなくリード・ソロモン復号化を生き残ることができる、またはエラー修正がエラーを間違った方向で「修正」したということが起こりうる。これらのエラーも見つけるためには、リード・ソロモン復号化動作で出力された転送済みハッシュと、この転送済みハッシュ値と復号化済みの符号語の第１（または第２）の既定のサブセットから導出されたハッシュ値とを用いたハッシュ確認が実行される。

好ましい実施が図１４に図示されている。ステップ４００において、エラー検出／訂正を伴うリード・ソロモン復号化が実行される。この処理手順により、符号語を伴う復号化済みフレームおよび好ましくはハッシュ値として実施される送信された第１および第２の結果値がもたらされる。ステップ４０２では、第１のハッシュ値が第１の既定のサブセットから計算され、ステップ４０４では計算された第１のハッシュ値が、送信された第１のハッシュ値と比較される。両ハッシュ値が等しい場合には、ステップ４０６の手順に進むことになる。ただし、両ハッシュ値が等しくない場合には、エラーが検出されて処理が停止され、ステップ４０８に記される通り完全フレーム損失隠蔽が開始される。

しかしながら、第１のハッシュ値と送信された第１のハッシュ値が互いに等しいと判定されると、第２のハッシュ値が計算され送信された第２のハッシュ値と比較される、ステップ４０６が実行される。両ハッシュ値が等しくない場合には、ステップ４１０に示される処理手順が適用される、すなわち部分的フレーム損失隠蔽が実行される。ただし、符号語の第２の既定のサブセットに対する両ハッシュ値が等しいと判定された場合、フレームリーダーおよびオーディオデコーダは、無エラー復号化動作を実行するように制御される。図１４に図示される処理手順は好ましくはエラー隠蔽器またはエラー隠蔽指示器３０４、および／またはエラー保護プロセッサ３０２によって実装される。

図１５は、図１４のブロック４１０に図示される部分的フレーム損失隠蔽の好ましい実施を図示している。ステップ４２０において、符号語の第２の既定のサブセットの全ての符号語のうち、符号語１つだけ、あるいはそれ以上がエラーなのかが決定される。このために、リード・ソロモンデコーダ等のブロックデコーダまたは符号語毎のＣＲＣチェックから情報を受信することになる。典型的には、リード・ソロモンデコーダは符号語の第２の既定のサブセットの符号語がエラーであること、あるいは符号語の第２の既定のサブセットのどの符号語がエラーであるかを示す。例えば、ブロック４２０によって、１つまたは２つの符号語のみがエラーであって、符号語の第２の既定のサブセットの他の符号語は正しいことが示される。これらの損傷していない他の符号語のデータは可能な限り通常の復号化または部分的隠蔽に用いられる。ステップ４２２において、第２の既定のサブセットのエラーでない１つ以上のブロックまたは符号語が読み込まれる。

ステップ４２４において、エラーである１つ以上の符号語がスペクトル範囲や残余データ等のどの意味を反映するかが決定される。このためには、符号語の第２の既定のサブセットの符号語の順序および基準位置に関する情報が有用となってくる。ステップ４２４はエラーの符号語の意味を決定して、ステップ４２６において、ブロック４２４が決定したスペクトル範囲等、エラーであるブロックのための隠蔽データを合成できるようにする。あるいは、ある種のエラー隠蔽は、損傷していると表示された残余データが単純にスキップされて、残余データのみが損傷している問題のない状況におけるエラー隠蔽処理手順の一種として、残余の復号化とエラーのない符号語の場合には得られるはずの対応する品質向上が単純に行われないことになる。

しかしながら、所定のスペクトル範囲が損傷していると判定された場合には、このスペクトル範囲のための隠蔽データがブロック４２６によって生成される。

ブロック４２８では、部分的フレーム損失隠蔽処理手順から生じるオーディオ信号の時間部分（フレーム）のための復号化済みオーディオ信号を最終的に得るために、第１の既定のサブセットから読み込まれたデータおよび第２の既定のサブセットの符号語からの正確なデータならびに隠蔽データが結合されて復号化される。

図１６はブロック４２４が実行する処理手順の概要を図示したものである。隠蔽スペクトル範囲を得るために、エラーであるデータを伴うビットストリームを構文解析することで、これらのデータがスペクトル値を表すデータの意味が決定される。しかしながら、これらのデータの実際値は、エラーであるとされているため、使用されることはない。ステップ４２４および４２６に続く処理手順の結果は、隠蔽境界までエラーのないスペクトル範囲データが得られ、隠蔽境界と最大周波数との間のスペクトル範囲について、合成／隠蔽データによって置き換えられるエラーのあるスペクトルデータが存在するということになる。しかしながら、他の実施態様においては、隠蔽スペクトル範囲が最大範囲まで完全には伸張せず、隠蔽境界とオーディオデコーダが要求する最大周波数よりも低い別の境界との間の所定のスペクトル範囲しかカバーしない場合もある。オーディオデコーダはそれでも、隠蔽境界と最大周波数の間は正しく受信されたデータを受信する。

ある実施態様において、エラー隠蔽器またはエラー隠蔽指示器３０４は代替データを生成するように構成され、このデータはその後復号化される、あるいは概してエラーの無いデータと共にデコーダによって用いられる。別の実施態様においては、エラー隠蔽器またはエラー隠蔽指示器３０４はエラー隠蔽指示を生成するだけで、この指示は、ブロック３０４と３０８を接続する線によって示されるように、図１３のデコーダ３０８等のオーディオデコーダによって評価され、この接続線がエラー隠蔽指示を伝搬する。そのうえでオーディオデコーダが必要なエラー隠蔽措置を、（一般には、エラー隠蔽指示は「復号化」または解釈されるが）先行するフレームからのデータの使用やヒューリスティック処理手順やその他の関連する処理手順等の特定のオーディオ復号化動作なしで、講じる。

図１７は図１、２、３または４について論じたデータまたは図２１のオーディオエンコーダによって得られたデータが使用される状況を図示したものである。ステップ４３０において、正しい最上位ビットに対応する最高周波数が隠蔽境界として決定される。あるいは、ＭＳＢおよびＬＳＢ／符号ビットの最高周波数のうちの上限が隠蔽境界として決定４３４される。

ステップ４３２において、より高い周波数値は完全にあるいはおそらく得られたであろうＬＳＢまたは符号ビットを使用して合成される。より高い周波数のＭＳＢビットは損傷していても、損傷したＭＳＢビットに対応するスペクトル値についてはＬＳＢまたは符号ビットは未だ使用することができる。ステップ４３６において、エラーのあるデータが隠蔽境界よりも低い周波数値のＬＳＢまたは符号ビットをカバーする際は、エラーのあるデータも同じく合成される。合成処理手順の出力は、図１６に概略的に図示される隠蔽スペクトル範囲のためのスペクトル値の形での合成／隠蔽データである。

図１８は図１３のフレーム読み込み器３０６の好ましい実施を図示している。フレーム読み込み器は好ましくは、入力バッファ４４２と出力バッファ４５２またはオーディオデコーダへの直接出力を備える。フレーム読み込み器３０６はコントローラ４４０、第１の読み込み方向に動作する第１制御入力ポインタ４４４、および第２の読み込み方向に動作する第２制御入力ポインタ４４６を備える。第１制御入力ポインタ４４４は第１書き込みポインタ４４８にデータを送り、第２制御入力ポインタ４４６は第２書き込みポインタ４５０にデータを送ることができる。

図８に８００で図示されるエンコーダ側の対応するコントローラとして、受信側の実施としてのポインタのコントローラ４４０も第２の既定のサブセット内の符号語の数についての情報または心理音響的により重要性の低い情報ユニットの総数または容量に関する情報も受信する。

さらに、符号語の第２の既定のサブセットからのデータが図１７について論じたとおりに可能な限り最大限に使用された場合、コントローラ４４０は、エラー保護プロセッサからの第２のサブセットのエラーである符号語の指示を受けることがある。これに該当しない場合、そして符号語の第２の既定のサブセットの少なくとも１つの符号語がエラーであり、ひいては、符号語の第２の既定のサブセットがカバーするすべてのスペクトルデータが合成または隠蔽データとしてエラー隠蔽動作から生成されると決定された場合、エラー保護プロセッサからコントローラ４４０への制御は一切必要ない。

それでも、コントローラ４４０の処理手順は図８のコントローラ８００と同じだが、書き込みと読み込みの概念が入れ替わっている。とりわけ、図１８のコントローラ４４０は例えばデータ交換のためあるいは増分での書き込みによって書き込みポイントを制御する。データ交換は図１９の文脈で論じられるような並びの場合に行われ、一方増分／減分処理手順は図２０に図示される直接復号化について行われる。

コントローラ４４０は第１の量の情報ユニットについて第１および第２ポインタのスタート位置／アドレスをフレーム内に設定し、そのうえで入力（読み込み）ポインタを同期させて増分／減分させる。コントローラ４４０は第１のサブセットの全ての符号語が入力バッファから読み込まれたことを検出し、そのうえで第２の量の情報ユニットのための第１および第２ポインタのスタート位置／アドレスを設定し、残りのデータがすべて読み込まれるまで、読み込みポインタを同期させて増分／減分させる。

第１の例において、出力バッファ４５２に書き込まれたデータの要求はデコーダからしか行われない。デコーダ、とりわけエントロピーデコーダおよび／または残差デコーダのみが、どのポインタからどれだけの情報ユニットまたはビットが必要なのかをわかっているからである。ある例においては、デコーダはスペクトル線またはスペクトル線のタプルのためのＬＳＢおよび符号を第１書き込みポインタ４４８から、この同じスペクトル線またはスペクトル線タプルのためのＭＳＢを第２書き込みポインタ４５０から、エントロピーデコーダが要求する通りに受信する。

第２の例においては、データは所定のフレームに書き込まれる。そのうえで、所定のフレーム構文に基づいて入力バッファ４４２からポインタ４４４、４４６を介してビットを読み込むための構文制御ビットストリームまたはフレーム読み込み器をコントローラが適用し、そのうえでデータが出力バッファ４５２またはブロック４４８および４５０を介して送信デバイスに書き込まれる。ある例においては、構文制御ビットストリームまたはフレーム読み込み器は、例えばポインタ４４６を介してスペクトル線またはスペクトル線タプルのためのＬＳＢおよび符号を読み込み、読み込まれたデータはブロック４５０を介してバッファ４５２に書き込まれ、構文制御ビットストリームまたはフレームリーダーは例えばポインタ４４８を介して同じスペクトル線またはスペクトル線タプルのためのＭＳＢを読み込み、読み込まれたデータはブロック４４８を介して出力バッファ４５２に書き込まれる。

このように、好ましい実施態様においては、図１３のオーディオデコーダ３０８は典型的に、パーサおよびレンダラを備える。パーサは図２２のブロック７１および７２から成り、レンダラは図２２の残りのブロックを含むことになる。というのもこの実施態様においては、算術または一般エントロピー復号化無しで、例えばスペクトル線またはスペクトル線タプルのＭＳＢ部分またはスペクトル線またはスペクトル線タプルのためのＭＳＢ／符号部分のためにはどれだけの符号化済みビットが必要なのかを決定することができないからである。トランスコーディング動作の場合には、トランスコーディング動作は入力フレームと比べると異なる構文で書き込まれたフレームを出力するため、パーサは後続のレンダラなしで使用される。

図１９は、例えばコントローラ４４０または一般的には図１３のフレーム読み込み器３０６が並べ替え動作を行うときの好ましい実施を図示している。ステップ４５６において、入力（読み込み）ポインタのスタート位置が、符号語の第１の既定のサブセットが読み込まれるように、決定される。この処理手順においては、例えば符号語の第２のサブセットがフレームの冒頭または末尾で隣接する符号語とまとめられるケースがこれにあたる。ステップ４５６は入力として、２番目の符号語の数または第２の量の情報ユニットを受信する。さらに、符号語の第２の既定のサブセットがフレームの末尾に位置する場合、フレームあたりの情報ユニットの総数もステップ４５６に要求されることとなる。

ステップ４５８では、読み込みポインタが互いに遭遇すれば処理手順は停止され、この時フレーム内での遭遇位置が決定される。ステップ４６０では、読み込みスタート位置までのデータがこの位置と遭遇位置との間のデータと交換される。

ブロック４６０の出力で、特定／標準化中間フレームフォーマットが得られる。

図２０は直接復号化のためのフレームリーダー３０６の処理手順を図示している。ステップ４７０はここでも第２の符号語の数または第２の量の情報ユニットを受信する。ステップ４７０はフレーム当たりの情報ユニットの総数を要求することがある。そのうえで、第１の既定のサブセットを読み込むための入力（読み込み）ポインタのスタート位置が決定される。ステップ４７０ならびにステップ４５６は読み込みポインタ４４４、４４６を制御する。ステップ４７２において、読み込みポインタが互いに遭遇し、遭遇位置が得られた時に処理手順は停止する。ステップ４７４において、残りの部分に対する読み込みが両側から継続され、反対方向に読み込むためのスタート位置は最初の工程で決定された開始点である。ブロック４７４の出力において、直接復号化アプリケーション用のオーディオデコーダのためのデータを得ることになる。

一部の側面は装置の文脈で記載されているが、これらの側面は、ブロックまたは装置が方法工程または方法工程の特徴に相当する対応する方法の記載も表すことは明らかである。同様に、方法工程の文脈で記載された側面は対応するブロックまたはアイテム、あるいは対応する装置の特徴の記載も表す。

所定の実施要件によっては、本願発明の実施態様はハードウェアまたはソフトウェアで実施することができる。実施は、例えばそれぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する（または協働することが可能な）、電子的に可読な制御信号を記憶したデジタル記憶媒体、例えばフロッピーディスク、ＤＶＤ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはフラッシュメモリを使用して行うことができる。

本願発明にかかる一部の実施態様は、本明細書に記載の方法の１つが実行できるようにプログラム可能なコンピュータシステムと協働することができる、電子的に可読な制御信号を有するデータキャリアを備える。

該して、本願発明の実施態様はプログラムコードを有するコンピュータプログラム製品として実施することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されると方法の１つを実行するように働く。プログラムコードは例えば機械可読キャリアに記憶されていても良い。

他の実施態様は、機械可読キャリアまたは非一時的記憶媒体に記憶された、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを備える。

換言すれば、本願発明の方法の実施態様はしたがって、コンピュータプログラムがコンピュータで実行された時に本明細書に記載の方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

したがって、本願発明の方法の別の実施態様は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを記録して含む、データキャリア（またはデジタル記憶媒体またはコンピュータ可読媒体）である。

したがって、本願発明の方法の別の実施態様は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは信号シーケンスである。データストリームまたは信号シーケンスは、データ通信接続、例えばインターネットを介して送信されるように構成されても良い。

別の実施態様は、本明細書に記載の方法の１つを実行するように構成されたまたは適応された処理手段、例えばコンピュータまたはプログラム可能な論理装置を含む。

別の実施態様は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムをインストールしたコンピュータを含む。

一部の実施態様において、本明細書に記載の方法の機能の一部または全部を実行するためにプログラム可能な論理装置（例えばフィールドプログラマブルゲートアレイ）が使用されることがある。一部の実施態様において、フィールドプログラマブルゲートアレイは本明細書に記載の方法の１つを実行するためにマイクロプロセッサと協働することがある。概して、方法は任意のハードウェア装置で実行されることが好ましい。

上記の実施態様は、本願発明の原理を単に説明するものである。本明細書に記載の構成および詳細の修正および改変は当業者にとって明確だと理解されるものとする。したがって、本明細書の実施態様の記載および説明に示される具体的な詳細ではなく、特許請求の範囲によってのみ限定されることを意図するものである。

・参考文献目録

[1] "ISO/IEC14496-3 MPEG-4 Information technology ？ Coding of audio-visual obje cts - Part 3: Audio," 2009.

[2] "ETSI ES 201 980 Digital Radio Mondiale; System Specification," 2014.

[3] "ETSI TR 103 590 V1.1.1 (2018-09) "Digital Enhanced Cordless Telecommunicati ons (DECT); Study of Super Wideband Codec in DECT for narrowband, wideband and super-wideband audio communication including options of low delay audio conne ctions (lower than 10 ms framing)".

Claims

オーディオフレームの符号化済みオーディオデータを使用してエラー保護済みフレームを生成するためのオーディオ送信プロセッサであって、前記オーディオフレームのための前記符号化済みオーディオデータは第１の量の情報ユニットと第２の量の情報ユニットとを含み、前記オーディオ送信プロセッサは、
既定の合計数の符号語について基準位置を定義する符号語ラスタを有する符号語フレームを構築するためのフレームビルダー（５０６）であって、前記フレームビルダー（５０６）は、
前記符号語の第１の既定のサブセットの基準位置から始まる前記第１の量の情報ユニットを書き込み、
前記符号語の第２の既定のサブセットの基準位置から始まる前記第２の量の情報ユニットを書き込む
ように構成され、
前記フレームビルダー（５０６）は、前記第２の量の情報ユニットの始まりが符号語境界と一致するように、前記第１の量の情報ユニットと前記第２の量の情報ユニットとの間の境界を決定するように構成される、
フレームビルダー（５０６）と、
前記符号語の前記第１の既定のサブセットの前記符号語のうちの１つ以上を処理して第１の処理結果を得るための、または前記符号語の前記第２の既定のサブセットの前記符号語のうちの１つ以上を処理して第２の処理結果を得て、前記第１の処理結果または前記第２の処理結果を前記既定の数の符号語に加算して前記エラー保護済みフレームを表す複数の処理済み符号語を得るための、または、
前記符号語の前記第１の既定のサブセットまたは前記符号語の前記第２の既定のサブセットの符号語を個別に処理して、前記エラー保護済みフレームを表す複数の処理済符号語を得るための、
エラー保護コーダ（５０８）と、
を備えるオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、前記符号語の前記第２の既定のサブセットの情報容量が前記第２の量の情報ユニットの情報ユニットの量と等しくなるように、前記第２の既定のサブセットの前記情報容量に基づいて、前記第１の量の情報ユニットと前記第２の量の情報ユニットとの間の境界を定義する（６０１）ように構成される、請求項１に記載のオーディオ送信プロセッサ。
オーディオ信号の既定の時間部分を使用して前記第１および前記第２の量の情報ユニットを生成するためのソースエンコーダ（５００）であって、前記情報ユニットはいくつかの必須情報ユニットと可変数の残余情報ユニットを含み、前記ソースエンコーダ（５００）は、前記既定の時間部分について信号に依存して決まる数の前記必須情報ユニットをもたらす可変長符号化規則（６０）を使用するように構成される、ソースエンコーダ（５００）をさらに備え、
前記フレームビルダー（５０６）は、前記符号語フレームが固定サイズの情報ユニットを有するように前記符号語フレームを構築するように構成され、
前記オーディオエンコーダは、前記可変数の残余情報ユニットを、前記符号語フレームのための前記固定サイズの情報ユニットおよび前記必須情報ユニットの数から導出された差分に等しい情報量として決定するように構成される、
請求項１または請求項２に記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、前記第１の量の情報ユニットと前記第２の量の情報ユニットとの間の境界を符号語フレームごとに信号適応的に決定して、符号語フレームの前記オーディオ信号に応じて、前記境界が前記符号語フレームの異なるオーディオ情報に関連する、あるいはオーディオデコーダが異なった解釈をする、符号化済み情報ユニットを表すように構成される、請求項１ないし請求項３のいずれかに記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、前記符号語の前記第２のサブセットとして、前記符号化済みオーディオデータの前記符号語フレームの一方の端で隣接する第２の規定数の符号語を使用し、前記符号語の前記第１の既定のサブセットとして、前記符号化済みオーディオデータの符号語フレームの別の端で隣接する第１の規定数の符号語を使用するように構成され、前記第１の規定数と前記第２の規定数の合計は符号語の前記既定の合計数に等しく、
前記符号語の前記第２の既定のサブセットの少なくとも１つの符号語は、前記符号語の前記第１の既定のサブセットの２つの符号語の間に位置する、または前記符号語の前記第１の既定のサブセットの少なくとも１つの符号語は、前記符号語の前記第２の既定のセットの２つの符号語の間に位置する、
請求項１ないし請求項４のいずれかに記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、
前記符号語の前記第１の既定のサブセットの基準位置を使用して、前記第１の量の情報ユニットを前記符号語の前記第１の既定のサブセットに書き込み、
前記符号語の前記第１の既定のサブセットが満杯になる（６０１）とすぐに、前記符号語の前記第２の既定のサブセットの基準位置を使用して、前記第２の量の情報ユニットを書き込む（６０２）
ように構成され、
前記フレームビルダー（５０６）は、前記境界（６０１）を前記符号語の前記第１の既定のサブセットの最後の符号語に書き込まれた情報ユニットとして、または前記符号語の前記第２の既定のサブセットの最初の符号語の基準位置に書き込まれた最初の情報ユニットとして決定するように構成される、
請求項１ないし請求項５のいずれかに記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、前記第１の量の情報ユニットの前記情報ユニットを、前記第１の規定数の符号語の少なくとも２つの符号語の基準位置をスタートとして第１の書き込み方向に、そして前記第１の規定数の符号語の少なくとも２つの別の符号語の基準位置をスタートとして第２の逆方向に書き込むように構成され、
前記フレームビルダー（５０６）は、前記第２の量の情報ユニットの前記情報ユニットを、前記第２の規定数の符号語の少なくとも２つの符号語の基準位置をスタートとして第１の書き込み方向に、そして前記第２の規定数の符号語の少なくとも２つの別の符号語の基準位置をスタートとして第２の逆方向に書き込むように構成される、
請求項１ないし請求項６のいずれかに記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、前記第１の量の情報ユニットと前記第２の量の情報ユニットを書き込むように構成され、前記第１の量の情報ユニットの前記情報ユニットの少なくとも過半数は、前記第２の量の情報ユニットの前記情報ユニットの過半数よりも心理音響的により重要性が高い、または、
前記第２の量の情報ユニット内の情報ユニットのみが損傷していると判定された場合、オーディオ受信プロセッサにおいては部分的フレーム損失隠蔽のみが想定され、前記第１の量の情報ユニット内の情報ユニットが損傷していると判定された場合には、前記オーディオ受信プロセッサにおいて完全フレーム損失隠蔽が想定される、
請求項１ないし請求項７のいずれかに記載のオーディオ送信プロセッサ。
少なくとも２つのカテゴリーの情報ユニットを生成するためのソースエンコーダ（５００）であって、前記少なくとも２つのカテゴリーは、固定長サイド情報、可変長サイド情報、時間ノイズ整形情報、スペクトルの第１周波数部分の１つ以上の最上位ビット、前記第１周波数部分よりも周波数が高い第２周波数部分の１つ以上の最上位ビット、第１周波数部分の１つ以上の最下位ビットまたは符号ビット、前記第１周波数部分よりも周波数が高い第２周波数部分の１つ以上の最下位ビットまたは符号ビット、および残余ビットから成るグループから選択される、ソースエンコーダ（５００）をさらに備え、
前記固定長サイド情報、前記可変長サイド情報、前記時間ノイズ整形情報、前記第１周波数部分のスペクトルの前記１つ以上の最上位ビット、および第１周波数部分の前記最下位ビットまたは符号ビットは、前記ソースエンコーダ（５００）によってカテゴリーとして生成された場合には、前記第１の量の情報ユニット内に配置され、前記第２の周波数部分の前記１つ以上の最上位ビット、第２周波数部分の前記１つ以上の最下位ビットまたは符号ビット、および前記残余ビットのうちの少なくとも１つは、前記ソースエンコーダ（５００）によってカテゴリーとして生成された場合には、前記第２の量の情報ユニット内に配置される、
請求項１ないし請求項８のいずれかに記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、第１書き込みポインタ（８１０）および第２書き込みポインタ（８１２）を使用するように構成され、
前記フレームビルダー（５０６）は、前記符号語フレーム内のより低い情報ユニット位置から前記符号語フレーム内のより高い情報ユニット位置に向かう方向に、前記第１書き込みポインタ（８１０）を増分させるように構成され、
前記フレームビルダー（５０６）は、前記符号語フレーム内のより高い情報ユニット位置から前記符号語フレーム内のより低い情報位置に向かう方向に、前記第２書き込みポインタ（８１２）を減分させるように構成され、
前記フレームビルダー（５０６）は、前記符号語の前記第１の既定のサブセットの既定の符号語シーケンス内の最初の符号語の始まりを示す基準位置から前記第１書き込みポインタ（８１０）をスタートさせるように構成され、
前記フレームビルダー（５０６）は、前記符号語の前記第１の既定のセットの前記既定の第１符号語シーケンス内の最後の符号語の末尾を示す基準位置から前記第２書き込みポインタ（８１２）をスタートさせるように構成され、
前記フレームビルダー（５０６）は、前記第１書き込みポインタ（８１０）が示す位置の前記第１の量の情報ユニットから、情報ユニットの第１カテゴリーの１つ以上に属する情報ユニットを書き込むように構成され、
前記フレームビルダー（５０６）は、前記第２書き込みポインタ（８１２）が示す位置の前記第１の量の情報ユニットから、情報ユニットの第２カテゴリーの１つ以上に属する情報ユニットを、前記第１および第２の書き込みポインタ（８１０、８１２）が遭遇情報ユニット位置で互いに遭遇するまで書き込むように構成され、
前記遭遇情報ユニット位置の前記情報ユニットは、前記第１の量の情報ユニットと前記第２の量の情報ユニットとの間の境界を表す、
請求項１ないし請求項９のいずれかに記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は
前記第１ポインタ（８１０）を、前記符号語の前記第２の既定のサブセットの第２の既定の符号語シーケンスの最初の符号語の始まりを示す基準位置にセットし、
前記第２書き込みポインタ（８１２）を、前記符号語の前記第２の既定のサブセットの前記第２の既定の符号語シーケンスの最後の符号語の末尾を示す基準位置にセットし、
前記第１書き込みポインタ（８１０）を使用して前記第２の量の情報ユニットから情報ユニットの第３カテゴリーの１つ以上を書き込み、前記第２書き込みポインタ（８１２）を使用して、前記第２の量の情報ユニットから情報ユニットの第４カテゴリーの１つ以上を書き込む、
ように構成される、請求項１０に記載のオーディオ送信プロセッサ。
前記情報ユニットの第１カテゴリーの１つ以上は、時間ノイズ整形情報および／または第１周波数部分のスペクトルの１つ以上の最上位ビットのうちの少なくとも１つを含み、
前記情報ユニットの第２カテゴリーの１つ以上は、固定長サイド情報、可変長サイド情報および前記第１周波数部分の最下位ビットまたは符号ビットのうちの少なくとも１つを含み、
前記情報ユニットの第３カテゴリーの１つ以上は、第２周波数部分の最上位ビットのうちの少なくとも１つを含み、
前記情報ユニットの第４カテゴリーの１つ以上は、前記第２周波数部分の最下位ビットまたは符号ビット、および残余データのうちの少なくとも１つを含む、
請求項１０または請求項１１に記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、
前記第１カテゴリーの１つ以上として、周波数に関して昇順に順序付けられた、前記遭遇情報ユニットのスペクトル値またはスペクトル値の組み合わせまでのスペクトル値から導出された最上位ビットを使用し、
前記第２カテゴリーの１つ以上として、前記遭遇情報ユニットのスペクトル値またはスペクトル値の組み合わせまでのスペクトル値から導出された最下位ビットまたは符号ビットを使用し、
前記第３カテゴリーの１つ以上として、前記遭遇情報ユニットにおける値以上の周波数に関連付けられた１つ以上の最上位ビットを使用し、
前記第４のカテゴリーとして、前記遭遇情報ユニットに関連付けられた周波数値以上の周波数に関連付けられた最下位ビットまたは符号ビットを使用する、
ように構成される、請求項１０ないし請求項１２のいずれかに記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、前記第１カテゴリーの１つ以上と前記第２カテゴリーの１つ以上、あるいは前記第３カテゴリーの１つ以上と前記第４カテゴリーの１つ以上を互いに同期させて書き込み、スペクトル値またはスペクトル値の組み合わせの前記少なくとも１つ以上の最上位ビットは前記第１書き込みポインタ（８１０）によって書き込まれ、同じ前記スペクトル値または同じ前記スペクトル値の組み合わせの前記１つ以上の最下位ビットまたは符号ビットは、別のスペクトル値または別のスペクトル値の組み合わせからの情報ユニットが前記書き込みポインタ（８１０、８１２）によって書き込まれる前に書き込まれるように構成される、請求項１３に記載のオーディオ送信プロセッサ。
前記符号化済みオーディオデータをスタート位置から終了位置まで伸張する中間表現で生成するためのソースエンコーダ（５００）をさらに備え、前記フレームビルダー（５０６）は前記中間表現の前記符号化済みオーディオデータを前記符号語の前記第１および第２の既定のサブセットに表される順番で並び替える（５０２）ように構成される、請求項１ないし請求項１４のいずれかに記載のオーディオ送信プロセッサ。
前記フレームビルダー（５０６）は、
前記符号語の前記第１の既定のサブセットの容量によって表される既定の情報ユニット量が得られるまで、前記スタート位置から前記終了位置まで読み込みおよび構文解析（２０２）を行い、
前記読み込みおよび構文解析済みの情報ユニットを前記符号語の前記第１の既定のサブセットに書き込み（２０６）、前記容量によって定められる前記既定の情報ユニット量が読み込み・構文解析された時に得られる前記中間情報ユニットの間の残りの情報ユニットを前記符号語の前記第２の既定のサブセットに書き込む、
ように構成される、請求項１５に記載のオーディオ送信プロセッサ。
符号化された時間ノイズ整形データ、サイド情報データおよび前記最上位データ部分および前記最下位データ部分が読み込まれて前記符号語の前記第１の既定のサブセットに書き込まれ、特定の周波数を越えるスペクトル値の最上位データ部分および最下位データ部分、ならびに残余データは、前記符号語の前記第２の既定のサブセットに書き込まれる、請求項１６に記載のオーディオ送信プロセッサ。
前記符号語の前記第２の既定のサブセットのいくつかの符号語は、前記エラー保護コードの特性および／または前記複数の処理済み符号語の総サイズから導出される、請求項１ないし請求項１７のいずれかに記載のオーディオ送信プロセッサ。
前記エラー保護コーダ（５０８）は、
前記第１の処理結果を第１のハッシュ値として計算（２１０）し、
前記第２の処理結果を第２のハッシュ値として計算（２１２）し、
前記第１のハッシュ値を前記符号語の前記第１の既定のサブセットに加算（２１４）し、前記第２のハッシュ値を前記符号語の前記第２の既定のサブセットに加算（２１４）し、
符号語単位のブロックコードを適用して前記エラー保護済み符号語を取得するように構成される、請求項１ないし請求項１８のいずれかに記載のオーディオ送信プロセッサ。
最小サイズのデータ部分を情報ユニットの第１粒度で生成する算術エンコーダ（６０）を有するオーディオエンコーダ（５００）をさらに備え、
前記エラー保護コーダ（５０８）は情報ユニットの第２粒度で動作するように構成され、
前記第１粒度は前記第２粒度と異なる、
請求項１ないし請求項１９のいずれかに記載のオーディオ送信プロセッサ。
前記第１粒度は前記第２粒度よりも大きく、
前記第１粒度及び前記第２粒度の間の粒度差分に相当する適応した量の情報ユニットが、前記第１の既定のサブセットの最初の符号語の基準位置に存在する、
請求項２０に記載のオーディオ送信プロセッサ。
前記第１粒度は前記第２粒度より整数倍大きく、前記適応した量の情報ユニットは、前記符号語の前記第２の既定のサブセットの符号語の基準位置に位置するデータとともに、前記算術エンコーダ（６０）が出力する前記最小サイズのデータ部分を表す、請求項２１に記載のオーディオ送信プロセッサ。
エラー保護済みフレームを処理するためのオーディオ受信プロセッサであって、
前記エラー保護済みフレームを受信して、受信したエラー保護済みフレームを得るための受信インターフェース（３００）と、
前記受信したエラー保護済みフレームを処理して符号化済みオーディオフレームを得るためのエラー保護プロセッサ（３０２）であって、前記エラー保護プロセッサは前記符号化済みオーディオフレームの符号語の第１の既定のサブセットの符号語がエラーを含むかをチェックするように構成される、エラー保護プロセッサ（３０２）と、
前記符号語の前記第１の既定のサブセット内にエラーが検出された時に、フレーム損失隠蔽動作を実行する、またはフレーム損失隠蔽指示を生成するように構成される、エラー隠蔽器またはエラー隠蔽指示器（３０４）と、
を備える、オーディオ受信プロセッサ。
前記エラー保護プロセッサ（３０２）は、前記符号化済みオーディオフレームの符号語の第２の既定のサブセットがエラーを含むかをチェックする（４０６）ように構成され、
前記エラー隠蔽器または前記エラー隠蔽指示器（３０４）は、前記符号語の前記第２の既定のサブセット内のエラーを隠蔽するために、部分的フレーム損失隠蔽動作（４１０）を実行するまたは部分的フレーム損失隠蔽指示を生成するように構成される、
請求項２３に記載のオーディオ受信プロセッサ。
前記符号語の前記第１の既定のサブセットに含まれる前記符号化済みオーディオデータを復号化するためのオーディオデコーダ（３０８）をさらに備え、前記オーディオデコーダ（３０８）は、前記エラー保護プロセッサ（３０２）が前記符号語の前記第１の既定のサブセット内にエラーを検知しなかったときに復号化を実行するように前記エラー保護プロセッサ（３０２）によって制御されるように構成される、請求項２３または請求項２４に記載のオーディオ受信プロセッサ。
前記エラー保護プロセッサ（３０２）は前記受信したエラー保護済みフレームにブロック復号化動作を適用して、復号化された前記符号語の既定の第１のサブセットおよび復号化された前記符号語の第２の既定のサブセットを得るように構成され、
前記ブロック復号化動作によってエラーの存在がシグナリングされなかった場合、前記エラー保護プロセッサは、
前記符号語の前記第１の既定のサブセットから第１のハッシュ値を算出し（４０２）、
前記第１のハッシュ値を受信した第１のハッシュ値と比較する（４０４、４０６）
ように構成され、
前記エラー保護プロセッサは、前記第１のハッシュ値と前記受信した第１のハッシュ値が互いに一致しなかった場合には、前記符号語の前記第１の既定のサブセット内にエラーが存在すると判定する、または前記第１のハッシュ値と前記受信した第１のハッシュ値が一致する場合には、前記符号語の前記第１の既定のサブセットにエラーはないと判定するように構成される、
請求項２３ないし請求項２５のいずれかに記載のオーディオ受信プロセッサ。
前記エラー保護プロセッサ（３０２）は前記受信したエラー保護済みフレームにブロック復号化動作を適用して、復号化された前記符号語の第１の既定のサブセットおよび復号化された前記符号語の第２の既定のサブセットを得るように構成され、
前記ブロック復号化動作によってエラーの存在がシグナリングされなかった場合、前記エラー保護プロセッサは、
前記符号語の前記第２の既定のサブセットから第２のハッシュ値を算出し（４０６）、
前記第２のハッシュ値を受信した第２のハッシュ値と比較する（４０４、４０６）
ように構成され、
前記エラー保護プロセッサは、前記第２のハッシュ値と前記受信した第２のハッシュ値が互いに一致しなかった場合には、前記符号語の前記第２の既定のサブセット内にエラーが存在すると判定する、または前記第２のハッシュ値と前記受信した第２のハッシュ値が一致する場合には、前記符号語の前記第２の既定のサブセットにエラーはないと判定するように構成される、
請求項２３ないし請求項２６のいずれかに記載のオーディオ受信プロセッサ。
前記ブロック復号化動作はリード・ソロモン復号化動作を含む、請求項２６または請求項２７に記載のオーディオ受信プロセッサ。
前記エラー保護プロセッサ（３０２）は、前記符号語の前記第１の既定のサブセットのチェックによってエラーが検出されなかった場合にのみ、前記符号語の前記第２の既定のサブセットがエラーを含むかをチェックするように構成される、請求項２３ないし請求項２８のいずれかに記載のオーディオ受信プロセッサ。
前記エラー保護プロセッサ（３０２）は、前記符号語の前記第２の既定のサブセットのうち１つ以上の特定の符号語がエラーを含むか、そして前記符号語の前記第２の既定のサブセットのうち任意の符号語がエラーのない符号語であるかを検出するように構成され、
前記エラー隠蔽器（４０３）は前記１つ以上の特定の符号語のための代替データまたはエラー隠蔽指示を生成するように構成され、
前記オーディオ受信プロセッサは、前記符号語の前記第１の既定のサブセットに含まれるオーディオデータおよび前記符号語の前記第２の既定のサブセットのうちのエラーのない符号語のうちの１つ以上に含まれるオーディオデータ、ならびに前記１つ以上の特定の符号語（４２８）のための前記代替データを復号化するためのオーディオデコーダ（３０８）を備える、または、
前記オーディオ受信プロセッサは、前記符号語の前記第１の既定のサブセットに含まれるオーディオデータおよび前記符号語の前記第２の既定のサブセットのうちの前記エラーのない符号語のうちの１つ以上に含まれるオーディオデータを復号化するためのオーディオデコーダ（３０８）を備え、前記オーディオデコーダ（３０８）は前記エラー隠蔽指示を受信して、前記エラー隠蔽指示に応答してエラー隠蔽措置を講じるように構成される、
請求項２３ないし請求項２９のいずれかに記載のオーディオ受信プロセッサ。
前記符号語の前記第１の既定のサブセットおよび前記符号語の前記第２の既定のサブセットを識別する既定のフレーム読み込み手順に従って前記符号化済みオーディオフレームを読み込むためのフレーム読み込み器（３０６）をさらに備える、請求項２３ないし請求項３０のいずれかに記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は、
前記符号語の前記第１の既定のサブセットの全ての符号語からの情報ユニットが読み込まれるまで、前記符号語の前記第１の既定のサブセットの符号語の基準点からスタートする第１の量の情報ユニットの情報ユニットを読み込み、
前記符号語の前記第２の既定のサブセットの符号語の基準点からスタートする第２の量の情報ユニットの情報ユニットを読み込む
ように構成され、
前記オーディオ受信プロセッサはオーディオデコーダをさらに含み、前記オーディオデコーダ（３０８）は前記符号化済みオーディオフレームのための復号化済みオーディオデータを得るために、前記第１の量の情報ユニットと前記第２の量の情報ユニットの連結を復号化するように構成される、
請求項３１に記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は、前記符号語の前記第２のサブセットとして、前記符号化済みオーディオデータの前記符号語フレームの一方の端にある、第２の規定数の隣接符号語の数を使用し、前記符号語の前記第１の既定のサブセットとして、前記符号化済みオーディオデータの前記符号語フレームのもう一方の端にある、第１の規定数の隣接符号語を使用するように構成され、前記第１の規定数と前記第２の規定数の合計は符号語の前記既定の総数に等しい、または、
前記符号語の前記第２の既定のサブセットの少なくとも１つの符号語は、前記符号語の前記第１の既定のサブセットの２つの符号語の間に位置する、または前記符号語の前記第１の既定のサブセットの少なくとも１つの符号語は、前記符号語の前記第２の既定のサブセットの２つの符号語の間に位置する、
請求項３１または請求項３２に記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は前記第１の量の情報ユニットの情報ユニットを、前記第１の規定数の符号語のうちの少なくとも２つの符号語の基準位置からスタートして第１の読み込み方向に、そして前記第１の規定数の符号語のうちの少なくとも２つの別の符号語の基準位置からスタートして第２の逆の読み込み方向に、読み込むように構成される、または、
前記フレーム読み込み器（３０６）は前記第２の量の情報ユニットの情報ユニットを、前記第２の規定数の符号語のうちの少なくとも２つの符号語の基準位置からスタートして第１の読み込み方向に、そして前記第２の規定数の符号語のうちの少なくとも２つの別の符号語の基準位置からスタートして第２の逆の読み込み方向に、読み込むように構成される、請求項３１ないし請求項３３のいずれかに記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は、前記第１の量の情報ユニットおよび前記第２の量の情報ユニットの情報ユニットを読み込むように構成され、前記第１の量の情報ユニットの少なくとも過半数の前記情報ユニットは、前記第２の量の情報ユニットの過半数の情報ユニットよりも心理音響的により重要性が高い、または、
前記第２の量の情報ユニット内の情報ユニットのみが損傷していると判定された場合には、部分的フレーム損失隠蔽のみが前記エラー隠蔽器によって実行され、前記第１の量の情報ユニット内の情報ユニットが損傷していると判定された場合には、完全フレーム損失隠蔽が前記エラー隠蔽器によって実行される、
請求項３１ないし請求項３４のいずれかに記載のオーディオ受信プロセッサ。
少なくとも２つのカテゴリーの情報ユニットを復号化するためのソースデコーダ（３０８）であって、前記少なくとも２つのカテゴリーは、固定長サイド情報、可変長サイド情報、時間ノイズ整形情報、スペクトルの第１周波数部分のスペクトルの１つ以上の最上位ビット、前記第１周波数部分よりも周波数が高い第２周波数部分の１つ以上の最上位ビット、第１周波数部分の１つ以上の最下位ビットまたは符号ビット、前記第１周波数部分よりも周波数が高い第２周波数部分の１つ以上の最下位ビットまたは符号ビット、および残余ビットから成るグループから選択される、ソースデコーダ（３０８）をさらに備え、
前記ソースデコーダ（３０８）によってカテゴリーとして復号化に利用可能な場合には、前記固定長サイド情報、前記可変長サイド情報、前記時間ノイズ整形情報、前記第１周波数部分のスペクトルの前記１つ以上の最上位ビット、および第１周波数部分の前記最下位ビットまたは符号ビットは、前記第１の量の情報ユニット内にあり、前記ソースデコーダ（３０８）によってカテゴリーとして復号化に利用可能な場合には、前記第２の周波数部分の前記１つ以上の最上位ビット、第２周波数部分の前記１つ以上の最下位ビットまたは符号ビット、および前記残余ビットのうちの少なくとも１つは、前記第２の量の情報ユニット内にある、
請求項３１ないし請求項３５のいずれかに記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は、
第１読み込みポインタ（４４４）および第２読み込みポインタ（４４６）を使用し、
前記符号語フレーム内のより低い情報ユニット位置から前記符号語フレーム内のより高い情報ユニット位置に向かう方向に、前記第１読み込みポインタ（４４４）を増分させ、
前記符号語フレーム内のより高い情報位置から前記符号語フレーム内のより低い情報位置に向かう方向に、前記第２読み込みポインタ（４４６）を減分させ、
前記符号語の前記第１の既定のサブセットの既定の符号語シーケンス内の最初の符号語の始まりを示す基準位置から前記第１読み込みポインタ（４４４）をスタートさせ、
前記符号語の前記第１の既定のセットの前記既定の第１符号語シーケンス内の最後の符号語の末尾を示す基準位置から前記第２読み込みポインタ（４４６）をスタートさせ、
前記第１読み込みポインタ（４４４）が示す位置の前記第１の量の情報ユニットから、情報ユニットの第１カテゴリーの１つ以上に属する情報ユニットを読み込み、
前記第２読み込みポインタ（４４６）が示す位置の前記第１の量の情報ユニットから、情報ユニットの第２カテゴリーの１つ以上に属する情報ユニットを、前記第１および第２の読み込みポインタ（４４４、４４６）が遭遇情報ユニット位置で互いに遭遇するまで読み込む
ように構成され、
前記遭遇情報ユニット位置の前記情報ユニットは、前記第１の量の情報ユニットと前記第２の量の情報ユニットとの間の境界を表す、
請求項３１ないし請求項３６のいずれかに記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は
前記第１読み込みポインタ（４４４）を、前記符号語の前記第２の既定のサブセットの第２の既定の符号語シーケンスの最初の符号語の始まりを示す基準位置にセットし、
前記第２読み込みポインタ（４４６）を、前記符号語の前記第２の既定のサブセットの前記第２の既定の符号語シーケンスの最後の符号語の末尾を示す基準位置にセットし、
前記第１読み込みポインタ（４４４）を使用して前記第２の量の情報ユニットから情報ユニットの第３カテゴリーの１つ以上を読み込み、前記第２読み込みポインタ（４４６）を使用して、前記第２の量の情報ユニットから情報ユニットの第４カテゴリーの１つ以上を読み込む
ように構成される、請求項３７に記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は、
前記第１カテゴリーの１つ以上として、周波数に関して昇順に順序付けられた、前記遭遇情報ユニットのスペクトル値またはスペクトル値の組み合わせまでのスペクトル値から導出された最上位ビットを使用し、
前記第２カテゴリーの１つ以上として、前記遭遇情報ユニットのスペクトル値またはスペクトル値の組み合わせまでのスペクトル値から導出された最下位ビットまたは符号ビットを使用し、
前記第３カテゴリーの１つ以上として、前記遭遇情報ユニットにおける値以上の周波数に関連付けられた１つ以上の最上位ビットを使用し、
前記第４のカテゴリーとして、前記遭遇情報ユニットに関連付けられた周波数値以上の周波数に関連付けられた最下位ビットまたは符号ビットを使用する
ように構成される、請求項３７または請求項３８に記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は、前記第１カテゴリーの１つ以上と前記第２カテゴリーの１つ以上、あるいは前記第３カテゴリーの１つ以上と前記第４カテゴリーの１つ以上を互いに同期させて読み込んで、スペクトル値またはスペクトル値の組み合わせの前記少なくとも１つ以上の最上位ビットは前記第１読み込みポインタ（４４４）によって読み込まれ、同じ前記スペクトル値または同じ前記スペクトル値の組み合わせの前記１つ以上の最下位ビットまたは符号ビットは、別のスペクトル値または別のスペクトル値の組み合わせからの情報ユニットが前記読み込みポインタ（４４４、４４６）によって読み込まれる前に読み込まれるように構成される、請求項３９に記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は第１読み込み方向で第１読み込みポインタ（４４４）を使用し、第２読み込み方向で第２ポインタ（４４６）を使用するように構成され、前記符号化済みオーディオフレームはフレーム開始位置およびフレーム終了位置を備え、前記フレーム読み込み器（３０６）は前記第１ポインタを、前記符号語の前記第２の既定のサブセットに含まれるいくつかの情報ユニットから導出される第１ポインタスタート位置にセットし、前記第２ポインタ（４４６）を前記フレーム終了位置に設定するように構成され、前記符号語の前記第１の既定のサブセットはすべて、前記符号化済みオーディオフレームの前記フレーム終了位置を有する側に配置され、
前記フレーム読み込み器（３０６）は、
対応する読み込み方向に前記第１読み込みポインタ（４４４）を増分し、前記第２読み込みポインタ（４４６）を減分して読み込み、
前記第１および第２読み込みポインタ（４４４、４４６）が遭遇位置で互いに遭遇したときに停止し、
前記フレーム開始位置と前記第１ポインタスタート位置との間の情報ユニットを、前記第１ポインタスタート位置と前記遭遇位置との間の情報ユニットと交換して、並び替えられた符号化済みオーディオフレームが、前記並び替え済みオーディオフレームの冒頭から、前記第１ポインタスタート位置と前記遭遇位置との間で読み込まれた情報ユニット、前記フレーム開始位置と前記第１ポインタスタート位置との間の前記符号化済みオーディオフレームの情報ユニット、および前記遭遇位置と前記フレーム終了位置との間の前記符号化済みオーディオフレームの情報ユニットを、上記の順番で含むようにする
ように構成され、
前記並べ替えられた符号化済みオーディオフレームの順番で前記符号化済みオーディオデータを有する前記並べ替えられた符号化済みオーディオフレームを復号化するようにあらかじめ設定されたオーディオデコーダ（３０８）をさらに備える、または
前記並び替えられた符号化済みオーディオフレームを離れた場所に送信するための送信デバイスをさらに備える、
請求項３１ないし請求項４０のいずれかに記載のオーディオ受信プロセッサ。
前記フレーム読み込み器（３０６）は第１読み込み方向で第１読み込みポインタ（４４４）を使用し、第２読み込み方向で第２ポインタ（４４６）を使用するように構成され、前記符号化済みオーディオフレームはフレーム開始位置及びフレーム終了位置を備え、前記フレーム読み込み器（３０６）は前記第２ポインタ（４４６）を、前記符号語の前記第２の既述のサブセットに含まれるいくつかの情報ユニットおよび前記符号化済みフレームの情報ユニットの総数から導出される第２ポインタスタート位置にセットし、前記第１読み込みポインタ（４４４）を前記フレーム開始位置に設定するように構成され、前記符号語の前記第１の既定のサブセットはすべて、前記符号化済みオーディオフレームの前記フレーム開始位置を有する側に配置され、
前記フレーム読み込み器（３０６）は、
対応する読み込み方向に前記第１読み込みポインタ（４４４）を増分し、前記第２読み込みポインタ（４４６）を減分して読み込み、
前記第１および第２読み込みポインタ（４４４、４４６）が遭遇位置で互いに遭遇したときに停止し、
前記フレーム終了位置と前記第２ポインタスタート位置との間の情報ユニットを、前記第２ポインタスタート位置と前記遭遇位置との間の情報ユニットと交換して、並び替えられた符号化済みオーディオフレームが、前記フレーム開始位置と前記遭遇位置との間の情報ユニット、前記フレーム終了位置と前記第２ポインタスタート位置との間の前記符号化済みオーディオフレームの情報ユニット、および前記遭遇位置と前記第２ポインタスタート位置との間の前記符号化済みオーディオフレームの情報ユニットを、前記並び替えられた符号化済みオーディオフレームの冒頭から上記の順番で含むようにする
ように構成される、
請求項３１ないし請求項４０のいずれかに記載のオーディオ受信プロセッサ。
最小データサイズ部分を情報ユニットの第１粒度で受信する算術デコーダ（７２）を有するオーディオデコーダ（３０８）をさらに備え、
前記エラー保護プロセッサ（３０２）は第２粒度で動作するように構成され、前記第１粒度は前記第２粒度よりも大きく、
前記第１粒度及び前記第２粒度の間の粒度差分に相当する適応した量の情報ユニットが、前記符号語の前記第１の既定のサブセットの最初の符号語の基準位置に存在し、
前記適応した量の情報ユニットは、前記第２の既定のサブセットの符号語の基準位置に位置するデータとともに、前記算術デコーダ（７２）に入力される前記最小データサイズ部分を形成し、
前記フレーム読み込み器（３０６）は、前記符号語の前記第１の既定のサブセットについて、前記最初の符号語の前記基準位置によって決定される前記最初の符号語内の位置に前記適応した量の大きさを加えた場所から情報ユニットの読み込みを開始するように構成される、
請求項２３ないし請求項４２のいずれかに記載のオーディオ受信プロセッサ。
オーディオフレームの符号化済みオーディオデータを使用してエラー保護済みフレームを生成するための方法であって、前記オーディオフレームのための前記符号化済みオーディオデータは第１の量の情報ユニットと第２の量の情報ユニットとを含み、前記方法は、
既定の合計数の符号語について基準位置を定義する符号語ラスタを有する符号語フレームを構築するためのステップであって、
前記符号語の第１の既定のサブセットの基準位置から始まる前記第１の量の情報ユニットを書き込むステップと、
前記符号語の第２の既定のサブセットの基準位置から始まる前記第２の量の情報ユニットを書き込むステップと、
前記第２の量の情報ユニットの始まりの情報ユニットが符号語境界と一致するように、前記第１の量の情報ユニットと前記第２の量の情報ユニットとの間の境界を決定するステップと、
を含む、構築するステップ、および
前記符号語の前記第１の既定のサブセットの前記符号語のうちの１つ以上を処理して第１の処理結果を得る、または前記符号語の前記第２の既定のサブセットの前記符号語のうちの１つ以上を処理して第２の処理結果を得て、前記第１の処理結果または前記第２の処理結果を前記既定の数の符号語に加算して前記エラー保護済みフレームを表す複数の処理済み符号語を得るステップ、または
前記符号語の前記第１の既定のサブセットまたは前記符号語の前記第２の既定のサブセットの符号語を個別に処理して、前記エラー保護済みフレームを表す複数の処理済符号語を得るステップ
を含む、エラー保護処理を実行するステップ
を含む方法。
エラー保護済みフレームを処理する方法であって、
前記エラー保護済みフレームを受信して、受信したエラー保護済みフレームを得るステップと、
前記受信したエラー保護済みフレームでエラー保護処理を実行して符号化済みオーディオフレームを得るステップであって、前記エラー保護処理は、前記符号化済みオーディオフレームの符号語の第１の既定のサブセットの符号語がエラーを含んでいるかをチェックするステップを含む、エラー保護処理を実行するステップと、
前記符号語の前記第１の既定のサブセットにエラーが検出された場合にフレーム損失隠蔽動作を実行するステップと、
を含む方法。
コンピュータまたはプロセッサ上で実行された時に、請求項４４または請求項４５に記載の方法を実行するためのコンピュータプログラム。