JP5926377B2 - サンプルレートスケーラブル可逆オーディオコーディング - Google Patents

サンプルレートスケーラブル可逆オーディオコーディング Download PDF

Info

Publication number
JP5926377B2
JP5926377B2 JP2014518944A JP2014518944A JP5926377B2 JP 5926377 B2 JP5926377 B2 JP 5926377B2 JP 2014518944 A JP2014518944 A JP 2014518944A JP 2014518944 A JP2014518944 A JP 2014518944A JP 5926377 B2 JP5926377 B2 JP 5926377B2
Authority
JP
Japan
Prior art keywords
signal
sample rate
encoded
additional
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014518944A
Other languages
English (en)
Other versions
JP2014524045A (ja
Inventor
エス ヴィントン,マーク
エス ヴィントン,マーク
キュー ロビンソン,チャールズ
キュー ロビンソン,チャールズ
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2014524045A publication Critical patent/JP2014524045A/ja
Application granted granted Critical
Publication of JP5926377B2 publication Critical patent/JP5926377B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ信号の符号化、および符号化オーディオ信号の復号のために使用することができる方法およびデバイスに関する。
符号化オーディオ信号を復号および処理するために受信器で必要となる計算資源は、オーディオチャネルの数および各チャネルにおけるオーディオ信号のサンプルレートによって直接影響を受ける。44.1kHz以下のサンプルレートを有する2つのチャネル信号は、コンパクトディスクに格納されたオーディオ情報を処理する用途など、多くの用途で使用されてきたが、現在の開発では、将来的な用途において、さらに高いサンプルレートでさらに多くのチャネルを処理するであろうことを示している。例えば、デジタルシネマ用途では、受信器は、96kHz以上のサンプルレートで、128以上のチャネルを処理することが必要となる可能性があることが予想される。多数のチャネルおよび高サンプルレートは、受信器において、経済的な魅力を無くすほど多くの計算資源を必要とする可能性がある。
受信器で必要とされる計算資源の量は、受信器が、復号オーディオ情報を、復号処理においてできる限り早くより低いサンプルレートに変換することによって減らすことができ、その結果、その処理において後続する動作を、より効率的に実行することができる。本手法は、サンプルレートの高品質な変換を実行するために必要な計算資源が、復号処理の後続部分での減少以下である場合、ほぼオフセットする可能性があるので、魅力的ではない。
受信器で必要となる計算資源の量は、コーディングシステムにおける最も有能ではない受信器で処理されるのに十分低いサンプルレートに送信器が変換することによって減らすことができる。本手法には、コーディングシステム内のすべての受信器が、その受信器が有する計算資源の量にかかわらず、低サンプルレート信号を処理しなければならないので、深刻な欠点がある。受信器は、復号オーディオ信号を、より高いレートに変換することができるが、その変換は、もとの高サンプルレート信号の品質レベルを完全には回復しない。さらに、受信器は、前述のようなサンプルレートにおける高品質変換を実行するために、かなりの計算資源を必要とする可能性がある。あるいは、送信器は、異なるサンプルレートに対して、複数のバージョンの符号化オーディオ信号を生成することができるが、この手法は、符号化信号の配信および格納において、新しい問題を生み出す可能性がある。
特許文献1は、階層符号化処理を実行する符号化装置について説明する。
関連出願の相互参照
本出願は、2011年7月1日に出願された、米国仮特許出願第61/504,005号、および2012年4月20日に出願された、米国仮特許出願第61/636,516号に基づく優先権を主張し、いずれも、あらゆる目的に対し全体が参照により本明細書に組み込まれる。
米国特許出願公開第2005/0091051号明細書
本発明の目的は、受信器によって効率的に処理され、計算資源に見合ったサンプルレートを有する出力オーディオ信号を送達することができる、符号化オーディオ信号を生成するためのコーディングシステムのための方法を提供することである。
この目的は、本発明の様々な態様を実現する方法およびデバイスによって達成される。送信器は、様々なサンプルレートで、オーディオ信号の符号化表現を搬送する符号化出力信号を生成する。様々なサンプルレートでの表現は、計算集約的で、非常に高品質なサンプルレート変換方法を使用して、送信器で生成することができる。各符号化表現は、非常に効率的に復号することができる形式で生成される。受信器は、所望のサンプルレートを有するオーディオ信号を取得するために必要とされる符号化信号の部分のみを復号することができる。
計算資源が非常に限られている受信器では、比較的低いサンプルレートを有するオーディオ信号を生成するために必要な処理しか実行することができない。より多くの計算資源を有する受信器では、より高いサンプルレートを有するオーディオ信号を生成するために必要な処理を実行することができる。結果として、受信器は、利用可能な計算資源の量に対して適切なサンプルレートで、より高品質なオーディオ信号を復号および処理することが可能である。
本発明の一態様によれば、送信器は、第1のサンプルレートでオーディオ信号を表すデジタルサンプルを備える第1の信号を取得し、第1のサンプルレートとは異なり、第1のサンプルレートより高いサンプルレートでオーディオ信号を表すデジタルサンプルをそれぞれが備える1つまたは複数の追加の信号を取得し、各追加の信号と各追加の信号のサンプルレートに等しいサンプルレートに変換された第1の信号との間の差を表すサンプルをそれぞれが備える1つまたは複数の差信号を生成し、第1の可逆符号化器を第1の信号に適用して、第1のサンプルレートでオーディオ信号を表すサンプルを備える第1の符号化信号を生成し、第1の可逆符号化器は、第1のコーディングパラメータに応じて動作を適応させ、送信器はさらに、1つまたは複数の追加の可逆符号化器を1つまたは複数の差信号に適用して1つまたは複数の追加の符号化信号を生成し、各追加の可逆符号化器は、差信号の各1つに適用され、そのサンプルレートで各差信号を表すサンプルを備える各追加の符号化信号を生成し、各追加の可逆符号化器は、関連するコーディングパラメータに応じてそれ自体の動作を適合させ、送信器はさらに、第1の符号化信号、1つまたは複数の追加の符号化信号、ならびに第1のコーディングパラメータ、および1つまたは複数の追加の可逆符号化器と関連したコーディングパラメータの表現を搬送する符号化出力信号を生成することによりオーディオ信号を符号化する。
本発明の別の態様によれば、受信器は、第1のサンプルレートでオーディオ情報を表すサンプルを備える第1の符号化信号と、第1のサンプルレートよりも高い異なるサンプルレートでのオーディオ情報をそれぞれ表すサンプルをそれぞれ備える1つまたは複数の追加の符号化信号と、可逆符号化器によって第1の符号化信号を生成するために使用された第1のコーディングパラメータと、1つまたは複数の追加の符号化信号を生成するために使用された1つまたは複数の追加の可逆符号化器と関連したコーディングパラメータとを搬送する符号化オーディオ信号を受信し、符号化オーディオ信号を処理して、第1の符号化信号と、第1のコーディングパラメータと、少なくともいくつかの追加の符号化信号と、少なくともいくつかの追加の符号化信号を生成するために使用された各追加の可逆符号化器に対して対応するコーディングパラメータとを取得し、第1の可逆復号器を第1の符号化信号に適用することによって、第1の信号を生成し、第1の可逆復号器は、第1のコーディングパラメータに応じてそれ自体の動作を適合させ、受信器はさらに、各追加の可逆復号器を少なくともいくつかの追加の符号化信号のそれぞれに適用することによって1つまたは複数の追加の信号を生成し、各可逆復号器は、関連するコーディングパラメータに応じてそれ自体の動作を適合させ、受信器はさらに、各追加の信号と各追加の信号のサンプルレートに等しいサンプルレートに変換された第1の信号との和をそれぞれが表す1つまたは複数の加算信号を生成し、第1の信号と1つまたは複数の加算信号とを備える信号のセット内の少なくとも1つの信号から出力信号を生成し、第1の信号は、第1のサンプルレートでオーディオ信号を表すデジタルサンプルを備え、各それぞれの加算信号は、第1のサンプルレートとは等しくないそれぞれのサンプルレートでオーディオ信号を表すデジタルサンプルを備えることにより、符号化オーディオ信号を復号する。
本発明の様々な特徴および好ましい実装態様は、以下の説明、および、いくつかの図において同様の参照番号が同様の構成要素を意味する添付図面を参照することによって、より理解されるであろう。以下の説明および図面の内容は、例示目的のみのために記載され、本発明の範囲を限定することを意味するものと理解されるべきではない。
本発明の様々な態様による、オーディオ信号を符号化するために使用することができるデバイスの模式的なブロック図である。 本発明の様々な態様による、符号化オーディオ信号を復号するために使用することができるデバイスの模式的なブロック図である。 図1で図示したデバイスに組み込むことができるデバイスの模式的なブロック図である。 図1に図示したデバイスに使用することができる可逆符号化器の例示的な実装態様の模式的なブロック図である。 図2に図示したデバイスに使用することができる可逆復号器の例示的な実装態様の模式的なブロック図である。 本発明の様々な態様を実現するために使用することができるデバイスの模式的なブロック図である。
A.序論
1.送信器
a)基本実装態様
図1は、本発明の様々な態様を組み込む、オーディオ信号を符号化するための送信器の一実装態様を示す模式的なブロック図である。図面に描いた機能のいくつかはオプションである。
本実装態様の変形例の1つにおいて、送信器100は、パス111から第1の信号を取得し、パス121から第2の信号を取得する。第1の信号は、例えば、48kHzなどの第1のサンプルレートでオーディオ信号を表すデジタルサンプルを備える。第2の信号は、例えば、96kHzなどの、第1のサンプルレートよりも高い第2のサンプルレートでオーディオ信号を表すデジタルサンプルを備える。これらの2つの信号は、以下に記載するように、後に受信器内で復号されて、第1の信号、第2の信号、またはこれら2つの信号の両方の正確な複製を回復することができる符号化信号を生成するよう処理される。
レート変換器112は、第1の信号を、第2のサンプルレートでデジタルサンプルを備える第1の中間信号に変換する。
減算器122は、第2の信号と第1の中間信号との対応するサンプル間の差を算出することによって、第2のサンプルレートでサンプルを備える第1の差信号を生成する。
可逆符号化器116は、第1の信号に適用され、パス117に沿ってフォーマッタ108に向かう、第1の符号化信号を生成する。この第1の符号化信号は、第1のサンプルレートで第1の信号を表すサンプルを備える。可逆符号化器116は、符号化器の性能を最適化するよう調整することが可能な値を備える第1のコーディングパラメータに応じて、その動作を適合させる。第1のコーディングパラメータは、パス118に沿って、フォーマッタ108に向かう。
可逆符号化器126は、減算器122から受信した第1の差信号に適用され、パス127に沿ってフォーマッタ108に向かう第2の符号化信号を生成する。この第2の符号化信号は、第2のサンプルレートで第1の差信号を表すサンプルを備える。可逆符号化器126は、符号化器の性能を最適化するよう調整することが可能な値を備える第2のコーディングパラメータに応じて、その動作を適合させる。第2のコーディングパラメータは、パス128に沿って、フォーマッタ108に向かう。
フォーマッタ108は、第1の符号化信号、第2の符号化信号、ならびに、第1のコーディングパラメータおよび第2のコーディングパラメータを表すデータを、伝送または格納するために適切な符号化出力信号に組み立てる。これには、信号を復号する際に使用するための、誤差検出訂正コード、通信同期ワード、およびコーディングメタデータを含むことができる。これらの詳細は、実際の実装態様では重要である可能性があるが、本発明では原理的には重要ではない。符号化出力信号は、パス109を通り、伝送または格納される。
b)さらなる特徴および変更例
レート変換器112の動作は、所望により適合させることができる。動作が適合されると、機能特性を確定するパラメータが、パス113に沿ってフォーマッタ108に向かい、符号化出力信号に組み立てられる。
所望であれば、送信器100は、異なるサンプルレートを有する3つ以上の信号を処理することができる。図1に示す実装態様は、パス131から受信した第3の信号を処理するために必要な構成要素を備える。第3の信号は、例えば、192kHzなどの第3のサンプルレートでオーディオ信号を表すデジタルサンプルを備える。
レート変換器114は、第2の信号を、第3のサンプルレートでデジタルサンプルを備える第2の中間信号に変換する。随意選択的に、レート変換器114は、第1の信号に適用され、第1の信号を第2の中間信号に変換することができる。いずれの実装態様においても、レート変換器114の動作は、所望により適合させることができる。動作が適合されると、機能特性を確定するパラメータが、パス115に沿ってフォーマッタ108に向かい、符号化出力信号に組み立てられる。送信器100は、レート変換器114への入力を適応的に変更することができる場合、入力の選択に関する指示のいくつかは、符号化出力信号に含まれるべきであり、その結果、コンパニオン受信器200は、レート変換器218に対する入力を適切に選択することができる。
減算器132は、第3の信号と第2の中間信号との対応するサンプル間の差を算出することによって、第3のサンプルレートでサンプルを備える第2の差信号を生成する。
可逆符号化器136は、減算器132から受信した第2の差信号に適用され、パス137に沿ってフォーマッタ108に向かう第3の符号化信号を生成する。この第3の符号化信号は、第3のサンプルレートで第2の差信号を表すサンプルを備える。可逆符号化器136は、符号化器の性能を最適化するよう調整することが可能な値を備える第3のコーディングパラメータに応じて、その動作を適合させる。第3のコーディングパラメータは、パス138に沿って、フォーマッタ108に向かう。
フォーマッタ108は、第3の符号化信号と、第3のコーディングパラメータを表すデータとを符号化出力信号に組み立てる。
送信器100の実装態様は、異なるサンプルレートを有する4つ以上の信号に対して信号を処理するのと同じ方法で拡張することができる。
図3は、送信器100とは別々に、または送信器100に組み込んで使用され、第1の信号、第2の信号、および単一のソースオーディオ信号からの第3の信号などの任意の追加の信号を取得することができるデバイスの模式的なブロック図である。サンプルレート変換器103は、パス101から受信したソースオーディオ信号に適用され、ソースオーディオ信号のサンプルレートとは異なるサンプルレートでソースオーディオ信号を表す信号を取得する。遅延部102を使用して、同じサンプルレートでソースオーディオ信号を表すが、サンプルレート変換器103によって生成した信号と時間的に整列される信号を取得する。オプションのサンプルレート変換器104を使用して、他の2つのサンプルレートとは異なるサンプルレートでソースオーディオ信号を表す信号を取得することができる。各サンプルレート変換器は、より高い、またはより低いサンプルレートに変換することができる。追加の遅延部品を、必要に応じて、2つのサンプルレート変換器の信号パスに挿入して、すべての出力信号間での適切な時間整列をもたらすことができる。しかしながら、サンプルレート変換器103、104が、遅延部102によってもたらされる遅延と等しい遅延を課すよう設計された場合、追加の遅延部品は必要ない。サンプルレート変換器を有する追加の信号処理パスは、より多くのサンプルレートを有する信号が所望される場合に追加することができる。
図3に図示するデバイスが、図1に示す送信器実装態様と共に使用される場合、遅延部102、サンプルレート変換器103、およびサンプルレート変換器104の各出力は、信号パス111、121、および131のいずれかに結合することができる。例えば、2サンプルレートシステムにおいて、遅延部102は、信号パス111に結合することができ、サンプルレート変換器103は、信号パス121に結合することができる。あるいは、3サンプルレートシステムにおいて、遅延部102は、信号パス121に結合することができ、サンプルレート変換器103は、信号パス131に結合することができ、サンプルレート変換器104は、信号パス111に結合することができる。
一実装態様において、パス101から受信したソースオーディオ信号は、48kHzのサンプルレートを有する。遅延部102は、第1の信号としてソースオーディオ信号の遅延複製を、パス111に通す。サンプルレート変換器103は、ソースオーディオ信号を、96kHzのサンプルレートを有する第2の信号に変換し、この信号を、パス121に通す。第3のサンプルレートが必要とされる場合、サンプルレート変換器104は、ソースオーディオ信号を、192kHzのサンプルレートを有する第3の信号に変換し、この信号を、パス131に通す。
別の実装態様において、パス101から受信したソースオーディオ信号は、96kHzのサンプルレートを有する。遅延部102は、第2の信号としてソースオーディオ信号の遅延された複製を、パス121に通す。サンプルレート変換器103は、ソースオーディオ信号を、48kHzのサンプルレートを有する第1の信号に変換し、この信号を、パス111に通す。第3のサンプルレートが必要とされる場合、サンプルレート変換器104は、ソースオーディオ信号を、192kHzのサンプルレートを有する第3の信号に変換し、この信号を、パス131に通す。
上記のサンプルレートおよびサンプルレート変換ファクタは、単なる例示である。
2.受信器
図2は、本発明の様々な態様を組み込む、符号化オーディオ信号を復号するための受信器の一実装態様を示す模式的なブロック図である。図面に描いた機能のいくつかはオプションである。
この実装態様の一変形例において、受信器200は、パス201から符号化オーディオ信号を受信する。符号化オーディオ信号は、第1の符号化信号、第2の符号化信号、ならびに、第1のコーディングパラメータおよび第2のコーディングパラメータを表すデータを搬送する。第1の符号化信号は、例えば、48kHzなどの第1のサンプルレートでオーディオ情報を表す。第2の符号化信号は、例えば、96kHzなどの、第1のサンプルレートよりも高い第2のサンプルレートでオーディオ情報を表す。第1のコーディングパラメータは、第1の符号化信号を生成した可逆符号化器によって使用された。第2のコーディングパラメータは、第2の符号化信号を生成した可逆符号化器によって使用された。
デフォーマッタ202は、受信器200の他の構成要素によって必要とされるあらゆる情報を含んで抽出する情報に適切な方法で、符号化オーディオ信号を処理する。必要とされる情報は、以下の段落で説明するように、適切な構成要素に通される。
可逆復号器215は、パス211から受信した第1の符号化信号に適用され、その信号を処理して、パス216に向けて第1の信号を生成する。可逆復号器215は、デフォーマッタ202からパス212を通って受信した第1のコーディングパラメータに応じて、その動作を適合させる。これらのパラメータの値は送信器100によって、復号器の性能を最適化するよう調整することができる。コーディング処理の可逆性のため、可逆復号器215によって出力された第1の信号は、符号化オーディオ信号を生成した送信器100における可逆符号化器116に入力された第1の信号と同一である。
可逆復号器225は、パス221から受信した第2の符号化信号に適用され、その信号を処理して、パス226に向けて第2の信号を生成する。可逆復号器225は、デフォーマッタ202からパス222を通って受信した第2のコーディングパラメータに応じて、その動作を適合させる。これらのパラメータの値は送信器100によって、復号器の性能を最適化するよう調整することができる。コーディング処理の可逆性のため、可逆復号器225によって出力された第2の信号は、符号化オーディオ信号を生成した送信器100における可逆符号化器126に入力された第2の信号と同一である。
レート変換器217は、第1の信号を、第2のサンプルレートでデジタルサンプルを備える第1の中間信号に変換する。変換器217は、それが提供する第1の中間信号が、符号化オーディオ信号を生成した送信器100におけるレート変換器112によってもたらされた第1の中間信号と同一となるように動作する。
加算器228は、第1の中間信号と第2の信号との対応するサンプルの合計を算出することによって、第2のサンプルレートでサンプルを備える第1の加算信号を生成する。
セレクタ208は、受信器200内の他の構成要素によってもたらされる信号のセット内の少なくとも1つの信号を選択することによって、パス209に向けて出力オーディオ信号を生成する。ここに記載した実装態様において、この信号のセットは、第1の信号および第1の加算信号を含む。第1の信号を選択することによって、出力オーディオ信号は、第1のサンプルレートでソースオーディオ信号を表す。第1の加算信号を選択することによって、出力オーディオ信号は、第2のサンプルレートでソースオーディオ信号を表す。
所望であれば、受信器200は、第1のサンプルレートのみでオーディオ信号を出力することができる。この場合、可逆復号器225、レート変換器217、加算器228、およびセレクタ208は必要ない。この構成は、非常に限られた計算資源を有する受信器200が、受信器100における非常に高品質のサンプルレート変換から取得された高品質で低サンプルレートの信号をもたらすことができるため、魅力的である。受信器200が、第2のサンプルレートのみでオーディオ信号を出力する場合、セレクタ208は必要とされない。
a)さらなる特徴および変更例
レート変換器217の動作は、適合させることができる。動作を適合させる場合、機能特性を確定するパラメータが、デフォーマッタ202からパス213を通って受信される。
所望であれば、受信器200は、3つ以上のサンプルレートに対して符号化信号を搬送する符号化オーディオ信号を処理することができる。図2に示す実装態様は、第3のサンプルレートを処理するために必要な構成要素を備える。この実装態様では、パス201から受信した符号化オーディオ信号もまた、第3の符号化信号、および第3のコーディングパラメータを表すデータを搬送する。第3の符号化信号は、例えば、192kHzなどの、第1のサンプルレートよりも高く、第2のレートに等しくない第3のサンプルレートでオーディオ情報を表す。第3のコーディングパラメータは、第3の符号化信号を生成した可逆符号化器によって使用された。
可逆復号器235は、パス231から受信した第3の符号化信号に適用され、その信号を処理して、パス236に向けて第3の信号を生成する。可逆復号器235は、デフォーマッタ202からパス232を通って受信した第3のコーディングパラメータに応じて、その動作を適合させる。これらのパラメータの値は、送信器100によって、復号器の性能を最適化するよう調整することができる。コーディング処理の可逆性のため、可逆復号器235によって出力された第3の信号は、符号化オーディオ信号を生成した送信器100における可逆符号化器136に入力された第3の信号と同一である。
レート変換器218は、第2の信号を、第3のサンプルレートでデジタルサンプルを備える第2の中間信号に変換する。変換器218は、それが提供する第2の中間信号が、符号化オーディオ信号を生成した送信器100におけるレート変換器114によってもたらされた第2の中間信号と同一となるように動作する。
レート変換器218は、符号化器内のレート変換器114が第1の信号に適用された場合、代わりに第1の信号に適用されるべきである。送信器100が、レート変換器114への入力を適応的に変更できる場合、入力を選択する指示の一部は、符号化出力信号に含まれる。受信器200は、この指示に応じて、レート変換器218に対する適切な入力を適応的に選択する。レート変換器218の動作は、適合させることができる。動作を適合させる場合、機能特性を確定するパラメータが、デフォーマッタ202からパス223を通って受信される。
加算器238は、第2の中間信号と第3の信号との対応するサンプルの合計を算出することによって、第3のサンプルレートでサンプルを備える第2の加算信号を生成する。
受信器200の実装態様は、異なるサンプルレートを有する4つ以上の信号に対して信号を処理するのと同じ方法で拡張することができる。
B.実装態様のさらなる詳細
1.可逆符号化器
送信器100の可逆符号化器は、様々な方法で実現することができる。
実装態様の選択は、コーディング性能に重要な影響を与えるが、可逆符号化器の実装態様は、本発明に特に重要ではない。
一実装態様を、図4の模式的なブロック図に示す。この図は、可逆符号化器116に関するが、可逆符号化器126および136も同じ方法で実現することができる。この実装態様では、符号化器の入力信号は、パス111から受信する。自己相関器41は、入力信号を解析して、変動するサンプルオフセットでのデジタルサンプル間の類似点の測定値を取得する。
サンプルの類似点の取得した測定値は、反射係数生成器42によって使用されて、線形予測フィルタ45に対する反射係数のセットを生成する。反射係数生成器42は、レヴィンソン−ダービンのアルゴリズムを使用して、予測フィルタ45に対する反射係数のセットを導出し、予測誤差信号のエネルギーを最小にする。この誤差信号は、パス111から受信した入力信号と入力信号のフィルタによる予測との間の差である。反射係数は、量子化器43によって量子化され、パス118に通される。
量子化された反射係数は、予測フィルタの詳細をもたらすが、量子化された反射係数は、直接型係数に変換され、有限インパルス応答(FIR)フィルタとして予測フィルタを実現しなければならない。直接型係数変換器44は、この変換を実行し、直接型係数を、線形予測フィルタ45に通す。
各直接型係数は、FIRフィルタにおける各タップに対する係数である。
フィルタ45の出力からのサンプルは、加算器46により、入力信号のサンプルに加えられる。この加算器から取得したサンプルは、予測誤差信号であり、符号化器47に通され、符号化される。直接型係数変換器44から受信したフィルタ係数の符号により、線形予測フィルタ45が、入力信号に対して反転した予測信号を生成するので、加算器46が、その出力で、入力信号と予測信号との間の差をもたらすことを説明するのに役立つ可能性がある。
予測フィルタのこの特定の実装態様についてのさらなる詳細は、ProakisおよびManolakisによる「Digital Signal Processing Principles, Algorithms, and Applications」Prentice Hall,International Editions,3rd editionから得ることができ、参照により本明細書に組み込まれる。特に327〜329ページ、503ページ、504ページ、512ページ、および865〜868ページを参照。
符号化器47は、符号化処理を予測誤差信号に適用し、符号化表現を、パス117に通す。符号化処理は、算術コーディングまたはハフマンコーディングなどのエントロピーコーディング処理であることが好ましい。
可逆符号化器の他の実装態様は、2003年12月16日に発行された米国特許第6,664,913号明細書「Lossless Coding Method for Waveform Data」に記載され、参照により本明細書に組み込まれる。
2.可逆復号器
受信器200の可逆復号器はまた、様々な方法で実現することができるが、それらの実装態様は、送信器100における可逆符号化器の実装態様に対して相補的であるべきであり、したがって、符号化器および復号器のエンドツーエンドコーディング効果は可逆である。
上記した可逆符号化器の実装態様に相補的である可逆復号器の一実装態様は、図5の模式的なブロック図により示す。この図は、可逆復号器215に関するが、可逆符号化器225および235も同じ方法で実装することができる。この実装態様では、符号化オーディオ信号は、パス211から受信する。復号器54は、復号処理を符号化オーディオ信号に適用し、復号表現を、パス55に通す。符号化処理は、符号化オーディオ信号を生成した送信器100における符号化器47によって適用された符号化処理の適切な逆である、算術的コーディングまたはハフマンコーディングなどの、エントロピーコーディング処理であることが好ましい。
直接型係数変換器57は、量子化された反射係数をパス212から受信し、それらを直接型係数に変換し、次いで、この直接型係数を線形予測フィルタ58に通す。各直接型係数は、FIRフィルタにおける各タップに対する係数である。
フィルタ58の出力からのサンプルは、加算器56により、復号信号のサンプルに加えられる。この加算から得られたサンプルは、予測信号を備え、この予測信号は、パス216に通され、線形予測フィルタ58に入力される。
さらなる詳細は、上記した、ProakisおよびManolakisによる文献から得ることができる。
可逆復号器の他の実装態様は、上記した、米国特許第6,664,913号明細書で説明される。
3.サンプルレート変換
サンプルレートの変換は、送信器100のレート変換器112および114、ならびに受信器200のレート変換器217および218で実行され、さらに、図3に示したサンプルレート変換器103および104で実行される。
サンプルレート変換は、いくつかの整数ファクタによってサンプルレートを増加するようサンプル間の補完をすることによって、いくつかの整数ファクタによりサンプルレートを減らすようサンプルを間引くことによって、または、有理であるが整数ではないファクタによるサンプルレートの変更を達成するように補完とその後に続く間引きを組み合わせることによって、達成することができる。これらの動作は、既知の技術を使用するFIRフィルタによって実現することができる。さらなる詳細は、ProakisおよびManolakisによる「Introduction to Digital Signal Processing,」Macmillan Publishing Co.,1988から得ることができ、参照により本明細書に組み込まれる。特に、654〜673ページを参照。
サンプルレート変換の品質または確度は、変換を行うために使われるフィルタの種類と設計により大きく変わる可能性がある。一般に、より高品質の変換には、より長いフィルタが必要となり、より低品質の変換をもたらすより短いフィルタよりも多くの計算資源を必要とする。
好ましい実装態様では、高品質サンプルレート変換は、サンプルレート変換器103および104で実行されるべきである。より低品質の変換は、図1および図2に示す残りの変換器で許容可能であるが、送信器100および受信器200における相補的な変換は、正確に同じ結果を実現するべきである。レート変換器112から得られた第1の中間信号は、レート変換器217から得られた第1の中間信号と同一であるべきであり、レート変換器114から得られた第2の中間信号は、レート変換器218から得られた第2の中間信号と同一であるべきである。
一実装態様では、より高いレートに変換する場合に、ハーフバンドFIRフィルタを使用して、図1および図2に示すレート変換器を実現する。図3に示すサンプルレート変換器は、128個のタップを有する高次FIRフィルタによって実現される。
C.実装態様
本発明の様々な態様を組み込むデバイスは、汎用コンピュータで見られるものと同様の構成要素に結合されたデジタル信号プロセッサ(DSP)回路などの、より専門化された構成要素を含むコンピュータまたはいくつかの他のデバイスによって実行されるソフトウェアを含む様々な方法で実現することができる。図6は、本発明の態様を実現するために使用することができるデバイス70の模式的なブロック図である。プロセッサ72は、計算資源を提供する。RAM73は、処理を行うためにプロセッサ72によって使用されるシステムランダムアクセスメモリ(RAM)である。ROM74は、デバイス70を動作するために必要なプログラムを格納し、場合により本発明の様々な態様を実行するための、リードオンリーメモリ(ROM)などの、何らかの形式の永続的記憶装置を表す。I/O制御部75は、通信チャネル76および77による信号の受信および送信のためのインターフェース回路を表す。示した実施形態において、主なシステム構成要素のすべては、バス71に接続される。このバス71は、1つより多くの物理的または論理的バスを表すことができるが、バスアーキテクチャは、本発明を実施するために必要ではない。
汎用コンピュータシステムによって実現される実施形態では、追加の構成要素が備えられ、キーボードもしくはマウス、およびディスプレイなどのデバイスを接続することができ、さらに、磁気テープもしくはディスク、または光学媒体などの記憶媒体を有する記憶デバイスを制御することができる。記憶媒体を使用して、システム、ユーティリティならびにアプリケーションを動作させるための命令についてのプログラムを記録することができ、さらに、本発明の様々な態様を実現するプログラムを備えることができる。
本発明の様々な態様を実現するために必要な機能を実施するための手段は、ディスクリート論理部品、集積回路、1つまたは複数のASIC、および/またはプログラム制御プロセッサを含む、幅広く様々な方法で実装される、電子部品とすることができる。プログラム制御プロセッサで実行することによって本発明を実施するプログラムは、従来のプログラム設計手法を使用して設計することができ、従来のプログラミング言語で書くことができる。これらの構成要素およびプログラムを実装する方法は、本発明には重要ではない。
本発明のプログラム実装態様は、記憶媒体を含む様々な機械読取り可能媒体で搬送することができる。そのような媒体は、磁気テープ、カードもしくはディスク、光カードもしくは光ディスク、および紙を含む媒体上で検出可能なマーキングを含めて何らかの記録技術を本質的に使用して情報を記録する非一時媒体である。

Claims (17)

  1. オーディオ信号を符号化する方法であって
    第1のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する第1の信号を取得する、前記第1の信号は、前記第1のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する入力信号の遅延により得られるステップと、
    前記第1のサンプルレートよりも高い第2のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する第2の信号を取得する、前記第2の信号は、前記入力信号のサンプルレート変換により得られるステップと、
    前記第1の信号を、前記第2のサンプルレートのデジタルサンプルを有する第1の中間信号に変換する、前記第1の中間信号を取得するための前記サンプルレート変換の品質は、前記第2の信号を取得するための前記サンプルレート変換の品質よりも低いステップと、
    前記第2の信号と前記第1の中間信号との対応するサンプル間の差を表す第2のサンプルレートのサンプルを有する第1の差信号を生成するステップと、
    第1のコーディングパラメータに応じてそれ自体の動作を適合させる第1の可逆符号化器を前記第1の信号に適用して、前記第1のサンプルレートで前記第1の信号を表すサンプルを有する第1の符号化信号を生成するステップと、
    第2のコーディングパラメータに応じてそれ自体の動作を適合させる第2の可逆符号化器を前記第1の差信号に適用して、前記第2のサンプルレートで前記第1の差信号を表すサンプルを有する第2の符号化信号を生成するステップと、
    前記第1の符号化信号と、前記第2の符号化信号と、前記第1のコーディングパラメータおよび前記第2のコーディングパラメータの表現とを搬送する符号化出力信号を生成するステップとを有する、方法。
  2. 前記第2のサンプルレートよりも高い第3のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する第3の信号を取得するステップと、
    前記第1の信号または前記第2の信号を、前記第3のサンプルレートのデジタルサンプルを有する第2の中間信号に変換するステップと、
    前記第3のサンプルレートで、前記第3の信号と前記第2の中間信号との対応するサンプル間の差を表すサンプルを有する第2の差信号を生成するステップと、
    第3のコーディングパラメータにそれ自体の動作を適合させる第3の可逆符号化器を前記第2の差信号に適用して、前記第3のサンプルレートで前記第2の差信号を表すサンプルを有する第3の符号化信号を生成するステップと、
    前記第3の符号化信号および前記第3のコーディングパラメータの表現も搬送する前記符号化出力信号を生成するステップとを有する、請求項1に記載の方法。
  3. 前記入力信号または前記第2の信号のいずれかのサンプルレート変換から、前記第3の信号を取得するステップを有する、請求項2に記載の方法。
  4. 前記第1の可逆符号化器を前記第1の信号に適用して、第1の予測誤差信号を生成し、エントロピー符号化器を前記第1の予測誤差信号に適用して、前記第1の符号化信号を生成するステップであって、前記第1の予測誤差信号の生成は、第1の予測フィルタを前記第1の信号に適用することを有し、前記第1の可逆符号化器は、予測フィルタ係数を表す前記第1のコーディングパラメータに応じて前記第1の予測フィルタを適合することによってそれ自体の動作を適合させるステップと、
    前記第2の可逆符号化器を前記第1の差信号に適用して、第2の予測誤差信号を生成し、エントロピー符号化器を前記第2の予測誤差信号に適用して、前記第2の符号化信号を生成するステップであって、前記第2の予測誤差信号の生成は、第2の予測フィルタを前記第1の差信号に適用することを有し、前記第2の可逆符号化器は、予測フィルタ係数を表す前記第2のコーディングパラメータに応じて前記第2の予測フィルタを適合することによってそれ自体の動作を適合させるステップと、
    前記第3の可逆符号化器を前記第2の差信号に適用して、第3の予測誤差信号を生成し、エントロピー符号化器を前記第3の予測誤差信号に適用して、前記第3の符号化信号を生成するステップであって、前記第3の予測誤差信号の生成は、第3の予測フィルタを前記第2の差信号に適用することを有し、前記第3の可逆符号化器は、予測フィルタ係数を表す前記第3のコーディングパラメータに応じて前記第3の予測フィルタを適合することによってそれ自体の動作を適合させるステップとを有する、請求項3に記載の方法。
  5. 前記第1の可逆符号化器を前記第1の信号に適用して、第1の予測誤差信号を生成し、エントロピー符号化器を前記第1の予測誤差信号に適用して、前記第1の符号化信号を生成するステップであって、前記第1の予測誤差信号の生成は、第1の予測フィルタを前記第1の信号に適用することを有し、前記第1の可逆符号化器は、予測フィルタ係数を表す前記第1のコーディングパラメータに応じて前記第1の予測フィルタを適合することによってそれ自体の動作を適合させるステップと、
    前記第2の可逆符号化器を前記第1の差信号に適用して、第2の予測誤差信号を生成し、エントロピー符号化器を前記第2の予測誤差信号に適用して、前記第2の符号化信号を生成するステップであって、前記第2の予測誤差信号の生成は、第2の予測フィルタを前記第1の差信号に適用することを有し、前記第2の可逆符号化器は、予測フィルタ係数を表す前記第2のコーディングパラメータに応じて前記第2の予測フィルタを適合することによってそれ自体の動作を適合させるステップとを有する、請求項1に記載の方法。
  6. オーディオ信号を符号化するための装置であって、
    第1のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する第1の信号を受信する第1の端末と、
    前記第1のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する入力信号の遅延バージョンとして前記第1の端末に前記第1の信号を提供する遅延部と、
    前記第1のサンプルレートよりも高い第2のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する第2の信号を受信する第2の端末と、
    前記入力信号を前記第2のサンプルレートに変換することによって前記第2の端末に前記第2の信号を提供するサンプルレート変換器と、
    前記第1の端末に結合され、前記第1の信号を、前記第2のサンプルレートのデジタルサンプルを有する第1の中間信号に変換する第1のサンプルレート変換器であって、前記第1の中間信号を取得するための前記サンプルレート変換の品質は、前記第2の信号を取得するための前記サンプルレート変換の品質よりも低い第1のサンプルレート変換器と、
    前記第1のサンプルレート変換器および前記第2の端末に結合されて、前記第2のサンプルレートで、前記第2の信号および前記第1の中間信号の対応するサンプル間の差を表すサンプルを有する第1の差信号を生成する、第1の差計算器と、
    前記第1の端末に結合され、前記第1の信号に適用されて前記第1のサンプルレートで前記第1の信号を表すサンプルを有する第1の符号化信号を生成する、第1のコーディングパラメータに応じてそれ自体の動作を適合させる第1の可逆符号化器と、
    前記第1の差計算器に結合され、前記第1の差信号に適用されて前記第2のサンプルレートで前記第1の差信号を表すサンプルを有する第2の符号化信号を生成し、第2のコーディングパラメータに応じてそれ自体の動作を適合させる第2の可逆符号化器と、
    前記第1の可逆符号化器および前記第2の可逆符号化器に結合されて、前記第1の符号化信号と、前記第2の符号化信号と、前記第1のコーディングパラメータおよび前記第2のコーディングパラメータの符号化表現とを搬送する符号化出力信号を生成するフォーマッタとを有する、装置。
  7. 前記第2のサンプルレートよりも高い第3のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する第3の信号を受信する第3の端末と、
    前記第1の端末に結合されて、前記第1の信号を前記第3のサンプルレートでデジタルサンプルを有する第2の中間信号に変換するか、または前記第2の端末に結合されて、前記第2の信号を前記第2の中間信号に変換する第2のサンプルレート変換器と、
    第2のサンプルレート変換器および前記第3の端末に結合されて、前記第3のサンプルレートで、前記第3の信号および前記第2の中間信号の対応するサンプル間の差を表すサンプルを有する第2の差信号を生成する第2の差計算器と、
    前記第2の差計算器に結合され、前記第2の差信号に適用されて前記第3のサンプルレートで前記第2の差信号を表すサンプルを有する第3の符号化信号を生成し、第3のコーディングパラメータに応じてそれ自体の動作を適合させる第3の可逆符号化器と、
    前記第3の可逆符号化器に結合され、前記第3の符号化信号および前記第3のコーディングパラメータの符号化表現も搬送するような前記符号化出力信号を生成する前記フォーマッタとを有する、請求項6に記載の装置。
  8. 前記入力信号または前記第2の信号のいずれかを前記第3のサンプルレートに変換することによって前記第3の端末に前記第3の信号を提供する第2のサンプルレート変換器と有する、請求項7に記載の装置。
  9. 前記第1の可逆符号化器は、前記第1の端末に結合された第1の予測フィルタと、前記第1の予測フィルタに結合された第1のエントロピー符号化器とを備えて、前記第1の符号化信号を生成し、前記第1の予測フィルタは、予測フィルタ係数を表す前記第1のコーディングパラメータに応じてそれ自体の動作を適合させ、
    前記第2の可逆符号化器は、前記第1の差計算器に結合された第2の予測フィルタと、前記第2の予測フィルタに結合された第2のエントロピー符号化器とを備えて、前記第2の符号化信号を生成し、前記第2の予測フィルタは、予測フィルタ係数を表す前記第2のコーディングパラメータに応じてそれ自体の動作を適合させ、
    前記第3の可逆符号化器は、前記第2の差計算器に結合された第3の予測フィルタと、前記第3の予測フィルタに結合された第3のエントロピー符号化器とを備えて、前記第3の符号化信号を生成し、前記第3の予測フィルタは、予測フィルタ係数を表す前記第3のコーディングパラメータに応じてそれ自体の動作を適合させる、請求項7に記載の装置。
  10. 前記第1の可逆符号化器は、前記第1の端末に結合された第1の予測フィルタと、前記第1の予測フィルタに結合された第1のエントロピー符号化器とを備えて、前記第1の符号化信号を生成し、前記第1の予測フィルタは、予測フィルタ係数を表す前記第1のコーディングパラメータに応じてそれ自体の動作を適合させ、
    前記第2の可逆符号化器は、前記第1の差計算器に結合された第2の予測フィルタと、前記第2の予測フィルタに結合された第2のエントロピー符号化器とを備えて、前記第2の符号化信号を生成し、前記第2の予測フィルタは、予測フィルタ係数を表す前記第2のコーディングパラメータに応じてそれ自体の動作を適合させる、請求項6に記載の装置。
  11. オーディオ信号を符号化する方法であって、
    第1のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する第1の信号を取得するステップと、
    前記第1の信号の前記サンプルレートを変換することによって1つまたは複数の追加の信号を取得する、前記1つまたは複数の追加の信号のそれぞれは、前記第1のサンプルレートよりも高い異なるサンプルレートで前記オーディオ信号を表すデジタルサンプルを備えるステップと、
    各追加の信号と前記各追加の信号の前記サンプルレートに等しいサンプルレートに変換された前記第1の信号との間の差を表すサンプルをそれぞれが有する1つまたは複数の差信号を生成する、前記第1の信号を、前記各追加の信号の前記サンプルレートに等しい前記サンプルレートに変換するための前記サンプルレート変換の品質は、前記各追加の信号を取得するための前記サンプルレート変換の品質よりも低いステップと、
    第1のコーディングパラメータに応じてそれ自体の動作を適合させる第1の可逆符号化器を前記第1の信号に適用して、前記第1のサンプルレートで前記オーディオ信号を表すサンプルを有する第1の符号化信号を生成するステップと、
    1つまたは複数の追加の可逆符号化器を前記1つまたは複数の差信号に適用して、1つまたは複数の追加の符号化信号を生成する、各追加の可逆符号化器は、前記差信号の各1つに適用され、そのサンプルレートで前記各差信号を表すサンプルを有する各追加の符号化信号を生成し、前記各追加の可逆符号化器は、関連するコーディングパラメータに応じてそれ自体の動作を適合させるステップと、
    前記第1の符号化信号、前記1つまたは複数の追加の符号化信号、ならびに前記第1のコーディングパラメータおよび前記1つまたは複数の追加の可逆符号化器と関連した前記コーディングパラメータの表現を搬送する符号化出力信号を生成するステップとを有する、方法。
  12. 前記第1の可逆符号化器を前記第1の信号に適用して、第1の予測誤差信号を生成し、エントロピー符号化器を前記第1の予測誤差信号に適用して、前記第1の符号化信号を生成するステップであって、前記第1の予測誤差信号の生成は、第1の予測フィルタを前記第1の信号に適用することを備え、前記第1の可逆符号化器は、予測フィルタ係数を表す前記第1のコーディングパラメータに応じて前記第1の予測フィルタを適合することによってそれ自体の動作を適合させるステップと、
    前記各追加の可逆符号化器を、前記各差信号に適用して、各追加の予測誤差信号を生成し、エントロピー符号化器を、前記各追加の予測誤差信号に適用して、前記各追加の符号化信号を生成するステップであって、前記各追加の予測誤差信号の生成は、各追加の予測フィルタを前記各差信号に適用することを有し、前記各追加の可逆符号化器は、各予測フィルタ係数を表す関連するコーディングパラメータに応じて前記各追加の予測フィルタを適合することによってそれ自体の動作を適合させるステップとを有する、請求項11に記載の方法。
  13. オーディオ信号を符号化するための装置であって、
    第1のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する第1の信号を取得する手段と、
    前記第1の信号の前記サンプルレートを変換することによって1つまたは複数の追加の信号を取得する手段であって、前記1つまたは複数の追加の信号のそれぞれは、前記第1のサンプルレートよりも高い異なるサンプルレートで前記オーディオ信号を表すデジタルサンプルを備える手段と、
    各追加の信号と前記各追加の信号の前記サンプルレートに等しいサンプルレートに変換された前記第1の信号との間の差を表すサンプルをそれぞれが有する1つまたは複数の差信号を生成する手段であって、前記第1の信号を、前記各追加の信号の前記サンプルレートに等しい前記サンプルレートに変換するための前記サンプルレート変換の品質は、前記各追加の信号を取得するための前記サンプルレート変換の品質よりも低い手段と、
    第1のコーディングパラメータに応じてそれ自体の動作を適合させる第1の可逆符号化器を使用して、前記第1の信号から第1の符号化信号を生成する手段と、
    前記1つまたは複数の差信号から、1つまたは複数の追加の符号化信号を生成する手段であって、各追加の可逆符号化器は、前記差信号の各1つに適用され、そのサンプルレートで前記各差信号を表すサンプルを有する各追加の符号化信号を生成し、前記各追加の可逆符号化器は、関連するコーディングパラメータに応じてそれ自体の動作を適合させる手段と、
    前記第1の符号化信号、前記1つまたは複数の追加の符号化信号、ならびに前記第1のコーディングパラメータおよび前記1つまたは複数の追加の可逆符号化器と関連した前記コーディングパラメータの表現を搬送する符号化出力信号を生成する手段とを有する、装置。
  14. 前記第1の符号化信号を生成する前記手段は、第1の予測フィルタを使用して、前記第1の信号から第1の予測誤差信号を生成し、エントロピー符号化器を前記第1の予測誤差信号に適用して、前記第1の符号化信号を生成し、前記第1の予測フィルタは、予測フィルタ係数を表す前記第1のコーディングパラメータに応じてそれ自体の動作を適合させ、
    前記1つまたは複数の追加の符号化信号を生成する前記手段は、各追加の予測フィルタを使用して、前記各差信号から各追加の予測誤差信号を生成し、エントロピー符号化器を前記各追加の予測誤差信号に適用して、前記各追加の符号化信号を生成し、前記各追加の予測フィルタは、それぞれの予測フィルタ係数を表す関連するコーディングパラメータに応じてそれ自体の動作を適合させる、請求項13に記載の装置。
  15. 符号化オーディオ信号を復号する方法であって、
    第1のサンプルレートでオーディオ情報を表すサンプルを有する第1の符号化信号と、前記第1のサンプルレートよりも高い第2のサンプルレートでオーディオ情報を表すサンプルを有する第2の符号化信号とを搬送する前記符号化オーディオ信号を受信するステップであって、前記第2のサンプルレートでの前記オーディオ情報は、前記第1のサンプルレートから前記第2のサンプルレートへのオーディオ入力信号の第1のサンプルレート変換によって生成される第1のオーディオ信号と、前記第1のサンプルレートから前記第2のサンプルレートへの前記オーディオ入力信号の遅延バージョンの第2のサンプルレート変換によって生成される第2のオーディオ信号との間の差を表し、前記第1のサンプルレート変換の品質は、前記第2のサンプルレート変換の品質よりも高く、および前記符号化オーディオ信号はさらに、前記第1の符号化信号を生成するために使用された第1の可逆符号化器の第1のコーディングパラメータ、ならびに前記第2の符号化信号を生成するために使用された第2の可逆符号化器の第2のコーディングパラメータの表現を搬送するステップと、
    前記符号化オーディオ信号を処理して、前記第1の符号化信号と、前記第2の符号化信号と、前記第1のコーディングパラメータおよび前記第2のコーディングパラメータの前記表現とを取得するステップと、
    前記第1のコーディングパラメータに応じてそれ自体の動作を適合させる第1の可逆復号器を、前記第1の符号化信号に適用することによって、第1の復号信号を生成するステップと、
    前記第2のコーディングパラメータに応じてそれ自体の動作を適合させる第2の可逆復号器を、前記第2の符号化信号に適用することによって、第2の復号信号を生成するステップと、
    前記第1の復号信号を、前記第2のサンプルレートでデジタルサンプルを有する第1の中間信号に変換することと、
    前記第2のサンプルレートで、前記第1の中間信号と前記第2の復号信号との対応するサンプルの合計を表すサンプルを有する第1の加算信号を生成するステップと、
    前記第1の復号信号と前記第1の加算信号とを有する信号のセット内の少なくとも1つの信号から出力信号を生成するステップであって、前記第1の復号信号は、前記第1のサンプルレートでオーディオ信号を表すデジタルサンプルを備え、前記第1の加算信号は、前記第2のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有するステップとを有する、方法。
  16. 符号化オーディオ信号を復号する装置であって、
    第1のサンプルレートでオーディオ情報を表すサンプルを有する第1の符号化信号と、前記第1のサンプルレートよりも高い第2のサンプルレートでオーディオ情報を表すサンプルを有する第2の符号化信号とを搬送する前記符号化オーディオ信号を受信する手段であって、前記第2のサンプルレートでの前記オーディオ情報は、前記第1のサンプルレートから前記第2のサンプルレートへのオーディオ入力信号の第1のサンプルレート変換によって生成される第1のオーディオ信号と、前記第1のサンプルレートから前記第2のサンプルレートへの前記オーディオ入力信号の遅延バージョンの第2のサンプルレート変換によって生成される第2のオーディオ信号との間の差を表し、前記第1のサンプルレート変換の品質は、前記第2のサンプルレート変換の品質よりも高く、および前記符号化オーディオ信号はさらに、前記第1の符号化信号を生成するために使用された第1の可逆符号化器の第1のコーディングパラメータ、ならびに前記第2の符号化信号を生成するために使用された第2の可逆符号化器の第2のコーディングパラメータの表現を搬送する手段と、
    前記符号化オーディオ信号を処理して、前記第1の符号化信号と、前記第2の符号化信号と、前記第1のコーディングパラメータおよび前記第2のコーディングパラメータの前記表現とを取得する手段と、
    前記第1のコーディングパラメータに応じてそれ自体の動作を適合させる第1の可逆復号器を、前記第1の符号化信号に適用することによって、第1の復号信号を生成する手段と、
    前記第2のコーディングパラメータに応じてそれ自体の動作を適合させる第2の可逆復号器を、前記第2の符号化信号に適用することによって、第2の復号信号を生成する手段と、
    前記第1の復号信号を、前記第2のサンプルレートでデジタルサンプルを有する第1の中間信号に変換する手段と、
    前記第2のサンプルレートで、前記第1の中間信号と前記第2の復号信号との対応するサンプルの合計を表すサンプルを有する第1の加算信号を生成する手段と、
    前記第1の復号信号および前記第1の加算信号を有する信号のセット内の少なくとも1つの信号から出力信号を生成する手段であって、前記第1の復号信号は、前記第1のサンプルレートでオーディオ信号を表すデジタルサンプルを備え、前記第1の加算信号は、前記第2のサンプルレートで前記オーディオ信号を表すデジタルサンプルを有する手段とを有する、装置。
  17. デバイスによって、請求項1ないし5、11、12、および16のいずれか1項に記載の方法のすべてのステップを行うよう実行可能である命令のプログラムを記録する記憶媒体。
JP2014518944A 2011-07-01 2012-06-27 サンプルレートスケーラブル可逆オーディオコーディング Active JP5926377B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161504005P 2011-07-01 2011-07-01
US61/504,005 2011-07-01
US201261636516P 2012-04-20 2012-04-20
US61/636,516 2012-04-20
PCT/US2012/044336 WO2013006322A1 (en) 2011-07-01 2012-06-27 Sample rate scalable lossless audio coding

Publications (2)

Publication Number Publication Date
JP2014524045A JP2014524045A (ja) 2014-09-18
JP5926377B2 true JP5926377B2 (ja) 2016-05-25

Family

ID=46548818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014518944A Active JP5926377B2 (ja) 2011-07-01 2012-06-27 サンプルレートスケーラブル可逆オーディオコーディング

Country Status (5)

Country Link
US (1) US20140214431A1 (ja)
EP (1) EP2727108B1 (ja)
JP (1) JP5926377B2 (ja)
CN (1) CN103650037B (ja)
WO (1) WO2013006322A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2435569C2 (ru) 2006-03-16 2011-12-10 Трис Фарма, Инк. Композиции с модифицированным высвобождением, содержащие комплексы лекарственное вещество - ионообменная смола
US9959875B2 (en) * 2013-03-01 2018-05-01 Qualcomm Incorporated Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams
CA2898885C (en) 2013-03-28 2016-05-10 Dolby Laboratories Licensing Corporation Rendering of audio objects with apparent size to arbitrary loudspeaker layouts
WO2014159898A1 (en) 2013-03-29 2014-10-02 Dolby Laboratories Licensing Corporation Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals
JP6515087B2 (ja) * 2013-05-16 2019-05-15 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ処理装置及び方法
US11290819B2 (en) 2016-01-29 2022-03-29 Dolby Laboratories Licensing Corporation Distributed amplification and control system for immersive audio multi-channel amplifier
WO2017132594A2 (en) 2016-01-29 2017-08-03 Dolby Laboratories Licensing Corporation Multi-channel amplifier with continuous class-d modulator and embedded pld and resonant frequency detector
US10778160B2 (en) 2016-01-29 2020-09-15 Dolby Laboratories Licensing Corporation Class-D dynamic closed loop feedback amplifier
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
CN112689109B (zh) * 2019-10-17 2023-05-09 成都鼎桥通信技术有限公司 一种记录仪的音频处理方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9509831D0 (en) 1995-05-15 1995-07-05 Gerzon Michael A Lossless coding method for waveform data
EP0922334A2 (en) * 1997-06-04 1999-06-16 Koninklijke Philips Electronics N.V. Data compression and expansion of an n-level information signal
DE69944788C5 (de) * 1998-04-09 2023-10-19 Koninklijke Philips N.V. Verlustfreie kodierung/dekodierung in einem übertragungssystem
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
JP3960932B2 (ja) * 2002-03-08 2007-08-15 日本電信電話株式会社 ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
AU2003213439A1 (en) * 2002-03-08 2003-09-22 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
JP2003280694A (ja) * 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP3926730B2 (ja) * 2002-11-11 2007-06-06 日本電信電話株式会社 符号送受信システム
GB2403634B (en) * 2003-06-30 2006-11-29 Nokia Corp An audio encoder
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
CN101086845B (zh) * 2006-06-08 2011-06-01 北京天籁传音数字技术有限公司 声音编码装置及方法以及声音解码装置及方法

Also Published As

Publication number Publication date
JP2014524045A (ja) 2014-09-18
US20140214431A1 (en) 2014-07-31
CN103650037B (zh) 2015-12-09
WO2013006322A1 (en) 2013-01-10
CN103650037A (zh) 2014-03-19
EP2727108B1 (en) 2015-09-09
EP2727108A1 (en) 2014-05-07

Similar Documents

Publication Publication Date Title
JP5926377B2 (ja) サンプルレートスケーラブル可逆オーディオコーディング
Gersho et al. Vector quantization and signal compression
KR101237546B1 (ko) 통신 시스템에서 프레임들을 연결하는 방법
KR101634979B1 (ko) 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측
US20080077412A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
US7805314B2 (en) Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data
TWI288915B (en) Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
CN102047325A (zh) 基于核心编码器性能进行选择性信号代码化的方法和装置
JP2006301464A (ja) ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
JP2008503793A (ja) 残響サウンド信号のコーディング
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
KR102311239B1 (ko) 심화 신경망 기반의 비-자동회귀 음성 합성 방법 및 시스템
US20080071550A1 (en) Method and apparatus to encode and decode audio signal by using bandwidth extension technique
JP6700506B2 (ja) 透明な無損失オーディオ電子透かし
CN103620674A (zh) 用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法
KR20200012861A (ko) 디지털 오디오 신호에서의 차분 데이터
JP2013502607A (ja) マルチチャネルオーディオデコーディング方法及び装置
JP5253518B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
EP3248190B1 (en) Method of encoding, method of decoding, encoder, and decoder of an audio signal
US8160869B2 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same
JP2011009860A (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
JP2011009868A (ja) 符号化方法、復号方法、符号化器、復号器およびプログラム
WO2023118138A1 (en) Ivas spar filter bank in qmf domain
De Smet et al. Do not zero-pute: An efficient homespun MPEG-Audio layer II decoding and optimization strategy
US20090063161A1 (en) Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150113

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160128

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20160205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160421

R150 Certificate of patent or registration of utility model

Ref document number: 5926377

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250