JP2011528807A - デジタル信号の圧縮または解凍のための方法、システムおよび装置 - Google Patents

デジタル信号の圧縮または解凍のための方法、システムおよび装置 Download PDF

Info

Publication number
JP2011528807A
JP2011528807A JP2011518942A JP2011518942A JP2011528807A JP 2011528807 A JP2011528807 A JP 2011528807A JP 2011518942 A JP2011518942 A JP 2011518942A JP 2011518942 A JP2011518942 A JP 2011518942A JP 2011528807 A JP2011528807 A JP 2011528807A
Authority
JP
Japan
Prior art keywords
signal
encoding
binary digital
dynamic range
signal value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011518942A
Other languages
English (en)
Inventor
リュ、サン−ウク
グプタ、サミア・ケー.
ラッシュマン、フィリップ
ヨ、ヘジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2011528807A publication Critical patent/JP2011528807A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/50Conversion to or from non-linear codes, e.g. companding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Nonlinear Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

a−law、mu−law、または振幅コンパンディングの他の変形のような、非線形表示へと符号化されたデジタルデータのサンプルを圧縮するために、該コンパンデッドサンプルは、非線形ドメインにおいて予測残差を作る予測の影響を受け、その残差は、ゴロムライス符号を使用して無損失で入れられる。

Description

関連出願
本願は、2008年7月18日に出願された「小さいダイナミックレンジを備えた信号のための低遅延及び低複雑さの無損失コーデック(LOW-DELAY AND LOW-COMPLEXITY LOSSLESS CODEC FOR SIGNALS WITH SMALL DYNAMIC RANGE)」と題された仮出願番号第61/082,170号と、ここでの譲受人に譲渡される「低遅延及び低複雑さの無損失(LOW-DELAY AND LOW-COMPLEXITY LOSSLESS)」と題された仮出願番号第61/091,263号の利益を主張する。
(分野)
実施形態は、デジタルコンテンツ(digital contents)を符号化または復号する分野に関しており、例えば、デジタル信号によって表わされるオーディオ情報を符号化または復号する。
(情報)
デジタル化されたオーディオ信号を含んでいるデジタル化されたコンテンツの様々な形態、例えば、無損失圧縮及び/または解凍は、様々な環境において望ましい。そのような圧縮または解凍のための技術は、求められ続け、特により低い遅延または低いコンピューテーショナル複雑性を提供する技術が求められている。
主題の事柄は、明細書の結論部分において具体的に示されており、明確に特許請求されている。しかしながら、特許請求される主題の事柄は、オペレーションの方法と編成(organization)の両方について、添付図面を見るときに、目的、特徴、およびその利益と一緒に、下記の詳細な説明を参照することによってよく理解されることができる。
図1は、一実施形態にしたがって、低い遅延・低い複雑性無損失符号化スキームの概略図である。 図2は、符号化及び復号スキームのブロック図である。 図3は、別の符号化及び復号スキームのブロック図である。 図4は、一実施形態にしたがって、符号化/復号スキームのブロック図である。 図5は、一実施形態にしたがって、可変ビット長符号化/復号スキームの1以上の態様のブロック図である。 図6は、一実施形態にしたがって、可変ビット長符号化スキームの1以上の態様のブロック図である。 図7は、一実施形態にしたがって、可変ビット長復号スキームの1以上の態様のブロック図である。
詳細な説明
次の詳細な説明では、多くの具体的な詳細が、特許請求される主題の事柄の完全な理解を提供するために、記載されている。しかしながら、特許請求される主題の事柄がこれらの具体的な詳細なしで実行されることができるということは当業者によって理解されるであろう。他の例において、当業者によって知られるであろう方法、装置あるいはシステムは、特許請求された主題の事柄を不明瞭にしないために詳細に説明されていない。
下記の提示される詳細な説明のいくつかの部分は、専用装置、専用コンピューティングデバイス、装置、またはプラットフォームのメモリ内で保存されるバイナリデジタル信号に関するオペレーションのアルゴリズムまたはシンボリック表示の観点において示されている。この具体的な明細書の文脈では、用語特有の装置(term specific apparatus)、専用コンピューティングデバイス、及び/または同様なものは、いったんプログラムソフトウェアからの命令に順ずる具体的な機能を実行するようにプログラムされると、携帯情報端末、ポータブル電話、セルラ電話、スマートフォン、または同様なもののような汎用コンピュータまたは他のコンピューティングデバイスを含むことができる。アルゴリズム記述またはシンボリック表示は、当業者に作業(work)のサブスタンスを伝達するために信号処理または関連技術において当業者によって使用される技術の例である。ここでの、及び一般的なアルゴリズムは、オペレーションの首尾一貫したシーケンス、または、望ましい結果をもたらす同様な信号処理であると考えられている。この文脈では、オペレーションまたは処理は、物理量の物理的な操作を含む。一般的には、必然ではないが、そのような量は、保存される、トランスファされる、組み合わせられる、比較される、そうでない場合には、操作される、ことができる電子的または磁気的な信号の形態を取ることができる。主に共通的な利用(common usage)という理由から、ビット、データ、値、エレメント、シンボル、数字(characters)、用語(terms)、数字、数表示(numerals)、および同様なもののような信号(signal)、を参照することは便利であるということがわかっている。しかしながら、これらの用語または同様な用語は適切な物理量と関連づけられるべきであり単なる便宜上のラベルにすぎない、ということが理解されるべきである。具体的に述べられていない限り、下記の説明から明らかであるように、本明細書の記載全体にわたって、「処理すること(processing)」、「コンピュートすること(computing)」、「計算すること(calculating)」、「決定すること(determining)」、および同様なもの、のような用語を使用することは、専用コンピュータ、専用コンピューティング装置、または同様な専用エレクトロニクスコンピューティングデバイスのような特定の装置の動作またはプロセスを指すということは理解される。したがって、本明細書の文脈では、専用コンピュータまたは同様な専用電子コンピューティングデバイスは、信号を操作または変換することが可能であり、典型的には、メモリ内の物理電子又は磁気量子、レジスタ、または、他の情報の記憶デバイス、送信デバイス、オーディオデバイス、または、専用コンピュータまたは同様な専用電子コンピューティングデバイスのディスプレイデバイス、として表される。
「1つの実施形態(one embodiment)」あるいは「実施形態(an embodiment)」に対する本明細書全体にわたる参照は、実施形態に関連して説明される具体的な特徴、ストラクチャ、または特性は、特許請求される主題の事柄の少なくとも1つの実施形態に含まれるということを意味する。したがって、本明細書全体にわたる様々な箇所におけるフレーズ「1つの実施形態において(in one embodiment)」または「一実施形態(an embodiment)」の外観は、必ずしも、同じ実施形態を言及していない。更に、具体的な特徴、構造、あるいは特性は1以上の実施形態の中で組み合わせられることができる。
下記でより詳細に説明される、様々な理由から、圧縮または解凍のスキームの実施形態は、引き続き望ましい。ある環境の下では、利用可能なオーディオコーデックは、信号における、統計的及び/または知覚的な冗長度を効率的に取り除くことによって、より高い信号圧縮を可能にする1以上の損失信号圧縮スキーム(lossy signal compression schemes)であってもよい。そのような環境では、損失オーディオ圧縮技術から復号された信号は、オリジナルのオーディオ信号と実質に同一ではない可能性がある。例えば、歪みまたは符号化ノイズは、損失オーディオ符号化スキームまたはプロセスの間に導入されることができるが、いくつかの環境の下では、そのような欠損は、知覚的に減らされることができるので、処理されるオーディオ信号は、オリジナルのオーディオ信号に、少なくとも、おおよそ近いものとして認識されることができる。
しかしながら、いくつかの環境の下では、無損失符号化は、より望ましい可能性がある。例えば、無損失符号化スキームまたはプロセスは、オリジナルのオーディオ信号が圧縮オーディオ信号から再構築されることを可能にすることができる。ALAC、MPEG−4 ALS及びSLS、Monkey’sAudio、Shorten、FLAC、そしてWavPackのような多くのタイプの無損失オーディオコーデックは、1以上のオーディオ信号の圧縮のために開発されてきた。しかしながら、いくつかの状況の下で、そのような無損失コーデックは、コンピュータ的に高価なまたは複雑な信号処理を利用することができる。そのような信号処理は、いくつかの環境の下で、入力データの大部分(例、2048のPCM信号サンプル)を保存するための相対的に大量なメモリを利用し、したがって、ある環境の下では、著しいエンド・ツー・エンドレイテンシ(significant end-to-end latency)を導入することができる。
G.711標準規格準拠入力信号(G.711 standard compliant input signal)の文脈内で1以上の無損失圧縮スキームに少なくとも部分的に基づいている1つの可能性のあるアプローチ、例えばA−lawマッピングまたはμ−lawマッピングは、IPネットワーク上のボイス通信のようなボイス通信において利用されることができる。そのようなアプリケーションでは、16ビットの線形のパルス符号変調(Pulse Code Modulated)(PCM)によって表わされるスピーチ信号は、8ビットの非線形のPCMサンプルにマッピングされることができる。そのような8ビットサンプル信号は、別のデバイスに対して、または、通信ネットワークを介して、送信されることができ、そして、オリジナル16ビットPCMサンプルの損失バージョンに対してG.711復号器によって復号されることができる。そのような状況の下では、G.711符号化によってマッピングされる8ビットサンプルための無損失圧縮および解凍は、ネットワーク帯域幅の効率的な使用に望ましい。しかしながら、上記の言及された無損失コーデックは、このアプローチで利用されるのに望ましくない可能性がある。例えば、そのような無損失コーデックは、いくつかの環境の下、著しいコンピューテーショナルリソースまたはメモリリソースを使用することができる。さらに、そのようなコーデックは、特に、16ビットのPCM信号サンプルの特定のレンジの値について具体的に設計されてもよい。従って、低遅延・低複雑さの無損失の圧縮スキームまたはプロセスは、小さいダイナミックレンジの値(a small dynamic range of values)を有することにより特徴づけられる信号について使用されることができる。
ここにおいて使用されるように、用語「小さなダイナミックレンジ(small dynamic range)」は信号値の範囲を指しており、そのような信号値の1以上の表示(representation)、例えば最も高い信号値レベルから最も低い信号値レベルまで、は相対的に小さい範囲を備えることができる。小さいダイナミックレンジはビットという観点から必ずしも量子化される必要はないが、そのダイナミックレンジをバイナリデジタル信号についてのビットの数から推論することは珍しいことではない。例えば、1以上の8ビット信号(8-bit signals)が、小さなダイナミックレンジを有し、すべての8つのビット(eight bits)が異なる。同様に、より多くのビットを有する1以上の信号、例えば64ビットバイナリデジタル信号は、例えば、バイナリデジタル信号範囲のより低いエンド(lower end)にある64ビットのサブセットが変わり、64のうちの他の残りのビットが変わらない場合には、小さいダイナミックレンジを有することができる。後の2つの例は、単なる説明の目的のためだけにすぎず、いずれの方法で特許請求される主題の事柄の範囲を限定するようには意図されないということは勿論留意される。さらに、ここにおいて使用される「信号(signal)」は、限定されないが、例えばサウンド、イメージ、ビデオ、または、同様なもののような、特定の物理属性またはまにフェステーション(manifestation)に関連して、時間において特定のインスタンスまたはサンプルに対応することができるメディア信号を参照することができる。
図1は、例えば、非線形PCMスピーチ信号のG.711(8ビット)準拠A−lawマッピングまたはμlawマッピング、のような狭いダイナミックレンジの値入力信号(a narrow dynamic range value input signal)のための低遅延低複雑の無損失符号化スキームの実施形態の例示的な展開を示す。一実施形態では、符号化スキーム100は、8ビットPCMスピーチサンプルのための符号化効率から、効果的または効率的であるように、少なくとも部分的に、設計される、無損失符号化または復号スキームを備えることができる。一実施形態では、低い遅延あるいは低い複雑さの符号化スキームは、相対的に小さい数の入力PCM信号サンプルを有することができ、他の無損失一般的なオーディオコーデックに競合するまたは匹敵する(comparable)複雑さとレイテンシを有することができる。図1に関して、G.711符号化モジュール102は、1以上の16ビットのPCM信号サンプルを受信することができる。G.711符号化モジュール102は、例えばG.711標準規格に準拠する8ビットコンパンデッドPCM信号サンプル(8-bit companded PCM signal samples)のような、8ビットの非線形PCM信号サンプルを生成するために、少なくとも部分的に、受信される16ビットPCM信号サンプルを修正することが動作可能である。その後で、生成された8ビットのPCM信号サンプルは、無損失符号化(LLC)符号器104によって受信されることができる。一実施形態では無損失符号化された8ビットのPCM信号は、LLC復号器106に対して、IPネットワークのような通信ネットワークを介して、ビットストリームとして送信されることができる。一実施形態では、LLC復号器106は、符号化される8ビットのPCM信号から、8ビットのPCM信号サンプルを再構築することが動作可能でありうる。その後で、再構築された8ビットのPCM信号サンプルは、G.711復号器108によって受信されることができる。一実施形態では、G.711復号器108は、再構築される8ビットのPCM信号サンプルから、16ビットのPCM信号サンプルを再構築することが動作可能であってもよい。しかしながら、これらは無損失符号化スキームに関する単なる説明のための例にすぎないということ、そして特許請求された主題の事柄はこの点に関して限定されないということ、に留意されるべきである。
図2に関して、8ビットのPCM信号、例えばG.711標準規格と互換性を有する信号は、G.711復号器202によって受信されることができる。例えば、G.711復号器202は、少なくとも部分的に、受信される8ビットPCM信号に関して1以上のプロセスを適用することができ、その信号を1以上の16ビットPCM信号サンプルへと変換する。1以上の符号化された16ビットPCM信号サンプルは、代わりに、利用可能な無損失コーデック(LLC)符号器204によって受信されることができる。LLC符号器204は、代わりに、例えば上記で説明される符号化スキームのうちの1つで、1以上の16ビットPCM信号サンプルを圧縮することができる。符号化された1以上の16ビットPCM信号サンプルは、利用可能なLLC復号器106に対して送信されることができる。この例では、LLC復号器206は、符号化される1以上の16ビットPCM信号サンプルを復号することが動作可能であり、少なくとも部分的に、オリジナルの1以上の16ビットPCM信号サンプルを生成する。さらに、この例においては、復号された1以上の16ビットのPCM信号サンプルは、G.711符号器208によって受信されることができる。G.711符号器208は、例えばG.711標準規格に準拠する(または互換性を有する)1以上の信号サンプルのような、1以上の8ビットPCM信号サンプルを少なくとも部分的に生成するために、復号される1以上の16ビットPCM信号サンプル上で動作することができる。生成された1以上の8ビットPCM信号サンプルは、例えばさらなる処理のために、コンピューティングプラットフォーム、周辺機器、またはセルラ電話のようなデバイスの1以上の部分に対して送信されることができる。しかしながら、いくつかの環境の下では、上記のスキームは、1以上の符号化された信号において望ましい圧縮を生成しない、または、望ましくないレイテンシまたは複雑さを経験する。
図3に関しては、いくつかの環境下では、図1について上記で示されているような無損失圧縮技術は、1以上の予測ツールまたはモジュールをさらに利用することができる。例えば、G.711復号器302は、1以上の受信される8ビットのPCM信号サンプルから、1以上の16ビットのPCM信号サンプルを生成することができる。この例では、生成される1以上の16ビットのPCM信号のサンプルは、時間ドメイン予測モジュール304に対して送信されることができる。時間ドメイン予測モジュール204は、エントロピ符号器306と共に、符号化されたビットストリームを生成することが動作可能であることができる。この例では、符号化されたビットストリームはエントロピ復号器308に対して送信されることができる。エントロピ復号器308は、時間ドメイン予測モジュール310と共に、少なくとも部分的に、1以上の16ビットのPCM信号サンプルを再び生成するために、符号化されたビットストリームを復号することが動作可能であることができる。例えばG.711標準規格に準拠する1以上の信号サンプルのような、1以上の8ビットPCM信号サンプルを少なくとも部分的に生成するために、復号される1以上の16ビットPCM信号サンプルはG.711符号器312に対して送信されることができる。生成された1以上の8ビットPCM信号サンプルは、例えばさらなる処理のために、コンピューティングプラットフォーム、周辺機器、またはセルラ電話のようなデバイスの1以上の部分に対して送信されることができる。しかしながら、いくつかの環境の下では、上記のスキームは、1以上の符号化された信号において望ましい圧縮を生成しない、または、望ましくないレイテンシまたは複雑さを経験する。
図4は、ある環境の下で、上記される欠損のうちの1以上に取り組むことができる、LLC符号器104の実施形態にしたがった符号化スキームと、LLC復号器106の実施形態に従って復号スキームと、の詳細ブロック図400を示す。一実施形態では、符号化スキームは、可変ビット長符号器402を備え、それは、少なくとも部分的には、1以上の信号を扱うためのものであり、補足一定ビット長符号器(supplemental constant bit-length encoder)404を備え、それは、少なくとも部分的には、可変ビット長ベースライン符号化によって生成される出力ビットの数は、一定ビット長符号化によって生成される出力ビットの数よりも大きくなる、信号サンプルの1以上の特別なケースを扱うためのものである。それぞれの入力信号ブロックの場合、可変ビット長符号器402と一定ビット長符号器404のうちのより望ましいものが、信号ブロックを符号化するために選択されることができ、そして、シグナリングビットは、少なくとも部分的に、符号化された信号サンプルと共に送信されることができるので、復号器は、特定の信号ブロックについてどの符号化スキームが使用されたかを伝えることができる。図2に関して、LLC復号器406は、少なくとも部分的に、可変ビット長エンコーダ402あるいは一定ビット長符号器404で符号化された信号サンプルを再構築するために、可変ビット長復号器406と一定ビット長復号器408を備えることができる。
可変ビット長ベースラインコーデックに関して、符号化または復号デバイスは、1以上の入力信号のダイナミックレンジを減らすために1以上の予測器(predictors)を少なくとも部分的に使用して、予測符号化スキームを実行するように構成されることができる無損失コーデックをインプリメントすることができる。一実施形態では、少なくとも部分的には1以上の予測信号値を決定するための、予測モジュールは、1以上のスキームを使用して使用されることができ、そしてそれは、ある環境の下で、よりよい予測利得を結果としてもらすことができる。例えば、予測モジュールは、1セットの固定予測器、高次順方向予測器(high-order forward predictors)、適応性後方予測器(adaptive backward predictors)、または同様なものを利用することができる。一実施形態では、1以上の予測される信号値と1以上の信号の実際の値との間の1以上の差分(differentials)は、1以上の可変ビット長エントロピ符号を使用して少なくとも部分的に符号化されることができる。一実施形態では、1以上の予測される信号値と1つ以上の実際の信号値の間の差分は、予測残差(prediction residual)と呼ばれる。一実施形態では、1以上の予測残差値はラプラシアン分布によってモデル化されることができ、そして、特定の分布に望ましいゴロムライス符号化のような可変ビット長符号化スキームで符号化されることができる。
大部分については、入力信号の小さいダイナミックレンジの観点で記載されているが、一実施形態にしたがった無損失コーデックはまた、例えば1以上の修正で、入力信号のより大きなダイナミックを有する信号の場合には例えば置換符号化スキームを使用することによって、使用されることができる。例えば、「デジタルコンテンツを符号化するおよび/または復号する(ENCODING AND/OR DECODING DIGITAL CONTENT)」と題された米国特許出願番号第11840880号で記載されている置換符号化スキームは、ある環境の下で、一実施形態にしたがって無損失コーデックで利用されることができる。もちろん、特許請求された主題の事柄は、この点に関して限定されておらず、これらの上述されたもののほかのスキームを利用することができる。
図5は、可変ビット長符号器の実施形態にしたがった、符号化/復号スキーム500の図である。ここにおいて開示される無損失コーデックは、小さいダイナミックレンジで入力信号について適応されることができるが、その符号化効率は、置換符号化スキームが選択の1つとして埋め込まれている場合には、広いダイナミックレンジを備えた入力信号であることを考慮に入れても、改良されることができる。上記のアプローチは、コンパンデッドドメインにおける区別を実行することによってよりよい圧縮利得を達成することができるが、図5で示されているように下記でさらに改善されることができる。一実施形態では、低遅延低複雑の符号化または復号のスキームまたはプロセスは、2以上のブロックまたはモジュールを備えることができ、例えば、少なくとも部分的に、1以上の信号を符号化するために、コンパンデッドドメイン予測モジュールのようなドメイン予測モジュール502と、ライス符号化モジュールまたは修正されるライス符号化モジュールのようなライス符号化モジュール504を備えることができる。同様に、符号化/復号スキーム500はまた、少なくとも部分的に、符号化された1以上の信号を再構築するために、ドメイン予測モジュール508と共に、例えば、ライス復号モジュールまたは修正されるライス復号モジュールのようなライス復号モジュール506を利用することができる。しかしながら、上記の例がコンパンデッドドメインに限定されないということに留意されるべきである。例えば、実施形態に従った符号化または復号のスキームは、時間ドメインにおいても、1以上の信号と使用されることができる。従って、特許請求された主題の事柄は、この点に関して制限されるべきではない。同様に、符号化/復号スキーム500はまた、少なくとも部分的に、前に符号化された1以上の信号を再構築するために、ドメイン予測モジュール508と共に、例えば、ライス復号モジュールまたは修正されるライス復号モジュールのようなライス復号モジュール506を利用することができる。しかしながら、これは符号化/復号スキームに関する単なる説明のための例にすぎないということ、そして特許請求された主題の事柄はこの点に関して限定されないということ、に留意されるべきである。
図6は、図5で示される符号化スキームのような実施形態に従って可変ビット長符号器の符号化スキーム600のブロック図を示す。一実施形態では、予測モジュール602は、例えば1セットの固定予測器、高次順方向予測器、適応性後方予測器などのような、よりよい予測利得についてのアドバンスドスキームを含んでいる多くの異なる形態でインプリメントされることができる。少なくとも1つの実施形態では、予測残差の線形予測およびエントロピ符号化のための効率的なスキームは、少なくとも部分的に、符号化スキームのインプリメンテーショナル複雑さまたはアルゴリズム的遅延を縮小するために、利用されることができる。例えば、前の信号サンプルによって現在の信号サンプルを予測するシンプル第1次線形予測器を利用することができる。一実施形態では、コンピュータ的に効率的なエントロピ符号化スキームは、少なくとも部分的に、残差信号値のような、予測される信号値と実際の信号値の間の差分を符号化するために利用されることができる。一実施形態では、符号化スキーム600は、選択モジュール604、インターリービングモジュール606、ユーナリ符号化モジュール(unary coding module)608およびライス符号化モジュール610をさらに備えることができる。しかしながら、インターリービングモジュール606は、いくつかの環境の下では、オプションでありうるということは留意されるべきである。例えば、インターリービングモジュールを利用することよりもむしろ、一実施形態は、1以上の値が負の値を有するかを少なくとも部分的に示すためにサインビットを代わりに利用することができる。従って、特許請求された主題の事柄は、この点に関して制限されるべきではない。少なくとも1つの実施形態では、インタリーブされる残差信号値は、1以上のライス符号化スキームを使用して符号化されることができる。一実施形態では、ライス符号化は、コードパラメータが2の冪であるケースの特殊化されたゴロム符号化と見なされるので、多数の追加及びビットシフトを用いて、ライス符号化において利用されるオペレーションを実行することができる。
符号化スキームの実施形態では、入力信号x(n)は、連続するN−信号サンプルブロックに分割されることができ、M個数のブロックは信号フレームを備え、すなわち、フレームは、MN入力信号サンプルを含んでいるが、勿論、特許請求される主題の事柄はこの点に限定されていない。0≦n<Nと0≦m<Mの場合のx(n)として信号フレームのm番目ブロックにおいてn番目信号サンプルを示しており、現在の信号サンプルの予測は、下記のように表されることができる。
Figure 2011528807
ブロック内では、前の信号サンプルは、現在の信号サンプルの予測される信号値として使用されることができる。しかしながら、いくつかの環境の下では、例えば1以上のブロック間のバウンダリで、前の信号ブロックにおける最後の信号サンプルは、現在の信号ブロックの第1の信号サンプルの予測として役立つ。ある環境の下では、例えば、第1の信号ブロックにおける第1の信号サンプルについては、予測なし(no prediction)が、フレームレベル復号依存を回避するために利用される。例えば、ある環境の下では、信号の分離フレームが互いに依存していないということが望ましい。従って、ある環境の下では、いずれのプライア信号サンプルに基づいてフレームの第1信号サンプルが符号化されないということが望ましい可能性がある。一実施形態では、予測残差信号は以下のようにコンピュートされる:
Figure 2011528807
いったん予測残差信号のN−サンプルブロックが決定されると、そのような予測残差信号サンプルは、下記のように、負でない値に、図6のインタリービングブロック506でインタリーブされることができる。
Figure 2011528807
予測残差信号のインタリーブされるサンプルは、ライス符号化プロセスによって動作されることができる。負でない整数nについてのそのようなライス符号化プロセスは、符号化エレメントの少なくとも1以上を含むことができ、すなわち、ユーナリ符号化の商である
Figure 2011528807
と一定ビット長符号化の余りであるkLSビットを含むことができる。例えば、n=11(「1011」)の場合、k=2を備えたライス符号化は、コードワード「00111」を生成する;すなわち、ユーナリ符号化の商2(「001」)と、余り3についての2ビット符号化(「11」)を生成する。ライス符号化パラメータがk=1として選択される場合、整数11は7ビットのコードワード「0000011」として、この場合、符号化される。この例より、(i)パラメータkを備えた負でない整数nのライス符号化は
Figure 2011528807
を生成する、そして、(ii)与えられた負でない整数または1セットの負でない整数については、より小さい数のビットを生成する望ましいライスパラメータがあるべきである、ということがわかる。予測残差信号のインタリーブされる値のN−サンプルブロックが与えられると、図6のパラメータ選択ブロック604は、
Figure 2011528807
となるように、望ましいライス符号化パラメータを決定し、なお、
Figure 2011528807
である。
いったん望ましいライスパラメータkが、例えば選択モジュール604によって、決定されると、kは、前のブロックkm−1のライスパラメータと区別されることができ、結果として生じる差分は、負でない値にインタリーブされることができ、そのあとで、例えばユーナリ符号化モジュール608によって、ユーナリ符号化されることができる。ライスパラメータを復号することにおける従属を回避するために、フレームにおける第1ブロックのパラメータ値は、前のフレームの最後のブロックのパラメータから差分符号化(differential coding)することなく、ユーナリ符号化されることができる。予測残差信号は、例えばライス符号化モジュール610によって、望ましいライスkでライス符号化される。
予測残差のインタリーブされるサンプルのライス符号化の場合は、そのようなサンプルは、それぞれの商の値と余りの値に分解されることができる。一実施形態では、商の値と余りの値は、それぞれ、kビットによってインタリーブされるサンプルをダウンシフトすることによって、そして、インタリーブされるサンプルのLSkビットをとることによって、コンピュートされることができる。その後、商と余りは、kLSビットのユーナリ符号化または一定ビット符号化を介してそれぞれ符号化されることができ、それらのコードワードは、ビットストリームへとパッキングされることができる。すべてのM個のブロックを符号化したあとで、多数のゼロが、バイトアライン(byte-aligned)されるように符号化されたビットストリームの終わりに挿入されることができる。
図7は、図5で示される復号スキームのような実施形態に従って可変ビット長復号器の復号スキーム700のブロック図である。実施形態では、低い遅延・低い複雑さ復号スキームのための復号器モジュールは、与えられたビットストリームのための上記符号化プロセスの1以上のオペレーションをリバースすることができる。ビットストリームの始めにおいて、第1ブロックのライスパラメータのユーナリコードワードは、例えばビットストリームパーシングモジュール702によってパースされることができ、例えばユーナリ復号モジュール704によって復号されることができ、第1ブロックにおける予測残差のインタリーブされるサンプルのためのコードワードがシーケンシャルにパースされ、そして、ライス復号モジュール706によってライス復号される。ライス復号の後で、予測残差のインタリーブされるサンプルは、予測残差の整数値に対して、例えばデインターリービングモジュール708によって、デインタリーブされることができる。予測モジュール710によって予測されるサンプルに予測残差サンプルを追加して、ブロックにおいてオリジナル入力信号サンプルを無損失で再構築することができる。上記のプロセスの1以上は、符号化された信号サンプルの1以上の残りのブロックについて繰り返される。しかしながら、ライスパラメータと、前のブロックに依存するブロックの第1の残差信号値と、の復号のプロセスは、残りのブロックのうちの1以上について利用されてもよい、または、利用されなくてもよい。
上記で説明されてきた符号化及び復号スキームは、例えばA−lawマッピングまたはμ−lawマッピングのようにG.711PCM準拠スピーチ信号サンプルのような小さいダイナミックレンジで多くの信号を扱うのに効率的であるが、専用の一定ビット長符号化が可変ビット長ベースラインコーデックよりもよい圧縮利得を生み出すことができるいくつかのコーナーケース(corner case)の可能性がありうる。例えば、IPネットワーク上のボイス通信の間にスピーカーが電話をミュートモードにする場合には、IPパケットのスピーチ信号は、ゼロまたは一定値の信号サンプルを含むことができる。そのようなブロックの場合には、上述される可変ビット長ベースラインコーデックによってより多くのビットを費やすことよりもむしろ、より少数のフラッグビットで復号器に対してそのようなケースをシグナリングすることのほうがコスト効率がよい。特別な対応(special handling)が望ましい別の例は、ブロックにおける信号サンプルのために一定ビットを費やすよりも多くのビットを無損失圧縮が生み出すサンプルブロックを含むことができる。この場合には、ブロックにおける信号サンプルをあらわすために使用されるビットの数を復号器に伝える、より小さいビットシグナリング、例えば8ビット精度データの場合には3ビットシグナリング、16ビット精度データの場合には4ビットシグナリング、と共に、一定ビットコードワードでそのような信号サンプルを符号化することが有益であるようである。したがって、特別なコーナーケース(special corner cases)を扱うように設計される一定ビット長圧縮スキームで、符号化及び復号スキームを補足することが有益であることができる。従って、切り換えプロセスは符号器に導入されてもよく、ここでは、各ブロックについて、ここで可変ビット長符号化による、および一定ビット長符号化による、出力ビットの期待される数は、それぞれコンピュートされることができる。一定ビット長符号化のためのビットの数は、例えば、下記によってコンピュートされることができる。
(i)ブロックにおける入力信号サンプルを負でない値に、例えば下記のように、インタリーブする。
Figure 2011528807
(ii)最大の信号サンプルを見つける。
Figure 2011528807
(iii)
Figure 2011528807
としてブロックにおける入力サンプルを表わすためにビットの数をコンピュートする。その後、一定ビット圧縮技術スキームのための合計ビット数は、
Figure 2011528807
として与えられることができる。
出力ビットの期待された数をコンピュートした後で、一定ビット長符号化が可変ビット長ベースラインコーデックよりも少ないビットを使用することが判明する場合には、切換フラグ(switching flag)は、「1」に設定される。そうでない場合には、フラグは「0」に設定される。フラグビットは、ブロックについてビットストリームの初めに挿入され、対応する符号化スキームは、符号化を開始し、符号化されたビットをビットストリームへとパッキングする。復号器側で、このフラグは、実際の信号サンプル復号の前にパースされ、このフラグによって表示されるように適切な復号プロシージャは、ビットストリーム復号を実行する。
上記の追加は、可変ビット長ベースラインコーデックとブロックについての一定ビット長圧縮スキームとの間でよりよい符号化スキームを選択的に選ぶことができる。ある方法から別の方法への遷移について特別に注意するべきである。信号フレームにおいてm番目のブロックが可変ビット長ベースラインコーデックによって符号化されるように選択されるが、前のブロックは、一定ビット長符号化によって符号化されたと仮定する。その後、現在ブロックのライスパラメータが前のと区別をつけて(differentially)符号化されることができない、というのは、ライスパラメータは、前のブロックにおいてコンピュートされていなかったためである。そのような場合、現在のフレーム自体のライスパラメータは、前のフレームのライスパラメータとの差(difference)の代わりに、符号化され、そしてそれは、ベースラインコーデックの符号化効率を下げうる。この問題を回避するある効率的な方法は、各ブロックについてのライスパラメータをコンピュートし、それを次のブロックの信号値の差分符号化のために保存することである。いくつかの環境の下では、そのようなシチュエーションは、符号器側に困難を引き起こさない、なぜならば、ブロックの場合、信号値は、どの方法がより少ないビットを生成するかを見つけることにおいて、コンピュートされることができるためである。しかしながら、復号器側で、ブロックが一定ビット長圧縮スキームによって符号化されたとしても、次のブロックの復号についてライスパラメータが利用可能であるようにするように、エキストラなコンピューテーションが費やされうる。例えば符号器で実行されるものの模倣(mimics)をしているライスパラメータの閉ループ復号を組み込むことによって、改善される符号化効率のために、2つの異なる符号化スキーム間で相対的なシームレス遷移が達成される。
同様に、ここにおいて使用されている、用語、「及び(and)」、「または(or)」、そして「及び/または(and/or)」、は、それが使用される文脈に少なくとも部分的に基づいて決まる、様々な意味を含むことができる。一般的には、「及び/または(and/or)」がリストを関連づけるために使用される場合には、例えばA、B、及び/またはCは、A、B及びCに加え、A、B、またはCを意味することを意図する。しかしながら、これは単なる説明のための例にすぎないということ、そして特許請求された主題の事柄はこの例に限定されないということ、に留意されるべきである。
上記のシステム、方法、またはプロセスの態様は、具体的な順序で説明されているが、その具体的な順序は、プロセスの単なる例にすぎず、特許請求項される主題の事柄は記載される順序に勿論限定されない、ということに留意されるべきである。ここにおいて記載されるシステム、方法、およびプロセスは、1以上のコンピューティングプラットフォームまたはコンピューティングデバイスによって実行されることができる。さらに、ここにおいて記載される方法またはプロセスは、実行される場合には、コンピューティングプラットフォーム、コンピューティングデバイス、または、1以上のアクションを実行する専用コンピューティングデバイスをイネーブルにすることができる1以上の機械可読命令、として記憶媒体上で保存されることができる。ここにおいて述べられている「記憶媒体(Storage medium)」は、1以上のマシンによって、動作されることができるまたは実行されることができる情報または命令を保存することができる媒体に関する。例えば、記憶媒体は、機械可読命令または情報を保存するための1以上の記憶デバイスを備えることができる。そのような記憶デバイスは、磁気記憶媒体、光学記憶媒体あるいは半導体記憶媒体を含むいくつかのメディアのタイプのうちのいずれか1つを備えることができる。さらなる例では、1以上のコンピューティングプラットフォームは、特許請求される主題の事柄にしたがったプロセスまたは方法のうちの1つまたは複数、例えばここにおいて記載される方法または方法、を実行するように適応されることができる。しかしながら、これらは、記憶媒体とコンピューティングプラットフォームに関する単なる例にすぎず、特許請求された主題の事柄はこれらの点において限定されていない。
上記説明において、特許請求された主題の事柄の様々な態様が記載されている。説明の目的のために、具体的な数、システムあるいは構成は、特許請求された主題の事柄の完全な理解を提供するために記載されている。しかしながら、特許請求される主題の事柄がこれらの具体的な詳細なしで実行されることができるということは、本開示の利益を有する当業者によって明白であるべきである。他の例においては、当業者によって理解されるであろう特徴は、特許請求された主題の事柄を不明瞭にしないために、省略または簡潔にされている。ある特徴がここにおいて図示され、または、説明されてきたが、多くの修正、代用、変更、または均等物が、当業者に対して生じるであろう。したがって、添付の特許請求の範囲は、特許請求された主題の事柄の真の精神内に入るように、すべてのそのような修正または変更を含むように意図されるということは理解される。

Claims (70)

  1. 符号化デバイスを用いて、狭いダイナミックレンジバイナリデジタル信号を、少なくとも部分的に、前記狭いダイナミックレンジバイナリデジタル信号の非線形ドメインにおける信号予測を通じて、圧縮すること、
    を備える方法。
  2. 前記非線形ドメインは、より広いダイナミックレンジ信号がマッピングされた、コンパンデッドドメインを備える、請求項1に記載の方法。
  3. 前記圧縮の前に、A−lawマッピングまたはμ−lawマッピングのうちの少なくとも1つを通じて前記コンパンデッドドメインにおいて前記狭いダイナミックレンジバイナリデジタル信号へと前記より広いダイナミックレンジ信号をマッピングすること、をさらに備えている請求項2に記載の方法。
  4. A−lawマッピングまたはμ−lawマッピングのうちの少なくとも1つを通じたマッピングは、G.711標準規格のうちの少なくとも1つのバージョンに実質的に準拠しているまたは互換性を有するマッピングを備える、請求項3に記載の方法。
  5. 前記狭いダイナミックレンジバイナリデジタル信号の非線形ドメインにおける予測は、現在の信号値の予測として前の信号値を利用することを備える、請求項1に記載の方法。
  6. 前記狭いダイナミックレンジバイナリデジタル信号は、デジタル化されたオーディオ信号を備える、請求項1に記載の方法。
  7. 前記デジタル化されたオーディオ信号は、ヒューマンスピーチのデジタル化された信号を備える、請求項6に記載の方法。
  8. 前記ヒューマンスピーチのデジタル化された信号は、ヒューマンスピーチの8ビットのデジタル化された信号を備える、請求項7に記載の方法。
  9. 符号化デバイス、
    を備え、前記符号化デバイスは、狭いダイナミックレンジバイナリデジタル信号を、前記狭いダイナミックレンジバイナリデジタル信号の非線形ドメインにおける信号予測を通じて、圧縮するように適応される、装置。
  10. 前記非線形ドメインは、より広いダイナミックレンジ信号がマッピングされた、コンパンデッドドメインを備えている、請求項9に記載の装置。
  11. 前記符号化デバイスは、前記圧縮の前に、A−lawマッピングまたはμ−lawマッピングのうちの少なくとも1つを通じて前記コンパンデッドドメインにおいて前記狭いダイナミックレンジバイナリデジタル信号へと前記より広いダイナミックレンジ信号をマッピングするようにさらに適応される、請求項10に記載の装置。
  12. A−lawマッピングまたはμ−lawマッピングのうちの少なくとも1つを通じたマッピングは、G.711標準規格のうちの少なくとも1つのバージョンに実質的に準拠しているまたは互換性を有するマッピングを備える、請求項11に記載の装置。
  13. 前記狭いダイナミックレンジバイナリデジタル信号の非線形ドメインにおける予測は、現在の信号値の予測として前の信号値を利用することを備える、請求項9に記載の装置。
  14. 前記狭いダイナミックレンジ信号は、デジタル化されたオーディオ信号を備える、請求項9に記載の装置。
  15. 前記デジタル化されたオーディオ信号は、ヒューマンスピーチのデジタル化された信号を備える、請求項14に記載の装置。
  16. 前記ヒューマンスピーチのデジタル化された信号は、ヒューマンスピーチの8ビットのデジタル化された信号を備える、請求項15に記載の装置。
  17. 保存された命令を有する記憶媒体、
    を備え、前記命令は、専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、狭いダイナミックレンジバイナリデジタル信号を前記狭いダイナミックレンジバイナリデジタル信号の非線形ドメインにおける信号予測を通じて圧縮することを可能にする、
    製品。
  18. 前記非線形ドメインは、より広いダイナミックレンジ信号がマッピングされた、コンパンデッドドメインを備えている、請求項17に記載の製品。
  19. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、前記圧縮の前に、A−lawマッピングまたはμ−lawマッピングのうちの少なくとも1つを通じて前記コンパンデッドドメインにおいて前記狭いダイナミックレンジバイナリデジタル信号へと前記より広いダイナミックレンジ信号をマッピングすることをさらに可能にする、請求項18に記載の製品。
  20. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、前記圧縮の前に、G.711標準規格のうちの少なくとも1つのバージョンに実質的に準拠しているまたは互換性を有するA−lawマッピングまたはμ−lawマッピングのうちの少なくとも1つを通じて前記コンパンデッドドメインにおいて前記狭いダイナミックレンジバイナリデジタル信号へと前記より広いダイナミックレンジ信号をマッピングすることをさらに可能にする、請求項19に記載の製品。
  21. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記コンピューティングプラットフォームが、現在の信号値の予測として前の信号値を利用することをさらに可能にする、請求項17に記載の製品。
  22. 前記狭いダイナミックレンジ信号は、デジタル化されたオーディオ信号を備える、請求項17に記載の製品。
  23. 前記デジタル化されたオーディオ信号は、ヒューマンスピーチのデジタル化された信号を備える、請求項22に記載の製品。
  24. 前記ヒューマンスピーチのデジタル化された信号は、ヒューマンスピーチの8ビットのデジタル化された信号を備える、請求項23に記載の製品。
  25. 符号化デバイスを用いて、ライス符号化スキームを使用して符号化されるべき残差バイナリデジタル信号を生成するために、狭いダイナミックレンジバイナリデジタル信号と、予測される狭いダイナミックレンジバイナリデジタル信号と、を比較すること、
    を備える方法。
  26. 前記ライス符号化スキームは、ライス符号化スキームを備え、そして、与えられた残差バイナリデジタル信号について、サインビット、商の信号値、余りの信号値を符号化することを利用し、ゼロ残差信号値はサインビットを符号化せずに符号化される、請求項25に記載の方法。
  27. 前記ライス符号化スキームは、1以上のインタリーブされる残差バイナリデジタル信号について、1以上の商の信号値と1以上の余りの信号値と、を符号化することを利用する、請求項25に記載の方法。
  28. 前記予測される狭いダイナミックレンジバイナリデジタル信号は、単一の時間遅延オペレーションを、実際の狭いダイナミックレンジバイナリデジタル信号に適用することを備え、前記ライス符号化スキームは、サインビット、商の信号値と余りの信号値を符号化することを備える、請求項25に記載の方法。
  29. 前記サイン符号化、商の信号値符号化、および余りの信号値符号化は、特定のビットストリームにおいて編成されるので、サインの符号化信号値、商の符号化信号値、及び余りの符号化信号値は、一緒にグルーピングされる、請求項28に記載の方法。
  30. 前記サイン符号化、商の信号値符号化、および余りの信号値符号化は、1以上のビットストリームへと編成される、請求項25に記載の方法。
  31. 第1のK信号値を符号化することと、
    前記第1のK信号値と第2のK信号値との間のK信号差分を計算することと、
    前記K信号差分を符号化することと、
    をさらに備えている請求項25に記載の方法。
  32. 前記第1のK信号値は、第1のブロックにおける狭いダイナミックレンジバイナリ信号に対応し、前記第2のK信号値は、第2のブロックにおける狭いダイナミックレンジバイナリデジタル信号に対応する、請求項31に記載の方法。
  33. 信号ビットを、少なくとも部分的に、前記ライス符号化スキームは残差バイナリデジタル信号のブロックを圧縮しない場合には残差バイナリデジタル信号は前記ライス符号化スキームで符号化されなかったということを示すために、符号化すること、をさらに備える請求項25に記載の方法。
  34. 前記ライス符号化スキームを使用して残差バイナリデジタル信号の後続ブロックを符号化すること、をさらに備えている請求項33に記載の方法。
  35. 前記K信号値と、前記ライス符号化スキームで符号化されなかった残差バイナリデジタル信号のブロックに対応するK信号値との間の差分に少なくとも部分的に基づいて、前記残差バイナリデジタル信号の後続ブロックについてK信号値を符号化すること、をさらに備える請求項34に記載の方法。
  36. 狭いダイナミックレンジデジタル信号のグループを1以上のフレームへと編成すること、をさらに備える請求項25に記載の方法。
  37. 前記1以上のフレームは、互いに独立して、少なくとも部分的に符号化される、請求項36に記載の方法。
  38. 符号化デバイス、
    を備え、前記符号化デバイスは、ライス符号化スキームを使用して符号化されるべき残差バイナリデジタル信号を生成するために、狭いダイナミックレンジバイナリデジタル信号と、予測される狭いダイナミックレンジバイナリデジタル信号と、を比較するように適応される、装置。
  39. 前記ライス符号化スキームは、ライス符号化スキームを備え、そして、与えられた残差バイナリデジタル信号について、サインビット、商の信号値、余りの信号値を符号化することを利用し、ゼロ残差信号値はサインビットを符号化せずに符号化される、請求項38に記載の装置。
  40. 前記ライス符号化スキームは、1以上のインタリーブされる残差バイナリデジタル信号について、1以上の商の信号値と1以上の余りの信号値と、を符号化することを利用する、請求項38に記載の装置。
  41. 前記予測される狭いダイナミックレンジバイナリデジタル信号は、単一の時間遅延オペレーションを、実際の狭いダイナミックレンジバイナリデジタル信号に適用することを備え、前記ライス符号化スキームは、サインビット、商の信号値と余りの信号値を符号化することを備える、請求項38に記載の装置。
  42. 前記サイン符号化、商の信号値符号化、および余りの信号値符号化は、特定のビットストリームにおいて編成されるので、サインの符号化信号値、商の符号化信号値、及び余りの符号化信号値は、一緒にグルーピングされる、請求項41に記載の装置。
  43. 前記サイン符号化、商の信号値符号化、および余りの信号値符号化は、1以上のビットストリームへと編成される、請求項38に記載の装置。
  44. 前記符号化デバイスは、第1のK信号値を符号化するように、前記第1のK信号値と第2のK信号値との間のK信号差分を計算するように、前記K信号差分を符号化するように、さらに適応される、請求項38に記載の装置。
  45. 前記第1のK信号値は、第1のブロックにおける狭いダイナミックレンジバイナリ信号に対応し、前記第2のK信号値は、第2のブロックにおける狭いダイナミックレンジバイナリデジタル信号に対応する、請求項44に記載の装置。
  46. 信号ビットを、少なくとも部分的に、前記符号化デバイスは、前記ライス符号化スキームが残差バイナリデジタル信号のブロックを圧縮しない場合には前記残差バイナリデジタル信号のブロックは前記ライス符号化スキームで符号化されなかったということを示すために、符号化するようにさらに適応される、請求項38に記載の装置。
  47. 前記符号化デバイスは、前記ライス符号化スキームを使用して残差バイナリデジタル信号の後続ブロックを符号化するようにさらに適応される、請求項46に記載の装置。
  48. 前記符号化デバイスは、前記K信号値と、前記ライス符号化スキームで符号化されなかった残差バイナリデジタル信号のブロックに対応するK信号値との間の差分に少なくとも部分的に基づいて、前記残差バイナリデジタル信号の後続ブロックについてK信号値を符号化するようにさらに適応される、請求項47に記載の装置。
  49. 前記符号化デバイスは、狭いダイナミックレンジバイナリデジタル信号のグループを1以上のフレームへと編成するようにさらに適応される、請求項38に記載の装置。
  50. 前記1以上のフレームは、互いに独立して、少なくとも部分的に符号化される、請求項49に記載の装置。
  51. 保存された命令を有する記憶媒体、
    を備え、前記命令は、専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、ライス符号化スキームを使用して符号化されるべき残差バイナリデジタル信号を生成するために、狭いダイナミックレンジバイナリデジタル信号と、予測される狭いダイナミックレンジバイナリデジタル信号と、を比較することを可能にする、製品。
  52. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、与えられた残差バイナリデジタル信号について、サインビット、商の信号値、余りの信号値を符号化して利用することをさらに可能にし、ゼロ残差信号値はサインビットを符号化せずに符号化される、請求項51に記載の製品。
  53. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、1以上のインタリーブされる残差バイナリデジタル信号について、1以上の商の信号値と1以上の余りの信号値と、を符号化することを利用することをさらに可能にする、請求項51に記載の製品。
  54. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、単一の時間遅延オペレーションを、実際の狭いダイナミックレンジバイナリデジタル信号に適用することをさらに可能にし、前記ライス符号化スキームは、サインビット、商の信号値と余りの信号値を符号化することを備える、請求項51に記載の製品。
  55. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、前記サイン符号化、商の信号値符号化、および余りの信号値符号化を特定のビットストリームにおいて編成することを可能にするので、サインの符号化信号値、商の符号化信号値、及び余りの符号化信号値は、一緒にグルーピングされる、請求項54に記載の製品。
  56. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、前記サイン符号化、商の信号値符号化、および余りの信号値符号化を1以上のビットストリームへと編成することをさらに可能にする、請求項51に記載の製品。
  57. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、第1のK信号値を符号化するように、前記第1のK信号値と第2のK信号値との間のK信号差分を計算するように、前記K信号差分を符号化することをさらに可能にする、請求項51に記載の製品。
  58. 前記第1のK信号値は、第1のブロックにおける狭いダイナミックレンジバイナリ信号に対応し、前記第2のK信号値は、第2のブロックにおける狭いダイナミックレンジバイナリデジタル信号に対応する、請求項57に記載の製品。
  59. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、信号ビットを、少なくとも部分的に、前記ライス符号化スキームは残差バイナリデジタル信号のブロックを圧縮しない場合には前記残差バイナリデジタル信号のブロックは前記ライス符号化スキームで符号化されなかったということを示すために、符号化することをさらに可能にする、請求項51に記載の製品。
  60. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、前記ライス符号化スキームを使用して残差バイナリデジタル信号の後続ブロックを符号化することをさらに可能にする、請求項59に記載の製品。
  61. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記専用コンピューティングデバイスが、前記K信号値と、前記ライス符号化スキームで符号化されなかった残差バイナリデジタル信号のブロックに対応するK信号値との間の差分に少なくとも部分的に基づいて、前記残差バイナリデジタル信号の後続ブロックについてK信号値を符号化することをさらに可能にする、請求項60に記載の製品。
  62. 前記命令は、前記専用コンピューティングデバイスによって実行される場合には、前記汎用コンピューティングデバイスが狭いダイナミックレンジバイナリデジタル信号のグループを1以上のフレームへと編成することをさらに可能にする、請求項51に記載の製品。
  63. 前記1以上のフレームは、互いに独立して、少なくとも部分的に符号化される、請求項62に記載の製品。
  64. A−lawマッピングまたはμ−lawマッピングのうちの少なくとも1つを通じて前記コンパンデッドドメインにおいて前記狭いダイナミックレンジバイナリデジタル信号へと前記より広いダイナミックレンジ信号をマッピングするための手段と、
    前記狭いダイナミックレンジバイナリデジタル信号の非線形のドメインにおける信号予測を通じて前記狭いダイナミックレンジバイナリデジタル信号を圧縮するための手段と、
    を備える装置。
  65. ライス符号化スキームを使用して符号化されるべき残差バイナリデジタル信号を生成するために、狭いダイナミックレンジバイナリデジタル信号と、予測される狭いダイナミックレンジバイナリデジタル信号と、を比較するための手段と、
    前記残差バイナリデジタル信号をライス符号化するための手段と、
    を備える装置。
  66. 第1のK信号値を符号化するための手段と、
    前記第1のK信号値と第2のK信号値との間のK信号差分を計算するための手段と、
    前記K信号差分を符号化するための手段と、
    をさらに備える請求項65に記載の装置。
  67. 信号ビットを、少なくとも部分的に、前記ライス符号化スキームは残差バイナリデジタル信号のブロックを圧縮しない場合には前記残差バイナリデジタル信号のブロックは前記ライス符号化スキームで符号化されなかったということを示すために、符号化するための手段、をさらに備える請求項65に記載の装置。
  68. 前記ライス符号化スキームを使用して残差バイナリデジタル信号の後続ブロックを符号化するための手段、をさらに備えている請求項67に記載の装置。
  69. 前記K信号値と、前記ライス符号化スキームで符号化されなかった残差バイナリデジタル信号のブロックに対応するK信号値との間の差分に少なくとも部分的に基づいて、前記残差バイナリデジタル信号の後続ブロックについてK信号値を符号化するための手段、をさらに備える請求項68に記載の装置。
  70. 狭いダイナミックレンジバイナリデジタル信号のグループを1以上のフレームへと編成するための手段、をさらに備える請求項65に記載の装置。
JP2011518942A 2008-07-18 2009-07-17 デジタル信号の圧縮または解凍のための方法、システムおよび装置 Pending JP2011528807A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US8217008P 2008-07-18 2008-07-18
US61/082,170 2008-07-18
US9126308P 2008-08-22 2008-08-22
US61/091,263 2008-08-22
US12/504,592 US20100017196A1 (en) 2008-07-18 2009-07-16 Method, system, and apparatus for compression or decompression of digital signals
US12/504,592 2009-07-16
PCT/US2009/051036 WO2010009423A1 (en) 2008-07-18 2009-07-17 Method, system, and apparatus for compression or decompression of digital signals

Publications (1)

Publication Number Publication Date
JP2011528807A true JP2011528807A (ja) 2011-11-24

Family

ID=41531072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011518942A Pending JP2011528807A (ja) 2008-07-18 2009-07-17 デジタル信号の圧縮または解凍のための方法、システムおよび装置

Country Status (7)

Country Link
US (1) US20100017196A1 (ja)
EP (1) EP2319038A1 (ja)
JP (1) JP2011528807A (ja)
KR (2) KR20110043684A (ja)
CN (1) CN102057425A (ja)
TW (1) TW201015540A (ja)
WO (1) WO2010009423A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014149342A (ja) * 2013-01-31 2014-08-21 Axell Corp 音声信号圧縮装置及び音声信号圧縮方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
CN101902283B (zh) * 2009-05-26 2014-06-18 鸿富锦精密工业(深圳)有限公司 编码调制方法及系统
CN102368385B (zh) * 2011-09-07 2013-08-14 中科开元信息技术(北京)有限公司 后向块自适应Golomb-Rice编解码方法及装置
GB2524424B (en) 2011-10-24 2016-04-27 Graham Craven Peter Lossless buried data
RU2750644C2 (ru) * 2013-10-18 2021-06-30 Телефонактиеболагет Л М Эрикссон (Пабл) Кодирование и декодирование положений спектральных пиков
CN106803762B (zh) * 2016-12-28 2019-03-05 中国北方车辆研究所 一种应用于数字通信的编码方法
CN106952651A (zh) * 2017-02-17 2017-07-14 福建星网智慧科技股份有限公司 一种语音处理装置传输语音的方法以及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207497A (ja) * 1996-12-19 1998-08-07 Lucent Technol Inc 音声コーダの方法とシステム
JP2003524796A (ja) * 1999-07-19 2003-08-19 クゥアルコム・インコーポレイテッド 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4718087A (en) * 1984-05-11 1988-01-05 Texas Instruments Incorporated Method and system for encoding digital speech information
US5400075A (en) * 1993-01-13 1995-03-21 Thomson Consumer Electronics, Inc. Adaptive variable length encoder/decoder
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
US5818530A (en) * 1996-06-19 1998-10-06 Thomson Consumer Electronics, Inc. MPEG compatible decoder including a dual stage data reduction network
CA2242523C (en) * 1996-11-11 2005-07-12 Philips Electronics N.V. Data compression/expansion using a rice encoder/decoder
US6125348A (en) * 1998-03-12 2000-09-26 Liquid Audio Inc. Lossless data compression with low complexity
US6611531B1 (en) * 1998-09-30 2003-08-26 Cisco Technology, Inc. Method and apparatus for routing integrated data, voice, and video traffic
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US20070110042A1 (en) * 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
US6694294B1 (en) * 2000-10-31 2004-02-17 Qualcomm Incorporated System and method of mu-law or A-law compression of bark amplitudes for speech recognition
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7408918B1 (en) * 2002-10-07 2008-08-05 Cisco Technology, Inc. Methods and apparatus for lossless compression of delay sensitive signals
KR100453142B1 (ko) * 2002-10-17 2004-10-15 주식회사 팬택 이동통신 단말기에서의 사운드 압축 방법
DE10258472B3 (de) * 2002-12-09 2004-05-13 Siemens Ag Verfahren zum Verarbeiten von digitalen Datenwerten
WO2005020210A2 (en) * 2003-08-26 2005-03-03 Sarnoff Corporation Method and apparatus for adaptive variable bit rate audio encoding
EP2009623A1 (en) * 2007-06-27 2008-12-31 Nokia Siemens Networks Oy Speech coding
WO2008151408A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207497A (ja) * 1996-12-19 1998-08-07 Lucent Technol Inc 音声コーダの方法とシステム
JP2003524796A (ja) * 1999-07-19 2003-08-19 クゥアルコム・インコーポレイテッド 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014149342A (ja) * 2013-01-31 2014-08-21 Axell Corp 音声信号圧縮装置及び音声信号圧縮方法

Also Published As

Publication number Publication date
WO2010009423A1 (en) 2010-01-21
TW201015540A (en) 2010-04-16
KR20120096541A (ko) 2012-08-30
CN102057425A (zh) 2011-05-11
EP2319038A1 (en) 2011-05-11
KR20110043684A (ko) 2011-04-27
US20100017196A1 (en) 2010-01-21

Similar Documents

Publication Publication Date Title
KR101737294B1 (ko) 심볼 압축을 수반하는 데이터의 소스 코딩 및 디코딩을 위한 방법들 및 디바이스들
JP2011528807A (ja) デジタル信号の圧縮または解凍のための方法、システムおよび装置
TWI431948B (zh) 轉換區塊之效率編碼和解碼
US8653991B2 (en) Coding method, decoding method, and apparatuses, programs and recording media therefor
US8558724B2 (en) Coding method, coding appartaus, decoding method, decoding apparatus, program, and recording medium
US8285062B2 (en) Method for improving the performance of embedded graphics coding
US20070094019A1 (en) Compression and decompression of data vectors
JP5264901B2 (ja) デジタルオーディオ信号の階層符号化
WO2010042348A1 (en) Arithmetic encoding for celp speech encoders
JP6681383B2 (ja) エンコーダ、デコーダ、および方法
US20100324914A1 (en) Adaptive Encoding of a Digital Signal with One or More Missing Values
JP2019124947A (ja) スペクトルピーク位置の符号化及び復号化
US20100191534A1 (en) Method and apparatus for compression or decompression of digital signals
US11475600B2 (en) Method and device for digital data compression
WO2011097963A1 (zh) 编码方法、解码方法、编码器和解码器
Yang et al. A lossless audio compression scheme with random access property
US20180205952A1 (en) Method and apparatus for performing arithmetic coding by limited carry operation
WO2011162723A1 (en) Entropy encoder arrangement and entropy decoder arrangement
WO2010041680A1 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
US9070362B2 (en) Audio quantization coding and decoding device and method thereof
KR100686354B1 (ko) 가변 트리를 이용한 허프만 복호화 방법 및 장치
JP3218630B2 (ja) 高能率符号化装置及び高能率符号復号化装置
Mohamed Wireless Communication Systems: Compression and Decompression Algorithms
JP3028885B2 (ja) ベクトル量子化装置
WO2005106849A1 (en) Digital audio compression/decompression with reduced complexity linear predictor coefficients coding/de-coding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120926

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121003

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121026

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121102

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121126

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121225

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130129