JP2005260969A - 無損失オーディオ符号化/復号化方法および装置 - Google Patents

無損失オーディオ符号化/復号化方法および装置 Download PDF

Info

Publication number
JP2005260969A
JP2005260969A JP2005067265A JP2005067265A JP2005260969A JP 2005260969 A JP2005260969 A JP 2005260969A JP 2005067265 A JP2005067265 A JP 2005067265A JP 2005067265 A JP2005067265 A JP 2005067265A JP 2005260969 A JP2005260969 A JP 2005260969A
Authority
JP
Japan
Prior art keywords
frequency
context
importance
bit plane
lossless
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005067265A
Other languages
English (en)
Other versions
JP2005260969A5 (ja
JP4744899B2 (ja
Inventor
殷 美 ▼呉▲
Oh Ennmi
Jung-Hoe Kim
金 重 會
Miao Lei
磊 苗
Shi-Hwa Lee
時 和 李
Sangwook Kim
▼尚▲ ▼焔▲ 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2005260969A publication Critical patent/JP2005260969A/ja
Publication of JP2005260969A5 publication Critical patent/JP2005260969A5/ja
Application granted granted Critical
Publication of JP4744899B2 publication Critical patent/JP4744899B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 BPGCより優れた圧縮率を可能とする無損失オーディオ符号化/復号化方法および装置を提供する。
【解決手段】 整数値を有する周波数領域のオーディオスプクトル信号を、周波数に応じてビットプレーン信号にマッピングする段階と、ビットプレーン別に、MSBおよびゴロムパラメータを獲得する段階と、MSBからLSBの順番に、かつ低い周波数から高い周波数の順番に符号化するビットプレーン上の2進サンプルを選択する段階と、選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、選択された2進サンプルの文脈を計算する段階と、獲得されたゴロムパラメータと計算された文脈とを利用して、確率モデルを選択する段階と、選択された確率モデルを利用して、2進サンプルを無損失符号化する段階と、を含む符号化方法。
【選択図】 図6

Description

本発明は、オーディオ信号の符号化/復号化に関し、より詳細には、文脈に基づいた符号化方式を用いて、BPGC(Bit−Plane Golomb Code)より優れた圧縮率を提供可能な無損失オーディオ符号化/復号化方法および装置に関する。
無損失オーディオ符号化方式には、MLP(Meridian Lossless audio compression Packing)、Monkey’s Audio、FLAC(Free Lossless Audio Coding)などが挙げられる。特に、MLPは、DVD−A(Digital Versatile Disk-Audio)に適用されている。インターネットのネットワーク帯域幅の拡大に伴い、大容量のマルチメディアコンテンツが提供されており、それに伴い無損失オーディオ方式が必要となっている。EU(European Union)では、すでにDAB(Digital Audio Broadcasting)を介してのデジタルオーディオ放送が開始しており、該当する放送局やコンテンツ提供者はオーディオ無損失符号化方式を利用している。一方、MPEG(Motion Picture Experts Group)やISO/IEC14496−3:2001/AMD 5、SLS(Audio Scalable to Lossless Coding)の名称で、無損失オーディオ圧縮方式についての標準化が進んでいる。これは、FGS(Fine Grain Scalablity)を提供することによって無損失オーディオ圧縮を可能とする技術である。無損失オーディオ圧縮技術で最も重要な要素である圧縮率は、データ間の重複情報を除去することによって改善することができる。前記重複情報は、隣接するデータ間から予測され、除去されるか、あるいは隣接するデータ間の文脈(context)を用いて除去される。整数MDCT(Modified Discrete Cosine Transform)係数は、ラプラス分布を示し、この分布ではゴロム(Golomb)コードという圧縮方式が最適の結果を示す。FGSを提供するためには、ビットプレーンコーディングが必要であり、前記ゴロムコードとビットプレーンコーディングとを組み合わせることにより(この組み合わせをBPGC(Bit Plane Golomb Coding)と呼ぶ)、最適の圧縮率とFGSを提供することができる。
しかしながら、前記整数MDCT係数がラプラス分布を有するという仮定は、実際のデータ分布では適切でないことがある。前記BPGCは、整数MDCT係数がラプラス分布を示すと仮定して考案されたアルゴリズムなので、前記整数MDCT係数がラプラス分布を示さない場合には、最適の圧縮率を提供することができない。従って、前記整数MDCT係数がラプラス分布を示すという仮定に関係なく、最適の圧縮率を提供可能な無損失オーディオ符号化および復号化方式が必要である。
本発明が達成しようとする技術的課題は、前記整数MDCT係数がラプラス分布を示すという仮定に関係なく、更に最適の圧縮率を提供できる無損失オーディオ符号化方法および装置を提供することにある。
また、本発明が達成しようとする技術的課題は、整数MDCT係数がラプラス分布を示すという仮定に関係なく、更に最適の圧縮率を提供できる無損失オーディオ復号化方法および装置を提供することにある。
前記技術的課題を達成するための本発明による無損失オーディオ符号化方法は、整数値を有する前記周波数領域のオーディオスペクトル信号を周波数に応じてビットプレーン信号にマッピングする段階と、ビットプレーンの最上位ビットおよびゴロムパラメータを獲得する段階と、最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に符号化するビットプレーン上の2進サンプルを選択する段階と、前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれについて、既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する段階と、前記獲得されたゴロムパラメータと、前記計算された文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する段階と、前記選択された確率モデルを利用して、前記2進サンプルに対して無損失符号化を行う段階と、を含むことを特徴とする。
前記技術的課題を達成するための本発明による無損失オーディオ符号化方法は、(a)前記周波数領域のオーディオスペクトル信号を、スケーリングすることで損失符号化器の入力信号として整合させる段階と、(b)前記スケーリングされた周波数信号に対して損失圧縮符号化を行う段階と、(c)前記損失符号化されたデータと、前記整数値を有する周波数領域のオーディオスペクトル信号との差に相当するエラーマッピングされた信号を求める段階と、(d)前記エラーマッピングされた信号が属する周波数ラインの周辺に存在する、複数の周波数ラインのそれぞれに対して既に符号化されたビットプレーンの重要度に基づき求めた文脈を利用し、前記エラーマッピングされた信号に対して無損失符号化を行う段階と、(e)前記無損失符号化された信号と前記損失符号化された信号とを多重化して、ビットストリームを生成する段階と、を含むことを特徴とする。
前記技術的課題を達成するための本発明による無損失オーディオ符号化装置は、整数値を有する周波数領域のオーディオスプクトル信号を、周波数に応じてビットプレーンデータにマッピングするビットプレーンマッピング部と、前記ビットプレーンの最上位ビットおよびゴロムパラメータを獲得するパラメータ獲得部と、最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の2進サンプルを選択する2進サンプル選択部と、前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する文脈計算部と、前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、確率モデルを選択する確率モデル選択部と、前記選択された確率モデルを利用して、前記2進サンプルに対して無損失符号化を行う2進サンプル符号化部と、を備えることを特徴とする。
前記技術的課題を達成するための本発明による無損失オーディオ符号化装置は、整数値を有する周波数領域のオーディオスペクトル信号を、損失符号化部の入力信号として整合させるスケーリング部と、前記スケーリングされた周波数信号を損失符号化する損失符号化部と、前記損失符号化された信号と前記整数時間/周波数変換部の信号との差を求めるエラーマッピング部と、前記エラーマッピングされた信号を、前記エラーマッピングされた信号が属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度に基づいて求めた文脈を利用して無損失符号化を行う無損失符号化部と、前記無損失符号化された信号と、前記損失符号化された信号とを多重化して、ビットストリームを生成するマルチプレクサと、を備えることを特徴とする。
前記他の技術的課題を達成するための本発明による無損失オーディオ復号化方法は、オーディオデータのビットストリームからゴロムパラメータを獲得する段階と、最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化する2進サンプルを選択するサンプル選択段階と、前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する文脈計算段階と、前記ゴロムパラメータと文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する確率モデル選択段階と、前記選択された確率モデルを利用して、算術復号化を行う算術復号化段階と、すべてのサンプルが復号化されるまで、前記サンプル選択段階ないし算術復号化段階を繰り返して行う段階と、を含むことを特徴とする。
前記他の技術的課題を達成するための本発明による無損失オーディオ復号化方法は、符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータとする時、(aa)オーディオビットストリームを逆多重化して、損失符号化された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する段階と、(bb)前記抽出された損失ビットストリームを、損失復号化する段階と、(cc)前記抽出されたエラービットストリームを、復号化するサンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、それぞれの同一周波数ラインで既に復号化されたビットプレーンサンプルの重要度に基づいた文脈を利用して無損失復号化する段階と、(dd)前記復号化された損失ビットストリームとエラービットストリームとを利用して、周波数スペクトル信号に復元する段階と、を含むことを特徴とする。
前記他の技術的課題を達成するための本発明による無損失オーディオ復号化装置は、オーディオデータのビットストリームからゴロムパラメータを獲得するパラメータ獲得部と、最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に復号化する2進サンプルを選択するサンプル選択部と、前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する文脈計算部と、前記パラメータ獲得部のゴロムパラメータと前記文脈計算部の文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する確率モデル選択部と、前記選択された確率モデルを利用して算術復号化を行う算術復号化部と、を備えることを特徴とする。
前記他の技術的課題を達成するための本発明による無損失オーディオ復号化装置は、損失符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータとする時、オーディオビットストリームを逆多重化して、所定の損失符号化された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する逆多重化部と、前記抽出された損失ビットストリームを、所定の損失復号化する損失復号化部と、前記抽出されたエラービットストリームを復号化するサンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度に基づいた文脈を利用して、前記抽出された損失ビットストリームに対して無損失復号化を行う無損失復号化部と、前記復号化された損失ビットストリームとエラービットストリームとを合成して、周波数スペクトル信号に復元するオーディオ信号合成部と、を備えることを特徴とする。
更に、前記記載された発明を、コンピュータで実行させるためのプログラムを記録したコンピュータ可読記録媒体を提供する。
本発明による無損失オーディオ符号化/復号化方法および装置によれば、無損失オーディオ符号化/復号化において、入力の分布に無関係に、グローバル文脈およびローカル文脈を利用した統計的な分布に基づくモデルを通じて、最適の性能を提供することができる。更に、整数MDCT係数がラプラス分布を示すという仮定に無関係に最適で、かつ文脈に基づいた符号化方式を用いてBPGCより優れた圧縮率を提供することができる。
以下、添付図面を参照して、本発明の実施形態に係る無損失オーディオ符号化/復号化方法および装置を詳細に説明する。
オーディオ符号化において、前記FGSを提供して無損失オーディオ符号化を行うためには、前記整数化されたMDCTを利用する。特に、前記オーディオ信号の入力サンプル分布が、ラプラス分布に従えば、BPGC方式が最適の圧縮結果を示し、それは、ゴロムコードと等価的な結果を提供することが知られている。ゴロムパラメータは、下記のようなコードにより求められる。
For(L=0;(N<<L+1))<=A;L++);
このコードによりゴロムパラメータLを求められ、ゴロムコードの特性上、Lより小さいビットプレーンでは0または1が表示される確率を1/2と見ることができる。しかし、この結果は、ラプラス分布である場合には最適であるが、そうでない場合には、最適の圧縮率を提供することができない。したがって、本発明の基本概念としては、データ分布がラプラス分布であるかどうかに関らず、統計的分析を用いて文脈を利用して最適の圧縮率を提供することにある。
図1は、本発明の1実施形態に係る無損失オーディオ符号化装置についての構成を示すブロック図であり、整数時間/周波数変換部100および無損失符号化部120から構成される。前記整数時間/周波数変換部100は、時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する。尚、この変換は整数MDCTを使用することが好ましい。前記無損失符号化部120は、前記周波数領域のオーディオ信号を周波数に応じてビットプレーンデータにマッピングし、前記ビットプレーンを構成する2進サンプルに対して、所定の文脈を利用して無損失符号化を行う。この無損失符号化部120は、図2に示すように、ビットプレーンマッピング部200と、パラメータ獲得部210と、2進サンプル選択部220と、文脈計算部230と、確率モデル選択部240と、2進サンプル符号化部250とから構成される。
前記ビットプレーンマッピング部200は、前記周波数領域のオーディオ信号を、周波数に応じてビットプレーンデータをマッピングする。図8および図10は、周波数に応じてビットプレーンデータをマッピングした文脈の1例を示したものである。
前記パラメータ獲得部210は、前記ビットプレーンのMSBとゴロムパラメータとを獲得する。前記2進サンプル選択部220は、MSBからLSBの順番に、低い周波数から高い周波数の順番に、符号化するビットプレーン上の2進サンプルを選択する。
前記文脈計算部230は、前記選択した2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する。
前記確率モデル選択部240は、前記獲得したゴロムパラメータと、前記計算した文脈とを利用して、確率モデルを選択する。前記2進サンプル符号化部250は、前記選択した確率モデルを利用して、前記2進サンプルに対して無損失符号化を行う。
図2では、ビットプレーン上のあらゆる2進サンプルに対して、文脈に基づいた無損失符号化を利用して符号化する完全文脈モード(full context mode)で符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の2進サンプルのみに文脈に基づいた無損失符号化を利用し、残りの2進サンプルについては、単にビットパッキング(bit-packing)で符号化する部分文脈モード(partial context mode)で符号化を行うことができる。ここで、ビットパッキングで符号化を行うビットプレーン上の2進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の2進サンプルは、1が発生する確率が1/2だからである。
図3は、本発明の他の実施形態に係る無損失オーディオ符号化装置の構成をブロック図で示したものであり、整数時間/周波数変換部300と、スケーリング部310と、損失符号化部320と、エラーマッピング部330と、無損失符号化部340と、マルチプレクサ350とから構成される。
前記整数時間/周波数変換部300は、時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する。この変換は整数MDCTを用いて行われることが好ましい。前記スケーリング部310は、前記整数時間/周波数変換部300のオーディオ周波数信号を、損失符号化部320の入力信号と整合させる。前記整数時間/周波数変換部300の出力信号は整数で示されるので、前記損失符号化部320の入力として直接使用することができない。したがって、前記スケーリング部310を介して、損失符号化部320の入力信号として使用できるように、前記整数時間/周波数変換部300のオーディオ周波数信号を整合させる。
前記損失符号化部320は、前記スケーリングされた周波数信号に対して損失圧縮符号化を行う。この符号化はAACコア符号化器を使用して行われることが好ましい。前記エラーマッピング部330は、前記損失符号化された信号と、前記整数時間/周波数変換部300の信号との差に相当するエラーマッピングされた信号を獲得する。前記無損失符号化部340は、前記エラーマッピングされた信号に対して、文脈を利用して無損失符号化を行う。前記マルチプレクサ350は、前記無損失符号化部340の無損失符号化された信号と、前記損失符号化部320の損失符号化された信号とを多重化して、ビットストリームに生成する。
図4は、前記無損失符号化部340の構成をブロック図で示したものあり、ビットプレーンマッピング部400と、パラメータ獲得部410と、2進サンプル選択部420と、文脈計算部430と、確率モデル選択部440と、2進サンプル符号化部450とを備える。
前記ビットプレーンマッピング部400は、前記エラーマッピング部のエラーマッピングされた信号を、周波数に応じてビットプレーンデータにマッピングする。前記パラメータ獲得部410は、前記ビットプレーンのMSBおよびゴロムパラメータを獲得する。前記2進サンプル選択部420は、MSBからLSBの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の2進サンプルを選択する。前記文脈計算部430は、前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する。前記確率モデル選択部440は、前記獲得されたゴロムパラメータと、前記計算された文脈とを利用して、確率モデルを選択する。前記2進サンプル符号化部450は、前記選択された確率モデルを利用して、前記2進サンプルに対して無損失符号化を行なる。
図4では、ビットプレーン上のあらゆる2進サンプルは、文脈に基づいた無損失符号化を利用して符号化するモードで符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の2進サンプルのみに文脈に基づいた無損失符号化を利用し、残りの2進サンプルについては、単にビットパッキングで符号化するモードで符号化を行っている。ここで、ビットパッキングで符号化するビットプレーン上の2進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の2進サンプルは、1が発生する確率が1/2だからである。
図2および図4にそれぞれ示された文脈計算部230、430で、前記2進サンプルの文脈値を計算する方法を説明する。本発明の1実施形態と関連して使用される重要度は、1つのスペクトルが、現行までの同一の周波数ライン上のビットプレーン上で符号化された前のサンプルのうち、1度でも1と符号化された場合には1であり、1度も1と符号化されたことのない場合には0と定義する。すなわち、重要度が1であれば、同一の周波数ライン上のビットプレーンのうち、現行まで符号化された前のサンプルが0となり、重要度が0であれば、同一の周波数ライン上のビットプレーンのうち、現行までに符号化された前のサンプルが0となることを意味する。
文脈計算部230、430が、前記2進サンプルの文脈を計算する方法の1つとして、グローバル文脈計算が挙げられる。このグローバル文脈計算は、全体のスペクトルの分布を考慮する方法であって、スペクトルの包絡線状が周波数軸上で急速に変わらず、前の包絡線状と類似した形状を示すことを利用した方法である。グローバル文脈計算において、前記文脈計算部230、430は、前記選択された2進サンプルの周波数ラインに基づいて、前記選択された2進サンプルの周波数ラインの前に位置するそれぞれの周波数ライン上のビットプレーンのうち、既に符号化された所定のサンプルを利用して、重要度が「1」となる確率値を求め、前記確率値に所定の整数値を掛けて整数で示した後、前記整数を利用して前記2進サンプルの文脈値を計算する。
文脈計算部230、430が、前記2進サンプルの文脈値を計算する方法の他の1つとして、ローカル文脈計算が挙げられる。ローカル文脈計算は、隣接する2進サンプルの相関関係を利用し、グローバル文脈を利用した文脈計算と同様に重要度を利用する方法であって、同一の周波数上のビットストリーム上で、現在符号化する2進サンプルの所定のN個の該当するサンプルの重要度を2進化し、それを再び十進数に変換して文脈を計算する。ローカル文脈計算において、前記文脈計算部230、430は、前記選択された2進サンプルの周波数ラインを基準として、前記選択された2進サンプルの周波数ラインを前後の所定範囲内に存在するそれぞれの周波数ライン上のビットプレーンのうち、既に符号化された所定のサンプルを利用して、重要度をそれぞれ求め、それをスカラー値に変換して、前記2進サンプルの文脈値を計算する。この計算で使用するNは、グローバル文脈計算に使用するMより小さい値を有する。
図5は、図1に示した本発明の1実施形態に係る無損失オーディオ符号化装置のについての動作を示すフローチャートであって、これを参照して前記無損失オーディオ符号化装置の構成を説明する。まず、時間領域におけるオーディオ信号に相当するPCM(Pulse Code Modulation)信号が、前記整数時間/周波数変換部100に入力すると、この信号は、整数値を有する周波数領域のオーディオスペクトル信号に変換される(500段階)。ここでは、intMDCTを使用することが好ましい。その後、図8および図10のように、前記周波数領域のオーディオ信号を、周波数に応じてビットプレーン信号にマッピングする(520段階)。その後、前記ビットプレーンを構成する2進サンプルに対して、所定の文脈を利用して、決定された確率モデルを通じて損失符号化する(540段階)。
図6は、図1に示した前記無損失符号化部120の動作を示したフローチャートであって、これを参照してその動作を説明する。
まず、前記周波数領域のオーディオ信号が、ビットプレーンマッピング部200に入力すると、前記信号は、周波数に応じてビットプレーンデータにマッピングされる(600段階)。更に、ゴロムパラメータ獲得部210を通じて、ビットプレーン別に、MSBおよびゴロムパラメータを獲得する(610段階)。その後、前記2進サンプル選択部220を通じて、MSBからLSBの順番に、かつ低い周波数から高い周波数の順番に符号化されたビットプレーン上の2進サンプルを選択する(620段階)。前記選択した2進サンプルに対して、これが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記2進サンプル選択部220で選択された2進サンプルの文脈を計算する(630段階)。前記ゴロムパラメータ獲得部210で求めたゴロムパラメータと、前記文脈計算部230で計算された文脈とを利用して、確率モデルを選択する(640段階)。前記確率モデル選択部240で選択した確率モデルを利用して、前記2進サンプルに対して無損失符号化を行う(650段階)。
図6では、ビットプレーン上のあらゆる2進サンプルに対して、文脈に基づいた無損失符号化方式を通じて符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の2進サンプルのみに文脈に基づいた無損失符号化を利用し、残りの2進サンプルについては、単にビットパッキングで符号化する方式を用いてよい。ここで、ビットパッキングで符号化するビットプレーン上の2進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の2進サンプルは、1が発生する確率が1/2であるからである。
図7は、図3に示した本発明の他の実施形態に係る無損失オーディオ符号化装置についての動作を示したフローチャートであって、これを参照して前記無損失オーディオ符号化装置の他の実施形態についての動作を説明する。まず、整数時間/周波数変換部300により、時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する(710段階)。次いで、前記周波数領域のオーディオスペクトル信号は、前記スケーリング部310でスケーリングされて、損失符号化部320の入力信号として使用できるように整合される(720段階)。前記スケーリング部310でスケーリングされた周波数信号は、損失圧縮符号化部320で損失圧縮符号化する(730段階)。前記損失圧縮符号化は、AAC Core符号化器によって行われることが好ましい。前記損失符号化部320で損失符号化されたデータと、前記整数値を有する周波数領域のオーディオスペクトル信号との差に相当するエラーマッピングされた信号を、エラーマッピング部330で求める(740段階)。前記エラーマッピングされた信号は、無損失符号化部340で文脈を利用して無損失符号化される(750段階)。
前記無損失符号化部340(図3参照)で無損失符号化された信号と、前記損失符号化部320で損失符号化された信号とがマルチプレクサ350で多重化され、ビットストリームが生成される(760段階)。前記無損失符号化(750段階)は、エラーマッピングされた信号を、周波数に応じでビットプレーンデータにマッピングする。その後、MSBとゴロムパラメータとを求める過程以後は、図6と同一であるため、その説明を省略する。
一般的に、MDCTによるスペクトル漏れ(Spectral leakage)によって、周波数軸上の隣接するサンプルに相関関係が存在する。すなわち、隣接したサンプルの値がXであれば、現行のサンプルの値がXに近い値である確率が非常に高いということである。したがって、隣接するサンプルを文脈として選択すれば、前記相関関係を利用して圧縮率向上を図ることができる。更に、ビットプレーン値は、下位サンプルの確率分布との相関関係が高いということが統計分析から分かる。したがって、周辺隣接サンプルを文脈として選択すれば、相関関係を利用して圧縮率向上を図ることができる。
以下に、文脈を計算する方式について説明する。
図8は、文脈計算部で、グローバル文脈を利用して文脈を求めるための図である。点線で表示された部分を利用して、既に符号化されたサンプルから現行のサンプルの確率分布を計算する。図9は、文脈計算部で、グローバル文脈を利用して文脈を計算する時に 「1」が表示される確率を表すグラフである。
図8において、斜線で格子状に表示されているボックスの中にあるシンボルを符号化すると仮定する。グローバル文脈は、図8で点線からなる楕円で表示される。図9において、他の2つの形態の文脈は、ゴロム文脈(Context 1)=1、ローカル文脈(Context 2)=0と固定されている。グラフで、BPGCを利用した文脈計算においては、「1」が表示される確率が一定に維持されているのに対し、グローバル文脈を利用した文脈計算においては、文脈インデックスが大きくなるにつれて、1が表示される確率が次第に高まることが分かる。
図10は、文脈計算部で、ローカル文脈を利用して文脈を求めるための図である。図11は、文脈計算部で、ローカル文脈を利用して文脈を計算する時に「1」が表示される確率を表すグラフである。
図10において、ローカル文脈は、3つの隣接する周波数ライン上で重要度を求める。ビットパターンは、0から7までの範囲(すなわち、2進数で000、001、010、011、100、101、110、111)内で、シンボルの確率をマッピングさせる。ローカル文脈は、図10に示したように、3つのそれぞれの点線で表示された部分を利用して、既に符号化されたサンプルから現行のサンプルの確率分布を計算する。ここで、現行の符号化で1が表示される確率は、前記したように、0から7までの範囲内で、ビットパターン「0,1,1」のように3つの値によって決定される。図11において、他の2つの文脈が、ゴロム文脈(Context1)=1、グローバル文脈(Context=2)=4と固定されている場合に、ローカル文脈を利用して文脈を計算する時に「1」が表示される確率を表す。ここで、BPGCを利用する場合に、1が表示される確率は一定に固定されているのに対し、グローバル文脈を利用して文脈を計算する時は、前半では1が表示される確率がBPGCを利用する場合より高いのに対し、後半では逆に1が表示される確率がBPGCを利用する場合より低いことがわかる。
実際に符号化する例を挙げると、グローバル文脈を計算するために符号化する10個の隣接するサンプルのうち5つが、重要度「1」を有していれば、確率は、0.5であり、それを8の値でスケーリングすれば4となる。それにより、グローバル文脈は4となる。そして、ローカル文脈を計算するために、前後の2つのサンプルの重要度をチェックする場合、i−2番目のサンプルが1、i−1番目のサンプルが0、i+1番目のサンプルが0、i+2番目のサンプルが1である場合、2進化すれば、1001となり、十進数では9となる。現在符号化するデータのゴロムパラメータが4であれば、ゴロムパラメータ(Context1)=4、グローバル文脈(Context2)=4、ローカル文脈(Context3)=9となる。そのようなゴロムパラメータ、グローバル文脈、ローカル文脈を利用して、確率モデルを選択する。確率モデルは、実装形態によって異なるが、その1つの実装方法は、三次元配列で、Prob[Golomb][Context1][Context2]として表せる。このようにして求めた確率モデルを用いて無損失符号化を行う。前記無損失符号化の代表的な方法として、算術符号化が使用することができる。本発明の方式により、従来の方式に比べて最大約0.8%の圧縮率の改善効果が見られる。
図12は、本発明の1実施形態に係る、完全文脈モードの場合の図であり、図13は、本発明の1実施形態による部分文脈モードの場合の図である。図12を参照すると、すべての2進サンプルが文脈に基づいた無損失符号化を用いて符号化され、図13を参照すると、2進サンプルの一部が文脈に基づいた無損失符号化を用いて符号化され、残りはビットパッキングを用いて符号化される。
図14は、本発明の1実施形態における、文脈基盤コーディングのための疑似コード(pseudo code)を表す。
次に、本発明の1実施形態に係る無損失オーディオ復号化装置および方法を説明する。
図15は、本発明の1実施形態に係る無損失オーディオ復号化装置の構成を示したブロック図であって、この装置はパラメータ獲得部1500と、サンプル選択部1510と、文脈計算部1520と、確率モデル選択部1530と、算術復号化部1540とから構成される。
前記パラメータ獲得部1500は、オーディオデータのビットストリームが入力されると、前記ビットストリームからMSBおよびゴロムパラメータを求める。前記サンプル選択部1510は、MSBからLSBの順番に、かつ低い周波数から高い周波数の順番に、復号化する2進サンプルを選択する。前記文脈計算部1520は、既に復号化されたサンプルを利用して、所定の文脈を計算し、図10に示したように、第1文脈計算部1600および第2文脈計算部1620から構成される。第1文脈計算部1600は、前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、それぞれの同じ周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、それを2進化して第1文脈を計算する。第2文脈計算部1620は、前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、それぞれの同一周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて、整数で示した後、前記整数を利用して第2文脈を計算する。前記確率モデル選択部1530は、前記パラメータ獲得部1500のゴロムパラメータと、前記文脈計算部1520で計算された文脈とを利用して、確率モデルを選択する。前記算術復号化部1540は、前記確率モデル選択部1530で選択された確率モデルを利用して算術復号化を行う。
図15では、ビットプレーン上のすべての2進サンプルは、文脈に基づいた無損失符号化方式を用いて符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の2進サンプルのみに文脈に基づいた無損失符号化を利用し、残りの2進サンプルについては、単にビットパッキングで符号化する方式を用いて符号化を行ってよい。ここで、ビットパッキングで符号化するビットプレーン上の2進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の2進サンプルは、1が発生する確率が1/2だからである。
図17は、本発明の他の実施形態に係る無損失オーディオ復号化装置の構成を示すブロック図であり、この装置は、逆多重化部1700と、損失復号化部1710と、無損失復号化部1720と、オーディオ信号合成部1730と、逆整数時間/周波数変換部1740とから構成され、更に逆時間/周波数変換部1750を備えることが好ましい。
前記逆多重化部1700は、オーディオビットストリームが入力されると、前記オーディオビットストリームを逆多重化し、前記ビットストリームが符号化される時に使用された所定の損失符号化方式により形成された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する。
前記損失復号化部1710は、前記逆多重化部1700で抽出された損失ビットストリームに対して、前記ビットストリームが符号化される時に使用された所定の損失符号化方式に対応する所定の損失復号化方式を用いて損失復号化を行う。前記無損失復号化部1720は、前記逆多重化部1700で抽出されたエラービットストリームに対しても、無損失符号化に対応する無損失復号化方式を用いて無損失復号化を行う。
前記オーディオ信号合成部1730は、前記復号化された損失ビットストリームとエラービットストリームとを合成して、周波数スペクトル信号に復元する。前記逆整数時間/周波数変換部1740は、前記オーディオ信号合成部1730で復元された周波数スペクトル信号を、逆整数時間/周波数変換して、時間領域のオーディオ信号に復元する。そして、前記逆時間/周波数変換部1750は、前記損失復号化部1710で復号化された周波数領域のオーディオ信号を、時間領域のオーディオ信号に復元する。それゆえ復元された信号は損失復号化された信号となる。
図18は、前記無損失復号化部1720の構成を示したブロック図であり、この複合化部はパラメータ獲得部1800と、サンプル選択部1810と、文脈計算部1820と、確率モデル選択部1830と、算術復号化部1840とから構成される。
前記パラメータ獲得部1800は、オーディオデータのビットストリームからMSBおよびゴロムパラメータを獲得する。前記サンプル選択部1810は、MSBからLSBの順番に、かつ低い周波数から高い周波数の順番に、復号化する2進サンプルを選択する。
前記文脈計算部1820は、既に復号化されたサンプルを利用して所定の文脈を計算する。前記計算部は第1文脈計算部および第2文脈計算部から構成される。第1文脈計算部1600は、前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、それぞれの同一の周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、それを2進化して第1文脈を計算する。第2文脈計算部1620は、前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、それぞれの同一の周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて、整数で示した後、その整数を利用して第2文脈を計算する。前記確率モデル選択部1830は、前記ゴロムパラメータと文脈を利用して、確率モデルを選択する。前記算術復号化部1840は、前記選択された確率モデルを利用して算術復号化する。
図18では、ビットプレーン上のすべての2進サンプルに対して、文脈に基づいた無損失符号化方式を用いて符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の2進サンプルのみが文脈に基づいた無損失符号化を利用し、残りの2進サンプルに対しては、単にビットパッキングで符号化する方式を用いて符号化することができる。ここで、ビットパッキングで符号化するビットプレーン上の2進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の2進サンプルは、1が発生する確率が1/2であるからである。
図19は、図15に示した本発明の1実施形態に係る無損失オーディオ復号化装置の動作を示したフローチャートであって、これを参照して、前記無損失オーディオ復号化装置の動作を説明する。
まず、オーディオデータのビットストリームがパラメータ獲得部1500に入力されると、前記オーディオデータのビットストリームからゴロムパラメータを獲得する(1900段階)。その後、サンプル選択部1510を通じて、MSBからLSBの順番に、かつ低い周波数から高い周波数の順番に、復号化する2進サンプルを選択する(1910段階)。前記サンプル選択部1510で復号化するサンプルが選択されれば、文脈計算部1520を通じて、既に復号化されたサンプルを利用して、所定の文脈を計算する(1920段階)。ここで、前記文脈は、第1文脈および第2文脈からなり、図16に示したように、第1文脈計算部1600は、前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、それぞれの同一周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、それを2進化して第1文脈を計算する。そして、第2文脈計算部1620は、前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、それぞれの同一周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて、整数で示した後、前記整数を利用して第2文脈を計算する。その後、前記確率モデル選択部1530を通じて、前記ゴロムパラメータと、前記第1文脈および第2文脈とを利用して、確率モデルを選択する(1930段階)。前記確率モデル選択部1530で確率モデルが選択されれば、前記選択された確率モデルを利用して、前記2進サンプルに対して算術復号化を行う(1940段階)。前記1910段階ないし1940段階を、すべてのサンプルが復号化されるまで繰り返して行う(1950段階)。
図19では、ビットプレーン上のあらゆる2進サンプルは、文脈に基づいた無損失符号化を利用して符号化する方式を通じて符号化している。しかし、本発明の他の1実施形態では、複雑性の改善のために、ビットプレーン上の一部の2進サンプルのみが文脈に基づいた無損失符号化を利用し、残りの2進サンプルについては、単にビットパッキングで符号化する方式を通じて符号化できる。ここで、ビットパッキングで符号化するビットプレーン上の2進サンプルの決定においてはゴロムパラメータを利用するが、これは、ゴロムパラメータ以下の2進サンプルは、1が発生する確率が1/2であるからである。
図20は、図17に示した本発明の他の実施形態に係る無損失オーディオ復号化装置のついての動作を示したフローチャートであって、これを参照して前記無損失オーディオ復号化装置の動作を説明する。
損失符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータと定義する。まず、オーディオビットストリームが、逆多重化部1700に入力されれば、前記ビットストリームを逆多重化して、所定の損失符号化を通じて生成された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する(2000段階)。前記抽出された損失ビットストリームは、損失復号化部1710に入力されて、符号化時の損失符号化に対応する所定の損失復号化方式により損失復号化する(2010段階)。更に、前記抽出されたエラービットストリームは、無損失復号化部1720に入力されて無損失復号化が行われる(2020段階)。前記無損失復号化(2020段階)の更に詳細な過程は、図19に示したものと同一である。前記損失復号化部1710で損失復号化された損失ビットストリームと、前記無損失復号化部1720で無損失復号化されたエラービットストリームとを、オーディオ信号合成部1730に入力させて、周波数スペクトル信号に復元する(2030段階)。前記周波数スペクトル信号は、前記逆整数時間/周波数変換部1740に入力されて、時間領域のオーディオ信号に復元される(2040段階)。
本発明は、コンピュータ可読記録媒体に、コンピュータ(情報処理機能を有する任意の装置を含む)可読コードとして実装することが可能である。コンピュータ可読記録媒体には、コンピュータシステムによって読み出されるデータが保存された、如何なる種類の記録装置が含まれる。コンピュータ可読記録装置の例としては、ROM(read only memory)、RAM(random access memory)、CD−ROM、磁気テープ、フロッピーディスク、光学式データ保存装置などが挙げられる。
以上、本発明を図面に示した実施形態を用いて説明したが、これらは例示的なものに過ぎず、本技術分野の当業者ならば、本発明の範囲および趣旨から逸脱しない範囲で多様な変更および変形が可能なことは理解できるであろう。
本発明は、無損失オーディオ符号化および復号化に利用されるインターネット電話(voice over internet protocol VoIP)およびMDプレイヤーなどに利用される。
本発明の1実施形態に係る無損失オーディオ符号化装置の構成を示すブロック図である。 図1の無損失符号化部の構成を示すブロック図である。 本発明の他の実施形態に係る無損失オーディオ符号化装置の構成を示すブロック図である。 図3の無損失符号化部の構成を示すブロック図である。 図1の無損失オーディオ符号化装置の動作を示したフローチャートである。 図1の無損失符号化部の動作を示すフローチャートである。 図3の無損失オーディオ符号化装置の動作を示すフローチャートである。 文脈計算部で、グローバル文脈を表す図である。 文脈計算部で、グローバル文脈計算時に1を表す確率を示すグラフである。 文脈計算部で、ローカル文脈を示す図である。 文脈計算部で、ローカル文脈計算時に1を表す確率を示すグラフである。 本発明の1実施形態に係る完全文脈モード(full context mode)についての図である。 本発明の1実施形態に係る部分文脈モード(partial context mode)についての図である。 本発明の1実施形態に係る文脈に基づいたコーディングのための疑似コードの1例である。 本発明の1実施形態に係る無損失オーディオ復号化装置の構成を示すブロック図である。 図15に示した文脈計算部の構成を示すブロック図である。 本発明の他の実施形態に係る無損失オーディオ復号化装置の構成を示すブロック図である。 図17の無損失復号化部の構成を示すブロック図である。 図15に示した無損失オーディオ復号化装置の動作を示すフローチャートである。 図15の無損失オーディオ復号化装置の動作を示すフローチャートである。

Claims (57)

  1. 整数値を有する周波数領域のオーディオスペクトル信号を周波数に応じてビットプレーン信号にマッピングする段階と、
    ビットプレーンの最上位ビットおよびゴロムパラメータを獲得する段階と、
    最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の2進サンプルを選択する段階と、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する段階と、
    前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する段階と、
    前記選択された確率モデルを利用して、前記2進サンプルに対して無損失符号化を行う段階と、
    を含むことを特徴とする無損失オーディオ符号化方法。
  2. 前記重要度は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「1」が1つでも存在すれば「1」となり、「1」が1つも存在しなければ「0」となることを特徴とする請求項1に記載の無損失オーディオ符号化方法。
  3. 前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を2進化して、前記選択された2進サンプルの文脈を計算することを特徴とする請求項1に記載の無損失オーディオ符号化方法。
  4. 前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの文脈値とすることを特徴とする請求項1に記載の無損失オーディオ符号化方法。
  5. 前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を利用して第1文脈を計算する段階と、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を利用して第2文脈を計算する段階と、
    を含むことを特徴とする請求項1に記載の無損失オーディオ符号化方法。
  6. 前記ビットプレーン上の2進サンプルの一部に対して、確率0.5を用いて符号化することを特徴とする請求項1に記載の無損失オーディオ符号化方法。
  7. 時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する段階を更に含むことを特徴とする請求項1に記載の無損失オーディオ符号化方法。
  8. (a)整数値を有する周波数領域のオーディオスペクトル信号を、スケーリングすることにより損失符号化器の入力信号として整合させる段階と、
    (b)前記スケーリングされた周波数信号に対して損失符号化を行う段階と、
    (c)前記損失符号化された信号と、前記整数値を有する周波数領域のオーディオスペクトル信号との差に相当するエラーマッピングされた信号を求める段階と、
    (d)前記エラーマッピングされた信号が属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して既に符号化されたビットプレーンの重要度に基づいて求めた文脈を利用することにより、前記エラーマッピングされた信号に対して無損失符号化を行う段階と、
    (e)前記無損失符号化された信号と前記損失符号化された信号とを多重化して、ビットストリームを生成する段階と、
    を含むことを特徴とする無損失オーディオ符号化方法。
  9. 前記重要度は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「1」が1つでも存在すれば「1」とし、「1」が1つも存在しなければ「0」とすることを特徴とする請求項8に記載の無損失オーディオ符号化方法。
  10. 前記(d)段階は、
    (d1)前記(c)段階でエラーマッピングされた信号を、周波数に応じてビットプレーンデータにマッピングする段階と、
    (d2)前記ビットプレーンの最上位ビットおよびゴロムパラメータを獲得する段階と、
    (d3)最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の2進サンプルを選択する段階と、
    (d4)前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する段階と、
    (d5)前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、確率モデルを選択する段階と、
    (d6)前記選択された確率モデルを利用して、前記2進サンプルに対して無損失符号化を行う段階と、
    を含むことを特徴とする請求項8に記載の無損失オーディオ符号化方法。
  11. 前記(d4)段階は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を2進化して、前記選択された2進サンプルの文脈を計算することを特徴とする請求項10に記載の無損失オーディオ符号化方法。
  12. 前記(d4)段階は、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの文脈とすることを特徴とする請求項10に記載の無損失オーディオ符号化方法。
  13. 前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を利用して第1文脈を計算する段階と、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を利用して第2文脈を計算する段階と、
    を含むことを特徴とする請求項10に記載の無損失オーディオ符号化方法。
  14. 前記ビットプレーン上の2進サンプルの一部に対して、確率0.5を用いて符号化を行うことを特徴とする請求項10に記載の無損失オーディオ符号化方法。
  15. 前記(a)段階の前に、時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する段階を更に含むことを特徴とする請求項8に記載の無損失オーディオ符号化方法。
  16. 整数値を有する周波数領域のオーディオスプクトル信号を、周波数に応じてビットプレーンデータにマッピングするビットプレーンマッピング部と、
    前記ビットプレーンの最上位ビットおよびゴロムパラメータを獲得するパラメータ獲得部と、
    最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の2進サンプルを選択する2進サンプル選択部と、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する文脈計算部と、
    前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する確率モデル選択部と、
    前記選択された確率モデルを利用して、前記2進サンプルに対して無損失符号化を行う2進サンプル符号化部と、
    を備えることを特徴とする無損失オーディオ符号化装置。
  17. 前記重要度は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「1」が1つでも存在すれば「1」とし、「1」が1つも存在しなければ「0」とすることを特徴とする請求項16に記載の無損失オーディオ符号化装置。
  18. 前記文脈計算部は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を2進化して前記選択された2進サンプルの文脈を計算する第1文脈計算部と、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの第2文脈で計算する第2文脈計算部と、
    を備えることを特徴とする請求項16に記載の無損失オーディオ符号化装置。
  19. 時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する整数時間/周波数変換部を更に備えることを特徴とする請求項16に記載の無損失オーディオ復号化装置。
  20. 前記整数時間/周波数変換部は、整数MDCTであることを特徴とする請求項19に記載の無損失オーディオ符号化装置。
  21. 前記ビットプレーン上の2進サンプルの一部に対して、確率0.5を用いて符号化を行うことを特徴とする請求項16に記載の無損失オーディオ符号化装置。
  22. 整数値を有する周波数領域のオーディオスペクトル信号を、出力先の入力信号として整合させるスケーリング部と、
    前記整合された周波数信号に対して損失符号化を行う損失符号化部と、
    前記損失符号化された信号と前記整数時間/周波数変換部の信号との差を求めるエラーマッピング部と、
    前記エラーマッピングされた信号を、前記エラーマッピングされた信号が属する周波数ラインの周りに存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度に基づいて求めた文脈を利用して無損失符号化する無損失符号化部と、
    前記無損失符号化された信号と、前記損失符号化された信号とを多重化して、ビットストリームを生成するマルチプレクサと、
    を備えることを特徴とする無損失オーディオ符号化装置。
  23. 前記重要度は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに、「1」が1つでも存在すれば「1」とし、「1」が1つも存在しなければ「0」とすることを特徴とする請求項22に記載の無損失オーディオ符号化装置。
  24. 前記無損失符号化部は、
    前記エラーマッピング部のエラーマッピングされた信号を、周波数に応じてビットプレーンデータにマッピングするビットプレーンマッピング部と、
    前記ビットプレーンの最上位ビットと、ゴロムパラメータとを獲得するパラメータ獲得部と、
    最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化を行うビットプレーン上の2進サンプルを選択する2進サンプル選択部と、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する文脈計算部と、
    前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する確率モデル選択部と、
    前記選択された確率モデルを利用して、前記2進サンプルに対して無損失符号化を行う2進サンプル符号化部と、
    を備えることを特徴とする請求項22に記載の無損失オーディオ符号化装置。
  25. 前記文脈計算部は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を2進化して前記選択された2進サンプルの第1文脈にする第1文脈計算部と、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの第2文脈にする第2文脈計算部と、
    を備えることを特徴とする請求項24に記載の無損失オーディオ符号化装置。
  26. 前記2進サンプル符号化部は、前記ビットプレーン上の2進サンプルの一部に対して、確率0.5を用いて符号化を行うことを特徴とする請求項24に記載の無損失オーディオ符号化装置。
  27. 時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する整数時間/周波数変換部を更に備えることを特徴とする請求項22に記載の無損失オーディオ符号化装置。
  28. オーディオデータのビットストリームからゴロムパラメータを獲得する段階と、
    最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化する2進サンプルを選択するサンプル選択段階と、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する文脈計算段階と、
    前記ゴロムパラメータと文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する確率モデル選択段階と、
    前記選択された確率モデルを利用して、前記2進サンプルに対して算術復号化を行う算術復号化段階と、
    すべてのサンプルが復号化されるまで、前記サンプル選択段階ないし算術復号化段階を繰り返して行う段階と、
    を含むことを特徴とする無損失オーディオ復号化方法。
  29. 前記重要度は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに、「1」が1つでも存在すれば「1」とし、「1」が1つも存在しなければ「0」とすることを特徴とする請求項28に記載の無損失オーディオ復号化方法。
  30. 前記文脈計算段階は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンのサンプルの重要度を求め、前記重要度を2進化して前記選択された2進サンプルの文脈を計算することを特徴とする請求項28に記載の無損失オーディオ復号化方法。
  31. 前記文脈計算段階は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一の周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの文脈にする特徴とすることを請求項28に記載の無損失オーディオ復号化方法。
  32. 前記文脈計算段階は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンのサンプルの重要度を利用して第1文脈を計算する段階と、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンのサンプルの重要度を利用して第2文脈を計算する段階と、
    を含むことを特徴とする請求項28に記載の無損失オーディオ復号化方法。
  33. 前記選択された2進サンプルの一部に対して、確率0.5を用いて復号化することを特徴とする請求項28に記載の無損失オーディオ復号化方法。
  34. 符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータとする、無損失オーディオ復号化方法であって、
    (aa)オーディオビットストリームを逆多重化して、所定の方法で損失符号化された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する段階と、
    (bb)前記抽出した損失ビットストリームに対して、所定の損失復号化を行う段階と、
    (cc)復号化するサンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインで既に復号化されたビットプレーンサンプルの重要度に基づいた文脈を利用して、前記抽出されたエラービットストリームに対して無損失復号化を行う段階と、
    (dd)前記復号化された損失ビットストリームとエラービットストリームとを利用して、周波数スペクトル信号に復元する段階と、
    を含むことを特徴とする無損失オーディオ復号化方法。
  35. 前記重要度は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「1」が1つでも存在すれば「1」とし、「1」が1つも存在しなければ「0」とすることを特徴とする請求項34に記載の無損失オーディオ復号化方法。
  36. 前記(cc)段階は、
    (cc1)オーディオデータのビットストリームからゴロムパラメータを獲得する段階と、
    (cc2)最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化する2進サンプルを選択する段階と、
    (cc3)前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する段階と、
    (cc4)前記ゴロムパラメータと文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する段階と、
    (cc5)前記選択された確率モデルを利用して算術復号化する段階と、
    (cc6)すべてのサンプルが復号化されるまで、前記(cc2)段階ないし(cc5)段階を繰り返して行う段階と、
    を含むことを特徴とする請求項34に記載の無損失オーディオ復号化方法。
  37. 前記(cc3)段階は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記重要度を2進化して、前記選択された2進サンプルの第1文脈を計算することを特徴とする請求項36に記載の無損失オーディオ復号化方法。
  38. 前記(cc3)段階は、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの第2文脈にすることを特徴とする請求項36に記載の無損失オーディオ復号化方法。
  39. 前記(cc3)段階は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を2進化して、前記選択された2進サンプルの第1文脈にする段階と、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの第2文脈にする段階と、
    を含むことを特徴とする請求項36に記載の無損失オーディオ復号化方法。
  40. 前記ビットプレーン上の2進サンプルの一部に対して、確率0.5を用いて復号化することを特徴とする請求項36に記載の無損失オーディオ復号化方法。
  41. (ee)前記周波数スペクトル信号を、逆整数時間/周波数変換して、時間領域のオーディオ信号を復元する段階を更に含むことを特徴とする請求項34に記載の無損失オーディオ復号化方法。
  42. オーディオデータのビットストリームからゴロムパラメータを獲得するパラメータ獲得部と、
    最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化する2進サンプルを選択するサンプル選択部と、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する文脈計算部と、
    前記パラメータ獲得部のゴロムパラメータと前記文脈計算部の文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する確率モデル選択部と、
    前記選択された確率モデルを利用して、前記2進サンプルに対して算術復号化を行う算術復号化部と、
    を備えることを特徴とする無損失オーディオ復号化装置。
  43. 前記重要度は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「1」が1つでも存在すれば「1」とし、「1」が1つも存在しなければ「0」とすることを特徴とする請求項42に記載の無損失オーディオ復号化方法。
  44. 前記文脈計算部は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記重要度を2進化して、選択された2進サンプルの第1文脈にする第1文脈計算部と、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの第2文脈にする第2文脈計算部と、
    を備えることを特徴とする請求項42に記載の無損失オーディオ復号化装置。
  45. 前記ビットプレーン上の2進サンプルの一部に対して、確率0.5を用いて復号化を行うことを特徴とする請求項42に記載の無損失オーディオ復号化方法。
  46. 損失符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータとする、無損失オーディオ復号化装置であって、
    オーディオビットストリームを逆多重化して、損失符号化された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する逆多重化部と、
    前記抽出された損失ビットストリームを損失復号化する損失復号化部と、
    前記抽出されたエラービットストリームを復号化するサンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度に基づいた文脈を利用して、前記抽出された損失ビットストリームに対して無損失復号化を行う無損失復号化部と、
    前記復号化された損失ビットストリームとエラービットストリームとを合成して、周波数スペクトル信号に復元するオーディオ信号合成部と、
    を備えることを特徴とする無損失オーディオ復号化装置。
  47. 前記損失復号化部は、AAC復号化部であることを特徴とする請求項46に記載の無損失オーディオ復号化装置。
  48. 前記オーディオ信号合成部で復元された周波数スペクトル信号を、逆整数時間/周波数変換して、時間領域のオーディオ信号を復元する逆整数時間/周波数変換部を更に備えることを特徴とする請求項46に記載の無損失オーディオ復号化装置。
  49. 前記損失復号化部で復号化された周波数領域のオーディオ信号を、時間領域のオーディオ信号に復元する逆時間/周波数変換部を更に備えることを特徴とする請求項46に記載の無損失オーディオ復号化装置。
  50. 前記重要度は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「1」が1つでも存在すれば「1」とし、「1」が1つも存在しなければ「0」とすることを特徴とする請求項46に記載の無損失オーディオ復号化方法。
  51. 前記無損失復号化部は、
    オーディオデータのビットストリームからゴロムパラメータを獲得するパラメータ獲得部と、
    最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化を行う2進サンプルを選択するサンプル選択部と、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された2進サンプルの文脈を計算する文脈計算部と、
    前記ゴロムパラメータと文脈とを利用して、前記選択された2進サンプルの確率モデルを選択する確率モデル選択部と、
    前記選択された確率モデルを利用して算術復号化する算術復号化部と、
    を備えることを特徴とする請求項46に記載の無損失オーディオ復号化装置。
  52. 前記文脈計算部は、
    前記選択された2進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記重要度を2進化して、前記選択された2進サンプルの第1文脈にする第1文脈計算部と、
    前記選択された2進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同じ周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された2進サンプルの第2文脈にする第2文脈計算部と、
    を備えることを特徴とする請求項51に記載の無損失オーディオ復号化装置。
  53. 前記ビットプレーン上の2進サンプルの一部に対して、確率0.5を用いて復号化を行うことを特徴とする請求項51に記載の無損失オーディオ復号化装置。
  54. 請求項1に記載の方法をコンピュータで実行させるためのプログラムが記録されたコンピュータ可読記録媒体。
  55. 請求項9に記載の方法をコンピュータで実行させるためのプログラムが記録されたコンピュータ可読記録媒体。
  56. 請求項28に記載の方法をコンピュータで実行させるためのプログラムが記録されたコンピュータ可読記録媒体。
  57. 請求項34に記載の方法をコンピュータで実行させるためのプログラムが記録されたコンピュータ可読記録媒体。
JP2005067265A 2004-03-10 2005-03-10 無損失オーディオ符号化/復号化方法および装置 Expired - Fee Related JP4744899B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US55135904P 2004-03-10 2004-03-10
US60/551,359 2004-03-10
KR1020040050479A KR100561869B1 (ko) 2004-03-10 2004-06-30 무손실 오디오 부호화/복호화 방법 및 장치
KR2004-050479 2004-06-30

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010230776A Division JP5372886B2 (ja) 2004-03-10 2010-10-13 無損失オーディオ復号化方法および記録媒体

Publications (3)

Publication Number Publication Date
JP2005260969A true JP2005260969A (ja) 2005-09-22
JP2005260969A5 JP2005260969A5 (ja) 2007-12-20
JP4744899B2 JP4744899B2 (ja) 2011-08-10

Family

ID=34829555

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2005067265A Expired - Fee Related JP4744899B2 (ja) 2004-03-10 2005-03-10 無損失オーディオ符号化/復号化方法および装置
JP2010230776A Expired - Fee Related JP5372886B2 (ja) 2004-03-10 2010-10-13 無損失オーディオ復号化方法および記録媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010230776A Expired - Fee Related JP5372886B2 (ja) 2004-03-10 2010-10-13 無損失オーディオ復号化方法および記録媒体

Country Status (7)

Country Link
US (1) US7660720B2 (ja)
EP (1) EP1575032B1 (ja)
JP (2) JP4744899B2 (ja)
KR (1) KR100561869B1 (ja)
CN (1) CN1681213B (ja)
DE (1) DE602005019643D1 (ja)
ES (1) ES2339257T3 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009518934A (ja) * 2005-12-07 2009-05-07 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号の符号化及び復号化方法、オーディオ信号の符号化及び復号化装置
JP2010506207A (ja) * 2006-10-06 2010-02-25 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ エンコード方法、デコード方法、エンコーダ、デコーダ、及びコンピュータプログラム製品
JP2012531086A (ja) * 2009-06-19 2012-12-06 サムスン エレクトロニクス カンパニー リミテッド コンテクスト基盤の算術符号化装置及びその方法並びに算術復号化装置及びその方法

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
JP4732203B2 (ja) * 2006-03-17 2011-07-27 キヤノン株式会社 画像符号化装置及び復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
KR101346358B1 (ko) 2006-09-18 2013-12-31 삼성전자주식회사 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
US20080071550A1 (en) * 2006-09-18 2008-03-20 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode audio signal by using bandwidth extension technique
KR101261524B1 (ko) * 2007-03-14 2013-05-06 삼성전자주식회사 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
US7991622B2 (en) * 2007-03-20 2011-08-02 Microsoft Corporation Audio compression and decompression using integer-reversible modulated lapped transforms
US8086465B2 (en) * 2007-03-20 2011-12-27 Microsoft Corporation Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
KR100889750B1 (ko) * 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
JP4981174B2 (ja) * 2007-08-24 2012-07-18 フランス・テレコム 確率テーブルの動的な計算によるシンボルプレーン符号化/復号化
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
AU2009267543B2 (en) 2008-07-11 2013-01-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and audio decoder
WO2010032934A2 (ko) * 2008-09-16 2010-03-25 에스케이텔레콤 주식회사 B-변환을 위한 부호화 방법 및 장치와 그를 위한 부호화 데이터
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
CA2778325C (en) 2009-10-20 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
BR122021008581B1 (pt) 2010-01-12 2022-08-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
ES2937066T3 (es) * 2010-07-20 2023-03-23 Fraunhofer Ges Forschung Decodificador de audio, procedimiento y programa informático para decodificación de audio
KR101676477B1 (ko) 2010-07-21 2016-11-15 삼성전자주식회사 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법
CN102074243B (zh) * 2010-12-28 2012-09-05 武汉大学 一种基于比特平面的感知音频分级编码系统及方法
GB2495918B (en) * 2011-10-24 2015-11-04 Malcolm Law Lossless buried data
CN103248367B (zh) * 2012-02-03 2016-03-16 展讯通信(上海)有限公司 码流数据的编码、解码方法和装置
EP2856776B1 (en) * 2012-05-29 2019-03-27 Nokia Technologies Oy Stereo audio signal encoder
CN111179946B (zh) 2013-09-13 2023-10-13 三星电子株式会社 无损编码方法和无损解码方法
KR102270106B1 (ko) 2013-09-13 2021-06-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
CN103595503B (zh) * 2013-10-25 2016-08-17 福建升腾资讯有限公司 一种基于串口装置的频率编解码通讯系统
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
CN105187071B (zh) * 2015-09-29 2018-04-06 东北大学 一种管道毫秒级在线数据的复合压缩/解压缩方法
US20230318622A1 (en) * 2017-06-22 2023-10-05 Nippon Telegraph And Telephone Corporation Encoder, decoder, encoding method, decoding method and program
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002100994A (ja) * 2000-07-14 2002-04-05 Nokia Mobile Phones Ltd 媒体ストリームのスケーラブル符号化方法、スケーラブルエンコーダおよびマルチメディア端末
WO2003077565A1 (en) * 2002-03-07 2003-09-18 Aware, Inc. Jpeg 2000 coder using selective group modeling according to coding passes
JP2004004578A (ja) * 2002-03-09 2004-01-08 Samsung Electronics Co Ltd スケーラブル無損失オーディオ符号化/復号化装置及びその方法
WO2005036528A1 (en) * 2003-10-10 2005-04-21 Agency For Science, Technology And Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream.
JP2005242363A (ja) * 2004-02-27 2005-09-08 Samsung Electronics Co Ltd 無損失オーディオ符号化/復号化方法および装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778965B1 (en) * 1996-10-10 2004-08-17 Koninklijke Philips Electronics N.V. Data compression and expansion of an audio signal
JP4049820B2 (ja) * 1996-11-07 2008-02-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビットストリーム信号のデータ処理
IL122714A (en) * 1997-04-02 2011-06-30 Samsung Electronics Co Ltd Digital data coding/decoding method and apparatus
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6314136B1 (en) * 1997-08-01 2001-11-06 Creative Technology Ltd. Method for performing wavelet-based image compaction losslessly and low bit precision requirements
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6121904A (en) 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6223162B1 (en) * 1998-12-14 2001-04-24 Microsoft Corporation Multi-level run length coding for frequency-domain audio coding
US6400289B1 (en) * 2000-03-01 2002-06-04 Hughes Electronics Corporation System and method for performing lossless data compression and decompression
CN1408146A (zh) * 2000-11-03 2003-04-02 皇家菲利浦电子有限公司 音频信号的参数编码
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
US6735254B2 (en) * 2001-06-29 2004-05-11 Qualcomm, Inc. DCT compression using Golomb-Rice coding
US6650784B2 (en) * 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice
US6856701B2 (en) * 2001-09-14 2005-02-15 Nokia Corporation Method and system for context-based adaptive binary arithmetic coding
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
KR101015497B1 (ko) * 2003-03-22 2011-02-16 삼성전자주식회사 디지털 데이터의 부호화/복호화 방법 및 장치
JP2005173201A (ja) * 2003-12-11 2005-06-30 Canon Inc オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、及びオーディオ復号プログラムを記録したコンピュータ可読記録媒体
KR100576548B1 (ko) * 2003-12-26 2006-05-03 한국전자통신연구원 문맥기반 적응 가변길이 복호화 장치 및 그 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002100994A (ja) * 2000-07-14 2002-04-05 Nokia Mobile Phones Ltd 媒体ストリームのスケーラブル符号化方法、スケーラブルエンコーダおよびマルチメディア端末
WO2003077565A1 (en) * 2002-03-07 2003-09-18 Aware, Inc. Jpeg 2000 coder using selective group modeling according to coding passes
JP2004004578A (ja) * 2002-03-09 2004-01-08 Samsung Electronics Co Ltd スケーラブル無損失オーディオ符号化/復号化装置及びその方法
WO2005036528A1 (en) * 2003-10-10 2005-04-21 Agency For Science, Technology And Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream.
JP2005242363A (ja) * 2004-02-27 2005-09-08 Samsung Electronics Co Ltd 無損失オーディオ符号化/復号化方法および装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009518934A (ja) * 2005-12-07 2009-05-07 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号の符号化及び復号化方法、オーディオ信号の符号化及び復号化装置
US8224658B2 (en) 2005-12-07 2012-07-17 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding an audio signal
JP2010506207A (ja) * 2006-10-06 2010-02-25 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ エンコード方法、デコード方法、エンコーダ、デコーダ、及びコンピュータプログラム製品
JP2012531086A (ja) * 2009-06-19 2012-12-06 サムスン エレクトロニクス カンパニー リミテッド コンテクスト基盤の算術符号化装置及びその方法並びに算術復号化装置及びその方法
US9171550B2 (en) 2009-06-19 2015-10-27 Samsung Electronics Co., Ltd. Context-based arithmetic encoding apparatus and method and context-based arithmetic decoding apparatus and method
US9959879B2 (en) 2009-06-19 2018-05-01 Samsung Electronics Co., Ltd. Context-based arithmetic encoding apparatus and method and context-based arithmetic decoding apparatus and method

Also Published As

Publication number Publication date
EP1575032A3 (en) 2006-09-27
JP5372886B2 (ja) 2013-12-18
JP4744899B2 (ja) 2011-08-10
DE602005019643D1 (de) 2010-04-15
CN1681213B (zh) 2010-05-26
KR100561869B1 (ko) 2006-03-17
CN1681213A (zh) 2005-10-12
EP1575032B1 (en) 2010-03-03
US20050203731A1 (en) 2005-09-15
JP2011048388A (ja) 2011-03-10
EP1575032A2 (en) 2005-09-14
KR20050090941A (ko) 2005-09-14
US7660720B2 (en) 2010-02-09
ES2339257T3 (es) 2010-05-18

Similar Documents

Publication Publication Date Title
JP4744899B2 (ja) 無損失オーディオ符号化/復号化方法および装置
JP5384780B2 (ja) 無損失オーディオ符号化方法、無損失オーディオ符号化装置、無損失オーディオ復号化方法、無損失オーディオ復号化装置及び記録媒体
JP5606433B2 (ja) オーディオエンコーダ及びオーディオデコーダ
JP2005260969A5 (ja)
JP2005242363A5 (ja)
JP4390208B2 (ja) 音声を可変レートで符号化および復号する方法
US20070078646A1 (en) Method and apparatus to encode/decode audio signal
JP2004272260A (ja) 帯域拡張技術を利用したデジタルデータの符号化方法、その装置、復号化方法およびその装置
JP2008107415A (ja) 符号化装置
JP2009509456A (ja) 逐次改善可能な格子ベクトル量子化
CA2775314A1 (en) Signal processing apparatus and method, and program
JP2009518934A (ja) オーディオ信号の符号化及び復号化方法、オーディオ信号の符号化及び復号化装置
JP3960932B2 (ja) ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
JP2004289837A (ja) デジタルデータの符号化/復号化方法および装置
JP2001044847A (ja) 可逆符号化方法、可逆復号化方法、これらの装置及びその各プログラム記録媒体
JP3811110B2 (ja) ディジタル信号符号化方法、復号化方法、これらの装置、プログラム及び記録媒体
KR101381602B1 (ko) 계층적 부호화 및 복호화 방법 및 장치
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
KR100947065B1 (ko) 무손실 오디오 부호화/복호화 방법 및 장치
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP3617804B2 (ja) Pcm信号符号化装置及び復号化装置
JP4195598B2 (ja) 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム
JP7318645B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP2005004119A (ja) 音響信号符号化装置及び音響信号復号化装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061101

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071101

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100915

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4744899

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees