JP2005260969A

JP2005260969A - 無損失オーディオ符号化／復号化方法および装置

Info

Publication number: JP2005260969A
Application number: JP2005067265A
Authority: JP
Inventors: 殷美 ▼呉▲; Oh Ennmi; Jung-Hoe Kim; 金　重　會; Miao Lei; 磊苗; Shi-Hwa Lee; 時和李; Sangwook Kim; ▼尚▲ ▼焔▲ 金
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2004-03-10
Filing date: 2005-03-10
Publication date: 2005-09-22
Anticipated expiration: 2025-03-10
Also published as: EP1575032A3; JP5372886B2; JP4744899B2; DE602005019643D1; CN1681213B; KR100561869B1; CN1681213A; EP1575032B1; US20050203731A1; JP2011048388A; EP1575032A2; KR20050090941A; US7660720B2; ES2339257T3

Abstract

【課題】ＢＰＧＣより優れた圧縮率を可能とする無損失オーディオ符号化／復号化方法および装置を提供する。
【解決手段】整数値を有する周波数領域のオーディオスプクトル信号を、周波数に応じてビットプレーン信号にマッピングする段階と、ビットプレーン別に、ＭＳＢおよびゴロムパラメータを獲得する段階と、ＭＳＢからＬＳＢの順番に、かつ低い周波数から高い周波数の順番に符号化するビットプレーン上の２進サンプルを選択する段階と、選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、選択された２進サンプルの文脈を計算する段階と、獲得されたゴロムパラメータと計算された文脈とを利用して、確率モデルを選択する段階と、選択された確率モデルを利用して、２進サンプルを無損失符号化する段階と、を含む符号化方法。
【選択図】図６

Description

本発明は、オーディオ信号の符号化／復号化に関し、より詳細には、文脈に基づいた符号化方式を用いて、ＢＰＧＣ（Bit−Plane Golomb Code）より優れた圧縮率を提供可能な無損失オーディオ符号化／復号化方法および装置に関する。

無損失オーディオ符号化方式には、ＭＬＰ（Meridian Lossless audio compression Packing）、Ｍｏｎｋｅｙ’ｓＡｕｄｉｏ、ＦＬＡＣ（Free Lossless Audio Coding）などが挙げられる。特に、ＭＬＰは、ＤＶＤ−Ａ（Digital Versatile Disk-Audio）に適用されている。インターネットのネットワーク帯域幅の拡大に伴い、大容量のマルチメディアコンテンツが提供されており、それに伴い無損失オーディオ方式が必要となっている。ＥＵ（European Union）では、すでにＤＡＢ（Digital Audio Broadcasting）を介してのデジタルオーディオ放送が開始しており、該当する放送局やコンテンツ提供者はオーディオ無損失符号化方式を利用している。一方、ＭＰＥＧ（Motion Picture Experts Group）やＩＳＯ／ＩＥＣ１４４９６−３：２００１／ＡＭＤ５、ＳＬＳ（Audio Scalable to Lossless Coding）の名称で、無損失オーディオ圧縮方式についての標準化が進んでいる。これは、ＦＧＳ（Fine Grain Scalablity）を提供することによって無損失オーディオ圧縮を可能とする技術である。無損失オーディオ圧縮技術で最も重要な要素である圧縮率は、データ間の重複情報を除去することによって改善することができる。前記重複情報は、隣接するデータ間から予測され、除去されるか、あるいは隣接するデータ間の文脈（context）を用いて除去される。整数ＭＤＣＴ（Modified Discrete Cosine Transform）係数は、ラプラス分布を示し、この分布ではゴロム（Golomb）コードという圧縮方式が最適の結果を示す。ＦＧＳを提供するためには、ビットプレーンコーディングが必要であり、前記ゴロムコードとビットプレーンコーディングとを組み合わせることにより（この組み合わせをＢＰＧＣ（Bit Plane Golomb Coding）と呼ぶ）、最適の圧縮率とＦＧＳを提供することができる。

しかしながら、前記整数ＭＤＣＴ係数がラプラス分布を有するという仮定は、実際のデータ分布では適切でないことがある。前記ＢＰＧＣは、整数ＭＤＣＴ係数がラプラス分布を示すと仮定して考案されたアルゴリズムなので、前記整数ＭＤＣＴ係数がラプラス分布を示さない場合には、最適の圧縮率を提供することができない。従って、前記整数ＭＤＣＴ係数がラプラス分布を示すという仮定に関係なく、最適の圧縮率を提供可能な無損失オーディオ符号化および復号化方式が必要である。

本発明が達成しようとする技術的課題は、前記整数ＭＤＣＴ係数がラプラス分布を示すという仮定に関係なく、更に最適の圧縮率を提供できる無損失オーディオ符号化方法および装置を提供することにある。
また、本発明が達成しようとする技術的課題は、整数ＭＤＣＴ係数がラプラス分布を示すという仮定に関係なく、更に最適の圧縮率を提供できる無損失オーディオ復号化方法および装置を提供することにある。

前記技術的課題を達成するための本発明による無損失オーディオ符号化方法は、整数値を有する前記周波数領域のオーディオスペクトル信号を周波数に応じてビットプレーン信号にマッピングする段階と、ビットプレーンの最上位ビットおよびゴロムパラメータを獲得する段階と、最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に符号化するビットプレーン上の２進サンプルを選択する段階と、前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれについて、既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する段階と、前記獲得されたゴロムパラメータと、前記計算された文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する段階と、前記選択された確率モデルを利用して、前記２進サンプルに対して無損失符号化を行う段階と、を含むことを特徴とする。

前記技術的課題を達成するための本発明による無損失オーディオ符号化方法は、（ａ）前記周波数領域のオーディオスペクトル信号を、スケーリングすることで損失符号化器の入力信号として整合させる段階と、（ｂ）前記スケーリングされた周波数信号に対して損失圧縮符号化を行う段階と、（ｃ）前記損失符号化されたデータと、前記整数値を有する周波数領域のオーディオスペクトル信号との差に相当するエラーマッピングされた信号を求める段階と、（ｄ）前記エラーマッピングされた信号が属する周波数ラインの周辺に存在する、複数の周波数ラインのそれぞれに対して既に符号化されたビットプレーンの重要度に基づき求めた文脈を利用し、前記エラーマッピングされた信号に対して無損失符号化を行う段階と、（ｅ）前記無損失符号化された信号と前記損失符号化された信号とを多重化して、ビットストリームを生成する段階と、を含むことを特徴とする。

前記技術的課題を達成するための本発明による無損失オーディオ符号化装置は、整数値を有する周波数領域のオーディオスプクトル信号を、周波数に応じてビットプレーンデータにマッピングするビットプレーンマッピング部と、前記ビットプレーンの最上位ビットおよびゴロムパラメータを獲得するパラメータ獲得部と、最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の２進サンプルを選択する２進サンプル選択部と、前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する文脈計算部と、前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、確率モデルを選択する確率モデル選択部と、前記選択された確率モデルを利用して、前記２進サンプルに対して無損失符号化を行う２進サンプル符号化部と、を備えることを特徴とする。

前記技術的課題を達成するための本発明による無損失オーディオ符号化装置は、整数値を有する周波数領域のオーディオスペクトル信号を、損失符号化部の入力信号として整合させるスケーリング部と、前記スケーリングされた周波数信号を損失符号化する損失符号化部と、前記損失符号化された信号と前記整数時間／周波数変換部の信号との差を求めるエラーマッピング部と、前記エラーマッピングされた信号を、前記エラーマッピングされた信号が属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度に基づいて求めた文脈を利用して無損失符号化を行う無損失符号化部と、前記無損失符号化された信号と、前記損失符号化された信号とを多重化して、ビットストリームを生成するマルチプレクサと、を備えることを特徴とする。

前記他の技術的課題を達成するための本発明による無損失オーディオ復号化方法は、オーディオデータのビットストリームからゴロムパラメータを獲得する段階と、最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化する２進サンプルを選択するサンプル選択段階と、前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する文脈計算段階と、前記ゴロムパラメータと文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する確率モデル選択段階と、前記選択された確率モデルを利用して、算術復号化を行う算術復号化段階と、すべてのサンプルが復号化されるまで、前記サンプル選択段階ないし算術復号化段階を繰り返して行う段階と、を含むことを特徴とする。

前記他の技術的課題を達成するための本発明による無損失オーディオ復号化方法は、符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータとする時、（ａａ）オーディオビットストリームを逆多重化して、損失符号化された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する段階と、（ｂｂ）前記抽出された損失ビットストリームを、損失復号化する段階と、（ｃｃ）前記抽出されたエラービットストリームを、復号化するサンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、それぞれの同一周波数ラインで既に復号化されたビットプレーンサンプルの重要度に基づいた文脈を利用して無損失復号化する段階と、（ｄｄ）前記復号化された損失ビットストリームとエラービットストリームとを利用して、周波数スペクトル信号に復元する段階と、を含むことを特徴とする。

前記他の技術的課題を達成するための本発明による無損失オーディオ復号化装置は、オーディオデータのビットストリームからゴロムパラメータを獲得するパラメータ獲得部と、最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に復号化する２進サンプルを選択するサンプル選択部と、前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する文脈計算部と、前記パラメータ獲得部のゴロムパラメータと前記文脈計算部の文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する確率モデル選択部と、前記選択された確率モデルを利用して算術復号化を行う算術復号化部と、を備えることを特徴とする。

前記他の技術的課題を達成するための本発明による無損失オーディオ復号化装置は、損失符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータとする時、オーディオビットストリームを逆多重化して、所定の損失符号化された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する逆多重化部と、前記抽出された損失ビットストリームを、所定の損失復号化する損失復号化部と、前記抽出されたエラービットストリームを復号化するサンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度に基づいた文脈を利用して、前記抽出された損失ビットストリームに対して無損失復号化を行う無損失復号化部と、前記復号化された損失ビットストリームとエラービットストリームとを合成して、周波数スペクトル信号に復元するオーディオ信号合成部と、を備えることを特徴とする。

更に、前記記載された発明を、コンピュータで実行させるためのプログラムを記録したコンピュータ可読記録媒体を提供する。

本発明による無損失オーディオ符号化／復号化方法および装置によれば、無損失オーディオ符号化／復号化において、入力の分布に無関係に、グローバル文脈およびローカル文脈を利用した統計的な分布に基づくモデルを通じて、最適の性能を提供することができる。更に、整数ＭＤＣＴ係数がラプラス分布を示すという仮定に無関係に最適で、かつ文脈に基づいた符号化方式を用いてＢＰＧＣより優れた圧縮率を提供することができる。

以下、添付図面を参照して、本発明の実施形態に係る無損失オーディオ符号化／復号化方法および装置を詳細に説明する。
オーディオ符号化において、前記ＦＧＳを提供して無損失オーディオ符号化を行うためには、前記整数化されたＭＤＣＴを利用する。特に、前記オーディオ信号の入力サンプル分布が、ラプラス分布に従えば、ＢＰＧＣ方式が最適の圧縮結果を示し、それは、ゴロムコードと等価的な結果を提供することが知られている。ゴロムパラメータは、下記のようなコードにより求められる。
Ｆｏｒ（Ｌ＝０；（Ｎ＜＜Ｌ＋１））＜＝Ａ；Ｌ＋＋）；
このコードによりゴロムパラメータＬを求められ、ゴロムコードの特性上、Ｌより小さいビットプレーンでは０または１が表示される確率を１／２と見ることができる。しかし、この結果は、ラプラス分布である場合には最適であるが、そうでない場合には、最適の圧縮率を提供することができない。したがって、本発明の基本概念としては、データ分布がラプラス分布であるかどうかに関らず、統計的分析を用いて文脈を利用して最適の圧縮率を提供することにある。

図１は、本発明の１実施形態に係る無損失オーディオ符号化装置についての構成を示すブロック図であり、整数時間／周波数変換部１００および無損失符号化部１２０から構成される。前記整数時間／周波数変換部１００は、時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する。尚、この変換は整数ＭＤＣＴを使用することが好ましい。前記無損失符号化部１２０は、前記周波数領域のオーディオ信号を周波数に応じてビットプレーンデータにマッピングし、前記ビットプレーンを構成する２進サンプルに対して、所定の文脈を利用して無損失符号化を行う。この無損失符号化部１２０は、図２に示すように、ビットプレーンマッピング部２００と、パラメータ獲得部２１０と、２進サンプル選択部２２０と、文脈計算部２３０と、確率モデル選択部２４０と、２進サンプル符号化部２５０とから構成される。

前記ビットプレーンマッピング部２００は、前記周波数領域のオーディオ信号を、周波数に応じてビットプレーンデータをマッピングする。図８および図１０は、周波数に応じてビットプレーンデータをマッピングした文脈の１例を示したものである。
前記パラメータ獲得部２１０は、前記ビットプレーンのＭＳＢとゴロムパラメータとを獲得する。前記２進サンプル選択部２２０は、ＭＳＢからＬＳＢの順番に、低い周波数から高い周波数の順番に、符号化するビットプレーン上の２進サンプルを選択する。
前記文脈計算部２３０は、前記選択した２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する。
前記確率モデル選択部２４０は、前記獲得したゴロムパラメータと、前記計算した文脈とを利用して、確率モデルを選択する。前記２進サンプル符号化部２５０は、前記選択した確率モデルを利用して、前記２進サンプルに対して無損失符号化を行う。

図２では、ビットプレーン上のあらゆる２進サンプルに対して、文脈に基づいた無損失符号化を利用して符号化する完全文脈モード（full context mode）で符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の２進サンプルのみに文脈に基づいた無損失符号化を利用し、残りの２進サンプルについては、単にビットパッキング（bit-packing）で符号化する部分文脈モード（partial context mode）で符号化を行うことができる。ここで、ビットパッキングで符号化を行うビットプレーン上の２進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の２進サンプルは、１が発生する確率が１／２だからである。

図３は、本発明の他の実施形態に係る無損失オーディオ符号化装置の構成をブロック図で示したものであり、整数時間／周波数変換部３００と、スケーリング部３１０と、損失符号化部３２０と、エラーマッピング部３３０と、無損失符号化部３４０と、マルチプレクサ３５０とから構成される。
前記整数時間／周波数変換部３００は、時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する。この変換は整数ＭＤＣＴを用いて行われることが好ましい。前記スケーリング部３１０は、前記整数時間／周波数変換部３００のオーディオ周波数信号を、損失符号化部３２０の入力信号と整合させる。前記整数時間／周波数変換部３００の出力信号は整数で示されるので、前記損失符号化部３２０の入力として直接使用することができない。したがって、前記スケーリング部３１０を介して、損失符号化部３２０の入力信号として使用できるように、前記整数時間／周波数変換部３００のオーディオ周波数信号を整合させる。
前記損失符号化部３２０は、前記スケーリングされた周波数信号に対して損失圧縮符号化を行う。この符号化はＡＡＣコア符号化器を使用して行われることが好ましい。前記エラーマッピング部３３０は、前記損失符号化された信号と、前記整数時間／周波数変換部３００の信号との差に相当するエラーマッピングされた信号を獲得する。前記無損失符号化部３４０は、前記エラーマッピングされた信号に対して、文脈を利用して無損失符号化を行う。前記マルチプレクサ３５０は、前記無損失符号化部３４０の無損失符号化された信号と、前記損失符号化部３２０の損失符号化された信号とを多重化して、ビットストリームに生成する。

図４は、前記無損失符号化部３４０の構成をブロック図で示したものあり、ビットプレーンマッピング部４００と、パラメータ獲得部４１０と、２進サンプル選択部４２０と、文脈計算部４３０と、確率モデル選択部４４０と、２進サンプル符号化部４５０とを備える。
前記ビットプレーンマッピング部４００は、前記エラーマッピング部のエラーマッピングされた信号を、周波数に応じてビットプレーンデータにマッピングする。前記パラメータ獲得部４１０は、前記ビットプレーンのＭＳＢおよびゴロムパラメータを獲得する。前記２進サンプル選択部４２０は、ＭＳＢからＬＳＢの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の２進サンプルを選択する。前記文脈計算部４３０は、前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する。前記確率モデル選択部４４０は、前記獲得されたゴロムパラメータと、前記計算された文脈とを利用して、確率モデルを選択する。前記２進サンプル符号化部４５０は、前記選択された確率モデルを利用して、前記２進サンプルに対して無損失符号化を行なる。

図４では、ビットプレーン上のあらゆる２進サンプルは、文脈に基づいた無損失符号化を利用して符号化するモードで符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の２進サンプルのみに文脈に基づいた無損失符号化を利用し、残りの２進サンプルについては、単にビットパッキングで符号化するモードで符号化を行っている。ここで、ビットパッキングで符号化するビットプレーン上の２進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の２進サンプルは、１が発生する確率が１／２だからである。

図２および図４にそれぞれ示された文脈計算部２３０、４３０で、前記２進サンプルの文脈値を計算する方法を説明する。本発明の１実施形態と関連して使用される重要度は、１つのスペクトルが、現行までの同一の周波数ライン上のビットプレーン上で符号化された前のサンプルのうち、１度でも１と符号化された場合には１であり、１度も１と符号化されたことのない場合には０と定義する。すなわち、重要度が１であれば、同一の周波数ライン上のビットプレーンのうち、現行まで符号化された前のサンプルが０となり、重要度が０であれば、同一の周波数ライン上のビットプレーンのうち、現行までに符号化された前のサンプルが０となることを意味する。

文脈計算部２３０、４３０が、前記２進サンプルの文脈を計算する方法の１つとして、グローバル文脈計算が挙げられる。このグローバル文脈計算は、全体のスペクトルの分布を考慮する方法であって、スペクトルの包絡線状が周波数軸上で急速に変わらず、前の包絡線状と類似した形状を示すことを利用した方法である。グローバル文脈計算において、前記文脈計算部２３０、４３０は、前記選択された２進サンプルの周波数ラインに基づいて、前記選択された２進サンプルの周波数ラインの前に位置するそれぞれの周波数ライン上のビットプレーンのうち、既に符号化された所定のサンプルを利用して、重要度が「１」となる確率値を求め、前記確率値に所定の整数値を掛けて整数で示した後、前記整数を利用して前記２進サンプルの文脈値を計算する。

文脈計算部２３０、４３０が、前記２進サンプルの文脈値を計算する方法の他の１つとして、ローカル文脈計算が挙げられる。ローカル文脈計算は、隣接する２進サンプルの相関関係を利用し、グローバル文脈を利用した文脈計算と同様に重要度を利用する方法であって、同一の周波数上のビットストリーム上で、現在符号化する２進サンプルの所定のＮ個の該当するサンプルの重要度を２進化し、それを再び十進数に変換して文脈を計算する。ローカル文脈計算において、前記文脈計算部２３０、４３０は、前記選択された２進サンプルの周波数ラインを基準として、前記選択された２進サンプルの周波数ラインを前後の所定範囲内に存在するそれぞれの周波数ライン上のビットプレーンのうち、既に符号化された所定のサンプルを利用して、重要度をそれぞれ求め、それをスカラー値に変換して、前記２進サンプルの文脈値を計算する。この計算で使用するＮは、グローバル文脈計算に使用するＭより小さい値を有する。

図５は、図１に示した本発明の１実施形態に係る無損失オーディオ符号化装置のについての動作を示すフローチャートであって、これを参照して前記無損失オーディオ符号化装置の構成を説明する。まず、時間領域におけるオーディオ信号に相当するＰＣＭ（Pulse Code Modulation）信号が、前記整数時間／周波数変換部１００に入力すると、この信号は、整数値を有する周波数領域のオーディオスペクトル信号に変換される（５００段階）。ここでは、ｉｎｔＭＤＣＴを使用することが好ましい。その後、図８および図１０のように、前記周波数領域のオーディオ信号を、周波数に応じてビットプレーン信号にマッピングする（５２０段階）。その後、前記ビットプレーンを構成する２進サンプルに対して、所定の文脈を利用して、決定された確率モデルを通じて損失符号化する（５４０段階）。

図６は、図１に示した前記無損失符号化部１２０の動作を示したフローチャートであって、これを参照してその動作を説明する。
まず、前記周波数領域のオーディオ信号が、ビットプレーンマッピング部２００に入力すると、前記信号は、周波数に応じてビットプレーンデータにマッピングされる（６００段階）。更に、ゴロムパラメータ獲得部２１０を通じて、ビットプレーン別に、ＭＳＢおよびゴロムパラメータを獲得する（６１０段階）。その後、前記２進サンプル選択部２２０を通じて、ＭＳＢからＬＳＢの順番に、かつ低い周波数から高い周波数の順番に符号化されたビットプレーン上の２進サンプルを選択する（６２０段階）。前記選択した２進サンプルに対して、これが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記２進サンプル選択部２２０で選択された２進サンプルの文脈を計算する（６３０段階）。前記ゴロムパラメータ獲得部２１０で求めたゴロムパラメータと、前記文脈計算部２３０で計算された文脈とを利用して、確率モデルを選択する（６４０段階）。前記確率モデル選択部２４０で選択した確率モデルを利用して、前記２進サンプルに対して無損失符号化を行う（６５０段階）。

図６では、ビットプレーン上のあらゆる２進サンプルに対して、文脈に基づいた無損失符号化方式を通じて符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の２進サンプルのみに文脈に基づいた無損失符号化を利用し、残りの２進サンプルについては、単にビットパッキングで符号化する方式を用いてよい。ここで、ビットパッキングで符号化するビットプレーン上の２進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の２進サンプルは、１が発生する確率が１／２であるからである。

図７は、図３に示した本発明の他の実施形態に係る無損失オーディオ符号化装置についての動作を示したフローチャートであって、これを参照して前記無損失オーディオ符号化装置の他の実施形態についての動作を説明する。まず、整数時間／周波数変換部３００により、時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する（７１０段階）。次いで、前記周波数領域のオーディオスペクトル信号は、前記スケーリング部３１０でスケーリングされて、損失符号化部３２０の入力信号として使用できるように整合される（７２０段階）。前記スケーリング部３１０でスケーリングされた周波数信号は、損失圧縮符号化部３２０で損失圧縮符号化する（７３０段階）。前記損失圧縮符号化は、ＡＡＣＣｏｒｅ符号化器によって行われることが好ましい。前記損失符号化部３２０で損失符号化されたデータと、前記整数値を有する周波数領域のオーディオスペクトル信号との差に相当するエラーマッピングされた信号を、エラーマッピング部３３０で求める（７４０段階）。前記エラーマッピングされた信号は、無損失符号化部３４０で文脈を利用して無損失符号化される（７５０段階）。

前記無損失符号化部３４０（図３参照）で無損失符号化された信号と、前記損失符号化部３２０で損失符号化された信号とがマルチプレクサ３５０で多重化され、ビットストリームが生成される（７６０段階）。前記無損失符号化（７５０段階）は、エラーマッピングされた信号を、周波数に応じでビットプレーンデータにマッピングする。その後、ＭＳＢとゴロムパラメータとを求める過程以後は、図６と同一であるため、その説明を省略する。
一般的に、ＭＤＣＴによるスペクトル漏れ（Spectral leakage）によって、周波数軸上の隣接するサンプルに相関関係が存在する。すなわち、隣接したサンプルの値がＸであれば、現行のサンプルの値がＸに近い値である確率が非常に高いということである。したがって、隣接するサンプルを文脈として選択すれば、前記相関関係を利用して圧縮率向上を図ることができる。更に、ビットプレーン値は、下位サンプルの確率分布との相関関係が高いということが統計分析から分かる。したがって、周辺隣接サンプルを文脈として選択すれば、相関関係を利用して圧縮率向上を図ることができる。
以下に、文脈を計算する方式について説明する。

図８は、文脈計算部で、グローバル文脈を利用して文脈を求めるための図である。点線で表示された部分を利用して、既に符号化されたサンプルから現行のサンプルの確率分布を計算する。図９は、文脈計算部で、グローバル文脈を利用して文脈を計算する時に「１」が表示される確率を表すグラフである。
図８において、斜線で格子状に表示されているボックスの中にあるシンボルを符号化すると仮定する。グローバル文脈は、図８で点線からなる楕円で表示される。図９において、他の２つの形態の文脈は、ゴロム文脈（Ｃｏｎｔｅｘｔ１）＝１、ローカル文脈（Ｃｏｎｔｅｘｔ２）＝０と固定されている。グラフで、ＢＰＧＣを利用した文脈計算においては、「１」が表示される確率が一定に維持されているのに対し、グローバル文脈を利用した文脈計算においては、文脈インデックスが大きくなるにつれて、１が表示される確率が次第に高まることが分かる。

図１０は、文脈計算部で、ローカル文脈を利用して文脈を求めるための図である。図１１は、文脈計算部で、ローカル文脈を利用して文脈を計算する時に「１」が表示される確率を表すグラフである。
図１０において、ローカル文脈は、３つの隣接する周波数ライン上で重要度を求める。ビットパターンは、０から７までの範囲（すなわち、２進数で０００、００１、０１０、０１１、１００、１０１、１１０、１１１）内で、シンボルの確率をマッピングさせる。ローカル文脈は、図１０に示したように、３つのそれぞれの点線で表示された部分を利用して、既に符号化されたサンプルから現行のサンプルの確率分布を計算する。ここで、現行の符号化で１が表示される確率は、前記したように、０から７までの範囲内で、ビットパターン「０，１，１」のように３つの値によって決定される。図１１において、他の２つの文脈が、ゴロム文脈（Ｃｏｎｔｅｘｔ１）＝１、グローバル文脈（Ｃｏｎｔｅｘｔ＝２）＝４と固定されている場合に、ローカル文脈を利用して文脈を計算する時に「１」が表示される確率を表す。ここで、ＢＰＧＣを利用する場合に、１が表示される確率は一定に固定されているのに対し、グローバル文脈を利用して文脈を計算する時は、前半では１が表示される確率がＢＰＧＣを利用する場合より高いのに対し、後半では逆に１が表示される確率がＢＰＧＣを利用する場合より低いことがわかる。

実際に符号化する例を挙げると、グローバル文脈を計算するために符号化する１０個の隣接するサンプルのうち５つが、重要度「１」を有していれば、確率は、０．５であり、それを８の値でスケーリングすれば４となる。それにより、グローバル文脈は４となる。そして、ローカル文脈を計算するために、前後の２つのサンプルの重要度をチェックする場合、ｉ−２番目のサンプルが１、ｉ−１番目のサンプルが０、ｉ＋１番目のサンプルが０、ｉ＋２番目のサンプルが１である場合、２進化すれば、１００１となり、十進数では９となる。現在符号化するデータのゴロムパラメータが４であれば、ゴロムパラメータ（Ｃｏｎｔｅｘｔ１）＝４、グローバル文脈（Ｃｏｎｔｅｘｔ２）＝４、ローカル文脈（Ｃｏｎｔｅｘｔ３）＝９となる。そのようなゴロムパラメータ、グローバル文脈、ローカル文脈を利用して、確率モデルを選択する。確率モデルは、実装形態によって異なるが、その１つの実装方法は、三次元配列で、Ｐｒｏｂ［Ｇｏｌｏｍｂ］［Ｃｏｎｔｅｘｔ１］［Ｃｏｎｔｅｘｔ２］として表せる。このようにして求めた確率モデルを用いて無損失符号化を行う。前記無損失符号化の代表的な方法として、算術符号化が使用することができる。本発明の方式により、従来の方式に比べて最大約０．８％の圧縮率の改善効果が見られる。

図１２は、本発明の１実施形態に係る、完全文脈モードの場合の図であり、図１３は、本発明の１実施形態による部分文脈モードの場合の図である。図１２を参照すると、すべての２進サンプルが文脈に基づいた無損失符号化を用いて符号化され、図１３を参照すると、２進サンプルの一部が文脈に基づいた無損失符号化を用いて符号化され、残りはビットパッキングを用いて符号化される。

図１４は、本発明の１実施形態における、文脈基盤コーディングのための疑似コード（pseudo code）を表す。

次に、本発明の１実施形態に係る無損失オーディオ復号化装置および方法を説明する。
図１５は、本発明の１実施形態に係る無損失オーディオ復号化装置の構成を示したブロック図であって、この装置はパラメータ獲得部１５００と、サンプル選択部１５１０と、文脈計算部１５２０と、確率モデル選択部１５３０と、算術復号化部１５４０とから構成される。
前記パラメータ獲得部１５００は、オーディオデータのビットストリームが入力されると、前記ビットストリームからＭＳＢおよびゴロムパラメータを求める。前記サンプル選択部１５１０は、ＭＳＢからＬＳＢの順番に、かつ低い周波数から高い周波数の順番に、復号化する２進サンプルを選択する。前記文脈計算部１５２０は、既に復号化されたサンプルを利用して、所定の文脈を計算し、図１０に示したように、第１文脈計算部１６００および第２文脈計算部１６２０から構成される。第１文脈計算部１６００は、前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、それぞれの同じ周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、それを２進化して第１文脈を計算する。第２文脈計算部１６２０は、前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、それぞれの同一周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて、整数で示した後、前記整数を利用して第２文脈を計算する。前記確率モデル選択部１５３０は、前記パラメータ獲得部１５００のゴロムパラメータと、前記文脈計算部１５２０で計算された文脈とを利用して、確率モデルを選択する。前記算術復号化部１５４０は、前記確率モデル選択部１５３０で選択された確率モデルを利用して算術復号化を行う。

図１５では、ビットプレーン上のすべての２進サンプルは、文脈に基づいた無損失符号化方式を用いて符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の２進サンプルのみに文脈に基づいた無損失符号化を利用し、残りの２進サンプルについては、単にビットパッキングで符号化する方式を用いて符号化を行ってよい。ここで、ビットパッキングで符号化するビットプレーン上の２進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の２進サンプルは、１が発生する確率が１／２だからである。

図１７は、本発明の他の実施形態に係る無損失オーディオ復号化装置の構成を示すブロック図であり、この装置は、逆多重化部１７００と、損失復号化部１７１０と、無損失復号化部１７２０と、オーディオ信号合成部１７３０と、逆整数時間／周波数変換部１７４０とから構成され、更に逆時間／周波数変換部１７５０を備えることが好ましい。
前記逆多重化部１７００は、オーディオビットストリームが入力されると、前記オーディオビットストリームを逆多重化し、前記ビットストリームが符号化される時に使用された所定の損失符号化方式により形成された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する。
前記損失復号化部１７１０は、前記逆多重化部１７００で抽出された損失ビットストリームに対して、前記ビットストリームが符号化される時に使用された所定の損失符号化方式に対応する所定の損失復号化方式を用いて損失復号化を行う。前記無損失復号化部１７２０は、前記逆多重化部１７００で抽出されたエラービットストリームに対しても、無損失符号化に対応する無損失復号化方式を用いて無損失復号化を行う。
前記オーディオ信号合成部１７３０は、前記復号化された損失ビットストリームとエラービットストリームとを合成して、周波数スペクトル信号に復元する。前記逆整数時間／周波数変換部１７４０は、前記オーディオ信号合成部１７３０で復元された周波数スペクトル信号を、逆整数時間／周波数変換して、時間領域のオーディオ信号に復元する。そして、前記逆時間／周波数変換部１７５０は、前記損失復号化部１７１０で復号化された周波数領域のオーディオ信号を、時間領域のオーディオ信号に復元する。それゆえ復元された信号は損失復号化された信号となる。

図１８は、前記無損失復号化部１７２０の構成を示したブロック図であり、この複合化部はパラメータ獲得部１８００と、サンプル選択部１８１０と、文脈計算部１８２０と、確率モデル選択部１８３０と、算術復号化部１８４０とから構成される。
前記パラメータ獲得部１８００は、オーディオデータのビットストリームからＭＳＢおよびゴロムパラメータを獲得する。前記サンプル選択部１８１０は、ＭＳＢからＬＳＢの順番に、かつ低い周波数から高い周波数の順番に、復号化する２進サンプルを選択する。
前記文脈計算部１８２０は、既に復号化されたサンプルを利用して所定の文脈を計算する。前記計算部は第１文脈計算部および第２文脈計算部から構成される。第１文脈計算部１６００は、前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、それぞれの同一の周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、それを２進化して第１文脈を計算する。第２文脈計算部１６２０は、前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、それぞれの同一の周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて、整数で示した後、その整数を利用して第２文脈を計算する。前記確率モデル選択部１８３０は、前記ゴロムパラメータと文脈を利用して、確率モデルを選択する。前記算術復号化部１８４０は、前記選択された確率モデルを利用して算術復号化する。

図１８では、ビットプレーン上のすべての２進サンプルに対して、文脈に基づいた無損失符号化方式を用いて符号化を行っている。しかし、本発明の他の実施形態では、簡略化のために、ビットプレーン上の一部の２進サンプルのみが文脈に基づいた無損失符号化を利用し、残りの２進サンプルに対しては、単にビットパッキングで符号化する方式を用いて符号化することができる。ここで、ビットパッキングで符号化するビットプレーン上の２進サンプルの決定においてはゴロムパラメータを利用するが、それはゴロムパラメータ以下の２進サンプルは、１が発生する確率が１／２であるからである。

図１９は、図１５に示した本発明の１実施形態に係る無損失オーディオ復号化装置の動作を示したフローチャートであって、これを参照して、前記無損失オーディオ復号化装置の動作を説明する。
まず、オーディオデータのビットストリームがパラメータ獲得部１５００に入力されると、前記オーディオデータのビットストリームからゴロムパラメータを獲得する（１９００段階）。その後、サンプル選択部１５１０を通じて、ＭＳＢからＬＳＢの順番に、かつ低い周波数から高い周波数の順番に、復号化する２進サンプルを選択する（１９１０段階）。前記サンプル選択部１５１０で復号化するサンプルが選択されれば、文脈計算部１５２０を通じて、既に復号化されたサンプルを利用して、所定の文脈を計算する（１９２０段階）。ここで、前記文脈は、第１文脈および第２文脈からなり、図１６に示したように、第１文脈計算部１６００は、前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、それぞれの同一周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、それを２進化して第１文脈を計算する。そして、第２文脈計算部１６２０は、前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、それぞれの同一周波数ライン上の既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて、整数で示した後、前記整数を利用して第２文脈を計算する。その後、前記確率モデル選択部１５３０を通じて、前記ゴロムパラメータと、前記第１文脈および第２文脈とを利用して、確率モデルを選択する（１９３０段階）。前記確率モデル選択部１５３０で確率モデルが選択されれば、前記選択された確率モデルを利用して、前記２進サンプルに対して算術復号化を行う（１９４０段階）。前記１９１０段階ないし１９４０段階を、すべてのサンプルが復号化されるまで繰り返して行う（１９５０段階）。

図１９では、ビットプレーン上のあらゆる２進サンプルは、文脈に基づいた無損失符号化を利用して符号化する方式を通じて符号化している。しかし、本発明の他の１実施形態では、複雑性の改善のために、ビットプレーン上の一部の２進サンプルのみが文脈に基づいた無損失符号化を利用し、残りの２進サンプルについては、単にビットパッキングで符号化する方式を通じて符号化できる。ここで、ビットパッキングで符号化するビットプレーン上の２進サンプルの決定においてはゴロムパラメータを利用するが、これは、ゴロムパラメータ以下の２進サンプルは、１が発生する確率が１／２であるからである。

図２０は、図１７に示した本発明の他の実施形態に係る無損失オーディオ復号化装置のついての動作を示したフローチャートであって、これを参照して前記無損失オーディオ復号化装置の動作を説明する。
損失符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータと定義する。まず、オーディオビットストリームが、逆多重化部１７００に入力されれば、前記ビットストリームを逆多重化して、所定の損失符号化を通じて生成された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する（２０００段階）。前記抽出された損失ビットストリームは、損失復号化部１７１０に入力されて、符号化時の損失符号化に対応する所定の損失復号化方式により損失復号化する（２０１０段階）。更に、前記抽出されたエラービットストリームは、無損失復号化部１７２０に入力されて無損失復号化が行われる（２０２０段階）。前記無損失復号化（２０２０段階）の更に詳細な過程は、図１９に示したものと同一である。前記損失復号化部１７１０で損失復号化された損失ビットストリームと、前記無損失復号化部１７２０で無損失復号化されたエラービットストリームとを、オーディオ信号合成部１７３０に入力させて、周波数スペクトル信号に復元する（２０３０段階）。前記周波数スペクトル信号は、前記逆整数時間／周波数変換部１７４０に入力されて、時間領域のオーディオ信号に復元される（２０４０段階）。

本発明は、コンピュータ可読記録媒体に、コンピュータ（情報処理機能を有する任意の装置を含む）可読コードとして実装することが可能である。コンピュータ可読記録媒体には、コンピュータシステムによって読み出されるデータが保存された、如何なる種類の記録装置が含まれる。コンピュータ可読記録装置の例としては、ＲＯＭ（read only memory）、ＲＡＭ（random access memory）、ＣＤ−ＲＯＭ、磁気テープ、フロッピーディスク、光学式データ保存装置などが挙げられる。

以上、本発明を図面に示した実施形態を用いて説明したが、これらは例示的なものに過ぎず、本技術分野の当業者ならば、本発明の範囲および趣旨から逸脱しない範囲で多様な変更および変形が可能なことは理解できるであろう。

本発明は、無損失オーディオ符号化および復号化に利用されるインターネット電話（voice over internet protocol ＶｏＩＰ）およびＭＤプレイヤーなどに利用される。

本発明の１実施形態に係る無損失オーディオ符号化装置の構成を示すブロック図である。図１の無損失符号化部の構成を示すブロック図である。本発明の他の実施形態に係る無損失オーディオ符号化装置の構成を示すブロック図である。図３の無損失符号化部の構成を示すブロック図である。図１の無損失オーディオ符号化装置の動作を示したフローチャートである。図１の無損失符号化部の動作を示すフローチャートである。図３の無損失オーディオ符号化装置の動作を示すフローチャートである。文脈計算部で、グローバル文脈を表す図である。文脈計算部で、グローバル文脈計算時に１を表す確率を示すグラフである。文脈計算部で、ローカル文脈を示す図である。文脈計算部で、ローカル文脈計算時に１を表す確率を示すグラフである。本発明の１実施形態に係る完全文脈モード（full context mode）についての図である。本発明の１実施形態に係る部分文脈モード（partial context mode）についての図である。本発明の１実施形態に係る文脈に基づいたコーディングのための疑似コードの１例である。本発明の１実施形態に係る無損失オーディオ復号化装置の構成を示すブロック図である。図１５に示した文脈計算部の構成を示すブロック図である。本発明の他の実施形態に係る無損失オーディオ復号化装置の構成を示すブロック図である。図１７の無損失復号化部の構成を示すブロック図である。図１５に示した無損失オーディオ復号化装置の動作を示すフローチャートである。図１５の無損失オーディオ復号化装置の動作を示すフローチャートである。

Claims

整数値を有する周波数領域のオーディオスペクトル信号を周波数に応じてビットプレーン信号にマッピングする段階と、
ビットプレーンの最上位ビットおよびゴロムパラメータを獲得する段階と、
最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の２進サンプルを選択する段階と、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する段階と、
前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する段階と、
前記選択された確率モデルを利用して、前記２進サンプルに対して無損失符号化を行う段階と、
を含むことを特徴とする無損失オーディオ符号化方法。
前記重要度は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「１」が１つでも存在すれば「１」となり、「１」が１つも存在しなければ「０」となることを特徴とする請求項１に記載の無損失オーディオ符号化方法。
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を２進化して、前記選択された２進サンプルの文脈を計算することを特徴とする請求項１に記載の無損失オーディオ符号化方法。
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの文脈値とすることを特徴とする請求項１に記載の無損失オーディオ符号化方法。
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を利用して第１文脈を計算する段階と、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を利用して第２文脈を計算する段階と、
を含むことを特徴とする請求項１に記載の無損失オーディオ符号化方法。
前記ビットプレーン上の２進サンプルの一部に対して、確率０．５を用いて符号化することを特徴とする請求項１に記載の無損失オーディオ符号化方法。
時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する段階を更に含むことを特徴とする請求項１に記載の無損失オーディオ符号化方法。
（ａ）整数値を有する周波数領域のオーディオスペクトル信号を、スケーリングすることにより損失符号化器の入力信号として整合させる段階と、
（ｂ）前記スケーリングされた周波数信号に対して損失符号化を行う段階と、
（ｃ）前記損失符号化された信号と、前記整数値を有する周波数領域のオーディオスペクトル信号との差に相当するエラーマッピングされた信号を求める段階と、
（ｄ）前記エラーマッピングされた信号が属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して既に符号化されたビットプレーンの重要度に基づいて求めた文脈を利用することにより、前記エラーマッピングされた信号に対して無損失符号化を行う段階と、
（ｅ）前記無損失符号化された信号と前記損失符号化された信号とを多重化して、ビットストリームを生成する段階と、
を含むことを特徴とする無損失オーディオ符号化方法。
前記重要度は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「１」が１つでも存在すれば「１」とし、「１」が１つも存在しなければ「０」とすることを特徴とする請求項８に記載の無損失オーディオ符号化方法。
前記（ｄ）段階は、
（ｄ１）前記（ｃ）段階でエラーマッピングされた信号を、周波数に応じてビットプレーンデータにマッピングする段階と、
（ｄ２）前記ビットプレーンの最上位ビットおよびゴロムパラメータを獲得する段階と、
（ｄ３）最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の２進サンプルを選択する段階と、
（ｄ４）前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する段階と、
（ｄ５）前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、確率モデルを選択する段階と、
（ｄ６）前記選択された確率モデルを利用して、前記２進サンプルに対して無損失符号化を行う段階と、
を含むことを特徴とする請求項８に記載の無損失オーディオ符号化方法。
前記（ｄ４）段階は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を２進化して、前記選択された２進サンプルの文脈を計算することを特徴とする請求項１０に記載の無損失オーディオ符号化方法。
前記（ｄ４）段階は、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの文脈とすることを特徴とする請求項１０に記載の無損失オーディオ符号化方法。
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を利用して第１文脈を計算する段階と、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を利用して第２文脈を計算する段階と、
を含むことを特徴とする請求項１０に記載の無損失オーディオ符号化方法。
前記ビットプレーン上の２進サンプルの一部に対して、確率０．５を用いて符号化を行うことを特徴とする請求項１０に記載の無損失オーディオ符号化方法。
前記（ａ）段階の前に、時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する段階を更に含むことを特徴とする請求項８に記載の無損失オーディオ符号化方法。
整数値を有する周波数領域のオーディオスプクトル信号を、周波数に応じてビットプレーンデータにマッピングするビットプレーンマッピング部と、
前記ビットプレーンの最上位ビットおよびゴロムパラメータを獲得するパラメータ獲得部と、
最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化するビットプレーン上の２進サンプルを選択する２進サンプル選択部と、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する文脈計算部と、
前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する確率モデル選択部と、
前記選択された確率モデルを利用して、前記２進サンプルに対して無損失符号化を行う２進サンプル符号化部と、
を備えることを特徴とする無損失オーディオ符号化装置。
前記重要度は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「１」が１つでも存在すれば「１」とし、「１」が１つも存在しなければ「０」とすることを特徴とする請求項１６に記載の無損失オーディオ符号化装置。
前記文脈計算部は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を２進化して前記選択された２進サンプルの文脈を計算する第１文脈計算部と、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの第２文脈で計算する第２文脈計算部と、
を備えることを特徴とする請求項１６に記載の無損失オーディオ符号化装置。
時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する整数時間／周波数変換部を更に備えることを特徴とする請求項１６に記載の無損失オーディオ復号化装置。
前記整数時間／周波数変換部は、整数ＭＤＣＴであることを特徴とする請求項１９に記載の無損失オーディオ符号化装置。
前記ビットプレーン上の２進サンプルの一部に対して、確率０．５を用いて符号化を行うことを特徴とする請求項１６に記載の無損失オーディオ符号化装置。
整数値を有する周波数領域のオーディオスペクトル信号を、出力先の入力信号として整合させるスケーリング部と、
前記整合された周波数信号に対して損失符号化を行う損失符号化部と、
前記損失符号化された信号と前記整数時間／周波数変換部の信号との差を求めるエラーマッピング部と、
前記エラーマッピングされた信号を、前記エラーマッピングされた信号が属する周波数ラインの周りに存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度に基づいて求めた文脈を利用して無損失符号化する無損失符号化部と、
前記無損失符号化された信号と、前記損失符号化された信号とを多重化して、ビットストリームを生成するマルチプレクサと、
を備えることを特徴とする無損失オーディオ符号化装置。
前記重要度は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに、「１」が１つでも存在すれば「１」とし、「１」が１つも存在しなければ「０」とすることを特徴とする請求項２２に記載の無損失オーディオ符号化装置。
前記無損失符号化部は、
前記エラーマッピング部のエラーマッピングされた信号を、周波数に応じてビットプレーンデータにマッピングするビットプレーンマッピング部と、
前記ビットプレーンの最上位ビットと、ゴロムパラメータとを獲得するパラメータ獲得部と、
最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、符号化を行うビットプレーン上の２進サンプルを選択する２進サンプル選択部と、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する文脈計算部と、
前記獲得されたゴロムパラメータと前記計算された文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する確率モデル選択部と、
前記選択された確率モデルを利用して、前記２進サンプルに対して無損失符号化を行う２進サンプル符号化部と、
を備えることを特徴とする請求項２２に記載の無損失オーディオ符号化装置。
前記文脈計算部は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を２進化して前記選択された２進サンプルの第１文脈にする第１文脈計算部と、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの第２文脈にする第２文脈計算部と、
を備えることを特徴とする請求項２４に記載の無損失オーディオ符号化装置。
前記２進サンプル符号化部は、前記ビットプレーン上の２進サンプルの一部に対して、確率０．５を用いて符号化を行うことを特徴とする請求項２４に記載の無損失オーディオ符号化装置。
時間領域のオーディオ信号を、整数値を有する周波数領域のオーディオスペクトル信号に変換する整数時間／周波数変換部を更に備えることを特徴とする請求項２２に記載の無損失オーディオ符号化装置。
オーディオデータのビットストリームからゴロムパラメータを獲得する段階と、
最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化する２進サンプルを選択するサンプル選択段階と、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する文脈計算段階と、
前記ゴロムパラメータと文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する確率モデル選択段階と、
前記選択された確率モデルを利用して、前記２進サンプルに対して算術復号化を行う算術復号化段階と、
すべてのサンプルが復号化されるまで、前記サンプル選択段階ないし算術復号化段階を繰り返して行う段階と、
を含むことを特徴とする無損失オーディオ復号化方法。
前記重要度は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに、「１」が１つでも存在すれば「１」とし、「１」が１つも存在しなければ「０」とすることを特徴とする請求項２８に記載の無損失オーディオ復号化方法。
前記文脈計算段階は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンのサンプルの重要度を求め、前記重要度を２進化して前記選択された２進サンプルの文脈を計算することを特徴とする請求項２８に記載の無損失オーディオ復号化方法。
前記文脈計算段階は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一の周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの文脈にする特徴とすることを請求項２８に記載の無損失オーディオ復号化方法。
前記文脈計算段階は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンのサンプルの重要度を利用して第１文脈を計算する段階と、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンのサンプルの重要度を利用して第２文脈を計算する段階と、
を含むことを特徴とする請求項２８に記載の無損失オーディオ復号化方法。
前記選択された２進サンプルの一部に対して、確率０．５を用いて復号化することを特徴とする請求項２８に記載の無損失オーディオ復号化方法。
符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータとする、無損失オーディオ復号化方法であって、
（ａａ）オーディオビットストリームを逆多重化して、所定の方法で損失符号化された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する段階と、
（ｂｂ）前記抽出した損失ビットストリームに対して、所定の損失復号化を行う段階と、
（ｃｃ）復号化するサンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインで既に復号化されたビットプレーンサンプルの重要度に基づいた文脈を利用して、前記抽出されたエラービットストリームに対して無損失復号化を行う段階と、
（ｄｄ）前記復号化された損失ビットストリームとエラービットストリームとを利用して、周波数スペクトル信号に復元する段階と、
を含むことを特徴とする無損失オーディオ復号化方法。
前記重要度は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「１」が１つでも存在すれば「１」とし、「１」が１つも存在しなければ「０」とすることを特徴とする請求項３４に記載の無損失オーディオ復号化方法。
前記（ｃｃ）段階は、
（ｃｃ１）オーディオデータのビットストリームからゴロムパラメータを獲得する段階と、
（ｃｃ２）最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化する２進サンプルを選択する段階と、
（ｃｃ３）前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に符号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する段階と、
（ｃｃ４）前記ゴロムパラメータと文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する段階と、
（ｃｃ５）前記選択された確率モデルを利用して算術復号化する段階と、
（ｃｃ６）すべてのサンプルが復号化されるまで、前記（ｃｃ２）段階ないし（ｃｃ５）段階を繰り返して行う段階と、
を含むことを特徴とする請求項３４に記載の無損失オーディオ復号化方法。
前記（ｃｃ３）段階は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記重要度を２進化して、前記選択された２進サンプルの第１文脈を計算することを特徴とする請求項３６に記載の無損失オーディオ復号化方法。
前記（ｃｃ３）段階は、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの第２文脈にすることを特徴とする請求項３６に記載の無損失オーディオ復号化方法。
前記（ｃｃ３）段階は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記重要度を２進化して、前記選択された２進サンプルの第１文脈にする段階と、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの第２文脈にする段階と、
を含むことを特徴とする請求項３６に記載の無損失オーディオ復号化方法。
前記ビットプレーン上の２進サンプルの一部に対して、確率０．５を用いて復号化することを特徴とする請求項３６に記載の無損失オーディオ復号化方法。
（ｅｅ）前記周波数スペクトル信号を、逆整数時間／周波数変換して、時間領域のオーディオ信号を復元する段階を更に含むことを特徴とする請求項３４に記載の無損失オーディオ復号化方法。
オーディオデータのビットストリームからゴロムパラメータを獲得するパラメータ獲得部と、
最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化する２進サンプルを選択するサンプル選択部と、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する文脈計算部と、
前記パラメータ獲得部のゴロムパラメータと前記文脈計算部の文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する確率モデル選択部と、
前記選択された確率モデルを利用して、前記２進サンプルに対して算術復号化を行う算術復号化部と、
を備えることを特徴とする無損失オーディオ復号化装置。
前記重要度は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「１」が１つでも存在すれば「１」とし、「１」が１つも存在しなければ「０」とすることを特徴とする請求項４２に記載の無損失オーディオ復号化方法。
前記文脈計算部は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記重要度を２進化して、選択された２進サンプルの第１文脈にする第１文脈計算部と、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの第２文脈にする第２文脈計算部と、
を備えることを特徴とする請求項４２に記載の無損失オーディオ復号化装置。
前記ビットプレーン上の２進サンプルの一部に対して、確率０．５を用いて復号化を行うことを特徴とする請求項４２に記載の無損失オーディオ復号化方法。
損失符号化されたオーディオデータと、整数値を有する周波数領域のオーディオスペクトル信号との差をエラーデータとする、無損失オーディオ復号化装置であって、
オーディオビットストリームを逆多重化して、損失符号化された損失ビットストリームと、前記エラーデータのエラービットストリームとを抽出する逆多重化部と、
前記抽出された損失ビットストリームを損失復号化する損失復号化部と、
前記抽出されたエラービットストリームを復号化するサンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度に基づいた文脈を利用して、前記抽出された損失ビットストリームに対して無損失復号化を行う無損失復号化部と、
前記復号化された損失ビットストリームとエラービットストリームとを合成して、周波数スペクトル信号に復元するオーディオ信号合成部と、
を備えることを特徴とする無損失オーディオ復号化装置。
前記損失復号化部は、ＡＡＣ復号化部であることを特徴とする請求項４６に記載の無損失オーディオ復号化装置。
前記オーディオ信号合成部で復元された周波数スペクトル信号を、逆整数時間／周波数変換して、時間領域のオーディオ信号を復元する逆整数時間／周波数変換部を更に備えることを特徴とする請求項４６に記載の無損失オーディオ復号化装置。
前記損失復号化部で復号化された周波数領域のオーディオ信号を、時間領域のオーディオ信号に復元する逆時間／周波数変換部を更に備えることを特徴とする請求項４６に記載の無損失オーディオ復号化装置。
前記重要度は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に符号化されたビットプレーンに「１」が１つでも存在すれば「１」とし、「１」が１つも存在しなければ「０」とすることを特徴とする請求項４６に記載の無損失オーディオ復号化方法。
前記無損失復号化部は、
オーディオデータのビットストリームからゴロムパラメータを獲得するパラメータ獲得部と、
最上位ビットから最下位ビットの順番に、かつ低い周波数から高い周波数の順番に、復号化を行う２進サンプルを選択するサンプル選択部と、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインのそれぞれに対して、既に復号化されたビットプレーンの重要度を利用して、前記選択された２進サンプルの文脈を計算する文脈計算部と、
前記ゴロムパラメータと文脈とを利用して、前記選択された２進サンプルの確率モデルを選択する確率モデル選択部と、
前記選択された確率モデルを利用して算術復号化する算術復号化部と、
を備えることを特徴とする請求項４６に記載の無損失オーディオ復号化装置。
前記文脈計算部は、
前記選択された２進サンプルが属する周波数ラインの周辺に存在する複数の周波数ラインにおいて、同一周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記重要度を２進化して、前記選択された２進サンプルの第１文脈にする第１文脈計算部と、
前記選択された２進サンプルが属する周波数ラインの前に存在する複数の周波数ラインにおいて、同じ周波数ラインごとに既に復号化されたビットプレーンサンプルの重要度を求め、前記複数の周波数ラインのうち、いくつの周波数ラインが重要度を有するかの割合に所定の整数値を掛けて計算される整数を、前記選択された２進サンプルの第２文脈にする第２文脈計算部と、
を備えることを特徴とする請求項５１に記載の無損失オーディオ復号化装置。
前記ビットプレーン上の２進サンプルの一部に対して、確率０．５を用いて復号化を行うことを特徴とする請求項５１に記載の無損失オーディオ復号化装置。
請求項１に記載の方法をコンピュータで実行させるためのプログラムが記録されたコンピュータ可読記録媒体。
請求項９に記載の方法をコンピュータで実行させるためのプログラムが記録されたコンピュータ可読記録媒体。
請求項２８に記載の方法をコンピュータで実行させるためのプログラムが記録されたコンピュータ可読記録媒体。
請求項３４に記載の方法をコンピュータで実行させるためのプログラムが記録されたコンピュータ可読記録媒体。