JP6088532B2 - 無損失符号化方法 - Google Patents

無損失符号化方法 Download PDF

Info

Publication number
JP6088532B2
JP6088532B2 JP2014537001A JP2014537001A JP6088532B2 JP 6088532 B2 JP6088532 B2 JP 6088532B2 JP 2014537001 A JP2014537001 A JP 2014537001A JP 2014537001 A JP2014537001 A JP 2014537001A JP 6088532 B2 JP6088532 B2 JP 6088532B2
Authority
JP
Japan
Prior art keywords
lossless
unit
encoding
energy
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014537001A
Other languages
English (en)
Other versions
JP2015502561A (ja
Inventor
チュ,キ−ヒョン
オ,ウン−ミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2015502561A publication Critical patent/JP2015502561A/ja
Application granted granted Critical
Publication of JP6088532B2 publication Critical patent/JP6088532B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Description

本発明は、オーディオ符号化及び復号化に係り、さらに具体的には、複雑度の上昇、及び復元された音質の劣化なしに、限定されたビット範囲において、オーディオスペクトルのエネルギー情報を符号化するのに必要となるビット数を低減させることにより、実際のスペクトル成分を符号化するのに必要となるビット数を増加させることができるエネルギー無損失符号化方法及びその装置、オーディオ符号化方法及びその装置、エネルギー無損失復号化方法及びその装置、オーディオ復号化方法及びその装置、ならびにそれらを採用したマルチメディア機器に関する。
オーディオ信号の符号化時、実際のスペクトル成分以外に、エネルギーのような付加情報がビットストリームに含まれもする。そのとき、損失を最小化しながら、付加情報の符号化に割り当てられるビット数を低減させることにより、実際のスペクトル成分符号化に割り当てられるビット数を増加させることができる。
すなわち、オーディオ信号を符号化したり復号化したりする場合、特に、低いビット率に限定されたビットを効率的に利用することにより、当該ビット範囲で、最上の音質を有するオーディオ信号を復元するのが要求される。
本発明が解決しようとする課題は、複雑度の上昇、及び復元された音質の劣化なしに、限定されたビット範囲において、オーディオスペクトルのエネルギー情報を符号化するのに必要となるビット数を低減させる一方、実際のスペクトル成分を符号化するのに必要となるビット数を増加させることができるエネルギー無損失符号化方法、オーディオ符号化方法、エネルギー無損失復号化方法及びオーディオ復号化方法を提供するところにある。
本発明が解決しようとする他の課題は、複雑度の上昇、及び復元された音質の劣化なしに、限定されたビット範囲において、オーディオスペクトルのエネルギー情報を符号化するのに必要となるビット数を低減させる一方、実際のスペクトル成分を符号化するのに必要となるビット数を増加させることができるエネルギー無損失符号化装置、オーディオ符号化装置、エネルギー無損失復号化装置及びオーディオ復号化装置を提供するところにある。
本発明が解決しようとする他の課題は、エネルギー無損失符号化方法、オーディオ符号化方法、エネルギー無損失復号化方法あるいはオーディオ復号化方法を、コンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供するところにある。
本発明が解決しようとする他の課題は、エネルギー無損失符号化装置、オーディオ符号化装置、エネルギー無損失復号化装置あるいはオーディオ復号化装置を採用するマルチメディア機器を提供するところにある。
前記課題を達成するための本発明の一実施形態による無損失符号化方法は、量子化係数の無損失符号化モードを、無限範囲無損失符号化モード及び有限範囲無損失符号化モードのうち一つに決定する段階と、前記無損失符号化モード決定結果に対応し、前記量子化係数を無限範囲無損失符号化モードで符号化する段階と、前記無損失符号化モード決定結果に対応し、前記量子化係数を有限範囲無損失符号化モードで符号化する段階と、を含んでもよい。
前記課題を達成するための本発明の一実施形態によるオーディオ符号化方法は、時間領域のオーディオ信号から生成されるスペクトル係数から、周波数バンド単位で得られるエネルギーを量子化する段階と、エネルギー量子化係数を表現するビット数と、前記エネルギー量子化係数を、無限範囲無損失符号化モード及び有限範囲無損失符号化モードで符号化した結果として発生するビット数と、を考慮し、前記エネルギー量子化係数を、前記無限範囲無損失符号化モード及び有限範囲無損失符号化モードのうち一つを利用して、無損失符号化する段階と、前記エネルギー量子化係数を利用して、前記周波数バンド単位で、符号化のためのビットを割り当てる段階と、前記割り当てられたビットに基づいて、前記スペクトル係数を量子化して無損失符号化する段階と、を含んでもよい。
前記課題を達成するための本発明の一実施形態による無損失復号化方法は、ビットストリームに含まれた量子化係数の無損失符号化モードを判断する段階と、前記無損失符号化モード判断結果に対応し、前記量子化係数を無限範囲無損失復号化モードで復号化する段階と、前記無損失符号化モード判断結果に対応し、前記量子化係数を有限範囲無損失復号化モードで復号化する段階と、を含んでもよい。
前記課題を達成するための本発明の一実施形態による無損失復号化方法は、ビットストリームから得られるエネルギー量子化係数の無損失符号化モードを判断し、前記無損失符号化モード判断結果に対応し、前記エネルギー量子化係数を無限範囲無損失復号化モードで復号化したり、有限範囲無損失復号化モードで復号化したりする段階と、前記無損失復号化されたエネルギー量子化係数を逆量子化し、エネルギー逆量子化係数を利用して、前記周波数バンド単位で、復号化のためのビットを割り当てる段階と、前記ビットストリームから得られるスペクトル係数を無損失復号化する段階と、前記無損失復号化されたスペクトル係数を、前記割り当てられたビットに基づいて、逆量子化する段階と、を含んでもよい。
無限範囲量子化係数を階乗パルスコーディング方式以外に、ハフマン符号化方式でも符号化を可能とすることにより、無限範囲量子化係数の符号化に使用されるビット数を節減し、スペクトル符号化にさらに多くのビット数を割り当てることができる。
本発明の一実施形態によるオーディオ符号化装置の構成を示したブロック図である。 本発明の一実施形態によるオーディオ復号化装置の構成を示したブロック図である。 本発明の一実施形態によるエネルギー無損失符号化装置の構成を示したブロック図である。 図3に図示された第2無損失符号化部の細部的な構成を示したブロック図である。 本発明の一実施形態によるエネルギー無損失符号化方法について説明するフローチャートである。 本発明の一実施形態によるエネルギー無損失復号化装置の構成を示したブロック図である。 図6に図示された第2無損失復号化部の細部的な構成を示したブロック図である。 有限範囲のエネルギー量子化係数について説明する図面である。 本発明の一実施形態によるマルチメディア機器の構成を示したブロック図である。 本発明の他の実施形態によるマルチメディア機器の構成を示したブロック図である。 本発明の他の実施形態によるマルチメディア機器の構成を示したブロック図である。
本発明は、多様な変換を加えることができ、さまざまな実施形態を有することができるが、特定実施形態を図面に例示し、詳細な説明で具体的に説明する。しかし、それらは、本発明を特定の実施形態について限定するものではなく、本発明の技術的思想及び技術範囲に含まれる全ての変換、均等物ないし代替物を含むものであると理解すべきものである。本発明の説明において、関連公知技術に係わる具体的な説明が、本発明の要旨を不明瞭にすると判断される場合、その詳細な説明を省略する。
第1、第2のような用語は、多様な構成要素について説明するところに使用されるが、構成要素が用語によって限定されるものではない。用語は、1つの構成要素を、他の構成要素から区別する目的でのみ使用される。
本発明で使用した用語は、ただ特定の実施形態について説明するために使用されたものであり、本発明を限定する意図ではない。本発明で使用した用語は、本発明での機能を考慮しながら、可能な限り、現在広く使用される一般的な用語を選択したが、それは、当分野の当業者の意図、判例、または新たな技術の出現などによって異なることもある。また、特定の場合には、出願人が任意に選定した用語もあり、その場合、該当発明の説明部分で、詳細にその意味を記載する。従って、本発明で使用される用語は、単純な用語の名称ではない、その用語が有する意味、及び本発明の全般にわたる内容を基に定義されなければならない。
単数の表現は、文脈上明白に取り立てて意味しない限り、複数の表現を含む。本発明で、「含む」または「有する」のような用語は、明細書上に記載された特徴、数字、段階、動作、構成要素、部品、またはそれらの組み合わせが存在するということを指定しするものであり、一つまたはそれ以上の他の特徴、数字、段階、動作、構成要素、部品、またはそれらの組み合わせなどの存在または付加の可能性をあらかじめ排除するものではないということを理解しなければならない。
以下、本発明の実施形態について、添付図面を参照しつつ詳細に説明するが、添付図面を参照して説明するにあたり、同一であったり、あるいは対応する構成要素は、同一の図面番号を付し、それについての重複説明は省略する。
図1は、本発明の一実施形態によるオーディオ符号化装置の構成を示したブロック図である。図1に図示されたオーディオ符号化装置100は、変換部110、エネルギー量子化部120、エネルギー無損失符号化部130、ビット割当て部140、スペクトル量子化部150、スペクトル無損失符号化部160及び多重化部170を含んでもよい。多重化部170は、オプションとして含まれ、ビットパッキング機能を遂行する他の構成要素にも代替される。または、無損失符号化されたエネルギーデータと、無損失符号化されたスペクトルデータとが別途のビットストリームを形成し、保存あるいは伝送されもする。一方、スペクトル量子化過程の前後、エネルギー値を利用して、正規化(normalization)を行う正規化部(図示せず)をさらに具備することができる。各構成要素、は少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)によって具現されもする。ここで、オーディオ信号は、音楽あるいは音声、あるいは音楽と音声との混合信号を示すサウンドなどのメディア信号を意味するが、以下では、説明の便宜のために、オーディオ信号とする。オーディオ符号化装置100に入力される時間ドメインのオーディオ信号は、多様なサンプリングレートを有することができ、サンプリングレート別に、スペクトルを量子化するのに使用されるエネルギーのバンド構成が異なりもする。それにより、無損失符号化が行われる量子化されたエネルギーの個数が変動されもする。サンプリングレートの例としては、8kHz、16kHz、32kHZ、48kHzなどがあるが、それらに限定されるものではない。サンプリングレート及びターゲットビット率が決定された時間ドメインのオーディオ信号は、変換部110に提供されもする。
図1において、変換部110は、時間ドメインのオーディオ信号、例えばPCM(pulse code modulation)信号を周波数ドメインに変換し、オーディオスペクトルを生成することができる。そのとき、時間/周波数ドメイン変換は、MDCT(modified discrete cosine transform)のような公知された多様な方法を使用して行うことができる。変換部110から得られるオーディオスペクトルの変換係数、例えば、MDCT係数は、エネルギー量子化部120及びスペクトル量子化部150に提供される。
エネルギー量子化部120は、変換部110から提供される変換係数から、周波数バンド単位で、エネルギー値を獲得することができる。周波数バンドは、オーディオスペクトルのサンプルをグルーピングした単位であり、臨界帯域を反映させ、均一長あるいは非均一長を有することができる。非均一である場合、1フレームについて、開始サンプルから最後のサンプルに至るまで、周波数バンドに含まれるサンプルの個数がだんだんと増加するように、周波数バンドを設定することができる。また、多重ビット率を支援する場合、互いに異なるビット率で対応する各周波数バンドに含まれるサンプルの数が同一になるように設定することができる。1フレームに含まれる周波数バンドの個数、あるいは周波数バンドに含まれるサンプルの個数は、あらかじめ決定されていてもよい。エネルギー値は、周波数バンドに含まれる変換係数のエンベロープを示すことができ、平均振幅、平均エネルギー、パワーあるいはnorm値などを意味する。ここで、周波数バンドは、パラメータバンドあるいはスケールファクタバンドを意味する。
k番目の周波数バンドのエネルギーE(k)は、例えば、下記数式(1)によって獲得される。
Figure 0006088532
ここで、S(l)は、周波数スペクトルを意味し、start及びendは、それぞれ現在周波数バンドの開始サンプル及び最後のサンプルを意味する。
エネルギー量子化部120は、獲得されたエネルギーに対して、量子化ステップサイズでもって量子化を行い、エネルギー量子化係数を生成することができる。具体的には、k番目の周波数バンドのエネルギーE(k)を、量子化ステップサイズに分け、四捨五入を行い、整数に変換することにより、エネルギー量子化係数を得ることができる。そのとき、エネルギー量子化部120は、エネルギーに対して、量子化境界(boundary)を置かずに、無限範囲のエネルギー量子化係数を有するように量子化を行うことができる。一方、エネルギー量子化係数は、エネルギー量子化インデックスで表現されもし、例えば、本来のエネルギー値が20.2であり、量子化ステップサイズが2であると仮定した場合、量子化された値は、20であり、量子化インデックス及び量子化係数は、10と表現することができる。一実施形態によれば、現在バンドに対して、現在バンドの量子化係数と、以前バンドの量子化係数との差、すなわち、デルタ値に対して無損失符号化を行うことができる。そのとき、無限範囲の無損失符号化を適用する場合、エネルギー量子化係数、またはエネルギー量子化係数の以前バンドとの差値、すなわち、デルタ値を入力として活用して遂行される。そして、有限範囲の無損失符号化を使用する場合、エネルギー量子化係数のデルタ値を入力として活用することになるが、入力値に特定値を加えた値を活用し、エネルギー量子化係数に対して無損失符号化を行う。そのとき、最初のバンドの値は、以前バンドが存在しないので、デルタ値を適用せず、前記加えられる特定値の代わりに、他の値を差し引き、無損失符号化の入力信号として生成することができる。
エネルギー無損失符号化部130は、エネルギー量子化部120から提供されるエネルギー量子化係数に対して、無損失符号化を行う。一実施形態によれば、無限範囲のエネルギー量子化係数に対して、フレーム単位で、第1無損失符号化モード及び第2無損失符号化モードのうち一つを選択的に行う。ここで、第1無損失符号化モードは、無限範囲の量子化係数に対して無損失符号化を行うアルゴリズムを使用し、第2無損失符号化モードは、有限範囲の量子化係数に対して無損失符号化を行うアルゴリズムを使用する。他の実施形態によれば、エネルギー量子化部120から提供される各周波数バンドに対するエネルギー量子化係数に対して、周波数バンド間量子化デルタ値を求め、量子化デルタ値に対して、無損失符号化を行う。無損失符号化の結果として得られるエネルギーデータは、第1無損失符号化モードあるいは第2無損失符号化モードを示す情報と共に、ビットストリームに含まれて保存あるいは伝送される。
ビット割当て部140は、エネルギー量子化部120から提供されるエネルギー量子化係数に対して逆量子化を行い、エネルギー逆量子化係数を獲得することができる。ビット割当て部140は、ターゲットビット率による全体ビット数に対して、各周波数バンド単位で、エネルギー逆量子化係数を利用して、マスキング臨界値を計算し、マスキング臨界値を利用して、各周波数バンドの知覚的符号化に必要な割当てビット数を、整数単位あるいは小数点単位で決定することができる。具体的には、ビット割当て部140は、各周波数バンド単位で求められたエネルギー逆量子化係数を利用して、許容ビット数を推定してビットを割り当て、割当てビット数が許容ビット数を超えないように制限することができる。そのとき、エネルギー値が大きい周波数バンドから、順次にビットを割り当てることができる。また、各周波数バンドのエネルギー値に対して、各周波数バンドの知覚的重要度によって、加重値を付与することにより、知覚的に重要な周波数バンドにさらに多くのビットが割り当てられるように調整することができる。知覚的重要度は、一例に過ぎず、ITU−T G.719のような心理音響加重を介しても決定することができる。
スペクトル量子化部150は、変換部110から提供される変換係数に対して、各周波数バンド単位で決定された割当てビット数を利用して、量子化を行い、スペクトル量子化係数を生成することができる。
スペクトル無損失符号化部160は、スペクトル量子化部150から提供されるスペクトル量子化係数に対して、無損失符号化を行うことができる。無損失符号化アルゴリズムの一例として、階乗パルスコーディング(FPC:factorial pulse coding)を使用することができる。FPC符号化によれば、割り当てられたビット数の範囲内で、パルスの位置、パルスの大きさ及びパルスの符号のような情報が階乗形式で表現される。FPC符号化の結果として得られるFPCデータは、ビットストリームに含まれて保存あるいは伝送される。
多重化部170は、エネルギー無損失符号化部130から提供されるエネルギーデータと、スペクトル無損失符号化部160から提供されるスペクトルデータとをビットストリームとして生成することができる。
図2は、本発明の一実施形態によるオーディオ復号化装置の構成を示したブロック図である。図2に図示されたオーディオ復号化装置200は、逆多重化部210、エネルギー無損失復号化部220、エネルギー逆量子化部230、ビット割当て部240、スペクトル無損失復号化部250、スペクトル逆量子化部260及び逆変換部270を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)によって具現される。オーディオ符号化装置100と同様に、逆多重化部210は、オプションとしても具備され、ビットアンパッキング機能を遂行する他の構成要素にも代替される。一方、スペクトル逆量子化過程の前後、エネルギー値を利用して、逆正規化(denormalization)を行う逆正規化部(図示せず)をさらに具備することができる。
図2において、逆多重化部210は、ビットストリームをパージングして符号化されたエネルギーデータは、エネルギー無損失復号化部220に、符号化されたスペクトルデータは、スペクトル無損失復号化部250にそれぞれ提供することができる。
エネルギー無損失復号化部220は、符号化されたエネルギーデータに対して、無損失復号化を行い、エネルギー量子化係数を生成することができる。
エネルギー逆量子化部230は、エネルギー無損失復号化部220から提供されるエネルギー量子化係数に対して、量子化ステップサイズを利用して、逆量子化を行い、エネルギー逆量子化係数を生成することができる。具体的には、エネルギー逆量子化部230は、エネルギー量子化係数に、量子化ステップサイズを乗じ、エネルギー逆量子化係数を得ることができる。
ビット割当て部240は、エネルギー逆量子化部230から提供されるエネルギー逆量子化係数を利用して、各周波数バンド単位で、整数単位あるいは小数点単位のビット割当てを行うことができる。具体的には、エネルギー値が大きい周波数バンドから、順次にサンプル別にビットを割り当てる。すなわち、優先的に、最大エネルギー値を有する周波数バンドに対して、サンプル当たりビットを割り当て、当該周波数バンドのエネルギー値を、所定単位ほど減少させ、他の周波数バンドにビットを割り当てることができるように、優先順位を変更する。そのような過程は、与えられたフレームで使用可能な全体ビット数が全くなくなるまで反復的に遂行される。ビット割当て部240の動作は、オーディオ符号化装置100のビット割当て部140と実質的に同一である。
スペクトル無損失復号化部250は、符号化されたスペクトルデータに対して、無損失復号化を行い、スペクトル量子化係数を生成することができる。
スペクトル逆量子化部260は、スペクトル無損失復号化部250から提供されるスペクトル量子化係数に対して、各周波数バンド単位で決定された割当てビット数を利用して、逆量子化を行い、スペクトル逆量子化係数を生成することができる。
逆変換部250は、スペクトル逆量子化部260から提供されるスペクトル逆量子化係数に対して、逆変換を行い、時間ドメインのオーディオ信号を復元することができる。
図3は、本発明の一実施形態によるエネルギー無損失符号化装置の構成を示したブロック図である。図3に図示されたエネルギー無損失符号化装置300は、モード決定部310、第1無損失符号化部330及び第2無損失符号化部350を含んでもよい。第2無損失符号化部350は、上位ビット符号化部351と、下位ビット符号化部353とを含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)によって具現される。
図3において、モード決定部310は、エネルギー量子化係数に係わる符号化モードを、第1無損失符号化モード及び第2無損失符号化モードのうち一つに決定することができる。第1無損失符号化モードに決定された場合、エネルギー量子化係数を、第1無損失符号化部330に提供することができる。第2無損失符号化モードに決定された場合、エネルギー量子化係数を、第2無損失符号化部350に提供することができる。モード決定部310は、1フレーム内の全ての周波数バンドで、エネルギー量子化係数が特定ビット、例えば、Nビット(ここで、Nは、2以上の自然数)で表現されるか否かということを判断し、少なくとも1つの周波数バンドで、特定ビットで表現されないという場合、エネルギー量子化係数の符号化モードを、無限無損失符号化アルゴリズムを使用する第1無損失符号化モードに決定することができる。一方、全ての周波数バンドで、特定ビットで表現される場合、エネルギー量子化係数の符号化モードを、無限無損失符号化アルゴリズムを使用する第1無損失符号化モードと、有限無損失符号化アルゴリズムを使用する第2無損失符号化モードとのうち一つに決定することができる。具体的には、現在フレームで、全てのバンドに対して、上位ビットの量子化係数を、第2無損失符号化モードの複数個のモードで符号化し、符号化の結果、使用された最も少ないビットと、第1無損失符号化モードの遂行結果、使用されたビットとを比較し、比較結果により、さらに第1無損失符号化モード及び第2無損失符号化モードのうち一つに決定することができる。モード決定結果に対応し、エネルギー量子化係数の符号化モードを示す1ビットの第1付加情報D0が生成され、ビットストリームに含まれもする。モード決定部310は、符号化モードが、第2無損失符号化モードに決定された場合、Nビットのエネルギー量子化係数に対して、N0ビットの上位ビットと、N1ビットの下位ビットとに分離し、第2無損失符号化部350に提供することができる。ここで、N0は、N−N1であり、N1は、N−N0と示すことができる。一実施形態によれば、Nは6、N0は5、N1は1と設定することができる。
第1無損失符号化部330は、エネルギー量子化係数に対して、FPCを行うことができる。FPCは、デルタコーディングが適用される場合、周波数バンド間エネルギー量子化係数の差値を、符号と絶対値とに分離し、符号は、絶対値が0ではない場合に伝送し、絶対値は、パルスをスタックしたと表現し、各周波数バンド別にいくつのパルスがスタックされるかということを表現して伝送することができる。
第2無損失符号化部350は、エネルギー量子化係数に対して、上位ビットと下位ビットとに分離し、上位ビットについては、ハフマン符号化方式あるいはビットパッキング方式を適用し、下位ビットについては、ビットパッキング方式を適用し、無損失符号化を行うことができる。
具体的には、上位ビット符号化部351は、N0ビットで表現される上位ビットデータに対して、2N0個のシンボルを構成し、ハフマン符号化方式あるいはビットパッキング方式のうち少ないビットが必要となる方式で符号化することができる。上位ビット符号化部351は、M種類の符号化モードを有し、具体的には、(M−1)個のハフマン符号化モードと、1個のビットパッキングモードとを有することができる。例えば、Mが4である場合、上位ビットの符号化モードを示す2ビットの第2付加情報D1が生成され、第1付加情報D0と共にビットストリームに含まれる。
一方、下位ビット符号化部353は、N1ビットで表現される下位ビットデータに対して、ビットパッキング方式を適用して符号化を行うことができる。1つのフレームがN個の周波数バンドからなる場合、全体N1×N個のビットを使用して、下位ビットデータを符号化することができる。
図4は、図3に図示された第2無損失符号化部の細部的な構成を示したブロック図である。図4に図示された第2無損失符号化部400は、上位ビット符号化部410と、第2ビットパッキング部430とから構成される。上位ビット符号化部410は、複数個、例えば、第1ハフマン符号化部411、第2ハフマン符号化部413及び第3ハフマン符号化部415、並びに第1ビットパッキング部417を含んでもよい。ここで、多様なハフマン符号化方式により、例えば、第1ハフマン符号化部411、第2ハフマン符号化部413及び第3ハフマン符号化部415により構成されているが、それらに限定されるものではなく、符号化許容ビット数を考慮して設計変更されもする。
図4において、第2無損失符号化部400は、1つのフレームに存在する全ての周波数バンドに対して、デルタコーディングが使用される場合、現在周波数バンドと以前周波数バンドとのエネルギー量子化係数の差値が、特定ビット、例えば、6ビットで表現されてこそ動作される。例えば、最初の周波数バンドのエネルギー量子化係数の差値が6ビットで表現することができる64種に属さない場合には、第1無損失符号化部330(図3)を介して、無損失符号化が行われる。
上位ビット符号化部410は、第1ハフマン符号化部411、第2ハフマン符号化部413及び第3ハフマン符号化部415、並びに第1ビットパッキング部417のうち、モード決定部310(図3)ですでに決定された最小ビットのハフマンモードを、そのまま各バンドの上位ビット符号化に適用することができる。それによれば、1フレームの全ての帯域に対して、同一の無損失符号化モードが適用され、従って、エネルギーに係わる無損失符号化モードと係わり、例えば、同一のビット値が、各フレームのヘッダに含まれる。
ここで、第1ハフマン符号化部411、第2ハフマン符号化部413及び第3ハフマン符号化部415は、コンテクストを使用したり、あるいは使用せずに、ハフマン符号化を行うことができる。例えば、第1ハフマン符号化部411は、コンテクストを使用せずにハフマン符号化を行うことにより、具現することができる。第2ハフマン符号化部413は、コンテクストを使用して、ハフマン符号化を行うことにより、具現することができる。コンテクストを使用する場合、一実施形態によれば、現在周波数バンドの量子化デルタ値をハフマン符号化するにあたり、以前周波数バンドの量子化デルタ値をコンテクストとして活用することができる。他の実施形態によれば、以前周波数バンドの量子化デルタ値のうち上位ビット、例えば、5ビットで表現された値を、コンテクストとして活用することができる。第3ハフマン符号化部415は、コンテクストを使用しないが、第1ハフマン符号化部411と比較し、さらに少ない個数のシンボルでもってハフマンテーブルを構成することができる。第1ビットパッキング部417は、上位ビットデータをそのまま符号化し、例えば、5ビットデータを出力することができる。
一方、上位ビット符号化部410において、第1無損失符号化モードあるいは第2無損失符号化モードの決定段階で決定された上位ビットの符号化モードと係わりなく、比較部(図示せず)をさらに含み、上位ビットデータに対して、第1ハフマン符号化部411、第2ハフマン符号化部413及び第3ハフマン符号化部415、並びに第1ビットパッキング部417による符号化結果を比較し、最も少ないビットが必要となった符号化モードを選択して出力することができる。1フレームの全ての帯域に対して、第2無損失符号化モードが適用される一方、上位ビット符号化には、互いに異なるハフマン符号化モードが適用される。
図5は、本発明の一実施形態によるエネルギー無損失符号化方法について説明するフローチャートであり、少なくとも1つのプロセシング・デバイスによって遂行される。また、図5のエネルギー無損失符号化方法は、フレーム単位で動作される。説明の便宜上、M=4、すなわち、上位ビットデータのハフマン符号化モードが4種である場合を例として挙げる。4種は、図4に図示された第1ハフマン符号化部411、第2ハフマン符号化部413及び第3ハフマン符号化部415、並びに第1ビットパッキング部417によって得られるものを例として挙げる。
図5において、510段階では、入力されるエネルギー量子化係数に対して、無限無損失符号化アルゴリズムであるFPCを遂行し、FPCで使用されたビット(ebits)を計算することができる。510段階は、後述する580段階以前に遂行されてもよい。
520段階では、エネルギー無損失符号化のために入力されるエネルギー量子化係数の差値を確認し、第1無損失符号化モードあるいは第2無損失符号化モードのうち一つを選択することができる。すなわち、1つのフレームをなす全ての周波数バンドに対して、エネルギー量子化係数の差値が特定ビットで表現される場合、第2無損失符号化モードであるハフマン符号化方式を選択することができる。一方、1つのフレームをなす少なくとも1つの周波数バンドで、エネルギー量子化係数の差値が、特定ビットで表現されない場合、第1無損失符号化モードであるFPC方式を選択することができる。すなわち、ハフマン符号化が可能ではないと判断された場合、580段階では、当該フレームに対して、FPCで使用されたビット(ebits)に、エネルギー量子化係数の無損失符号化モードを示す第1付加情報に該当する1ビットを追加し、第1無損失符号化結果を生成することができる。
530段階では、ハフマン符号化が可能であると判断された場合、上位ビットデータに対して、M種のハフマン符号化モードを遂行し、各符号化モードに対して使用されたビットh0bitsないしh(M−1)bitsを計算することができる。ここで、h0bitsは、第1ハフマン符号化モードを適用した場合に使用されたビットであり、h(M−1)bitsは、第Mハフマン符号化モードを適用した場合に使用されたビットを意味する。
540段階では、h0bitsないしh(M−1)bitsを比較し、最小ビットを選択し、選択された符号化モードを示す第2付加情報を表現する2ビットを付加し、上位ビットに対する無損失符号化ビット(hbits)を計算することができる。
550段階では、上位ビットの無損失符号化に使用されたビット(hbits)に、下位ビットの無損失符号化に使用されたビット(lbits)を加え、全体ビットのハフマン符号化に使用されたビット(tbits)を計算することができる。ここで、下位ビットが1ビットであり、1つのフレームをなす周波数バンドが20個である場合、lbitsは、20ビットである。
560段階では、550段階で計算された全体ビットのハフマン符号化に使用されたビット(tbits)と、510段階で計算されたFPCで使用されたビット(ebits)とを比較し、すなわち、ハフマン符号化で使用されたビット(tbits)が、FPCで使用されたビット(ebits)より小さい場合、上位ビットに対して、第2無損失符号化、すなわち、ハフマン符号化を行うと判断することができる。
570段階では、560段階で、上位ビットに対して、第2無損失符号化、すなわち、ハフマン符号化を行うと判断された場合、ハフマン符号化で使用されたビット(tbits)に、エネルギー量子化係数の無損失符号化モードを示す第1付加情報に該当する1ビットを追加し、第2無損失符号化結果を生成することができる。
580段階では、520段階で、エネルギー量子化係数に対して、ハフマン符号化が可能ではないと判断されるか、あるいは560段階で、上位ビットに対して、第1無損失符号化、すなわち、FPCを行うと判断された場合、FPCで使用されたビット(ebits)に、エネルギー量子化係数の無損失符号化モードを示す第1付加情報に該当する1ビットを追加し、第1無損失符号化結果を生成することができる。
図6は、本発明の一実施形態によるエネルギー無損失復号化装置の構成を示したブロック図である。図6に図示されたエネルギー無損失復号化装置600は、モード判断部610、第1無損失復号化部630及び第2無損失復号化部650を含んでもよい。第2無損失復号化部650は、上位ビット復号化部651と、下位ビット復号化部653とを含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)によって具現される。
図6において、モード判断部610は、ビットストリームをパージングし、第1付加情報D0及び第2付加情報D1から、エネルギーデータと、上位ビットデータの無損失符号化モードとを判断することができる。まず、第1付加情報D0をチェックし、第1無損失符号化モードである場合、エネルギーデータを第1無損失復号化部610に、第2無損失符号化モードである場合、エネルギーデータを第2無損失復号化部630に提供することができる。
第1無損失復号化部630は、モード判断部610から提供されたエネルギーデータに対して、FPCを利用して、無損失復号化を行うことができる。
第2無損失復号化部650において、上位ビット復号化部651は、モード判断部610から提供されたエネルギーデータの上位ビットデータに対して、第2付加情報D1をチェックし、無損失復号化を行うことができる。下位ビット復号化部653は、モード判断部610から提供されたエネルギーデータの下位ビットデータに対して、無損失復号化を行うことができる。
図7は、図6に図示された第2無損失復号化部の細部的な構成を示したブロック図である。図7に図示された第2無損失復号化部700は、上位ビット復号化部710と、第2ビットアンパッキング部730とから構成される。上位ビット復号化部710は、複数個、例えば、第1ハフマン復号化部711、第2ハフマン復号化部713及び第3ハフマン復号化部715、並びに第1ビットアンパッキング部717を含んでもよい。ここで、第1ハフマン復号化部711、第2ハフマン復号化部713及び第3ハフマン復号化部715、並びに第1ビットアンパッキング部717は、図4の第1ハフマン符号化部411、第2ハフマン符号化部413及び第3ハフマン符号化部415、並びに第1ビットパッキング部417に対応して具現される。
図7において、上位ビット復号化部710の第1ハフマン復号化部711、第2ハフマン復号化部713及び第3ハフマン復号化部715、並びに第1ビットアンパッキング部717は、第2付加情報D1により、モード判断部610から提供されたエネルギーデータの上位ビットデータを入力され、無損失復号化を行うことができる。例えば、D1=00である場合、上位ビットデータは、第1ハフマン復号化部711に、D1=01である場合、上位ビットデータは、第2ハフマン復号化部713に、D1=10である場合、上位ビットデータは、第3ハフマン復号化部711に提供され、ハフマンテーブルを利用した無損失復号化が行われる。一方、D1=11である場合、上位ビットデータは第、1ビットアンパッキング部717に提供され、ビットアンパッキングが行われる。
第2ビットアンパッキング部719は、エネルギーデータの下位ビットデータを入力され、ビットアンパッキングを行うことができる。
図8は、有限範囲、すなわち、特定ビットで表現されるエネルギー量子化係数について説明する図面であり、Nは6、N0は5、N1は1の場合を例として挙げたものである。図8を参照すれば、上位5ビットは、ハフマン符号化方式で、下位1ビットは、ビットパッキング方式で符号化を行うことができる。
図9は、本発明の一実施形態による、符号化モジュールを含むマルチメディア機器の構成を示したブロック図である。図9に図示されたマルチメディア機器900は、通信部910と、符号化モジュール930とを含んでもよい。また、符号化の結果として得られるオーディオ・ビットストリームの用途によって、オーディオ・ビットストリームを保存する保存部950をさらに含んでもよい。また、マルチメディア機器900は、マイクロホン970をさらに含んでもよい。すなわち、保存部950と、マイクロホン970は、オプションとして具備される。一方、図9に図示されたマルチメディア機器900は、任意の復号化モジュール(図示せず)、例えば、一般的な復号化機能を遂行する復号化モジュール、あるいは、本発明の一実施形態による復号化モジュールをさらに含んでもよい。ここで、符号化モジュール930は、マルチメディア機器900に具備される他の構成要素(図示せず)と共に一体化され、少なくとも一つ以上のプロセッサ(図示せず)によって具現される。
図9を参照すれば、通信部910は、外部から提供されるオーディオと、符号化されたビットストリームとのうち少なくとも一つを受信したり、あるいは復元されたオーディオと、符号化モジュール930の符号化結果として得られるオーディオ・ビットストリームとのうち少なくとも一つを送信することができる。
通信部910は、無線インターネット、無線イントラネット、無線電話網、無線LAN(local area network)、Wi−Fi(wireless fidelity)、WFD(Wi−Fi direct)、3G(3 generation)、4G(4 generation)、ブルートゥース((登録商標)Bluetooth)、赤外線通信(IrDA:infrared data association)、RFID(radio frequency identification)、UWB(ultra-wideband)、ジグビー(ZigBee)、NFC(near field communication)のような無線ネットワーク、または有線電話網、有線インターネットのような有線ネットワークを介して、外部のマルチメディア機器とデータを送受信することができるように構成される。
符号化モジュール930は、一実施形態によれば、通信部910あるいはマイクロホン970を介して提供される時間ドメインのオーディオ信号を、周波数ドメインのオーディオスペクトルに変換し、周波数ドメインのオーディオスペクトルから得られるエネルギー量子化係数の無損失符号化モードを、無限範囲無損失符号化モード及び有限範囲無損失符号化モードのうち一つに決定し、無損失符号化モードの決定結果に対応し、エネルギー量子化係数を無限範囲無損失符号化モードで符号化したり、あるいは有限範囲無損失符号化モードで符号化したりすることができる。また、無損失符号化モードを決定するにあたり、デルタコーディングが適用される場合、現在フレームに含まれた全ての周波数バンドのエネルギー量子化係数差値が、所定ビットで表現されるか否かということにより、無限範囲無損失符号化モード及び有限範囲無損失符号化モードのうち一つに決定することができる。一方、現在フレームに含まれた全ての周波数バンドのエネルギー量子化係数差値が、所定ビットで表現されても、エネルギー量子化係数を、無限範囲無損失符号化モードで符号化した結果と、有限範囲無損失符号化モードで符号化した結果とにより、無限範囲無損失符号化モード及び有限範囲無損失符号化モードのうち一つに決定することができる。エネルギー量子化係数に対して決定された無損失符号化モードを示す付加情報を生成することができる。ここで、無限範囲無損失符号化モードは、FPCによって遂行され、有限範囲無損失符号化モードは、ハフマン符号化によって遂行される。また、有限範囲無損失符号化モードは、エネルギー量子化係数を、上位ビットと下位ビットとで分けて符号化が行われ、上位ビットは、複数個のハフマンテーブルを使用したり、あるいはビットパッキングによって符号化が行われ、上位ビットの符号化モードを示す付加情報を生成することができる。下位ビットは、ビットパッキングによって符号化が行われる。
保存部950は、符号化モジュール930で生成される符号化されたビットストリームを保存することができる。一方、保存部950は、マルチメディア機器900の運用に必要な多様なプログラムを保存することができる。
マイクロホン970は、ユーザあるいは外部のオーディオ信号を、符号化モジュール930に提供することができる。
図10は、本発明の一実施形態による、復号化モジュールを含むマルチメディア機器の構成を示したブロック図である。図10に図示されたマルチメディア機器1000は、通信部1010と、復号化モジュール1030とを含んでもよい。また、復号化の結果として得られる復元されたオーディオ信号の用途によって、復元されたオーディオ信号を保存する保存部1050をさらに含んでもよい。また、マルチメディア機器1000は、スピーカ1070をさらに含んでもよい。すなわち、保存部1050とスピーカ1070は、オプションとして具備される。一方、図10に図示されたマルチメディア機器1000は、任意の符号化モジュール(図示せず)、例えば、一般的な符号化機能を遂行する符号化モジュール、あるいは、本発明の一実施形態による符号化モジュールをさらに含んでもよい。ここで、復号化モジュール1030は、マルチメディア機器1000に具備される他の構成要素(図示せず)と共に一体化され、少なくとも1つの以上のプロセッサ(図示せず)によって具現される。
図10を参照すれば、通信部1010は、外部から提供される符号化されたビットストリームと、オーディオ信号とのうち少なくとも一つを受信したり、あるいは復号化モジュール1030の復号化の結果として得られる復元されたオーディオ信号と、符号化の結果として得られるオーディオ・ビットストリームとのうち少なくとも一つを送信することができる。一方、通信部1010は、図9の通信部910と実質的に類似して具現される。
復号化モジュール1030は、一実施形態によれば、通信部1010を介して提供されるビットストリームを受信し、ビットストリームに含まれたエネルギー量子化係数の無損失符号化モードを判断し、無損失符号化モードの判断結果に対応し、エネルギー量子化係数を、無限範囲無損失復号化モードで復号化したり、有限範囲無損失復号化モードで復号化したりすることができる。無限範囲無損失復号化モードは、FPCによって遂行され、有限範囲無損失復号化モードは、ハフマン復号化によって遂行される。有限範囲無損失復号化モードは、エネルギー量子化係数を、上位ビットと下位ビットとに分けて復号化が行われ、上位ビットは、複数個のハフマンテーブルを使用したり、あるいはビットアンパッキングによって復号化が行われ、下位ビットは、ビットアンパッキングによって復号化が行われる。
保存部1050は、復号化モジュール1030で生成される復元されたオーディオ信号を保存することができる。一方、保存部1050は、マルチメディア機器1000の運用に必要な多様なプログラムを保存することができる。
スピーカ1070は、復号化モジュール1030で生成される復元されたオーディオ信号を外部に出力することができる。
図11は、本発明の一実施形態による符号化モジュールと、復号化モジュールとを含むマルチメディア機器の構成を示したブロック図である。図11に図示されたマルチメディア機器1100は、通信部1110、符号化モジュール1120及び復号化モジュール1130を含んでもよい。また、符号化の結果として得られるオーディオ・ビットストリーム、あるいは復号化の結果として得られる復元されたオーディオ信号の用途によって、オーディオ・ビットストリームあるいは復元されたオーディオ信号を保存する保存部1140をさらに含んでもよい。また、マルチメディア機器1100は、マイクロホン1150、あるいはスピーカ1160をさらに含んでもよい。ここで、符号化モジュール1120と、復号化モジュール1130は、マルチメディア機器1100に具備される他の構成要素(図示せず)と共に一体化され、少なくとも一つ以上のプロセッサ(図示せず)によって具現される。
図11に図示された各構成要素は図9に、図示されたマルチメディア機器900の構成要素、あるいは図10に図示されたマルチメディア機器1000の構成要素と重複されるので、その詳細な説明は省略する。
図9ないし図11に図示されたマルチメディア機器900,1000,1100には、電話、モバイルフォンなどを含む音声通信専用端末、TV(television)・MP3プレーヤなどを含む放送あるいは音楽の専用装置、あるいは音声通信専用端末と、放送あるいは音楽の専用装置との融合端末装置が含まれもするが、それらに限定されるものではない。また、マルチメディア機器900,1000,1100は、クライアント、サーバあるいはクライアントとサーバとの間に配置される変換器として使用されもする。
なお、マルチメディア機器900,1000,1100が、例えば、モバイルフォンである場合、図示されていないが、キーパッドのようなユーザ入力部;ユーザ・インターフェース、あるいはモバイルフォンで処理される情報をディスプレイするディスプレイ部;及びモバイルフォンの全般的な機能を制御するプロセッサをさらに含んでもよい。また、モバイルフォンは、撮像機能を有するカメラ部と、モバイルフォンで必要とされる機能を遂行する少なくとも一つ以上の構成要素とをさらに含んでもよい。
一方、マルチメディア機器900,1000,1100が、例えば、TVである場合、図示されていないが、キーパッドのようなユーザ入力部、受信された放送情報をディスプレイするディスプレイ部、及びTVの全般的な機能を制御するプロセッサをさらに含んでもよい。また、TVは、TVで必要とされる機能を遂行する少なくとも一つ以上の構成要素をさらに含んでもよい。
前記実施形態による方法は、コンピュータで実行されるプログラムでもって作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。また、前述の本発明の実施形態で使用されるデータ構造、プログラム命令あるいはデータファイルは、コンピュータで読み取り可能な記録媒体に多様な手段を介して記録される。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存される全ての種類の保存装置を含んでもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media);CD(compact disc)−ROM(read-only memory)、DVD(digital versatile disc)のような光記録媒体(optical media);フロプティカルディスク(floptical disk)のような磁気・光媒体(magneto-optical media);及びROM、RAM(random-access memory)、フラッシュメモリのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置;が含まれる。また、コンピュータで読み取り可能な記録媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でもある。プログラム命令の例としては、コンパイラによって作われるような機械語コードだけではなく、インタープリタなどを使用して、コンピュータによって実行される高級言語コードを含んでもよい。
以上、本発明の一実施形態は、たとえ限定された実施形態と図面とによって説明されたとしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、それは本発明が属する分野で当業者であるならば、かような記載から、多様な修正及び変形が可能である。従って、本発明のスコープは、前述の説明ではなく、特許請求の範囲に示されており、それと均等であったり、あるいは等価的変形は、いずれも本発明の技術的思想の範疇に属するものである。

Claims (6)

  1. エンベロープの差分量子化インデックスが表現される範囲とビット所要量に基づき、前記差分量子化インデックスに対して第1無損失符号化方式と第2無損失符号化方式のうち一つを選択する段階と、
    前記選択された無損失符号化方式を使用して前記差分量子化インデックスを符号化する段階と、を含み、
    前記第1無損失符号化方式と第2無損失符号化方式のうち一つを選択する段階は、
    フレームの全バンドに対して少なくとも一つの差分量子化インデックスが前記範囲で表現されない場合、前記第1無損失符号化方式を選択する段階と、
    前記フレームの全バンドに対して前記差分量子化インデックスが前記範囲で表現される場合、前記第1無損失符号化方式のビット所要量より前記第2無損失符号化方式のビット所要量が大きければ、前記第1無損失符号化方式を選択し、前記第2無損失符号化方式のビット所要量より前記第1無損失符号化方式のビット所要量が大きければ、前記第2無損失符号化方式を選択する段階と、を含み、
    前記第1無損失符号化方式はハフマン符号化と係わり、前記第2無損失符号化方式はコンテクスト(context)に基づいたハフマン符号化モードを含み、
    前記第2無損失符号化方式においては、前記差分量子化インデックスを示す複数の上位ビットと少なくとも一つの下位ビットを相異なる方式で符号化する無損失符号化方法。
  2. 前記方法は、フレーム単位で遂行されることを特徴とする請求項1に記載の無損失符号化方法。
  3. 前記差分量子化インデックスは、信号のエネルギーと係わることを特徴とする請求項1に記載の無損失符号化方法。
  4. 前記第2無損失符号化方式は、複数のハフマン符号化モードを含むことを特徴とする請求項1に記載の無損失符号化方法。
  5. 前記第2無損失符号化方式においては、前記差分量子化インデックスを複数の上位ビットと少なくとも一つの下位ビットとに分け、前記複数の上位ビットは、複数個のハフマン符号化モードのうち一つを使用して符号化が行われることを特徴とする請求項1に記載の無損失符号化方法。
  6. 前記少なくとも一つの下位ビットは、ビットパッキングによって符号化が行われることを特徴とする請求項に記載の無損失符号化方法。
JP2014537001A 2011-10-21 2012-10-22 無損失符号化方法 Active JP6088532B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161549942P 2011-10-21 2011-10-21
US61/549,942 2011-10-21
PCT/KR2012/008688 WO2013058634A2 (ko) 2011-10-21 2012-10-22 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017019014A Division JP6438056B2 (ja) 2011-10-21 2017-02-03 無損失符号化装置

Publications (2)

Publication Number Publication Date
JP2015502561A JP2015502561A (ja) 2015-01-22
JP6088532B2 true JP6088532B2 (ja) 2017-03-01

Family

ID=48141573

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014537001A Active JP6088532B2 (ja) 2011-10-21 2012-10-22 無損失符号化方法
JP2017019014A Active JP6438056B2 (ja) 2011-10-21 2017-02-03 無損失符号化装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2017019014A Active JP6438056B2 (ja) 2011-10-21 2017-02-03 無損失符号化装置

Country Status (8)

Country Link
US (4) US20130110522A1 (ja)
EP (1) EP2767977A4 (ja)
JP (2) JP6088532B2 (ja)
KR (3) KR102070429B1 (ja)
CN (3) CN106941003B (ja)
MX (1) MX2014004797A (ja)
TW (2) TWI585749B (ja)
WO (1) WO2013058634A2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
PT2772913T (pt) 2011-10-28 2018-05-10 Fraunhofer Ges Forschung Aparelho de codificação e método de codificação
US10468033B2 (en) * 2013-09-13 2019-11-05 Samsung Electronics Co., Ltd. Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
CN105723454B (zh) * 2013-09-13 2020-01-24 三星电子株式会社 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备
CN110867190B (zh) * 2013-09-16 2023-10-13 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
EP3226242B1 (en) * 2013-10-18 2018-12-19 Telefonaktiebolaget LM Ericsson (publ) Coding of spectral peak positions
CN110808056B (zh) * 2014-03-14 2023-10-17 瑞典爱立信有限公司 音频编码方法和装置
ES2770704T3 (es) * 2014-07-28 2020-07-02 Nippon Telegraph & Telephone Codificación de una señal acústica
WO2016018058A1 (ko) 2014-07-28 2016-02-04 삼성전자 주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
JP6763849B2 (ja) * 2014-07-28 2020-09-30 サムスン エレクトロニクス カンパニー リミテッド スペクトル符号化方法
WO2016122612A1 (en) 2015-01-30 2016-08-04 Hewlett-Packard Development Company, L.P. Spectral reflectance compression
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US10511858B2 (en) * 2016-07-13 2019-12-17 Ati Technologies Ulc Bit packing for delta color compression
JP7159539B2 (ja) * 2017-06-28 2022-10-25 株式会社三洋物産 遊技機
JP7159537B2 (ja) * 2017-06-28 2022-10-25 株式会社三洋物産 遊技機
JP7228908B2 (ja) * 2020-07-07 2023-02-27 株式会社三洋物産 遊技機

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5884269A (en) * 1995-04-17 1999-03-16 Merging Technologies Lossless compression/decompression of digital audio data
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
US6466912B1 (en) * 1997-09-25 2002-10-15 At&T Corp. Perceptual coding of audio signals employing envelope uncertainty
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
ATE255785T1 (de) 1999-04-07 2003-12-15 Dolby Lab Licensing Corp Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US20020016161A1 (en) * 2000-02-10 2002-02-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for compression of speech encoded parameters
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
KR100571824B1 (ko) 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
KR100695125B1 (ko) * 2004-05-28 2007-03-14 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
MX2008010836A (es) * 2006-02-24 2008-11-26 France Telecom Un metodo para codificacion binaria de indices de cuantificacion de una envoltura de señal, un metodo para descodificar una envoltura de señal, y modulos de codificacion y descodificacion correspondiente.
US20080059201A1 (en) * 2006-09-03 2008-03-06 Chih-Hsiang Hsiao Method and Related Device for Improving the Processing of MP3 Decoding and Encoding
US20080071550A1 (en) 2006-09-18 2008-03-20 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode audio signal by using bandwidth extension technique
KR101346358B1 (ko) * 2006-09-18 2013-12-31 삼성전자주식회사 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
JP2008107615A (ja) * 2006-10-26 2008-05-08 Yamaha Corp データ圧縮装置
US7756350B2 (en) * 2006-11-13 2010-07-13 Global Ip Solutions, Inc. Lossless encoding and decoding of digital data
CN101290771B (zh) * 2007-04-20 2011-07-13 中兴通讯股份有限公司 一种基于先进音频编码器的比特消耗控制方法
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR100889750B1 (ko) * 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
JP4888335B2 (ja) 2007-10-25 2012-02-29 ソニー株式会社 符号化方法及び装置、並びにプログラム
US8515767B2 (en) 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
KR101485339B1 (ko) 2008-09-29 2015-01-26 삼성전자주식회사 무손실 부호화/복호화 장치 및 방법
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR20100136890A (ko) 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
TWI455114B (zh) * 2009-10-20 2014-10-01 Fraunhofer Ges Forschung 多模式音訊編解碼器及其適用碼簿激發線性預測編碼技術
KR20110060181A (ko) * 2009-11-30 2011-06-08 한국전자통신연구원 무손실/준무손실 영상 압축 장치 및 방법
KR20110071231A (ko) * 2009-12-21 2011-06-29 엠텍비젼 주식회사 부호화 방법, 복호화 방법 및 장치
ES2641315T3 (es) * 2011-03-04 2017-11-08 Telefonaktiebolaget Lm Ericsson (Publ) Corrección de ganancia post-cuantificación en codificación de audio
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
EP2830055A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
JP6385433B2 (ja) * 2013-10-18 2018-09-05 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号のスペクトルのスペクトル係数のコード化

Also Published As

Publication number Publication date
TWI585749B (zh) 2017-06-01
KR20130044193A (ko) 2013-05-02
MX2014004797A (es) 2014-09-22
KR20200143349A (ko) 2020-12-23
TWI671736B (zh) 2019-09-11
KR102070429B1 (ko) 2020-01-28
CN104025190B (zh) 2017-06-09
KR20200010539A (ko) 2020-01-30
JP2017126073A (ja) 2017-07-20
US20190355367A1 (en) 2019-11-21
CN107025909B (zh) 2020-12-29
EP2767977A2 (en) 2014-08-20
KR102248253B1 (ko) 2021-05-04
US10878827B2 (en) 2020-12-29
TW201724087A (zh) 2017-07-01
JP2015502561A (ja) 2015-01-22
US20150221315A1 (en) 2015-08-06
US10424304B2 (en) 2019-09-24
WO2013058634A2 (ko) 2013-04-25
CN106941003A (zh) 2017-07-11
KR102194557B1 (ko) 2020-12-23
CN104025190A (zh) 2014-09-03
US20130110522A1 (en) 2013-05-02
CN106941003B (zh) 2021-01-26
JP6438056B2 (ja) 2018-12-12
WO2013058634A3 (ko) 2013-06-13
EP2767977A4 (en) 2015-04-29
US11355129B2 (en) 2022-06-07
TW201324500A (zh) 2013-06-16
CN107025909A (zh) 2017-08-08
US20210090581A1 (en) 2021-03-25

Similar Documents

Publication Publication Date Title
JP6438056B2 (ja) 無損失符号化装置
KR102409305B1 (ko) 비트할당방법, 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 기록매체와 이를 채용하는 멀티미디어 기기
JP6585753B2 (ja) 無損失符号化装置及び無損失復号化装置
TW201738881A (zh) 音訊解碼方法、裝置及電腦可讀取記錄媒體
KR102401002B1 (ko) 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
JP6616316B2 (ja) 高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置
KR20130090826A (ko) 낮은 복잡도로 오디오 신호를 처리하는 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20151201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170203

R150 Certificate of patent or registration of utility model

Ref document number: 6088532

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250