JP2006235253A - 符号化装置、符号化方法、復号化装置及び復号化方法 - Google Patents
符号化装置、符号化方法、復号化装置及び復号化方法 Download PDFInfo
- Publication number
- JP2006235253A JP2006235253A JP2005050005A JP2005050005A JP2006235253A JP 2006235253 A JP2006235253 A JP 2006235253A JP 2005050005 A JP2005050005 A JP 2005050005A JP 2005050005 A JP2005050005 A JP 2005050005A JP 2006235253 A JP2006235253 A JP 2006235253A
- Authority
- JP
- Japan
- Prior art keywords
- bits
- bit allocation
- frame
- bit
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】 本発明のビット割当部は、所望のビット数Xよりも大きな目標ビット数X+aを設定し、目標ビット数X+a以下となるようにビット割当を決定する(ステップS30a参照)。次に、比較部21は、生成フレームのビット数と所望のビット数Xとを比較する(ステップS30b参照)。ここで、生成フレームのビット数が所望のビット数X以下である場合は、差分符号化器は、そのときのビット割当に基づく差分符号化データをビットストリーム生成部に出力する(ステップS30d参照)。一方、生成フレームのビット数が所望のビット数より大きい場合は、ビット割当部は、前回設定した目標ビット数X+aよりも小さく、かつ所望のビット数Xよりも大きな目標ビット数X+bを設定してビット割当を決定することを繰り返す(ステップS30e、30f参照)。
【選択図】 図2
Description
これらのアプリケーションで主に用いられている音声符号化技術としては、MP3(MPEG1 Audio Layer3)、AAC(Advanced Audio Coding)、ATRAC(Adaptive TRansform Acoustic Coding)などの周波数変換型の技術が挙げられる。これらの周波数変換型の音声符号化技術においては、時間領域の入力データを周波数変換して人間の聴覚特性を考慮に入れて分析することで、帯域毎のビット割当を動的に変更する。これにより、入力データに最適なビット割当を実現し、高圧縮率でも比較的音質劣化の少ない音声符号化技術を提供している。
◎前記入力データを時間関数から周波数関数に変換してスペクトル信号を生成するスペクトル信号生成手段、
◎前記スペクトル信号の心理聴覚分析を行い、帯域毎のビット割当を決定するビット割当手段、
◎前記ビット割当手段により決定された現在フレームのビット割当と直前フレームのビット割当との差分データを演算し、前記差分データをエントロピー符号化して差分符号化データを算出する差分データ符号化器、
◎前記スペクトル信号を前記ビット割当に基づいて量子化して量子化スペクトルを生成する量子化手段、
◎前記差分符号化データ及び前記量子化スペクトルを含む生成フレームを生成し、前記生成フレームにより構成されるビットストリームを出力するビットストリーム出力手段、
ここで、前記ビット割当手段は、前記所望のビットレートのビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きい第1目標ビット数を設定し、前記第1目標ビット数に基づいて第1ビット割当を決定し、前記第1ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第1差分符号化データと、前記第1ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第1生成フレームのビット数が、前記所望のビット数より大きいか否かを比較し、その比較結果において前記第1生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数よりも大きく前記第1目標ビット数よりも小さい第2目標ビット数を設定し、前記第2目標ビット数に基づいて第2ビット割当を決定し、前記第2ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第2差分符号化データと、前記第2ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第2生成フレームのビット数が、前記所望のビット数よりも大きいか否かを比較し、その比較結果に応じてさらなる目標ビット数を設定し、その目標ビット数に基づくビット割当の決定を繰り返す。
本願第2発明は、第1発明において、前記ビット割当手段は、前記目標ビット数に基づくビット割当の決定の繰り返しを所定の制限回数で終了する符号化装置を提供する。
ハフマン符号化は、一般的に演算量の小さい符号化方式であるが、一方で符号化後の符号量を予測することが困難な符号化方式である。上記の通り、本願の符号化では、ビット割当情報として差分符号化データを含む生成フレームが、所望のビット数以下となるようにビット割当を繰り返し行う。このように繰り返しビット割当を行うため、符号量の予測が困難なハフマン符号化であっても、生成フレームが所望のビット数以下となるように収束させることが可能である。よって、ハフマン符号化により演算量を小さくしつつ、量子化スペクトルに割り当てるビット数を減らさないような符号化を行うことができる。
◎前記入力データを時間関数から周波数関数に変換してスペクトル信号を生成するスペクトル信号生成ステップ、
◎前記スペクトル信号の心理聴覚分析を行い、前記帯域毎のビット割当を決定するビット割当ステップ、
◎前記ビット割当ステップにより決定された現在フレームのビット割当と直前フレームのビット割当との差分データを演算し、前記差分データをエントロピー符号化して差分符号化データを算出する差分データ符号化ステップと、
◎前記スペクトル信号を前記ビット割当に基づいて量子化して量子化スペクトルを生成する量子化ステップと、
◎前記差分符号化データ及び前記量子化スペクトルを含む生成フレームを生成し、前記生成フレームにより構成されるビットストリームを出力するビットストリーム出力ステップ、
ここで、前記ビット割当ステップでは、前記所望のビットレートのビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きい第1目標ビット数を設定し、前記第1目標ビット数に基づいて第1ビット割当を決定し、前記第1ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第1差分符号化データと、前記第1ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第1生成フレームのビット数が、前記所望のビット数より大きいか否かを比較し、その比較結果において前記第1生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数よりも大きく前記第1目標ビット数よりも小さい第2目標ビット数を設定し、前記第2目標ビット数に基づいて第2ビット割当を決定し、前記第2ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第2差分符号化データと、前記第2ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第2生成フレームのビット数が、前記所望のビット数よりも大きいか否かを比較し、その比較結果に応じてさらなる目標ビット数を設定し、その目標ビット数に基づくビット割当の決定を繰り返す。
本願第6発明は、入力データを時間関数から周波数関数に変換して得られるスペクトル信号の心理聴覚分析の結果決定されるビット割当について、現在フレームと直前フレームとのビット割当の差分データを符号化した差分符号化データと、前記ビット割当に基づいて量子化された量子化スペクトルとを含むフレームから生成されたビットストリームを復号化する復号化装置であって、前記ビットストリームのフレームを分解し、前記フレームから差分符号化データを含む副情報と量子化スペクトルとを分離するフレーム分解部と、前記差分符号化データを含む副情報を復号化し、前記差分符号化データからビット割当を取得する副情報復号化部と、前記ビット割当情報に基づいて前記量子化スペクトルを逆量子化する逆量子化器とを含む復号化装置を提供する。
本願第7発明は、入力データを時間関数から周波数関数に変換して得られるスペクトル信号の心理聴覚分析の結果決定されるビット割当について、現在フレームと直前フレームとのビット割当の差分データを符号化した差分符号化データと、前記ビット割当に基づいて量子化された量子化スペクトルとを含むフレームから生成されたビットストリームを復号化する復号化方法であって、前記ビットストリームのフレームを分解し、前記フレームから差分符号化データを含む副情報と量子化スペクトルとを分離するフレーム分解ステップと、前記差分符号化データを含む副情報を復号化し、前記差分符号化データからビット割当を取得する副情報復号化ステップと、前記ビット割当情報に基づいて前記量子化スペクトルを逆量子化する逆量子化ステップとを含む復号化方法を提供する。
図1は、符号化による遅延時間を短縮しつつ音質を良好に維持可能な本発明の概要を説明するための模式図であり、(a)、(b)及び(c)はそれぞれビットストリームの生成フレームの模式図である。図1(a)はビット割当情報としてビット割当そのものを用いて生成した生成フレームを示しており、図1(b)及び(c)はビット割当情報としてビット割当の差分符号化データを用いて生成した生成フレームを示している。
本発明を適用しない場合、生成フレームを構成するビット割当情報としてはビット割当そのものを用いており、生成フレームは図1の(a)に示すようにビット割当ba及びサンプルmcにより構成される。一方、本発明の符号化装置では、ビット割当情報として現在フレームのビット割当と直前フレームのビット割当との差分をエントロピー符号化した差分符号化データhbaを用いる。よって、本発明により生成される生成フレームは、図1の(b)に示すように差分符号化データhba及びサンプルmcにより構成される。
{符号化装置の構成}
図2は、本発明の第1実施形態例に係る符号化装置である。以下に、第1実施形態例に係る符号化装置100の各部の構成について説明する。
(1)MDCT変換器
MDCT変換器11は、オーディオ信号などの入力データを変形離散コサイン変換処理(MDCT:Modified Discrete Cosine Transform)し、MDCT係数(図2中、mdctに相当:スペクトル信号とも言う)を生成する。このMDCT係数は、入力データの周波数スペクトルを表現する係数である。ここで、入力データはフレーム毎に入力され、MDCT変換器11はフレーム単位のMDCT係数を出力する。フレームとは、符号化・復号化の1単位処理において処理されるデータであり、1単位の処理ではこれまでのデータに加えて新たに1フレーム分の入力データを読み込み、処理を行うことで1フレーム分の新たなMDCT係数を算出する。本発明の第1実施形態例に係るMDCT変換器11では、変換処理を行うフレーム長が短い。つまり1フレーム内のサンプリング数が少ない。例えば、フレーム長が128サンプル以下であり、好ましくは64サンプル以下である。このように1フレームに含まれるサンプル数が少ないため、1フレーム分の入力データが蓄積されるのに要する時間が短く、1フレームの処理を開始するまでに要する遅延が少ない。よって、全体として符号化・復号化に要する時間を短縮することができる。以下、第1実施形態例では、フレーム毎に64サンプルのMDCT係数を生成しているものとする。
スケーリング部13は、MDCT係数を数本ずつ含むセグメントに1フレームを分割し、セグメントごとにスケールファクタ(図2中、scに相当)を算出するとともに、スケールファクタに基づいてセグメントごとにMDCT係数を正規化(図2中、正規化mdctに相当)する。ここで、スケールファクタとは、セグメント毎におけるMDCT係数の振幅の最大値に基づく値である。第1実施形態例では、2サンプルのMDCT係数を1セグメントとし、1フレームを32分割し32個のスケールファクタを算出している。
FFT部25は、入力データについてFFT(Fast Fourier Transform)による周波数スペクトルの計算を行って、例えば512点の周波数データを算出し心理聴覚分析器27に出力する。
(4)心理聴覚分析器
心理聴覚分析器27は、FFT部25からの算出結果に基づいて帯域毎のSMR(Signal to Masking Ratio)を決定し、ビット割当部15に出力する。以下、ビット割当の単位を帯域というものとする。ビット割当の単位である帯域とスケールファクタを算出する単位であるセグメントは、同じ単位であっても良いし異なっていても良い。
以下において、所望のビットレートのビットストリームを構成する1フレームのビット数を所望のビット数とする。まず、ビット割当部15は、所望のビット数よりも大きな目標ビット数を設定する。そして、ビット割当部15は、正規化MDCT係数及びSMRの入力を受けて、生成フレームが目標ビット数以下となるようにビット割当を行う。さらに、ビット割当部15は、決定したビット割当を後述の量子化器17及び差分符号化器19に出力する。差分符号化器19は、決定されたビット割当に基づいて差分符号化データを演算する。そして、比較部21は、その差分符号化データと、決定されたビット割当に基づいて量子化された量子化MDCT係数(図2中、mcに相当)と、スケールファクタと、後述のフラグ情報とを含んで生成される場合の生成フレームのビット数と、所望のビット数とを比較する。ビット割当部15は、比較部21での比較結果を受信し、比較結果に応じて、必要であれば再度ビット割当を行う。
差分符号化器19は、ビット割当部15から出力されるビット割当と直前フレームのビット割当との差分データをハフマン符号化して差分符号化データ(図中、hbaに相当)を算出する。さらに、差分符号化器19は、比較部21での比較結果に基づいて差分符号化データをビットストリーム生成部29に出力する。なお、差分符号化器19ではエントロピー符号化としてハフマン符号化を用いているが、これに限定されるものではない。ただし、ハフマン符号化を用いた場合には演算量を小さくできるので好ましい。
ビットストリームは、前述の通り後述のフラグ情報と、差分符号化データと、スケールファクタと、量子化MDCT係数とを含む生成フレームにより構成される。所望のビットレートを維持するためには、この生成フレームが所望のビット数以下である必要がある。よって、比較部21は、ビット割当部15からのビット割当と、差分符号化器19からの差分符号化データとを受信し、これらから生成されるであろう生成フレームのビット数を計算し、所望のビット数と比較する。なお、図2において、比較部21は、差分符号化データhbaを受信しているが、より詳細には差分符号化データhbaの長さに関する情報を受信している。また、ここでは、生成フレームがフラグ情報、ビット割当情報、スケールファクタ及び量子化MDCT係数により構成されるとしているが、その他のヘッダ情報などを含んでいても良い。さらに、以下において、フラグ情報及びスケールファクタに割り当てられるビット数は固定とする。
フラグ設定部23は、比較部21での比較結果を受信しフラグ情報(図2中、fに相当)を設定し、ビットストリーム生成部29に出力する。ここで、フラグ情報とは、フラグ情報、差分符号化データ、スケールファクタ及び量子化MDCT係数を含む生成フレームのビット数と1フレームの所望のビット数との比較結果を示す情報である。以下では、制限回数までに生成フレームのビット数が所望のビット数以下になった場合は、フラグ=“0”とする。一方、制限回数後においても生成フレームのビット数が所望のビット数より大きい場合は、フラグ=“1”とする。
量子化器17は、ビット割当部15からビット割当を受信し、スケーリング部13から正規化MDCT係数を受信する。そして、量子化器17は、正規化MDCT係数をビット割当に基づいて量子化し、量子化MDCT係数(図中、mcに相当)を生成する。ここで、量子化器17は、ビット割当部15から目標ビット数に基づくビット割当または所望のビット数に基づくビット割当を受信している。
ビットストリーム生成部29は、フラグ設定部23からフラグ情報を受信し、差分符号化器19またはビット割当部15からビット割当情報を受信し、スケーリング部13からスケールファクタを受信し、量子化器17から量子化MDCT係数を受信し、これらの情報に基づいてフレームを組み立ててビットストリームを生成する。より具体的には、制限回数までに生成フレームのビット数が所望のビット数以下になった場合は、ビットストリーム生成部29は、フラグ=“0”、差分符号化データ、スケールファクタ及び量子化MDCT係数に基づいてビットストリームを生成する。一方、制限回数後においても生成フレームのビット数が所望のビット数より大きい場合は、ビットストリーム生成部29は、フラグ=“1”、ビット割当、スケールファクタ及び量子化MDCT係数に基づいてビットストリームを生成する。
(1)全体処理
次に、第1実施形態例に係る符号化装置100の符号化処理全体の流れについて説明する。図3は、符号化処理の流れの概要を示すフローチャートの一例である。
ステップS10:MDCT変換器11は、入力データを受け付け変形離散コサイン変換処理してMDCT係数を生成し、スケーリング部13に出力する。
ステップS20、S25:FFT部25は入力データを解析して周波数データを算出する。心理聴覚分析器27は、その算出結果に基づいて帯域毎のSMRを決定してビット割当部15に出力する。
ステップS35:量子化器17は、正規化MDCT係数をビット割当部15から受信したビット割当に基づいて量子化し、量子化MDCT係数を生成する。
次に、前記ステップS30の比較結果に基づくビット割当処理について図4を用いて説明する。図4は、ビット割当処理の流れを示す模式図である。
着目するフレームを現在フレームnとし、現在フレームに対して直前のフレームを直前フレーム(n−1)とする。以下において、このnは現在フレームに関連する添字とし、(n−1)は直前フレームに関連する添字とする。例えば、直前フレームのビット割当をba(n−1)とする。また、所望のビットレートのビットストリームを構成する1フレームのビット数(所望のビット数)をXとする。
ステップS30b:ビット割当部15は、目標ビット数X+aに基づいてビット割当を決定する。つまり、決定されたビット割当に基づいて演算した差分符号化データと、決定されたビット割当に基づいて量子化された量子化MDCT係数と、スケールファクタと、フラグ情報とを含んで生成される場合の生成フレームのビット数が、目標ビット数X+a以下となるようにビット割当を決定する。このビット割当は、MPEG-1/Audio Layer 2と同様の方法で行われ、割当ビット数により変化するSNR(Signal to Nose Ratio)とSMRとからMNR(Masking to Noise Ratio)を計算し、MNRの小さい帯域から順にビットを割り当てる。
ステップS30e:一方、ビット割当部15は、生成フレームのビット数が所望のビット数Xより大きい場合は、前回設定した目標ビット数X+aよりも小さく、かつ所望のビット数Xよりも大きな目標ビット数X+bを設定する。そして、ビット割当部15は、再度設定された目標ビット数X+bに基づいてビット割当を決定する。
{復号化装置の構成}
図5は、本発明の第1実施形態例に係る復号化装置である。以下に、第1実施形態例に係る復号化装置200の各部の構成について説明する。
フレーム分解部51は、前述の符号化装置100からビットストリームをフレームごとに受信し、量子化MDCT係数と、それ以外のフラグ情報、帯域毎のビット割当情報及びセグメント毎のスケールファクタを含む副情報とに分解する。
(2)副情報復号化部
副情報復号化部53は、フレーム分解部51で分解された副情報を受信して、必要に応じて復号化し、ビット割当情報及びスケールファクタを逆量子化器55に出力する。ここで、副情報復号化部53は、まず各フレームの先頭に含まれるフラグ情報を解釈し、ビット割当情報として差分符号化データが含まれているかどうかを判断する。そして、フラグ=“0”である場合はビット割当情報として差分符号化データが含まれるため、副情報復号化部53はその差分符号化データを復号化してビット割当の差分データを取得する。副情報復号化部53は、この差分データに基づいて現在フレームのビット割当を算出し、逆量子化器55に出力する。なお、副情報復号化部53は、差分データから現在フレームのビット割当を算出するため、直前フレームのビット割当を記憶しているものとする。一方、フラグ=“1”である場合はビット割当情報として所望のビット数に基づくビット割当が含まれるため、副情報復号化部53はフレーム分解部51から受信した所望のビット数に基づくビット割当そのものを逆量子化器55に出力する。
逆量子化器55は、ビット割当情報及びスケールファクタに基づいて量子化MDCT係数を逆量子化し、逆量子化データを算出する。つまり、フラグ=“0”である場合は、逆量子化器55は、差分符号化データから算出されたビット割当に基づいて量子化MDCT係数を逆量子化する。一方、フラグ=“1”である場合は、逆量子化器55は、所望のビット数に基づくビット割当に基づいて量子化MDCT係数を逆量子化する。
(4)MDCT逆変換器 MDCT逆変換器57は、逆量子化されたMDCT係数を逆変形離散コサイン変換処理(IMDCT:Inverse Modified DiscreteCosine Transform)して出力信号を生成し出力する。
第1実施形態例によると、ビットストリームが差分符号化データと、量子化MDCT係数bit_と、スケールファクタと、フラグ情報とを含んで構成される。ここで、差分符号化データは、現在フレームと直前フレームとのビット割当の差分を符号化したものであり、ビット割当そのものよりもフレーム内において割り当てるビット数を少なくすることができる。よって、ビット割当情報に割り当てるビット数が少なくてすむので、その分だけ量子化スペクトルに割り当てるビット数を増加することができる。そのため、符号化及び復号化による遅延時間を短縮するためにフレーム長を短くしても、量子化スペクトルに割り当てられるビット数の減少を抑えることができ音質の劣化を防止することができる。
13:スケーリング部
15:ビット割当部
17:量子化器
19:差分符号化器
21:比較部
23:フラグ設定部
25:FFT部
29:ビットストリーム生成部
100:符号化装置
200:復号化装置
Claims (7)
- 時間関数としての入力データを所望のビットレート以内におさまるビットストリームにフレーム単位で符号化する符号化装置であって、
前記入力データを時間関数から周波数関数に変換してスペクトル信号を生成するスペクトル信号生成手段と、
前記スペクトル信号の心理聴覚分析を行い、帯域毎のビット割当を決定するビット割当手段と、
前記ビット割当手段により決定された現在フレームのビット割当と直前フレームのビット割当との差分データを演算し、前記差分データをエントロピー符号化して差分符号化データを算出する差分データ符号化器と、
前記スペクトル信号を前記ビット割当に基づいて量子化して量子化スペクトルを生成する量子化手段と、
前記差分符号化データ及び前記量子化スペクトルを含む生成フレームを生成し、前記生成フレームにより構成されるビットストリームを出力するビットストリーム出力手段とを含み、
前記ビット割当手段は、
前記所望のビットレートのビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きい第1目標ビット数を設定し、前記第1目標ビット数に基づいて第1ビット割当を決定し、
前記第1ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第1差分符号化データと、前記第1ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第1生成フレームのビット数が、前記所望のビット数より大きいか否かを比較し、
その比較結果において前記第1生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数よりも大きく前記第1目標ビット数よりも小さい第2目標ビット数を設定し、前記第2目標ビット数に基づいて第2ビット割当を決定し、前記第2ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第2差分符号化データと、前記第2ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第2生成フレームのビット数が、前記所望のビット数よりも大きいか否かを比較し、その比較結果に応じてさらなる目標ビット数を設定し、その目標ビット数に基づくビット割当の決定を繰り返す、符号化装置。 - 前記ビット割当手段は、前記目標ビット数に基づくビット割当の決定の繰り返しを所定の制限回数で終了する、請求項1に記載の符号化装置。
- 前記制限回数までに生成フレームのビット数が前記所望のビット数以下になった場合(以下、フラグ=“0”とする)と、前記制限回数後においても生成フレームのビット数が前記所望のビット数より大きい場合(以下、フラグ=“1”とする)とに応じてフラグを設定するフラグ設定手段をさらに含み、
前記ビットストリーム出力手段は、さらに前記フラグを含む生成フレームを生成し、
前記ビット割当手段は、
前記制限回数までに生成フレームのビット数が前記所望のビット数以下になった場合は、前記目標ビット数に基づくビット割当を前記差分データ符号化器に出力し、
前記制限回数後においても生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数に基づくビット割当を前記ビットストリーム出力手段に出力し、
前記ビットストリーム生成手段は、前記ビット割当手段での比較結果に応じて、前記フラグ=“0”と、前記差分符号化データと、前記量子化スペクトルとを含む生成フレームか、または前記フラグ=“1”と、前記所望のビット数に基づくビット割当と、前記量子化スペクトルとを含む生成フレームかのいずれかを生成し出力する、請求項2に記載の符号化装置。 - 前記差分データ符号化器によるエントロピー符号化はハフマン符号化である、請求項1または2に記載の符号化装置。
- 時間関数としての入力データを所望のビットレート以内におさまるビットストリームにフレーム単位で符号化する符号化方法であって、
前記入力データを時間関数から周波数関数に変換してスペクトル信号を生成するスペクトル信号生成ステップと、
前記スペクトル信号の心理聴覚分析を行い、前記帯域毎のビット割当を決定するビット割当ステップと、
前記ビット割当ステップにより決定された現在フレームのビット割当と直前フレームのビット割当との差分データを演算し、前記差分データをエントロピー符号化して差分符号化データを算出する差分データ符号化ステップと、
前記スペクトル信号を前記ビット割当に基づいて量子化して量子化スペクトルを生成する量子化ステップと、
前記差分符号化データ及び前記量子化スペクトルを含む生成フレームを生成し、前記生成フレームにより構成されるビットストリームを出力するビットストリーム出力ステップとを含み、
前記ビット割当ステップでは、
前記所望のビットレートのビットストリームを構成する1フレームのビット数(以下、所望のビット数)よりも大きい第1目標ビット数を設定し、前記第1目標ビット数に基づいて第1ビット割当を決定し、
前記第1ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第1差分符号化データと、前記第1ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第1生成フレームのビット数が、前記所望のビット数より大きいか否かを比較し、
その比較結果において前記第1生成フレームのビット数が前記所望のビット数より大きい場合は、前記所望のビット数よりも大きく前記第1目標ビット数よりも小さい第2目標ビット数を設定し、前記第2目標ビット数に基づいて第2ビット割当を決定し、前記第2ビット割当及び直前フレームのビット割当の差分データをエントロピー符号化した第2差分符号化データと、前記第2ビット割当に基づいて量子化された量子化スペクトルとを含んで生成される場合の第2生成フレームのビット数が、前記所望のビット数よりも大きいか否かを比較し、その比較結果に応じてさらなる目標ビット数を設定し、その目標ビット数に基づくビット割当の決定を繰り返す、符号化方法。 - 入力データを時間関数から周波数関数に変換して得られるスペクトル信号の心理聴覚分析の結果決定されるビット割当について、現在フレームと直前フレームとのビット割当の差分データを符号化した差分符号化データと、前記ビット割当に基づいて量子化された量子化スペクトルとを含むフレームから生成されたビットストリームを復号化する復号化装置であって、
前記ビットストリームのフレームを分解し、前記フレームから差分符号化データを含む副情報と量子化スペクトルとを分離するフレーム分解部と、
前記差分符号化データを含む副情報を復号化し、前記差分符号化データからビット割当を取得する副情報復号化部と、
前記ビット割当情報に基づいて前記量子化スペクトルを逆量子化する逆量子化器と、
を含む復号化装置。 - 入力データを時間関数から周波数関数に変換して得られるスペクトル信号の心理聴覚分析の結果決定されるビット割当について、現在フレームと直前フレームとのビット割当の差分データを符号化した差分符号化データと、前記ビット割当に基づいて量子化された量子化スペクトルとを含むフレームから生成されたビットストリームを復号化する復号化方法であって、
前記ビットストリームのフレームを分解し、前記フレームから差分符号化データを含む副情報と量子化スペクトルとを分離するフレーム分解ステップと、
前記差分符号化データを含む副情報を復号化し、前記差分符号化データからビット割当を取得する副情報復号化ステップと、
前記ビット割当情報に基づいて前記量子化スペクトルを逆量子化する逆量子化ステップと、
を含む復号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005050005A JP4573670B2 (ja) | 2005-02-25 | 2005-02-25 | 符号化装置、符号化方法、復号化装置及び復号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005050005A JP4573670B2 (ja) | 2005-02-25 | 2005-02-25 | 符号化装置、符号化方法、復号化装置及び復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006235253A true JP2006235253A (ja) | 2006-09-07 |
JP4573670B2 JP4573670B2 (ja) | 2010-11-04 |
Family
ID=37042967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005050005A Active JP4573670B2 (ja) | 2005-02-25 | 2005-02-25 | 符号化装置、符号化方法、復号化装置及び復号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4573670B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200012861A (ko) * | 2017-04-25 | 2020-02-05 | 디티에스, 인코포레이티드 | 디지털 오디오 신호에서의 차분 데이터 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0895598A (ja) * | 1994-09-26 | 1996-04-12 | Nec Corp | 帯域分割符号化装置 |
JP2001094433A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
JP2002189500A (ja) * | 2000-12-21 | 2002-07-05 | Nippon Columbia Co Ltd | オーディオ信号符号化方法及びオーディオ信号符号化装置及びオーディオ信号符号化プログラムが記録された記録媒体 |
JP2002268693A (ja) * | 2001-03-12 | 2002-09-20 | Mitsubishi Electric Corp | オーディオ符号化装置 |
JP2003066998A (ja) * | 2001-08-28 | 2003-03-05 | Mitsubishi Electric Corp | 音響信号符号化装置 |
-
2005
- 2005-02-25 JP JP2005050005A patent/JP4573670B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0895598A (ja) * | 1994-09-26 | 1996-04-12 | Nec Corp | 帯域分割符号化装置 |
JP2001094433A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
JP2002189500A (ja) * | 2000-12-21 | 2002-07-05 | Nippon Columbia Co Ltd | オーディオ信号符号化方法及びオーディオ信号符号化装置及びオーディオ信号符号化プログラムが記録された記録媒体 |
JP2002268693A (ja) * | 2001-03-12 | 2002-09-20 | Mitsubishi Electric Corp | オーディオ符号化装置 |
JP2003066998A (ja) * | 2001-08-28 | 2003-03-05 | Mitsubishi Electric Corp | 音響信号符号化装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200012861A (ko) * | 2017-04-25 | 2020-02-05 | 디티에스, 인코포레이티드 | 디지털 오디오 신호에서의 차분 데이터 |
CN110870005A (zh) * | 2017-04-25 | 2020-03-06 | Dts公司 | 数字音频信号中的差异数据 |
EP3616325A4 (en) * | 2017-04-25 | 2020-12-09 | DTS, Inc. | DIFFERENTIAL DATA IN DIGITAL AUDIO SIGNALS |
CN110870005B (zh) * | 2017-04-25 | 2023-12-12 | Dts公司 | 编码系统和解码系统 |
KR102615901B1 (ko) | 2017-04-25 | 2023-12-19 | 디티에스, 인코포레이티드 | 디지털 오디오 신호에서의 차분 데이터 |
Also Published As
Publication number | Publication date |
---|---|
JP4573670B2 (ja) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6170520B2 (ja) | オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置 | |
CN108831501B (zh) | 用于带宽扩展的高频编码/高频解码方法和设备 | |
JP5175028B2 (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
CN107025909B (zh) | 能量无损编码方法和设备以及能量无损解码方法和设备 | |
JP5413839B2 (ja) | 符号化装置および復号装置 | |
JP2019191594A (ja) | 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法 | |
KR100848324B1 (ko) | 음성 부호화 장치 및 그 방법 | |
CN111179946B (zh) | 无损编码方法和无损解码方法 | |
JPWO2006049204A1 (ja) | 符号化装置、復号化装置、符号化方法及び復号化方法 | |
WO2013168414A1 (ja) | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 | |
WO2006041055A1 (ja) | スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法 | |
JP5355387B2 (ja) | 符号化装置および符号化方法 | |
US20130226598A1 (en) | Audio encoder or decoder apparatus | |
EP3550563B1 (en) | Encoder, decoder, encoding method, decoding method, and associated programs | |
WO2004044891A1 (ja) | 音楽情報符号化装置及び方法、並びに音楽情報復号装置及び方法 | |
WO2011045926A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
Yu et al. | A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding | |
JP4573670B2 (ja) | 符号化装置、符号化方法、復号化装置及び復号化方法 | |
JP2004246038A (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
JP2007004050A (ja) | ステレオ信号の符号化装置及び符号化プログラム | |
JP2008026372A (ja) | 符号化データの符号化則変換方法および装置 | |
JP2005026940A (ja) | デジタルデータ符号化装置 | |
JPH0918348A (ja) | 音響信号符号化装置及び音響信号復号装置 | |
KR20140037118A (ko) | 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100803 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4573670 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |