JP2008107629A - オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム - Google Patents

オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム Download PDF

Info

Publication number
JP2008107629A
JP2008107629A JP2006291299A JP2006291299A JP2008107629A JP 2008107629 A JP2008107629 A JP 2008107629A JP 2006291299 A JP2006291299 A JP 2006291299A JP 2006291299 A JP2006291299 A JP 2006291299A JP 2008107629 A JP2008107629 A JP 2008107629A
Authority
JP
Japan
Prior art keywords
frame
frequency component
similar
difference
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006291299A
Other languages
English (en)
Other versions
JP4888048B2 (ja
Inventor
Masayuki Ueda
雅之 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006291299A priority Critical patent/JP4888048B2/ja
Publication of JP2008107629A publication Critical patent/JP2008107629A/ja
Application granted granted Critical
Publication of JP4888048B2 publication Critical patent/JP4888048B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】符号化効率が高く、かつ、符号化処理遅延、復号化処理遅延の小さい、オーディオ信号符号化復号化技術を提供。
【解決手段】周波数領域に変換されたーディ信号の符号化対象フレームと類似した先行フレームを探索する。類似したクレームが探索された場合には、この類似フレームを示す情報と、符号化対象フレームと類似フレームとの周波数成分の差を示す情報とを符号化する。類似フレームが探索されなかった場合には、符号化対象フレームの周波数成分を符号化する。
【選択図】 図1

Description

本発明は、オーディオ信号の符号化復号化技術に関し、特にオーディオ信号のもつ周期性を利用した符号化復号化技術に関する。
iPodなどのデジタル音楽Playerが普及するにつれて、聴覚上の音質を劣化させること無く、1曲当たりのファイルサイズを抑え、Playerに搭載されるメモリに保存できる曲数を増加させることが望まれている。この技術では、楽曲の聴感上の音質を落とさず、1つのコンテンツ(楽曲)あたりの符号量を抑えることが望まれる。
この要請に応える技術として、特開2005−292640(特許文献1)記載の技術が知られている。
この特許文献1記載の技術では、符号化側は、オーディオ信号を例えば、2ミリ秒程度のフレームに区切り、フレーム単位で、オーディオ信号を符号化する。この符号化の前処理として、符号化側は、ます、全フレームを、独立フレームと、予測フレームに分類する。ここで、独立フレームは、他のフレームのオーディオ信号を参照することなく、そのフレーム内のオーディオ信号が符号化されるフレームである。予測フレームは、そのフレーム内のオーディオ信号が、独立フレームのオーディオ信号を基とした予測符号化を用いて符号化されるフレームである。この分類が終了すると、符号化側は、まず、独立フレームを符号化し、その後に、予測フレームの予測符号化を行う。
特許文献1の復号化側では、まず、独立フレームを復号化し、次に、この独立フレームの再生オーディオ信号を用いて、予測フレームの予測誤差信号を予測復号化する。
この特許文献1の技術では、時間的に過去のフレーム内のオーディオ信号のみならず未来の独立クレーム内のオーディオ信号をも用いて、予測フレームのオーディオ信号を予測符号化できる。したがって、この特許文献1の技術は、高い符号化効率を提供する。
特開2005−292640
しかしながら、特許文献1記載の技術は、符号化処理の処理遅延、復号化処理の処理遅延が大きいという不具合がある。この理由は、次の通りである。
この従来技術では、符号化装置は、まず全フレームを独立フレームと予測フレームに分類し、次に、独立フレームの符号化し、最後に予測フレームを予測符号化する。このため、符号化側は、フレームの並び替えを行う必要がある。これらの分類及びフレーム並び替えは、符号化処理の処理遅延を大きくする。
また、この従来技術では、復号化装置は、まず、独立フレームを復号化し、次に予測フレームを予測復号化し、最後に復号化された独立フレームと復号化された予測フレームを、並び替えてオーディオ信号を再生する。このため、復号化側も、フレームの並び替えを行う必要がある。このフレーム並び替えは、復号化処理の処理遅延を大きくする。
本発明の目的は、符号化能率が高く、符号化処理遅延、復号化処理遅延の小さい、オーディオ信号符号化復号化技術を提供することにある。
本発明の1側面において、符号化側は、周波数領域に変換されたーディ信号の符号化対象フレームと類似した先行フレームを探索する。類似したフレームが探索された場合には、符号化側は、この類似フレームを示す番号と、符号化対象フレームと類似フレームとの周波数成分の差を示す情報とを符号化する。類似フレームが探索されなかった場合には、符号化側は、符号化対象フレームの周波数成分を符号化する。
また、復号化側は、類似フレーム情報が付加されていないフレームについては、符号化された周波数成分情報を復号化し、復号化された周波数成分を、逆周波数変換する。また、復号化側は、類似フレーム情報が付加されたフレームについては、符号化された周波数成分差分情報を復号化し、この復号化された周波数成分を類似フレーム番号の周波数成分に加算し、そのフレームの周波数成分情報を復元し、この復元された周波数成分を逆周波数変換する。
このように本発明の1側面ば、符号化対象フレームに類似した先行フレームを探索し、符号化対象フレームと類似フレームとの周波数成分差分データを符号化している。類似したフレーム間での差分信号は、通常の信号よりも小さくなる。このため、この1側面は、聴感上の音質を落とすことなく、全体の符号量を抑えることができる。
また、本発明の1側面は、類似フレームを、符号化対象フレームに先行するフレームのみから探索しているので、フレーム単位でのオーディオデータの並び替えは不要である。これは、符号化処理遅延のみならず、復号化処理遅延をも小さくする。
次に、本発明の実施形態に関わる符号化装置が、図1を参照して、説明される。図1は、符号化装置100の構成を示すブロック図である。
図1に示されたとおり、符号化装置100は、入力バッファ101と、周波数変換器102と、正規化部103と、差分信号抽出処理部104と、差分信号閾値処理部105と、量子化/符号化処理部106と、出力メモリ107とからなる。
以下では、符号化開始時には、1曲分のオーディオ信号(PCM信号)が、入力バッファ102に蓄積されているものとして説明する。
周波数変換器102は、入力バッファ201から所定の時間単位、例えば、2ミリ秒単位で、オーディオ信号を読みだし、このオーディオ信号を周波数変換する。この所定単位がオーディオ信号のフレームとなる。この周波数変換されたデータには、フレーム番号が付加され、フレーム単位の周波数変換されたオーディオデータが作成され、正規化部103に供給される。この周波数変換としては、フーリエ変換、ディスクリートコサイン変換(DCT)、モディファイドディスクリートコサイン変換(MDCT)等が使用可能である。なお、周波数変換されたオーディオ信号、即ち、周波数成分データが入力バッファの蓄積される場合には、この周波数変換機102が不要となることはいうまでもない。
正規化部103は、供給された周波数成分データは、フレーム単位正規化される。この正規化は、フレーム内のピーク周波数成分のレベルに応じて、行われる。この正規化に使用された正規化係数は、量子化/符号化処理部106に供給される。正規化された周波数変換周波数成分データX(k)(k=0、1、・・・、K−1)は、差分信号抽出処理部104に供給される。
この正規化処理は、例えば、異なるフレームの間でオーディオ信号が、同一音階、同一音色で、その振幅のみが異なる場合に、予測効率を特に高めるのに貢献する。
なお、正規化された周波数成分データが、既に、入力バッファ101に格納されている場合には、周波数変換器102及び正規化部103が不要となることはいうまでもない。
差分信号抽出処理部104は、直前のフレーム以前のフレーム内の正規化された周波数成分データの中から、現符号化対象フレームの正規化された周波数成分データと類似した周波数成分データを探索する。
この探索は、例えば、次の(1)式の計算を、適宜の数の先行フレームについて行うことにより、行うことができる。
Figure 2008107629
ここで、Xdiffは相違度を示し、その値が小さいほど類似度が高いことを示す。X(k)は、k番目の正規化された周波数成分データを示す。Xreference(k)は、先行フレームのk番目の正規化された周波数成分データを示す。Nは、1フレームあたりの周波数成分数を示す。
差分信号抽出処理部104は、(1)式の計算結果が閾値(T)以下となった先行フレームが探索できなかった場合には、類似フレームなしと判断する。また、差分信号抽出処理部104は、(1)式の計算結果がT以下となる先行フレームを少なくとも1つ検出できた場合には、検出された先行フレームの中から1つを、類似フレームとして選択する。
差分信号抽出処理部104は、現符号化対象フレームと類似する先行フレームを探索できなかった場合には、この符号化対象フレームを、一般フレーム(general frame;Gフレーム)と判定する。そして、差分信号抽出処理部104は、この符号化対象フレームがGフレームである旨を示すフラッグと、この符号化対象フレームの正規化された周波数成分データを、差分閾値処理部105に供給する。
差分信号抽出処理部104は、現符号化対象フレームと類似する先行フレームを探索できた場合には、この符号化対象フレームを、差分フレーム(differential frame;Dフレーム)と判定する。そして、差分信号抽出処理部104は、この符号化対象フレームがDフレームである旨を示すフラッグを、差分閾値処理部105に供給する。また、差分信号抽出処理部104は、この符号化対象フレームと類似した先行フレームのフレーム番号、即ち類似フレーム番号を、差分閾値処理部105に供給する。さらに、差分信号抽出処理部104は、この符号化対象フレームの正規化された周波数成分データと類似フレーム番号の正規化された周波数成分データとの差分信号である、周波数成分差分データを、差分閾値処理部105に供給する。符号化対象フレームと類似した先行フレームは1つとは限らないが、差分閾値処理部105へ供給される類似フレーム番号は、符号化対象フレームと最も類似した先行フレームのフレーム番号であることが好ましい。
なお、Gフレーム、Dフレームの種別を示すフラッグは、差分閾値処理部105を介して、量子化/符号化処理部106にも供給される。
差分閾値処理部105は、供給されたデータがGフレームである場合には、供給された周波数成分データ及びGフレームを示すフラグを、そのまま、量子化/符号化処理部106に転送する。
差分閾値処理部105は、供給されたデータがDフレームである場合には、供給された周波数成分差分データを、差分閾値(DT)と比較する。そして、DTより小さい値の周波数成分差分データを値ゼロに置き換える。この差分閾値処理が施された周波数成分差分データは、量子化/符号化処理部106に供給される。また、差分閾値処理部105は、差分信号抽出処理部から供給されたフラグ(Dフレームを示す)と類似フレーム番号とを、そのまま、量子化/符号化処理部106に供給する。なお、本実施例において、この差分閾値処理を行わない場合には、この差分閾値処理部105が不要となることはいうまでもない。
量子化/符号化処理部106は、この差分閾値処理部105から供給された周波数成分データまたは周波数成分差分データを符号化し、符号化された周波数成分データまたは符号化された周波数成分差分データを生成する。
量子化/符号化処理部106は、このフレームが、Gフレームに対応する場合には、この差分閾値処理部105から供給された周波数成分データを符号化し、符号化された周波数成分データを生成する。そして、量子化/符号化処理部106は、フレーム番号と、フラグと、正規化係数と、m符号化された周波数成分データとから、図2に例示したGフレームを作成し、出力メモリ107に格納する。
図2において、「フレーム番号」は、このフレームのフレーム番号を示し、「FT」は、フレームの種別(この場合はGフレーム)を示し、「正規化係数」は正規化部103から供給された正規化係数を示し、「周波数成分データ」は、符号化された周波数成分データを示している。
また、量子化/符号化処理部106は、このフレームが、Dフレームに対応する場合には、この差分閾値処理部105から供給された周波数成分差分データを符号化し、符号化された周波数成分差分データを生成する。そして、量子化/符号化処理部106は、フレーム番号と、フラグと、正規化係数と、類似フレーム番号と、符号化された周波数成分データとから、図3に例示されたDフレームを作成し、出力メモリ107に格納する。
図3において、「フレーム番号」は、このフレームのフレーム番号を示し、「FT」は、フレームの種別(この場合はDフレーム)を示し、「類似フレーム番号」は差分信号抽出処理部で選択された先行フレームのフレーム番号を示し、「正規化係数」は正規化部103から供給された正規化係数を示し、「周波数成分差分データ」は、符号化された周波数成分差分データを示している。
このように、図1の符号化装置は、符号化対象フレームに類似した先行フレームを探索し、符号化対象フレームと類似フレームとの周波数成分差分データを符号化している。類似したフレーム間での差分信号は、周波数成分よりも小さくなる。このため、図1の符号化装置は、聴感上の音質を落とすことなく、全体の符号量を抑えることができる。
また、図1の符号化装置は、ある周波数成分において、その周波数成分差分データが、差分閾値(DT)以下の場合、その差分データ0(類似フレームと同一成分)として扱うことにより、更に符号量を抑えることが可能である。この閾値をゼロとして、全ての差分成分を符号化すれば、ロスレス符号化が実現できる。つまり、ロスレスからロッシー符号化を差分閾値(DT)の変更だけでシームレスに対応できる。
さらに、図1の符号化装置は、類似フレームを、符号化対象フレームに先行するフレームのみから探索しているので、フレーム単位でのオーディオデータの並び替えは不要である。これは、符号化装置の符号化遅延を小さくする。
次に、図4を参照して、本発明の実施形態にかかる復号化装置が、説明される。図4は、復号化装置200の構成を示すブロック図である。
図4に示されたとおり、復号化装置200は、入力バッファ201と、復号化処理部202と、加算処理部203と、逆正規化部204と、周波数逆変換器205と、出力メモリ206とからなる。
復号化開始時には、入力バッファ201は、図1の符号化装置で生成されたGフレーム及びDフレームを、所定のフレーム数だけ格納しているものとする。
復号化処理部202は、入力バッファから、GフレームあるいはDフレームを、フレーム番号順に1フレームずつ読み出す。まず、復号化処理部202は、読み出したフレームから、フレーム種別情報(図2、図3の「TYPE」)及び正規化係数を分離する。このフレーム種別情報は、加算処理部204に供給される。この正規化係数は、逆正規化部204に供給される。また、復号化処理部202は、そのフレームがDフレームである場合には、類似フレーム番号を、加算処理部204に供給する。さらに、復号化処理部202は、符号化された周波数成分データまたは符号化された周波数成分差分データを復号し、復号結果を、加算処理部204に供給する。
加算処理部203は、フレーム種別情報がGフレームを示している場合には、復号化処理部203から供給された周波数成分データを、そのまま逆正規化部204に供給する。また、加算処理部203は、この周波数成分データを、そのフレームのフレーム番号とともに記憶する。
また、加算処理部203は、フレーム種別情報がDフレームを示している場合には、復号化処理部203から供給される復号化対象フレームの周波数成分差分データを、類似フレームの周波数データと加算し、この復号化対照フレームの周波数成分データを再生する。加算処理部203は、この再生された周波数成分データを、逆正規化部204に供給する。また、加算処理部203は、この周波数成分データを、そのフレームのフレーム番号とともに記憶する。
逆正規化部204は、加算処理部から供給された周波数成分データに、復号化処理部202から供給された正規化係数を乗算する。この乗算結果は、周波数逆変換器205に供給される。
周波数逆変換器205は、逆正規化部から供給される逆正規化された周波数成分データを逆変換し、時間領域のオーディオ信号を再生し、出力メモリ208に格納する。この出力メモリ206に格納された時間領域のオーディオ信号は、オーディオ再生装置等の要求に応じて、読み出される。
なお、この復号化装置において、逆正規化部204は、復号化処理部202と加算処理部203との間に設けられていてもよいことは明らかであろう。
このように、図4の復号化装置は、フレーム番号順に、復号処理を実行するので、復号化装置内部でのフレーム並び替え処理を必要としないので、復号化遅延が少ない。したがって、本実施例に係る復号化装置は、図1の符号化装置と連携して、特許文献1では回避できなかった問題を解決する。
次に、図5及び図6のフローチャートを参照して、図1の符号化装置及び図4の復号化装置を、コンピュータにより実現するためのプログラムにつき、説明される。図5は、図1の符号化装置をコンピュータにより実現するためのプログラムを説明するためのフローチャートである。図6は、図4の復号化装置をコンピュータにより実現するためのプログラムを説明するためのフローチャートである。
まず、図5につき説明される。図5において、ステップS11以下のステップが実行される前に、所定フレーム数のオーディオデータが、図1の入力バッファに格納されているものとする。コンピュータの中央処理装置(CPU)は、図5のステップS11からステップS19で、図1の周波数変換器102から量子化/符号化処理部106までの処理と同等の処理を、実行する。
ステップS11で、CPUは、図1の入力バッファから、1フレーム分のオーディオデータを読み出す。この際に、CPUは、この読み出されたデータに、フレーム番号を付与する。
次に、ステップS12で、CPUは、1フレームのオーディオデータを周波数領域に変換する。ステップS13では、CPUは、この周波数領域データを、前述したとおりの手法で正規化し、周波数成分データを生成する。CPUは、この正規化に使用された正規化係数を、レジスタ等に記憶する。また、CPUは、この正規化された周波数成分データを、フレーム番号と共に、内部メモリ等に、記憶する。
ステップS14では、CPUは、過去のフレームの正規化された周波数成分データの中に、現フレームの正規化された周波数成分データと類似したデータを有するフレームがあるか否かをサーチする。CPUは、このサーチを、前述の(1)式を過去のフレームにつき計算することにより行う。なお、この過去のフレームとの類似度計算は、符号化対象フレームの直前のフレームから、例えば、100フレーム程度までの過去のフレームにつき、類似度計算の範囲を制限してもよい。また、オーディオ信号のピッチ周波数を別途求めておき、このピッチ周波数に基づいて、サーチ対象とする過去のフレームを決定することにより、類似フレーム探索のための所要演算量を減らすこともできる。
ステップS15では、CPUは、ステップS14の実行結果に基づき、類似フレームの有無を判定する。類似したフレームがない場合には、現フレームに、Gフレームを示すフラグをセットする。そして、CPUの処理は、ステップS18に進む。類似フレームがある場合には、CPUの処理は、ステップS16に進む。
ステップS16では、CPUは、類似フレームを1つ、好ましくは、最類似フレームを選択する。そして、CPUは、選択した類似フレームのフレーム番号を、レジスタに記憶する。また、CPUは、現フレームの正規化された周波数成分データと類似フレームの正規化された周波数成分データとの差信号である、周波数成分差分データを計算する。この後、CPUの処理は、ステップS17に進む。
ステップS17では、CPUは、前述した差分閾値処理を行う。この際に、この差分閾値(DT)は、固定値でもよいが、この差分閾値を、再生音声信号に要求される品質に応じて可変とすることもできる。例えば、本実施例は、差分閾値(DT)をゼロにした場合、全ての周波数成分差分データを符号化することになり、ロスレス符号化に近い符号化が実現できる。即ち、本実施例は、この差分閾値を変えるだけで、ロスレスからロッシー(lossy)符号化までをシームレスにカバーできる。この後、CPUの処理は、ステップS18に進む。
ステップS18では、CPUは、現フレームが、Gフレームの場合には、正規化された周波数成分データに、量子化及び符号化を施し、オーディオ信号信号自体のビットストリーム(図2の「周波数成分データ」)を生成する。また、CPUは、図2に示されたGフレームを作成し、図1の出力メモリ107に書き込む。
また、ステップS18では、CPUは、現フレームが、Dフレームの場合には、正規化された周波数成分差分データに、量子化及び符号化を施し、オーディオ信号信号自体のビットストリーム(図3の「周波数成分差分データ」)を生成する。また、CPUは、図3に示されたDフレームを作成し、図1の出力メモリ107に書き込む込む。
ステップS19では、CPUは、最終フレームへの処理が終了したか否かを判定する。この判定結果が、“Yes”の場合には、CPUは、符号化処理を終了する。そうでない場合には、CPUの処理は、ステップS11に戻り、次のフレームのオーディオ信号の符号化処理を行う。
次に、図6が説明される。図6は、図4の復号化装置をコンピュータにより実現するためのプログラムを説明するためのフローチャートである。
図6において、ステップS21以下が実行される前に、所定フレーム数の図1の符号化装置で作成された符号化データが、図4の入力バッファ201に格納されているものとする。CPUは、図6のステップS21からステップS26で、図4の復号化処理部202から周波数逆変換器206までの処理と同等の処理を、実行する。
ステップS21において、CPUは、図4の入力バッファ201から、1フレームの符号化データを読み出す。この符号化データは、図2または図3に示されたフォーマットである。
CPUは、この読み出されたデータから、フレーム番号、フレーム種別(TYPE)及び正規化係数を読み出し、各々の値を、レジスタ等にセットする。このフレームがDフレームの場合には、類似フレーム番号を抽出し、この値をレジスタにセットする。
また、CPUは、そのフレームがGフレームの場合には、正規化された周波数成分データを復元し、フレーム番号と対応付けて内部メモリ等に記憶する。そのフレームがDフレームの場合には、正規化された周波数成分差分データを復元し、、フレーム番号と対応付けて内部メモリ等に記憶する。
ステップS22では、CPUは、現フレームがGフレーム、Dフレームのいずれであるかを判定する。Gフレームである場合には、CPUの処理は、ステップS24に進む。Dフレームである場合には、CPUの処理は、ステップS23に進む。
ステップS23では、CPUは、現フレームの正規化された周波数成分差分データと、類似フレーム番号に対応する正規化された周波数成分差分データとを加算し、現フレームの正規化された周波数成分データを復元する。この復元された周波数成分データは、フレーム番号と対応付けられて、内部メモリに格納される。
ステップS24では、CPUは、ステップS21またはステップS23で復元された正規化された周波数成分データを逆正規化し、現フレームの周波数成分データを、復元する。
なお、このステップS24の逆正規化処理は、ステップS21で行ってもよい。この場合には、CPUは、ステップS21では、Gフレームにおいては、逆正規化後の周波数成分データを復元し、Dフレームにおいては、逆正規化後の周波数成分差分データを復元することになる。
ステップS25では、CPUは、現フレームの復元された周波数成分データに、逆周波数変換処理を施し、オーディオ信号を再生する。
ステップS26では、CPUは、全てのフレームについて、復号処理が終了したか否かうを判定する。この判定結果が“NO”の場合には、CPUの処理はステップS21に戻り、後続するフレームの復号処理を行う。この判定結果が“YES”の場合には、CPUは、復号処理を終了する。
本発明の実施形態にかかる符号化装置の構成例を示すブロック図である。 本発明におけるGフレームの例を示す図である。 本発明におけるDフレームの例を示す図である。 本発明の実施形態にかかる復号化装置の構成例を示すブロック図である。 図1の符号化装置をコンピュータで実現するためのプログラムを説明するためのフローチャートである。 図4の復号化装置をコンピュータで実現するためのプログラムを説明するためのフローチャートである。
符号の説明
100 符号化装置
101 入力バッファ
102 周波数変換器
103 正規化部
104 差分信号抽出処理部
105 差分信号閾値処理部
106 量子化/符号化処理部
107 出力メモリ
200 復号化装置
201 入力バッファ
202 復号化処理部
203 加算処理部
204 逆正規化部
205 周波数逆変換器
206 出力メモリ

Claims (23)

  1. 下記、(A)―(C)のステップを含むオーディオ信号符号化方法。
    (A)周波数領域に変換されたオーディオ信号の符号化対象フレームと類似した先行フレームを探索し、
    (B)類似したクレームが探索された場合には、符号化対象フレームのフレーム番号と、この類似フレームを示す情報と、符号化対象フレームと類似フレームとの周波数成分の差を示す情報とを符号化し、
    (C)類似フレームが探索されなかった場合には、符号化対象フレームのフレーム番号と、符号化対象フレームの周波数成分を符号化する。
  2. 前記前記周波数変換されたオーディオ信号を、そのフレームのピーク値に基づいて正規化するステップと、
    この正規化係数を符号化するステップ
    とをさらに備えた請求項1に記載のオーディオ信号符号化方法。
  3. 請求項1に記載の符号化方法において、前記ステップ(A)は、
    その周波数成分と符号化対象フレームの周波数成分との2乗和が所定の閾値以下となる先行フレームが探索された場合には、類似フレーム有りと判定する。
  4. 請求項2に記載の符号化方法において、前記ステップ(A)は、
    その正規化された周波数成分と符号化対象フレームの正規化され周波数成分との2乗和が所定の閾値以下となる先行フレームが探索された場合には、類似フレーム有りと判定する。
  5. 請求項1から4に記載の符号化方法において、前記ステップ(B)は、
    符号化対象フレームの周波数成分に最も類似した周波数成分を有する先行フレームを、前記類似フレームとする。
  6. フレーム番号とそのフレームの周波数成分情報とを含む一般フレーム(Gフレーム)と、フレーム番号と類似フレーム番号とそのフレームと類似フレーム番号との差分周波数成分情報を含む差分フレーム(Dフレーム)とが混在するビットストリームからオーディオ信号を復号化するオーディオ信号復号化方法であり、下記のステップ(A)−(C)を含むオーディオ信号復号化方法。
    (A)現フレームがGフレームである場合には、前記周波数成分情報を復号化して周波数成分データを復元し、
    (B)現フレームがDフレームである場合には、
    前記差分周波数成分情報を復号化して、現フレームの差分周波数成分を復号して周波数成分データを得、
    復号された現フレームの差分周波数成分を、前記類似フレームの周波数成分とから現フレームの周波数成分を復元し、
    (C)前記ステップ(A)、(B)で復元された周波数成分を逆変換し、現フレームのオーディオ信号を生成する。
  7. 請求項6記載のオーディオ信号復号化方法において、
    前記Gフレーム及びDフレームは正規化係数を更に含み、また前記Gフレームはこの正規化係数に基づいて正規化された周波数成分データを前記周波数成分情報として含み、前記Dフレームは、この正規化係数に基づいて正規化された差分周波数データを、前記周波数成分差分データとして含み、
    前記方法は、
    この正規化係数に基づいて、前記復元された周波数成分を逆正規化し、前記ステップ(C)に供給するステップ
    をさらに備える。
  8. 請求項6記載のオーディオ信号復号化方法において、
    前記Gフレーム及びDフレームは正規化係数を更に含み、また前記Gフレームはこの正規化係数に基づいて正規化された周波数成分データを前記周波数成分情報として含み、前記Dフレームは、この正規化係数に基づいて正規化された差分周波数データを、前記周波数成分差分データとして含み、
    前記ステップ(A)は、この正規化係数に基づいて、前記周波数成分データを逆正規化して前記周波数成分データを復元し、
    前記ステップ(B)は、この正規化係数に基づいて、前記周波数成分差分情報を逆正規化し、逆正規化された周波数成分差分情報に基づいて前記周波数成分を復元する。
  9. 周波数領域に変換されたオーディオ信号の符号化対象フレームと類似した先行フレームを探索する探索部と;
    類似したクレームが探索された場合には、符号化対象フレームのフレーム番号と、この類似フレームを示す情報と、符号化対象フレームと類似フレームとの周波数成分の差を示す情報とを符号化し、 類似フレームが探索されなかった場合には、符号化対象フレームのフレーム番号と、符号化対象フレームの周波数成分を符号化する符号化部;
    とを備えたオーディオ信号符号化装置。
  10. 前記前記周波数変換されたオーディオ信号を、そのフレームのピーク値に基づいて正規化する正規化部を更に備え、
    前記符号化部は、この正規化係数をさらに「符号化する
    請求項9に記載のオーディオ信号符号化装置。
  11. 請求項9に記載の符号化装置において、
    前記探索部は、その周波数成分と符号化対象フレームの周波数成分との2乗和が所定の閾値以下となる先行フレームが探索された場合には、類似フレーム有りと判定する。
  12. 請求項10に記載の符号化装置において、
    前記探索部は、正規化された周波数成分と符号化対象フレームの正規化され周波数成分との2乗和が所定の閾値以下となる先行フレームが探索された場合には、類似フレーム有りと判定する。
  13. 請求項9から12に記載の符号化装置において、
    前記符号化部は、
    符号化対象フレームの周波数成分に最も類似した周波数成分を有する先行フレームを、前記類似フレームとする。
  14. フレーム番号とそのフレームの周波数成分情報とを含む一般フレーム(Gフレーム)と、フレーム番号と類似フレーム番号とそのフレームと類似フレーム番号との差分周波数成分情報を含む差分フレーム(Dフレーム)とが混在するビットストリームからオーディオ信号を復号化するオーディオ信号復号化装置であり、
    現フレームがGフレームである場合には、前記周波数成分情報を復号化して周波数成分データを復元し、 現フレームがDフレームである場合には、
    前記差分周波数成分情報を復号化しフレームの差分周波数成分を復号して周波数成分データを得る復号化部と;
    現フレームがGフレームである場合には、復号された現フレームの差分周波数成分を、前記類似フレームの周波数成分とから現フレームの周波数成分を復元する加算処理部と、
    前記復号化部または前記加算処理部で復元された周波数成分を逆変換し、現フレームのオーディオ信号を生成する逆変換部;
    とからなるオーディオ信号復号化装置。
  15. 請求項14記載のオーディオ信号復号化総理において、
    前記Gフレーム及びDフレームは正規化係数を更に含み、また前記Gフレームはこの正規化係数に基づいて正規化された周波数成分データを前記周波数成分情報として含み、前記Dフレームは、この正規化係数に基づいて正規化された差分周波数データを、前記周波数成分差分データとして含み、
    前記復号化部は、
    この正規化係数に基づいて、前記復元された周波数成分を逆正規化する逆正規化部を含む。
    をさらに備える。
  16. コンピュータにオーディオ信号復号化処理を実行させるためのプログラムであり、前記プログラムは、下記、(A)―(C)のステップを含む。
    (A)周波数領域に変換されたオーディオ信号の符号化対象フレームと類似した先行フレームを探索し、
    (B)類似したクレームが探索された場合には、符号化対象フレームのフレーム番号と、この類似フレームを示す情報と、符号化対象フレームと類似フレームとの周波数成分の差を示す情報とを符号化し、
    (C)類似フレームが探索されなかった場合には、符号化対象フレームのフレーム番号と、符号化対象フレームの周波数成分を符号化する。
  17. 前記前記周波数変換されたオーディオ信号を、そのフレームのピーク値に基づいて正規化するステップと、
    この正規化係数を符号化するステップ
    とをさらに備えた請求項16に記載のプログラム。
  18. 請求項16に記載のプログラムにおいて、前記ステップ(A)は、
    その周波数成分と符号化対象フレームの周波数成分との2乗和が所定の閾値以下となる先行フレームが探索された場合には、類似フレーム有りと判定する。
  19. 請求項17に記載のプログラムにおいて、前記ステップ(A)は、
    その正規化された周波数成分と符号化対象フレームの正規化され周波数成分との2乗和が所定の閾値以下となる先行フレームが探索された場合には、類似フレーム有りと判定する。
  20. 請求項16から19に記載のプログラムにおいて、前記ステップ(B)は、
    符号化対象フレームの周波数成分に最も類似した周波数成分を有する先行フレームを、前記類似フレームとする。
  21. オーディオ信号復号化処理をコンピュータに実行させるためのプログラムであり、
    フレーム番号とそのフレームの周波数成分情報とを含む一般フレーム(Gフレーム)と、フレーム番号と類似フレーム番号とそのフレームと類似フレーム番号との差分周波数成分情報を含む差分フレーム(Dフレーム)とが混在するビットストリームからオーディオ信号を復号化するためのプログラムであり、下記のステップ(A)−(C)を含むプログラム。
    (A)現フレームがGフレームである場合には、前記周波数成分情報を復号化して周波数成分データを復元し、
    (B)現フレームがDフレームである場合には、
    前記差分周波数成分情報を復号化して、現フレームの差分周波数成分を復号して周波数成分データを得、
    復号された現フレームの差分周波数成分を、前記類似フレームの周波数成分とから現フレームの周波数成分を復元し、
    (C)前記ステップ(A)、(B)で復元された周波数成分を逆変換し、現フレームのオーディオ信号を生成する。
  22. 請求項21記載のプログラムにおいて、
    前記Gフレーム及びDフレームは正規化係数を更に含み、また前記Gフレームはこの正規化係数に基づいて正規化された周波数成分データを前記周波数成分情報として含み、前記Dフレームは、この正規化係数に基づいて正規化された差分周波数データを、前記周波数成分差分データとして含み、
    前記方法は、
    この正規化係数に基づいて、前記復元された周波数成分を逆正規化し、前記ステップ(C)に供給するステップ
    をさらに備える。
  23. 請求項21記載のプログラムにおいて、
    前記Gフレーム及びDフレームは正規化係数を更に含み、また前記Gフレームはこの正規化係数に基づいて正規化された周波数成分データを前記周波数成分情報として含み、前記Dフレームは、この正規化係数に基づいて正規化された差分周波数データを、前記周波数成分差分データとして含み、
    前記ステップ(A)は、この正規化係数に基づいて、前記周波数成分データを逆正規化して前記周波数成分データを復元し、
    前記ステップ(B)は、この正規化係数に基づいて、前記周波数成分差分情報を逆正規化し、逆正規化された周波数成分差分情報に基づいて前記周波数成分を復元する。
JP2006291299A 2006-10-26 2006-10-26 オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム Expired - Fee Related JP4888048B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006291299A JP4888048B2 (ja) 2006-10-26 2006-10-26 オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006291299A JP4888048B2 (ja) 2006-10-26 2006-10-26 オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2008107629A true JP2008107629A (ja) 2008-05-08
JP4888048B2 JP4888048B2 (ja) 2012-02-29

Family

ID=39441020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006291299A Expired - Fee Related JP4888048B2 (ja) 2006-10-26 2006-10-26 オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4888048B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289328A (zh) * 2020-10-28 2021-01-29 北京百瑞互联技术有限公司 一种确定音频编码码率的方法及系统
WO2023074800A1 (ja) * 2021-10-29 2023-05-04 ソニーグループ株式会社 情報処理装置および方法、並びにプログラム
WO2023074009A1 (ja) * 2021-10-29 2023-05-04 ソニーグループ株式会社 情報処理装置および方法、並びにプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004241839A (ja) * 2003-02-03 2004-08-26 Dainippon Printing Co Ltd 時系列信号の符号化方法および装置
JP2006262292A (ja) * 2005-03-18 2006-09-28 Casio Comput Co Ltd 符号化装置、復号装置、符号化方法及び復号方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004241839A (ja) * 2003-02-03 2004-08-26 Dainippon Printing Co Ltd 時系列信号の符号化方法および装置
JP2006262292A (ja) * 2005-03-18 2006-09-28 Casio Comput Co Ltd 符号化装置、復号装置、符号化方法及び復号方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289328A (zh) * 2020-10-28 2021-01-29 北京百瑞互联技术有限公司 一种确定音频编码码率的方法及系统
WO2023074800A1 (ja) * 2021-10-29 2023-05-04 ソニーグループ株式会社 情報処理装置および方法、並びにプログラム
WO2023074039A1 (ja) * 2021-10-29 2023-05-04 ソニーグループ株式会社 情報処理装置および方法、並びにプログラム
WO2023074009A1 (ja) * 2021-10-29 2023-05-04 ソニーグループ株式会社 情報処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP4888048B2 (ja) 2012-02-29

Similar Documents

Publication Publication Date Title
JP4922296B2 (ja) 低ビット率オーディオ信号の符号化/復号化方法及び装置
US8548801B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
US7756715B2 (en) Apparatus, method, and medium for processing audio signal using correlation between bands
KR100661040B1 (ko) 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체
US7328161B2 (en) Audio decoding method and apparatus which recover high frequency component with small computation
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP2006048043A (ja) オーディオデータの高周波数の復元方法及びその装置
JP2006011456A (ja) 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体
US8665945B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
JP6979048B2 (ja) 低複雑度の調性適応音声信号量子化
EP1441330B1 (en) Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method
JP3765171B2 (ja) 音声符号化復号方式
JP4022504B2 (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
JP2009253706A (ja) 符号化装置、復号装置、符号化方法、復号方法及びプログラム
JP4888048B2 (ja) オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
US20090210219A1 (en) Apparatus and method for coding and decoding residual signal
WO2019216187A1 (ja) ピッチ強調装置、その方法、およびプログラム
US8224659B2 (en) Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid
JP2931059B2 (ja) 音声合成方式およびこれに用いる装置
US8160869B2 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same
KR101317269B1 (ko) 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
JP4438654B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
JP2019531505A (ja) オーディオコーデックにおける長期予測のためのシステム及び方法
JP2009193015A (ja) 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080616

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090512

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111128

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees