JP2007333785A - オーディオ信号符号化装置およびオーディオ信号符号化方法 - Google Patents
オーディオ信号符号化装置およびオーディオ信号符号化方法 Download PDFInfo
- Publication number
- JP2007333785A JP2007333785A JP2006162194A JP2006162194A JP2007333785A JP 2007333785 A JP2007333785 A JP 2007333785A JP 2006162194 A JP2006162194 A JP 2006162194A JP 2006162194 A JP2006162194 A JP 2006162194A JP 2007333785 A JP2007333785 A JP 2007333785A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- band
- discard
- energy
- limited
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】被帯域制限信号からコア符号化信号を生成するとともに、廃棄帯域信号の包絡線情報を生成して前記コア符号化信号に多重化するオーディオ信号符号化装置において、コア符号化処理にかかる処理量を軽減して、消費電力を低減する。
【解決手段】包絡線情報算出手段400は、分析フィルタ300により生成されたサブバンド信号から、廃棄される予定の周波数帯域の包絡線情報を算出する。一方、コア符号化手段200のブロック長判定手段260は、包絡線情報算出手段400により算出される被帯域制限信号エネルギーを用いて、時間/周波数変換手段240で被帯域制限信号をスペクトルデータに変換する際のサンプルブロック長を決定する。
【選択図】図1
【解決手段】包絡線情報算出手段400は、分析フィルタ300により生成されたサブバンド信号から、廃棄される予定の周波数帯域の包絡線情報を算出する。一方、コア符号化手段200のブロック長判定手段260は、包絡線情報算出手段400により算出される被帯域制限信号エネルギーを用いて、時間/周波数変換手段240で被帯域制限信号をスペクトルデータに変換する際のサンプルブロック長を決定する。
【選択図】図1
Description
本発明は、オーディオ信号の特定の周波数帯域を廃棄し、廃棄された周波数帯域の包絡線情報を符号化信号に多重化して伝送または記憶するオーディオ信号符号化装置およびオーディオ信号符号化方法に関するものである。
デジタルオーディオの分野では、人間の可聴帯域、例えば20kHz以下の周波数帯域をカバーするように周波数帯域を制限してコンパクトディスク(CD)などの記録媒体に記録したり、或いは衛星デジタル放送などの伝送経路を通じて伝送したりしている。その一方で、CDに比べて10分の1以下の低いビットレートで、高品位の音質で伝送または記憶を可能にするオーディオ信号符号化技術が開発され、実際に使用されている。
これらのオーディオ信号の符号化技術には、例えばミニディスク(MD)に採用されているATRAC(Adaptive Transform Acoustic coding)方式や、衛星デジタル放送で採用され、ISOのMPEGで規格化されているMPEG2−AACなどの各種方式がある。
これらのオーディオ信号の符号化技術では、時系列の入力オーディオ信号を複数のサンプルでまとめたものを符号化フレームとする。そしてこの符号化フレームを単位として、周波数領域のサブバンド信号やスペクトルデータに変換する。周波数領域のサブバンド信号への変換には、QMF(Quadrature Mirror Filter)などの帯域分割フィルタといったフィルタバンクを利用する。或いは、周波数領域のスペクトルデータへの変換には、MDCT(Modified Discrete Transform)などの周波数変換処理を利用する。以下に説明するオーディオ信号の符号化処理では、MDCTなどの周波数変換を利用して、時系列上の入力オーディオ信号を周波数領域のスペクトルデータに変換するものとする。
上記の周波数変換により生成されるスペクトルデータは、複数のスペクトルデータをまとめた正規化帯域毎に正規化され、量子化が施される。スペクトルデータは、正規化帯域毎のスペクトルデータの振幅を表すスケールファクタで正規化される。更に、正規化されたスペクトルデータは、所望のビットレートになるように、正規化帯域毎に割り当てられる量子化ビット数で量子化される。量子化ビット数は、最小可聴しきい値や、マスキングなどの人間の聴覚心理特性に基づいて、聴感上知覚されない、もしくは知覚され難い量子化雑音レベルを許容して割り当てられる。
量子化されたスペクトルデータは、符号化された後に、スケールファクタや量子化ビット数などの符号化情報と多重化され、符号化信号として伝送または記憶される。このようにして人間の聴覚特性を利用すると、ビットレートの大幅な低減が可能となる。
上記のようなオーディオ信号の符号化処理によって伝送または記憶された符号化信号は、復号化処理において符号化処理の逆の手順が施され、再生オーディオ信号に復元されて出力される。
また、上記の周波数変換を用いたオーディオ信号の符号化処理では、入力オーディオ信号の特性に応じて、2つの異なるサンプルブロック長を切替えてスペクトルデータに変換する。以下に、2つの異なるサンプルブロック長で周波数変換を行う理由を説明する。
伝送または記憶される符号化信号に対して復号化処理を施して再生オーディオ信号を復元する際に、符号化時の量子化処理に起因する量子化雑音は、周波数変換を施すサンプルブロック長の時間間隔に分散して出現する。すなわち、符号化フレーム中に小さな信号振幅のオーディオ信号と、大きな信号振幅のオーディオ信号とが連続する場合に、大きな信号振幅のオーディオ信号によってもたらされる量子化雑音が、小さな信号振幅に重畳され再生されることにより、知覚品質の劣化を引き起こす。
このような知覚品質の劣化を防ぐために、符号化フレーム中に信号振幅の大きな変化がある場合には、時間間隔の短いサンプルブロック長を選択して周波数変換を行う。これにより、大きな信号振幅のオーディオ信号によってもたらされる量子化雑音が出現する時間間隔は短くなり、量子化雑音は大きな信号振幅のオーディオ信号の近傍のみ重畳される。
人間の聴覚特性の一つとして、時系列に近接して連続する信号間の知覚レベルが低下するという時間マスキング効果がある。この時間マスキング効果により、量子化雑音が知覚されにくくなる。このような特性を利用して知覚品質を向上させる方法がある(例えば、特許文献1参照)。
ここで、オーディオ信号の特性に応じ、2つの異なるサンプルブロック長を切替える方法について説明する。例えば、予め入力オーディオ信号を固定長の分析窓で高速フーリエ変換(FFT)などの周波数分析を行ってスペクトルデータに変換し、スペクトルデータの時系列の変化量を監視する。そしてこの監視によって、符号化フレーム中の信号振幅の変化量を調べ、2つの異なるサンプルブロック長を切替える。すなわち、符号化フレーム中の信号振幅において、変化量が大きい部分を検出した場合には短いサンプルブロック長を選択し、検出されない場合は長いサンプルブロック長を選択する。
以下の説明では、上記した一連の処理によって時系列のオーディオ信号を周波数領域のスペクトルデータに変換し、量子化および符号化して符号化信号を生成するオーディオ信号の符号化処理をコア符号化処理と呼び、コア符号化処理を施す処理ブロックをコア符号化手段と呼ぶ。更に、コア符号化処理の逆の手順を施して、符号化信号から再生オーディオ信号を復元し出力する復号化処理をコア復号化処理と呼び、コア復号化処理を施す処理ブロックをコア復号化手段と呼ぶ。
上記のコア符号化処理を更なる低ビットレートで施した場合には、伝送または記憶された符号化信号に対してコア復号化処理を行うと、復元され出力される再生オーディオ信号の音質劣化が知覚される。このことは、低ビットレートという要求に対して行われるコア符号化処理によって、削減される情報量が聴感上知覚され易い部分に及ぶためである。特に、周波数帯域が制限されて、高音域の成分が削除されることが多い。これは、低音域の成分の削除よりも、高音域データ成分の削除の方が聴感上知覚され難いことによる。
そこで、低ビットレートでコア符号化処理を施すことにより削除される高音域の成分を、復号化時にコア復号化処理とは別に擬似的に再現することによって、出力する再生オーディオ信号の周波数帯域を拡張して知覚品質を改善する方法が提案されている。以下にその方法を説明する。
符号化時において、コア符号化処理とは別に、入力オーディオ信号の周波数領域のサブバンド信号を分析し、コア符号化処理により廃棄(削除ともいう)される周波数帯域の信号、即ち廃棄帯域におけるサブバンド信号の包絡線や分布、振幅などを求める。そしてこれらの付加情報をコア符号化処理により生成されるコア符号化信号に多重化して伝送または記憶する。復号化時には、廃棄された周波数帯域のサブバンド信号を持つ信号を生成すると共に、コア符号化信号に多重化されるサブバンド信号の包絡線や分布、振幅などの付加情報を抽出して再現する。これらの付加情報に基づいてサブバンド信号の包絡線や分布、振幅などを調整する。この技術は、例えば特許文献2、または非特許文献1に開示されている。
以下は説明を簡単にするため、廃棄される周波数帯域のサブバンド信号を擬似的に再現するために、符号化信号に多重化して伝送または記憶される情報を単に包絡線情報と呼ぶ。ここで言う包絡線情報には、廃棄される周波数帯域のサブバンド信号の包絡線や分布、振幅などのいずれか一つ以上が含まれるものとする。
上記のようにして、伝送または記憶されるコア符号化信号にコア復号化処理を施すと共に、復元され出力されるオーディオ信号に含まれない周波数帯域のサブバンド信号を持つ付加信号を生成し、復号オーディオ信号と付加信号とを合成する。これにより低ビットレートで再生オーディオ信号の周波数帯域を拡張し、知覚品質を大幅に改善することができる。
上記の方法により入力オーディオ信号の特定の周波数帯域を廃棄した信号(以下、被帯域制限信号という)にコア符号化処理を施してコア符号化信号を生成する。そして、入力オーディオ信号を分析することにより、廃棄される周波数帯域のサブバンド信号の包絡線情報を求め、符号化信号に多重化して伝送または記憶する。
以下、このようなオーディオ信号符号化装置について図面を参照しながら説明する。
図13は上記した従来のオーディオ信号符号化装置の構成を示すブロック図である。図13において、ダウンサンプルフィルタ100は、入力オーディオ信号X1の高域の周波数帯域を廃棄し、被帯域制限信号X2を出力する。コア符号化手段200は、被帯域制限信号X2にコア符号化処理を施し、コア符号化信号S2を生成する。分析フィルタ300は、入力オーディオ信号X1に分析フィルタ処理を施し、サブバンド信号Sbを生成する。包絡線情報算出手段400は、サブバンド信号Sbを用いて、廃棄される周波数帯域のサブバンド信号の符号化された包絡線情報Ev1を生成する。マルチプレクサ500は、コア符号化信号S2に廃棄帯域信号の包絡線情報Ev1を多重化し、これを符号化信号S1として出力する。
コア符号化手段200は、周波数分析手段210、エネルギー算出手段220、ブロック長判定手段230、時間/周波数変換手段240および、量子化及び符号化手段250を備えている。周波数分析手段210は、被帯域制限信号X2から周波数領域のスペクトルデータSp1を算出する。エネルギー算出手段220は、スペクトルデータSp1から被帯域制限信号の周波数帯域におけるエネルギーEを算出する。ブロック長判定手段230は、被帯域制限信号のエネルギーEの時系列的に変化する量を調べ、変化量に従って、被帯域制限信号X2を周波数領域のスペクトルデータSp2に変換する際に用いるサンプルブロック長を選択する。時間/周波数変換手段240は、ブロック長判定手段230で選択されたサンプルブロック長に従って、被帯域制限信号X2からスペクトルデータSp2を生成する。量子化及び符号化手段250は、スペクトルデータSp2を正規化帯域毎に正規化および量子化した後に、符号化を施してコア符号化信号S2を生成する。
図14は、分析フィルタ300によって、入力オーディオ信号X1から生成されるサブバンド信号Sb(t,f)の時間方向と周波数方向の配置を表した図である。ここでtは時間方向のインデックスであり,fは周波数方向のインデックスである。
図14では、説明を簡単にするために、符号化フレームの時間間隔Tで、分析フィルタ300によるサブバンド信号Sbの生成を8回行うものとする。時間方向のインデックスtは、t=0,1,2・・・7となる。また、分析フィルタ300によるサブバンド信号Sbの生成の1回当たり、周波数帯域を8個に分割するものとする。周波数方向のインデックスfは、f=0,1,2・・・7となる。すなわち、入力オーディオ信号に対して符号化フレームの時間間隔Tで、分析フィルタ300によって64個のサブバンド信号Sb(t,f)(t=0〜7,f=0〜7)が生成される。
また、周波数方向のインデックスfが大きいほど高音域の周波数帯域を表す。Sb(t,0)は、入力オーディオ信号の周波数帯域のうち、直流成分を含む低音域の周波数帯域のサブバンド信号を表す。また、Sb(t,7)は入力オーディオ信号の周波数帯域のうち、fs/2(fsは、サンプリング周波数)の成分を含む高音域の周波数帯域のサブバンド信号を表す。ダウンサンプルフィルタ100によって廃棄される周波数帯域w1を(f=4〜7)とし、コア符号化処理が施される被帯域制限信号X2の周波数帯域w0を(f=0〜3)とする。
特表平5−506345号公報
特表2001−521648号公報
マーチン、他共著「スペクトルバンド複製によるオーディオ符号化における新たなアプローチ(Spectral Band Replication,a novel approach in audio coding)」AES、2002年、ドイツ、ミュンヘン会議、論文第5553号
前述した従来のオーディオ信号符号化装置では、廃棄される周波数帯域のサブバンド信号の包絡線情報を算出するために行う分析フィルタとは別に、コア符号化処理において被帯域制限信号を周波数領域のスペクトルデータに変換する必要がある。すなわち、サンプルブロック長を決定する前処理として、周波数分析手段210を用いて周波数分析処理を行っている。このため、従来の符号化装置ではコア符号化処理にかかる処理量が大きいという課題を有していた。
本発明は、コア符号化手段と包絡線情報算出手段の機能の一部を共有化することにより、コア符号化処理にかかる処理量を軽減したオーディオ信号符号化装置および符号化方法を実現するものである。
上記課題を解決するために、本発明のオーディオ信号符号化装置は、
入力オーディオ信号から特定の周波数帯域を廃棄した信号を被帯域制限信号とし、前記特定の周波数帯域の信号を廃棄帯域信号とするとき、前記被帯域制限信号からコア符号化信号を生成するとともに、前記廃棄帯域信号の包絡線情報を生成して前記コア符号化信号に多重化するオーディオ信号符号化装置であって、
前記入力オーディオ信号から周波数領域のサブバンド信号を生成する分析フィルタと、
前記分析フィルタで生成されたサブバンド信号のうち、前記被帯域制限信号の周波数領域のサブバンド信号から被帯域制限信号エネルギーを生成し、前記廃棄帯域信号の周波数領域のサブバンド信号から廃棄帯域信号エネルギーを生成し、更に前記被帯域制限信号エネルギーおよび前記廃棄帯域信号エネルギーから前記廃棄帯域信号の包絡線情報を算出する包絡線情報算出手段と、
前記包絡線情報算出手段で生成された被帯域制限信号エネルギーに基づいて、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定するブロック長判定手段と、
前記ブロック長判定手段で決定されたサンプルブロック長に従って前記被帯域制限信号をスペクトルデータに変換する時間/周波数変換手段と、
前記時間/周波数変換手段で変換されたスペクトルデータを適応的に量子化および符号化してコア符号化信号を生成する量子化及び符号化手段と、
前記量子化及び符号化手段で生成されたコア符号化信号と、前記包絡線情報算出手段で算出された包絡線情報とを多重化して符号化信号を出力する多重化手段と
を具備することを特徴とする。
入力オーディオ信号から特定の周波数帯域を廃棄した信号を被帯域制限信号とし、前記特定の周波数帯域の信号を廃棄帯域信号とするとき、前記被帯域制限信号からコア符号化信号を生成するとともに、前記廃棄帯域信号の包絡線情報を生成して前記コア符号化信号に多重化するオーディオ信号符号化装置であって、
前記入力オーディオ信号から周波数領域のサブバンド信号を生成する分析フィルタと、
前記分析フィルタで生成されたサブバンド信号のうち、前記被帯域制限信号の周波数領域のサブバンド信号から被帯域制限信号エネルギーを生成し、前記廃棄帯域信号の周波数領域のサブバンド信号から廃棄帯域信号エネルギーを生成し、更に前記被帯域制限信号エネルギーおよび前記廃棄帯域信号エネルギーから前記廃棄帯域信号の包絡線情報を算出する包絡線情報算出手段と、
前記包絡線情報算出手段で生成された被帯域制限信号エネルギーに基づいて、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定するブロック長判定手段と、
前記ブロック長判定手段で決定されたサンプルブロック長に従って前記被帯域制限信号をスペクトルデータに変換する時間/周波数変換手段と、
前記時間/周波数変換手段で変換されたスペクトルデータを適応的に量子化および符号化してコア符号化信号を生成する量子化及び符号化手段と、
前記量子化及び符号化手段で生成されたコア符号化信号と、前記包絡線情報算出手段で算出された包絡線情報とを多重化して符号化信号を出力する多重化手段と
を具備することを特徴とする。
本発明のオーディオ信号符号化装置において、前記ブロック長判定手段は、前記被帯域制限信号エネルギーを所定の時間間隔に累計したセグメントエネルギーを算出し、前記セグメントエネルギーに基づいて前記サンプルブロック長を決定することが好ましい。
同様に、前記包絡線情報算出手段は、前記廃棄帯域信号エネルギーに基づいて、前記廃棄帯域信号の時分割境界情報を算出し、前廃棄帯域信号エネルギー、前記被帯域制限信号エネルギーおよび前記時分割境界情報に基づいて前記廃棄帯域信号の周波数領域の包絡線データを算出し、前記包絡線データを量子化および符号化して前記包絡線情報を生成することが好ましい。
また本発明のオーディオ信号符号化装置において、前記ブロック長判定手段は、前記被帯域制限信号と前記廃棄帯域信号との相関が強い場合には、前記被帯域制限信号エネルギーに代え、前記廃棄帯域信号の時分割境界情報に基づいて、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定してもよい。
この場合、前記包絡線情報算出手段で算出された、前記廃棄帯域信号の周波数領域の包絡線データに基づいて、前記被帯域制限信号と前記廃棄帯域信号との相関の強さを判定することが好ましい。
次に、上記課題を解決する本発明のオーディオ信号符号化方法は、
入力オーディオ信号から特定の周波数帯域を廃棄した信号を被帯域制限信号とし、前記特定の周波数帯域の信号を廃棄帯域信号とするとき、前記被帯域制限信号からコア符号化信号を生成するとともに、前記廃棄帯域信号の包絡線情報を生成して前記コア符号化信号に多重化するオーディオ信号符号化方法であって、
前記入力オーディオ信号から周波数領域のサブバンド信号を生成する第1のステップと、
前記被帯域制限信号の周波数領域の前記サブバンド信号から被帯域制限信号エネルギーを生成し、前記廃棄帯域信号の周波数領域の前記サブバンド信号から廃棄帯域信号エネルギーを生成する第2のステップと、
前記被帯域制限信号エネルギーおよび前記廃棄帯域信号エネルギーに基づいて前記廃棄帯域信号の包絡線情報を算出する第3のステップと、
前記被帯域制限信号エネルギーから、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定する第4のステップと、
前記サンプルブロック長に従って前記被帯域制限信号をスペクトルデータに変換する第5のステップと、
前記スペクトルデータを適応的に量子化および符号化してコア符号化信号を生成する第6のステップと、
前記コア符号化信号と前記包絡線情報とを多重化して符号化信号を生成する第7のステップと
を含むことを特徴とする。
入力オーディオ信号から特定の周波数帯域を廃棄した信号を被帯域制限信号とし、前記特定の周波数帯域の信号を廃棄帯域信号とするとき、前記被帯域制限信号からコア符号化信号を生成するとともに、前記廃棄帯域信号の包絡線情報を生成して前記コア符号化信号に多重化するオーディオ信号符号化方法であって、
前記入力オーディオ信号から周波数領域のサブバンド信号を生成する第1のステップと、
前記被帯域制限信号の周波数領域の前記サブバンド信号から被帯域制限信号エネルギーを生成し、前記廃棄帯域信号の周波数領域の前記サブバンド信号から廃棄帯域信号エネルギーを生成する第2のステップと、
前記被帯域制限信号エネルギーおよび前記廃棄帯域信号エネルギーに基づいて前記廃棄帯域信号の包絡線情報を算出する第3のステップと、
前記被帯域制限信号エネルギーから、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定する第4のステップと、
前記サンプルブロック長に従って前記被帯域制限信号をスペクトルデータに変換する第5のステップと、
前記スペクトルデータを適応的に量子化および符号化してコア符号化信号を生成する第6のステップと、
前記コア符号化信号と前記包絡線情報とを多重化して符号化信号を生成する第7のステップと
を含むことを特徴とする。
更に本発明は、上記オーディオ信号符号化方法の各ステップをコンピュータに実行させるためのプログラムを含む。
本発明のオーディオ信号符号化装置および符号化方法は、包絡線情報算出手段で生成される被帯域制限信号エネルギーを用いて、被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定しており、コア符号化処理における周波数分析にかかる処理を軽減することができる。
もしくは、本発明のオーディオ信号符号化装置および符号化方法は、包絡線情報算出手段で生成される廃棄帯域信号の時分割境界情報を用いて、被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定しており、コア符号化処理における周波数分析にかかる処理を軽減することができる。
以下、本発明を実施の形態について、図面を参照しながら説明する。
(実施の形態1)
図1は本発明の実施の形態1におけるオーディオ信号符号化装置の全体構成を示すブロック図である。
図1は本発明の実施の形態1におけるオーディオ信号符号化装置の全体構成を示すブロック図である。
本実施の形態のオーディオ信号符号化装置は、ダウンサンプルフィルタ100、コア符号化手段200、分析フィルタ300、包絡線情報算出手段400およびマルチプレクサ500で構成されている。一方、コア符号化手段200は、従来装置と異なり、ブロック長判定手段260、時間/周波数変換手段240および、量子化及び符号化手段250により構成されている。なお図中、図13の従来装置と同一機能を有するブロックには同一の符号を付している。
以下、まず図1の各ブロックの機能について説明する。ダウンサンプルフィルタ100は、入力オーディオ信号X1の特定の周波数帯域を廃棄し、被帯域制限信号X2を生成する。コア符号化手段200は、被帯域制限信号X2にコア符号化処理を施してコア符号化信号S2を生成する。分析フィルタ300は、入力オーディオ信号X1から周波数領域のサブバンド信号Sbを生成する。包絡線情報算出手段400は、サブバンド信号Sbから、廃棄される周波数帯域のサブバンド信号Sbの包絡線情報Ev1を生成する。マルチプレクサ500は多重化手段であり、コア符号化信号S2に、符号化された包絡線情報Ev1を多重化した符号化信号S1を生成して出力する。
次に、コア符号化手段200の構成について説明する。ブロック長判定手段260は、包絡線情報算出手段400で生成された被帯域制限信号エネルギーELを用いて、被帯域制限信号X2を周波数領域のスペクトルデータSp2に変換するためのサンプルブロック長を判定する。時間/周波数変換手段240は、ブロック長判定手段260で選択されたサンプルブロック長を用いて、被帯域制限信号X2から周波数領域のスペクトルデータSp2を生成する。また量子化及び符号化手段250は、スペクトルデータSp2を正規化帯域毎に正規化および量子化した後に、符号化を施してコア符号化信号S2を生成する。
図2は、包絡線情報算出手段400とブロック長判定手段260の構成を更に詳しく示したブロック図である。
包絡線情報算出手段400は、エネルギー算出手段410、包絡線データ境界検出手段420、包絡線データ算出手段430および、包絡線データ量子化及び符号化手段440を備えている。一方、ブロック長判定手段260は、エネルギー変化量算出手段261とブロック長選択手段262を備えている。
以下、包絡線情報算出手段400およびブロック長判定手段260の機能と動作について、それぞれ具体的に説明する。
エネルギー算出手段410は、サブバンド信号Sbから被帯域制限信号の周波数帯域におけるサブバンド信号の自乗値を周波数方向で累計し、その累計値を被帯域制限信号エネルギーELとして算出する。同様に、廃棄帯域信号の周波数帯域におけるサブバンド信号の自乗値を周波数方向で累計し、その累計値を廃棄帯域信号エネルギーEHとして算出する。
図3は、エネルギー算出手段410によって、サブバンド信号Sbから生成される被帯域制限信号エネルギーEL(t)と廃棄帯域信号エネルギーEH(t)の時間方向と周波数方向の配置を表す図である。ここでtは時間方向のインデックスである。
説明を簡単にするため、前述した図14に示すように、符号化フレームの時間間隔Tで、分析フィルタ300によるサブバンド信号Sbの生成を8回行うものとする。この場合、時間方向のインデックスtは、0〜7の何れかの整数値となる。また、分析フィルタ300によるサブバンド信号Sbの生成の1回当たり、周波数帯域を8個に分割するものとする。周波数方向のインデックスfは、0〜7の何れかの整数値となる。
すなわち、入力オーディオ信号に対して符号化フレームの時間間隔Tで、分析フィルタ300により64個のサブバンド信号Sb(t,f)が生成される。また、周波数方向のインデックスfが大きいほど高音域の周波数帯域を表す。Sb(t,0)は入力オーディオ信号の周波数帯域のうち、直流成分を含む低音域の周波数帯域のサブバンド信号を表す。また、Sb(t,7)は入力オーディオ信号の周波数帯域のうち、fs/2(fsは、サンプリング周波数)の成分を含む高音域の周波数帯域のサブバンド信号を表す。
更に、ダウンサンプルフィルタ100によって廃棄される周波数帯域w1をf=4〜7とし、コア符号化処理が施される被帯域制限信号X2の周波数帯域w0をf=0〜3とする。図3では、被帯域制限信号エネルギーEL(0)は、サブバンド信号Sb(0,f)(f=0〜3)の自乗値の累計として算出される。一方、廃棄帯域信号エネルギーEH(0)は、サブバンド信号Sb(0,f)(f=4〜7)の自乗値の累計として算出される。すなわち、廃棄帯域信号エネルギーEH(t)と被帯域制限信号エネルギーEL(t)は図3に示す周波数方向および時間方向の順序となる。
図4は、エネルギー算出手段410によって算出される被帯域制限信号エネルギーEL(t)と廃棄帯域信号エネルギーEH(t)を表す図である。図4の横軸は時間を表し、縦軸は被帯域制限信号エネルギーEL(t)と廃棄帯域信号エネルギーEH(t)の大きさを表している。
図4において、被帯域制限信号エネルギーEL(t)は、サブバンド信号Sb(t,f)のうち、コア符号化処理が施される被帯域制限信号X2の周波数帯域w0に含まれるサブバンド信号Sb(t,f)(f=0〜3)の自乗値を周波数方向で累計して算出している。また、廃棄帯域信号エネルギーEH(t)は、サブバンド信号Sb(t,f)のうち、周波数帯域w1に含まれるサブバンド信号Sb(t,f)(f=4〜7)の自乗値を周波数方向で累計して算出している。
次に、包絡線データ境界検出手段420は、時系列上で隣接する2つの廃棄帯域信号エネルギーEHにおける差の絶対値を演算し、その演算結果を廃棄帯域信号のエネルギー変化量として変化量の大きさに応じて、時分割境界情報TEを求める。更に包絡線データ算出手段430は、包絡線データ境界検出手段420で求められる時分割境界情報TEに基づいて、それぞれの時間間隔に含まれる被帯域制限信号エネルギーELと廃棄帯域信号エネルギーEHとから、復号化時に被帯域制限信号から擬似的に生成される廃棄帯域信号のゲインを調整するための包絡線データEv2を算出する。包絡線データ量子化及び符号化手段440は、包絡線データ算出手段430で算出される包絡線データEv2に量子化および符号化を施すとともに、包絡線データの時分割境界情報TEをまとめた包絡線情報Ev1を生成する。
図5の上段には、包絡線データ境界検出手段420において、時系列上で隣接する2つの廃棄帯域信号エネルギーEHにおける差の絶対値を演算し、その演算結果を廃棄帯域信号のエネルギー変化量として変化量の大きさに応じて求められる、包絡線データを算出する時分割境界を示す。また、図5の下段には、包絡線データ境界検出手段420で求められる時分割境界情報TEに基づいて、包絡線データ算出手段430で算出される包絡線データの配置を示す。
図5において、廃棄帯域信号エネルギーEHの時間方向の変化量の大きいt=1とt=2の境界、t=4とt=5の境界を時分割境界(破線)とし、t=0〜1とt=2〜4とt=5〜7で括られる時間間隔を時分割境界情報TEとしていることを表す。同様に、時分割境界情報TEに基づく境界に挟まれる時間間隔に含まれる被帯域制限信号エネルギーEL(t,f)と、廃棄帯域信号エネルギーEH(t,f)から算出される包絡線データEv2(k,f)の配置を表す。
すなわち、包絡線データEv2(0,4)は、被帯域制限信号エネルギーEL(t,0)(t=0〜1)と、廃棄帯域信号エネルギーEH(t,4)(t=0〜1)に基づいて算出される。同様にして求められる包絡線データEv2(t、f)は、図5に示す時間軸および周波数軸上の順序となる。但し、上記の説明では復号化時に廃棄帯域信号の周波数帯域のサブバンド信号Sb(0,4)は被帯域制限信号の周波数帯域のサブバンド信号Sb(0,0)に基づいて擬似的に生成される方法で行うとしたが、別の方法を用いても良い。
このようにして算出された包絡線データEv2は、包絡線データ量子化及び符号化手段440で量子化および符号化を施して包絡線情報Ev1を生成し、マルチプレクサ500に出力する。
一方、ブロック長判別手段260のエネルギー変化量算出手段261は、時系列上で隣接する2つの被帯域制限信号エネルギーELにおける差の絶対値を演算し、その演算結果をエネルギー変化量Dとして出力する。更にブロック長選択手段262は、符号化フレーム中で、所定の閾値Thよりも大きいエネルギー変化量Dが検出される場合には、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を短い時間間隔のサンプルブロック長とし、閾値Thと等しいか、それよりも小さいエネルギー変化量Dが検出される場合には、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を長い時間間隔のサンプルブロック長とするようにサンプルブロック長を選択する。
図6は、エネルギー変化量算出手段261によって、図4の被帯域制限信号エネルギーEL(t)から算出されるエネルギー変化量D(t)を表す。図6の横軸は時間を表し、縦軸はエネルギー変化量D(t)の大きさを表す。
図6において、エネルギー変化量D(t)は、時系列で隣接する被帯域制限信号エネルギーEL(t−1)とEL(t)との差の絶対値で算出される。ここで、D(0)は、現在の符号化フレームに対して時系列に先行する前の符号化フレーム中における最後の被帯域制限信号エネルギーEL’(7)と、現在の符号化フレーム中の被帯域制限信号エネルギーEL(0)との差の絶対値で算出される。横軸に点線で表されるThは、エネルギー変化量D(t)に応じ、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を切替えるブロック長判定閾値である。
すなわち、符号化フレームの時間間隔Tでブロック長判定閾値Thより大きいエネルギー変化量D(t)が検出される場合には、短い時間間隔のサンプルブロック長を選択し、検出されない場合は、長い時間間隔のサンプルブロック長を選択するように、ブロック長選択出手段262がエネルギー変化量D(t)を監視する。
以上説明した本実施の形態の構成によれば、ブロック長判定手段260は、包絡線情報算出手段400のエネルギー算出手段410により生成される被帯域制限信号エネルギーELを用いて、被帯域制限信号X2をスペクトルデータSp2に変換するためのサンプルブロック長を決定しており、コア符号化手段200において、サンプルブロック長を決定するための被帯域制限信号X2の周波数分析にかかる処理が不要となるため、処理量を軽減することができる。これにより、電力消費を低減したオーディオ信号符号化装置を実現することができる。
なお、被帯域制限信号エネルギーELおよびエネルギー変化量Dの算出、並びにサンプルブロック長の決定については、本実施の形態で説明した方法以外の方法を用いても良い。
また本実施の形態において、ブロック長判定手段260は、分析フィルタ300のサブバンド信号Sbを生成する時間間隔を単位に、被帯域制限信号エネルギーELから算出されるエネルギー変化量Dとブロック長判定閾値Thとを比較するようにした。しかし、ブロック長判定手段260は、分析フィルタ300のサブバンド信号Sbを生成する時間間隔とは異なる時間間隔のサンプルブロック長の時間間隔を単位に統合して、被帯域制限信号エネルギーELを統合したセグメントエネルギーを算出し、セグメントエネルギーから算出されるエネルギー変化量Dとブロック長判定閾値Thとを比較するようにしても良い。
(実施の形態2)
図7は、本発明の実施の形態2におけるオーディオ信号符号化装置の全体構成を示すブロック図である。本実施の形態の符号化装置は、包絡線情報算出手段400から包絡線データの時分割境界情報TEと包絡線データEv2が、コア符号化手段200のブロック長判定手段270に入力される点で、実施の形態1の符号化装置と異なっている。
図7は、本発明の実施の形態2におけるオーディオ信号符号化装置の全体構成を示すブロック図である。本実施の形態の符号化装置は、包絡線情報算出手段400から包絡線データの時分割境界情報TEと包絡線データEv2が、コア符号化手段200のブロック長判定手段270に入力される点で、実施の形態1の符号化装置と異なっている。
図8は、本実施の形態における包絡線情報算出手段400とブロック長判定手段270の構成を更に詳しく示したブロック図である。包絡線情報算出手段400の構成は実施の形態1の符号化装置と同一である。ブロック長判定手段270は、エネルギー変化量算出手段271とブロック長選択手段272を備えている。
以下、実施の形態1と相違する点を中心に、ブロック長判定手段270の機能と動作を説明する。
エネルギー変化量算出手段271は、被帯域制限信号エネルギーELと包絡線データEv2とから廃棄帯域信号と被帯域制限信号との相関を求め、相関が弱い場合には、時系列上で隣接する2つの被帯域制限信号エネルギーELにおける差の絶対値を演算し、その演算結果をエネルギー変化量Dとして出力する。
ブロック長選択手段272は、廃棄帯域信号と被帯域制限信号との相関が弱い場合には、エネルギー変化量算出手段271によって算出されるエネルギー変化量Dに基づいて、サンプルブロック長を選択する。具体的には、実施の形態1のエネルギー変化量算出手段261と同様に、符号化フレーム中で、所定の閾値Thよりも大きいエネルギー変化量Dが検出される場合には、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を短い時間間隔のサンプルブロック長とし、閾値Thと等しいか、それよりも小さいエネルギー変化量Dが検出される場合には、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を長い時間間隔のサンプルブロック長とするようにサンプルブロック長を選択する。
他方、廃棄帯域信号と被帯域制限信号と相関が強い場合には、ブロック長選択手段272は、廃棄帯域信号エネルギーEHの時間方向の変化量に基づいて求められる時分割境界情報TEに基づいて、サンプルブロック長を選択する。具体的には、廃棄帯域信号エネルギーEHが時間方向で大きく変化する時分割境界が検出されて分割数が2以上となる場合には、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を短い時間間隔のサンプルブロック長とし、分割数が1の場合には、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を長い時間間隔のサンプルブロック長とするようにサンプルブロック長を選択する。
図9は、被帯域制限信号と廃棄帯域信号の相関が強い場合のサブバンド信号Sbの信号レベルを表す。図9の縦軸はサブバンド信号Sbの信号レベルを表し、横軸は周波数を表す。一方、図10(A)、(B)は、被帯域制限信号と廃棄帯域信号の相関が弱い場合のサブバンド信号Sbの信号レベルを表す。図10(A)は低域に偏りのある場合であり、図10(B)は高域に偏りのある場合である。図9と同様、図10の縦軸はサブバンド信号Sbの信号レベルを表し、横軸は周波数を表す。
図9に示すように被帯域制限信号と廃棄帯域信号との相関が強い場合には、包絡線データ境界検出手段420で求められる包絡線データEv2の時分割境界情報TEが、被帯域制限信号の信号振幅の変化を検出する場合と同様の結果が得られるので、時分割境界情報TEに基づいて、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を決定することができる。
逆に、図10に示すように被帯域制限信号と廃棄帯域信号との相関が弱い場合には、被帯域制限信号の信号振幅の変化を検出する場合と同様の結果は得られない。このような場合には、エネルギー変化量算出手段271によって被帯域制限信号エネルギーELからエネルギー変化量Dを算出し、エネルギー変化量Dに基づいて被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を決定する。
本実施の形態のブロック長判定手段270においては、被帯域制限信号と廃棄帯域信号との相関の強さを検出する方法として、包絡線データEv2を用いている。すなわち、包絡線データEv2が大きい場合には被帯域制限信号と廃棄帯域信号との相関が強いものと判定し、逆に包絡線データEv2が小さい場合には被帯域制限信号と廃棄帯域信号との相関が弱いものと判定する。このことは、包絡線データEv2が、復号化時に被帯域制限信号の周波数領域のサブバンド信号Sbから擬似的に生成される廃棄帯域信号のサブバンド信号のゲイン調整を行うために、包絡線データ算出手段430において被帯域制限信号エネルギーと廃棄帯域信号エネルギーから算出されることに基づくものである。
ここで、図10に示される、被帯域制限信号と廃棄帯域信号の相関が弱い場合に、包絡線データEv2が小さい値となる理由を説明する。被帯域制限信号のサブバンド信号Sbの信号レベルが大きく、かつ廃棄帯域信号のサブバンド信号Sbの信号レベルが小さい場合には、復号化時に被帯域制限信号の周波数帯域のサブバンド信号Sbから擬似的に生成される廃棄帯域信号の周波数帯域のサブバンド信号のゲインを調整するために包絡線データEv2は小さい値となる。或いは、被帯域制限信号のサブバンド信号Sbの信号レベルが小さく、かつ廃棄帯域信号のサブバンド信号Sbの信号レベルが大きい場合には、復号化時に被帯域制限信号の周波数帯域のサブバンド信号Sbから擬似的に生成される廃棄帯域信号の周波数帯域のサブバンド信号のゲインを調整するために包絡線データEv2は小さい値とし、代わりに擬似的なノイズ信号や正弦波信号を付加して廃棄帯域信号の周波数帯域のサブバンド信号を生成する。上記の説明のような復号化時における廃棄帯域信号の周波数帯域のサブバンド信号の生成により、被帯域制限信号と廃棄帯域信号の相関が弱い場合には、包絡線データEv2は小さい値となる。
図11は、相関の強弱を表す包絡線データEv2と時間分割境界情報TEから、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を決定する処理フローを示す図である。図11の処理フローに従い、サンプルブロック長を決定する手順を説明する。
まず、ステップS111において被帯域制限信号のエネルギー変化量Dを算出する。ステップS112では、算出したエネルギー変化量Dに基づいて被帯域制限信号の信号振幅の変化量を検出し、信号振幅の変化量が小さい場合にはステップS113に移る。一方、信号振幅の変化量が大きい場合にはステップS116に移る。
ステップS113では、包絡線データEv2に基づいて被帯域制限信号と廃棄帯域信号の相関の強さを検出する。被帯域制限信号と廃棄帯域信号の相関が強い場合にはステップS114に移り、被帯域制限信号と廃棄帯域信号の相関が弱い場合にはステップS115に移る。
ステップS114では、時分割境界情報TEに基づいて廃棄帯域信号の時分割数を判定し、例えば時分割数が1の場合はステップS115に移る。一方、廃棄帯域信号の時分割数が1より大きい場合にはステップS116に移る。ステップS115およびS116で、それぞれ被帯域制限信号X2をスペクトルデータに変換するサンプルブロック長を決定する。
図11の処理フローにより、被帯域制限信号の信号振幅の変化量が小さく、かつ被帯域制限信号と廃棄帯域信号の相関が強い場合には、廃棄帯域信号の時分割境界情報TEに基づいて、被帯域制限信号X2をスペクトルデータSp2に変換するブロック長を決定する。これにより、被帯域制限信号の信号振幅の変化を検出する閾値の精度不足による検出の誤りを補正して精度を向上することができ、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長の誤った設定による音質の劣化を防止することができる。
図12は、相関の強弱を表す包絡線データEv2と時間分割境界情報TEからサンプルブロック長を決定する他の処理フローを示す図である。図12の処理フローに従い、サンプルブロック長を決定する手順を説明する。
まず、ステップS121において被帯域制限信号と廃棄帯域信号の相関の強弱を判定する。被帯域制限信号と廃棄帯域信号の相関が強い場合にはステップS122に移り、被帯域制限信号と廃棄帯域信号の相関が弱い場合にはステップS123に移る。
ステップS122では、時分割境界情報TEに基づいて廃棄帯域信号の時分割数を判定し、例えば時分割数が1の場合はステップS125に移る。一方、廃棄帯域信号の時分割数が1より大きい場合にはステップS126に移る。
ステップS121で、被帯域制限信号と廃棄帯域信号の相関が弱いと判定された場合には、ステップS123で被帯域制限信号のエネルギー変化量Dを算出し、ステップS124に移る。ステップS124では、エネルギー変化量Dに基づいて被帯域制限信号の信号振幅の変化量を検出し、信号振幅の変化量が小さい場合にはステップS125に移り、信号振幅の変化量が大きい場合にはステップS126に移る。ステップS125およびS126で、それぞれ被帯域制限信号X2をスペクトルデータに変換するサンプルブロック長を決定する。
図12の処理フローに示すように、被帯域制限信号と廃棄帯域信号の相関が強い場合には、廃棄帯域信号の時分割境界情報TEに基づいて、被帯域制限信号X2をスペクトルデータSp2に変換する際のサンプルブロック長を決定することで、被帯域制限信号の信号振幅の変化量を検出するステップを省略し、処理量を更に削減するようにしてもよい。
以上説明したように本実施の形態の構成によれば、コア符号化手段200のブロック長判定手段270は、包絡線情報算出手段400により生成される被帯域制限信号エネルギーEL、包絡線データEv2および時分割境界情報TEから、被帯域制限信号と廃棄帯域信号の相関が強い場合には、時分割境界情報TEに基づいて、被帯域制限信号X2をスペクトルデータSp2に変換するサンプルブロック長を決定する。こうすることにより、サンプルブロック長を決定するための周波数分析にかかる処理が不要となるため、処理量を軽減することができ、これにより電力消費を低減したオーディオ信号の符号化装置を実現することができる。
なお、エネルギー変化量Dの算出、被帯域制限信号と廃棄帯域信号の相関の強さの検出、並びにサンプルブロック長の決定については、本実施の形態で説明した方法以外の方法を用いても良い。
また本実施の形態において、ブロック長判定手段270は、分析フィルタ300のサブバンド信号Sbを生成する時間間隔を単位として、被帯域制限信号エネルギーELから算出されるエネルギー変化量Dと、ブロック長判定閾値Thとを比較するようにした。しかし、分析フィルタ300のサブバンド信号Sbを生成する時間間隔とは異なる時間間隔のサンプルブロック長を単位に被帯域制限信号エネルギーを統合してセグメントエネルギーを算出し、セグメントエネルギーから算出されるエネルギー変化量と、ブロック長判定閾値とを比較するようにしても良い。この方法は、実施の形態1と同様であるので、説明を省略する。
また、上記各実施の形態におけるオーディオ信号符号化装置の各ブロックの一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムを、コンピュータまたはデジタルシグナルプロセッサ(DSP)を用いて実行して本発明を実現することができること、あるいは、各処理フローで示した処理手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータまたはDSPに実行させることができることは云うまでもない。
そして、コンピュータでその処理機能を実現するためのプログラム、あるいは、コンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、フロッピー(登録商標)ディスクや、MO、ROM,メモリカード、CD,DVD、リムーバブルディスクなどに記録して、保存したり、低給したりすることができると共に、インターネットなどのネットワークを通してそのプログラムを配布したりすることが可能である。
本発明によれば、サンプルブロック長を決定するための周波数分析にかかる処理量を軽減し、電力消費を低減したオーディオ信号符号化装置を提供することが可能となる。このような技術は、バッテリなどで駆動するオーディオ信号符号化装置に使用して好適である。また本発明は、映像信号とオーディオ信号を含むコンテンツを、制限されたビットレートでサービスする放送分野やコンテンツプロバイダ等にも利用できる。
100 ダウンサンプルフィルタ
200 コア符号化手段
240 時間/周波数変換手段
250 量子化及び符号化手段
260、270 ブロック長判定手段
261、271 エネルギー変化量算出手段
262、272 ブロック長選択手段
300 分析フィルタ
400 包絡線情報算出手段
410 エネルギー算出手段
420 包絡線データ境界検出手段
430 包絡線データ算出手段
440 包絡線データ量子化及び符号化手段
500 マルチプレクサ
200 コア符号化手段
240 時間/周波数変換手段
250 量子化及び符号化手段
260、270 ブロック長判定手段
261、271 エネルギー変化量算出手段
262、272 ブロック長選択手段
300 分析フィルタ
400 包絡線情報算出手段
410 エネルギー算出手段
420 包絡線データ境界検出手段
430 包絡線データ算出手段
440 包絡線データ量子化及び符号化手段
500 マルチプレクサ
Claims (12)
- 入力オーディオ信号から特定の周波数帯域を廃棄した信号を被帯域制限信号とし、前記特定の周波数帯域の信号を廃棄帯域信号とするとき、前記被帯域制限信号からコア符号化信号を生成するとともに、前記廃棄帯域信号の包絡線情報を生成して前記コア符号化信号に多重化するオーディオ信号符号化装置であって、
前記入力オーディオ信号から周波数領域のサブバンド信号を生成する分析フィルタと、
前記分析フィルタで生成されたサブバンド信号のうち、前記被帯域制限信号の周波数領域のサブバンド信号から被帯域制限信号エネルギーを生成し、前記廃棄帯域信号の周波数領域のサブバンド信号から廃棄帯域信号エネルギーを生成し、更に前記被帯域制限信号エネルギーおよび前記廃棄帯域信号エネルギーから前記廃棄帯域信号の包絡線情報を算出する包絡線情報算出手段と、
前記包絡線情報算出手段で生成された被帯域制限信号エネルギーに基づいて、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定するブロック長判定手段と、
前記ブロック長判定手段で決定されたサンプルブロック長に従って前記被帯域制限信号をスペクトルデータに変換する時間/周波数変換手段と、
前記時間/周波数変換手段で変換されたスペクトルデータを適応的に量子化および符号化してコア符号化信号を生成する量子化及び符号化手段と、
前記量子化及び符号化手段で生成されたコア符号化信号と、前記包絡線情報算出手段で算出された包絡線情報とを多重化して符号化信号を出力する多重化手段と
を具備することを特徴とするオーディオ信号符号化装置。 - 前記ブロック長判定手段は、前記被帯域制限信号エネルギーを所定の時間間隔に累計したセグメントエネルギーを算出し、前記セグメントエネルギーに基づいて前記サンプルブロック長を決定することを特徴とする請求項1に記載のオーディオ信号符号化装置。
- 前記包絡線情報算出手段は、前記廃棄帯域信号エネルギーに基づいて、前記廃棄帯域信号の時分割境界情報を算出し、前廃棄帯域信号エネルギー、前記被帯域制限信号エネルギーおよび前記時分割境界情報に基づいて前記廃棄帯域信号の周波数領域の包絡線データを算出し、前記包絡線データを量子化および符号化して前記包絡線情報を生成することを特徴とする請求項1または2に記載のオーディオ信号符号化装置。
- 前記ブロック長判定手段は、前記被帯域制限信号と前記廃棄帯域信号との相関が強い場合には、前記被帯域制限信号エネルギーに代え、前記廃棄帯域信号の時分割境界情報に基づいて、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定することを特徴とする請求項3に記載のオーディオ信号符号化装置。
- 前記ブロック長判定手段は、前記包絡線情報算出手段で算出された、前記廃棄帯域信号の周波数領域の包絡線データに基づいて、前記被帯域制限信号と前記廃棄帯域信号との相関の強さを判定することを特徴とする請求項4に記載のオーディオ信号符号化装置。
- 入力オーディオ信号から特定の周波数帯域を廃棄した信号を被帯域制限信号とし、前記特定の周波数帯域の信号を廃棄帯域信号とするとき、前記被帯域制限信号からコア符号化信号を生成するとともに、前記廃棄帯域信号の包絡線情報を生成して前記コア符号化信号に多重化するオーディオ信号符号化方法であって、
前記入力オーディオ信号から周波数領域のサブバンド信号を生成する第1のステップと、
前記被帯域制限信号の周波数領域の前記サブバンド信号から被帯域制限信号エネルギーを生成し、前記廃棄帯域信号の周波数領域の前記サブバンド信号から廃棄帯域信号エネルギーを生成する第2のステップと、
前記被帯域制限信号エネルギーおよび前記廃棄帯域信号エネルギーに基づいて前記廃棄帯域信号の包絡線情報を算出する第3のステップと、
前記被帯域制限信号エネルギーから、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定する第4のステップと、
前記サンプルブロック長に従って前記被帯域制限信号をスペクトルデータに変換する第5のステップと、
前記スペクトルデータを適応的に量子化および符号化してコア符号化信号を生成する第6のステップと、
前記コア符号化信号と前記包絡線情報とを多重化して符号化信号を生成する第7のステップと
を含むことを特徴とするオーディオ信号符号化方法。 - 前記第4のステップにおいて、前記被帯域制限信号エネルギーを所定の時間間隔に累計したセグメントエネルギーを算出し、前記セグメントエネルギーに基づいて前記サンプルブロック長を決定することを特徴とする請求項6に記載のオーディオ信号符号化方法。
- 前記第3のステップにおいて、前記廃棄帯域信号エネルギーに基づいて、前記廃棄帯域信号の時分割境界情報を算出し、前記廃棄帯域信号エネルギー、前記被帯域制限信号エネルギーおよび前記時分割境界情報に基づいて前記廃棄帯域信号の周波数領域の包絡線データを算出し、前記包絡線データを量子化および符号化して前記包絡線情報を生成することを特徴とする請求項6または7に記載のオーディオ信号符号化方法。
- 前記第4のステップにおいて、前記被帯域制限信号と前記廃棄帯域信号との相関が強い場合には、前記被帯域制限信号エネルギーに代え、前記廃棄帯域信号の時分割境界情報に基づいて、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定することを特徴とする請求項8に記載のオーディオ信号符号化方法。
- 前記第3のステップで算出された前記廃棄帯域信号の周波数領域の包絡線データに基づいて、前記被帯域制限信号と前記廃棄帯域信号との相関の強さを判定することを特徴とする請求項9に記載のオーディオ信号符号化方法。
- 入力オーディオ信号から特定の周波数帯域を廃棄した信号を被帯域制限信号とし、前記特定の周波数帯域の信号を廃棄帯域信号とするとき、前記被帯域制限信号からコア符号化信号を生成するとともに、前記廃棄帯域信号の包絡線情報を生成して前記コア符号化信号に多重化するオーディオ信号符号化方法において、
前記入力オーディオ信号から周波数領域のサブバンド信号を生成する第1のステップと、
前記被帯域制限信号の周波数領域の前記サブバンド信号から被帯域制限信号エネルギーを生成し、前記廃棄帯域信号の周波数領域の前記サブバンド信号から廃棄帯域信号エネルギーを生成する第2のステップと、
前記被帯域制限信号エネルギーおよび前記廃棄帯域信号エネルギーに基づいて前記廃棄帯域信号の包絡線情報を算出する第3のステップと、
前記被帯域制限信号エネルギーから、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定する第4のステップと、
前記サンプルブロック長に従って前記被帯域制限信号をスペクトルデータに変換する第5のステップと、
前記スペクトルデータを適応的に量子化および符号化してコア符号化信号を生成する第6のステップと、
前記コア符号化信号と前記包絡線情報とを多重化して符号化信号を生成する第7のステップと
をコンピュータに実行させるためのプログラム。 - 前記第4のステップにおいて、前記被帯域制限信号と前記廃棄帯域信号との相関が強い場合には、前記被帯域制限信号エネルギーに代え、前記廃棄帯域信号の時分割境界情報に基づいて、前記被帯域制限信号を周波数領域のスペクトルデータに変換する際のサンプルブロック長を決定することをコンピュータに実行させるための請求項11に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006162194A JP2007333785A (ja) | 2006-06-12 | 2006-06-12 | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006162194A JP2007333785A (ja) | 2006-06-12 | 2006-06-12 | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007333785A true JP2007333785A (ja) | 2007-12-27 |
Family
ID=38933356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006162194A Pending JP2007333785A (ja) | 2006-06-12 | 2006-06-12 | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007333785A (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010503881A (ja) * | 2006-09-13 | 2010-02-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声・音響送信器及び受信器のための方法及び装置 |
JP2011501225A (ja) * | 2008-07-11 | 2011-01-06 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 |
WO2013027630A1 (ja) * | 2011-08-24 | 2013-02-28 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US9361900B2 (en) | 2011-08-24 | 2016-06-07 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9679580B2 (en) | 2010-04-13 | 2017-06-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9691410B2 (en) | 2009-10-07 | 2017-06-27 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
CN111916090A (zh) * | 2020-08-17 | 2020-11-10 | 北京百瑞互联技术有限公司 | 一种lc3编码器近奈奎斯特频率信号检测方法、检测器、存储介质及设备 |
CN111989953A (zh) * | 2018-04-18 | 2020-11-24 | 特瑞斯贝斯技术私人(Opc)有限公司 | 用于对移动设备中的功耗进行优化的系统和方法 |
-
2006
- 2006-06-12 JP JP2006162194A patent/JP2007333785A/ja active Pending
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010503881A (ja) * | 2006-09-13 | 2010-02-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声・音響送信器及び受信器のための方法及び装置 |
TWI457914B (zh) * | 2008-07-11 | 2014-10-21 | Fraunhofer Ges Forschung | 用以使用頻譜傾斜控制訊框化技術來計算帶寬延伸資料之裝置和方法 |
JP2011501225A (ja) * | 2008-07-11 | 2011-01-06 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 |
US8788276B2 (en) | 2008-07-11 | 2014-07-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing |
US9691410B2 (en) | 2009-10-07 | 2017-06-27 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
US10297270B2 (en) | 2010-04-13 | 2019-05-21 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10224054B2 (en) | 2010-04-13 | 2019-03-05 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10546594B2 (en) | 2010-04-13 | 2020-01-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9679580B2 (en) | 2010-04-13 | 2017-06-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10381018B2 (en) | 2010-04-13 | 2019-08-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10236015B2 (en) | 2010-10-15 | 2019-03-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9842603B2 (en) | 2011-08-24 | 2017-12-12 | Sony Corporation | Encoding device and encoding method, decoding device and decoding method, and program |
US9361900B2 (en) | 2011-08-24 | 2016-06-07 | Sony Corporation | Encoding device and method, decoding device and method, and program |
WO2013027630A1 (ja) * | 2011-08-24 | 2013-02-28 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN103765510A (zh) * | 2011-08-24 | 2014-04-30 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CN103765510B (zh) * | 2011-08-24 | 2016-08-17 | 索尼公司 | 编码装置和方法、解码装置和方法 |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
US11705140B2 (en) | 2013-12-27 | 2023-07-18 | Sony Corporation | Decoding apparatus and method, and program |
CN111989953A (zh) * | 2018-04-18 | 2020-11-24 | 特瑞斯贝斯技术私人(Opc)有限公司 | 用于对移动设备中的功耗进行优化的系统和方法 |
CN111916090A (zh) * | 2020-08-17 | 2020-11-10 | 北京百瑞互联技术有限公司 | 一种lc3编码器近奈奎斯特频率信号检测方法、检测器、存储介质及设备 |
CN111916090B (zh) * | 2020-08-17 | 2024-03-05 | 北京百瑞互联技术股份有限公司 | 一种lc3编码器近奈奎斯特频率信号检测方法、检测器、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007333785A (ja) | オーディオ信号符号化装置およびオーディオ信号符号化方法 | |
RU2439720C1 (ru) | Способ и устройство для обработки звукового сигнала | |
EP1334484B1 (en) | Enhancing the performance of coding systems that use high frequency reconstruction methods | |
KR100949232B1 (ko) | 인코딩 장치, 디코딩 장치 및 그 방법 | |
JP5688852B2 (ja) | オーディオコーデックポストフィルタ | |
US8862463B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
JP5975243B2 (ja) | 符号化装置および方法、並びにプログラム | |
JP5942358B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
JP4272897B2 (ja) | 符号化装置、復号化装置およびその方法 | |
EP2056294A2 (en) | Apparatus, Medium and Method to Encode and Decode High Frequency Signal | |
WO2013027630A1 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
JP5719941B2 (ja) | オーディオ信号の効率的なエンコーディング/デコーディング | |
US20090192789A1 (en) | Method and apparatus for encoding/decoding audio signals | |
US9177569B2 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
US20100268542A1 (en) | Apparatus and method of audio encoding and decoding based on variable bit rate | |
JP5395250B2 (ja) | 音声コーデックの品質向上装置およびその方法 | |
US7444289B2 (en) | Audio decoding method and apparatus for reconstructing high frequency components with less computation | |
JP4973397B2 (ja) | 符号化装置および符号化方法、ならびに復号化装置および復号化方法 | |
JP2006023658A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
JP2007178529A (ja) | 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20081107 |