JP4399185B2 - 符号化装置および復号化装置 - Google Patents

符号化装置および復号化装置 Download PDF

Info

Publication number
JP4399185B2
JP4399185B2 JP2003099945A JP2003099945A JP4399185B2 JP 4399185 B2 JP4399185 B2 JP 4399185B2 JP 2003099945 A JP2003099945 A JP 2003099945A JP 2003099945 A JP2003099945 A JP 2003099945A JP 4399185 B2 JP4399185 B2 JP 4399185B2
Authority
JP
Japan
Prior art keywords
frequency
band
time
frequency spectrum
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003099945A
Other languages
English (en)
Other versions
JP2004004710A (ja
Inventor
峰生 津島
武志 則松
直也 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2003099945A priority Critical patent/JP4399185B2/ja
Publication of JP2004004710A publication Critical patent/JP2004004710A/ja
Application granted granted Critical
Publication of JP4399185B2 publication Critical patent/JP4399185B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号や音楽信号などのオーディオ信号に対して、直交変換等の手法を用いて、時間領域から周波数領域に変換した信号を、より少ない符号化列で符号化することにより情報を圧縮する符号化方法と、符号化列を入力として情報を伸長し、オーディオ信号を得る復号化方法に関するものである。
【0002】
【従来の技術】
オーディオ信号の符号化方法、および、復号化方法は現在までに非常に多くの方式が開発されている。特に昨今では、それらの中でもISO/IECで国際標準化されたIS13818−7が認知され、高音質で高効率な符号化方法として、評価されている。この符号化方式はAAC(Advanced Audio Coding)と呼ばれている。近年、前記AACがMPEG4と呼ばれる標準化にも採用され、前記IS13818−7に対して、いくつかの拡張機能を具備したMPEG4−AACと呼ばれる方式が策定されている。その中のINFORMATIVE PARTにその符号化過程の一例が記述されている。
【0003】
ここで図21を用いて、従来の符号化方法を用いたオーディオ符号化装置について説明する。図21は、従来の符号化装置100の構成を示すブロック図である。この符号化装置100は、時間‐周波数変換部101、スペクトル増幅部102、スペクトル量子化部103、ハフマン符号化部104および符号化列転送部105を含んで構成される。アナログオーディオ信号を所定の周波数でサンプリングすることによって得られた時間軸上のデジタルオーディオ信号は、一定時間間隔で一定サンプル数ずつに切り出され、時間‐周波数変換部101を経て、周波数軸上のデータに変換された後、符号化装置100の入力信号としてスペクトル増幅部102に与えられる。スペクトル増幅部102は、あらかじめ決められた帯域ごとにある1つのゲインをもって、前記帯域に含まれるスペクトルを増幅する。スペクトル量子化部103は、前出の増幅されたスペクトルを決められた変換式で量子化を行う。AAC方式の場合は、浮動小数で表現されている周波数スペクトル情報を整数値に丸めを行うことで量子化をおこなっている。ハフマン符号化部104は、前記量子化されたスペクトル情報を何個かごとにまとめてハフマン符号化した上、スペクトル増幅部102における前記所定帯域ごとのゲインおよび量子化の変換式を特定する情報などをハフマン符号化し、その符号を符号化列転送部105に送る。ハフマン符号化された符号化列は、符号化列転送部105から伝送路または記録媒体などを介して復号化装置に転送され、復号化装置によって時間軸上のオーディオ信号に再生される。従来の符号化装置はこのようにして動作する。
【0004】
【特許文献1】
米国特許WO98/57436
【0005】
【発明が解決しようとする課題】
しかしながら、上記従来の符号化装置100では、情報の圧縮能力がハフマン符号化部104などの性能に委ねられており、高い圧縮率で、つまり、少ない情報量で符号化を行う際には、前記スペクトル増幅部102で十分にゲインを大きくし、前記スペクトル量子化部103で得られる量子化スペクトル列が前記ハフマン符号化部104で少ない情報量となるように符号化する必要がある。このような方法に従って、少ない情報量となるように符号化を行うと、再生される音声および音楽の周波数帯域が実効的に狭くなってしまう。このため、聴感上こもった感じが否めず、十分な音質を確保できないという問題が生じる。
【0006】
また、上記従来の符号化装置100では、時間‐周波数変換部101において、時間軸上で表現された入力信号が予め決められた間隔(サンプル数)ごとに、周波数軸上に表現される周波数スペクトルへと変換される。従って、この後段で符号化のために量子化される信号は周波数軸上のスペクトルである。量子化処理では、周波数スペクトルの小数値を整数値に丸める処理などによって量子化誤差を生じることを避けられないのであるが、周波数軸上の信号に生じた量子化誤差を周波数軸上で評価することは容易である反面、時間軸上で評価することは困難である。このために、時間軸上に反映される量子化誤差を評価して、符号化装置の時間分解能を向上させることは容易ではない。また、符号化に割り当て可能な情報量が十分に多ければ、周波数分解能と時間分解能の両者を容易に向上させることが可能であるが、符号化に割り当てる情報量を小さくした場合には、両者を向上させることは非常に困難である。
【0007】
本発明は、上記課題に鑑み、符号化装置ではオーディオ信号を高い圧縮率、かつ、高い時間分解能で符号化し、復号化装置では広帯域な周波数スペクトル情報を復号化できる符号化装置および復号化装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明の符号化装置は、入力される原信号を時間‐周波数変換して得られる周波数領域の信号を符号化し、出力信号を生成する符号化装置であって、入力原信号の特性に基づいて、周波数スペクトルの一部の帯域を特定する第1の帯域特定手段と、特定された帯域の信号を、周波数−時間変換した信号に変換する時間変換手段と、前記時間変換手段によって得られる信号と、前記周波数スペクトルの少なくとも一部とを符号化し、符号化された前記信号および前記周波数スペクトルから出力信号を生成する符号化手段とを備える。
【0009】
また、本発明の復号化装置は、時間領域の離散信号を符号化して得られた符号化列を復号化し、周波数スペクトルを出力する復号化装置であって、入力された符号化列に含まれる一部の符号化列を抽出し、抽出された符号化列を復号化する復号化手段と、抽出された符号化列を復号化して得られた信号を、周波数スペクトルに変換する周波数変換手段と、入力された符号化列の他の部分から抽出された符号化列を復号化して得られた周波数スペクトルと、前記周波数変換手段によって得られた周波数スペクトルとを周波数軸上で合成する合成手段とを備える。
【0010】
【発明の実施の形態】
以下、本発明の実施の形態における符号化装置および復号化装置について、図面(図1〜図20)を用いて説明する。
【0011】
(実施の形態1)
図1は本発明の実施の形態1における符号化装置200の構成を示すブロック図である。符号化装置200は、時間軸上で表されるオーディオ入力信号の時間特性を抽出し、抽出された時間特性に基づいて、周波数スペクトルの一部を時間領域の信号に部分的に変換して符号化する符号化装置であって、時間‐周波数変換部201、周波数特性抽出部202、時間特性抽出部203、時間変換部204および符号化列生成部205を備える。
【0012】
時間−周波数変換部201は、オーディオ入力信号を、ある時間間隔ごとに時間軸上の離散信号から周波数スペクトル情報に変換する。より具体的には、時間‐周波数変換部201は、時間領域のオーディオ信号を、例えば、1フレーム(1024サンプル)を単位として一度に変換し、変換結果としては、1024サンプルの周波数スペクトル係数などを生成する。時間‐周波数変換としてはMDCT変換などが用いられ、変換結果としてはMDCT係数などがあげられる。このうち、時間特性抽出部203によって特定された帯域の複数の周波数スペクトル係数を時間変換部204に出力し、それ以外の帯域の周波数スペクトル係数を周波数特性抽出部202に出力する。
【0013】
周波数特性抽出部202は、周波数スペクトルの周波数特性を抽出し、抽出した特性に基づき、周波数領域において量子化および符号化した場合に符号化効率がよくない帯域を選出し、時間‐周波数変換部201の出力である周波数スペクトルから切り出して時間変換部204に出力する。それ以外の帯域の周波数スペクトルは符号化列生成部205に入力される。
【0014】
時間特性抽出部203は、オーディオ入力信号の時間的特性を調べ、符号化列生成部205における量子化の際に時間分解能を優先すべきか周波数分解能を優先すべきかを判定し、時間分解能を優先すべきと判定された周波数帯域を特定する。時間変換部204は、時間分解能を優先すべきと判定された帯域の周波数スペクトルおよび周波数特性抽出部202によって選出された帯域の周波数スペクトルを、完全に可逆な変換式を用いて、周波数スペクトル係数の時間変化として表される時間周波数信号に変換する。
【0015】
符号化列生成部205は、結果的に、時間−周波数変換部201から入力される周波数スペクトルと時間変換部204から入力される時間周波数信号とを量子化した後、符号化する。さらに、符号化列生成部205は、符号化された符号化データにヘッダなどの付加情報を付して所定のフォーマットに従う符号化列を生成し、生成された符号化列を符号化装置200の外部に出力する。
【0016】
図2は、図1に示した時間‐周波数変換部201による時間周波数変換の一例を示す図である。時間‐周波数変換部201は、例えば、図2のように、時間軸上の離散信号を、一定時間ごとに重複を許して切り出し、変換を実行する。図2では、N番目(Nは正の整数)のフレームに対し、2分の1フレームの重複を許して(N+1)番目のフレームを切り出し、変換する場合を示している。一般に、時間−周波数変換部201は、変形離散余弦変換(Modified Discrete Cosine Transform)いわゆるMDCT変換によって変換を行う。しかしながら、時間−周波数変換部201による変換方法は、MDCT変換に限定されるものではなく、ポリフェーズフィルターでもよいし、フーリエ変換などでもよい。MDCT変換、ポリフェーズフィルター、フーリエ変換はいずれも当業者には公知であるので説明を省略する。
【0017】
図3(a)は、時間−周波数変換部201に入力される時間領域のオーディオ信号の図である。同図において、第Nフレームに相当する部分の信号が一度に周波数変換されるとする。図3(b)は、図3(a)に示した第Nフレームのオーディオ信号を一度に時間‐周波数変換して得られる周波数スペクトルを示す図である。同図は、縦軸に周波数、横軸にその周波数に対する周波数スペクトル係数の値をプロットしたものである。このように、第Nフレームに対する時間領域の信号は、周波数領域の信号へと変換される。図3(b)に示される周波数スペクトルは、図3(a)に示した1フレーム時間内のオーディオ信号に含まれる周波数成分の特徴を示している。
【0018】
なお、時間−周波数変換部201としてMDCT変換を用いる場合、時間領域の信号と、周波数領域の信号との実効的なサンプル数は同じとなる。実効的なサンプル数とは、MDCT変換の場合、図3(a)に示される第Nフレームのサンプル数が2048サンプルの場合、図3(b)で示される独立な周波数係数(MDCT係数)は1024サンプルである。しかしながら、MDCT変換は図2で示すように2分の1フレームずつオーバーラップするアルゴリズムであるので、図3(a)で新しく入力されるサンプル数は1024サンプルとなる。よって、図3(a)のサンプル数と図3(b)のサンプル数は情報の数としては同じと考えられ、これをもって実効的なサンプル数を1024とする。第Nフレームの実効的なサンプル数は、前記のように1024でもいいし、128などでもよいし、任意の値でよい。この値は、本発明の符号化装置200と復号化装置との間であらかじめ取り決められる。
【0019】
一方、オーディオ入力信号は、時間‐周波数変換部201以外に時間特性抽出部203へも入力される。時間特性抽出部203では、与えられたオーディオ入力信号の時間変化を調べ、オーディオ入力信号が量子化される際に、時間分解能が優先されるべきか周波数分解能が優先されるべきかを判定する。すなわち、時間特性抽出部203は、オーディオ入力信号を周波数領域で量子化すべきか、時間領域で量子化すべきかを決定する。時間領域で量子化するとは、時間領域の信号によってオーディオ入力信号の時間変化を復号化装置に伝えることを意味する。
【0020】
さらに、これは、量子化が量子化誤差をともない、その誤差値が、周波数領域で量子化を行った場合には周波数領域の一定値の範囲に留まるが、時間領域ではどのような値の範囲に分布するかを把握が困難であることに基づく。すなわち、周波数領域で量子化を行った場合には周波数分解能が高く、時間領域で量子化を行った場合には時間分解能が高くすることが可能という理由による。
【0021】
また、一般に、与えられたオーディオ入力信号の1フレームを、複数の時間的なサブフレームに分割した際に、各々のサブフレームに属する信号の平均エネルギーが隣接サブフレームの平均エネルギーと比べて大きく変動した場合は、オーディオ入力信号にアタックなどの急激な音量変化があったと考えられる。このような場合には、時間領域に量子化誤差が拡散することは好ましくない。このため、時間特性抽出部203は、このような帯域の量子化において周波数分解能よりも、時間分解能を優先すべきと判定する。時間特性抽出部203が平均エネルギーの変動が大きいと判定する閾値(例えば、隣接サブフレーム間の平均エネルギーの差分の閾値)は、符号化装置の実装方法に応じて定められる。
【0022】
次いで、時間特性抽出部203は、オーディオ入力信号において、時間領域で量子化を行うべき帯域を特定する。帯域および帯域幅の選定は、これらに限定されない。帯域の特定方法は、まず、サブフレーム内で、時間領域において最大振幅を与えるサンプルを含む信号(ピーク信号)を特定し、そのピーク信号の周波数を計算する。さらに、時間特性抽出部203は、例えば、ピーク信号の大きさに応じて帯域幅を決定し、計算の結果得られた周波数またはそれに近い周波数を含み、決定された帯域幅の帯域を特定する。時間特性抽出部203では、時間分解能を優先すべきか周波数分解能を優先すべきかの判定結果と特定された帯域とを示す情報を、時間−周波数変換部201および符号化列生成部205に出力する。
【0023】
周波数特性抽出部202は、時間‐周波数変換部201の出力信号である周波数スペクトルの特性を調べ、時間領域で量子化した方が好ましい帯域を特定する。例えば、符号化列生成部205における符号化効率を考慮すると、周波数スペクトルにおいて隣接する周波数スペクトル係数の分散が大きい帯域、または、隣接する周波数スペクトル係数の正負の符号が頻繁に切り替わる帯域などでは符号化効率が向上しない場合が多い。このため、周波数特性抽出部202は、入力される周波数スペクトルからこれに該当する帯域を切り出して時間変換部204に出力し、該当しない帯域についてはそのまま符号化列生成部205に出力する。併せて、時間変換部204に出力した帯域を特定するための情報を符号化列生成部205に出力する。
【0024】
符号化列生成部205では、周波数特性抽出部202の出力信号(周波数スペクトルおよび帯域を特定する情報)と、時間特性抽出部203の判定結果およびその帯域を特定する情報と、時間変換部204の出力信号(周波数時間信号)とを合成して、符号化列を生成する。
【0025】
図4(a)は、図3(a)と同様の時間軸上のオーディオ信号において、第Nフレームを前半のサブフレーム1と後半のサブフレーム2とに分割した様子を示す図である。同図では、サブフレーム1とサブフレーム2との長さは同じである場合を示しているが、サブフレーム1とサブフレーム2との長さは同じでなくともよいし、重複を許してもよい。なお、以後は、説明を簡単にするために、図4で図示したものと同様に、サブフレーム1とサブフレーム2との長さが同じ場合について述べる。
【0026】
図4(b)は、図4(a)に示したサブフレーム1の時間領域のオーディオ信号を周波数領域の信号へ変換して得られた周波数スペクトルを示す図である。また、図4(c)は、図4(a)に示したサブフレーム2の時間領域のオーディオ信号を周波数領域の信号へ変換して得られた周波数スペクトルを示す図である。時間領域から周波数領域への変換は、各々のサブフレームのオーディオ信号のみを用いて変換し、変換によって得られた周波数領域の信号(周波数スペクトル)は、その逆変換(周波数‐時間変換)を行うことで、元の時間領域の信号へ完全に復元できるものとする。このような周波数変換としては、離散フーリエ変換や離散コサイン変換などがあるが、これらは当業者には公知であるので説明を省略する。また、前述のMDCT変換は、時間的なオーバーラップを有するフレームの時間領域の信号に対して、周波数領域の信号に変換するものであるが、時間領域の信号の再構成に遅延を要するので、図4(b)および図4(c)の周波数スペクトルを導出する場合には使用しない。同様に遅延が生じる理由から、ポリフェーズフィルターなども用いない。
【0027】
図4(b)および図4(c)の周波数スペクトルは、第Nフレームを前半と後半とに分割しているのでそれぞれサブフレーム1とサブフレーム2とに含まれるサンプル数は、1フレームの1/2である。図4(a)および図4(b)の周波数スペクトルは、それぞれ1フレームの半分のサンプル数で、すなわち、周波数軸方向に2倍のサンプル間隔で、図3(b)に示した帯域と同じ帯域における周波数成分の割合の変化を示している。図3(b)に示したように、1フレームのオーディオ入力信号を一度に時間‐周波数変換すると、1フレームのオーディオ入力信号全体に含まれる周波数成分の割合を示す周波数スペクトルが得られるが、図4(b)および図4(c)に示すように、1フレームのオーディオ入力信号を前半と後半とに分割してそれぞれ時間‐周波数変換すると、オーディオ入力信号の第Nフレームにおいて、前半と後半とではそれぞれの部分のオーディオ信号に含まれる周波数成分の割合が異なっていることがわかる。すなわち、図4(b)および図4(c)に示した周波数スペクトルは、第Nフレームの前半と後半とにおけるオーディオ信号の周波数成分の割合の時間的変化を表している。
【0028】
上記図4(b)および図4(c)においては、第Nフレームを2つのサブフレームに分割して各サブフレームを時間‐周波数変換した場合の周波数スペクトルの例を示したが、以下では、第Nフレームをさらに細かく(M+1)個のサブフレームに分割した場合について図5(a)および図5(b)を用いて説明する。図5(a)は、図3(a)と同様の時間領域のオーディオ信号(第Nフレーム)を(M+1)個のサブフレームに分割した様子を示す図である。
【0029】
図5(b)は、1フレームのオーディオ入力信号を(M+1)個のサブフレームに分割し、サブフレームごとに時間‐周波数変換することによって得られる周波数スペクトルを示す図である。図5(a)および図5(b)において、任意番目(たとえばP(Pは整数)番目)のサブフレームの時間領域の信号SubPは、少なくとも同じかそれ以上のサンプル数からなる周波数スペクトル係数Spect_SubPに変換される。以下では、説明を簡単にするために、同数のサンプル数からなる周波数スペクトルに変換されるものとする。このように、図5(b)に示す(M+1)個の周波数スペクトル(周波数スペクトル係数Spect_Sub0〜周波数スペクトル係数Spect_SubM)は、図4(b)および図4(c)に示した周波数スペクトルと比較すると、周波数軸方向にはサンプル間隔がより大きくなるが、時間軸方向にはより細かく第Nフレーム内の周波数成分の時間変化を表しているといえる。
【0030】
次に、図6(a)および図6(b)を用いて、1フレームのオーディオ入力信号を時間‐周波数変換することによって得られる周波数スペクトルと、サブフレームごとに時間周波数変換することによって得られる周波数スペクトルとの対応を説明する。図6(a)は、1フレームのオーディオ信号を一度に時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandAに含まれるサンプルを示す図である。図6(a)の周波数スペクトルは、図3(b)に示した周波数スペクトルと同一である。
【0031】
また、図6(b)は、1フレームのオーディオ入力信号を(M+1)個のサブフレームに分割し、サブフレームごとに時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandBに含まれるサンプルを示す図である。すなわち、図6(b)の周波数スペクトルは、図5(b)に示した周波数スペクトルと同一である。図6(a)の周波数スペクトルにおける周波数バンドBandAと、図6(b)の周波数スペクトルにおける周波数バンドBandBとは、同一の周波数帯域を示している。すなわち、1フレーム全体では、周波数バンドBandAに含まれるサンプル数と周波数バンドBandBに含まれるサンプル数とは同数である。このことは図6(a)の周波数バンドBandA内の周波数スペクトル係数(図中では黒色ひし形)と、図6(b)の周波数バンドBandB内のすべてのサブフレーム中の周波数スペクトル係数(図中では黒色ひし形)とが、ほぼ等価の情報に相当することを示している。
【0032】
ここでは、周波数バンドBandA内の周波数スペクトル係数を、変換式を用いて時間変換することによって、周波数バンドBandB内の周波数スペクトル係数と完全に一致する周波数スペクトル係数が得られる必要はなく、周波数バンドBandA内の周波数スペクトル係数が周波数バンドBandB内の周波数スペクトル係数に相当することが重要である。したがって、周波数バンドBandA内の各サンプル(周波数スペクトル係数)を表現することは、周波数バンドBandB内のすべてのサブバンドにあるサンプル(周波数スペクトル係数)を表現することに置き換えて考えることができる。
【0033】
よって、本発明の実施の形態1の符号化装置200では、時間分解能を優先すると判定された周波数バンドBandAについては、周波数バンドBandAの周波数スペクトル係数を量子化し符号化する代わりに、周波数バンドBandBの周波数スペクトル係数を量子化し符号化する。すなわち、時間変換部204は、時間‐周波数変換部201によって得られた周波数スペクトルのうち、時間分解能を優先すると判定された周波数バンドBandAに対して、例えば、DCT変換の逆変換(周波数‐時間変換)に相当するような変換式を適用し、図6(b)に示す周波数バンドBandB内の全サンプル(周波数スペクトル係数)に相当する周波数スペクトル係数を出力する。
【0034】
以下では、時間変換部204による時間変換方法をより分かりやすく説明するために、図6(a)および図6(b)に示した周波数バンドBandAと周波数バンドBandBとの帯域幅を、図7(a)および図7(b)を用いて周波数バンドBandDに属するサンプルが各サブバンドについて1つあるように周波数バンドBandDの幅を選んだ場合について説明する。図7(a)は、1フレームのオーディオ信号を一度に時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandC内のサンプルを示す図である。
【0035】
図7(b)は、1フレームのオーディオ入力信号を(M+1)個のサブフレームに分割し、サブフレームごとに時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandD内のサンプルを示す図である。図7(a)の周波数スペクトルは、図3(b)に示した周波数スペクトルと同じであり、図7(b)の周波数スペクトルは、図5(b)に示した周波数スペクトルと同じである。また、図7(a)の周波数スペクトルにおける周波数バンドBandCと、図7(b)の周波数スペクトルにおける周波数バンドBandDとは、同一の周波数帯域を示している。
【0036】
図7(b)において、周波数バンドBandDに属するサンプル(周波数スペクトル係数)が(M+1)個の各サブバンドについて1つあるように周波数バンドBandDを選ぶとき、図7(a)に示した周波数スペクトルにおいて同じ周波数帯域である周波数バンドBandC内のサンプル数は、(M+1)個である。図7(b)に示す周波数バンドBandDに属するサンプルは、(M+1)個の各サブフレームから1つずつ選出されているので、横軸に時間、縦軸に周波数スペクトル係数をとって前記各サンプルをプロットすれば、それはオーディオ信号1フレームにおいて、周波数バンドBandC内に属する1つの周波数スペクトル係数の時間変化を表しているといえる。
【0037】
図8(a)は、図7(a)と同様、1フレームのオーディオ信号を一度に時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandC内のサンプルを示す図である。図8(b)は、横軸を時間、縦軸を周波数スペクトル係数値として、図7(b)に示した各サンプル(周波数スペクトル係数)をプロットし直した図である。すでに説明したように、(M+1)個の各サブフレームにおける同一周波数バンドBandDから1サンプルずつ抽出し、図8(b)のようにプロットした信号は、時間変換部204によって得られる時間周波数信号に相当し、当該周波数バンドBandDの周波数スペクトル係数の時間変化を表す時間周波数信号である。
【0038】
このように、図8(a)に示された周波数バンドBandC内の各サンプル(周波数スペクトル係数)は、図8(b)の時間周波数信号(周波数バンドBandD)とほぼ同じ情報として扱うことができる。従って、以後の説明では、図8(a)の周波数スペクトル係数を量子化することを、「Qfする」と表現し、図8(b)の時間周波数信号を量子化することを、「Qtする」と表現することにする。
【0039】
本発明の実施の形態1の符号化装置200において、図1に示した時間変換部204では、時間‐周波数変換部201によって得られる周波数スペクトルの一部の周波数スペクトル係数、すなわち、図8(a)の周波数バンドBandCに含まれる周波数スペクトル係数列を、図8(b)に示される時間領域の時間周波数信号へと変換する。この変換の過程は、前に説明した図7(a)の周波数バンドBandCに含まれる周波数スペクトル係数列を、図7(b)の周波数バンドBandDに含まれる周波数スペクトル係数列へ変換することに相当する。または、図6(a)の周波数バンドBandAの周波数スペクトル係数列を、図6(b)の周波数バンドBandBの周波数スペクトル係数列へ変換することに相当する。
【0040】
図1に示した符号化列生成部205では、時間‐周波数変換部201からの出力と、上記のように変換された時間変換部204からの出力とを、量子化して符号化し、符号化列を出力する。なお、符号化列生成部205における量子化および符号化の具体的方法は、ハフマン符号化やベクトル量子化などの公知の技術を用いて行う。
【0041】
また、符号化列生成部205は、例えば、振幅変化の少ない部分における時間周波数信号のサンプルをいくつかずつ組にして、それぞれの平均ゲインなどを量子化し符号化するとしてもよい。図9は、図1に示した符号化列生成部205による時間周波数信号の符号化を示す図である。図9に示すように、符号化列生成部205は、例えば、周波数スペクトル係数Spec_Sub0から周波数スペクトル係数Spec_Sub2までのサンプルの組と、周波数スペクトル係数Spec_Sub3から周波数スペクトル係数Spec_SubMまでのサンプルの組とのそれぞれについて、平均ゲインGt1と平均ゲインGt2とを求め、周波数スペクトル係数Spec_Sub0から周波数スペクトル係数Spec_SubMまでの時間周波数信号そのものを量子化および符号化する代わりに、前記各サンプルの組を特定する情報と、それぞれの組の平均ゲインとを量子化および符号化する。
【0042】
この場合、符号化装置200と、その出力である符号化列を復号化する復号化装置との間であらかじめ、時間周波数信号を、例えば、(サンプルの組の先頭サンプルの番号、サンプルの組の末尾サンプルの番号、サンプルの組の平均ゲイン)で表すと定めておけば、図9に示す時間周波数信号は、(0、2、Gt1)と(3、M、Gt2)との2つの組の情報で表すことができる。また、この場合、時間周波数信号の各サンプルをもれなく組にする必要はなく、振幅変化の少ない部分だけを組にし、振幅変化の激しい部分は各サンプルの周波数スペクトル係数値そのものを量子化および符号化するとしてもよい。
【0043】
さらに符号化列生成部205では、時間‐周波数変換部201の出力のうち、いずれの帯域を時間変換したかを示す情報を符号化列とともに出力する。図10は、時間‐周波数変換部201の出力信号と時間変換部204によって時間変換された帯域を示す情報との対応を示す図である。同図において、縦軸は周波数、横軸は縦軸の周波数に対応する周波数スペクトル係数を示している。なお、時間‐周波数変換部201においてMDCT変換を用いた場合には、同図の周波数スペクトル係数はMDCT係数を示している。
【0044】
また、時間‐周波数変換部201の出力信号である周波数スペクトルにおいて、破線部分は、符号化列生成部205によって量子化および符号化されないことを示している。代わりに、符号化列生成部205では、この帯域に対応する時間周波数信号が量子化および符号化される。同図では、周波数軸方向を5つの帯域に分割し、低域側からQf、Qt、Qf、Qt、Qfの順で量子化を行う場合の例を記載している。このように、符号化列生成部205から出力される符号化列には、それぞれの帯域が時間領域で量子化され符号化されたか、周波数領域で量子化され符号化されたかを示す情報と、それぞれの帯域において量子化され符号化された情報が少なくとも含まれる。なお、符号化装置200における帯域の分割の個数や各帯域の量子化方法(QfであるかQtであるか)などは、固定的なものではなく、この例に限定されない。
【0045】
図11は、本発明の実施の形態1における復号化装置1200の構成を示すブロック図である。この復号化装置1200は、符号化装置200によって出力された符号化列を復号化し、時間分解能に優れたオーディオ信号を出力する復号化装置であって、符号化列分離部1201、時間周波数信号生成部1202、周波数変換部1203、周波数スペクトル生成部1204および周波数‐時間変換部1205を備える。
【0046】
符号化列分離部1201は、入力信号である符号化列から、「Qf」で示される帯域の符号化データと、「Qt」で示される帯域の符号化データとを分離し、「Qf」で示される帯域の符号化データを周波数スペクトル生成部1204に出力し、「Qt」で示される帯域の符号化データを時間周波数信号生成部1202に出力する。「Qf」で示される帯域の符号化データは、符号化装置200において周波数領域で量子化および符号化されたデータである。「Qt」で示される帯域の符号化データは、符号化装置200において時間領域で量子化および符号化されたデータである。
【0047】
周波数スペクトル生成部1204は、入力された符号化データを復号化し、それをさらに逆量子化して、周波数軸上の周波数スペクトルを生成する。一方、時間周波数信号生成部1202は、入力された符号化データを復号化し、それを逆量子化して、時間軸上の時間周波数信号を一時的に生成する。一時的に生成された時間周波数信号は、周波数変換部1203に入力される。周波数変換部1203は、符号化装置200の時間変換部204が用いた変換式の逆変換に相当する変換式を用いて、入力された時間周波数信号を、時間領域の周波数スペクトル係数から周波数領域の周波数スペクトル係数へと1フレームよりも少ないサンプル数を単位として変換する。このように1フレームのうちの部分的な変換結果として得られた周波数スペクトル係数には、時間周波数信号で表されていた時間変化を表す情報が反映されており、この周波数スペクトル係数は、周波数‐時間変換部1205に出力される。
【0048】
周波数‐時間変換部1205では、周波数スペクトル生成部1204と周波数変換部1203とからの出力信号である周波数領域の周波数スペクトルを周波数軸上に合成して、時間軸上のオーディオ信号へと変換する。これによって、時間周波数信号で表された時間成分を周波数スペクトル生成部1204からの出力である周波数スペクトルに反映することができ、時間分解能に優れたオーディオ信号を得ることができる。なお、周波数‐時間変換部1205では、符号化装置200でおこなった時間−周波数変換部201の逆過程である変換方法を用いる。例えば、符号化装置200の時間−周波数変換部201がMDCT変換なら、周波数‐時間変換部1205は逆MDCT変換である。このようにして得られた周波数‐時間変換部1205の出力は、例えば、電圧の離散的時間変化で表されるオーディオ出力信号となる。
【0049】
以上のように、本発明の実施の形態1の符号化装置200および復号化装置1200によれば、ある時間フレーム内のオーディオ信号を、任意の帯域について、時間領域で符号化するか周波数領域で符号化するかを選択することができる。したがって、周波数領域のみの符号化方法や、時間領域のみの符号化方法よりも、符号化の自由度が高く、かつ、効率的に符号化できる可能性がある。その結果、与えられた情報量の中で多くの情報を符号化することができ、再生されるオーディオ信号の高音質化を図ることができる。
【0050】
なお、実施の形態1において、時間特性抽出部203は、サブフレーム間の平均エネルギーの変化(すなわち、隣接するサブフレーム間の差分)があらかじめ定めた閾値よりも大きい場合に時間分解能を優先すべきと判定したが、時間特性抽出部203が時間分解能を優先すべきか周波数分解能を優先すべきかの判定を行う判定規準は上記の方法に限定されない。また、上記実施の形態1では、周波数特性抽出部202は、周波数スペクトルにおいて隣接する周波数スペクトル係数の分散が大きい帯域、または、正負の符号が頻繁に切り替わる帯域を、時間領域で量子化すべきと判定したが、この判定においても判定規準は上記の方法に限定されない。
【0051】
(実施の形態2)
次に本発明の実施の形態2について説明する。実施の形態2は、量子化方法および符号化方法が実施の形態1と異なる。実施の形態1においては、1フレームずつ周波数領域へと変換されたオーディオ入力信号を、1フレームのある帯域はそのまま量子化し、ある帯域は時間領域に再度変換する手法で、その時間領域の信号を量子化したが、本発明の実施の形態2においては、選択された帯域の信号だけで量子化と符号化を行うのではなく、他の帯域の信号を利用して量子化と符号化とを行う。
【0052】
図12は、本発明の実施の形態2における符号化装置1300の構成を示すブロック図である。この符号化装置1300は、時間‐周波数変換部1301、周波数特性抽出部1302、時間特性抽出部1303、量子化および符号化部1304、参照帯域決定部1305、時間変換部1306、時間合成符号化部1307、周波数合成符号化部1308および符号化列生成部1309を備える。同図において、時間‐周波数変換部1301、周波数特性抽出部1302、時間特性抽出部1303および時間変換部1306は、それぞれ図1に示した符号化装置200の時間−周波数変換部201、周波数特性抽出部202、時間特性抽出部203および時間変換部204とほぼ同じものである。
【0053】
オーディオ入力信号は、ある時間長のフレームごとに、時間‐周波数変換部1301および時間特性抽出部1303へ入力される。時間‐周波数変換部1301は、入力された時間領域の信号を周波数領域の信号へと変換する。時間‐周波数変換部1301は、例えば、MDCT変換を用いてMDCT係数を得る。
【0054】
周波数特性抽出部1302は、時間‐周波数変換部201の出力である、フレームごとに変換された周波数スペクトル係数の周波数特性を調べ、図1に示した周波数特性抽出部202と同様にして、時間分解能を優先して量子化した方が好ましい帯域を特定する。
【0055】
時間特性抽出部1303は、フレームごとに入力されたオーディオ信号を、時間分解能を優先して量子化すべきか、周波数分解能を優先して量子化すべきかを、図1に示した時間特性抽出部203と同様にして判定する。時間特性抽出部1303では、入力された信号のすべての帯域を同じ時間分解能や周波数分解能で量子化し符号化する必要はないので、サブフレームまたは周波数帯域ごとに判定することができる。
【0056】
量子化および符号化部1304は、時間‐周波数変換部1301で得られる周波数領域の信号(周波数スペクトル係数)のうち、あらかじめ定めたバンドごとの信号について量子化を行い符号化する。この量子化および符号化部1304は、当業者に公知な技術、たとえばベクトル量子化およびハフマン符号化などを用いて量子化および符号化する。量子化および符号化部1304は、図示されないメモリを内部に備え、符号化済みの符号化列および符号化前の周波数スペクトルをメモリに保持し、参照帯域決定部1305によって決定された帯域の符号化列または符号化前の周波数スペクトルを、参照帯域決定部1305に出力する。
【0057】
参照帯域決定部1305は、周波数特性抽出部1302および時間特性抽出部1303の判定結果に従って、量子化および符号化部1304の出力である符号化列のうち、周波数特性抽出部1302および時間特性抽出部1303によって特定された帯域に参照されるべき帯域を決定する。具体的には、参照帯域決定部1305は、時間特性抽出部1303によって特定された帯域について、最初に特定された1つの帯域だけを他の帯域を参照しないで時間領域で量子化および符号化し、残りの帯域はその帯域の周波数スペクトルを参照し、時間領域で符号化するものとする。
【0058】
さらに、参照帯域決定部1305は、周波数特性抽出部1302によって特定された帯域について、周波数特性抽出部1302によって特定された帯域間で、整数倍の信号成分に相当する(倍音関係にある)周波数スペクトル係数が含まれている場合、その周波数スペクトル係数を含む帯域間で、例えば、最も低い周波数の成分(周波数スペクトル係数)を含む帯域のみ周波数領域において量子化および符号化する。例えば、周波数特性抽出部1302によって特定された帯域にそれぞれ、8kHz、16kHzおよび24kHzの周波数成分が含まれている場合には、8kHzの周波数成分を含んでいる帯域のみ量子化および符号化する。
【0059】
それ以外の帯域、例えば、16kHzの周波数成分を含む帯域と24kHzの周波数成分を含む帯域とでは、最も低い周波数(8kHz)の成分(周波数スペクトル係数)を含む帯域を被参照帯域として、それを参照して周波数領域で符号化すると決定する。周波数特性抽出部1302によって特定された帯域間で倍音に相当する周波数スペクトル係数が含まれていない場合には、それらの帯域を他の帯域を参照することなく、時間領域で量子化および符号化すると決定する。
【0060】
次に、図13から図15を用いて、参照帯域決定部1305の動作を説明する。図13は、他の帯域を参照して対象帯域の符号化列を生成する方法の一例を示す図である。同図において縦軸は周波数を示し、横軸はその周波数に対する周波数スペクトル係数の値を示している。図13において、周波数バンドBase1および周波数バンドBase2は、いずれも量子化および符号化部1304にてすでにその周波数領域信号(周波数スペクトル)の係数を量子化され、符号化されている帯域の一部である。
【0061】
一方、「Qt1」および「Qf2」に示された帯域の信号は、それぞれ周波数バンドBase1、周波数バンドBase2の周波数スペクトル係数を用いて量子化し符号化することを意味している。例えば、「Qt1」は、周波数バンドBase1の信号を用いて、時間領域変換での量子化と符号化を行うことを意図しており、「Qf2」なる帯域は、Base2の信号を用いて、周波数領域での量子化と符号化を行うことを意図している。
【0062】
さらに、「Qt1」をBase1の帯域信号を用いて表現する際のパラメータをパラメータGt1、「Qf2」を周波数バンドBase2の帯域信号を用いて表現する際のパラメータをパラメータGf2としている。つまり、「Qt1」の帯域の信号は、周波数バンドBase1の帯域の信号を時間領域で表現したものと、パラメータGt1で表現されるものとで、量子化し符号化することを意味し、「Qf2」の帯域の信号は、Base2の帯域の信号を周波数領域で表現したもの(すでに周波数領域での表現なので変換は不要)と、パラメータGf2で表現されるものとで、量子化し符号化することを意味する。帯域の分割方法や順序、個数などはこれらに限定されない。
【0063】
図14は、他の帯域を参照して対象帯域の符号化列を生成する方法の他の例を示す図である。また、図14の場合のように、「Qt」の信号は、すでに量子化および符号化部1304にて、量子化と符号化をされた周波数バンドBase1と周波数バンドBase2の2つの帯域の両方(時間領域の表現)を用いて、パラメータGt1とパラメータGt2をそれぞれ用いて、その加算和で表現されるとしてもよい。図15は、他の帯域を参照して対象帯域の符号化列を生成する方法のさらに他の例を示す図である。
【0064】
また、図15の場合のように、「Qf」の信号は、すでに量子化および符号化部1304にて、量子化と符号化をされた周波数バンドBase1と周波数バンドBase2の2つの帯域の両方(周波数領域の表現)を用いて、パラメータGf1とパラメータGf2とをそれぞれ用いて、その加算和で表現されるとしてもよい。図14、図15のいずれの場合も、ある周波数バンドを、すでに量子化および符号化された2つの帯域の信号を用いて、量子化および符号化する場合について図示したが、帯域の数は2つに限定されない。
【0065】
参照帯域決定部1305では、1フレームの周波数スペクトル係数のうち、時間特性抽出部203によって特定された、量子化および符号化の対象となる帯域(対象帯域)を、すでに量子化および符号化部1304によって量子化および符号化された帯域(被参照帯域)のいずれの帯域を用いて表現し、量子化と符号化を行うかを決定する。
【0066】
次に、周波数合成符号化部1308について図16を用いて説明する。図16は、対象領域の周波数スペクトルを、すでに量子化および符号化された被参照帯域の符号化列を用いて周波数領域で合成する方法の一例を示す図である。前述のように、被参照帯域と対象帯域の信号が、参照帯域決定部1305で選出されているとする。
【0067】
図16において、帯域Aが被参照帯域であり、帯域Bが対象帯域とする。説明を簡単にするために、帯域Aと帯域Bとの信号がそれぞれ同じ要素数からなっており、それぞれベクトルFa、ベクトルFbと表記されるものとする。さらに、ベクトルFaはFa=(Fa0,Fa1)、ベクトルFbはFb=(Fb0,Fb1)のように2つのベクトルに分割されるものとする。Fa0、Fa1、Fb0、Fb1もベクトルであり、Fa0の要素数とFb0の要素数が同じで、Fa1の要素数とFb1の要素数が同じとする。Fa0とFa1の要素数は同じでも同じでなくてもよい。また、パラメータGb = ( Gb0,Gb1 )を定義する。パラメータGbはベクトルであるが、Gb0,Gb1はスカラー値である。ベクトルFbの近似ベクトルFb'を、ベクトルFaとパラメータGbとを用いて、数式1のように定義する。
【数式1】
Figure 0004399185
【0068】
このようにして、対象帯域Bに対する周波数領域の信号を、被参照帯域Aの周波数領域の信号と、合成比率の制御を行うパラメータGbとの積によって合成する。さらに、周波数合成符号化部1308は、ある対象帯域がどの被参照帯域で表現されるかを示す情報と、被参照帯域に対してゲイン制御に用いられるパラメータGbとを量子化し符号化する。説明を簡単にするために、対象帯域、被参照帯域を2つのベクトルに分割する場合について述べたが、分割は1つでも、3つ以上でもよい。また、帯域の分割も均一でも不均一でもよい。
【0069】
次に、時間合成符号化部1307について、図17を用いて説明する。図17は、対象領域の周波数スペクトルを、すでに量子化および符号化された被参照帯域の符号化列を用いて時間領域で合成する方法の一例を示す図である。前述のように、被参照帯域の信号と対象帯域の信号とが、参照帯域決定部1305で選出されているとする。図17において、帯域Aが被参照帯域であり、帯域Bが対象帯域であるとする。また、説明を簡単にするために、帯域Aの信号と帯域Bの信号とがそれぞれ同じ要素数からなっているとする。
【0070】
時間変換部1306は、帯域Aおよび帯域Bの周波数領域の信号を、実施の形態1の時間変換部204と同じ方法で、時間領域の信号へ変換(Tt)する。ここで、帯域A、帯域Bの周波数領域の信号を時間領域に変換して得られる信号が、それぞれ、ベクトルTa,ベクトルTbであるとする。さらに、ベクトルTaは、Ta=(Ta0,Ta1)に、ベクトルTbは、Tb=(Tb0,Tb1)に分割可能とする。Ta0、Ta1、Tb0、Tb1もベクトルであり、Ta0の要素数とTb0の要素数が同じで、かつ、Ta1の要素数とTb1の要素数が同じとする。ただし、Ta0とTa1の要素数は同じでも同じでなくてもよい。
【0071】
また、ここで、パラメータGb = ( Gb0,Gb1 )を定義する。Gb0,Gb1はそれぞれスカラー値である。図18(a)、図18(b)および図18(c)は、帯域Bの時間領域の信号であるベクトルTbを、帯域Aの時間領域の信号であるベクトルTaを用いて近似する方法の一例を示す図である。図18(a)は、被参照帯域である帯域Aの周波数領域の信号を時間領域に変換して得られる信号を表したベクトルTaを示す図である。図18(b)は、対象帯域である帯域Bの周波数領域の信号を時間領域に変換して得られる信号を表したベクトルTbを示す図である。図18(c)は、ベクトルTaにゲイン制御を施してベクトルTbに近似するベクトルを表した場合の近似ベクトルTb'を示す図である。図18(a)、図18(b)および図18(c)に示すように、パラメータGbの値は、ベクトルTaをGb倍したものがベクトルTbに近似するように決定する。
【0072】
たとえば、近似ベクトルTb'を、ベクトルTaとパラメータGbを用いて、数式2のように定義する。
【数式2】
Figure 0004399185
【0073】
このようにして、対象帯域Bに対する時間領域の信号を、被参照帯域Aの時間領域の信号と、ゲイン制御を行うパラメータGbとによって合成する。よって、時間合成符号化部1307では、ある対象帯域がどの被参照帯域で表現されるかを示す情報と、被参照帯域に対してゲイン制御に用いられるパラメータGbとが量子化され符号化される。説明を簡単にするために、対象帯域、被参照帯域を2つのベクトルに分割する場合について述べたが、分割数は1つでも、3つ以上でもよい。また、帯域の分割も均一でも不均一でもよい。
【0074】
符号化列生成部1309では、量子化および符号化部1304の出力、周波数合成符号化部1308の出力、時間合成符号化部1307の出力、および周波数特性抽出部1302と時間特性抽出部1303との出力を、あらかじめ決められたフォーマットにしたがってパッケージングし、符号化列を生成する。よって、符号化装置1300の出力信号である符号化列には、▲1▼被参照帯域と被参照帯域でも対象帯域でもない帯域との信号を量子化し符号化して得られたデータ、▲2▼被参照帯域と対象帯域との関連を示す情報、▲3▼対象帯域が被参照帯域の信号を用いてどのように量子化し符号化されたかを示す情報、▲4▼被参照帯域、対象帯域およびそのいずれでもない帯域が時間領域か周波数領域かいずれの領域で量子化し符号化されたかを示す情報などが含まれる。また、被参照帯域および対象帯域のサンプル数およびそれぞれの帯域に相当する周波数は、直接的または間接的に符号化列に含まれる。
【0075】
次に、本実施の形態2における復号化装置2000について、図19を用いて説明する。図19は、実施の形態2における復号化装置2000の構成を示すブロック図である。この復号化装置2000は、符号化装置1300によって作成された符号化列を復号化して、オーディオ出力信号を出力する復号化装置であって、符号化列分離部2001、参照周波数信号生成部2002、時間変換部2003、時間合成部2004、周波数変換部2005、周波数合成部2006および周波数‐時間変換部2007を備える。
【0076】
復号化装置2000の周波数‐時間変換部2007、時間変換部2003および周波数変換部2005は、実施の形態1の周波数‐時間変換部1205、時間変換部1306および周波数変換部1203と、それぞれ同じ構成である。符号化列分離部2001は、入力された符号化列中のヘッダなどを読み取って、符号化列に含まれている▲1▼被参照帯域と被参照帯域でも対象帯域でもない帯域との信号を量子化し符号化して得られたデータ、▲2▼被参照帯域と対象帯域との関連を示す情報、▲3▼対象帯域が被参照帯域の信号を用いてどのように量子化し符号化されたかを示す情報、▲4▼被参照帯域および対象帯域が時間領域か周波数領域かいずれの領域で量子化し符号化されたかを示す情報などを分離し、対応する各部に出力する。
【0077】
参照周波数信号生成部2002は、すでに当業者には公知な復号化の方法を用いて、たとえばハフマン復号化などを用いて、周波数領域の信号を復号化する。このことは、図13から図15におけるBase1およびBase2の信号を復号化することを意味する。また図17、図16においては、帯域Aの周波数領域での信号を復号化することを意味する。
【0078】
周波数合成部2006の動作を、図16を用いて説明する。図16に示すように、帯域AのベクトルFaで表される周波数領域の信号(周波数スペクトル)は、符号化列分離部2001から参照周波数信号生成部2002に入力された被参照帯域のデータを、参照周波数信号生成部2002において復号化および逆量子化することによって得られる。一方、帯域BのベクトルFbで表される周波数領域の信号(周波数スペクトル)は、数式1に従って、ベクトルFaと、パラメータGbとを用いて合成される近似ベクトルFb'によって近似される。
【0079】
ゲイン制御用のパラメータGbは、符号化列分離部2001において符号化列から分離されることによって得られ、帯域Aが帯域Bの被参照帯域であることを示す情報も、符号化列分離部2001において符号化列から分離されることによって得られる。このように、周波数合成部2006では、対象帯域である帯域Bの周波数領域での信号Fbを、近似ベクトルFb'を生成することによって生成する。
【0080】
次に時間合成部2004の動作を、図17を用いて説明する。図17において、ベクトルTaで表される帯域Aの時間領域の信号(時間周波数信号)は、参照周波数信号生成部2002で得られたベクトルFaで表される周波数スペクトルに、時間変換部2003による時間変換(図17のTfの処理)を施して得られる。また、対象帯域である帯域BにおいてベクトルTbで表される時間領域の信号(時間周波数信号)は、近似ベクトルTb'によって近似される。
【0081】
この近似ベクトルTb'は、数式2に従って、ベクトルTaと、パラメータGbとを用いて合成される。このように、時間合成部2004では、対象帯域である帯域Bの時間領域での信号Tbを、近似ベクトルTb'を生成することによって生成する。ゲイン制御用のパラメータGbと帯域Aが帯域Bの被参照帯域であることを示す情報とは、符号化列分離部2001から得られる。時間合成部2004によって得られた近似ベクトルTb'で表される時間領域の信号は、周波数変換部2005によって周波数領域の信号へと変換される。
【0082】
周波数‐時間変換部2007では、参照周波数信号生成部2002の出力、周波数合成部2006の出力および周波数変換部2005の出力を1つの周波数軸上の信号成分として合成する。さらに周波数‐時間変換部2007は、合成された周波数スペクトルに、符号化装置1300の時間‐周波数変換部1301による時間‐周波数変換の逆変換を施し、時間領域のオーディオ出力信号を得る。周波数‐時間変換部2007における周波数‐時間変換(たとえば逆MDCT変換など)は、当業者には公知な技術を用いて容易に実施することができる。
【0083】
図20(a)は、図1に示した符号化列生成部205によって生成される符号化列のデータ構成の一例を示す図である。図20(b)は、図12に示した符号化列生成部1309によって生成される符号化列のデータ構成の一例を示す図である。ただし、図20(a)および図20(b)に示す各バンドの帯域幅は、一定であってもなくてもよい。実施の形態1の符号化装置200では、周波数特性抽出部202および時間特性抽出部203によって特定されたバンド内の周波数スペクトルは、時間変換部204によって時間周波数信号にさらに変換された後、量子化され、符号化される。それ以外のバンドでは、周波数スペクトルのまま、量子化され、符号化される。
【0084】
図20(a)では、例えば、周波数特性抽出部202および時間特性抽出部203によって特定された帯域が、band1とband4とである場合を示している。図20(a)および図20(b)に示すように、各バンドの先頭にはヘッダが記述されている。図20(a)では、各ヘッダに、バンド内の符号化列が時間領域と周波数領域とのいずれの領域で量子化され符号化されたかを示すフラグが記述されている。例えば、band1とband4とのヘッダには、band1およびband4内の符号化列 t_quantize が時間領域で量子化され符号化されたことを示すフラグ qm=t がそれぞれ記述されている。
【0085】
また、band2とband3とのヘッダには、band2およびband3内の符号化列 f_quantize が周波数領域で量子化され符号化されたことを示すフラグ qm=f がそれぞれ記述されている。これにおいて、符号化列 f_quantizeおよび符号化列 t_quantize は、それぞれ、周波数スペクトルを周波数領域および時間領域で量子化し符号化して得られた符号化列である。
【0086】
また、実施の形態2の符号化装置1300では、周波数特性抽出部1302および時間特性抽出部1303によって特定されたバンド内の周波数スペクトルは、
▲1▼他の帯域を参照しないで周波数領域で量子化および符号化する、
▲2▼他の帯域を参照して周波数領域で符号化する
▲3▼他の帯域を参照しないで時間領域で量子化および符号化する
▲4▼他の帯域を参照して時間領域で符号化する
という4通りの符号化方法で符号化される。したがって、符号化列内のバンドごとのヘッダには、そのバンドが他のバンドを参照しているか否かを示すフラグと、参照している場合はどのバンドを参照しているかを示すバンド番号と、参照されるバンドのゲインを制御するためのパラメータなどが記述される。
【0087】
図20(b)に示すように、例えば、band1のヘッダには、band1内の符号化列 t_quantize が時間領域で量子化され符号化されたことを示すフラグqm=t が記述されている。band2のヘッダには、band2内の符号化列 f_quantize が周波数領域で量子化され符号化されたことを示すフラグ qm=f が記述されている。さらに、band3には、実際に周波数スペクトルを時間領域で量子化し符号化して得られる符号化列は含まれず、band3が他のバンドを参照して生成されることを示すフラグ qm=ref、band3の被参照帯域がband1であることを示すバンド番号ref=1、および被参照帯域band1のゲインを制御するためのパラメータGain_info などが記述される。
【0088】
また、band4には、band3と同様、実際に周波数スペクトルを量子化および符号化して得られる符号化列は含まれず、band4が他のバンドを参照して生成されることを示すフラグ qm=ref、band4の被参照帯域がband2であることを示すバンド番号ref=2、および被参照帯域band2のゲインを制御するためのパラメータGain_info などが記述される。
【0089】
なお、band3では、バンド番号ref=1によって、周波数領域で量子化および符号化されたband1が参照されることが示されているので、band3が周波数領域で符号化されることを間接的に示している。また、band4では、バンド番号ref=2によって、時間領域で量子化および符号化されたband2が参照されることが示されているので、band4が時間領域で符号化されることを間接的に示している。
【0090】
なお、図20(a)では、符号化列内の各バンドのヘッダに、バンド内の符号化列が時間領域と周波数領域とのいずれの領域で量子化され符号化されたかを示すフラグが記述されているが、どのバンドがいずれの領域で量子化され符号化されるかがあらかじめ決められている場合には、このフラグは不要である。また、図20(b)では、符号化列内の各バンドのヘッダに、そのバンドが他のバンドを参照しているか否かを示すフラグと、そのバンドに対する被参照帯域を特定するためのバンド番号とが記述されているが、どのバンドがどのバンドを参照するかがあらかじめ決められている場合には、これらの情報は不要である。
【0091】
なお、本発明の実施の形態2の符号化装置1300および復号化装置2000において、さらに、被参照帯域を低域周波数成分の帯域に、対象帯域を被参照帯域より高い周波数成分の帯域に選択し、被参照帯域を既存の符号化方式で符号化し、対象帯域成分の生成のための符号を補助情報として符号化すれば、既存の符号化方式と、データ量の少ない補助情報とを用いて、広帯域な再生音を提供することができる。また、既存のオーディオ符号化方式として、AAC方式を使用する場合、AAC方式のFill_elementに対象帯域成分の生成のための符号化情報を入れておけば、AAC方式と互換の復号化方式でも雑音を生じることなく符号化列を復号化できるし、本発明の実施の形態2の復号化方法を用いれば、より広帯域な再生音を比較的少ない情報から生成することも可能である。
【0092】
以上のように構成される本発明の符号化装置および復号化装置を用いれば、周波数領域での符号化に加えて、時間領域での符号化が行なえるので、より符号化効率のよい符号化方法を選択することにより、復号化された再生音について、周波数分解能と時間分解能を効率的に高めることができる。また、すでに符号化された帯域の信号を再利用して少ないデータ量でオーディオ符号化列を構成できるので、オーディオ符号化列の低ビットレート化を図ることができる。
【0093】
また、同じビットレートにした場合に高音質なオーディオ信号を得ることができるオーディオ符号化列を提供することができる。また時間変換部1306や、時間変換部2003、および周波数変換部2005として、信号の切り出しに時間的オーバーラップの不要な分析合成系の直交変換方式を選択することにより、この符号化装置と復号化装置における追加的な算術遅延を排除できるので、符号化および復号化における遅延に配慮が必要なアプリケーションにおいては、メリットが生じる。
【0094】
なお、上記実施の形態2では、参照帯域決定部1305が周波数特性抽出部1302および時間特性抽出部1303によって特定された帯域の4通りの符号化方法を決定したが、具体的な決定方法については、上記の方法に限定されない。
【0095】
なお、本発明に係る符号化装置は、BSおよびCSを含む衛星放送の放送局に備えられる音響符号化装置として、またインターネットなどの通信ネットワークを介してコンテンツを配信するコンテンツ配信サーバの音響符号化装置として、さらに、汎用のコンピュータによって実行される音響信号符号化用のプログラムとして有用である。
【0096】
また、本発明に係る復号化装置は、家庭のSTBに備えられる音響復号化装置としてだけでなく、汎用のコンピュータ、PDAおよび携帯電話機などによって実行される音響信号復号化用のプログラムとして、またSTBまたは汎用のコンピュータに備えられる音響信号復号化用の専用の回路基板、LSIなどとして、さらにSTBまたは汎用のコンピュータに挿入されるICカードとして有用である。
【0097】
【発明の効果】
以上のように本発明の符号化装置および復号化装置によれば、周波数領域での符号化に加えて、時間領域での符号化を追加することにより、符号化効率のより高い領域での符号化を選択することができ、出力符号化列のビット量を低減することができる。さらに、時間領域での符号化を追加することにより、周波数分解能だけでなく、時間分解能の向上を図ることが容易になる。
【0098】
本発明の復号化装置によれば、オーディオ信号の再生時である復号化の過程では、高域周波数の成分を低域スペクトルの複製に加工を加えたもので生成するため、容易に低ビットレート化を達成することができ、同じレートでの従来の復号化装置と比較して、より広帯域な再生音を得ることができる。
【0099】
また、本発明の符号化装置および復号化装置によれば、低いビットレートで、広帯域なオーディオ符号化列を提供することが可能となる。低域周波数成分は、その周波数の微細構造をハフマン符号化などの圧縮技術を用いて符号化するが、高域周波数成分は、その微細構造を符号化せず、主に低域スペクトルを高域スペクトルとして代理複製する情報だけを符号化しているもので、高域周波数成分が符号化で消費する情報量を極小化することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における符号化装置の構成を示すブロック図である。
【図2】図1に示した時間‐周波数変換部による時間周波数変換の一例を示す図である。
【図3】(a)時間−周波数変換部に入力される時間領域のオーディオ信号の図である。
(b)図3(a)に示した第Nフレームのオーディオ信号を一度に時間‐周波数変換して得られる周波数スペクトルを示す図である。
【図4】(a)図3(a)と同様の時間軸上のオーディオ信号において、第Nフレームを前半のサブフレーム1と後半のサブフレーム2とに分割した様子を示す図である。
(b)図4(a)に示したサブフレーム1の時間領域のオーディオ信号を周波数領域の信号へ変換して得られた周波数スペクトルを示す図である。
(c)図4(a)に示したサブフレーム2の時間領域のオーディオ信号を周波数領域の信号へ変換して得られた周波数スペクトルを示す図である。
【図5】(a)図3(a)と同様の時間領域のオーディオ信号(第Nフレーム)を(M+1)個のサブフレームに分割した様子を示す図である。
(b)1フレームのオーディオ入力信号を(M+1)個のサブフレームに分割し、サブフレームごとに時間‐周波数変換することによって得られる周波数スペクトルを示す図である。
【図6】(a)1フレームのオーディオ信号を一度に時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandAに含まれるサンプルを示す図である。
(b)1フレームのオーディオ入力信号を(M+1)個のサブフレームに分割し、サブフレームごとに時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandBに含まれるサンプルを示す図である。
【図7】(a)1フレームのオーディオ信号を一度に時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandC内のサンプルを示す図である。
(b)1フレームのオーディオ入力信号を(M+1)個のサブフレームに分割し、サブフレームごとに時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandD内のサンプルを示す図である。
【図8】(a)1フレームのオーディオ信号を一度に時間‐周波数変換することによって得られる周波数スペクトル上の周波数バンドBandC内のサンプルを示す図である。
(b)横軸を時間、縦軸を周波数スペクトル係数値として、図7(b)に示した各サンプル(周波数スペクトル係数)をプロットし直した図である。
【図9】図1に示した符号化列生成部による時間周波数信号の符号化を示す図である。
【図10】時間‐周波数変換部の出力信号と時間変換部によって時間変換された帯域を示す情報との対応を示す図である。
【図11】本発明の実施の形態1における復号化装置の構成を示すブロック図である。
【図12】本発明の実施の形態2における符号化装置の構成を示すブロック図である。
【図13】他の帯域を参照して対象帯域の符号化列を生成する方法の一例を示す図である。
【図14】他の帯域を参照して対象帯域の符号化列を生成する方法の他の例を示す図である。
【図15】他の帯域を参照して対象帯域の符号化列を生成する方法のさらに他の例を示す図である。
【図16】対象領域の周波数スペクトルを、すでに量子化および符号化された被参照帯域の符号化列を用いて周波数領域で合成する方法の一例を示す図である。
【図17】対象領域の周波数スペクトルを、すでに量子化および符号化された被参照帯域の符号化列を用いて時間領域で合成する方法の一例を示す図である。
【図18】(a)被参照帯域である帯域Aの周波数領域の信号を時間領域に変換して得られる信号を表したベクトルTaを示す図である。
(b)対象帯域である帯域Bの周波数領域の信号を時間領域に変換して得られる信号を表したベクトルTbを示す図である。
(c)ベクトルTaにゲイン制御を施してベクトルTbに近似するベクトルを表した場合の近似ベクトルTb'を示す図である。
【図19】実施の形態2における復号化装置の構成を示すブロック図である。
【図20】(a)図1に示した符号化列生成部によって生成される符号化列のデータ構成の一例を示す図である。
(b)図12に示した符号化列生成部によって生成される符号化列のデータ構成の一例を示す図である。
【図21】従来の符号化装置の構成を示すブロック図である。
【符号の説明】
200、1300 符号化装置
201、1301 時間‐周波数変換部
202、1302 周波数特性抽出部
203、1303 時間特性抽出部
204、1306 時間変換部
205、1309 符号化列生成部
1304 量子化および符号化部
1305 参照帯域決定部
1307 時間合成符号化部
1308 周波数合成符号化部
1200、2000 復号化装置
1201、2001 符号化列分離部
1202 時間周波数信号生成部
1203、2005 周波数変換部
1204 周波数スペクトル生成部
1205、2007 周波数‐時間変換部
2002 参照周波数信号生成部
2003 時間変換部
2004 時間合成部
2006 周波数合成部

Claims (24)

  1. 入力されるオーディオ信号をフレーム時間ごとに時間−周波数変換して得られる周波数領域の信号を符号化し、出力信号を生成する符号化装置であって、
    入力オーディオ信号の特性に基づいて、前記入力オーディオ信号を時間−周波数変換して得られる周波数スペクトルの一部の帯域を特定する第1の帯域特定手段と、
    特定された帯域の周波数スペクトルに含まれる周波数スペクトル係数列を、周波数−時間変換することにより、前記フレーム時間における前記特定された帯域の周波数成分の時間変化を表す信号を生成する時間変換手段と、
    前記時間変換手段によって得られる前記信号と、前記周波数スペクトルの少なくとも一部とを符号化し、符号化された前記信号および前記周波数スペクトルから出力信号を生成する符号化手段とを備える
    ことを特徴とする符号化装置。
  2. 前記符号化装置は、さらに、
    前記周波数スペクトルの2以上の帯域を特定し、特定された前記帯域の1つに含まれる周波数成分の時間変化を表す信号を用いて、特定された他の前記帯域の周波数成分の時間変化を表す信号を近似する時間領域近似手段を備え、
    前記符号化手段は、前記時間領域近似手段によって特定された前記帯域につき、前記近似に用いられる前記信号を符号化する
    ことを特徴とする請求項1記載の符号化装置。
  3. 前記時間領域近似手段は、前記周波数スペクトルにおいて、前記近似に用いられる帯域と、前記近似される帯域とを特定するための情報を生成する
    ことを特徴とする請求項2記載の符号化装置。
  4. 前記時間領域近似手段は、さらに、前記近似に用いられる前記信号の前記近似される前記信号に対するゲインを示す情報を生成する
    ことを特徴とする請求項3記載の符号化装置。
  5. 前記符号化手段は、前記近似される前記信号の代わりに、前記時間領域近似手段によって生成された、前記近似に用いられる帯域を特定するための情報と、前記ゲインを示す情報とを符号化する
    ことを特徴とする請求項4記載の符号化装置。
  6. 前記第1の帯域特定手段は、入力オーディオ信号において、平均エネルギーの変化が大きい部分の周波数帯域を特定する
    ことを特徴とする請求項1記載の符号化装置。
  7. 前記符号化装置は、さらに、
    前記周波数スペクトルの特性に基づいて、当該周波数スペクトルの一部の帯域を特定する第2の帯域特定手段を備え、
    前記時間変換手段は、特定された帯域の周波数スペクトルに含まれる周波数スペクトル係数列を周波数−時間変換した信号に変換する
    ことを特徴とする請求項1記載の符号化装置。
  8. 前記符号化装置は、さらに、
    前記周波数スペクトルに含まれる2以上の帯域を特定し、特定されたうちの1つの帯域の周波数スペクトルを用いて、他の帯域の周波数スペクトルを近似する周波数領域近似手段を備え、
    前記符号化手段は、前記周波数領域近似手段によって特定された帯域につき、前記近似に用いられる周波数スペクトル係数列を符号化する
    ことを特徴とする請求項7記載の符号化装置。
  9. 前記周波数領域近似手段は、前記周波数スペクトルにおいて、前記近似に用いられる帯域と、前記近似される帯域とを特定するための情報を生成する
    ことを特徴とする請求項8記載の符号化装置。
  10. 前記周波数領域近似手段は、さらに、前記近似に用いられる周波数スペクトルの前記近似される周波数スペクトルに対するゲインを示す情報を生成する
    ことを特徴とする請求項9記載の符号化装置。
  11. 前記符号化手段は、前記近似される周波数スペクトルの代わりに、前記周波数領域近似手段によって生成された、前記近似に用いられる帯域を特定するための情報と、前記ゲインを示す情報とを符号化する
    ことを特徴とする請求項10記載の符号化装置。
  12. 前記第2の帯域特定手段は、前記周波数スペクトルにおいて、周波数スペクトル係数の分散が大きい帯域を特定する
    ことを特徴とする請求項7記載の符号化装置。
  13. 請求項1記載の符号化装置によって生成された出力信号である符号化列を復号化し、周波数スペクトルを出力する復号化装置であって、
    入力された符号化列に含まれる1フレームの一部をなし、周波数成分の時間変化を表す信号の符号化列を抽出し、抽出された符号化列を復号化する復号化手段と、
    抽出された前記符号化列を復号化して得られた、前記周波数成分の時間変化を表す信号を、時間−周波数変換することにより、周波数スペクトル係数列に変換する周波数変換手段と、
    入力された符号化列の同じフレームの他の部分から抽出された符号化列を復号化して得られた周波数スペクトル係数列と、前記周波数変換手段によって得られた周波数スペクトル係数列とを周波数軸上で合成する合成手段とを備える
    ことを特徴とする復号化装置。
  14. 前記復号化装置は、さらに、
    抽出された符号化列が表す帯域を、他の帯域の符号化列から復号化された前記周波数成分の時間変化を表す信号で近似する時間近似手段を備え、
    前記周波数変換手段は、近似された周波数成分の時間変化を表す信号を周波数スペクトル係数列に変換する
    ことを特徴とする請求項13記載の復号化装置。
  15. 前記時間近似手段は、抽出された前記符号化列に含まれる情報から、当該符号化列が表す帯域の近似に用いられた前記周波数成分の時間変化を表す信号の帯域を特定し、特定された帯域の前記周波数成分の時間変化を表す信号を用いて近似する
    ことを特徴とする請求項14記載の復号化装置。
  16. 前記時間近似手段は、さらに、抽出された前記符号化列に含まれる情報から、近似に用いられた前記周波数成分の時間変化を表す信号につき、近似される側の前記周波数成分の時間変化を表す信号に対するゲインを読み取り、特定された帯域の前記周波数成分の時間変化を表す信号の振幅を、読み取られたゲインを用いて調整して近似する
    ことを特徴とする請求項15記載の復号化装置。
  17. 前記時間近似手段は、すでに周波数スペクトルに変換されている帯域を特定し、特定された帯域の周波数スペクトルに含まれる周波数スペクトル係数列を周波数成分の時間変化を表す信号に変換し、変換によって得られた前記周波数成分の時間変化を表す信号を用いて、抽出された前記符号化列が表す帯域を近似する
    ことを特徴とする請求項15記載の復号化装置。
  18. 前記復号化装置は、さらに、
    抽出された符号化列が表す帯域を、他の帯域の符号化列から復号化された周波数スペクトルで近似する周波数近似手段を備え、
    前記合成手段は、入力された符号化列の他の部分から抽出された符号化列を復号化して得られた周波数スペクトル係数列と、前記周波数変換手段から得られた周波数スペクトル係数列とに加えて、さらに、前記周波数近似手段によって近似された周波数スペクトル係数列とを周波数軸上で合成する
    ことを特徴とする請求項14記載の復号化装置。
  19. 前記周波数近似手段は、抽出された前記符号化列に含まれる情報から、当該符号化列が表す帯域の近似に用いられた周波数スペクトルの帯域を特定し、特定された帯域の周波数スペクトルを用いて近似する
    ことを特徴とする請求項18記載の復号化装置。
  20. 前記周波数近似手段は、さらに、抽出された前記符号化列に含まれる情報から、近似に用いられた周波数スペクトルにつき、近似される側の周波数スペクトルに対するゲインを読み取り、特定された帯域の周波数スペクトルの振幅を、読み取られたゲインを用いて調整して近似する
    ことを特徴とする請求項19記載の復号化装置。
  21. 入力されるオーディオ信号をフレーム時間ごとに時間−周波数変換して得られる周波数領域の信号を符号化し、出力信号を生成する符号化方法であって、
    入力オーディオ信号の特性に基づいて、前記入力オーディオ信号を時間−周波数変換して得られる周波数スペクトルの一部の帯域を特定する第1の帯域特定ステップと、
    特定された帯域の周波数スペクトルに含まれる周波数スペクトル係数列を、周波数−時間変換することにより、前記フレーム時間における前記特定された帯域の周波数成分の時間変化を表す信号を生成する時間変換ステップと、
    前記時間変換ステップによって得られる前記信号と、前記周波数スペクトルの少なくとも一部とを符号化し、符号化された前記信号および前記周波数スペクトルから出力信号を生成する符号化ステップとを含む
    ことを特徴とする符号化方法。
  22. 請求項1記載の符号化装置によって生成された出力信号である符号化列を復号化し、周波数スペクトルを出力する復号化方法であって、
    入力された符号化列に含まれる1フレームの一部をなし、周波数成分の時間変化を表す信号の符号化列を抽出し、抽出された符号化列を復号化する復号化ステップと、
    抽出された前記符号化列を復号化して得られた、前記周波数成分の時間変化を表す信号を、時間−周波数変換することにより、周波数スペクトル係数列に変換する周波数変換ステップと、
    入力された符号化列の同じフレームの他の部分から抽出された符号化列を復号化して得られた周波数スペクトル係数列と、前記周波数変換ステップによって得られた周波数スペクトル係数列とを周波数軸上で合成する合成ステップと
    を含むことを特徴とする復号化方法。
  23. コンピュータに、入力されるオーディオ信号をフレーム時間ごとに時間−周波数変換して得られる周波数領域の信号を符号化し、出力信号を生成する符号化方法に含まれる各ステップを実行させるプログラムであって、
    入力オーディオ信号の特性に基づいて、前記入力オーディオ信号を時間−周波数変換して得られる周波数スペクトルの一部の帯域を特定する第1の帯域特定ステップと、
    特定された帯域の周波数スペクトルに含まれる周波数スペクトル係数列を、周波数−時間変換することにより、前記フレーム時間における前記特定された帯域の周波数成分の時間変化を表す信号を生成する時間変換ステップと、
    前記時間変換ステップによって得られる前記信号と、前記周波数スペクトルの少なくとも一部とを符号化し、符号化された前記信号および前記周波数スペクトルから出力信号を生成する符号化ステップと
    を実行させることを特徴とするプログラム。
  24. コンピュータに、請求項1記載の符号化装置によって生成された出力信号である符号化列を復号化し、周波数スペクトルを出力する復号化方法に含まれる各ステップを実行させるためのプログラムであって、
    入力された符号化列に含まれる1フレームの一部をなし、周波数成分の時間変化を表す信号の符号化列を抽出し、抽出された符号化列を復号化する復号化ステップと、
    抽出された前記符号化列を復号化して得られた、前記周波数成分の時間変化を表す信号を、時間−周波数変換することにより、周波数スペクトル係数列に変換する周波数変換ステップと、
    入力された符号化列の同じフレームの他の部分から抽出された符号化列を復号化して得られた周波数スペクトル係数列と、前記周波数変換ステップによって得られた周波数スペクトル係数列とを周波数軸上で合成する合成ステップと
    を実行させることを特徴とするプログラム。
JP2003099945A 2002-04-11 2003-04-03 符号化装置および復号化装置 Expired - Lifetime JP4399185B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003099945A JP4399185B2 (ja) 2002-04-11 2003-04-03 符号化装置および復号化装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002108703 2002-04-11
JP2003099945A JP4399185B2 (ja) 2002-04-11 2003-04-03 符号化装置および復号化装置

Publications (2)

Publication Number Publication Date
JP2004004710A JP2004004710A (ja) 2004-01-08
JP4399185B2 true JP4399185B2 (ja) 2010-01-13

Family

ID=30446880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003099945A Expired - Lifetime JP4399185B2 (ja) 2002-04-11 2003-04-03 符号化装置および復号化装置

Country Status (1)

Country Link
JP (1) JP4399185B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
US20080215340A1 (en) * 2005-05-25 2008-09-04 Su Wen-Yu Compressing Method for Digital Audio Files
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
EP2458588A3 (en) 2006-10-10 2012-07-04 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
JP5294713B2 (ja) * 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
US9672840B2 (en) 2011-10-27 2017-06-06 Lg Electronics Inc. Method for encoding voice signal, method for decoding voice signal, and apparatus using same
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
JP2018101826A (ja) * 2016-12-19 2018-06-28 株式会社Cri・ミドルウェア 音声通話システム、音声通話方法およびプログラム
KR101847076B1 (ko) * 2017-07-04 2018-04-09 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치

Also Published As

Publication number Publication date
JP2004004710A (ja) 2004-01-08

Similar Documents

Publication Publication Date Title
US7269550B2 (en) Encoding device and decoding device
AU2002318813B2 (en) Audio signal decoding device and audio signal encoding device
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
US7864843B2 (en) Method and apparatus to encode and/or decode signal using bandwidth extension technology
JP3926726B2 (ja) 符号化装置および復号化装置
EP2750134B1 (en) Encoding device and method, decoding device and method, and program
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
US8634577B2 (en) Audio decoder
US8135583B2 (en) Encoder, decoder, encoding method, and decoding method
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
JP4399185B2 (ja) 符号化装置および復号化装置
US9847095B2 (en) Method and apparatus for adaptively encoding and decoding high frequency band
JP3144009B2 (ja) 音声符号復号化装置
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
JP4308229B2 (ja) 符号化装置および復号化装置
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP4317355B2 (ja) 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP7318645B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP5724338B2 (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP2003029797A (ja) 符号化装置、復号化装置および放送システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051012

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090929

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091026

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4399185

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term