JP4008244B2 - 符号化装置および復号化装置 - Google Patents

符号化装置および復号化装置 Download PDF

Info

Publication number
JP4008244B2
JP4008244B2 JP2002016246A JP2002016246A JP4008244B2 JP 4008244 B2 JP4008244 B2 JP 4008244B2 JP 2002016246 A JP2002016246 A JP 2002016246A JP 2002016246 A JP2002016246 A JP 2002016246A JP 4008244 B2 JP4008244 B2 JP 4008244B2
Authority
JP
Japan
Prior art keywords
code
sequence
frequency
unit
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002016246A
Other languages
English (en)
Other versions
JP2002328699A (ja
Inventor
峰生 津島
武志 則松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2002016246A priority Critical patent/JP4008244B2/ja
Publication of JP2002328699A publication Critical patent/JP2002328699A/ja
Application granted granted Critical
Publication of JP4008244B2 publication Critical patent/JP4008244B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、符号化装置および復号化装置に関する。さらに詳細には、オーディオ信号の音質を保持しながら、オーディオ信号を情報量の少ない符号化列に符号化する符号化装置および復号化装置に関する。
【0002】
【従来の技術】
音声信号および/または音楽信号を含むオーディオ信号の符号化方法および復号化方法は、現在までに非常に多くの方式が開発されている。特に最近では、それらの中でもISO/IECで国際標準化されたIS13818−7が認知され、高音質および高効率な符号化方法として評価されている。この符号化方法はAACと呼ばれている。
【0003】
近年、AACはMPEG4と呼ばれる標準規格にも採用され、IS13818−7に対していくつかの拡張機能を有するMPEG4−AACと呼ばれる方式が定められている。符号化過程の一例は、INFOMATIVE PARTに記述される。
【0004】
図10は、従来の符号化装置1000の構成例を示す。周波数スペクトル列が符号化装置1000に入力される。周波数スペクトル列は以下に説明するように生成される。
【0005】
オーディオ信号は、オーディオ信号をサンプリングしたオーディオ離散信号の形態で時間周波数変換部(図示せず)に入力される。時間周波数変換部は、直交変換等によって、時間軸上の離散信号を周波数軸上のスペクトルに変換する。本明細書において、時間周波数変換部によって、時間軸上の離散信号から変換された周波数軸上のスペクトル全体を、1フレームの周波数スペクトルとよぶ。1フレームの周波数スペクトルは複数の周波数帯域に対応する複数の周波数スペクトルに分けられる。周波数スペクトル列が符号化装置1000に入力される。
【0006】
符号化装置1000は、周波数スペクトル列を受け取り、周波数スペクトル列を所定のゲインを用いて増幅した増幅スペクトル列と所定のゲインを符号化した符号化ゲインとを生成するスペクトル増幅部1010と、増幅スペクトル列を量子化した量子化スペクトル列を生成するスペクトル量子化部1020と、量子化スペクトル列をハフマン符号化したハフマン符号化スペクトル列を生成するハフマン符号化部1030と、符号化ゲインとハフマン符号化スペクトル列とを含む符号化列を生成する符号化列生成部1040とを含む。
【0007】
スペクトル増幅部1010は、複数の周波数帯域のうちの予め決められた周波数帯域に対応するスペクトル列に対して、所定のゲインを用いて、予め決められた周波数帯域の周波数スペクトルを表す周波数スペクトル列を増幅した増幅スペクトル列を生成する。スペクトル増幅部1010は、また、所定のゲインを符号化した符号化ゲインを生成する。
【0008】
スペクトル量子化部1020は、増幅スペクトル列のデータを決められた変換式で量子化した量子化スペクトル列を生成する。AAC方式の場合、スペクトル量子化部1020は、浮動小数で表現される増幅スペクトル列のデータを整数値に丸めこむことで量子化する。
【0009】
ハフマン符号化部1030は、量子化スペクトル列のデータを何個ずつかまとめて、ハフマン符号化したハフマン符号化スペクトル列を生成する。
【0010】
符号化列生成部1040は、符号化ゲインとハフマン符号化スペクトル列とを含む符号化列を復号化装置(図示せず)に転送する。
【0011】
【発明が解決しようとする課題】
近年、オーディオ信号を符号化した符号化列の情報量をより少なくし、オーディオ信号の圧縮率をより高くすることが望まれている。
【0012】
符号化装置1000において、情報の圧縮の性能はハフマン符号化部1030に依存する。符号化装置1000において、オーディオ信号を高い圧縮率、すなわち、少ない情報量に符号化する場合、スペクトル増幅部1010のゲインを制御して量子化スペクトル列のデータの値を小さくし、それにより、ハフマン符号化部1030によって符号化される情報量を小さくする。
【0013】
しかしながら、このような動作を行なうと、ハフマン符号化スペクトル列を復号化した周波数スペクトルに、非常に多くの振幅(量子化値)ゼロの値が現れ、十分な音質を確保できないという課題がある。
【0014】
本発明は、このような従来の課題を鑑みてなされたものであり、オーディオ信号の音質を確保しながら、オーディオ信号に対応する周波数スペクトル列を少ない情報量の符号化列に符号化する符号化装置、および、そのような符号化列を復号オーディオ信号に対応する出力スペクトル列に復号化する復号化装置を実現することを目的とする。
【0015】
【課題を解決するための手段】
本発明の符号化装置は、複数フレームの時間信号列を含むオーディオ信号の、1フレームの時間信号列を時間周波数変換することにより得られる1フレームの周波数スペクトルの複数の周波数帯域のそれぞれについて周波数スペクトル列の平均振幅を算出することにより、前記周波数スペクトル列の平均振幅を表す第1の符号を生成する帯域ゲイン符号部と、前記複数の周波数帯域のうち、周波数スペクトル列を量子化し符号化すべき少なくとも1つの周波数帯域を決定する符号化帯域決定部と、前記符号化帯域決定部によって決定された前記少なくとも1つの周波数帯域のそれぞれについて周波数スペクトル列を量子化し符号化することにより、第2の符号を生成するスペクトル符号化部と、1フレームの時間信号列を複数の時間領域に対応する複数の時間信号列に分割し、前記複数の時間領域のそれぞれの時間信号列の平均振幅を算出することにより、前記時間信号列の平均振幅を表す第4の符号を生成する時間領域ゲイン符号化部と、前記第1の符号と前記第2の符号と前記第4の符号とに基づいて、符号化列を生成する符号化列生成部とを備える。
【0016】
前記符号化帯域決定部は、前記周波数スペクトル列の平均振幅を表す前記第1の符号の大きさに基づいて、前記周波数スペクトル列を量子化し符号化すべきかを決定してもよい。
【0017】
前記符号化帯域決定部は、前記量子化し符号化すべきと決定された少なくとも1つの周波数帯域について前記スペクトル符号化部によって生成される第2の符号の大きさに基づいて、前記量子化し符号化すべきと決定されていなかった周波数帯域の中から、さらに量子化し符号化すべき周波数帯域を再決定し、前記スペクトル符号化部は、前記再決定された周波数帯域について周波数スペクトル列を量子化し符号化することにより、第2の符号を生成してもよい。
【0018】
前記符号化帯域決定部が、複数の周波数帯域のうち、どの周波数帯域の周波数スペクトル列を量子化し符号化したかを表す第3の符号と、前記第1の符号と、前記第2の符号と、前記第4の符号とに基づいて、前記符号化列生成部は前記符号化列を生成してもよい。
【0019】
前記スペクトル符号化部は、ハフマン符号化を行ってもよい。
【0020】
前記スペクトル符号化部は、ベクトル量子化を行ってもよい。
【0021】
前記スペクトル符号化部は、ハフマン符号化およびベクトル量子化を行ってもよい。
【0023】
前記複数の周波数帯域のうち、前記符号化帯域決定部によって量子化し符号化すべきと決定されなかった周波数帯域うち、少なくとも1つの周波数帯域を複数のサブ帯域に分割し、前記複数のサブ帯域の各々の平均振幅を表す第5の符号を生成するサブ帯域ゲイン符号化部をさらに備えてもよい。
【0024】
前記複数のサブ帯域の少なくとも1つは、前記2つ以上の周波数スペクトル列を含んでもよい。
【0025】
本発明の復号化装置は、第1の符号と少なくとも1つの第2の符号と第4の符号とを含む符号化列を復号化する復号化装置であって、前記第1の符号は、1フレームの周波数スペクトルを構成する複数の周波数帯域のうちの1つについて周波数スペクトル列の平均振幅を表すように生成されたものであり、前記少なくとも1つの第2の符号のそれぞれは、前記複数の周波数帯域のうちの1つについて周波数スペクトル列を量子化し符号化することによって生成されたものであり、前記第4の符号は、前記1フレームの周波数スペクトル列を時間周波数変換する前の1フレームの時間信号列を複数の時間領域に分割し、前記複数の時間領域に対応する複数の時間信号列それぞれの平均振幅を表すように生成されたものであり、前記符号化列を解析し、前記第1の符号と前記少なくとも1つの第2の符号と前記第4の符号とを検出する符号化列解析部と、前記符号化列解析部によって検出された前記第1の符号を前記周波数スペクトル列の平均振幅に逆量子化する帯域ゲイン逆量子化部と、前記少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域があるか否かを通知する符号化帯域通知部と、前記第4の符号を前記時間信号列の平均振幅に復号化する時間領域ゲイン復号化部と、前記少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域があるという前記符号化帯域通知部の通知に基づいて、前記第2の符号を前記周波数スペクトル列に逆量子化し復号化するスペクトル逆量子化部と、前記少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域がないという前記符号化帯域通知部の通知及び前記時間領域ゲイン復号化部において復号化された前記時間信号列の平均振幅に基づいて、ノイズスペクトル列を生成するノイズスペクトル列生成部と、前記周波数スペクトル列または前記ノイズスペクトル列を前記周波数スペクトル列の平均振幅に基づいて増幅する増幅部とを備える。
【0026】
前記符号化列は、複数の周波数帯域のうち、どの周波数帯域を周波数スペクトル列に量子化し符号化したかを表す第3の符号をさらに含み、前記符号化帯域通知部は第3の符号を復号化し、前記復号化した第3の符号に基づいて、前記少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域があるか否かを通知してもよい。
【0027】
前記スペクトル逆量子化部は、ハフマン復号化を行ってもよい。
【0028】
前記スペクトル逆量子化部は、ベクトル逆量子化を行ってもよい。
【0029】
前記スペクトル逆量子化部は、ハフマン復号化およびベクトル逆量子化を行ってもよい。
【0032】
前記符号化列は、前記スペクトル逆量子化部によって逆量子化されない周波数帯域うち、少なくとも幾つかの周波数帯域を分割した複数のサブ帯域の各々の平均振幅を表す第5の符号をさらに含み、前記第5の符号を前記サブ帯域の平均振幅に復号化し、前記復号化した平均振幅に基づいて、前記複数のサブ帯域のノイズスペクトル列を生成するサブ帯域復号化部をさらに備えてもよい。
【0033】
【発明の実施の形態】
以下に、本発明の実施の形態における符号化装置および復号化装置ならびに符号化装置と復号化装置とを含むデータ処理システムについて、図面を用いて説明する。
【0034】
(実施の形態1)
図1は、本発明によるオーディオ信号変換システム10の構成例を示す。オーディオ信号変換システム10は、オーディオ信号を周波数スペクトル列に変換する時間周波数変換部20と、周波数スペクトル列を符号化列に符号化して情報量を減らし、かつ、その符号化列を復号化した出力スペクトル列を生成するデータ処理システム100と、出力スペクトル列を復号オーディオ信号に変換する周波数時間変換部30とを含む。復号オーディオ信号は、再生部40によって再生される。
【0035】
データ処理システム100は、周波数スペクトル列を符号化列に符号化する符号化装置110と、符号化列を出力スペクトル列に復号化する復号化装置120とを含む。オーディオ信号変換システム10において、時間周波数変換部20と,符号化装置110とは、送信部60として機能する。また、復号化装置120と、周波数時間変換部30とは、受信部70として機能する。送信部60から出力される符号化列は、任意の記録手段によって一時的に記録され、所望の場合に復号化さらには再生される。あるいは、送信部60から出力される符号化列は、伝送路(図示せず)を介して受信部70に送信される。
【0036】
オーディオ信号は、オーディオ信号をサンプリングしたオーディオ離散信号の形態で時間周波数変換部20に入力される。オーディオ離散信号は、時間軸上の離散信号として表される。時間周波数変換部20は、ある時間間隔毎に、時間軸上の離散信号を周波数軸上のスペクトルに変換する。本明細書において、ある時間間隔の時間軸上の離散信号全体を1フレームの時間信号とよび、1フレームの時間信号を変換した周波数軸上のスペクトルを1フレームの周波数スペクトルとよぶ。1フレームの時間信号は、1フレームの時間信号列として表される。フレームの周波数スペクトルは、複数の周波数帯域に対応する複数の周波数スペクトルに分けられる。本明細書において、この複数に分けられた周波数帯域の各々をスケールファクターバンドとよぶ。各スケールファクターバンドには、複数の周波数スペクトルのデータが属し、そのデータの各々が符号化装置110に入力される。
【0037】
時間周波数変換部20は、例えば、変形離散余弦変換(MDCT)によって時間周波数変換を行う。MDCTは、当業者にとって公知な技術である。時間周波数変換部20は、特定のサンプル毎(例えば、512サンプル毎または1024サンプル毎)に時間周波数変換を行う。時間信号列のサンプル数が512サンプルであり、時間周波数変換としてMDCTを使用する場合、512サンプルのMDCT係数が1フレーム毎に得られる。MDCTを使用する場合、MDCT係数全体を1フレームの周波数スペクトルとして、後述の説明を行なう。
【0038】
図2Aは、図1に示される符号化装置110の一例としての符号化装置110Aの構成例を示す。符号化装置110Aは、周波数スペクトル列を受け取り、符号化列を生成する。
【0039】
符号化装置110Aは、周波数スペクトル列の平均振幅を算出し、周波数スペクトル列の平均振幅を表す第1の符号を生成する帯域ゲイン符号化部210Aと、複数の周波数帯域のうち、周波数スペクトル列を量子化し符号化すべき少なくとも1つの周波数帯域を決定する符号化帯域決定部220Aと、符号化帯域決定部220Aによって決定された少なくとも1つの周波数帯域のそれぞれについて周波数スペクトル列を量子化し符号化することにより、第2の符号を生成するスペクトル符号化部230Aと、帯域ゲイン符号化部210Aによって生成された第1の符号とスペクトル符号化部230Aによって生成された第2の符号とに基づいて符号化列を生成する符号化列生成部240Aとを含む。
【0040】
帯域ゲイン符号化部210Aは、スケールファクターバンド毎に、そのスケールファクターバンドに属する周波数スペクトル列の平均振幅を算出する。各スケールファクターバンド毎の周波数スペクトル列の平均振幅rmsの算出は、例えば(数1)を用いる。
【0041】
【数1】
Figure 0004008244
ここで、sp(i)は、そのスケールファクターバンドの周波数スペクトル列のそれぞれのデータの値であり、nはそのスケールファクターバンドの周波数スペクトル列のデータの数である。
【0042】
帯域ゲイン符号化部210Aは、各スケールファクターバンド毎に得られた平均振幅を、量子化し符号化する。
【0043】
符号化した平均振幅(index)は、例えば、(数2)で与えられる。
【0044】
【数2】
Figure 0004008244
ここで、(int)は小数点以下の値を切り捨てて整数化する関数であり、log2は2の対数をとる関数である。
【0045】
量子化された平均振幅(qrms)は、例えば(数3)で与えられる。ここで、^は指数演算の関数である。
【0046】
【数3】
Figure 0004008244
1フレームの周波数スペクトルが、M個の周波数スペクトルに分割される場合(M個のスケールファクタバンドからなる場合)、量子化された平均振幅は最大M個である。符号化列生成部240Aは、M個全ての平均振幅を表す符号を用いて符号化列を生成してもよい。または、低い周波数帯域からM個より少ない個数の平均振幅を表す符号を用いて符号化列を生成してもよい。あるいは、1つの平均振幅を表す符号と他の情報とに基づいて、符号化列を生成してもよい。また、符号化列の生成方法は、(数2)で算出された符号を直接符号化してもよいし、隣接するスケールファクタバンドの平均振幅どうしの差分をハフマン符号化などを用いて符号化してもよい。
【0047】
符号化帯域決定部220Aは、複数のスケールファクターバンドに分割された周波数スペクトル列の中から、どのスケールファクターバンドに属する周波数スペクトル列を、スペクトル符号化部230Aで量子化し符号化するかを決定する。量子化し符号化するスケールファクターバンドは、例えば、低域からN個のスケールファクターバンドのように予め設定されてもよい。
【0048】
ここでは、M個のスケールファクタバンドのうち、低域からN個のスケールファクターバンドに属する周波数スペクトル列を符号化すると予め設定されている場合を想定する。ここで、MおよびNはともに自然数であり、Mは、Nに等しいか、または、Nより大きい。ここで、低域から符号化を行なうように設定したのは、オーディオ信号を再生した際に、低域の周波数スペクトルの影響が人間の聴覚にとってより重要であるからである。
【0049】
スペクトル符号化部230Aは、符号化帯域決定部220Aによって量子化し符号化すると決定されたスケールファクターバンドに属する周波数スペクトル列を量子化し符号化する。スペクトル符号化部230Aは、ハフマン符号化を用いてもよいし、または、ベクトル量子化を用いてもよい。あるいは、ハフマン符号化とベクトル量子化との両方を用いてもよい。ここでは、スペクトル符号化部230Aの符号化のタイプが予め指定されている場合を想定する。ただし、本実施の形態はこれに限定されず、スペクトル符号化部230Aは周波数スペクトル列を量子化し符号化したタイプを表す情報を符号化列生成部240Aに出力し、符号化列生成部240Aはその情報を符号化列に含めてもよい。
【0050】
符号化列生成部240Aは、帯域ゲイン符号化部210Aによって生成された平均振幅とスペクトル符号化部230Aによって生成された符号化スペクトル列とに基づいて、符号化列を生成する。符号化列は、所定のフォーマットにしたがってビットストリームの形態で生成される。符号化列は、当業者に周知なフォーマットで生成することができる。
【0051】
図3は、図1に示される復号化装置120の一例としての復号化装置120Aの構成例を示す。
【0052】
本実施の形態の復号化装置120Aは、符号化列を受け取り、出力スペクトル列を生成する。符号化列は、複数の第1の符号と少なくとも1つの第2の信号とを含む。複数の第1の符号の各々は、複数の周波数帯域のうちの1つについて周波数スペクトル列の平均振幅を表すように生成された符号である。本明細書において、用語「第1の符号」は、複数の周波数帯域のうちの1つについて周波数スペクトル列の平均振幅を表すように生成された符号を意味し、用語「第2の符号」は、第1の符号によって表される平均振幅に対応する周波数スペクトル列が符号化された符号を意味する。
【0053】
復号化装置120Aが受け取る符号化列は、例えば、上述の符号化装置110Aの符号化列生成部240Aで生成された符号化列である。復号化装置120Aが生成した出力スペクトル列は、周波数時間変換部30(図1を参照)によって、時間信号である復号オーディオ信号に変換される。
【0054】
復号化装置120Aは、第1の符号と第2の符号とを含む符号化列を解析する符号化列解析部310Aと、第1の符号を逆量子化して周波数スペクトル列の平均振幅を生成する帯域ゲイン逆量子化部320Aと、少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域があるか否かを通知する符号化帯域通知部330Aと、第2の符号を逆量子化した周波数スペクトル列を生成するスペクトル逆量子化部340Aと、ノイズスペクトル列を生成するノイズスペクトル列生成部350Aと、スペクトル逆量子化部340Aによって逆量子化された周波数スペクトル列およびノイズスペクトル列生成部350Aによって生成されたノイズスペクトル列を増幅する増幅部360Aと、増幅部360Aから出力される増幅された周波数スペクトル列および増幅されたノイズスペクトル列とを合成するスペクトル合成部365Aを含む。増幅部は、ノイズスペクトル列を増幅するノイズスペクトル列増幅部362Aと、周波数スペクトル列を増幅するスペクトル増幅部364Aとを含む。
【0055】
符号化列解析部310Aは、符号化列を受け取り、受け取った符号化列を解析する。
【0056】
帯域ゲイン逆量子化部320Aは、符号化列解析部310Aによって解析された符号に基づいて、各スケールファクターバンド毎の量子化された復号平均振幅qrmsを生成する。量子化された平均振幅qrmsは、上述の(数3)を用いて算出される。
【0057】
符号化列解析部310Aは、第1の符号を帯域ゲイン逆量子化部320Aに出力する。符号化列解析部310Aは、また、少なくとも1つの第2の符号の周波数帯域の中に、第1の符号の周波数帯域に対応する周波数帯域があるかどうかに関する情報を符号化帯域通知部330Aに出力する。符号化帯域通知部330Aは、少なくとも1つの第2の符号の周波数帯域の中に、第1の符号の周波数帯域に対応する周波数帯域があるか否かを通知する。ここでは、符号列が、複数のスケールファクターバンドのうちの低域からN個のスケールファクターバンドのスペクトル列を符号化した符号を含むと予め設定されている場合を想定する。ただし、本実施の形態はこれに限定されるものではない。
【0058】
少なくとも1つの第2の符号の周波数帯域の中に、第1の符号の周波数帯域に対応する周波数帯域があることを符号化帯域通知部330Aがスペクトル逆量子化部340Aに通知する場合、スペクトル逆量子化部340Aは符号化列解析部から受け取った第2の符号を逆量子化して周波数スペクトル列を生成する。第2の符号の符号化がハフマン符号化で行われている場合、スペクトル逆量子化部340Aはハフマン復号を行う。第2の符号の符号化がベクトル量子化で行われている場合、スペクトル逆量子化部340Aは、逆ベクトル量子化を行う。ここでは、第2の符号を符号化したタイプが予め設定されている場合を想定している。ただし、本実施の形態はこれに限定されず、符号化列が第2の符号を符号化したタイプを表す符号を含み、スペクトル逆量子化部340Aはその符号に基づいて、第2の符号を復号するタイプを決定してもよい。
【0059】
スペクトル増幅部364Aは、帯域ゲイン逆量子化部320Aによって生成された平均振幅を用いて、スペクトル逆量子化部340Aによって生成された周波数スペクトル列を増幅する。
【0060】
あるスケールファクターバンドにおいて生成された平均振幅がqrmsで、そのスケールファクターバンドに対応して、スペクトル逆量子化部340Aによって生成された周波数スペクトル列をqsp(i)とすると、スペクトル増幅部364Aの出力(rsp)は、(数4)で与えられる。
【0061】
【数4】
Figure 0004008244
少なくとも1つの第2の符号の周波数帯域の中に、第1の符号の周波数帯域に対応する周波数帯域がないことを符号化帯域通知部330Aがノイズスペクトル列生成部350Aに通知する場合、ノイズスペクトル列生成部350Aは、ノイズスペクトルを増幅部360Aに出力する。本明細書において、ノイズスペクトルとは、周波数軸上のスペクトルを指す。ノイズスペクトル列生成部350Aは、予め用意した白色ノイズ信号に時間周波数変換部20(図1参照)が行なうのと同じ時間周波数変換を行なったスペクトルを、ノイズスペクトルとして使用してもよい。白色ノイズの周波数スペクトルは、(数1)から(数3)で求められる平均振幅が1であるように正規化される。あるいは、ノイズスペクトル列生成部350Aは、ノイズスペクトルの値を予め何らかの記録媒体に保持し、単にその値を出力してもよい。
【0062】
ノイズスペクトル増幅部362Aは、帯域ゲイン逆量子化部320Aによって生成された平均振幅を用いて、前記ノイズスペクトル列生成部350Aによって生成されたノイズスペクトル列を増幅する。増幅は(数4)と同様の手順で行う。
【0063】
このように、増幅部360Aは符号化列が第2の符号を含む場合、スペクトル逆量子化部340Aによって生成された周波数スペクトル列と帯域ゲイン逆量子化部320Aによって生成された平均振幅とに基づいて、周波数スペクトル列を増幅する。
【0064】
また、増幅部360Aは、符号化列が第2の符号を含まない場合、ノイズスペクトル列生成部350Aによって生成されたノイズスペクトル列と帯域ゲイン逆量子化部320Aによって生成された平均振幅とに基づいて、ノイズスペクトル列を増幅する。スペクトル合成部365Aは、増幅したノイズスペクトル列と増幅したスペクトル列とを合成し、出力スペクトル列を生成する。
【0065】
以上をまとめると、少なくとも1つの第2の符号の周波数帯域の中に、第1の符号の周波数帯域に対応する周波数帯域がある場合、符号化帯域通知部330Aはスペクトル逆量子化部340Aに、第2の符号を逆量子化して復号した周波数スペクトル列を生成するように通知する。この場合、スペクトル逆量子化部340Aは、周波数スペクトル列をスペクトル増幅部364Aに出力する。スペクトル増幅部364Aは、周波数スペクトル列を、第1の符号を帯域ゲイン逆量子化部320Aによって逆量子化された平均振幅によって増幅する。
【0066】
あるいは、少なくとも1つの第2の符号の周波数帯域の中に、第1の符号の周波数帯域に対応する周波数帯域がない場合、符号化帯域通知部330Aはノイズスペクトル列生成部350Aに、ノイズスペクトル列を出力するように通知する。この場合、ノイズスペクトル列生成部350Aは、ノイズスペクトル列をノイズスペクトル増幅部362Aに出力する。ノイズスペクトル増幅部362Aは、ノイズスペクトル列を、第1の符号を帯域ゲイン逆量子化部320Aによって逆量子化された平均振幅によって増幅する。
【0067】
図4は、復号化装置120Aの出力する出力スペクトル列によって表される出力スペクトルを示す。図4の縦軸は出力スペクトルの振幅、横軸は周波数を表す。
【0068】
図4は、周波数帯域を低域側と高域側の2つに分けて、符号化列が低域側のスケールファクターバンドに対応する第2の符号を含む場合を図示したが、本実施の形態は、このように符号化列が第2の符号を含む周波数帯域が低域から連続する場合に限定されない。増幅部360Aから出力される出力スペクトル列によって表される出力スペクトルは、周波数時間変換部30(図1参照)によって、時間信号列である復号オーディオ信号に変換される。
【0069】
上述の説明では、符号化装置110Aが量子化し符号化するスケールファクターバンドおよび復号化装置120Aが復号化するスケールファクターバンドが予め設定されている場合を説明した。しかし、本実施の形態はこれに限定されない。本実施の形態は、符号化装置110Aが量子化し符号化するスケールファクターバンドが、平均振幅または符号化スペクトル列の情報量に基づいて決定されてもよい。また、復号化装置120Aが復号化するスケールファクターバンドは、符号化列に含まれる符号によって決定されてもよい。
【0070】
図2Bは、図1に示される符号化装置110の一例としての符号化装置110Bの構成例を示す。
【0071】
符号化装置110Bは、帯域ゲイン符号化部210Bがスケールファクターバンドの平均振幅を表すのに使用した符号化列の情報量に基づいて、符号化帯域決定部220Bが量子化し符号化すべき周波数帯域を決定し、符号化列生成部240Bは符号化帯域決定部220Bが決定した周波数帯域を表す符号を符号化列に含める点を除いて、図2Aで説明した符号化装置110Aと同様である。符号化装置110Bの帯域ゲイン符号化部210B、符号化帯域決定部220B、スペクトル符号化部230B、符号化列生成部240Bは、符号化装置110Aの帯域ゲイン符号化部210A、符号化帯域決定部220A、スペクトル符号化部230A、符号化列生成部240Aにそれぞれ対応する。
【0072】
帯域ゲイン符号化部210Bで各スケールファクターバンドの平均振幅を表すのに使用した符号化列の情報量に応じて、符号化帯域決定部220Bは、スペクトル符号化部230Bが量子化し符号化すべきスケールファクタバンドの数を決定する。
【0073】
例えば、平均振幅を表すのに使用した符号化列の情報量がある閾値よりも大きい場合、符号化帯域決定部220Bは、スペクトル符号化部230Bが量子化し符号化すべきスケールファクタバンドの数を少なくする。反対に、平均振幅を表すのに使用した符号化列の情報量がある閾値よりも小さい場合、符号化帯域決定部220Bは、スペクトル符号化部230Bが量子化し符号化すべきスケールファクタバンドの数を多くする。
【0074】
このように、符号化帯域決定部220Bは、帯域ゲイン符号化部210Bの符号化の結果に基づいて、量子化し符号化すべきスケールファクタバンドの数を制御することができる。
【0075】
この場合、符号化列生成部240Bは、帯域ゲイン符号化部210Bによって生成された平均振幅およびスペクトル符号化部230Bによって生成された符号化スペクトル列に加えて、符号化帯域決定部220Bが決定した量子化し符号化すべきスケールファクタバンドを表す符号(第3の符号)から、符号化列を生成する。
【0076】
図2Cは、図1に示される符号化装置110の一例としての符号化装置110Cの構成例を示す。
【0077】
符号化装置110Cは、スペクトル符号化部230Cが符号化スペクトル列を表すのに使用した符号化列の情報量に基づいて、符号化帯域決定部220Cが量子化し符号化すべき周波数帯域を決定し、符号化列生成部240Cは符号化帯域決定部220Cが決定した周波数帯域を表す符号を符号化列に含める点を除いて、図2Aで説明した符号化装置110Aと同様である。符号化装置110Cの帯域ゲイン符号化部210C、符号化帯域決定部220C、スペクトル符号化部230C、符号化列生成部240Cは、符号化装置110Aの帯域ゲイン符号化部210A、符号化帯域決定部220A、スペクトル符号化部230A、符号化列生成部240Aにそれぞれ対応する。
【0078】
例えば、符号化列の大きさがあらかじめ設定されており、スペクトル符号化部230Cの符号化のタイプがハフマン符号である場合、符号化帯域決定部220Cは、複数の周波数帯域のうちの低域側の周波数帯域から順にハフマン符号化を行なうように決定する。符号化列の大きさの制約によって全てハフマン符号化を行なうことができない場合、符号化帯域決定部220Cは、ある周波数帯域より高域側の周波数帯域をハフマン符号化しないように決定する。この場合も、符号化列生成部240Cは、帯域ゲイン符号化部210Aによって生成された平均振幅およびスペクトル符号化部230Cによって生成された符号化スペクトル列に加えて、符号化帯域決定部220Cが決定した量子化し符号化すべきスケールファクタバンドを表す符号(第3の符号)から、符号化列を生成する。
【0079】
あるいは、符号化帯域決定部220Cには、必ず量子化し符号化する周波数帯域が予め決定されている場合も考えられる。この場合、スペクトル符号化部230Cが予め決定された周波数帯域を量子化し符号化した第2の符号の大きさに基づいて、始めに量子化し符号化すべきと決定されていなかった周波数帯域の中から、さらに量子化し符号化すべき周波数帯域を再決定してもよい。このとき、スペクトル符号化部230Cは、再決定された周波数帯域について周波数スペクトル列を量子化し符号化し、さらなる第2の符号を生成する。
【0080】
図2Bおよび図2Cに示したように、符号化列は、どのスケールファクターバンドが符号化されたのかを表す第3の符号を含んでもよい。
【0081】
その場合の復号化装置の動作を図3に示される復号化装置120Aを参照して説明する。
【0082】
符号化列解析部310Aは、符号化列の第3の符号を解析する。符号化帯域通知部330Aは、符号化列解析部310Aによって解析された第3の符号に基づいて、どのスケールファクターバンドが符号化されているかを復号し、復号した結果に基づいて、スペクトル逆量子化部340Aまたはノイズスペクトル列生成部350Aに通知する。例えば、符号化帯域通知部330Aは、低域側のN個のスケールファクターバンドが符号化されているなどの情報を復号する。
【0083】
スペクトル逆量子化部340Aは、符号化列解析部330Aによって解析された結果に基づいて、符号化帯域通知部330Aで、符号化されたと判断されたスケールファクターバンドの周波数スペクトルを復号する。第2の符号の符号化がハフマン符号化で行われている場合、スペクトル逆量子化部340Aは第2の符号をハフマン復号する。第2の符号の符号化がベクトル量子化で行われている場合、スペクトル逆量子化部340Aは、第2の符号を逆ベクトル量子化する。増幅部360Aは、帯域ゲイン逆量子化部320Aで復号化された平均振幅を用いて、スペクトル逆量子化部340Aによって生成された復号周波数スペクトルを増幅する。
【0084】
このような方法で生成された符号化列は、少ない情報量であっても、広帯域の復号化された復号オーディオ信号を得ることができる。これは全ての広帯域の信号に対するスペクトルの微細構造を符号化しているものではなく、一部の帯域については、その平均振幅のみを符号化するだけであるので、符号化列を小さくできるからである。しかしながら、このようにして生成された復号オーディオ信号は、符号化時に入力されたオーディオ信号の各周波数帯域の平均振幅を保持しているので、狭帯域な音にあるこもった感じの少ない明瞭な再生を提供することができる。
【0085】
(実施の形態2)
本実施の形態2は、符号化時に、オーディオ信号を表す1フレームの時間信号列を複数の時間領域に対応する複数の時間信号列に分割し、分割した時間領域ごとに時間信号列の平均振幅を符号化する点で実施の形態1とは異なる。また、本実施の形態2は、復号化時に、1フレームの時間信号列を複数の時間領域に対応する複数の時間信号列に分割した時間領域の時間信号列の平均振幅を表す第4の符号を復号する点で実施の形態1とは異なる。
【0086】
図5は、図1に示される符号化装置110の一例としての符号化装置110Dの構成例を示す。
【0087】
符号化装置110Dは、時間領域の時間信号列の平均振幅を表す第4の符号を生成する時間領域ゲイン符号化部250Dをさらに含み、符号化列生成部240Dが第4の符号を符号化列に含める点を除いて、図2Aで説明した符号化装置110Aと同様である。符号化装置110Dの帯域ゲイン符号化部210D、符号化帯域決定部220D、スペクトル符号化部230D、符号化列生成部240Dは、符号化装置110Aの帯域ゲイン符号化部210A、符号化帯域決定部220A、スペクトル符号化部230A、符号化列生成部240Aにそれぞれ対応する。
【0088】
オーディオ信号は、所定数のサンプル毎に時間周波数変換部20に入力される。時間周波数変換部20は、変形離散コサイン変換(MDCT変換)などの方法を用いて、時間軸上の信号列から、周波数軸上のスペクトルを生成する。上述したように、周波数軸上のスペクトルは1フレームの周波数スペクトルである。時間周波数変換部20によって生成された周波数スペクトルは、実施の形態1において説明したのと同様に、周波数スペクトル列として、帯域ゲイン符号化部210Dおよび符号化帯域決定部220Dに入力される。
【0089】
オーディオ信号は、また、オーディオ離散信号として、時間領域ゲイン符号部250Dに、時間周波数変換部20と同じ時間間隔毎に入力される。時間領域ゲイン符号部250Dは、オーディオ離散信号を時間的に連続な複数の時間領域に分割する。
【0090】
例えば、オーディオ信号が時間的に連続な512サンプルによって表される場合、時間領域ゲイン符号部250Dは、オーディオ信号をin[i](i=0,1,2,...,511)とし、128サンプル毎の4つの時間領域に分割すると仮定する。第0の時間領域のデータは、iが0から127の場合のin[i]である。第1の時間領域のデータは、iが128から255の場合のin[i]である。第2の時間領域のデータは、iが256から383の場合のin[i]である。第3の時間領域のデータは、iが384から511の場合のin[i]である。時間領域ゲイン符号化部250Dは、例えば(数5)を用いて、各時間領域の平均振幅を算出する。
【0091】
【数5】
Figure 0004008244
ここで、jは時間領域の番号であり、g[j]は、第j番目の時間領域の平均振幅である。次に、算出された各時間領域の平均振幅から、各時間領域の平均振幅比を算出する。例えば、4つの時間領域のうち、最大値をとる時間領域の平均振幅を16になるように正規化すれば、各時間領域の平均振幅比は4ビットで表される。例えば、(数6)のようにして算出する。
【0092】
【数6】
Figure 0004008244
ここで、rg(j)は量子化された第j番目の時間領域の平均振幅であり、gmaxは、g(j)の最大値である。時間領域ゲイン符号部250Dは、算出したrg(j)を符号化し、符号化列生成部240Dに送る。なお、上記説明では、rg(j)を導出する際に、4ビットで量子化するように16で正規化したが、必ずしも4ビットでなくてもよい。例えば、各時間領域の平均振幅比を1ビットで量子化してもよい。このように、各時間領域の平均振幅比を導出することで、所定の情報量で時間領域の平均振幅を表すことができる。
【0093】
また、上記説明では、各時間領域の平均振幅比を導出したが、本実施の形態はこれに限定されない。各時間領域の平均振幅を単に符号化した値を符号化列生成部240Dに送信してもよい。
【0094】
図6は、図1に示される復号化装置120の一例としての復号化装置120Bの構成例を示す。
【0095】
復号化装置120Bは、時間領域ゲイン復号部370Bを有する点で図3に示した復号化装置120Aとは異なる。図6に示される復号化装置120Bの符号化列解析部310B、帯域ゲイン逆量子化部320B、符号化帯域通知部330B、スペクトル逆量子化部340B、ノイズスペクトル列生成部350B、増幅部360B、スペクトル合成部365Bは、それぞれ、図3に示される復号化装置120Aの符号化列解析部310A、帯域ゲイン逆量子化部320A、符号化帯域通知部330A、スペクトル逆量子化部340A、ノイズスペクトル列生成部350A、増幅部360A、スペクトル合成部365Aに対応する。
【0096】
復号化装置120Bにおいて、符号化列解析部330Bは、時間領域の時間信号列の平均振幅を表す第4の符号を含む符号化列を受けて、符号化列を解析する。時間領域ゲイン復号化部370Bは、符号化列解析部330Bによって解析された第4の符号から時間領域の時間信号列の平均振幅を復号する。第4の符号から復号化された時間領域の時間信号列の平均振幅は、ノイズスペクトル列生成部350Bへと送られる。ノイズスペクトル列生成部350Bは時間領域ゲイン復号化部370Bによって復号化された第4の符号に基づいて、複数の時間領域のそれぞれのノイズ信号に変換されるノイズスペクトル列を生成する。
【0097】
ここで、第4の符号が、図5を参照して上述したように、各時間領域の平均振幅の比を表す時間領域ゲイン比rg(j)である場合、ノイズスペクトル列生成部350Bは、ノイズ信号に対して、時間領域ゲイン比rg(j)をグループ長に応じて乗じて増幅された増幅ノイズ信号を生成する。例えば、(数7)のような増幅ノイズ信号を生成することに相当する。
【0098】
【数7】
Figure 0004008244
n(i)は、ノイズ信号であり、an(i)は増幅ノイズ信号である。ノイズスペクトル列生成部350Bは、増幅ノイズ信号an(i)を時間周波数変換部20と同様の時間周波数変換することによって、ノイズスペクトルを生成し、増幅部360Bに出力する。以降の処理は、上述した実施の形態1と同様である。また、ノイズスペクトル列生成部350Bは、ノイズスペクトルの値を予め何らかの記録手段に保持し、必要とされる場合に単に出力してもよい。
【0099】
このような方法で生成された符号化列は、少ない情報量であっても、広帯域の復号化された復号オーディオ信号を得ることができる。これは全ての広帯域の信号に対するスペクトルの微細構造を符号化しているものではなく、一部の帯域については、その平均振幅のみを符号化するだけであるので、符号化列を小さくできるからである。しかしながら、このようにして得られた復号オーディオ信号は、符号化時に入力されたオーディオ信号の各周波数帯域の平均振幅を保持しているので、狭帯域な音にあるこもった感じの少ない明瞭な再生音を提供することができる。また時間的な平均振幅を復号化することで、歯切れの良い再生を提供することが可能である。
【0100】
(実施の形態3)
本実施の形態3は、符号化時に、量子化し符号化しない周波数帯域をサブ帯域に分割し、サブ帯域の平均振幅を生成する点で実施の形態1とは異なる。また、本実施の形態3は、復号化時に、量子化し符号化しない周波数帯域を分割したサブ帯域の周波数スペクトル列の平均振幅を表す第5の符号を復号する点で実施の形態1とは異なる。
【0101】
図7は、図1に示される符号化装置110の一例としての符号化装置110Eの構成例を示す。符号化装置110Eは、サブ帯域符号化部260Eを有する点で、図2Aに示した符号化装置110Aとは異なる。符号化装置110Eの帯域ゲイン符号化部210E、符号化帯域決定部220E、スペクトル符号化部230E、符号化列生成部240Eは、それぞれ、符号化装置110Aの帯域ゲイン符号化部210A、符号化帯域決定部220A、スペクトル符号化部230A、符号化列生成部240に対応する。
【0102】
符号化帯域決定部220Eによって量子化し符号化しないと判定されたスケールファクターバンドの周波数スペクトル列は、サブ帯域ゲイン符号化部260Eに入力される。サブ帯域ゲイン符号化部260Eは、符号化しないと判定された周波数帯域(スケールファクターバンド)の周波数スペクトル列の全て、もしくは、その一部を選択する。本明細書において、選択された周波数帯域をサブ帯域ゲイン符号化適用帯域と呼ぶ。
【0103】
スペクトル符号化部230Eによって符号化に使用された情報量に応じて、サブ帯域ゲイン符号化適用帯域を変化させてもよい。例えば、スペクトル符号化部230Eによって符号化された情報量がある閾値よりも大きい場合、サブ帯域ゲイン符号化部260Eはサブ帯域ゲイン符号化適用帯域を小さくする。反対に、スペクトル符号化230Eによって符号化された情報量がある閾値よりも小さい場合、サブ帯域ゲイン符号化部260Eはサブ帯域ゲイン符号化適用帯域を大きくする。
【0104】
サブ帯域ゲイン符号化適用帯域の範囲内にある少なくとも1つの周波数スペクトルはサブ帯域に分割される。このとき、サブ帯域は2つ以上の周波数帯域からなってもよい。
【0105】
以下では、具体例として、1つのサブ帯域ゲイン符号化適用帯域の範囲内にある周波数スペクトルは16個のデータを有し、この周波数スペクトルを、周波数帯域内で最も低域周波数の成分に相当する周波数スペクトルから最も高域周波数の成分に相当する周波数スペクトルの順に並べて、最も低域周波数成分から5個、6個、5個のデータを有する3つのサブ帯域に分割する場合を想定する。
【0106】
図9は、本実施の形態によるサブ帯域の周波数スペクトルを模式的に示す。図9において、サブ帯域0が最も低域周波数スペクトルのサブ帯域であり、サブ帯域1が中間の周波数スペクトルのサブ帯域であり、サブ帯域2が最も高域周波数スペクトルのサブ帯域である。各サブ帯域において、各々のサブ帯域の平均振幅を算出する。例えば(数8)を用いて、各々のサブ帯域の平均振幅を算出する。
【0107】
【数8】
Figure 0004008244
ここで、あるサブ帯域ゲイン符号化適用帯域は、ssp(j)なる周波数スペクトルからなり、subG[i]は算出されたサブ帯域iの平均振幅である。サブ帯域ゲイン符号化部260Eは、算出された平均振幅がある閾値よりも大きいか小さいかに基づいいてサブ帯域の平均振幅を符号化し、符号化した結果を符号化列生成部104Cに送る。算出された平均振幅がある閾値よりも大きいか小さいかを表す符号化subGsw[i]は、例えば(数9)のように与えられる。
【0108】
【数9】
Figure 0004008244
ここで、Thは実装上の閾値である。
【0109】
図8は、図1に示される復号化装置120の一例としての復号化装置120Cの構成例を示す。復号化装置120Cは、サブ帯域ゲイン符号化部380Cを備える点で図3に示した復号化装置120Aとは異なる。
【0110】
図8に示される復号化装置120Cの符号化列解析部310C、帯域ゲイン逆量子化部320C、符号化帯域通知部330C、スペクトル逆量子化部340C、ノイズスペクトル列生成部350C、増幅部360Cは、それぞれ、図3に示される復号化装置120Aの符号化列解析部310A、帯域ゲイン逆量子化部320A、符号化帯域通知部330A、スペクトル逆量子化部340A、ノイズスペクトル列生成部350A、増幅部360Aに対応する。
【0111】
復号化装置120Cにおいて、符号化列解析部310Cは、量子化し符号化しない周波数スペクトル列の周波数帯域を分割したサブ帯域の周波数スペクトル列の平均振幅を表す第5の符号を含む符号化列を受けて、符号化列を解析する。サブ帯域ゲイン復号化部380Cは、符号化列解析部310Cによって解析された第5の符号をサブ帯域の周波数スペクトルの平均振幅に復号化し、復号化した平均振幅に基づいて、複数のサブ帯域のノイズスペクトル列を生成する。
【0112】
従って、サブ帯域ゲイン復号化部380Cは、まず符号化帯域通知部330Aから量子化し符号化しないと通知される周波数帯域の中から、サブ帯域ゲイン符号化適用帯域がいずれであるかを復号し、かつ、各サブ帯域ゲイン符号化適用帯域におけるサブ帯域の周波数スペクトル列の平均振幅を復号する。そして、ノイズスペクトル列生成部350Cから出力されるノイズスペクトルに、サブ帯域の周波数スペクトル列の平均振幅を乗算して、サブ帯域ゲイン復号化部380Cから出力する。サブ帯域ゲイン復号化部380Cの出力は、(数10)などで求められる。
【0113】
【数10】
Figure 0004008244
ここで、nsp(i)はノイズスペクトルであり、bn(i)は、サブ帯域ゲイン復号部380Cの出力する周波数スペクトルである。サブ帯域ゲイン復号部380Cの出力は、増幅部360Aへと入力され、以降の処理は、実施の形態1と同様である。
【0114】
このような方法で生成された符号化列は、少ない情報量であっても、広帯域の復号化された復号オーディオ信号を得ることができる。これは全ての広帯域の信号に対するスペクトルの微細構造を符号化しているものではなく、一部の周波数帯域については、その平均振幅のみを符号化するだけであるので、符号化列を小さくできるからである。しかしながら、このようにして得られた復号オーディオ信号は、符号化時に入力されたオーディオ信号の各周波数帯域の平均振幅を保持しているので、狭帯域な音にあるこもった感じの少ない明瞭な再生を提供することができる。また、サブ帯域ゲイン復号化部380Cを用いることで、符号化帯域通知部330Aによって符号化された周波数スペクトルがないと通知された周波数帯域においても、少ない情報量の増加をして、よりオーディオ信号に近い再生が可能となる。
【0115】
【発明の効果】
以上のように、本発明の符号化装置および復号化装置によれば、低いビットレートで、広帯域な復号オーディオ信号に復号化される符号化列を提供することが可能となる。
【0116】
本発明によれば、複数の周波数帯域のうち、低域の周波数成分に対してその周波数の微細構造をハフマン符号化などの圧縮技術を用いて符号化し、高域の周波数成分に対してその微細構造を符号化せず、平均振幅の情報だけを符号化することもでき、それにより、高域の周波数成分が符号化で消費する情報量を極小化することができる。しかしながら、復号化過程では、高域周波数の成分をノイズスペクトルによって生成するため、再生音は広帯域なものを得ることができる。
【図面の簡単な説明】
【図1】本発明によるオーディオ信号変換システムの構成例を示す図
【図2A】図1に示される符号化装置110の一例としての符号化装置の構成例を示す図
【図2B】図1に示される符号化装置110の一例としての符号化装置の構成例を示す図
【図2C】図1に示される符号化装置110の一例としての符号化装置の構成例を示す図
【図3】図1に示される復号化装置120の一例としての復号化装置の構成例を示す図
【図4】復号化装置の出力する出力スペクトル列によって表される出力スペクトルを示すグラフ
【図5】図1に示される符号化装置110の一例としての符号化装置の構成例を示す図
【図6】図1に示される復号化装置120の一例としての復号化装置の構成例を示す図
【図7】図1に示される符号化装置110の一例としての符号化装置の構成例を示す図
【図8】図1に示される復号化装置120の一例としての復号化装置の構成例を示す図
【図9】実施の形態3よるサブ帯域の周波数スペクトルを模式的に示すグラフ
【図10】従来の符号化装置の構成例を示す図
【符号の説明】
10 オーディオ信号変換システム
20 時間周波数変換部
30 周波数時間変換部
40 再生部
100 データ処理システム
110 符号化装置
120 復号化装置
210A 帯域ゲイン符号化部
220A 符号化帯域決定部
230A スペクトル符号化部
240A 符号化列生成部
250D 時間領域ゲイン符号化部
260E サブ帯域ゲイン符号化部
310A 符号化列解析部
320A 帯域ゲイン逆量子化部
330A 符号化帯域再生部
340A スペクトル逆量子化部
350A ノイズスペクトル列生成部
360A 増幅部
370B 時間領域ゲイン復号化部
380C サブ帯域ゲイン復号化部

Claims (16)

  1. 複数フレームの時間信号列を含むオーディオ信号の、1フレームの時間信号列を時間周波数変換することにより得られる1フレームの周波数スペクトルの複数の周波数帯域のそれぞれについて周波数スペクトル列の平均振幅を算出することにより、前記周波数スペクトル列の平均振幅を表す第1の符号を生成する帯域ゲイン符号部と、
    前記複数の周波数帯域のうち、周波数スペクトル列を量子化し符号化すべき少なくとも1つの周波数帯域を決定する符号化帯域決定部と、
    前記符号化帯域決定部によって決定された前記少なくとも1つの周波数帯域のそれぞれについて周波数スペクトル列を量子化し符号化することにより、第2の符号を生成するスペクトル符号化部と、
    1フレームの時間信号列を複数の時間領域に対応する複数の時間信号列に分割し、前記複数の時間領域のそれぞれの時間信号列の平均振幅を算出することにより、前記時間信号列の平均振幅を表す第4の符号を生成する時間領域ゲイン符号化部と、
    前記第1の符号と前記第2の符号と前記第4の符号とに基づいて、符号化列を生成する符号化列生成部と
    を備えた、符号化装置。
  2. 前記符号化帯域決定部は、前記周波数スペクトル列の平均振幅を表す前記第1の符号の大きさに基づいて、前記周波数スペクトル列を量子化し符号化すべきかを決定する、請求項1に記載の符号化装置。
  3. 前記符号化帯域決定部は、前記量子化し符号化すべきと決定された少なくとも1つの周波数帯域について前記スペクトル符号化部によって生成される第2の符号の大きさに基づいて、前記量子化し符号化すべきと決定されていなかった周波数帯域の中から、さらに量子化し符号化すべき周波数帯域を再決定し、
    前記スペクトル符号化部は、前記再決定された周波数帯域について周波数スペクトル列を量子化し符号化することにより、第2の符号を生成する、請求項1に記載の符号化装置。
  4. 前記符号化帯域決定部が、複数の周波数帯域のうち、どの周波数帯域の周波数スペクトル列を量子化し符号化したかを表す第3の符号と、前記第1の符号と、前記第2の符号と、前記第4の符号とに基づいて、前記符号化列生成部は前記符号化列を生成する、請求項1に記載の符号化装置。
  5. 前記スペクトル符号化部は、ハフマン符号化を行なう、請求項1に記載の符号化装置。
  6. 前記スペクトル符号化部は、ベクトル量子化を行なう、請求項1に記載の符号化装置。
  7. 前記スペクトル符号化部は、ハフマン符号化およびベクトル量子化を行なう、請求項1に記載の符号化装置。
  8. 前記複数の周波数帯域のうち、前記符号化帯域決定部によって量子化し符号化すべきと決定されなかった周波数帯域うち、少なくとも1つの周波数帯域を複数のサブ帯域に分割し、前記複数のサブ帯域の各々の平均振幅を表す第5の符号を生成するサブ帯域ゲイン符号化部をさらに備える、
    請求項1に記載の符号化装置。
  9. 前記複数のサブ帯域の少なくとも1つは、前記2つ以上の周波数スペクトル列を含む、請求項8に記載の符号化装置。
  10. 第1の符号と少なくとも1つの第2の符号と第4の符号とを含む符号化列を復号化する復号化装置であって、
    前記第1の符号は、1フレームの周波数スペクトルを構成する複数の周波数帯域のうちの1つについて周波数スペクトル列の平均振幅を表すように生成されたものであり、
    前記少なくとも1つの第2の符号のそれぞれは、前記複数の周波数帯域のうちの1つについて周波数スペクトル列を量子化し符号化することによって生成されたものであり、
    前記第4の符号は、前記1フレームの周波数スペクトル列を時間周波数変換する前の1 フレームの時間信号列を複数の時間領域に分割し、前記複数の時間領域に対応する複数の時間信号列それぞれの平均振幅を表すように生成されたものであり、
    前記符号化列を解析し、前記第1の符号と前記少なくとも1つの第2の符号と前記第4の符号とを検出する符号化列解析部と、
    前記符号化列解析部によって検出された前記第1の符号を前記周波数スペクトル列の平均振幅に逆量子化する帯域ゲイン逆量子化部と、
    前記少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域があるか否かを通知する符号化帯域通知部と、
    前記第4の符号を前記時間信号列の平均振幅に復号化する時間領域ゲイン復号化部と、
    前記少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域があるという前記符号化帯域通知部の通知に基づいて、前記第2の符号を前記周波数スペクトル列に逆量子化し復号化するスペクトル逆量子化部と、
    前記少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域がないという前記符号化帯域通知部の通知及び前記時間領域ゲイン復号化部において復号化された前記時間信号列の平均振幅に基づいて、ノイズスペクトル列を生成するノイズスペクトル列生成部と、
    前記周波数スペクトル列または前記ノイズスペクトル列を前記周波数スペクトル列の平均振幅に基づいて増幅する増幅部と
    を備える、復号化装置。
  11. 前記符号化列は、複数の周波数帯域のうち、どの周波数帯域を周波数スペクトル列に量子化し符号化したかを表す第3の符号をさらに含み、
    前記符号化帯域通知部は第3の符号を復号化し、前記復号化した第3の符号に基づいて、前記少なくとも1つの第2の符号の周波数帯域の中に、前記第1の符号の周波数帯域に対応する周波数帯域があるか否かを通知する、請求項10に記載の復号化装置。
  12. 前記スペクトル逆量子化部は、ハフマン復号化を行なう、請求項10に記載の復号化装置。
  13. 前記スペクトル逆量子化部は、ベクトル逆量子化を行なう、請求項10に記載の復号化装置。
  14. 前記スペクトル逆量子化部は、ハフマン復号化およびベクトル逆量子化を行なう、請求項10に記載の復号化装置。
  15. 前記ノイズスペクトル列生成部は、前記時間領域ゲイン復号化部によって復号化された前記第4の符号に基づいて、前記複数の時間領域のそれぞれのノイズ信号に変換されるノイズスペクトル列を生成する、請求項10に記載の復号化装置。
  16. 前記符号化列は、前記スペクトル逆量子化部によって逆量子化されない周波数帯域うち、少なくとも1つの周波数帯域を分割した複数のサブ帯域の各々の平均振幅を表す第5の符号をさらに含み、
    前記第5の符号を前記サブ帯域の平均振幅に復号化し、前記復号化した平均振幅に基づいて、前記複数のサブ帯域のノイズスペクトル列を生成するサブ帯域復号化部をさらに備える、
    請求項10に記載の復号化装置。
JP2002016246A 2001-03-02 2002-01-24 符号化装置および復号化装置 Expired - Fee Related JP4008244B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002016246A JP4008244B2 (ja) 2001-03-02 2002-01-24 符号化装置および復号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001057746 2001-03-02
JP2001-57746 2001-03-02
JP2002016246A JP4008244B2 (ja) 2001-03-02 2002-01-24 符号化装置および復号化装置

Publications (2)

Publication Number Publication Date
JP2002328699A JP2002328699A (ja) 2002-11-15
JP4008244B2 true JP4008244B2 (ja) 2007-11-14

Family

ID=26610480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002016246A Expired - Fee Related JP4008244B2 (ja) 2001-03-02 2002-01-24 符号化装置および復号化装置

Country Status (1)

Country Link
JP (1) JP4008244B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101556800B (zh) 2003-10-23 2012-05-23 松下电器产业株式会社 音频频谱编解码方法和装置、声音信号发送和接收装置
US7251577B2 (en) * 2004-07-19 2007-07-31 Tektronix, Inc. Realtime power mask trigger
WO2006125342A1 (fr) * 2005-05-25 2006-11-30 Lin, Hui Procede de compression d'information pour fichier audio numerique
WO2006126859A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
AU2006266579B2 (en) 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
JP2009500657A (ja) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
CA2613731C (en) 2005-06-30 2012-09-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP4859925B2 (ja) 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
EP1938663A4 (en) 2005-08-30 2010-11-17 Lg Electronics Inc DEVICE FOR ENCODING AND DECODING AUDIO SIGNAL AND CORRESPONDING METHOD
KR100880643B1 (ko) 2005-08-30 2009-01-30 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100857116B1 (ko) 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US8755442B2 (en) 2005-10-05 2014-06-17 Lg Electronics Inc. Method of processing a signal and apparatus for processing a signal
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7653533B2 (en) 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
EP2916318B1 (en) * 2012-11-05 2019-09-25 Panasonic Intellectual Property Corporation of America Speech audio encoding device, speech audio decoding device, speech audio encoding method, and speech audio decoding method

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05183523A (ja) * 1992-01-06 1993-07-23 Oki Electric Ind Co Ltd 音声・楽音符号化装置
JPH07253794A (ja) * 1994-03-15 1995-10-03 Nippon Telegr & Teleph Corp <Ntt> 音表現装置
JP2798003B2 (ja) * 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP4281131B2 (ja) * 1998-10-22 2009-06-17 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility

Also Published As

Publication number Publication date
JP2002328699A (ja) 2002-11-15

Similar Documents

Publication Publication Date Title
JP4008244B2 (ja) 符号化装置および復号化装置
US7627480B2 (en) Support of a multichannel audio extension
US6240380B1 (en) System and method for partially whitening and quantizing weighting functions of audio signals
EP1701340B1 (en) Decoding device, method and program
US6253165B1 (en) System and method for modeling probability distribution functions of transform coefficients of encoded signal
KR100346066B1 (ko) 오디오신호 코딩방법
US6263312B1 (en) Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
EP1080579B1 (en) Scalable audio coder and decoder
JP2005049889A (ja) オーディオ信号コーディング中にノイズ置換を信号で知らせる方法
JP2007017908A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2011059714A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JPH0856163A (ja) 適応的デジタルオーディオ符号化システム
KR101235829B1 (ko) 음성코덱의 품질향상장치 및 그 방법
AU2002226717B2 (en) Apparatus for coding scaling factors in an audio coder
JP2002542522A (ja) 音声符号化のための利得−適応性量子化及び不均一符号長の使用
US6678647B1 (en) Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
Lincoln An experimental high fidelity perceptual audio coder
Sinha et al. Low bit rate transparent audio compression using a dynamic dictionary and optimized wavelets
Lin et al. Subband coding with modified multipulse LPC for high quality audio
JP3863706B2 (ja) 音声符号化方法
JP3263881B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法
JPH07508375A (ja) スタジオ用デジタルオーディオ信号の記憶及び又は通信時のデータ整理方法
Lincoln An experimental high fidelity perceptual audio coder project in mus420 win 97
JP5569476B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070705

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070829

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100907

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4008244

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110907

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120907

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130907

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees