JP3753956B2 - 符号化装置 - Google Patents

符号化装置 Download PDF

Info

Publication number
JP3753956B2
JP3753956B2 JP2001188732A JP2001188732A JP3753956B2 JP 3753956 B2 JP3753956 B2 JP 3753956B2 JP 2001188732 A JP2001188732 A JP 2001188732A JP 2001188732 A JP2001188732 A JP 2001188732A JP 3753956 B2 JP3753956 B2 JP 3753956B2
Authority
JP
Japan
Prior art keywords
block
gain
amplitude
change
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001188732A
Other languages
English (en)
Other versions
JP2003005799A (ja
Inventor
滋 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001188732A priority Critical patent/JP3753956B2/ja
Publication of JP2003005799A publication Critical patent/JP2003005799A/ja
Application granted granted Critical
Publication of JP3753956B2 publication Critical patent/JP3753956B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、高能率符号化によって入力信号の符号化を行う符号化装置に関するものである。
【0002】
【従来の技術】
デジタルオーディオ信号の符号化装置における高能率符号化の方法としては、各サンプルが多値で表される時間軸上の入力信号をNサンプルからなる時間単位でブロック化してブロックごとに時間軸上の信号を周波数軸上の信号に変換、すなわちスペクトル変換して複数の周波数領域に分割し、各周波数領域ごとに符号化する変換符号化方式や、時間軸上の入力信号をブロック化せずに複数の周波数帯域に分割して符号化する帯域分割符号化方式を挙げることができる。また、帯域分割方式符号化方式と変換符号化方式とを組み合わせた方式も考えられている。
【0003】
上述の帯域分割符号化方式で用いられる帯域分割フィルタには、例えばQMF(Quadrature Mirror Filter) などのフィルタがある。また、変換符号化方式のスペクトル変換には、例えばモディファイド離散コサイン変換(MDCT)などがあり、このよな変換を行うことにより、時間軸上の信号を周波数軸上の信号に変換することができる。
【0004】
ここで、スペクトル変換としてMDCTを使用した場合、ブロック間の接続歪みを軽減するために、両隣のブロックでそれぞれN個ずつのサンプルデータをオーバーラップさせた2N個のサンプルデータを用いてスペクトル変換を行い、独立したN個の実数データ、すなわちMDCT係数データを得るようにしているため、平均してN個のサンプルデータに対してN個の実数データが得られることになり、スペクトル変換として離散フーリエ変換(DFT)や離散コサイン変換(DCT)を使用した場合よりも効率のよい符号化を行うことが可能である。
【0005】
以上のようにして、帯域ごとに分割され、周波数軸上に変換された信号を量子化することにより、量子化雑音が発生する帯域を制御することができ、マスキング効果などの性質を利用して聴覚的に、より高能率な符号化を行うことができる。この符号化データを復号化して再生信号を再現する場合には、符号化データを復号化して逆量子化を行い、得られたデータに対して逆MDCT変換などによる逆スペクトル変換を施して帯域合成フィルタを施す。
【0006】
なお、上述のMDCTによるスペクトル変換を行い、得られた実数データを量子化して符号化した符号化データを復号化して再生信号を再現する場合には、符号化データを復号化して逆量子化を行い、得られた実数データに対して逆MDCT変換による逆スペクトル変換を施し、同じブロック内の要素を干渉させながら加え合わせることにより、入力信号を再構成することになる。
【0007】
このように、入力信号をブロック化してブロックごとにスペクトル成分に分解する処理を行い、得られたスペクトル成分を量子化して符号化する方法を用いると、復号化してブロックごとに合成して得られた信号には量子化雑音が発生する。入力信号に、無音の準定常状態から強振幅状態へ移行する際に現れるアタック部が存在する場合、この信号をブロック化してブロックごとにスペクトル成分に分解する処理を行い、得られたスペクトル成分を量子化して符号化する方法を用いると、復号化してブロックごとに合成して得られた信号には、アタック部の時間的に前の部分にアタック部に起因する大きな量子化雑音が現れることになる。この量子化雑音は一般にプリエコーと呼ばれ、聴感上の障害になる。一例として、図6に、アタック部が存在する1ブロック分の入力信号A11と、量子化雑音B11とを示す。同図では、アタック部の前の無音の準定常状態であるべきところに、量子化雑音B11によるプリエコーが発生する。
【0008】
特に、長いブロックで分割した入力信号をスペクトル変換した場合は、長い時間にわたってプリエコーが発生してしまうことがある。そこで、ブロックの長さを短くすれば、量子化雑音の発生期間も短くなる。このため、アタック部の近辺で、スペクトル変換するブロックの長さを短くとれば、プリエコーが発生する期間を短くすることができ、プリエコーによる聴感上の障害を軽減することができる。
【0009】
一方、アタック部のような急激にレベルが変化する信号以外の信号に対しても同様にブロックを短くすると、周波数分解能が低下して符号化効率が低下する。このため、これらの部分に対しては、ブロックを長くした方が、特定のスペクトル成分に対してエネルギーが集中することになって符号化効率が高くなるので望ましい。
【0010】
これらのことから、実際には、入力信号の各部分の性質に応じてスペクトル変換のためのブロックの長さを選択的に切り換えることが行われる。ところが、この方法を実際の構成上で実現しようとすると、異なる長さのブロックでのスペクトル変換に対応したスペクトル変換手段を符号化装置に設ける必要があり、また、復号化装置側にも異なる長さのブロックに対応した逆スペクトル変換が可能な逆スペクトル変換手段を設ける必要がある。従って、符号化装置、復号化装置とも構成が複雑になってしまうという欠点がある。
【0011】
また、入力信号に、強振幅状態から無音の準定常状態へと移行する際に現れるリリース部が存在する場合、この信号を同様に符号化した後に復号化して得られた信号には、リリース部の時間的に後の部分にリリース部に起因する大きな量子化雑音が現れることになる。この量子化雑音は一般にポストエコーと呼ばれ、やはり聴感上の障害になる。一例として、図7に、リリース部が存在する1ブロック分の入力信号A12と、量子化雑音B12とを示す。同図では、リリース部の後の無音の準定常状態であるべきところに、量子化雑音B12によるポストエコーが発生する。
【0012】
これを解決するために、特開平8−237132号公報には、スペクトル変換のためのブロックの長さを十分な周波数分解能を確保することができるような一定の長さに保ったまま、プリエコーおよびポストエコーの発生を防止する技術が開示されている。上記公報の構成によれば、入力信号を時間軸上で複数のサンプルデータからなる複数のブロックに切り出し、さらにこのブロックにウィンドウ関数を掛けた後、ブロックごとに切り出された入力信号を時間軸上で複数のサブブロックに分割してアタック部を検出する。次いで、入力信号の特性に応じて複数通りの中から適応的にゲイン制御量を選択する。そして、アタック部の前のサブブロックの信号成分に対してはアタック部以後の選択された所定倍のゲインでゲイン制御を施し、アタック部直前の小振幅波形の信号を増幅する。さらに、ゲイン制御を施した信号をDFTやDCTなどを用いたスペクトル変換によってスペクトル成分を得て、これを符号化する。
【0013】
これに対する復号化の際には、復号化されたスペクトル成分に逆DFTや逆DCTなどによる逆スペクトル変換を施してから、符号化の際にアタック部直前の信号を増幅したことに対する補正処理を施す。この方式により復号化された再生波形の量子化雑音は、アタック部による同時マスキングによって遮蔽されるため、プリエコーの発生が防止されるようになる。同様にしてポストエコーの発生も防止される。
【0014】
【発明が解決しようとする課題】
しかしながら、上記公報の構成によれば、アタック部の検出範囲をそのアタック部が含まれる1つのブロックのみを用いて行おうとすると、アタック部が先頭サブブロックに存在する場合にはアタック部を検出することができず、ゲイン補正を施すことができなくなってしまう。従って、このような場合にプリエコーが発生してしまう。
【0015】
また、上記公報には、既に処理したブロックの次のブロックの先頭にアタック部が生じるような場合に備えて、アタック部の検出範囲を当該次のブロックの先頭のサブブロックにまで広げておくことも可能であると記載されている。この場合、そのようにして検出されたアタック部を基にゲイン補正を施すと、次のブロックの先頭のサブブロックにもゲイン補正を施すことになる。つまり、先頭のサブブロックは、現在ブロック処理時と前回ブロック処理時との両方でゲイン補正を施される結果、1つのサブブロックに対して2種類のゲイン補正が施されることになり、符号化処理が複雑になる。さらに、このようにゲイン補正が施されて符号化された信号を復号化する際は、あるサブブロックに対して2種類のゲイン情報が存在するために、復号化処理が複雑になる。
【0016】
このように、従来の変換符号化方式の符号化装置には、ブロックの先頭にアタック部が存在する場合にゲイン制御を施すことが困難であるために、プリエコーを容易に防止することができないという問題があった。また、ブロックの先頭にリリース部が存在する場合についても同様にゲイン制御を施すことが困難であるために、ポストエコーを容易に防止することができないという問題があった。
【0017】
本発明は上記従来の問題点に鑑みなされたものであり、その目的は、デジタルオーディオ信号をブロック化してスペクトル変換を行う構成でありながら、ブロックの先頭にアタック部が存在する場合にも容易にプリエコーを防止することができ、またブロックの先頭にリリース部が存在する場合にも容易にポストエコーを防止することができる符号化装置を提供することにある。
【0018】
【課題を解決するための手段】
本発明の符号化装置は、上記課題を解決するために、各サンプルが多値で表される時間軸上のデジタルオーディオ信号を単位時間ごとにブロック化するブロック化手段と、上記ブロック化手段によって作成された各ブロックの信号中にプリエコーあるいはポストエコーのもととなる所定の振幅変化を伴う振幅変化部を検出する振幅変化部検出手段と、上記振幅変化部検出手段の上記振幅変化部の検出結果に基づいて上記各ブロックに関する復号化までに使用されるゲイン情報を決定するゲイン情報決定手段と、上記振幅変化部検出手段による上記振幅変化部の検出結果と上記ゲイン情報決定手段により決定された上記ゲイン情報とに基づいて上記各ブロックの信号にゲイン制御を行うゲイン制御手段と、上記ゲイン制御手段によりゲイン制御が行われた上記各ブロックの信号を周波数軸上の信号にスペクトル変換するスペクトル変換手段と、上記スペクトル変換手段によって得られた周波数軸上の信号を符号化して上記ゲイン情報を含む符号化情報を出力する符号化手段とを備える符号化装置において、上記スペクトル変換手段は、上記各ブロックの信号と直前の上記ブロックの信号とを用いて上記各ブロックに関するスペクトル変換を行い、上記振幅変化部検出手段は、上記振幅変化部が先頭付近よりも後に存在する上記ブロックである途中変化ブロックの上記振幅変化部を上記途中変化ブロック内での信号の振幅変化により検出する一方、上記振幅変化部が先頭付近に存在する上記ブロックである先頭変化ブロックの上記振幅変化部を上記先頭変化ブロックにおける信号の振幅と直前の上記ブロックにおける信号の振幅の最大値との比較により検出し、上記ゲイン情報決定手段は、上記ゲイン情報を上記各ブロックに関するスペクトル変換に用いる上記各ブロックと直前の上記ブロックとの組ごとに上記各ブロックの先頭部分における信号のゲインと直前の上記ブロックにおける信号のゲインとが等しくなるように決定するとともに、上記途中変化ブロックに関する上記ゲイン情報を上記途中変化ブロック内での信号の振幅変化に基づいて決定する一方、上記先頭変化ブロックに関する上記ゲイン情報を上記比較に基づいて復号化の際のゲイン補正用のみとして決定し、上記ゲイン制御手段は、上記途中変化ブロックに関する上記ゲイン制御を上記途中変化ブロックに関する上記ゲイン情報を用いて行う一方、上記先頭変化ブロックに関する上記ゲイン制御を、上記ゲイン情報を使用することなくゲインを1として行うことを特徴としている。
【0019】
上記の発明によれば、振幅変化部検出手段は、アタック部やリリース部などの振幅変化部がブロックの先頭付近よりも後に存在する場合には、これらをブロック内での信号の振幅変化により検出し、振幅変化部がブロックの先頭付近に存在する場合には、これらを該ブロックにおける信号の振幅と直前のブロックにおける信号の振幅の最大値との比較により検出する。後者の検出は、オーディオ信号ではアタック部が、通常、多数ブロックにわたる無音の準定常状態から多数ブロックにわたる強振幅状態に移行する際に現れ、またリリース部が、通常、多数ブロックにわたる強振幅状態から多数ブロックにわたる無音の準定常状態に移行する際に現れることを利用したものである。これにより、振幅変化部がブロックのどこに存在しても、振幅変化部を検出することができる。
【0020】
そして、スペクトル変換手段は各ブロックの信号とその直前のブロックの信号とを用いて各ブロックに関するスペクトル変換を行うものであり、ゲイン情報決定手段は、ゲイン情報を各ブロックに関するスペクトル変換に用いる各ブロックと直前のブロックとの組ごとに、各ブロックの先頭部分における信号のゲインと直前のブロックにおける信号のゲインとが等しくなるように決定する。
【0021】
ここで、振幅変化部がブロックの先頭付近よりも後に存在する場合には、ゲイン情報決定手段がブロック内での信号の振幅変化に基づいて該ブロックに関するゲイン情報を決定し、ゲイン制御手段がそのゲイン情報を用いて該ブロックに関するゲイン制御を行う。また、振幅変化部がブロックの先頭付近に存在する場合には、ゲイン情報決定手段が該ブロックにおける信号の振幅と直前のブロックにおける信号の振幅の最大値との比較に基づいて該ブロックに関するゲイン情報を決定するが、このゲイン情報は復号化の際のゲイン補正用のみのものである。この場合にはゲイン制御手段は、上記ゲイン情報を使用することなくゲインを1として該ブロックに関するゲイン制御を行う。
【0022】
これにより、振幅変化部がブロックの先頭付近よりも後に存在する場合でも、振幅変化部がブロックの先頭付近に存在する場合でも、各ブロックに関して施されるゲイン制御は各ブロックにつき1回以下であって振幅変化部に容易に適切なゲインが設定されるとともに、各ブロックとその直前のブロックとのゲイン関係が容易に適切に設定される。従って、上記ゲイン情報を用いる復号化の際に量子化雑音が抑制された良好な復号化信号を得ることができる。
【0023】
以上により、デジタルオーディオ信号をブロック化してスペクトル変換を行う構成でありながら、ブロックの先頭にアタック部が存在する場合にも容易にプリエコーを防止することができ、またブロックの先頭にリリース部が存在する場合にも容易にポストエコーを防止することができる。
【0024】
さらに本発明の符号化装置は、上記課題を解決するために、上記振幅変化部検出手段は、上記各ブロックを時間軸上で先頭付近を分離することのできる複数のサブブロックに分割し、上記各サブブロックにおける信号の最大の振幅が時間軸上で第1の所定値以上の変化量である第1変化量で変化すれば変化時点の上記サブブロックを上記途中変化ブロックの上記振幅変化部とする一方、上記各サブブロックにおける上記振幅が上記第1変化量で変化せずに先頭の上記サブブロックにおける上記振幅が直前の上記ブロックにおける信号の最大の振幅に対して第2の所定値以上の変化量である第2変化量だけ異なれば先頭の上記サブブロックを上記先頭変化ブロックの上記振幅変化部とすることを特徴としている。
【0025】
上記の発明によれば、振幅変化部検出手段が各ブロックを時間軸上で先頭付近を分離することのできる複数のサブブロックに分割する。そして、サブブロックにおける信号の最大の振幅が時間軸上で第1変化量という第1の所定値以上の量で変化すれば、変化時点のサブブロックをブロックの先頭付近よりも後に存在する振幅変化部とし、各サブブロックにおける信号の最大の振幅が第1変化量で変化せずに先頭のサブブロックにおける信号の最大の振幅が直前のブロックにおける信号の最大の振幅に対して第2変化量という第2の所定値以上の量だけ異なれば先頭のサブブロックを振幅変化部とする。このような振幅変化部の検出は、前述したオーディオ信号のアタック部やリリース部の現れ方を利用した正確かつ容易な検出である。
【0026】
従って、ブロックの先頭付近よりも後に存在する振幅変化部と、ブロックの先頭付近に存在する振幅変化部との両方を、正確かつ容易に検出することができる。
【0027】
さらに本発明の符号化装置は、上記課題を解決するために、上記ゲイン情報決定手段は、上記途中変化ブロックに関する上記ゲイン情報を上記第1変化量に基づいたゲインを与えるように決定する一方、上記先頭変化ブロックに関する上記ゲイン情報を上記第2変化量に基づいたゲインを与えるように決定することを特徴としている。
【0028】
上記の発明によれば、振幅変化部が先頭付近よりも後に存在するブロックに関するゲイン情報を、振幅変化部の検出の際に得られた第1変化量に基づいたゲインを与えるように決定する。また、振幅変化部が先頭付近に存在するブロックに関するゲイン情報を、振幅変化部の検出の際に得られた第2変化量に基づいたゲインを与えるように決定する。従って、各ブロックに関するゲイン情報を容易に適切に決定することができる。
【0029】
さらに本発明の符号化装置は、上記課題を解決するために、上記振幅変化部検出手段は、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅よりも大きい場合に、上記第1の所定値および上記第2の所定値を振幅増加を伴う上記振幅変化部を検出するための値に設定し、上記ゲイン情報決定手段は、上記振幅変化部検出手段によって振幅増加を伴う上記振幅変化部が検出された上記先頭変化ブロックに関する上記ゲイン情報を、上記ゲイン補正時に逆数で使用されるゲインとして、上記先頭変化ブロックの先頭の上記サブブロックに時間軸上で上記第2変化量に応じた1より大きい値から1まで変化するゲインを与え、上記先頭変化ブロックの先頭より後の上記サブブロックに1のゲインを与えるように決定することを特徴としている。
【0030】
上記の発明によれば、各ブロックにおける信号の最大の振幅が直前のブロックにおける信号の最大の振幅よりも大きい場合に、振幅変化部検出手段は第1の所定値および第2の所定値を振幅増加を伴う振幅変化部を検出するための値に設定する。すなわち、振幅変化部検出手段は振幅変化部としてアタック部を検出する。そして、振幅変化部検出手段によって先頭のサブブロックにアタック部が検出された場合には、ゲイン情報決定手段は、このブロックに関するゲイン情報を、ゲイン補正時に逆数で使用されるゲインとして、直前のブロックには第2変化量に応じた1より大きい値のゲインを与え、アタック部の存在する先頭のサブブロックには時間軸上で第2変化量に応じた上記値から1まで変化する値のゲインを与え、先頭より後のサブブロックには1のゲインを与えるように決定する。
【0031】
これにより、先頭のサブブロックに振幅変化部としてアタック部が存在する場合に、プリエコーを防止するための適切なゲイン情報を、特に良好なゲイン関係で決定することができる。
【0032】
さらに本発明の符号化装置は、上記課題を解決するために、上記振幅変化部検出手段は、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅以下である場合、および、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅よりも大きくて、上記第1の所定値および上記第2の所定値を振幅増加を伴う上記振幅変化部を検出するための値に設定して振幅増加を伴う上記振幅変化部が検出されなかった場合に、上記第1の所定値および上記第2の所定値を振幅減少を伴う上記振幅変化部を検出するための値に設定し、上記ゲイン情報決定手段は、上記振幅変化部検出手段によって振幅減少を伴う上記振幅変化部が検出された上記先頭変化ブロックに関する上記ゲイン情報を、上記ゲイン補正時に逆数で使用されるゲインとして、上記先頭変化ブロックの先頭の上記サブブロックに時間軸上で1から上記第2変化量に応じた1より大きい値まで変化するゲインを与え、上記先頭変化ブロックの先頭より後の上記サブブロックに上記第2変化量に応じた上記値のゲインを与えるように決定することを特徴としている。
【0033】
上記の発明によれば、各ブロックの信号における最大の振幅が直前のブロックにおける信号の最大の振幅以下である場合、および、各ブロックにおける信号の最大の振幅が直前のブロックにおける信号の最大の振幅よりも大きくて、第1の所定値および第2の所定値を振幅増加を伴う振幅変化部、すなわちアタック部を検出するための値に設定したときにアタック部が検出されなかった場合に、振幅変化部検出手段は第1の所定値および第2の所定値を振幅減少を伴う振幅変化部を検出するための値に設定する。すなわち、振幅変化部検出手段は振幅変化部としてリリース部を検出する。
【0034】
そして、振幅変化部検出手段によって先頭のサブブロックにリリース部が検出された場合には、ゲイン情報決定手段は、このブロックに関するゲイン情報を、ゲイン補正時に逆数で使用されるゲインとして、直前のブロックには1のゲインを与え、リリース部の存在する先頭のサブブロックには時間軸上で1から第2変化量に応じた1より大きい値まで変化する値のゲインを与え、先頭より後のサブブロックには第2変化量に応じた上記値のゲインを与えるように決定する。
【0035】
これにより、先頭のサブブロックに振幅変化部としてリリース部が存在する場合に、ポストエコーを防止するための適切なゲイン情報を、特に良好なゲイン関係で決定することができる。
【0036】
【発明の実施の形態】
本発明の符号化装置を具現する一実施の形態について、図1ないし図5に基づいて説明すれば、以下の通りである。
【0037】
図4に、本実施の形態に係る符号化装置1の構成を示す。符号化装置1は、周波数帯域分割部2、ウィンドウ部3、アタック/リリース部検出部4、ゲイン制御部5、時間周波数変換部6、量子化部7、およびパッキング部8を備えている。
【0038】
周波数帯域分割部(ブロック化手段)2は、各サンプルが多値で表される時間軸上のデジタルオーディオ信号として与えられる入力信号を、Nサンプルからなる所定の単位時間ごとにブロック化し、QMFフィルタを用いて複数の周波数帯域に分割する。上記単位時間は例えばMD用の圧縮を行う場合には23.2msecといった時間である。ウィンドウ部3は周波数帯域ごとの各ブロックの入力信号にウィンドウ係数をかける。アタック/リリース部検出部(振幅変化部検出手段、ゲイン情報決定手段)4は、ウィンドウ部3によってウィンドウ係数がかけられた各ブロック内の入力信号に存在する振幅変化部としてのアタック部やリリース部を検出し、検出結果に基づいて各ブロックに関する復号化までに使用されるゲイン情報を決定する。ゲイン制御部(ゲイン制御手段)5は、アタック/リリース部検出部4のアタック部およびリリース部の検出結果と、アタック/リリース部検出部4により決定されたゲイン情報とに基づいて各ブロックの信号にゲイン制御を行う。
【0039】
時間周波数変換部(スペクトル変換手段)6は、MDCTを用いてスペクトル変換を行い、ゲイン制御部5によってゲイン制御が施された時間軸上の信号を周波数軸上の信号に変換する。量子化部7は、時間周波数変換部6によって得られた周波数軸上の信号を量子化する。パッキング部8は、アタック/リリース部検出部4によって決定されたゲイン情報と、量子化部7によって得られた量子化情報および量子化信号とのパッキングを行って符号化情報として出力する。量子化部7およびパッキング部8は、時間周波数変換部6によって得られた周波数軸上の信号を符号化してゲイン情報を含む符号化情報を出力する符号化手段を構成している。パッキング部8によって得られた符号化情報は、同図に示すように、MDなどの磁気記録メディアや、フラッシュメモリなどの半導体メディアといった記録メディア9に記録される。
【0040】
次に、上記符号化装置1によって得られた符号化情報から信号を復号化する際に用いる復号化装置11の構成を図5に示す。復号化装置11は、アンパッキング部12、逆量子化部13、周波数時間変換部14、ゲイン補正部15、隣接ブロック合成部16、および周波数帯域合成部17を備えている。
【0041】
アンパッキング部12は、同図に示すように記録メディア9に記録されている符号化情報からゲイン情報、量子化情報、および量子化信号を取り出す。逆量子化部13は、アンパッキング部12によって取り出された量子化信号を量子化情報を用いて逆量子化する。周波数時間変換部14は、逆MDCTを用いて逆スペクトル変換を行うことにより、周波数軸上の信号を時間軸上の信号に変換する。ゲイン補正部15は、アンパッキング部12によって取り出されたゲイン情報に基づき、周波数時間変換部14によって得られた信号のゲイン補正を行う。隣接ブロック合成部16は、ゲイン補正部15によって得られた信号に対し、同じブロックのものを重ね合わせた上で隣り合うブロックを合成する。周波数帯域合成部17は、隣接ブロック合成部16によって得られた信号についてIQMFフィルタを用いて各周波数帯域の合成を行って復号化されたオーディオ信号を出力する。
【0042】
次に、上記構成の符号化装置1による、プリエコーやポストエコーを防止する符号化処理について説明する。
【0043】
(1)プリエコーのみを防止する場合
まず、プリエコーのみを防止する場合の符号化処理について説明する。アタック/リリース部検出部4は、各ブロック内の信号にアタック部があるか否かを、現在注目しているブロックである今回処理ブロックと該今回処理ブロックの時間軸上で直前のブロックである前回処理ブロックとの両方を用いて判定する。オーディオ信号ではアタック部が、通常、多数ブロックにわたる無音の準定常状態から多数ブロックにわたる強振幅状態に移行する際に現れるので、今回処理ブロックにアタック部が存在するとすれば、前回処理ブロックは無音の準定常状態であり、今回処理ブロックには強振幅状態が存在する。従って、今回処理ブロックにおける信号の最大値と、前回処理ブロックにおける信号の最大値とを比較し、今回処理ブロックの方が前回処理ブロックよりも大きければ、今回処理ブロックにアタック部が存在する可能性があると判定する。今回処理ブロックにおける信号の最大値が、前回処理ブロックにおける信号の最大値以下であれば、今回処理ブロックにアタック部は存在しないと判定する。上記最大値は各ブロックの信号の最大の振幅である。
【0044】
アタック/リリース部検出部4は、今回処理ブロックにおける信号の最大値が、前回処理ブロックにおける信号の最大値よりも大きければ、すなわち今回処理ブロックにアタック部が存在する可能性があると判定した場合は、図1(a)に示すように、今回処理ブロックを時間軸上で先頭付近を分離することのできる程度の間隔で複数のサブブロックe0〜e7に分割する。次いで、各サブブロックにおける信号A1の最大値を算出する。該最大値は各サブブロックにおける信号A1の最大の振幅である。アタック部は振幅増加を伴う振幅変化部であるので、次に、時間軸上で、先頭のサブブロックe0から順に最大値を次のサブブロックの最大値と比較していき、急激に増加するサブブロックがあればそのサブブロックをアタック部とする。急激に増加しているか否かは、第1アタック部検出用所定値(第1の所定値)を設定し、最大値が第1アタック部検出用所定値以上の変化量である第1アタック部変化量(第1変化量)で増加方向に変化しているか否かで判断する。第1アタック部検出用所定値は、プリエコーが発生する振幅変化であると判断して予め定めた基準値である。ここではサブブロックの最大値が直前のサブブロックの最大値に対して何倍になっているかという値を、例えば40dB差といったように設定した第1アタック部検出用所定値と比較することとする。
【0045】
図1(a)は最大値がサブブロックe5においてサブブロックe4から第1アタック部変化量で変化していることを示しており、サブブロックe5がアタック部であり、今回処理ブロックはアタック部が先頭付近よりも後に存在する途中変化ブロックである。図1(a)においてサブブロックe5の最大値がサブブロックe4の最大値のR1倍(R1>1)、すなわち第1アタック部変化量がR1であった場合、アタック/リリース部検出部4は第1アタック部変化量に基づくゲインとして、アタック部直前のサブブロックe4に過渡期ブロックとして時間軸上でR1から1まで滑らかに変化するゲインG1を与え、それ以前の無音の準定常状態であるサブブロックe0〜e3にR1のゲインG1を与え、アタック部であるサブブロックe5およびアタック部の後の強振幅状態であるサブブロックe6・e7に1のゲインG1を与えるゲイン制御関数を作成する。ここで、サブブロックe4に時間軸上でR1から1まで滑らかに変化するゲインG1を与えているが、予めテーブルを設けておき、その中からR1を越えない最大の値を選んでその値から1まで滑らかに変化するゲインを与えてもよい。
【0046】
ここで、時間周波数変換部6はスペクトル変換としてMDCTを用い、前回処理ブロックの信号と今回処理ブロックの信号との2N個のサンプルを用いてスペクトル変換を行ってN個のサンプルの周波数軸上の信号を得るようにしている。従って、2つのブロックのレベル差を無くすために、上記ゲイン制御関数は前回処理ブロックにもゲインG1を与え、前回処理ブロックのゲインG1が今回処理ブロックの先頭のサブブロックe0のゲインG1と等しくなるようにする。従って、前回処理ブロックのゲインG1はR1となる。また、このゲイン制御関数が今回処理ブロックに関するゲイン情報となる。
【0047】
図1(a)の場合、ゲイン制御部5によって上記ゲイン制御関数のゲインG1で今回処理ブロックに関するゲイン制御を行い、時間周波数変換部6、量子化部7、パッキング部8によって順に、スペクトル変換、量子化、パッキングを行う。このようにして得られた符号化情報から復号化装置11によって信号を復号化する際には、アンパッキング部12、逆量子化部13、周波数時間変換部14で順に、アンパッキング、逆量子化、逆スペクトル変換を行って得られた信号に対してゲイン補正部15がアンパッキング部12で取り出されたゲイン情報を用いてゲイン補正を行う。
【0048】
この場合、ゲイン補正部15は、符号化の際に用いたゲイン制御関数のゲインG1の逆数を与えるゲイン補正関数を用いてゲイン補正を行う。上記例では、前回処理ブロックが1/R1の補正ゲイン、今回処理ブロックのサブブロックe0〜e3が1/R1の補正ゲイン、サブブロックe4が1/R1から1まで滑らかに変化する補正ゲイン、サブブロックe5〜e7が1の補正ゲインとなるゲイン補正関数を用いる。隣接ブロック合成部16では、今回処理ブロックについて周波数時間変換部14によって得られてゲイン補正部15でゲイン補正された2つのブロックと、前回処理ブロックについて同様にして得られた2つのブロックとのうちの同じ信号のブロックの信号レベルを一致させて重ね合わせることにより、隣接する各ブロックを合成する。周波数帯域合成部17は、隣接ブロック合成部16によって得られた周波数帯域ごとのブロックを合成して復号化された信号を出力する。
【0049】
上記のようにゲイン補正を行うことにより、無音の準定常状態における量子化雑音が抑制されるため、復号化された出力信号に発生する図1(a)の量子化雑音B1は無音の準定常状態では非常に小さく、プリエコーを防止することができる。
【0050】
次に、上述のようにサブブロックe0〜e7の最大値を順に比較した結果、第1アタック部変化量で変化するサブブロックが存在しなかった場合の処理について説明する。第1アタック部変化量で変化するサブブロックが存在しない場合には、図2の信号A2のように先頭のサブブロックe0がアタック部である場合が含まれる。このとき、今回処理ブロックはアタック部が先頭付近に存在する先頭変化ブロックである。このような場合に同図のように前回処理ブロックに対しても今回処理ブロックに対してもゲインG2’を1として、すなわちゲイン制御を行わずに、スペクトル変換し、復号化の際にもゲイン補正を行わないようにすると、同図に示すように量子化雑音B2’は無音の準定常状態において元の信号よりもレベルが大きくなるため、マスク効果がなく、プリエコーが発生する。
【0051】
そこで、アタック/リリース部検出部4は、第2アタック部検出用所定値(第2の所定値)を設定し、前回処理ブロックの最大値と今回処理ブロックのサブブロックe0の最大値とを比較して、サブブロックe0の最大値が前回処理ブロックの最大値に対して、第2アタック部検出用所定値以上の変化量である第2アタック部変化量(第2変化量)だけ増加方向に異なればサブブロックe0をアタック部とする。第2アタック部検出用所定値は、プリエコーが発生する振幅変化であると判断して予め定めた基準値である。ここではサブブロックe0の最大値が前回処理ブロックの最大値に対して何倍になっているかという値を、例えば40dB差といったように設定した第2アタック部検出用所定値と比較することとする。
【0052】
図1(b)はサブブロックe0の最大値が前回処理ブロックの最大値と第2アタック部変化量だけ異なっていることを示しており、サブブロックe0がアタック部である。図1(b)においてサブブロックe0の最大値が前回処理ブロックの最大値のR2倍(R2>1)、すなわち第2アタック部変化量がR2であった場合、アタック/リリース部検出部4は第2アタック部変化量に基づいたゲインとして、今回処理ブロックのアタック部であるサブブロックe0に時間軸上でR2から1まで滑らかに変化するゲインG2を与え、アタック部より後の強振幅状態であるサブブロックe1〜e7に1のゲインG2を与え、無音の準定常状態である前回処理ブロックにR2のゲインG2を与えるゲイン情報を作成する。このゲイン情報が今回処理ブロックに関するゲイン情報となる。ここで、サブブロックe0に時間軸上でR2から1まで滑らかに変化するゲインG2を与えているが、予めテーブルを設けておき、その中からR2を越えない最大の値を選んでその値から1まで滑らかに変化するゲインを与えてもよい。
【0053】
上記ゲインG2のゲイン情報を作成した場合は、ゲイン制御部5は該ゲイン情報を使用したゲイン制御を行わない。ゲイン制御を行わないことは1のゲインでゲイン制御を行うことと等価である。ゲイン制御を行わないので、アタック部以前の無音の準定常状態をR2倍すること、アタック部であるサブフレームe0の入力信号のレベルをR2倍もしくはR2から算出される値分だけ大きくすることにより発生する可能性のあるオーバーフローを防止することができる
【0054】
図1(b)の場合、ゲイン制御部5によってゲイン制御が行われなかった信号に対して、時間周波数変換部6、量子化部7、パッキング部8によって順に、スペクトル変換、量子化、パッキングを行う。このようにして得られた符号化情報には、上記ゲイン情報と、ゲイン制御が行われずにスペクトル変換されて量子化されることにより得られた量子化信号および量子化情報とが含まれている。この符号化情報から復号化装置11によって信号を復号化する際には、アンパッキング部12、逆量子化部13、周波数時間変換部14で順に、アンパッキング、逆量子化、逆スペクトル変換を行って得られた信号に対してゲイン補正部15がアンパッキング部12で取り出されたゲイン情報を用いてゲイン補正を行う。
【0055】
この場合、ゲイン補正部15は、符号化の際に用いなかったゲイン情報のゲインG2の逆数を与えるゲイン補正関数を用いてゲイン補正を行う。上記例では、前回処理ブロックが1/R2の補正ゲイン、今回処理ブロックのサブブロックe0は1/R2から1まで滑らかに変化する補正ゲイン、サブブロックe1〜e7が1の補正ゲインとなるゲイン補正関数を用いる。隣接ブロック合成部16は前述と同様にして各ブロックを合成し、周波数帯域合成部17は前述と同様にして周波数帯域ごとのブロックを合成して復号化された信号を出力する。
【0056】
上記のようにゲイン補正を行うことにより、無音の準定常状態である前回処理ブロックにおける量子化雑音が抑制されるため、復号化された出力信号に発生する図1(b)の量子化雑音B2は無音の準定常状態では非常に小さく、プリエコーを防止することができる。
【0057】
以上が今回処理ブロックにアタック部が存在する場合の処理の説明である。なお、今回処理ブロックにおける信号の最大値が前回処理ブロックにおける信号の最大値以下である場合、および、今回処理ブロックにおける信号の最大値が前回処理ブロックにおける信号の最大値より大きくて今回処理ブロックが途中変化ブロックでも先頭変化ブロックでもない場合は、アタック/リリース部検出部4はゲイン制御を行わない(1のゲインでゲイン制御を行うことと等価)ことを示すゲイン情報を作成し、ゲイン制御部5は今回処理ブロックに関するゲイン制御を行わない。従って復号化の際のゲイン補正も行わない。
【0058】
(2)ポストエコーのみを防止する場合
次に、ポストエコーのみを防止する場合の符号化処理について説明する。アタック/リリース部検出部4は、各ブロック内の信号にリリース部があるか否かを、現在注目しているブロックである今回処理ブロックと該今回処理ブロックの時間軸上で直前のブロックである前回処理ブロックとの両方を用いて判定する。オーディオ信号ではリリース部が、通常、多数ブロックにわたる強振幅状態から多数ブロックにわたる無音の準定常状態に移行する際に現れるので、今回処理ブロックにリリース部が存在するとすれば、前回処理ブロックは強振幅状態であり、今回処理ブロックには無音の準定常状態が存在してアタック部は存在しない。
【0059】
従って、アタック/リリース部検出部4は、今回処理ブロックにおける信号の最大値と、前回処理ブロックにおける信号の最大値とを比較し、今回処理ブロックにおける信号の最大値が前回処理ブロックにおける信号の最大値以下である場合、および、(1)で述べたように今回処理ブロックにおける信号の最大値が前回処理ブロックにおける信号の最大値よりも大きくて、第1アタック部検出用所定値および第2アタック部検出用所定値を用いてアタック部を検出した際にアタック部が検出されなかった場合に、今回処理ブロックにリリース部が存在する可能性があると判定する。上記最大値は各ブロックの最大の振幅である。
【0060】
アタック/リリース部検出部4は、今回処理ブロックにリリース部が存在する可能性があると判定した場合は、図3(a)に示すように、今回処理ブロックを(1)と同様のサブブロックe0〜e7に分割する。今回処理ブロックにおける信号の最大値が前回処理ブロックの信号における信号の最大値よりも大きくて、第1アタック部検出用所定値および第2アタック部検出用所定値を用いてまずアタック部を検出した際にアタック部を検出することができなかった場合は、アタック部の検出に用いたサブブロックe0〜e7をそのまま用いる。
【0061】
次いで、各サブブロックにおける信号A3の最大値を算出する。該最大値は各サブブロックにおける信号A3の最大の振幅である。リリース部は振幅減少を伴う振幅変化部であるので、次に、時間軸上で、先頭のサブブロックe0から順に最大値を次のサブブロックの最大値と比較していき、急激に減少するサブブロックがあればそのサブブロックをリリース部とする。急激に減少しているか否かは、第1リリース部検出用所定値(第1の所定値)を設定し、第1リリース部検出用所定値以上の変化量である第1リリース部変化量(第1変化量)で最大値が減少方向に変化しているか否かで判断する。第1リリース部検出用所定値は、ポストエコーが発生する振幅変化であると判断して予め定めた基準値である。ここではサブブロックの最大値が直前のサブブロックの最大値に対して何倍になっているかという値の逆数を、例えば40dB差といったように設定した第1リリース部検出用所定値と比較することとする。
【0062】
図3(a)は最大値がサブブロックe5においてサブブロックe4から第1リリース部変化量で変化していることを示しており、サブブロックe5がリリース部であり、今回処理ブロックはリリース部が先頭付近よりも後に存在する途中変化ブロックである。図3(a)においてサブブロックe5の最大値がサブブロックe4の最大値の1/R3倍(R3>1)、すなわち第1リリース部変化量がR3であった場合、アタック/リリース部検出部4は第1リリース部変化量に基づくゲインとして、リリース部より前の強振幅状態であるサブブロックe0〜e4に1のゲインG3を与え、リリース部より後の無音の準定常状態であるサブブロックe6・e7にR3のゲインG3を与え、リリース部であるサブブロックe5に過渡期ブロックとして時間軸上で1からR3まで滑らかに変化するゲインG3を与えるゲイン制御関数を作成する。ここで、サブブロックe5に時間軸上で1からR3まで滑らかに変化するゲインG3を与えているが、予めテーブルを設けておき、その中からR3を越えない最大の値を選んで1からその値まで滑らかに変化するゲインを与えてもよい。
【0063】
ここで、時間周波数変換部6はスペクトル変換としてMDCTを用いているので、(1)で述べたのと同一の理由により、上記ゲイン制御関数は前回処理ブロックにもゲインG3を与え、前回処理ブロックのゲインG3が今回処理ブロックの先頭のサブブロックe0のゲインG3と等しくなるようにする。従って、前回処理ブロックのゲインG3は1となる。また、このゲイン制御関数が今回処理ブロックに関するゲイン情報となる。
【0064】
図3(a)の場合、ゲイン制御部5によって上記ゲイン制御関数のゲインG3で今回処理ブロックに関するゲイン制御を行い、時間周波数変換部6、量子化部7、パッキング部8によって順に、スペクトル変換、量子化、パッキングを行う。このようにして得られた符号化情報から復号化装置11によって信号を復号化する際には、アンパッキング部12、逆量子化部13、周波数時間変換部14で順に、アンパッキング、逆量子化、逆スペクトル変換を行って得られた信号に対してゲイン補正部15がアンパッキング部12で取り出されたゲイン情報を用いてゲイン補正を行う。
【0065】
この場合、ゲイン補正部15は、符号化の際に用いたゲイン制御関数のゲインG3の逆数を与えるゲイン補正関数を用いてゲイン補正を行う。上記例では、前回処理ブロックが1の補正ゲイン、今回処理ブロックのサブブロックe0〜e4が1の補正ゲイン、サブブロックe5が1から1/R3まで滑らかに変化する補正ゲイン、サブブロックe6・e7が1/R3の補正ゲインとなるゲイン補正関数を用いる。隣接ブロック合成部16では、今回処理ブロックについて周波数時間変換部14によって得られてゲイン補正部15でゲイン補正された2つのブロックと、前回処理ブロックについて同様にして得られた2つのブロックとのうちの同じ信号のブロックの信号レベルを一致させて重ね合わせることにより、隣接する各ブロックを合成する。周波数帯域合成部17は、隣接ブロック合成部16によって得られた周波数帯域ごとのブロックを合成して復号化された信号を出力する。
【0066】
上記のようにゲイン補正を行うことにより、無音の準定常状態における量子化雑音が抑制されるため、復号化された出力信号に発生する図3(a)の量子化雑音B3は非常に小さく、ポストエコーを防止することができる。
【0067】
次に、上述のようにサブブロックe0〜e7の最大値を順に比較した結果、第1リリース部変化量で変化するサブブロックが存在しなかった場合の処理について説明する。第1リリース部変化量で変化するサブブロックが存在しない場合には、図3(b)の信号A4のように先頭のサブブロックe0がリリース部である場合が含まれる。このとき、今回処理ブロックはリリース部が先頭付近に存在する先頭変化ブロックである。このような場合に同図のように前回処理ブロックに対しても今回処理ブロックに対してもゲインを1として、すなわちゲイン制御を行わずに、スペクトル変換し、復号化の際にもゲイン補正を行わないと、量子化雑音は無音の準定常状態において元の信号よりもレベルが大きくなるため、マスク効果がなく、ポストエコーが発生する。
【0068】
そこで、アタック/リリース部検出部4は、前回処理ブロックの最大値と今回処理ブロックのサブブロックe0の最大値とを比較して、サブブロックe0の最大値が前回処理ブロックの最大値に対して、第2リリース部検出用所定値(第2の所定値)を設定し、第2リリース部検出用所定値以上の変化量である第2リリース部変化量(第2変化量)だけ減少方向に異なればサブブロックe0をリリース部とする。第2リリース部検出用所定値は、ポストエコーが発生する振幅変化であると判断して予め定めた基準値である。ここではサブブロックe0の最大値が前回処理ブロックの最大値に対して何倍になっているかという値の逆数を、例えば40dB差といったように設定した第2リリース部検出用所定値と比較することとする。
【0069】
図3(b)はサブブロックe0の最大値が前回処理ブロックの最大値と第2リリース部変化量だけ異なっていることを示しており、サブブロックe0がリリース部である。図3(b)においてサブブロックe0の最大値が前回処理ブロックの最大値の1/R4倍(R4>1)、すなわち第2リリース部変化量がR4であった場合、アタック/リリース部検出部4は第2リリース部変化量に基づいたゲインとして、リリース部であるサブブロックe0に時間軸上で1からR4まで滑らかに変化するゲインG4を与え、今回処理ブロックのリリース部より後の無音の準定常状態であるサブブロックe1〜e7にR4のゲインG4を与え、強振幅状態である前回処理ブロックに1のゲインG4を与えるゲイン情報を作成する。このゲイン情報が今回処理ブロックに関するゲイン情報となる。ここで、サブブロックe0に時間軸上で1からR4まで滑らかに変化するゲインG4を与えているが、予めテーブルを設けておき、その中からR4を越えない最大の値を選んで1からその値まで滑らかに変化するゲインを与えてもよい。
【0070】
上記ゲインG4のゲイン情報を作成した場合は、(1)で述べたのと同様の理由により、ゲイン制御部5は該ゲイン情報を使用したゲイン制御を行わない。ゲイン制御を行わないことは1のゲインでゲイン制御を行うことと等価である。
【0071】
図3(b)の場合、ゲイン制御部5によってゲイン制御が行われなかった信号に対して、時間周波数変換部6、量子化部7、パッキング部8によって順に、スペクトル変換、量子化、パッキングを行う。このようにして得られた符号化情報には、上記ゲイン情報と、ゲイン制御が行われずにスペクトル変換されて量子化されることにより得られた量子化信号および量子化情報とが含まれている。この符号化情報から復号化装置11によって信号を復号化する際には、アンパッキング部12、逆量子化部13、周波数時間変換部14で順に、アンパッキング、逆量子化、逆スペクトル変換を行って得られた信号に対してゲイン補正部15がアンパッキング部12で取り出されたゲイン情報を用いてゲイン補正を行う。
【0072】
この場合、ゲイン補正部15は、符号化の際に用いなかったゲイン情報のゲインG4の逆数を与えるゲイン補正関数を用いてゲイン補正を行う。上記例では、前回処理ブロックが1の補正ゲイン、今回処理ブロックのサブブロックe0は1から1/R4まで滑らかに変化する補正ゲイン、サブブロックe1〜e7が1/R4の補正ゲインとなるゲイン補正関数を用いる。隣接ブロック合成部16は前述と同様にして各ブロックを合成し、周波数帯域合成部17は前述と同様にして周波数帯域ごとのブロックを合成して復号化された信号を出力する。
【0073】
上記のようにゲイン補正を行うことにより、無音の準定常状態であるサブブロックe0〜e7における量子化雑音が抑制されるため、復号化された出力信号に発生する図3(b)の量子化雑音B4は非常に小さく、ポストエコーを防止することができる。
【0074】
以上が今回処理ブロックにリリース部が存在する場合の処理の説明である。なお、今回処理ブロックにアタック部が検出される場合、および、今回処理ブロックにアタック部もリリース部も検出されない場合は、アタック/リリース部検出部4はゲイン制御を行わない(1のゲインでゲイン制御を行うことと等価)ことを示すゲイン情報を作成し、ゲイン制御部5は今回処理ブロックに関するゲイン制御を行わない。従って復号化の際のゲイン補正も行わない。
【0075】
(3)プリエコーおよびポストエコーの両方を防止する場合
次に、プリエコーおよびポストエコーの両方を防止する場合の符号化処理について説明する。アタック/リリース部検出部4は、今回処理ブロックの入力信号の最大値と、前回処理ブロックの入力信号の最大値とを比較し、今回処理ブロックの方が前回処理ブロックよりも大きい場合は、(1)で述べた方法でアタック部を検出する処理をまず行い、アタック部が検出されればプリエコーを防止する処理を行う。また、上記処理でアタック部が検出されなかった場合、および、今回処理ブロックの入力信号の最大値が前回処理ブロックの入力信号の最大値以下である場合は、(2)で述べた方法でリリース部を検出する処理を行い、リリース部が検出されればポストエコーを防止する処理を行う。
【0076】
以上に述べたように、本実施の形態に係る符号化装置1によれば、アタック/リリース部検出部4は、アタック部やリリース部などの振幅変化部が今回処理ブロックの先頭付近よりも後に存在する場合には、これらを今回処理ブロック内での信号の振幅変化により検出し、振幅変化部が今回処理ブロックの先頭付近に存在する場合には、これらを今回処理ブロックにおける信号の振幅である最大値と、前回処理ブロックにおける信号の振幅である最大値との比較により検出する。これにより、振幅変化部が今回処理ブロックのどこに存在しても、振幅変化部を検出することができる。
【0077】
そして、時間周波数変換部6を今回処理ブロックの信号と前回処理ブロックの信号とを用いて今回処理ブロックに関するスペクトル変換を行うものとし、アタック/リリース部検出部4によってゲイン情報を今回処理ブロックに関するスペクトル変換に用いる今回処理ブロックと前回処理ブロックとの組ごとに、今回処理ブロックの先頭部分の信号のゲインと前回処理ブロックの信号のゲインとが等しくなるように決定する。
【0078】
ここで、振幅変化部が今回処理ブロックの先頭付近よりも後に存在する場合には、アタック/リリース部検出部4がブロック内での信号の振幅変化である各サブブロックの最大値の変化に基づいて今回処理ブロックに関するゲイン情報を決定し、ゲイン制御部5がそのゲイン情報を用いて今回処理ブロックに関するゲイン制御を行う。また、振幅変化部が今回処理ブロックの先頭付近に存在する場合には、アタック/リリース部検出部4が今回処理ブロックにおける信号の最大値と前回処理ブロックにおける信号の最大値との比較に基づいて今回処理ブロックに関するゲイン情報を決定するが、このゲイン情報を復号化装置11による復号化の際のゲイン補正部15におけるゲイン補正用のみのものとする。この場合にゲイン制御部5はゲインを1として今回処理ブロックに関するゲイン制御を行う。
【0079】
これにより、振幅変化部がブロックの先頭付近よりも後に存在する場合でも、振幅変化部がブロックの先頭付近に存在する場合でも、各ブロックに関して施されるゲイン制御は各ブロックにつき1回以下であって振幅変化部に容易に適切なゲインが設定されるとともに、今回処理ブロックと前回処理ブロックとのゲイン関係が容易に適切に設定される。従って、上記ゲイン情報を用いる復号化の際に量子化雑音が抑制された良好な復号化信号を得ることができる。
【0080】
以上により、デジタルオーディオ信号をブロック化してスペクトル変換を行う構成でありながら、ブロックの先頭にアタック部が存在する場合にも容易にプリエコーを防止することができ、またブロックの先頭にリリース部が存在する場合にも容易にポストエコーを防止することができる。
【0081】
また、符号化装置1によれば、アタック/リリース部検出部4は、各サブブロックにおける信号の最大値が第1アタック部変化量、第1リリース部変化量で変化すれば、変化時点のサブブロックをブロックの先頭付近よりも後に存在する振幅変化部とし、先頭のサブブロックにおける信号の最大値が前回処理ブロックにおける信号の最大値に対して第2アタック部変化量、第2リリース部変化量だけ異なれば先頭のサブブロックを振幅変化部とする。このような振幅変化部の検出は、前述したオーディオ信号のアタック部やリリース部の現れ方を利用した正確かつ容易な検出である。
【0082】
従って、ブロックの先頭付近よりも後に存在する振幅変化部と、ブロックの先頭付近に存在する振幅変化部との両方を、正確かつ容易に検出することができる。
【0083】
さらに、符号化装置1によれば、アタック/リリース部検出部4は、振幅変化部が先頭付近よりも後に存在するブロックに関するゲイン情報を、振幅変化部の検出の際に得られた第1アタック部変化量、第1リリース部変化量に基づいたゲインを与えるように決定する。また、振幅変化部が先頭付近に存在するブロックに関するゲイン情報を、振幅変化部の検出の際に得られた第2アタック部変化量、第2リリース部変化量に基づいたゲインを与えるように決定する。従って、各ブロックに関するゲイン情報を容易に適切に決定することができる。
【0084】
さらに、符号化装置1によれば、アタック/リリース部検出部4は、第2アタック部検出用所定値、第2リリース部検出用所定値を用いて先頭のサブブロックにアタック部、リリース部を検出した場合に、このブロックに関するゲイン情報を、図1(b)、図3(b)のように第2アタック部検出用所定値、第2リリース部検出用所定値に基づいて変化するゲインを与えるように決定する。これにより、先頭のサブブロックに振幅変化部としてアタック部、リリース部が存在する場合に、プリエコー、ポストエコーを防止するための適切なゲイン情報を、特に良好なゲイン関係で決定することができる。
【0085】
なお、以上の説明では、多数ブロックにわたる無音の準定常状態と多数ブロックにわたる強振幅状態との切り換わりによる無音の準定常状態における量子化雑音を抑制する構成について述べたが、無音の準定常状態中に短い強振幅状態が現れる場合や、強振幅状態中に短い無音部分が現れる場合は、短い強振幅状態の前後や無音部分で聴感上の障害になるような量子化雑音はもともと発生しにくいので、その量子化雑音を必ずしも抑制する必要はない。しかし、本実施の形態で述べたプリエコーやポストエコーを防止する構成によって、そのような量子化雑音による聴感への影響をも抑制することもできる。大きな振幅増加と大きな振幅減少との両方が同一のブロック処理に関わる場合には、いずれか一方に起因する量子化雑音を抑制することにより聴感への影響を十分に抑制することができる。
【0086】
【発明の効果】
本発明の符号化装置は、以上のように、上記スペクトル変換手段は、上記各ブロックの信号と直前の上記ブロックの信号とを用いて上記各ブロックに関するスペクトル変換を行い、上記振幅変化部検出手段は、上記振幅変化部が先頭付近よりも後に存在する上記ブロックである途中変化ブロックの上記振幅変化部を上記途中変化ブロック内での信号の振幅変化により検出する一方、上記振幅変化部が先頭付近に存在する上記ブロックである先頭変化ブロックの上記振幅変化部を上記先頭変化ブロックにおける信号の振幅と直前の上記ブロックにおける信号の振幅の最大値との比較により検出し、上記ゲイン情報決定手段は、上記ゲイン情報を上記各ブロックに関するスペクトル変換に用いる上記各ブロックと直前の上記ブロックとの組ごとに上記各ブロックの先頭部分における信号のゲインと直前の上記ブロックにおける信号のゲインとが等しくなるように決定するとともに、上記途中変化ブロックに関する上記ゲイン情報を上記途中変化ブロック内での信号の振幅変化に基づいて決定する一方、上記先頭変化ブロックに関する上記ゲイン情報を上記比較に基づいて復号化の際のゲイン補正用のみとして決定し、上記ゲイン制御手段は、上記途中変化ブロックに関する上記ゲイン制御を上記途中変化ブロックに関する上記ゲイン情報を用いて行う一方、上記先頭変化ブロックに関する上記ゲイン制御を、上記ゲイン情報を使用することなくゲインを1として行う構成である。
【0087】
それゆえ、振幅変化部がブロックのどこに存在しても振幅変化部を検出することができる。さらに、振幅変化部がブロックの先頭付近よりも後に存在する場合でも、振幅変化部がブロックの先頭付近に存在する場合でも、各ブロックに関して施されるゲイン制御は各ブロックにつき1回以下であって振幅変化部に容易に適切なゲインが設定されるとともに、各ブロックとその直前のブロックとのゲイン関係が容易に適切に設定される。従って、上記ゲイン情報を用いる復号化の際に量子化雑音が抑制された良好な復号化信号を得ることができる。
【0088】
以上により、デジタルオーディオ信号をブロック化してスペクトル変換を行う構成でありながら、ブロックの先頭にアタック部が存在する場合にも容易にプリエコーを防止することができ、またブロックの先頭にリリース部が存在する場合にも容易にポストエコーを防止することができるという効果を奏する。
【0089】
さらに本発明の符号化装置は、以上のように、上記振幅変化部検出手段は、上記各ブロックを時間軸上で先頭付近を分離することのできる複数のサブブロックに分割し、上記各サブブロックにおける信号の最大の振幅が時間軸上で第1の所定値以上の変化量である第1変化量で変化すれば変化時点の上記サブブロックを上記途中変化ブロックの上記振幅変化部とする一方、上記各サブブロックにおける上記振幅が上記第1変化量で変化せずに先頭の上記サブブロックにおける上記振幅が直前の上記ブロックにおける信号の最大の振幅と第2の所定値以上の変化量である第2変化量だけ異なれば先頭の上記サブブロックを上記先頭変化ブロックの上記振幅変化部とする構成である。
【0090】
それゆえ、振幅変化部の検出は、オーディオ信号のアタック部やリリース部の現れ方を利用した正確かつ容易な検出となる。従って、ブロックの先頭付近よりも後に存在する振幅変化部と、ブロックの先頭付近に存在する振幅変化部との両方を、正確かつ容易に検出することができるという効果を奏する。
【0091】
さらに本発明の符号化装置は、以上のように、上記ゲイン情報決定手段は、上記途中変化ブロックに関する上記ゲイン情報を上記第1変化量に基づいたゲインを与えるように決定する一方、上記先頭変化ブロックに関する上記ゲイン情報を上記第2変化量に基づいたゲインを与えるように決定する構成である。
【0092】
それゆえ、ゲイン情報を、振幅変化部の検出の際に得られた第1変化量、第2変化量に基づいたゲインを与えるように決定する。従って、各ブロックに関するゲイン情報を容易に適切に決定することができるという効果を奏する。
【0093】
さらに本発明の符号化装置は、以上のように、上記振幅変化部検出手段は、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅よりも大きい場合に、上記第1の所定値および上記第2の所定値を振幅増加を伴う上記振幅変化部を検出するための値に設定し、上記ゲイン情報決定手段は、上記振幅変化部検出手段によって振幅増加を伴う上記振幅変化部が検出された上記先頭変化ブロックに関する上記ゲイン情報を、上記ゲイン補正時に逆数で使用されるゲインとして、上記先頭変化ブロックの先頭の上記サブブロックに時間軸上で上記第2変化量に応じた1より大きい値から1まで変化するゲインを与え、上記先頭変化ブロックの先頭より後の上記サブブロックに1のゲインを与えるように決定する構成である。
【0094】
それゆえ、先頭のサブブロックに振幅変化部としてアタック部が存在する場合に、プリエコーを防止するための適切なゲイン情報を、特に良好なゲイン関係で決定することができるという効果を奏する。
【0095】
さらに本発明の符号化装置は、以上のように、上記振幅変化部検出手段は、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅以下である場合、および、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅よりも大きくて、上記第1の所定値および上記第2の所定値を振幅増加を伴う上記振幅変化部を検出するための値に設定して振幅増加を伴う上記振幅変化部が検出されなかった場合に、上記第1の所定値および上記第2の所定値を振幅減少を伴う上記振幅変化部を検出するための値に設定し、上記ゲイン情報決定手段は、上記振幅変化部検出手段によって振幅減少を伴う上記振幅変化部が検出された上記先頭変化ブロックに関する上記ゲイン情報を、上記ゲイン補正時に逆数で使用されるゲインとして、上記先頭変化ブロックの先頭の上記サブブロックに時間軸上で1から上記第2変化量に応じた1より大きい値まで変化するゲインを与え、上記先頭変化ブロックの先頭より後の上記サブブロックに上記第2変化量に応じた上記値のゲインを与えるように決定する構成である。
【0096】
それゆえ、先頭のサブブロックに振幅変化部としてリリース部が存在する場合に、ポストエコーを防止するための適切なゲイン情報を、特に良好なゲイン関係で決定することができるという効果を奏する。
【図面の簡単な説明】
【図1】(a)および(b)は、本発明の実施の形態に係る符号化装置によるプリエコーの防止を説明する説明図である。
【図2】図1の説明図に対する比較例としてプリエコーが発生する場合を説明する説明図である。
【図3】(a)および(b)は、本発明の実施の形態に係る符号化装置によるポストエコーの防止を説明する説明図である。
【図4】本発明の実施の形態に係る符号化装置の構成を示すブロック図である。
【図5】図4の符号化装置により作成された符号化情報から復号化を行う復号化装置の構成を示すブロック図である。
【図6】プリエコーを説明する説明図である。
【図7】ポストエコーを説明する説明図である。
【符号の説明】
1 符号化装置
2 周波数帯域分割部(ブロック化手段)
4 アタック/リリース部検出部(振幅変化部検出手段、ゲイン情報決定手段)
5 ゲイン制御部(ゲイン制御手段)
6 時間周波数変換部(スペクトル変換手段)
A1〜A4 信号(デジタルオーディオ信号)
e0〜e7 サブブロック
G1〜G4 ゲイン

Claims (5)

  1. 各サンプルが多値で表される時間軸上のデジタルオーディオ信号を単位時間ごとにブロック化するブロック化手段と、上記ブロック化手段によって作成された各ブロックの信号中にプリエコーあるいはポストエコーのもととなる所定の振幅変化を伴う振幅変化部を検出する振幅変化部検出手段と、上記振幅変化部検出手段の上記振幅変化部の検出結果に基づいて上記各ブロックに関する復号化までに使用されるゲイン情報を決定するゲイン情報決定手段と、上記振幅変化部検出手段による上記振幅変化部の検出結果と上記ゲイン情報決定手段により決定された上記ゲイン情報とに基づいて上記各ブロックの信号にゲイン制御を行うゲイン制御手段と、上記ゲイン制御手段によりゲイン制御が行われた上記各ブロックの信号を周波数軸上の信号にスペクトル変換するスペクトル変換手段と、上記スペクトル変換手段によって得られた周波数軸上の信号を符号化して上記ゲイン情報を含む符号化情報を出力する符号化手段とを備える符号化装置において、
    上記スペクトル変換手段は、上記各ブロックの信号と直前の上記ブロックの信号とを用いて上記各ブロックに関するスペクトル変換を行い、
    上記振幅変化部検出手段は、上記振幅変化部が先頭付近よりも後に存在する上記ブロックである途中変化ブロックの上記振幅変化部を上記途中変化ブロック内での信号の振幅変化により検出する一方、上記振幅変化部が先頭付近に存在する上記ブロックである先頭変化ブロックの上記振幅変化部を上記先頭変化ブロックにおける信号の振幅と直前の上記ブロックにおける信号の振幅の最大値との比較により検出し、
    上記ゲイン情報決定手段は、上記ゲイン情報を上記各ブロックに関するスペクトル変換に用いる上記各ブロックと直前の上記ブロックとの組ごとに上記各ブロックの先頭部分における信号のゲインと直前の上記ブロックにおける信号のゲインとが等しくなるように決定するとともに、上記途中変化ブロックに関する上記ゲイン情報を上記途中変化ブロック内での信号の振幅変化に基づいて決定する一方、上記先頭変化ブロックに関する上記ゲイン情報を上記比較に基づいて復号化の際のゲイン補正用のみとして決定し、
    上記ゲイン制御手段は、上記途中変化ブロックに関する上記ゲイン制御を上記途中変化ブロックに関する上記ゲイン情報を用いて行う一方、上記先頭変化ブロックに関する上記ゲイン制御を、上記ゲイン情報を使用することなくゲインを1として行うことを特徴とする符号化装置。
  2. 上記振幅変化部検出手段は、上記各ブロックを時間軸上で先頭付近を分離することのできる複数のサブブロックに分割し、上記各サブブロックにおける信号の最大の振幅が時間軸上で第1の所定値以上の変化量である第1変化量で変化すれば変化時点の上記サブブロックを上記途中変化ブロックの上記振幅変化部とする一方、上記各サブブロックにおける上記振幅が上記第1変化量で変化せずに先頭の上記サブブロックにおける上記振幅が直前の上記ブロックにおける信号の最大の振幅に対して第2の所定値以上の変化量である第2変化量だけ異なれば先頭の上記サブブロックを上記先頭変化ブロックの上記振幅変化部とすることを特徴とする請求項1に記載の符号化装置。
  3. 上記ゲイン情報決定手段は、上記途中変化ブロックに関する上記ゲイン情報を上記第1変化量に基づいたゲインを与えるように決定する一方、上記先頭変化ブロックに関する上記ゲイン情報を上記第2変化量に基づいたゲインを与えるように決定することを特徴とする請求項2に記載の符号化装置。
  4. 上記振幅変化部検出手段は、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅よりも大きい場合に、上記第1の所定値および上記第2の所定値を振幅増加を伴う上記振幅変化部を検出するための値に設定し、
    上記ゲイン情報決定手段は、上記振幅変化部検出手段によって振幅増加を伴う上記振幅変化部が検出された上記先頭変化ブロックに関する上記ゲイン情報を、上記ゲイン補正時に逆数で使用されるゲインとして、上記先頭変化ブロックの先頭の上記サブブロックに時間軸上で上記第2変化量に応じた1より大きい値から1まで変化するゲインを与え、上記先頭変化ブロックの先頭より後の上記サブブロックに1のゲインを与えるように決定することを特徴とする請求項3に記載の符号化装置。
  5. 上記振幅変化部検出手段は、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅以下である場合、および、上記各ブロックにおける信号の最大の振幅が直前の上記ブロックにおける信号の最大の振幅よりも大きくて、上記第1の所定値および上記第2の所定値を振幅増加を伴う上記振幅変化部を検出するための値に設定して振幅増加を伴う上記振幅変化部が検出されなかった場合に、上記第1の所定値および上記第2の所定値を振幅減少を伴う上記振幅変化部を検出するための値に設定し、
    上記ゲイン情報決定手段は、上記振幅変化部検出手段によって振幅減少を伴う上記振幅変化部が検出された上記先頭変化ブロックに関する上記ゲイン情報を、上記ゲイン補正時に逆数で使用されるゲインとして、上記先頭変化ブロックの先頭の上記サブブロックに時間軸上で1から上記第2変化量に応じた1より大きい値まで変化するゲインを与え、上記先頭変化ブロックの先頭より後の上記サブブロックに上記第2変化量に応じた上記値のゲインを与えるように決定することを特徴とする請求項3または4に記載の符号化装置。
JP2001188732A 2001-06-21 2001-06-21 符号化装置 Expired - Fee Related JP3753956B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001188732A JP3753956B2 (ja) 2001-06-21 2001-06-21 符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001188732A JP3753956B2 (ja) 2001-06-21 2001-06-21 符号化装置

Publications (2)

Publication Number Publication Date
JP2003005799A JP2003005799A (ja) 2003-01-08
JP3753956B2 true JP3753956B2 (ja) 2006-03-08

Family

ID=19027774

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001188732A Expired - Fee Related JP3753956B2 (ja) 2001-06-21 2001-06-21 符号化装置

Country Status (1)

Country Link
JP (1) JP3753956B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2748843T3 (es) * 2007-08-27 2020-03-18 Ericsson Telefon Ab L M Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable
JP5898534B2 (ja) 2012-03-12 2016-04-06 クラリオン株式会社 音響信号処理装置および音響信号処理方法

Also Published As

Publication number Publication date
JP2003005799A (ja) 2003-01-08

Similar Documents

Publication Publication Date Title
US7050972B2 (en) Enhancing the performance of coding systems that use high frequency reconstruction methods
KR100402189B1 (ko) 오디오신호압축방법
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP3186412B2 (ja) 情報符号化方法、情報復号化方法、及び情報伝送方法
JPH03132228A (ja) 直交変換信号符号化復号化方式
WO1995021489A1 (fr) Methode et appareil de codage de donnees, methode et appareil de decodage de donnees, support d'enregistrement de donnees et mode de transmission de donnees
JP5390690B2 (ja) 音声コーデックの品質向上装置およびその方法
JP2008519990A (ja) 信号符号化の方法
JP2003233395A (ja) オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
US7466245B2 (en) Digital signal processing apparatus, digital signal processing method, digital signal processing program, digital signal reproduction apparatus and digital signal reproduction method
EP1634276B1 (en) Apparatus and method for embedding a watermark using sub-band filtering
RU2481650C2 (ru) Ослабление опережающих эхо-сигналов в цифровом звуковом сигнале
JP3753956B2 (ja) 符号化装置
JP4101123B2 (ja) 符号化装置及び符号化方法
JP2003330497A (ja) オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体
JP4125520B2 (ja) 変換符号化されたデータの復号方法及び変換符号化されたデータの復号装置
JP3341440B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JP3263881B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法
JP2008058727A (ja) 音声符号化装置
JP4556866B2 (ja) 高能率符号化プログラム及び高能率符号化装置
JP4530567B2 (ja) デジタルオーディオ復号装置
US8165871B2 (en) Encoding method and apparatus for efficiently encoding sinusoidal signal whose magnitude is less than masking value according to psychoacoustic model and decoding method and apparatus for decoding encoded sinusoidal signal
JP2009239437A (ja) オーディオ信号伝送システム
JPH09160593A (ja) 信号符号化方法及び装置
JPH08265208A (ja) ノイズキャンセラ

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050401

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051214

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees