JP2005156740A - 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム - Google Patents

符号化装置、復号化装置、符号化方法、復号化方法及びプログラム Download PDF

Info

Publication number
JP2005156740A
JP2005156740A JP2003392723A JP2003392723A JP2005156740A JP 2005156740 A JP2005156740 A JP 2005156740A JP 2003392723 A JP2003392723 A JP 2003392723A JP 2003392723 A JP2003392723 A JP 2003392723A JP 2005156740 A JP2005156740 A JP 2005156740A
Authority
JP
Japan
Prior art keywords
envelope
input signal
signal
encoding
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003392723A
Other languages
English (en)
Inventor
Yasunori Ohora
恭則 大洞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003392723A priority Critical patent/JP2005156740A/ja
Publication of JP2005156740A publication Critical patent/JP2005156740A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 ダイナミックレンジの広い信号の場合でも効率のよい圧縮機能を提供することを課題とする。
【解決手段】 入力信号のエンベロープを生成するエンベロープ生成手段(2)と、エンベロープの各点における所要ビット数で前記入力信号を符号化する符号化手段(4)とを有する符号化装置が提供される。
【選択図】 図1

Description

本発明は、符号化及び復号化に関する。
従来、オーディオの符号化方式として、ADPCM等の波形符号化方式、MPEG−1,MPEG−2等のサブバンド符号化方式が知られており、例えば、特許文献1に記載されているこれらの符号化方式においては、ある一定時間区間の信号やスペクトルデータの最大値をカバーするスケールファクタにより情報圧縮を図っていた。
特開平11−66742号公報
しかしながら、ある一定時間区間の信号やスペクトルデータのピーク値がピーク値以外のデータよりも著しく大きい場合は十分に圧縮することができなかった。
本発明は前記課題を考慮して、ある一定時間区間の信号やスペクトルデータのピーク値がピーク値以外のデータよりも著しく大きい場合でも効率のよい圧縮機能を提供することを目的としている。
本発明の符号化装置は、入力信号のエンベロープを生成するエンベロープ生成手段と、前記エンベロープの各点における所要ビット数で前記入力信号を符号化する符号化手段とを有することを特徴とする。
また、本発明の復号化装置は、符号化された入力信号及び入力信号のエンベロープの情報を入力する入力手段と、前記エンベロープの各点における所要ビット数で前記入力信号を復号化する復号化手段とを有することを特徴とする。
また、本発明の符号化方法は、入力信号のエンベロープを生成するエンベロープ生成ステップと、前記エンベロープの各点における所要ビット数で前記入力信号を符号化する符号化ステップとを有することを特徴とする。
また、本発明の復号化方法は、符号化された入力信号及び入力信号のエンベロープの情報を入力する入力ステップと、前記エンベロープの各点における所要ビット数で前記入力信号を復号化する復号化ステップとを有することを特徴とする。
また、本発明のプログラムは、入力信号のエンベロープを生成するエンベロープ生成ステップと、前記エンベロープの各点における所要ビット数で前記入力信号を符号化する符号化ステップとをコンピュータに実行させるためのプログラムである。
また、本発明のプログラムは、符号化された入力信号及び入力信号のエンベロープの情報を入力する入力ステップと、前記エンベロープの各点における所要ビット数で前記入力信号を復号化する復号化ステップとをコンピュータに実行させるためのプログラムである。
ある一定時間区間の信号やスペクトルデータのピーク値がピーク値以外のデータよりも著しく大きい場合でも効率のよい圧縮機能を提供することができる。換言すると、ダイナミックレンジの広い信号やスペクトルデータの場合でも効率のよい圧縮機能を提供することができる。
(第1の実施形態)
以下、本発明の第1の実施形態を、図面を用いて詳細に説明する。
図1は本発明の第1の実施形態を適用するオーディオデータ符号化装置の構成例を示すブロック図である。オーディオデータは、所定区間毎に処理される。図1において、S1は符号化しようとする波形やスペクトルなどの入力信号、1は入力信号S1の振幅信号を生成する振幅信号生成部、S2は振幅信号生成部1で生成された振幅信号、2は振幅信号のエンベロープ(包絡線)を生成するエンベロープ生成部、S3はエンベロープ生成部2で生成されたエンベロープ、S4はエンベロープ生成部2で生成したエンベロープパラメータ、3は振幅信号生成部1の正負の情報を符号化する極性符号化部、4はエンベロープS3と振幅信号S2から振幅成分を符号化する振幅符号化部、5は振幅符号化部4の出力とエンベロープパラメータS4と極性符号化部3の出力を統合するマルチプレクサである。
図2は図1のエンベロープ生成部2の内部動作を説明するフローチャートである。図2において、101は振幅信号S2のリフター処理を行うリフター処理ステップ、102は目的とするエンベロープが得られたかどうかを判定するエンベロープ判定ステップ、103は前回のループのエンベロープと振幅信号S2との差分を取るエンベロープ差分ステップ、104はエンベロープ差分ステップ103で計算された差分をリフター処理するリフター処理ステップ、105は104でリフター処理したものでエンベロープを補正するエンベロープ補正ステップである。
図3は、振幅信号S2とエンベロープS3の関係を示したものである。
以下、図1、図2をもとに動作を説明する。入力信号S1は振幅信号生成部1において負の部分が正に反転される。それと同時に元の正負符号情報が計算され極性符号化部3に渡される。絶対値化された信号S2は、そのエンベロープを求めるためにエンベロープ生成部2に入力される。振幅符号化部4は振幅信号S2の符号化を行う。エンベロープS3を振幅信号S2より必ず大きくなるようにしておけば、振幅信号S2の必要符号化ビット数は、エンベロープを表現するビット数以下である。そのため振幅信号S2の各位置におけるビットを同位置におけるエンベロープの所要ビット数で量子化する。
ここでエンベロープ生成部2の内部動作の例を図2を用いて説明する。リフター処理101で振幅信号S2のFFT(高速フーリエ変換)を施し、高次成分を除去して低次成分だけを残しさらに逆FFTを施すリフター処理を行い、振幅信号S2を平滑し、初期エンベロープとする。
この操作だけでは振幅信号S2を包み込むエンベロープにならないので、エンベロープ差分ステップ103で振幅信号S2とリフター処理ステップ101で得られたエンベロープの差分を取り、差分の結果、負になる部分は0にし、そのデータをリフター処理ステップ104でさらに平滑化したものにある決まった係数を掛けたものを加算する。これを何回か繰り返し、エンベロープがもとの振幅信号S2より全範囲で大きくなったら、エンベロープ判定ステップ102は目的とするエンベロープが得られたとしてループから抜け出す。
一方、振幅信号生成部1において符号情報が計算されるが、ここではランレングス符号化を例として挙げる。従って、極性符号化部3は、初期の正負符号の極性と同じ極性の続く長さを符号化してマルチプレクサ5に渡す。マルチプレクサ5は振幅符号化部4の出力と、エンベロープパラメータS4と極性符号化部3の出力を統合して出力ビットストリームを得る。
図4は本発明の第1の実施形態を適用するオーディオデータ復号化装置の構成例を示すブロック図である。図4において、6はデマルチプレクサ、7はエンベロープ復元部、8は振幅信号生成部、9は極性復元部、10は極性反転部である。入力ビットストリームはデマルチプレクサ6においてエンベロープパラメータと振幅ビット成分と符号ビット成分に分離される。エンベロープパラメータはエンベロープ復元部7においてエンベロープに変換される。振幅信号生成部8では、エンベロープの各点における所要ビット数分だけを振幅ビット成分からとりだし振幅成分を復元する。符号ビット成分は極性復元部9においてランレングス復号され各点における極性情報を復元する。極性反転部10は振幅信号生成部8で出力された振幅信号の極性が負の部分を反転させてもとの信号を復元する。
図5は、本実施形態をソフトウエアロジックで構成する例である。図5で11は本実施形態をソフトウエアで実行するCPU、12は本実施形態のプログラムやデータを格納するメモリ、13はCPUを制御するOS、14はCDROMドライブ、15は本実施形態をソフトウエアで実現したプログラムが格納されているCDROMである。OS13の制御によりCDROM15から本実施形態のプログラムをCDROMドライブ14経由でメモリ12に読み込みCPU11で実行する。
また、振幅符号化部4ではさらにエントロピー符号化のような処理を施してもかまわない。入力信号S1がスペクトルなどのように極性反転することが無い場合、振幅信号生成部1や極性符号化部3が無くてもかまわない。極性符号化部3ではランレングスを例に説明したがこの符号化方式に限るものではない。また、本実施形態をサブバンド符号化における各サブバンドごとに実行しても良い。
以上のように、本実施形態は、一定区間の信号やスペクトルデータに対して絶対値を求め、その各ピークを滑らかに包含するエンベロープを生成する。このエンベロープはなるべく少ない情報量で実現する。符号化はこのエンベロープと振幅信号と正負の符号ビットで行う。符号化はこのエンベロープと振幅信号と正負の符号ビットで行う。すなわち、振幅信号の各位置におけるビットを同位置におけるエンベロープの所要ビット数で量子化する。エンベロープ生成部2は、入力信号をフーリエ変換し、前記フーリエ変換の高次成分を除去し低次成分のみを逆フーリエ変換し、前記逆フーリエ変換の信号を基にエンベロープを生成する。
これにより、従来よりも冗長な符号化を避けることができる。また、ダイナミックレンジの広い信号やスペクトルデータの場合でも効率のよい圧縮を提供できる。
(第2の実施形態)
以下、本発明の第2の実施形態を、図面を用いて詳細に説明する。第1の実施形態では、エンベロープ生成の際に、振幅信号S2に対してFFTを施して低次成分だけを残して逆FFTを行ったが、第2の実施形態では、振幅信号S2に最低振幅レベルを加算し対数をとり、この結果にFFTを施して低次成分だけを残して逆FFTを行うことにより、エンベロープを生成する。
図1に、本発明の第2の実施形態を適用するオーディオデータ符号化装置の構成例を示す。図1において、S1は符号化しようとする波形やスペクトルなどの入力信号、1は入力信号S1の振幅信号を生成する振幅信号生成部、S2は振幅信号生成部1で生成された振幅信号、2は振幅信号のエンベロープを生成するエンベロープ生成部、S3はエンベロープ生成部2で生成されたエンベロープ、S4はエンベロープ生成部2で生成したエンベロープパラメータ、3は振幅信号生成部1の正負の情報を符号化する極性符号化部、4はエンベロープS3と振幅信号S2から振幅成分を符号化する振幅符号化部、5は振幅符号化部4の出力とエンベロープパラメータS4と極性符号化部3の出力を統合するマルチプレクサである。
図2を参照して、図1のエンベロープ生成部2の内部動作を説明する。図2において、101は振幅信号S2のリフター処理を行うリフター処理ステップ、102は目的とするエンベロープが得られたかどうかを判定するエンベロープ判定ステップ、103は前回のループのエンベロープと振幅信号S2との差分を取るエンベロープ差分ステップ、104はエンベロープ差分部103で計算された差分をリフター処理するリフター処理ステップ、105は104でリフター処理したものでエンベロープを補正するエンベロープ補正ステップである。
図3に、振幅信号S2とエンベロープS3の関係を示す。
以下、図1、図2をもとに動作を説明する。入力信号S1は振幅信号生成部1において負の部分が正に反転される。それと同時に元の符号情報が計算され極性符号化部3に渡される。絶対値化された信号S2は、そのエンベロープを求めるためにエンベロープ生成部2に入力される。振幅符号化部4は振幅信号S2の符号化を行う。エンベロープS3を振幅信号S2より必ず大きくなるようにしておけば、振幅信号S2の必要符号化ビット数は、エンベロープを表現するビット数以下である。そのため振幅信号S2の各位置におけるビットを同位置におけるエンベロープの所要ビット数で量子化する。
ここでエンベロープ生成部2の内部動作の例を、図2を用いて説明する。まず、リフター処理ステップ101で振幅信号S2に最低振幅レベルを加算し対数をとる。この結果にFFTを施し、高次成分を除去して低次成分だけを残しさらに逆FFTを施すリフター処理を行い、振幅信号S2を平滑し、初期対数エンベロープとする。
この操作だけでは振幅信号S2を包み込む対数エンベロープにならないので、エンベロープ差分ステップ103で振幅信号S2を対数化したものとリフター処理ステップ101で得られた対数エンベロープの差分を取り、差分の結果、負になる部分は0にし、そのデータをリフター処理ステップ104でさらに平滑化したものにある決まった係数を掛けたものを加算する。これを何回か繰り返し、対数エンベロープがもとの振幅信号S2の対数化したものより全範囲で大きくなったら、エンベロープ判定ステップ102は目的とするエンベロープが得られたとしてループから抜け出す。
一方、振幅信号生成部1において符号情報が計算されるが、ここではランレングス符号化を例として挙げる。従って、極性符号化部3は、初期の符号の極性と同じ極性の続く長さを符号化してマルチプレクサ5に渡す。マルチプレクサ5は振幅符号化部4の出力と、エンベロープパラメータS4と極性符号化部3の出力を統合して出力ビットストリームを得る。
図4に、本発明の第2の実施形態を適用するオーディオデータ復号化装置の構成例を示す。図4において、6はデマルチプレクサ、7はエンベロープ復元部、8は振幅信号生成部、9は極性復元部、10は極性反転部である。入力ビットストリームはデマルチプレクサ6においてエンベロープパラメータと振幅ビット成分と符号ビット成分に分離される。エンベロープパラメータはエンベロープ復元部7においてエンベロープに変換される。振幅信号生成部8では、エンベロープの各点における所要ビット数分だけを振幅ビット成分からとりだし振幅成分を復元する。符号ビット成分は極性復元部9においてランレングス復号され各点における極性情報を復元する。極性反転部10は振幅信号生成部8で出力された振幅信号の極性が負の部分を反転させてもとの信号を復元する。
図5に、本実施形態をソフトウエアロジックで構成する例を示す。図5で11は本実施形態をソフトウエアで実行するCPU、12は本実施形態のプログラムやデータを格納するメモリ、13はCPUを制御するOS、14はCDROMドライブ、15は本実施形態をソフトウエアで実現したプログラムが格納されているCDROMである。OS13の制御によりCDROM15から本実施形態のプログラムをCDROMドライブ14経由でメモリ12に読み込みCPU11で実行する。
また、振幅符号化部4ではさらにエントロピー符号化のような処理を施してもかまわない。入力信号S1がスペクトルなどのように極性反転することが無い場合、振幅信号生成部1や極性符号化部3が無くてもかまわない。極性符号化部3ではランレングスを例に説明したがこの符号化方式に限るものではない。
以上のように、本実施形態は、一定区間の信号やスペクトルデータに対して絶対値を求め、その各ピークを滑らかに包含するエンベロープを生成する。このエンベロープはなるべく少ない情報量で実現する。符号化はこのエンベロープと振幅信号と正負の符号ビットで行う。符号化はこのエンベロープと振幅信号と正負の符号ビットで行う。すなわち、振幅信号の各位置におけるビットを同位置におけるエンベロープの所要ビット数で量子化する。エンベロープ生成部2は、入力信号に所定レベルを加算して対数をとり、その対数化した入力信号をフーリエ変換し、前記フーリエ変換の高次成分を除去し低次成分のみを逆フーリエ変換し、前記逆フーリエ変換の信号を基にエンベロープを生成する。
これにより、従来よりも冗長な符号化を避けることができる。また、ダイナミックレンジの広い信号やスペクトルデータの場合でも効率のよい圧縮を提供できる。
(第3の実施形態)
以下、本発明の第3の実施形態を、図面を用いて詳細に説明する。
図6は本発明の第3の実施形態を適用するオーディオデータ符号化装置の構成を示すブロック図である。図6において、S1は符号化しようとする波形やスペクトルなどのステレオや多チャネルの入力信号、1は入力信号S1の振幅信号を生成する振幅信号生成部、S2は振幅信号生成部1で生成された振幅信号、2Aは各チャネル間で振幅の類似度を計算するチャネル間類似度計算部、2Bは単一または合成振幅信号のエンベロープを生成するエンベロープ生成部、S3はエンベロープ生成部2Bで生成されたエンベロープ、S4はエンベロープ生成部2Bで生成したエンベロープパラメータ、3は振幅信号生成部1の正負の情報を符号化する極性符号化部、4はエンベロープS3と振幅信号S2から振幅成分を符号化する振幅符号化部、5は振幅符号化部4の出力とエンベロープパラメータS4と極性符号化部3の出力を統合するマルチプレクサである。
図2を参照して、図6のエンベロープ生成部2Bの内部動作を説明する。図2において、101は振幅信号S2のリフター処理を行うリフター処理ステップ、102は目的とするエンベロープが得られたかどうかを判定するエンベロープ判定処理ステップ、103は前回のループのエンベロープと振幅信号S2との差分を取るエンベロープ差分ステップ、104はエンベロープ差分部103で計算された差分をリフター処理するリフター処理ステップ、105は104でリフター処理したものでエンベロープを補正するエンベロープ補正ステップである。
図3に、振幅信号S2とエンベロープS3の関係を示す。
以下、図6、図2をもとに動作を説明する。入力信号S1は振幅信号生成部1において負の部分が正に反転される。それと同時に元の符号情報が計算され極性符号化部3に渡される。絶対値化された信号S2は、チャネル間類似度計算部2Aで各チャネル間の振幅の類似度が計算される。類似度が高いと判断された場合、それらのチャネルの最大値を取るよう合成し、それらのチャネルの共有のエンベロープを求めるためにエンベロープ生成部2Bに入力される。類似度が低いと判断された場合は各チャネル毎にエンベロープを生成する。振幅符号化部4は振幅信号S2の符号化を行う。エンベロープS3を各チャネルの振幅信号S2より必ず大きくなるようにしておけば、振幅信号S2の各チャネルの必要符号化ビット数は、エンベロープを表現するビット数以下である。そのため振幅信号S2の各位置におけるビットを同位置におけるエンベロープの所要ビット数で量子化する。
ここでエンベロープ生成部2Bの内部動作の例を、図2を用いて説明する。類似度が高いと判断された場合、振幅信号S2のチャネルの最大値をとるような合成振幅信号を作る。リフター処理ステップ101で合成振幅信号のFFTを施し、低次成分だけを残しさらに逆FFTを施すリフター処理を行い、合成振幅信号を平滑し、初期エンベロープとする。
この操作だけでは合成振幅信号を包み込むエンベロープにならないので、エンベロープ差分ステップ103で合成振幅信号とリフター処理ステップ101で得られたエンベロープの差分を取り、差分の結果、負になる部分は0にし、そのデータをリフター処理ステップ104でさらに平滑化したものにある決まった係数を掛けたものを加算する。これを何回か繰り返し、エンベロープがもとの合成振幅信号より全範囲で大きくなったら、エンベロープ判定ステップ102は目的とするエンベロープが得られたとしてループから抜け出す。
一方、振幅信号生成部1において符号情報が計算されるが、ここではランレングス符号化を例として挙げる。従って、極性符号化部3は、初期の符号の極性と同じ極性の続く長さを符号化してマルチプレクサ5に渡す。マルチプレクサ5は振幅符号化部4の出力と、エンベロープパラメータS4と極性符号化部3の出力を統合して出力ビットストリームを得る。
図4に、本発明の第3の実施形態を適用するオーディオデータ復号化装置の構成例を示す。図4において、6はデマルチプレクサ、7はエンベロープ復元部、8は振幅信号生成部、9は極性復元部、10は極性反転部である。入力ビットストリームはデマルチプレクサ6においてエンベロープパラメータと振幅ビット成分と符号ビット成分に分離される。エンベロープパラメータはエンベロープ復元部7においてエンベロープに変換される。エンベロープは、全チャネルに共有のエンベロープ又はチャネル毎のエンベロープである。振幅信号生成部8では、エンベロープの各点における所要ビット数分だけを振幅ビット成分からとりだし振幅成分を復元する。エンベロープが共有の場合は、一のエンベロープで全チャネルの振幅成分を復元する。エンベロープがチャネル毎に存在する場合は、チャネル毎のエンベロープで振幅成分を復元する。符号ビット成分は極性復元部9においてランレングス復号され各点における極性情報を復元する。極性反転部10は振幅信号生成部8で出力された振幅信号の極性が負の部分を反転させてもとの信号を復元する。
図5に、本実施形態をソフトウエアロジックで構成する例を示す。図5で11は本実施形態をソフトウエアで実行するCPU、12は本実施形態のプログラムやデータを格納するメモリ、13はCPUを制御するOS、14はCDROMドライブ、15は本実施形態をソフトウエアで実現したプログラムが格納されているCDROMである。OS13の制御によりCDROM15から本実施形態のプログラムをCDROMドライブ14経由でメモリ12に読み込みCPU11で実行する。
また、振幅符号化部4ではさらにエントロピー符号化のような処理を施してもかまわない。入力信号S1がスペクトルなどのように極性反転することが無い場合、振幅信号生成部1や極性符号化部3が無くてもかまわない。極性符号化部3ではランレングスを例に説明したがこの符号化方式に限るものではない。
以上のように、本実施形態は、一定区間の信号やスペクトルデータに対して絶対値を求め、その各ピークを滑らかに包含するエンベロープを生成する。このエンベロープはなるべく少ない情報量で実現する。符号化はこのエンベロープと振幅信号と正負の符号ビットで行う。すなわち、振幅信号の各位置におけるビットを同位置におけるエンベロープの所要ビット数で量子化する。エンベロープ生成部2Bは、全チャネルの入力信号が類似しているときには全チャネルの入力信号の最大値を取るように合成した信号を基に共有のエンベロープを生成し、類似していないときにはチャネル毎のエンベロープを生成する。
これにより、従来よりも冗長な符号化を避けることができる。また、ダイナミックレンジの広い信号やスペクトルデータの場合でも効率のよい圧縮を提供できる。
(第4の実施形態)
以下、本発明の第4の実施形態を、図面を用いて詳細に説明する。
図1に、本発明の第4の実施形態を適用するオーディオデータ符号化装置の構成例を示す。図1において、S1は符号化しようとする波形やスペクトルなどの入力信号、1は入力信号S1の振幅信号を生成する振幅信号生成部、S2は振幅信号生成部1で生成された振幅信号、2は振幅信号のエンベロープを生成するエンベロープ生成部、S3はエンベロープ生成部2で生成されたエンベロープ、S4はエンベロープ生成部2で生成したエンベロープパラメータ、3は振幅信号生成部1の正負の情報を符号化する極性符号化部、4はエンベロープS3と振幅信号S2から振幅成分を符号化する振幅符号化部、5は振幅符号化部4の出力とエンベロープパラメータS4と極性符号化部3の出力を統合するマルチプレクサである。
図7は図1のエンベロープ生成部2の内部動作を説明するフローチャートである。図7において、401はエンベロープ生成部2のサブルーチンの開始点、402は振幅成分のピークを抽出し、そのピークを包絡情報として使うかどうかを決定するピーク決定ステップ、403は範囲内のピークを境に左側(低域側)を再帰的に処理する左ピーク決定ステップ、404は範囲内の最大値を境に右側(高域側)を再帰的に処理する右ピーク決定ステップ、405は各ピーク点をとおる折れ線を包絡直線とする包絡直線決定ステップ、406はサブルーチンの戻り点である。
図8は振幅信号S2とエンベロープS3の関係を示したものである。
以下、図1、図7をもとに動作を説明する。入力信号S1は振幅信号生成部1において負の部分が正に反転される。それと同時に元の符号情報が計算され極性符号化部3に渡される。絶対値化された信号S2は、そのエンベロープを求めるためにエンベロープ生成部2に入力される。振幅符号化部4は振幅信号S2の符号化を行う。エンベロープS3を振幅信号S2より必ず大きくなるようにしておけば、振幅信号S2の必要符号化ビット数は、エンベロープを表現するビット数以下である。そのため振幅信号S2の各位置におけるビットを同位置におけるエンベロープの所要ビット数で量子化する。
ここでエンベロープ生成部2の内部動作の例を図7を用いて説明する。まず、開始点401が始めて呼ばれるときは、最も左側のピークと最も右側のピークを前もって計算しておき、再帰的に呼ばれたときの隣の区間のピーク値としておく。ピーク決定ステップ402のサブルーチン呼び出しで指定された信号区間内のピークを求める。このピークを包絡情報とすることで圧縮率が向上すれば、その点をピークとして採用し「Y」に進む。そうでなければ、包絡直線決定ステップ405を処理しサブルーチンより復帰する。
なお、包絡直線決定ステップ405は再帰呼び出しの場合は処理を行わない。「Y」に進んだときは、そのピークから左の部分について再帰的にエンベロープ生成部を呼び出す。ここでも包絡直線決定ステップ405は再帰呼び出しでは処理されない。同様にピークから右の部分についても再帰的にエンベロープ生成部を呼び出す。
最後に得られたピーク列からその各ピークを通過する折れ線を生成し、エンベロープ生成部2から抜け出す。
一方、振幅信号生成部1において符号情報が計算されるが、ここではランレングス符号化を例として挙げる。従って、極性符号化部3は、初期の符号の極性と同じ極性の続く長さを符号化してマルチプレクサ5に渡す。マルチプレクサ5は振幅符号化部4の出力と、エンベロープパラメータS4と極性符号化部3の出力を統合して出力ビットストリームを得る。
図4に、本発明の第4の実施形態を適用するオーディオデータ復号化装置の構成例を示す。図4において、6はデマルチプレクサ、7はエンベロープ復元部、8は振幅信号生成部、9は極性復元部、10は極性反転部である。入力ビットストリームはデマルチプレクサ6においてエンベロープパラメータと振幅ビット成分と符号ビット成分に分離される。エンベロープパラメータはエンベロープ復元部7においてエンベロープに変換される。振幅信号生成部8では、エンベロープの各点における所要ビット数分だけを振幅ビット成分からとりだし振幅成分を復元する。符号ビット成分は極性復元部9においてランレングス復号され各点における極性情報を復元する。極性反転部10は振幅信号生成部8で出力された振幅信号の極性が負の部分を反転させてもとの信号を復元する。
図5に、本実施形態をソフトウエアロジックで構成する例を示す。図5で11は本実施形態をソフトウエアで実行するCPU、12は本実施形態のプログラムやデータを格納するメモリ、13はCPUを制御するOS、14はCDROMドライブ、15は本実施形態をソフトウエアで実現したプログラムが格納されているCDROMである。OS13の制御によりCDROM15から本実施形態のプログラムをCDROMドライブ14経由でメモリ12に読み込みCPU11で実行する。
また、振幅符号化部4ではさらにエントロピー符号化のような処理を施してもかまわない。入力信号S1がスペクトルなどのように極性反転することが無い場合、振幅信号生成部1や極性符号化部3が無くてもかまわない。極性符号化部3ではランレングスを例に説明したがこの符号化方式に限るものではない。
以上のように、本実施形態は、一定区間の信号やスペクトルデータに対して絶対値を求め、その各ピークを直線で結ぶエンベロープを生成する。このエンベロープはなるべく少ない情報量で実現する。符号化はこのエンベロープと振幅信号と正負の符号ビットで行う。符号化はこのエンベロープと振幅信号と正負の符号ビットで行う。すなわち、振幅信号の各位置におけるビットを同位置におけるエンベロープの所要ビット数で量子化する。エンベロープ生成部2は、入力信号の複数のピークを直線で結んだ信号を基にエンベロープを生成する。
これにより、従来よりも冗長な符号化を避けることができる。また、ダイナミックレンジの広い信号やスペクトルデータの場合でも効率のよい圧縮を提供できる。
本実施形態は、コンピュータがプログラムを実行することによって実現することができる。また、プログラムをコンピュータに供給するための手段、例えばかかるプログラムを記録したCD−ROM等のコンピュータ読み取り可能な記録媒体又はかかるプログラムを伝送するインターネット等の伝送媒体も本発明の実施形態として適用することができる。また、上記のプログラムを記録したコンピュータ読み取り可能な記録媒体等のコンピュータプログラムプロダクトも本発明の実施形態として適用することができる。上記のプログラム、記録媒体、伝送媒体及びコンピュータプログラムプロダクトは、本発明の範疇に含まれる。記録媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
なお、上記実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
本発明の第1、第2及び第4の実施形態によるオーディオ符号化装置の構成例を示すブロック図である。 本発明の第1〜第3の実施形態のエンベロープ生成部2の内部動作を説明するフローチャートである。 本発明の第1〜第3の実施形態の振幅信号S2とエンベロープS3の関係を示す図である。 本発明の第1〜第4の実施形態によるオーディオデータ復号化装置の構成例を示すブロック図である。 本発明の第1〜第4の実施形態をソフトウエアロジックで構成する例を示す図である。 本発明の第3の実施形態によるオーディオ符号化装置の構成を示すブロック図である。 本発明の第4の実施形態のエンベロープ生成部2の内部動作を説明するフローチャートである。 本発明の第4の実施形態の振幅信号S2とエンベロープS3の関係を示す図である。
符号の説明
1 振幅信号生成部
2 エンベロープ生成部
2A チャネル間類似度計算部
2B エンベロープ生成部
3 極性符号化部
4 振幅符号化部
5 マルチプレクサ
6 デマルチプレクサ
7 エンベロープ復元部
8 振幅信号生成部
9 極性復元部
10 極性反転部
11 CPU
12 メモリ
13 OS
14 CDROMドライブ
15 CDROM

Claims (28)

  1. 入力信号のエンベロープを生成するエンベロープ生成手段と、
    前記エンベロープの各点における所要ビット数で前記入力信号を符号化する符号化手段と
    を有することを特徴とする符号化装置。
  2. 前記符号化手段は、前記エンベロープの各点における所要ビット数で前記入力信号を量子化することを特徴とする請求項1記載の符号化装置。
  3. さらに、前記符号化された入力信号及び前記エンベロープの情報を出力する出力手段を有することを特徴とする請求項1又は2記載の符号化装置。
  4. 前記出力手段は、前記符号化された入力信号及び前記エンベロープの情報を統合して出力することを特徴とする請求項3記載の符号化装置。
  5. さらに、入力信号の正負符号を検出する検出手段と、
    前記入力信号を絶対値化する絶対値化手段とを有し、
    前記エンベロープ生成手段は、前記絶対値化された入力信号のエンベロープを生成し、
    前記符号化手段は、前記エンベロープの各点における所要ビット数で前記絶対値化された入力信号を符号化し、
    前記出力手段は、前記符号化された入力信号、前記エンベロープの情報及び前記入力信号の正負符号の情報を出力することを特徴とする請求項3記載の符号化装置。
  6. 前記エンベロープ生成手段は、
    入力信号をフーリエ変換する手段と、
    前記フーリエ変換の高次成分を除去し低次成分のみを逆フーリエ変換する手段と、
    前記逆フーリエ変換の信号を基にエンベロープを生成する手段とを有することを特徴とする請求項1〜5のいずれか1項に記載の符号化装置。
  7. 前記エンベロープ生成手段は、
    対数化した入力信号をフーリエ変換する手段と、
    前記フーリエ変換の高次成分を除去し低次成分のみを逆フーリエ変換する手段と、
    前記逆フーリエ変換の信号を基にエンベロープを生成する手段とを有することを特徴とする請求項1〜5のいずれか1項に記載の符号化装置。
  8. 前記エンベロープ生成手段は、入力信号に所定レベルを加算して対数をとり、その対数化した入力信号をフーリエ変換することを特徴とする請求項7記載の符号化装置。
  9. 前記エンベロープ生成手段は、前記入力信号の複数のピークを結んだ信号を基にエンベロープを生成することを特徴とする請求項1〜5のいずれか1項に記載の符号化装置。
  10. 前記エンベロープ生成手段は、前記入力信号の複数のピークを直線で結んだ信号を基にエンベロープを生成することを特徴とする請求項9記載の符号化装置。
  11. 前記エンベロープ生成手段は複数チャネルの入力信号のエンベロープを生成し、前記符号化手段は前記複数チャネルの入力信号を符号化することを特徴とする請求項1〜10のいずれか1項に記載の符号化装置。
  12. 前記エンベロープ生成手段は全チャネルの入力信号の最大値を取るように合成した信号を基にエンベロープを生成することを特徴とする請求項11記載の符号化装置。
  13. さらに、全チャネルの入力信号の類似度を判定する判定手段を有し、
    前記エンベロープ生成手段は、全チャネルの入力信号が類似しているときには全チャネルの入力信号の最大値を取るように合成した信号を基に共有のエンベロープを生成し、類似していないときにはチャネル毎のエンベロープを生成することを特徴とする請求項12記載の符号化装置。
  14. さらに、全チャネルの入力信号の類似度を判定する判定手段を有し、
    前記エンベロープ生成手段は、全チャネルの入力信号が類似しているときには全チャネルの入力信号の共有のエンベロープを生成し、類似していないときにはチャネル毎のエンベロープを生成することを特徴とする請求項11記載の符号化装置。
  15. 前記入力信号はオーディオ信号であることを特徴とする請求項1〜14のいずれか1項に記載の符号化装置。
  16. 前記エンベロープ生成手段及び前記符号化手段は、所定区間毎に入力信号の処理を行うことを特徴とする請求項1〜15のいずれか1項に記載の符号化装置。
  17. 符号化された入力信号及び入力信号のエンベロープの情報を入力する入力手段と、
    前記エンベロープの各点における所要ビット数で前記入力信号を復号化する復号化手段と
    を有することを特徴とする復号化装置。
  18. 前記入力手段は、符号化された入力信号、入力信号のエンベロープの情報及び入力信号の正負符号の情報を入力し、
    さらに、前記入力信号の正負符号の情報を基に前記復号化された入力信号に正負符号を付与する付与手段を有することを特徴とする請求項17記載の復号化装置。
  19. 前記エンベロープは、入力信号をフーリエ変換し、前記フーリエ変換の高次成分を除去し低次成分のみを逆フーリエ変換し、前記逆フーリエ変換の信号を基に生成されたエンベロープであることを特徴とする請求項17又は18記載の復号化装置。
  20. 前記エンベロープは、対数化した入力信号をフーリエ変換し、前記フーリエ変換の高次成分を除去し低次成分のみを逆フーリエ変換し、前記逆フーリエ変換の信号を基に生成されたエンベロープであることを特徴とする請求項17又は18記載の復号化装置。
  21. 前記エンベロープは、入力信号の複数のピークを結んだ信号を基に生成されたエンベロープであることを特徴とする請求項17又は18記載の復号化装置。
  22. 前記復号化手段は、一のエンベロープを基に複数のチャネルの入力信号を復号化することを特徴とする請求項17〜21のいずれか1項に記載の復号化装置。
  23. 前記入力信号はオーディオ信号であることを特徴とする請求項17〜22のいずれか1項に記載の復号化装置。
  24. 前記復号化手段は、所定区間毎に入力信号を復号化することを特徴とする請求項17〜23のいずれか1項に記載の復号化装置。
  25. 入力信号のエンベロープを生成するエンベロープ生成ステップと、
    前記エンベロープの各点における所要ビット数で前記入力信号を符号化する符号化ステップと
    を有することを特徴とする符号化方法。
  26. 符号化された入力信号及び入力信号のエンベロープの情報を入力する入力ステップと、
    前記エンベロープの各点における所要ビット数で前記入力信号を復号化する復号化ステップと
    を有することを特徴とする復号化方法。
  27. 入力信号のエンベロープを生成するエンベロープ生成ステップと、
    前記エンベロープの各点における所要ビット数で前記入力信号を符号化する符号化ステップと
    をコンピュータに実行させるためのプログラム。
  28. 符号化された入力信号及び入力信号のエンベロープの情報を入力する入力ステップと、
    前記エンベロープの各点における所要ビット数で前記入力信号を復号化する復号化ステップと
    をコンピュータに実行させるためのプログラム。
JP2003392723A 2003-11-21 2003-11-21 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム Pending JP2005156740A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003392723A JP2005156740A (ja) 2003-11-21 2003-11-21 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003392723A JP2005156740A (ja) 2003-11-21 2003-11-21 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2005156740A true JP2005156740A (ja) 2005-06-16

Family

ID=34719332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003392723A Pending JP2005156740A (ja) 2003-11-21 2003-11-21 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2005156740A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1729329A2 (en) 2005-05-30 2006-12-06 Matsushita Electric Industrial Co., Ltd. Semiconductor memory cell with a ferroelectric capacitor and method for fabricating the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1729329A2 (en) 2005-05-30 2006-12-06 Matsushita Electric Industrial Co., Ltd. Semiconductor memory cell with a ferroelectric capacitor and method for fabricating the same

Similar Documents

Publication Publication Date Title
JP4779098B2 (ja) 可変サイズベクトルエントロピ符号化を実行するための方法および装置
JP4981174B2 (ja) 確率テーブルの動的な計算によるシンボルプレーン符号化/復号化
US6985590B2 (en) Electronic watermarking method and apparatus for compressed audio data, and system therefor
JP4640020B2 (ja) 音声符号化装置及び方法、並びに音声復号装置及び方法
JP2005531024A (ja) 圧縮されたマルチメディアコンテンツからのハッシュを生成する方法
JP2009105838A (ja) 符号化方法及び装置、並びにプログラム
JP4031909B2 (ja) 時間領域エイリアシングを効率的に除去する装置及び方法
US11749295B2 (en) Pitch emphasis apparatus, method and program for the same
WO2002103682A1 (en) Acoustic signal encoding method and apparatus, acoustic signal decoding method and apparatus, and recording medium
US8593321B2 (en) Computation apparatus and method, quantization apparatus and method, and program
JP2004258603A (ja) レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
JP2010060989A (ja) 演算装置および方法、量子化装置および方法、オーディオ符号化装置および方法、並びにプログラム
US7426462B2 (en) Fast codebook selection method in audio encoding
JP6334564B2 (ja) 低複雑度の調性適応音声信号量子化
JPH09106299A (ja) 音響信号変換符号化方法および復号化方法
JPH09127995A (ja) 信号復号化方法及び信号復号化装置
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
JP2005156740A (ja) 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム
JP2002132295A (ja) ステレオオーディオ信号高能率符号化装置
JP5361565B2 (ja) 符号化方法、復号方法、符号化器、復号器およびプログラム
JP2007017905A (ja) 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。
JP4438655B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
US11501782B2 (en) Encoder, decoder, encoding method, decoding method, program, and recording medium
JP4195598B2 (ja) 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム