JP4184817B2 - 時系列信号の符号化方法および装置 - Google Patents
時系列信号の符号化方法および装置 Download PDFInfo
- Publication number
- JP4184817B2 JP4184817B2 JP2003026308A JP2003026308A JP4184817B2 JP 4184817 B2 JP4184817 B2 JP 4184817B2 JP 2003026308 A JP2003026308 A JP 2003026308A JP 2003026308 A JP2003026308 A JP 2003026308A JP 4184817 B2 JP4184817 B2 JP 4184817B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- correlation
- sample
- time
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【産業上の利用分野】
本発明は、音楽制作、音響データの素材保管、ロケ素材の中継など音楽制作分野、特にCDよりも品質の高い高精細オーディオ制作を行う分野、CD、DVD等のデジタル記録媒体を用いたオーディオ記録再生分野、遠隔医療における生体信号の伝送等、データの改変が嫌われる分野等において好適なデータの可逆圧縮技術に関する。
【0002】
【従来の技術】
従来より、音響信号の圧縮には様々な手法が用いられている。音響信号を圧縮して符号化する手法として、MP3(MPEG−1/Layer3)、AAC(MPEG−2/Layer3)などが実用化されている。このような圧縮符号化方式により、音響信号を小さいデータとして扱うことが可能となり、データの記録・伝送の効率化に貢献している。
【0003】
上述のようなMP3、AAC等はいずれもロッシー符号化方式といわれるものであり、効率的な圧縮が可能であるが、復号化にあたって、少なからず品質の劣化を伴い、原信号を完全に再現することはできない。そのため、音楽制作、素材保管、ロケ素材の中継など音楽制作分野では、これらの符号化方式を適用できず、非効率ではあるが、非圧縮で保存・伝送する方式がとられている。特に最近は高精細オーディオを扱うプロダクションが増え、素材容量が膨大になり、ワークディスクを管理する上で問題になってきている。
【0004】
最近では、上記問題を解決するため、音響信号を可逆圧縮符号化する方法として、所定時間単位のサンプルをブロック化し、ブロック内のサンプルに対して予測符号化を利用して相関を除去する手法が提案されている(例えば、特許文献1参照)。
【0005】
【特許文献1】
特表2000−821199号公報
【0006】
【発明が解決しようとする課題】
しかしながら、上記特許文献1に記載の発明では、ブロック内の相関を用いた圧縮にとどまっており、ブロックを超えたブロック間の相関については考慮されていない。
【0007】
そこで、これらの問題を解決するため、本発明は、同じような信号波形パターンが繰り返し現れるような時系列信号に対して、より効率の高い圧縮を行うことが可能な時系列信号の符号化方法および装置を提供することを課題とする。
【0008】
【課題を解決するための手段】
上記課題を解決するため、本発明では、時系列のサンプル列で構成される時系列信号に対して、前記全てのサンプル列を再現できるように情報量を圧縮する符号化方法として、前記時系列信号に対して線形予測を行い、各サンプルの値を予測誤差値に変換する予測誤差変換段階、前記予測誤差値に変換されたサンプル列に対して、所定のフレーム長の複数のサンプルで構成されるフレーム単位に分割するフレーム設定段階、前記各フレームを対象フレームとして、当該対象フレームより時間的に過去に位置する所定数の比較フレームの中から最も対象フレームに類似する相関候補フレームを探索する相関候補フレーム探索段階、前記相関候補フレームのアドレスを前記フレーム長を超えない範囲でサンプル単位に移動させ、前記対象フレームと前記相関候補フレームが最も類似するアドレスを探索して相関フレームを決定する相関フレーム決定段階、前記対象フレームおよび相関フレームの各アドレスを関連付けて符号化するフレーム相関符号化段階、前記対象フレームと相関フレームとの差分を求め、対象フレームを相関フレームとの差分値に更新するフレーム更新段階、前記フレーム更新段階で更新された対象フレームを含む全サンプル列に対して符号化を行うサンプル列符号化段階を実行するようにしたことを特徴とする。
【0009】
本発明によれば、予測誤差変換後、サンプル列にフレームを設定し、各フレームに類似する相関フレームを、相関候補フレームを探索した後、相関候補フレームをサンプル単位で移動することにより決定して検出し、対象となるフレームを相関フレームとの差分値で記録するようにしたので、同じような信号波形パターンが繰り返し現れるような時系列信号に対して、より効率の高い圧縮を行うことが可能となる。
【0010】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照して詳細に説明する。
(装置構成)
図1は、本発明に係る時系列信号の符号化装置の一実施形態を示す構成図である。図1において、10は予測誤差変換手段、21はフレーム設定手段、22は相関候補フレーム探索手段、23は相関フレーム決定手段、24はフレーム相関符号化手段、25はフレーム更新手段、26は可視情報出力手段、30はサンプル列符号化手段である。
【0011】
図1において、予測誤差変換手段10は、線形予測誤差の手法を用いて、時系列信号の各サンプルの値を予測誤差値に変換する機能を有する。フレーム設定手段21は、時系列信号に対して所定数のサンプルで構成されるサンプル列をフレームとして設定する機能を有する。相関候補フレーム探索手段22は、あるフレームを対象フレームとし、対象フレームとの相関が高い相関フレームの候補となる相関候補フレームを探索する機能を有する。相関フレーム決定手段23は、相関候補フレームを時系列方向に少しずつ移動させながら、対象フレームとの相関が高い相関フレームを決定する機能を有する。フレーム相関符号化手段24は、決定された相関フレームと対象フレームとの対応関係をフレーム相関データとして符号化する機能を有する。フレーム更新手段25は、対象フレームの各サンプルの値を、相関フレームの各サンプルとの差分値に更新する機能を有する。可視情報出力手段26は、フレーム相関符号化手段24により作成されたフレーム相関データを可視情報として出力する機能を有する。サンプル列符号化手段30は、各対象フレームを更新した後の全サンプル列を所定の手法により符号化する機能を有する。図1に示した各構成要素は、実際には、コンピュータおよびコンピュータにより実行される専用のソフトウェアプログラムにより実現される。
【0012】
(処理動作)
次に、図1に示した時系列信号の符号化装置の処理動作について説明する。ここでは、時系列信号として音響信号を適用した場合を例にとって説明する。まず、時系列信号であるアナログの音響信号をデジタル化する。これは、従来の一般的なPCMの手法を用い、所定のサンプリング周波数でこのアナログ音響信号をサンプリングし、振幅を所定の量子化ビット数を用いてデジタルデータに変換する処理を行えば良い。本実施形態では、サンプリング周波数44.1KHz、量子化ビット数16ビットで正負の符号を記録した場合を想定して以降説明する。サンプリング周波数44.1KHzでサンプリングすると、1秒あたり44100個のサンプルにより構成されるサンプル列ができることになる。
【0013】
続いて、図2のフローチャートに従って、本発明の時系列信号の符号化方法について説明する。まず、上記のようなサンプル列に対して、まず、予測誤差変換手段10が、予測誤差の算出を行い、各サンプルの値を予測誤差値に変換する(ステップS1)。具体的には、直前の2つのサンプルを基に各サンプルの予測値と予測誤差を算出する。ここで、予測誤差の算出手法について、図3を用いて説明する。例えば、サンプル値x(t)が図3(a)に示すような状態である場合を考えてみる。図3(a)において、横軸は時刻(サンプル番号)、縦軸はサンプル値x(t)である。また、各時刻における線分は、各時刻におけるサンプル値x(t)の大きさを示している。このような状態で、時刻tのサンプルにおける予測誤差e(t)を算出する場合、直前の時刻t−1におけるサンプル値x(t−1)および2つ前の時刻t−2におけるサンプル値x(t−2)を利用して以下の〔数式1〕により算出する。
【0014】
〔数式1〕
e(t)=x(t)−2×x(t−1)+x(t−2)−e(t−1)/2
【0015】
上記〔数式1〕において、「2×x(t−1)−x(t−2)」は過去の2つのサンプルに基づく線形予測成分である。予測誤差変換手段10は、この線形予測成分、および、直前のサンプルにおいて算出された予測誤差「e(t−1)/2」(誤差フィードバック成分)を用いて時刻tにおける予測誤差e(t)を算出する。全サンプルについて、予測誤差の算出を行い、サンプル値の代わりに予測誤差が記録される。
【0016】
これを図3(a)に示したサンプルを基に説明する。まず、誤差フィードバック成分を加えない状態で各予測誤差eo(t)を算出する。図3(b)に示すように、時刻tの予測誤差eo(t)を算出する場合、直前の時刻t−1におけるサンプル値x(t−1)および2つ前の時刻t−2におけるサンプル値x(t−2)を結ぶ予測線が時刻tでとる値と、時刻tにおけるサンプル値x(t)の差分(図中太点線で示す)に基づいて予測誤差eo(t)が算出される。時刻t+1以降も同様に行って予測誤差eo(t+1)を算出する。算出された予測誤差eo(t)は、図3(c)に示すようになる。図3(a)と図3(c)を比較するとわかるように値が変動する範囲が大きく狭まり、データ圧縮に都合が良くなる。
【0017】
続いて、〔数式1〕に基づいて予測誤差eo(t)に対して直前の時刻t−1における補正が加わった予測誤差e(t−1)の50%を減算させて、誤差フィードバック処理を加えた結果が図3(d)である。図3(c)と比べると、時刻t+1およびt+2における予測誤差の低減が顕著である。逆に時刻t+3およびt+4では予測誤差が増大しているが、平均的には予測誤差が低減し、図3(a)と比較すると値が変動する範囲が更に狭まり、データ圧縮効果が向上する。
【0018】
続いて、フレーム設定手段21が、所定のサンプル数単位でフレーム化を行う(ステップS2)。本実施形態では、フレーム長をサンプル列の開始時刻から終了時刻までの全区間に渡って固定長としている。具体的には、1フレームを512サンプルとしている。フレーム設定手段21は、図4(a)に示すように、サンプル列の先頭から512サンプルずつを1フレームとして設定していくことになる。
【0019】
次に、相関候補フレーム探索手段22が、各フレームに対して相関の高いフレームの候補となる相関候補フレームを探索する。具体的には、図4(b)に示すように、まず、設定されたフレームのうち、時間的に最後尾のフレームを、相関フレームを探すための対象フレームとする。次に、この対象フレームの予測誤差絶対値の総和を算出する(ステップS3)。本実施形態の場合、対象フレーム内の512サンプルの絶対値の総和が算出されることになる。具体的には、対象フレームの番号をk、フレーム長をT、各フレーム内のサンプル番号をtとすると、総和値Eoは、以下の〔数式2〕により算出される。
【0020】
〔数式2〕
Eo=Σ|e(t+kT)|
ただし、t=0,1,2,…,T−1(Tはフレーム長)
【0021】
なお、上述のように、本実施形態においては、T=512である。すなわち、〔数式2〕による処理により、|e(kT)|から|e(kT+511)|の総和が得られることになる。ここで、対象フレームの各サンプルの様子を図5(a)に示す。図5において、横軸は時刻(サンプル番号)、縦軸はサンプル値である。図5(a)に示すように、対象フレームのサンプル番号は、kT,kT+1,kT+2,…となっている。Eoは512個の線分の総和として得られる。
【0022】
続いて、相関候補フレーム探索手段22は、対象フレームよりも時間的に過去に位置するフレームとの予測誤差差分の絶対値の総和を算出する(ステップS4)。まず、最初は、対象フレームの直前のフレームを比較フレームとして計算を行う。本実施形態の場合、対象フレームと比較フレームの各512サンプルの差分絶対値の総和が算出されることになる。具体的には、対象フレームの番号をk、比較フレームの番号をp、フレーム長をT、各フレーム内のサンプル番号をtとすると、差分総和値Epは、以下の〔数式3〕により算出される。
【0023】
〔数式3〕
Ep=Σ|e(t+kT)−e(t+pT)|
ただし、t=0,1,2,…,T−1(Tはフレーム長)
【0024】
なお、上述のように、本実施形態においては、T=512である。ここで、対象フレームFkと比較フレームFpの各サンプルの様子は図5(a)のようになっている。図5(a)に示すように、対象フレームのサンプル番号は、kT,kT+1,kT+2,…、比較フレームのサンプル番号は、pT,pT+1,pT+2,…となっている。上記〔数式3〕における処理は、図5(a)に示したe(kT)とe(pT)の差分絶対値、e(kT+1)とe(pT+1)の差分絶対値、…といった具合に対応するサンプル同士の差分絶対値を算出し、それを512個分足したものとなる。ステップS4における演算は、対象フレームを固定したまま、比較フレームを時間的に過去のものに順に変更して行っていく。本実施形態では、1つの対象フレームに対して100個の比較フレームとの演算を行う。例えば、フレームに時系列に昇順に番号を付与したとすると。対象フレームFkに対しては、p=k−1からk−100の100個の比較フレームFpに対して演算を行うことになる。
【0025】
相関候補フレーム探索手段22は、所定数の比較フレームとの演算を行った後、演算結果EpがEoより小さくかつ最小となる比較フレームを相関候補フレームとする(ステップS5)。相関候補フレームが見つからなければ、ステップS3に戻って、対象フレームkの直前のフレームk−1を新たな対象フレームとしてステップS3〜ステップS5の処理を行う。
【0026】
相関候補フレームが見つかった場合は、相関フレーム決定手段23が、相関フレームを探索して決定する処理を行う。まず、相関候補フレームのアドレスを1サンプル分前に移動させて対象フレームと相関候補フレームの差分絶対値の総和Epsを算出する(ステップS6)。対象フレームと相関候補フレームの差分絶対値の総和Epは既に算出されているので、まず、相関候補フレームのアドレスを1サンプル前にずらした状態で計算を行い、次に2サンプルずらした状態で行うというように順次計算を行っていく。具体的には、対象フレームの番号をk、相関候補フレームの番号をp、フレーム長をT、各フレーム内のサンプル番号をt、移動させる補正アドレスをsサンプルとすると、差分総和値Epsは、以下の〔数式4〕により算出される。
【0027】
〔数式4〕
Eps=Σ|e(t+kT)−e(t+pT+s)|
ただし、t=0,1,2,…,T−1(Tはフレーム長)
【0028】
なお、上述のように、本実施形態においては、T=512である。ここで、s=0のときの対象フレームFkと比較フレームFpの各サンプルの様子は図5(a)のようになっている。図5(a)に示すように、対象フレームのサンプル番号は、kT,kT+1,kT+2,…、相関候補フレームのサンプル番号は、pT,pT+1,pT+2,…となっている。s=0の場合については、既に、ステップS4において計算されているので、ここでは行わない。続いて、1サンプルずらした状態、すなわちs=−1とした状態で上記〔数式4〕の計算を行う。s=−1とした場合のサンプル列を図5(b)に示す。図5(a)と比較するとわかるように、この場合、相関候補フレームを1つずらした状態で差分演算を行っていく。すなわち、対象フレームのサンプルkTとの演算対象はサンプルpT−1、サンプルkT+1との演算対象はサンプルpTといった具合に1つずらした状態で行っていく。本実施形態では、1つの相関候補フレームについて、フレーム長Tの半分の256サンプルずらした状態まで対象フレームとの演算を行う。具体的には、s=−256〜+255の範囲で512個の差分総和値Epsを算出する。この結果、EpsがEp(s=0の場合)より小さくかつ最小となるアドレスsに対応するサンプル列を相関フレームとして決定する(ステップS7)。
【0029】
相関フレームが決定したら、フレーム相関符号化手段24が、対象フレームと相関フレームの対応関係をフレーム相関データとして符号化する(ステップS8)。具体的には、図4(d)に示すように、対象フレームの先頭のサンプル番号と、相関フレームの先頭のサンプル番号を対応付けて記録する。一方、フレーム更新手段25は、対象フレームの各サンプルの値を相関フレームの各サンプル値との差分値に更新する(ステップS9)。対象フレームが差分値に更新されたら、ステップS3に戻って、1つ直前のフレームを新たな対象フレームとして処理を続けていく。このようにして、時系列信号の先頭時刻までの全フレームを対象フレームとして相関フレームの検出処理を行う。
【0030】
全てのフレームを対象フレームとして上記処理が終了したら、上記処理が施されたサンプル列に対して、サンプル列符号化手段30が、サンプル列符号化処理を行う(ステップS10)。ここからのサンプル列符号化処理は、各サンプルについて固定ビット長もしくは可変ビット長で符号化を行うものであり、特定の手法には限定されない。しかし、ここでは、好ましい例について以下にしめしておく。
【0031】
(サンプル列符号化の好ましい例)
まず、正負の値をとる各サンプルのビット列を、正負の極性が付いたビット列に変換する。具体的には、16ビットで正負の値を表現しているビット列を、先頭の1ビットを正負の極性符号とし、他の15ビットで絶対値を表すように変換する。このように変換した場合、「0」については、極性符号が必要ないため、省略が可能となる。これにより、値が「0」のサンプル数×1ビット分が削減できることになる。
【0032】
次に、各サンプルの上位ビットと下位ビットの分離を行う。例えば、音響信号をPCMによりデジタル化する際に、量子化ビット数16でサンプリングした場合、各サンプルは16ビットで表現されている。この場合、本実施形態では、上位ビット12ビットと、下位ビット4ビットに分離する。この分離は、基本的に、A/D変換機等、音響信号をデジタル化する際に用いる回路の熱雑音を分離するために行う。そのため、熱雑音であると考えられる下位ビットを分離するのである。下位ビットとして、どの程度分離するかは、音源や利用した回路の特性によっても変化するが、通常量子化ビット数の1/4程度とすることが望ましい。したがって、ここでは、16ビットの1/4にあたる4ビットを下位ビットとして分離しているのである。本発明においては、特に、この上位ビットと下位ビットの分離を予測誤差に変換した後に行うことを特徴としている。これは、予測誤差への変換を上位ビットと下位ビットの分離後に上位サンプルに対して行うと、たとえ予測誤差への変換により圧縮可能な成分が下位ビットのなかに含まれていても、圧縮処理が行われないため、全体的に圧縮効率が低下する場合があるためである。
【0033】
ここで、このデータ分離の様子を図6に模式的に示す。図6において、Hは上位ビットもしくは上位サンプルデータを示し、Lは下位ビットもしくは下位サンプルデータを示す。図6(a)は分離前のサンプルデータである。データの分離処理により、サンプルデータは、図6(b)に示す上位サンプルデータと図6(c)に示す下位サンプルデータに分離されることになる。なお、上位ビットに含まれる符号ビットは、そのまま上位サンプルデータに含まれて分離される。図6の例で、「H4」として示したように、極性処理により符号ビットが削除されている場合には、符号ビットのない上位サンプルデータとなる。上記のようにして分離されたサンプルデータは、以降別々に処理されることになる。
【0034】
次に、上位サンプル列に対して、信号平坦部の処理を行う。具体的には、上位サンプル列中で同一の値が連続する部分を、信号平坦部の先頭時刻位置と、同一信号レベルが続くサンプルの個数と、信号レベル(サンプル値)の3つの値で構成される上位信号平坦部データとして、上位サンプル列と分離して記録する。
【0035】
続いて、上位サンプル列を可変ビット長で符号化していく。まず、最初に、ビット構成の変換を行うために利用するルックアップテーブルの作成を行う。ルックアップテーブルの作成にあたって、上位サンプル列の全時刻に渡って、各上位サンプル値のヒストグラムを算出する。各上位サンプル値は上記の極性処理により、全て絶対値化されているので、正負の区別なくヒストグラムを算出する。その結果、サンプル絶対値の種類が640以上となった場合、セパレータビットを2ビット固定値「00」とし、サンプル絶対値の種類が639以下となった場合、セパレータビットを1ビット固定値「0」とする。さらに、出現頻度の高いサンプル絶対値から順に、少ないビット数のビットパターンを割り当てていく。この際、割り当てるビットパターンには規則が有り、最上位ビットは必ず「1」とすると共に、セパレータビットが2ビット「00」の場合は「001」のビットパターンを含むビットパターンは禁止し、セパレータビットが1ビット「0」の場合は「01」のビットパターンを含むビットパターンは禁止する。また、セパレータビットが2ビット「00」の場合のルックアップテーブルは1つだけであるが、セパレータビットが1ビット「0」の場合のルックアップテーブルは、サンプル絶対値の種類が320以上の場合と、320未満の場合で異なるものを作成するようにしている。サンプル絶対値の種類の数に応じたルックアップテーブルの例を図7、図8に示す。
【0036】
上記のようにして作成されたルックアップテーブルを用いて、12ビット固定長の連続する上位サンプルデータを、可変長のビットパターンに変換していく。可変長になるため、変換後の各データの区切りを区別する必要が生じる。そのため、本実施形態では、各データ間に上述のような1ビットもしくは2ビットのセパレータビットを挿入する。サンプル値の種類が320未満の場合、各順位のデータを表現するためのビット列、およびビット数は、図7(a)に示すようになる。図7(a)において、順位0位は、最もビット数が少ない1ビット「1」で表現される。図7(a)においては、変換前ビット列は省略してあるが、最も頻繁に現れるビット列が1ビット「1」に変換されることになる。また、各可変長ビットには、セパレータが必ず付加されるので、順位0位のデータを表現するためには、2ビットが必要となることになる。図7(a)に示すサンプル値の種類が320未満の場合は、セパレータビットが1ビット「0」であるため、「01」のビットパターンは割り当てられないことになる。
【0037】
また、サンプル値の種類が320以上640未満の場合、各順位のデータを表現するためのビット列、およびビット数は、図7(b)に示すようになる。図7(b)は、図7(a)に示したルックアップテーブルの各ビット列の最上位1ビットに後続して1ビットを付加したものを新たなビット列としている。例えば、図7(b)において順位0位の「10」と順位1位の「11」は、図7(a)において順位0位の「1」に1ビット「0」と「1」をそれぞれ付加したものであり、図7(b)において順位2位の「100」と順位3位の「110」は、図7(a)において順位1位の「10」の2ビット目に1ビット「0」と「1」をそれぞれ付加したものである。図7(b)においても。各可変長ビットには、セパレータが必ず付加されるので、順位0位のデータを表現するためには、3ビットが必要となることになる。図7(b)の例では、セパレータビットが1ビット「0」であるため、「01」のビットパターンは割り当てられないことになるが、データの読出しの順序を工夫することにより復号時には正しいデータが抽出できるようになっている。
【0038】
また、セパレータビットが2ビット「00」の場合、各順位のデータを表現するためのビット列、およびビット数は、図8に示すようになる。図8において、順位0位は、最もビット数が少ない1ビット「1」で表現される。図8においても、変換前ビット列は省略してあるが、最も頻繁に現れるビット列が1ビット「1」に変換されることになる。また、各可変長ビットには、セパレータが必ず付加されるので、順位0位のデータを表現するためには、3ビットが必要となることになる。図8の例では、セパレータビットが2ビット「00」であるため、「001」のビットパターンは割り当てられないことになる。
【0039】
図9(a)(b)に、データ変換の様子を模式的に示す。図9(a)(b)はいずれもサンプル列の上位部分に対応しており、図9(a)は固定長の上位サンプルが連続して記録されている様子を示している。図9(a)に示したような上位サンプル列は、図7(a)(b)および図8に示したルックアップテーブルを用いて図9(b)に示すように変換されることになる。
【0040】
一方、下位サンプルデータは、上記データ分離処理により分離された下位2ビットのデータを固定長で連続に符号化していく。
【0041】
(符号データの記録)
以上のようにして得られた符号データは、図10に示すようになる。すなわち、上位可変長サンプル列、ルックアップテーブル、上位信号平坦部データ、下位固定長サンプル列、フレーム相関データとなる。このデータを記録すべき記録媒体に合わせたフォーマットで記録する。なお、上位可変長サンプル列、上位信号平坦部データ、ルックアップテーブル、下位固定長サンプル列はサンプル列符号化処理で上記の例と異なる処理を行った場合には、異なる形式で記録されることになる。
【0042】
(フレーム相関情報の可視化)
上記フレーム相関データは、サンプル列符号データと共に記録媒体等に記録されると共に、圧縮効率を分析した分析データとして出力することができる。フレーム相関符号化手段24では、フレーム相関データを記録媒体等に出力すると共に、フレーム相関データを加工して分析データを作成する。具体的には、元の時系列信号の全サンプル数の情報を用いて、フレーム間相関データをグラフィック表示して分析データを作成する。作成された分析データは、可視情報出力手段26から出力される。可視情報出力手段26としては、プリンタ等の印刷手段や、CRT、LCD等の表示手段が適用できる。可視情報出力手段26に出力された分析データの様子を図11に示す。
【0043】
図11において、上段下段共に時系列のサンプル列を矩形で示している。矩形の左端は開始時刻、右端は終了時刻を示している。上段に示したサンプル列中の上下方向の線分は相関フレーム、下段に示したサンプル列中の上下方向の太い線分は対象フレームを示している。上段のサンプル列も下段のサンプル列も同じものを示しているが、分けて表示しているのは、対象フレームと相関フレームの関係をわかりやすく示すためである。対応する相関フレームと対象フレームは点線で結んで示している。図11の例では、11個の対象フレームに対して11個の相関フレームが検出されたことを示している。図からわかるように、相関フレームは必ず対象フレームよりも時間的に過去のものになっている。図11に示すような分析データを可視情報として出力することにより、その時系列信号にどの程度の相関があるか等の情報を得ることができる。効果的な圧縮を検討するのに役立つ。
【0044】
(他の圧縮方式との組み合わせ)
本発明は、上記説明の内容のみであっても十分に圧縮効果をあげることが可能であるが、他の圧縮方式と組み合わせることで、より高い効果を得ることができる。以下に、好ましい組み合わせについて説明する。ここでは、図12に示すようなステレオ音響信号に対して処理を行う場合を想定して説明する。図12(a)は、2チャンネルのステレオ音響信号を示しており、Ch1にL(左)信号、Ch2にR(右)信号が記録されている。また、図12(a)から(d)においては、左端が開始時刻であり、右端が終了時刻である。図13は、本発明に他の方式を組み合わせた場合の全体の処理概要を示すフローチャートである。ここからは、図13に従って説明していく。
【0045】
(信号平坦部処理方式)
まず、デジタル音響信号であるサンプル列に対して、信号平坦部の処理を行う(ステップS21)。信号平坦部とは、同一の信号レベルが連続する部分のことをいう。特に信号レベルが「0」の無音部、および信号レベルの絶対値が最大の飽和部に現れることが多い。無音部は実際に無音であるか、音が非常に小さく記録されなかった場合に生じるが、飽和部は、信号の録音およびA/D変換の過程において生じる。無音部、飽和部またはそれ以外の同一信号レベルが連続する場合のいずれであっても、信号平坦部は、同一の信号レベルが所定の時間(所定のサンプル数)連続して記録される。このため、この部分は圧縮し易いデータになっている。具体的には、信号平坦部の先頭時刻位置と、同一信号レベルが続くサンプルの個数と、信号レベル(サンプル値)の3つの値を信号平坦部データとして各チャンネルのサンプル列と分離して記録する。各チャンネルのサンプル列からは、信号平坦部が削除される。これを模式的に示すと図12(b)(c)に示すようになる。図12(b)は、信号平坦部処理前のサンプル列である。図12(b)において、網掛けで示した部分は信号平坦部を示す。ステップS21の処理により、信号平坦部は元のサンプル列からは削除され、図12(c)に示すようになる。ただし、復号時に元通りに復元するために、分離された信号平坦部は、図12(e)に示すような形式で記録しておく。
【0046】
信号平坦部データは、上述のように、信号平坦部ごとに、その先頭時刻(サンプル番号)、サンプル数、サンプル値の3属性で記録する。ここで、先頭時刻とは、信号の開始位置からの時刻であり、図12(e)の例では、先頭からのサンプル番号で記録している。上述のように、サンプル番号をサンプリング周波数で除算すれば、時刻に変換されることになる。サンプル数は、そのサンプル値がどの程度連続して続くかを示す情報である。なお、サンプル数の代わりに信号平坦部の終了時刻を記録するようにしても良い。サンプル値は、デジタル化された信号レベルを示している。ここでは、16ビットで量子化しているので、最大値は「32767」、最小値は「−32768」となる。すなわち、「0」は無音部、「32767」および「−32768」は飽和部を示している。ただし、信号平坦部を無条件には処理しない。ここでは、データの圧縮を目的としているため、サンプル列の削減分よりも信号平坦部データが大きくなると意味がないからである。したがって、信号平坦部となるサンプルが所定数以上連続する場合に限り信号平坦部データを作成して各チャンネルのサンプル列から分離するのである。なお、上記サンプル列の符号化で説明した上位信号平坦部データ作成のための信号平坦部処理も全く同様の手法で行われる。
【0047】
続いて、各サンプルに対して、元のサンプル値から予測誤差への変換処理を行う(ステップS1)。これは、上記ステップS1において説明した処理を実行することにより各サンプルの値を予測誤差に変換する。複数チャンネルある場合は、各チャンネルのサンプル列に対して処理を行う。
【0048】
(チャンネル間演算方式)
次に、予測誤差値が記録された各チャンネルの誤差サンプル列に対して、チャンネル間の差分演算を行う(ステップS22)。これは、同一時刻における誤差サンプル値の差分を単純にとることにより行われる。差分演算の結果は、一方のチャンネルの誤差サンプル列として与え、他方のチャンネルの誤差サンプル列の値は、元のままとしておく。具体的には、図12(c)に示すような2チャンネルのステレオ音響信号の場合Ch1にはL信号の値をそのまま記録しておき、Ch2にはR−Lの差分値を与える。一般に、ステレオ音響信号では、同一時刻におけるそれぞれのデータには相関があり、各時刻における両データの差分値は元の値に比べて小さな値となる。これは線形予測により予測符号化した場合も同じである。そのため、図12(d)の例では、Ch2における各誤差サンプルの値が小さくなり、後に圧縮できる余地が大きくなる。この後、ステップS2〜ステップS9のフレーム間演算処理、ステップS10のサンプル列の符号化処理を行うことになる。
【0049】
(復号)
次に、上記符号化装置により符号化された符号データの復号について説明する。図14は、本発明に係る時系列信号の復号装置の構成を示す機能ブロック図である。図14において、91はデータ読込手段、92はサンプル列復号手段、93はフレーム復元手段、94は独立サンプル復元手段である。図14に示す構成は、コンピュータおよびコンピュータに搭載される専用のソフトウェアプログラムにより実現される。
【0050】
続いて、図14に示した復号装置の処理動作について説明する。まず、図10に示したような符号データを記録した記録媒体を、データ読込手段91が読み込む。データ読込手段91は、サンプル列符号化データをサンプル列復号手段92に渡す。サンプル列復号手段92は、符号化の手法に合わせた復号を行う。ここでは、上記の例に対応した復号について説明する。まず、読み込んだサンプル列符号化データのうち、ルックアップテーブルを参照することにより、上位可変長サンプル列から、12ビット(値が「0」のものについては11ビット)固定長の上位固定長サンプル列を復元してゆく。この際、ルックアップテーブルが図7(a)もしくは図8に示したものである場合には、上位可変長サンプル列のビットデータを順番に読み込んで復元していけば問題ないが、図7(b)に示したようなルックアップテーブルである場合には、変換時に工夫が必要となる。この場合、セパレータビットが1ビット「0」であるため、「01」のビットパターンは本来禁止されるはずであるが、図7(b)に示すように、変換後ビット列には、「01」のビットパターンを含むものがある。そこで、本実施形態では、ビットパターンの書き込み順序を変更することで対応している。具体的には、図7(a)または図8の場合、常に1となる先頭ビットを最後に書き込むようにし、2ビット目から書き込むようにし、図7(b)の場合、1および2ビット目を最後に書き込むようにし、3ビット目から書き込むようにしている。例えば、順位4位のビット列「101」は「01」のビットパターンを含むが、このようなビット列の場合、まず3ビット目の「1」から読み込まれ、セパレータビットと第1ビットから構成される「01」パターンを認識して、2ビット目が最後に読まれることになるため、セパレータの誤認識が生じない。この場合、サンプル列復号手段92は「101」のビット列を認識し、ルックアップテーブルに従って元の固定長ビット列が復元できる。
【0051】
さらに、サンプル列復号手段92は読み込んだ上位信号平坦部データを上位固定長サンプル列の所定の位置に挿入していく。続いて、上位固定長サンプル列と下位固定長サンプル列を統合する。具体的には、上位固定長サンプル列から12ビットを抽出し、下位固定長サンプル列から4ビットを抽出して順次統合する処理を行う。続いて、正負の正負極性部1ビットと数値部15ビットで表現されたサンプル列を正負の数値をとる16ビットに変換する。
【0052】
続いて、フレーム復元手段93は、フレーム相関データを利用して相関フレームとの差分値で記録された対象フレームを復元する。フレーム相関データに記録されている全対象フレームについて処理を行ったら、独立サンプル復元手段94が、上記〔数式1〕の左辺の項と右辺第1項を交換した式に基づいて、元のサンプル値x(t)を順次復元してゆく。これにより、アナログ信号をPCM化した状態のデジタル音響信号がデータの欠落無く復元されることになる。
【0053】
【発明の効果】
以上、説明したように本発明によれば、時系列信号に対して線形予測を行い、各サンプルの値を予測誤差値に変換し、予測誤差値に変換されたサンプル列に対して、所定のフレーム長の複数のサンプルで構成されるフレーム単位に分割し、各フレームを対象フレームとして、対象フレームより時間的に過去に位置する所定数の比較フレームの中から最も対象フレームに類似する相関候補フレームを探索し、相関候補フレームのアドレスをフレーム長を超えない範囲でサンプル単位に移動させ、対象フレームと相関候補フレームが最も類似するアドレスを探索して相関フレームを決定し、対象フレームおよび相関フレームの各アドレスを関連付けて符号化すると共に、対象フレームと相関フレームとの差分を求め、対象フレームを相関フレームとの差分値に更新するようにし、更新された対象フレームを含む全サンプル列に対して符号化を行うようにしたので、同じような信号波形パターンが繰り返し現れるような時系列信号に対して、より効率の高い圧縮を行うことが可能となるという効果を奏する。
【図面の簡単な説明】
【図1】本発明に係る時系列信号の符号化装置の一実施形態を示す機能ブロック図である。
【図2】本発明に係る時系列信号の符号化方法の概要を示すフローチャートである。
【図3】予測誤差変換手段10による予測誤差算出処理の様子を示す図である。
【図4】フレーム化から相関フレーム決定までのフレームの様子を示す図である。
【図5】フレーム内のサンプルの様子を示す図である。
【図6】データ分離処理の様子を示す図である。
【図7】サンプル絶対値の種類が640未満の場合のルックアップテーブルの一例を示す図である。
【図8】サンプル絶対値の種類が640以上の場合のルックアップテーブルの一例を示す図である。
【図9】上位サンプルのビット長の変換を模式的に示す図である。
【図10】本発明に係る時系列信号の符号化方法もしくは符号化装置により得られる符号データを示す図である。
【図11】可視情報出力手段により出力された分析データの様子を示す図である。
【図12】信号平坦部処理およびチャンネル間演算処理の様子を示す図である。
【図13】本発明に好適な他の圧縮処理を組み合わせた場合の処理概要を示すフローチャートである。
【図14】本発明に係る時系列信号の復号装置の一実施形態を示す機能ブロック図である。
【符号の説明】
10・・・予測誤差変換手段
21・・・フレーム設定手段
22・・・相関候補フレーム探索手段
23・・・相関フレーム決定手段
24・・・フレーム相関符号化手段
25・・・フレーム更新手段
26・・・可視情報出力手段
30・・・サンプル列符号化手段
91・・・データ読込手段
92・・・サンプル列復号手段
93・・・フレーム復元手段
94・・・独立サンプル復元手段
Claims (7)
- 時系列のサンプル列で構成される時系列信号に対して、前記全てのサンプル列を再現できるように情報量を圧縮する符号化方法であって、
前記時系列信号に対して線形予測を行い、各サンプルの値を予測誤差値に変換する予測誤差変換段階と、
前記予測誤差値に変換されたサンプル列に対して、
所定のフレーム長の複数のサンプルで構成されるフレーム単位に分割するフレーム設定段階と、
前記各フレームを対象フレームとして、当該対象フレームより時間的に過去に位置する所定数の比較フレームの中から最も対象フレームに類似する相関候補フレームを探索する相関候補フレーム探索段階と、
前記相関候補フレームのアドレスを前記フレーム長を超えない範囲でサンプル単位に移動させ、前記対象フレームと前記相関候補フレームが最も類似するアドレスを探索して相関フレームを決定する相関フレーム決定段階と、
前記対象フレームおよび相関フレームの各アドレスを関連付けて符号化するフレーム相関符号化段階と、
前記対象フレームと相関フレームとの差分を求め、対象フレームを相関フレームとの差分値に更新するフレーム更新段階と、
前記フレーム更新段階で更新された対象フレームを含む全サンプル列に対して符号化を行うサンプル列符号化段階と、
を有することを特徴とする時系列信号の符号化方法。 - 時系列のサンプル列で構成される時系列信号に対して、前記全てのサンプル列を再現できるように情報量を圧縮する符号化装置であって、
前記時系列信号に対して線形予測を行い、各サンプルの値を予測誤差値に変換する予測誤差変換手段と、
前記予測誤差値に変換されたサンプル列に対して、
所定のフレーム長の複数のサンプルで構成されるフレーム単位に分割するフレーム設定手段と、
前記各フレームを対象フレームとして、当該対象フレームより時間的に過去に位置する所定数の比較フレームの中から最も対象フレームに類似する相関候補フレームを探索する相関候補フレーム探索手段と、
前記相関候補フレームのアドレスを前記フレーム長を超えない範囲でサンプル単位に移動させ、前記対象フレームと前記相関候補フレームが最も類似するアドレスを探索して相関フレームを決定する相関フレーム決定手段と、
前記対象フレームおよび相関フレームの各アドレスを関連付けて符号化するフレーム相関符号化手段と、
前記対象フレームと相関フレームとの差分を求め、対象フレームを相関フレームとの差分値に更新するフレーム更新手段と、
前記フレーム更新手段で更新された対象フレームを含む全サンプル列に対して符号化を行うサンプル列符号化手段と、
を有することを特徴とする時系列信号の符号化装置。 - 請求項2において、
前記サンプル列符号化手段は、前記サンプル列に対して可変ビット長で符号化を行うことを特徴とする時系列信号の符号化装置。 - 請求項2において、
前記相関候補フレーム探索手段は、時間的過去に位置するフレームと対象フレームとの対応するサンプル同士の差分を計算し、差分値の絶対値の総和が、少なくとも対象フレームの絶対値の総和より所定の割合で小さく、かつ前記差分値の絶対値の総和が最も小さくなるフレームを相関候補フレームとして選出するものであることを特徴とする時系列信号の符号化装置。 - 請求項2において、
前記相関フレーム決定手段は、前記アドレスを移動させた相関候補フレームと対象フレームとの対応するサンプル同士の差分を計算し、差分値の絶対値の総和が、少なくともアドレスを移動させる前の差分値の絶対値の総和より所定の割合で小さく、かつ前記差分値の絶対値の総和が最も小さくなるアドレスを相関フレームのアドレスとして決定するものであることを特徴とする時系列信号の符号化装置。 - 請求項2において、
前記フレーム相関符号化手段が、前記対象フレームおよび相関フレームの各アドレスを関連付けた情報をグラフィカルに表示する可視情報出力手段に出力することを特徴とする時系列信号の符号化装置。 - 与えられた時系列信号に対して、請求項2から請求項6のいずれかの時系列信号の符号化装置により出力された符号データを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003026308A JP4184817B2 (ja) | 2003-02-03 | 2003-02-03 | 時系列信号の符号化方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003026308A JP4184817B2 (ja) | 2003-02-03 | 2003-02-03 | 時系列信号の符号化方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004241839A JP2004241839A (ja) | 2004-08-26 |
JP4184817B2 true JP4184817B2 (ja) | 2008-11-19 |
Family
ID=32954359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003026308A Expired - Fee Related JP4184817B2 (ja) | 2003-02-03 | 2003-02-03 | 時系列信号の符号化方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4184817B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4888048B2 (ja) * | 2006-10-26 | 2012-02-29 | 日本電気株式会社 | オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム |
JP5994073B2 (ja) * | 2013-01-31 | 2016-09-21 | 株式会社アクセル | 音声信号圧縮装置及び音声信号圧縮方法 |
-
2003
- 2003-02-03 JP JP2003026308A patent/JP4184817B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004241839A (ja) | 2004-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4482237B2 (ja) | 無損失エンコーダにおけるサイド情報の効率的な符号化 | |
JP4022504B2 (ja) | 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置 | |
JP4357852B2 (ja) | 時系列信号の圧縮解析装置および変換装置 | |
JP4184817B2 (ja) | 時系列信号の符号化方法および装置 | |
JP4170795B2 (ja) | 時系列信号の符号化装置および記録媒体 | |
JP4109124B2 (ja) | 時系列信号の符号化装置 | |
JP2004198559A (ja) | 時系列信号の符号化方法および復号方法 | |
JP4139704B2 (ja) | 時系列信号の符号化装置および復号装置 | |
JP4736331B2 (ja) | 音響信号の再生装置 | |
JP4139697B2 (ja) | 時系列信号の符号化方法および装置 | |
JP4249540B2 (ja) | 時系列信号の符号化装置および記録媒体 | |
JP3889738B2 (ja) | 逆量子化装置、オーディオ復号化装置、画像復号化装置、逆量子化方法および逆量子化プログラム | |
JP2006211243A (ja) | ディジタル信号符号化装置,ディジタル信号符号化方法 | |
JP2004070120A (ja) | 時系列信号の符号化装置、復号装置および記録媒体 | |
JP4319895B2 (ja) | 時系列信号の符号化装置 | |
JP4539180B2 (ja) | 音響復号装置及び音響復号方法 | |
JP4438654B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP2005166216A (ja) | 音響信号の再生装置 | |
JP2006195066A (ja) | 符号化オーディオ信号の再生装置及び再生方法 | |
JP2005210584A (ja) | データファイルの符号化方法 | |
JP3354136B2 (ja) | 音声符号化方法、音声信号受信方法及び音声復号方法 | |
JP4244222B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP2005215162A (ja) | 音響信号の再生装置 | |
JP4348324B2 (ja) | 信号の符号化装置、方法、プログラム、および記録媒体 | |
JP2001175295A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060123 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080902 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080904 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4184817 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130912 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |