JP4838774B2 - マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 - Google Patents
マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP4838774B2 JP4838774B2 JP2007187684A JP2007187684A JP4838774B2 JP 4838774 B2 JP4838774 B2 JP 4838774B2 JP 2007187684 A JP2007187684 A JP 2007187684A JP 2007187684 A JP2007187684 A JP 2007187684A JP 4838774 B2 JP4838774 B2 JP 4838774B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- channel
- coefficient
- order
- code amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
(符号語長)=(モデルの記述長)+(そのモデルによるデータの記述長) (1)
となる。ロスレス符号化で使われる言葉で言い換えると、
(ロスレスで復号するために必要な符号量)=(PARCOR係数に必要な符号量)+(予測残差に必要な符号量) (2)
となる。図1に模式的に示すように、PARCOR係数に必要な符号量は直線1Aで示すように予測次数に比例して増加する。1フレームあたりのサンプル数をNとすると、1フレームあたりの信号のエネルギーはΣn=1 Nxn 2で表され、それをNで割り算して得られる1サンプルあたりのエネルギー
図2の線形予測符号化装置の右チャネル符号化構成は、右チャネル入力信号xR(n)を線形予測分析してPARCOR係数KRを出力する線形予測分析部11Rと、PARCOR係数KRを量子化して量子化済PARCOR係数K’Rを出力する量子化部12Rと、量子化済PARCOR係数K'Rを線形予測係数a’Rに逆変換する逆変換部13Rと、線形予測係数a'Rを使って入力信号xR(n)を線形予測フィルタ処理して予測残差eR(n)を出力する線形予測フィルタ14Rと、量子化済PARCOR係数K’Rを符号化して係数符号Ck Rを出力する係数符号化部21Rと、予測残差eR(n)を符号化して残差符号Ce Rを出力する残差符号化部22Rと、係数符号Ck Rと残差符号Ce Rとを合成して合成符号Cg Rを出力する符号合成部23Rとから構成されている。
図2では各チャネルで閉じた(独立した)線形予測分析を行なっており、したがって右チャネルについてのみ説明する。
線形予測分析部11Rにおいては、入力信号xR(n)をフレーム毎に線形予測分析するが、その線形予測分析の最適予測次数P0の決定方法を図3を参照して説明する。
Step20:予め決めた最小予測次数Pminから最大予測次数Pmaxまでの各予測次数の場合の(量子化済)PARCOR係数を符号化して係数符号量を求める。
Step30:最小予測次数Pminから最大予測次数Pmaxまでの各予測次数の場合の予測残差符号量を求める。
Step50:決定された最適予測次数P0のときの線形予測係数を最適な予測係数として出力する。
尾崎統、北川源四郎、"時系列解析の方法"、朝倉書店、pp.82-92 "情報源符号化=無歪データ圧縮"、培風館、pp.114-115 "チャネル間相関を用いた多チャネル信号の可逆圧縮符号化"、情報処理学会論文誌、Vol.46, No. 5, pp.1118-1128.
この発明の目的は、マルチチャネル線形予測符号化において、演算処理量が少なく、かつより正確な予測係数を決定できる予測係数決定方法及び装置を提供することである。
該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とすることを特徴とする。
この発明の第2の観点によれば、マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法は、
(a) 該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の残差符号量または推定符号量と、を求めるステップと、
(b) 上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を第2の最適予測次数と決定するステップと、
(c) 上記ステップ(a) で求めた予測係数のうち、上記第2の最適予測次数に対応する線形予測係数を最適予測係数とするステップ、
とを含むことを特徴とする。
該チャネル以外のチャネルについて得られた最適予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とすることを特徴とする。
この発明の第4の観点によれば、マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法は、
(a) 該チャネル以外のチャネルについて得られた最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の符号量または推定符号量と、を求めるステップと、
(b) 上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を該チャネルの最適予測次数と決定するステップと、
(c) 上記ステップ(a) で求めた予測係数のうち、該チャネルの最適予測次数に対応する線形予測係数を最適予測係数とするステップ、
とを含むことを特徴とする。
Step400:他チャネルについて求めた最適予測次数P0、または、自チャネルについて下記のStep510とは別の方法で求めた最適予測次数P0、を厳密な手法による最適次数探索の初期値P0とする。
Step510:予め設定した探索範囲P0−ΔPv〜P0+ΔPvの各予測次数について共分散法又は数値計算法などの厳密な手法により線形予測係数を算出する。ここで、ΔPvは例えば0≦ΔPv<(Pmin+Pmax)/2の範囲の予め決めた整数である。また、予め設定した探索範囲は最適次数探索の初期値P0を中心とする範囲を対称とせず、例えばP0−ΔPb〜P0+ΔPtというように非対称な範囲としてもよい。ここで、ΔPb及びΔPtは、0≦ΔPb≦P0−Pmin、0≦ΔPt≦Pmax−P0、ΔPb≠ΔPtの範囲で予め決めた整数である。
Step530:上記探索範囲の各予測次数での残差符号量を求める。ここで、残差符号量は実際に予測残差を符号化して求めた符号量でなくても、例えば、予測残差のパワーや絶対値和などから推定した推定残差符号量を残差符号量として用いてもよい。
Step550:最適予測次数Pvのときの線形予測係数を最適な予測係数と決定する。
いま、あるチャネルの最適な予測次数での予測係数と予測残差を図4のStep510〜Step550で共分散法や数値計算法のような厳密な手法に基づく線形予測分析(以下、厳密法と呼ぶ)により決める場合、そのチャネルを自チャネルとすると、Step400における予測次数P0は自チャネルについて得たものでもよいし、他チャネルについて求めたものでもよい。また、予測次数P0の求め方は、Levinson-Durbin法やBurg法のように、低次から順次次数を増加させながら、順次増加させた次数分のみのPARCOR係数または線形予測係数を求める逐次的方法(以下、逐次法と呼ぶ)でもよいし、共分散法や数値計算法のように、予測次数ごとに全次の線形予測係数またはPARCOR係数を求める厳密法でもよい。
ステップ410A:Levinson-Durbin法又はBurg法のような逐次法により最大予測次数PmaxまでのPARCOR係数を算出する。
Step420A:予め決めた範囲Pmin〜Pmaxの各予測次数の場合のPARCOR係数の係数符号量を求める。
Step430A:範囲Pmin〜Pmaxの各予測次数の場合の残差符号量を求める。
Step440A:係数符号量と残差符号量の合計が最小となる予測次数を最適予測次数探索の初期値P0とする。
Step410B:共分散法又は数値計算法のような厳密な手法により予め決めた範囲Pmin〜Pmaxの各予測次数の場合の線形予測係数を求め、PARCOR係数に変換する。
Step420B:範囲Pmin〜Pmaxの各予測次数の場合の係数符号量を求める。
Step430B:範囲Pmin〜Pmaxの各予測次数の場合の残差符号量を求める。
Step440B:係数符号量と残差符号量の合計が最小となる予測次数を最適予測次数探索の初期値P0とする。
(b) A:他チャネルで逐次法; B:自チャネルで相関厳密法
(c) A:他チャネルで単独厳密法; B:自チャネルで単独厳密法
(d) A:他チャネルで単独厳密法; B:自チャネルで相関厳密法
(e) A:他チャネルで相関厳密法; B:自チャネルで単独厳密法
(f) A:他チャネルで相関厳密法; B:自チャネルで相関厳密法
(g) A:自チャネルで逐次法; B:自チャネルで単独厳密法
(h) A:自チャネルで逐次法; B:自チャネルで相関厳密法
(i) A:自チャネルで単独厳密法; B:自チャネルで相関厳密法
上記組み合わせのいずれの場合でも、Step510〜Step540を実施する代わりに初期値P0をそのまま最適次数Pvとして、最適次数Pvについて自チャネルで単独又は相関厳密法により予測係数を決定してもよい。これは、ΔPv=0とおいてStep510〜Step540を実施することに対応する。
残差符号量を推定する方法としては、例えば各予測次数で得られた線形予測係数をPARCOR係数に変換し、PARCOR係数を使って求まる予測残差のエネルギーから符号量を推定する方法がある。例えば、入力信号x(n)の1フレームあたりのエネルギーE(0)は
E(1)=E(0){1−k(1)2} (6)
となる。2次の線形予測を行ったときの予測残差のエネルギーE(2)は、
E(2)=E(1){1−k(2)2} (7)
となる。これをPmaxまで繰り返すと、Pmax次の線形予測を行ったときの予測残差のエネルギーE(Pmax)は、
図4に示した方法を2チャネル線形予測符号化装置に適用した例を図6に示す。
例えばコンパクトディスク(CD)のオーディオ2チャネル信号(ステレオ信号)の左右チャネル信号間には比較的大きな相互相関があることが知られている。このことから、一方のチャネルにおいて線形予測分析に最適な予測次数は他方のチャネルにおける線形予測分析に最適な予測次数に近いことが推定される。図6の実施例では、このような2チャネルの線形予測符号化装置にこの発明を適用することにより演算処理量を減らす場合を示す。
右チャネルの符号化構成と左チャネルの符号化構成は図2の符号化構成と同様である。図6の装置で特徴的なことは、一方のチャネル、ここでは右チャネルの線形予測分析部で結果で得られた最適予測次数P0が他方のチャネルの線形予測分析に利用されるよう構成されていることである。図4で説明した組み合わせ(a) 又は(c) に対応する。
線形予測分析部11Rは、与えられた右チャネル入力信号xR(n)(n=1, 2, …, N、Nは各フレームのサンプル数)に対しフレーム毎に予め決めた第1の範囲の各予測次数で例えば図5Aで説明したLevinson-Durbin法やBurg法のような逐次法、あるいは図5Bで説明した共分散法や数値計算法のような厳密な手法により線形予測分析を行なって残差符号量と係数符号量の和が最小となる予測次数を最適予測次数P0と決め、その予測次数に対応する予測係数をPARCOR係数KR={kR(1), kR(2), …, kR(P0)}として出力する。即ち、予測係数を線形予測係数aR={αR(1), αR(2), …, αR(P0)}として求めた場合は、これらをPARCOR係数KR={kR(1), kR(2), …, kR(P0)}に変換する。量子化部12RはPARCOR係数KRを量子化し、量子化済PARCOR係数K'R={k'R(1), k'R(2), …, k'R(P0)}を出力する。逆変換部13Rは量子化済PARCOR係数K'Rを線形予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}に変換する。線形予測フィルタ14Rは線形予測係数a'Rを使って入力信号xR(n)を線形予測フィルタ処理し、予測残差eR(n)を出力する。線形予測分析部11R、量子化部12R、逆変換部13R、線形予測フィルタ14Rは線形予測分析手段10Rを構成している。
左チャネル側符号化構成においては、線形予測分析部31Lは線形予測部11Rから予測次数P0が探索初期値として与えられ、P0を含む第1の範囲より狭い第2の範囲の各予測次数で入力信号xL(n)に対し例えば共分散法または数値計算法のような厳密な手法で線形予測分析を行ない、残差符号量と係数符号量を求める。これらの符号量の合計がもっとも小さい予測次数を最適予測次数Pvと決定し、そのときの線形予測係数をPARCOR係数KL={kL(1), kL(2), …, kL(Pv)}に変換して出力する。
係数符号化部21Lは最適予測次数Pvと量子化済PARCOR係数K'Lを符号化し、係数符号Ck Lを出力する。残差符号化部22Lは、予測残差eL(n)を例えばエントロピー符号化し、残差符号Ce Lを出力する。符号合成部23Lは、係数符号Ck Lと残差符号Ce Lを合成し、Lチャネル符号Cg Lとして出力する。係数符号化部21L、残差符号化部22L、符号合成部23Lは符号化手段20Lを構成している。
この例では図6における左チャネル信号xL(n)と、右チャネルの線形予測分析部11Rにおいて図4のStep400を実行することにより得られた最適次数探索初期値P0とが与えられ、Step510を実行して各予測次数の場合の線形予測係数を求める。係数符号量算出部520と残差符号量算出部530はそれぞれ図4のStep520とStep530を実行して各予測次数の場合の係数符号量と残差符号量を求める。最適次数探索部540は図4のStep540を実行して係数符号量と残差符号量の合計が最小となるときの予測次数を最適予測次数Pvと決定する。最適係数決定部550は、図4のStep550を行なって最適予測次数Pvが決定されたときの線形予測係数を最適な予測係数として出力する。
以上の説明のように、マルチチャネル信号符号化にこの発明を適用する場合、あるチャネルにおける線形予測分析のための最適予測次数探索の初期値予測次数P0としては、他のチャネルの線形予測分析部において求めた最適予測次数を使用してもよい。
チャネル間相関を利用した符号化
マルチチャネル信号の圧縮符号化では、非特許文献3に示されているように、所望の1つのチャネルを親チャネルとし、他を子チャネルとし、それぞれのチャネルごとに独立に線形予測分析を行って予測残差の基準値(エネルギーなど)を最小化するように、例えばLevinson-Durbin法などにより線形予測分析が行なわれ、分析により得られた線形予測係数a={α(1), α(2), …, α(P)}, α(0)=1を用いたフィルタを通して得られる親チャネルの予測残差に対して各子チャネルの予測残差を重み付き減算処理して残差差分を求め、親チャネルについてはその予測係数と予測残差を符号化し、各子チャネルについてはその予測係数と残差差分を符号化している。
このようにチャネル間の相互相関を考慮した式(9)を最小化する線形予測係数を求めるため、式(9)を線形予測係数で偏微分して0とおいた式を解くことにより線形予測係数を求める変形された共分散法(以降、変形共分散法と呼ぶ)は、参考文献1に示されている。以下のマルチチャネル信号符号化装置の実施例においても、相互相関を利用した線形予測分析部においてこの手法を使うものとする。
あるフレーム(Nサンプル)のRチャネルの信号をxR(n)(n=1, 2, …, N)、Lチャネルの信号をxL(n)(n=1, 2, …, N)とする。ここでは、Rチャネルを親チャネル、Lチャネルを子チャネルとする。
線形予測分析部11Rは入力された親チャネル信号xR(n)から図5A又は5Bで説明した方法により最適予測次数P0を決定し、その予測次数でのPARCOR係数KR={kR(1), kR(2), …, kR(P0)}を得る。また、その最適予測次数P0を探索初期値としてチャネル間相関を利用した線形予測分析部54Mに与える。量子化部12Rは入力されたPARCOR係数KR={kR(1), kR(2), …, kR(P0)}を量子化し、量子化済PARCOR係数K'R={k'R(1), k'R(2), …, k'R(P0)}を出力する。逆変換部13Rは入力された量子化済PARCOR係数K'R={kR(1), k'R(2), …, k'R(P0)}を量子化済予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}に逆変換する。線形予測フィルタ14Rは量子化済予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}をフィルタ係数として、入力された親チャネル原信号xR(n)を次式でフィルタリングし予測残差eR(n)を得る。ただしα'R(0)=1とする。
チャネル間相関を利用した線形予測分析部54Mは、与えられた最適予測次数の初期値P0の周辺(P0±ΔPvの範囲)の各予測次数Ph(h=−ΔPv, …, +ΔPv)について以下のStep1〜Step4を行う。
Step1:入力された子チャネル信号xL(n)と、線形予測フィルタ14Rからの親チャネル予測残差eR(n)とを使ってチャネル間の相互相関を考慮した変形共分散法により相互相関を考慮した線形予測係数aM={αM(1), αM(2), …, αM(Ph)}を求める。
Step2:線形予測係数aMをPARCOR係数に変換し、係数符号量を求める。
Step3:親チャネル予測残差eR(n)と相関を考慮した子チャネル予測残差eM(n)とから変形共分散法により残差差分信号e'M(n)=eR(n)−γeM(n)を推定し、その符号量を残差符号量として求める。
Step4:Step2とStep3で得た係数符号量と残差符号量の合計符号量を求める。
変換部55Mは線形予測係数aM={αM(1), αM(2), …, αM(Pv)}をPARCOR係数KM={kM(1), kM(2), …, kM(Pv)}に変換する。量子化部56Mは入力されたPARCOR係数KMを量子化し、量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を出力する。逆変換部57Mは入力された量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を量子化済予測係数a'M={α'M(1), α'M(2), …, α'M(Pv)}に逆変換する。線形予測フィルタ58Mは量子化済予測係数a'M={α'M(1), α'M(2), …, α'M(Pv)}をフィルタ係数として、入力された子チャネル信号xL(n)を以下の式でフィルタリングし予測残差eM(n)を得る。ただしα'M(0)=1とする。
残差符号化部61Mは残差差分信号e'M(n)を符号化し残差符号Ce Mを出力する。係数符号化部64Mは最適予測次数Pvと量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を符号化し係数符号Ck Mを出力する。重み符号化部62Mは量子化済重み係数γ'を符号化し重み符号Cw Mを出力する。符号合成部63Mは残差符号Ce Mと重み符号Cw Mと係数符号Ck Mを合成し、子チャネル合成符号Cg Mを出力する。残差符号化部61M、重み符号化部62M、符号合成部63M、係数符号化部64Mは符号化手段60を構成している。
この実施例ではチャネル間相関を利用した線形予測分析ぶ54Mがこの発明の予測係数決定装置を実現している。
図8の実施例において、子チャネルについては、図7のように通常の線形予測分析を行なって求めた係数符号Ck Lと残差符号Ce Lとを合成して得た符号Cg Lと、図8の実施例で求めたチャネル間相関を考慮した合成符号Cg Mの符号量を比較し、少ないほうを子チャネル符号として出力してもよい。その実施例を図9に示す。この実施例は図8の実施例に対し線形予測分析部11L、量子化部12L、逆変換部13L、線形予測フィルタ14L、係数符号化部21L、残差符号化部22L、符号合成部23L、符号量比較部71が追加されている。
線形予測分析部11Lは入力された子チャネル信号xL(n)を従来の線形予測分析方法(Levinson-Durbin法又はBurg法のような逐次法、または、共分散法や数値計算法などの厳密法など)により線形予測分析し、残差符号量と係数符号量の和が最小となる予測次数を最適予測次数P0として求め、最適予測次数に対応する予測係数をPARCOR係数KL={kL(1), kL(2), …, kL(P0)}として出力する。量子化部12Lは入力されたPARCOR係数KL={kL(1), kL(2), …, kL(P0)}を量子化し、量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(P0)}を出力する。逆変換部13Lは入力された量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(P0)}を量子化済予測係数a'L={α'L(1), α'L(2), …, α'L(P0)}に逆変換する。線形予測フィルタ14Lは量子化済予測係数a'L={α'L(1), α'L(2), …, α'L(P0)}をフィルタ係数として、入力された子チャネル信号xL(n)を以下の式でフィルタリングし予測残差eL(n)を得る。ただしα'L(0)=1とする。
この実施例では、子チャネルの線形予測分析部11Lにおいて図5A又は5Bの方法により求めた最適予測次数P0がチャネル間相関を利用した線形予測分析部54Mに与えられる。チャネル間相関を利用した線形予測分析部54Mは、与えられた予測次数P0を初期値とし、図8で説明したと同様の手法でP0±ΔPvの範囲で各予測次数について前述の変形共分散法により線形予測係数を求め、残差差分の符号量と係数符号量の合計が最小となる予測次数Pvを最適予測次数と決め、そのときの線形予測係数を変換部55Mに与える。この線形予測係数に基づく量子化済線形予測係数を使って線形予測フィルタ58Mにより子チャネルのチャネル間相関を考慮した予測残差eM(n)を生成し、重み計算部51及び重み付き減算処理部53に与える。
この実施例ではチャネル間相関を利用した線形予測分析部54Mがこの発明の予測係数決定装置を実現している。
この実施例によれば、減算処理を行わないほうが符号量が少ない場合には、通常の線形予測分析の結果を用いることになるので、従来法と比べて圧縮率が悪化することは常にない。
Step1:入力信号x(n)を用いて予測次数Pvi=P0の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={Pvi, kvi(1), kvi(2), …, kvi(Pvi)}に変換し、係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
Step2:入力信号x(n)を用いて予測次数Pv=P0−1の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={Pvi, kvi(1), kvi(2), …, kvi(Pvi)}に変換し、係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
Step3:入力信号x(n)を用いて予測次数Pvi=P0+1の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={ kvi(1), kvi(2), …, kvi(Pvi)}に変換し、予測次数Pviの符号量を含む係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
線形予測分析部11Vは、最適予測次数とPARCOR係数Kv={ kv(1), kv(2), …, kv(Pv)}を出力する。量子化部12VはPARCOR係数Kvを量子化し、量子化済PARCOR係数K'v={ k'(1), k'(2), …, k'(Pv)}を出力する。逆変換部13Vは量子化済PARCOR係数K'vを線形予測係数a'v={α'v(1), α'v(2), …, α'(Pv)}に変換して出力する。線形予測フィルタ14Vは線形予測係数a'vをフィルタ係数として、入力された信号x(n)(n=1, 2, …, N)をPv次の線形予測フィルタ処理し、予測残差
図12は、図11の変形実施例である。入力信号x(n)から符号化構成部11〜14,21〜23により合成符号Caを出力するまでは図11と同様にLevinson-Durbin法やBurg法などにより最適予測次数P0が決定され、そのときの予測次数に基づいてPARCOR係数及び予測残差の符号化が行なわれ、符号合成部23で合成される。図11では線形予測分析部11Vは入力信号x(n)から各予測次数ごとに共分散法に基づく線形予測分析により係数符号量及び残差符号量を推定して合計符号量が最小となる予測次数を決定した。しかし、図12では、線形予測分析部11Vは各予測次数Pvi=P0-ΔPv,P0−ΔPv+1, …, P0, …, P0+ΔPv−1, P0+ΔPvごとに共分散法に基づく線形予測分析により線形予測係数を求め、PARCOR係数に変換して出力し、以下、そのPARCOR係数から量子化部12V、逆変換部13V,線形予測フィルタ14V、係数符号化部21V、残差符号化部22V、符号合成部23Vにより実際に係数符号及び残差符号を求め、合成符号を生成し、線形予測分析部11Vに与える。線形予測分析部11Vは各予測次数Pvに対する合成符号の符号量を比較し、最小符号量となる予測次数を決定する。
Step1:線形予測分析部11Vでは、入力信号x(n)を用いて予測次数Pviの共分散法又は数値計算法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を変換したPARCOR係数Kvi={ kvi(1), kvi(2), …, kvi(Pvi)}を出力する。
Step2:量子化部12VはPARCOR係数Kviを量子化し、量子化済PARCOR係数K'vi={ k'vi(1), k'vi(2), …, k'vi(Pvi)}を出力する。
Step3:逆量子化部13Vは量子化済PARCOR係数K'viを線形予測係数a'vi={α'vi(1), α'vi(2), …, α'vi(Pvi)}に変換して出力する。
Step4:線形予測フィルタ14Vは線形予測係数a'vi={α'vi(1), α'vi(2), …, α'vi(Pvi)}をフィルタ係数として、入力信号x(n)(n=1, 2, …, N)を次式でPvi次の線形予測フィルタ処理を行い、予測残差evi(n)を得る。
Step6:係数符号化部21Vは予測次数Pviと量子化済PARCOR係数K'vi={ k'vi(1), k'vi(2), …, k'vi(Pvi)}を符号化し、係数符号Ckviを出力する。
Step7:符号合成部23Vは残差符号Ceviと係数符号Ckviを合成し、合成符号Cgviを線形予測分析部11Vに与える。
上記Step1〜Step7が−ΔPv〜+ΔPv の範囲のiについてすべて実行され、それによって線形予測分析部11Vは各予測次数Pvi=P0+iに対する合成符号の符号量を得て、それらの中で最小の符号量に対応する予測次数を最適予測次数と決定し、符号合成部24Vはその最適予測次数に対応する合成符号Cgvを符号量比較部24に出力する。符号量比較部24は符号合成部23及び23Vからの合成符号Cgx及びCgvの符号量を比較し、小さいほうを合成符号Cgとして出力する。
予測次数Pvの探索範囲が広くなれば、圧縮率は向上するが、処理量が増えるため処速度が低下するので、図10の結果を参考にすれば、予測次数P0の周辺5次程度で探索すれば十分な性能が得られる。図12の装置も単独チャネルの符号化装置として使用してもよい。
前述の図7及び8のマルチチャネル線形予測符号化においては、1つのチャネルでの線形予測分析で決めた最適予測次数P0を他の1つのチャネルの線形予測分析における最適予測次数探索の初期値として利用する場合を示した。脳磁場計測(MEG)信号やマイクロホンアレー信号などのようなマルチチャネル信号(Mチャネル、Mは3以上の整数)において、Hチャネル(Hは2以上M未満の整数)の最適次数の平均値や中央値(即ち、統計的な代表値)を初期値として、残りのM−Hチャネルの最適係数をそれぞれ求めてもよい。M−Hチャネルのうちの1つのチャネルにおけるその処理手順を図13に示す。
Step450:複数の他チャネルについて求めた最適予測次数の平均値又は中央値などを厳密法による最適予測次数探索の初期値P0とする。
Step510:厳密法によりP0−ΔPv〜P0+ΔPvの範囲の各予測次数の場合の線形予測係数を算出する。
Step520:上記範囲の各予測次数の場合の係数符号量を求める。
Step530:上記範囲の各予測次数の場合の残差符号量を求める。
Step540:係数符号量と残差符号量の合計が最小となる予測次数を最適予測次数Pvとする。
Step550:最適予測次数Pvのときの線形予測係数を最適な予測係数とする。
例えば、512チャネルのMEG信号(M=512)であれば、その10分の1程度の50チャネルをHとし、残りの462チャネルのそれぞれについて上記処理を実行する。
上記応用例1において、探索範囲を決めるΔPvの値は例えば標準偏差などの統計量に基づいて決めることができる。その場合の処理手順を図14に示す。
Step460:複数の他チャネルについて求めた最適予測次数の平均値又は中央値などを厳密法による最適予測次数探索の初期値P0とする。
Step470:複数の他のチャネルについて求めた最適予測次数の標準偏差に最も近い整数値(切り上げ、切り捨て、四捨五入など)をΔPvとする。ただし、P0-ΔPvが予め定められた下限Pmin(例えば0)を下回った場合は、ΔPb=P0-Pminとし(つまり次数が負にならないようにする)、同様にP0+ΔPvが予め定められた上限Pmaxを上回った場合は、ΔPt=P0+Pmaxとし、探索範囲をP0-ΔPb〜P0+ΔPv、P0-ΔPv〜P0+ΔPt、P0-ΔPb〜P0+ΔPt、というように非対称に変形することもある。また、標準偏差に限らず他の統計量を用いてもよい。例えば統計的分布が左右対称でない場合は、3次統計量などを利用して、P0-ΔPb〜P0+ΔPtというような非対称の探索範囲としてもよい。ここで、ΔPbとΔPtは同じ値になることも、異なる値となることもありえる。
以降のStep510〜Step550は図13の場合と同様なので説明を省略する。
ここで、Step460において平均値や中央値などを求める対象のチャネルやチャネル数と、Step470において標準偏差を求める対象のチャネルやチャネル数とは同じとするのが通常であるが、必ずしも同じである必要はなく、異なってもよい。
Claims (22)
- マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法であり、
予測係数決定手段が、該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とする
ことを特徴とする予測係数決定方法。 - マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法であり、
(a) 線形予測分析手段が、該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の残差符号量または推定符号量と、を求めるステップと、
(b) 最適次数探索手段が、上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を第2の最適予測次数と決定するステップと、
(c) 最適係数決定手段が、上記ステップ(a) で求めた予測係数のうち、上記第2の最適予測次数に対応する線形予測係数を最適予測係数とするステップ、
とを含むことを特徴とする予測係数決定方法。 - マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法であり、
予測係数決定手段が、該チャネル以外のチャネルについて得られた最適予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とする
ことを特徴とする予測係数決定方法。 - マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法であり、
(a) 線形予測分析手段が、該チャネル以外のチャネルについて得られた最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の符号量または推定符号量と、を求めるステップと、
(b) 最適次数探索手段が、上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を該チャネルの最適予測次数と決定するステップと、
(c) 最適係数決定手段が、上記ステップ(a) で求めた予測係数のうち、該チャネルの最適予測次数に対応する線形予測係数を最適予測係数とするステップ、
とを含むことを特徴とする予測係数決定方法。 - 請求項3記載の予測係数決定方法において、
最適予測係数を決定する対象以外の複数個のチャネルの最適予測次数の統計的な代表値を上記該チャネル以外のチャネルについて得られた最適予測次数とする
ことを特徴とする予測係数決定方法。 - 請求項4記載の予測係数決定方法において、
最適予測係数を決定する対象以外の複数個のチャネルの最適予測次数の統計的な代表値を上記該チャネル以外のチャネルについて得られた最適予測次数とする
ことを特徴とする予測係数決定方法。 - 請求項4または6記載の予測係数決定方法において、
最適予測係数を決定する対象以外の複数個のチャネルについて求めた最適予測次数の統計的分布に基づく値をΔPb及びΔPt、上記該チャネル以外のチャネルについて得られた最適予測次数をP0としたとき、上記予め決めた範囲の代わりにP0−ΔPbからP0+ΔPtまでの範囲を用いることを特徴とする予測係数決定方法。 - 請求項7記載の予測係数決定方法において、上記ΔPb及びΔPtは上記複数個のチャネルについて得られた最適予測次数の標準偏差に最も近い整数であることを特徴とする予測係数決定方法。
- 請求項7又は8記載の予測係数決定方法において、上記P0-ΔPbが予め設定した下限値を下回る場合は、上記予め設定した下限値を上記P0-ΔPbの代わりに範囲の下限として用い、及び/又は上記P0+ΔPtが予め設定した上限値を上回る場合は、上記予め設定した上限値を上記P0+ΔPtの代わりに範囲の上限値として用いることを特徴とする予測係数決定方法。
- 請求項1または2記載の予測係数決定方法において、
上記第1の線形予測分析は、低次から順次次数を増加させながら、順次増加させた次数分のみの線形予測係数を求める分析手順である
ことを特徴とする予測係数決定方法。 - 請求項1乃至4の何れか記載の予測係数決定方法において、
上記第1の線形予測分析は、該チャネルの線形予測残差が最小となる基準で線形予測係数を求める分析手順であり、
上記全次の線形予測係数を求める分析は、予測次数毎に全次の線形予測係数を該チャネルの線形予測残差と他チャネルの線形予測残差との重み付き差分が最小となる基準で決める分家器手順である
ことを特徴とする予測係数決定方法。 - マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する装置であり、
該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とする手段、
を含むことを特徴とする予測係数決定装置。 - マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する装置であり、
該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の残差符号量または推定符号量と、を求める手段と、
上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を第2の最適予測次数と決定する手段と、
上記厳密な線形予測分析により求めた予測係数のうち、上記第2の最適予測次数に対応する線形予測係数を最適予測係数とする手段、
とを含むことを特徴とする予測係数決定装置。 - マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する装置であり、
該チャネル以外のチャネルについて得られた最適予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とする手段、
を含むことを特徴とする予測係数決定装置。 - マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する装置であり、
該チャネル以外のチャネルについて得られた第1の最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の符号量または推定符号量とを求める手段と、
上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を該チャネルの最適予測次数と決定する手段と、
上記全次の線形予測係数を求める分析により求めた予測係数のうち、該チャネルの最適予測次数に対応する線形予測係数を最適予測係数とする手段、
とを含むことを特徴とする予測係数決定装置。 - 請求項14記載の予測係数決定装置において、
最適予測係数を決定する対象以外の複数個のチャネルの最適予測次数の統計的な代表値を上記外チャネル以外のチャネルについて得られた最適予測次数とする
ことを特徴とする予測係数決定装置。 - 請求項15記載の予測係数決定装置において、
最適予測係数を決定する対象以外の複数個のチャネルの最適予測次数の統計的な代表値を上記外チャネル以外のチャネルについて得られた最適予測次数とする
ことを特徴とする予測係数決定装置。 - 請求項15または17記載の予測係数決定装置において、
最適予測係数を決定する対象以外の複数個のチャネルについて求めた最適予測次数の統計的分布に基づく値をΔPb及びΔPt、上記該チャネル以外のチャネルについて得られた最適予測次数をP0としたとき、上記予め決めた範囲の代わりにP0−ΔPbからP0+ΔPtまでの範囲を用いることを特徴とする予測係数決定装置。 - 請求項18記載の予測係数決定装置において、上記ΔPb及びΔPtは上記複数個のチャネルについて得られた最適予測次数の標準偏差に最も近い整数であることを特徴とする予測係数決定装置。
- 請求項18又は19記載の予測係数決定装置において、上記P0-ΔPbが予め設定した下限値を下回る場合は、上記予め設定した下限値を上記P0-ΔPbの代わりに範囲の下限として用い、及び/又は上記P0+ΔPtが予め設定した上限値を上回る場合は、上記予め設定した上限値を上記P0+ΔPtの代わりに範囲の上限値として用いることを特徴とする予測係数決定装置。
- コンピュータを請求項12乃至20のいずれか記載の予測係数決定装置として機能させるためのプログラム。
- コンピュータを請求項12乃至20の何れか記載の予測係数決定装置として機能させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007187684A JP4838774B2 (ja) | 2007-07-18 | 2007-07-18 | マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007187684A JP4838774B2 (ja) | 2007-07-18 | 2007-07-18 | マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009025497A JP2009025497A (ja) | 2009-02-05 |
JP4838774B2 true JP4838774B2 (ja) | 2011-12-14 |
Family
ID=40397364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007187684A Active JP4838774B2 (ja) | 2007-07-18 | 2007-07-18 | マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4838774B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4848049B2 (ja) * | 2008-12-09 | 2011-12-28 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
JP4918108B2 (ja) * | 2009-02-18 | 2012-04-18 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
JP5866575B1 (ja) * | 2014-10-31 | 2016-02-17 | 株式会社アクセル | 音声信号の線形予測装置、音声信号の線形予測方法 |
JP5891500B1 (ja) * | 2014-12-11 | 2016-03-23 | 株式会社アクセル | 音声信号の線形予測装置、音声信号の線形予測方法 |
JP5891502B1 (ja) * | 2014-12-11 | 2016-03-23 | 株式会社アクセル | 音声信号の線形予測装置、音声信号の線形予測方法 |
JP5891501B1 (ja) * | 2014-12-11 | 2016-03-23 | 株式会社アクセル | 音声信号の線形予測装置、音声信号の線形予測方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2560785B2 (ja) * | 1988-05-31 | 1996-12-04 | 沖電気工業株式会社 | 自己回帰モデル自動次数決定方法 |
JP2625998B2 (ja) * | 1988-12-09 | 1997-07-02 | 沖電気工業株式会社 | 特徴抽出方式 |
JP2000020099A (ja) * | 1998-06-26 | 2000-01-21 | Oki Electric Ind Co Ltd | 線形予測分析器,コード励振線形予測符号器及びコード励振線形予測復号器 |
JP4634969B2 (ja) * | 2006-05-29 | 2011-02-16 | 日本電信電話株式会社 | 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 |
-
2007
- 2007-07-18 JP JP2007187684A patent/JP4838774B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009025497A (ja) | 2009-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5975243B2 (ja) | 符号化装置および方法、並びにプログラム | |
AU2010249173B2 (en) | Complex-transform channel coding with extended-band frequency coding | |
RU2369917C2 (ru) | Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования | |
US11532315B2 (en) | Linear prediction analysis device, method, program, and storage medium | |
US20090204397A1 (en) | Linear predictive coding of an audio signal | |
JP4838774B2 (ja) | マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 | |
JP5340261B2 (ja) | ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 | |
KR20110020846A (ko) | 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 | |
US9548056B2 (en) | Signal adaptive FIR/IIR predictors for minimizing entropy | |
KR20170017873A (ko) | 오디오 신호 처리 장치 및 방법, 부호화 장치 및 방법, 및 프로그램 | |
JP2008519308A5 (ja) | ||
JP2008519308A (ja) | 信号特性を用いた効率的なオーディオ符号化 | |
JP4838773B2 (ja) | 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体 | |
EP3610481B1 (en) | Audio coding | |
JP4914245B2 (ja) | マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体 | |
JP4963973B2 (ja) | マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体 | |
JP6179122B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム | |
JP5799824B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
US9837085B2 (en) | Audio encoding device and audio coding method | |
Kırbız et al. | Perceptual coding-based informed source separation | |
JP6051621B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 | |
RU2807462C1 (ru) | Устройство квантования аудиоданных, устройство деквантования аудиоданных и соответствующие способы | |
Cantzos | Statistical enhancement methods for immersive audio environments and compressed audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110920 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110930 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141007 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4838774 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |