JP4838774B2 - マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 - Google Patents

マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 Download PDF

Info

Publication number
JP4838774B2
JP4838774B2 JP2007187684A JP2007187684A JP4838774B2 JP 4838774 B2 JP4838774 B2 JP 4838774B2 JP 2007187684 A JP2007187684 A JP 2007187684A JP 2007187684 A JP2007187684 A JP 2007187684A JP 4838774 B2 JP4838774 B2 JP 4838774B2
Authority
JP
Japan
Prior art keywords
prediction
channel
coefficient
order
code amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007187684A
Other languages
English (en)
Other versions
JP2009025497A (ja
Inventor
優 鎌本
登 原田
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007187684A priority Critical patent/JP4838774B2/ja
Publication of JP2009025497A publication Critical patent/JP2009025497A/ja
Application granted granted Critical
Publication of JP4838774B2 publication Critical patent/JP4838774B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、マルチチャネル線形予測符号化における予測係数決定方法及びそれを使った符号化方法と符号化装置に関するものである。
従来の線形予測符号化では、非特許文献1に記載されているようなFPE(Final Prediction Error: 最終予測誤差)やAIC(Akaike Information Criterion: 赤池情報量基準)を用いて、予測次数を決定していた。また、非特許文献2に記載されているような、MDL原理(Minimum Description Length Principle)を下に、予測次数を決定する方法もある。MDL原理は、
(符号語長)=(モデルの記述長)+(そのモデルによるデータの記述長) (1)
となる。ロスレス符号化で使われる言葉で言い換えると、
(ロスレスで復号するために必要な符号量)=(PARCOR係数に必要な符号量)+(予測残差に必要な符号量) (2)
となる。図1に模式的に示すように、PARCOR係数に必要な符号量は直線1Aで示すように予測次数に比例して増加する。1フレームあたりのサンプル数をNとすると、1フレームあたりの信号のエネルギーはΣn=1 Nxn 2で表され、それをNで割り算して得られる1サンプルあたりのエネルギー
Figure 0004838774
で表され、従って、分散σ2が小さければエントロピーも小さい。ロスレス符号化であるエントロピー符号化においては、エントロピーは1サンプルあたりのビット数に対応し、ビット数は符号量に対応する。従って、予測残差のフレームあたりの符号量は予測残差のフレームあたりのエネルギーに対応する。一般に、線形予測の分析次数を高くすれば予測残差のエネルギーは小となる(平均振幅が小となる)ので、図1に曲線1Bで示すように予測次数が大となるにつれ、予測残差を符号化した場合の符号量は対数的に減少する。
ロスレス復号するために必要な符号量は直線1Aと曲線1Bの和である曲線1Cに示すように、ある予測次数P0で符号量が最小となる特徴を示す。つまり、予測次数を増加させるほど予測残差に必要な符号量は減少するが、その分PARCOR係数に必要な符号量が増加してしまうため、予測次数を増加させてもロスレス復号するための線形予測符号化に必要な符号量を減少させることができるとは限らない。そこで、式(2) を用いて、ロスレス復号するために必要な符号量が最小となる予測次数(最適予測次数)P0を計算し、この最適予測次数P0を用いて圧縮符号化を行っていた。
図2は従来の典型的な2チャネルの線形予測符号化装置の機能構成図を示す。一般的なマルチチャネル線形予測符号化では、各チャネル信号は別々に線形予測分析を行ないそれぞれ予測係数の符号(以下、係数符号と呼ぶ)と予測残差の符号(以下、残差符号と呼ぶ)を出力している。ただし、非特許文献3に記載されているように、入力マルチチャネル信号としては、予めいずれか1つのチャネルを親チャネルとし、他を子チャネルとし、各子チャネルは親チャネル信号との差分信号を子チャネル信号として入力する場合もある。
図2の線形予測符号化装置の右チャネル符号化構成は、右チャネル入力信号xR(n)を線形予測分析してPARCOR係数KRを出力する線形予測分析部11Rと、PARCOR係数KRを量子化して量子化済PARCOR係数K’Rを出力する量子化部12Rと、量子化済PARCOR係数K'Rを線形予測係数a’Rに逆変換する逆変換部13Rと、線形予測係数a'Rを使って入力信号xR(n)を線形予測フィルタ処理して予測残差eR(n)を出力する線形予測フィルタ14Rと、量子化済PARCOR係数K’Rを符号化して係数符号Ck Rを出力する係数符号化部21Rと、予測残差eR(n)を符号化して残差符号Ce Rを出力する残差符号化部22Rと、係数符号Ck Rと残差符号Ce Rとを合成して合成符号Cg Rを出力する符号合成部23Rとから構成されている。
左チャネル符号化構成も同様であり、線形予測分析部11Lと、量子化部12Lと、逆変換部13Lと、線形予測フィルタ14Lと、係数符号化部21Lと、残差符号化部22Lと、符号合成部23Lとから構成されている。
図2では各チャネルで閉じた(独立した)線形予測分析を行なっており、したがって右チャネルについてのみ説明する。
線形予測分析部11Rにおいては、入力信号xR(n)をフレーム毎に線形予測分析するが、その線形予測分析の最適予測次数P0の決定方法を図3を参照して説明する。
Step11:共分散法又は数値計算による方法のような、厳密な手法により予め決めた最小予測次数Pminから最大予測次数Pmaxまでの各予測次数での入力信号の線形予測分析を行ない、線形予測係数を算出する。
Step20:予め決めた最小予測次数Pminから最大予測次数Pmaxまでの各予測次数の場合の(量子化済)PARCOR係数を符号化して係数符号量を求める。
Step30:最小予測次数Pminから最大予測次数Pmaxまでの各予測次数の場合の予測残差符号量を求める。
Step40:係数符号量と残差符号量との合計が最小となる予測次数を最適予測次数P0と決める。
Step50:決定された最適予測次数P0のときの線形予測係数を最適な予測係数として出力する。
尾崎統、北川源四郎、"時系列解析の方法"、朝倉書店、pp.82-92 "情報源符号化=無歪データ圧縮"、培風館、pp.114-115 "チャネル間相関を用いた多チャネル信号の可逆圧縮符号化"、情報処理学会論文誌、Vol.46, No. 5, pp.1118-1128.
図2における線形予測分析部11Rはこのようにして最適予測次数P0を決定し、最適予測次数P0の場合のStep10で得られた線形予測係数をPARCOR係数KRに変換して出力する。この方法によれば、より精度の高い線形予測係数を求めることができるが、各予測次数PhごとにPh個の全係数を計算する必要があり、必要な演算処理量が圧倒的に大となる欠点がある。
この発明の目的は、マルチチャネル線形予測符号化において、演算処理量が少なく、かつより正確な予測係数を決定できる予測係数決定方法及び装置を提供することである。
この発明の第1の観点によれば、マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法は、
該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とすることを特徴とする。
この発明の第2の観点によれば、マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法は、
(a) 該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の残差符号量または推定符号量と、を求めるステップと、
(b) 上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を第2の最適予測次数と決定するステップと、
(c) 上記ステップ(a) で求めた予測係数のうち、上記第2の最適予測次数に対応する線形予測係数を最適予測係数とするステップ、
とを含むことを特徴とする。
この発明の第3の観点によれば、マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法は、
該チャネル以外のチャネルについて得られた最適予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とすることを特徴とする。
この発明の第4の観点によれば、マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法は、
(a) 該チャネル以外のチャネルについて得られた最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の符号量または推定符号量と、を求めるステップと、
(b) 上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を該チャネルの最適予測次数と決定するステップと、
(c) 上記ステップ(a) で求めた予測係数のうち、該チャネルの最適予測次数に対応する線形予測係数を最適予測係数とするステップ、
とを含むことを特徴とする。
この発明によれば、同一チャネルについて別の方法で求めた最適予測次数または他チャネルで決めた最適予測次数を利用して、厳密な線形予測分析により最適予測次数を決めるので、正確な予測係数を少ない演算量で決めることができる。
図4はこの発明による最適予測係数決定方法の一実施例を示す処理手順を示す。
Step400:他チャネルについて求めた最適予測次数P0、または、自チャネルについて下記のStep510とは別の方法で求めた最適予測次数P0、を厳密な手法による最適次数探索の初期値P0とする。
Step510:予め設定した探索範囲P0−ΔPv〜P0+ΔPvの各予測次数について共分散法又は数値計算法などの厳密な手法により線形予測係数を算出する。ここで、ΔPvは例えば0≦ΔPv<(Pmin+Pmax)/2の範囲の予め決めた整数である。また、予め設定した探索範囲は最適次数探索の初期値P0を中心とする範囲を対称とせず、例えばP0−ΔPb〜P0+ΔPtというように非対称な範囲としてもよい。ここで、ΔPb及びΔPtは、0≦ΔPb≦P0−Pmin、0≦ΔPt≦Pmax−P0、ΔPb≠ΔPtの範囲で予め決めた整数である。
Step520:上記探索範囲の各予測次数での係数符号を求め、係数符号量を求める。ここで、係数符号量は実際に係数を符号化して求めた符号量でなくても、例えば、予測次数から推定される推定係数符号量や、予測次数と各予測係数の絶対値などから推定される推定係数符号量を係数符号量として用いてもよい。
Step530:上記探索範囲の各予測次数での残差符号量を求める。ここで、残差符号量は実際に予測残差を符号化して求めた符号量でなくても、例えば、予測残差のパワーや絶対値和などから推定した推定残差符号量を残差符号量として用いてもよい。
Step540:Step520で得られた係数符号量とStep530で得られた残差符号量との合計が最小となる予測次数を最適予測次数Pvと決定する。
Step550:最適予測次数Pvのときの線形予測係数を最適な予測係数と決定する。
いま、あるチャネルの最適な予測次数での予測係数と予測残差を図4のStep510〜Step550で共分散法や数値計算法のような厳密な手法に基づく線形予測分析(以下、厳密法と呼ぶ)により決める場合、そのチャネルを自チャネルとすると、Step400における予測次数P0は自チャネルについて得たものでもよいし、他チャネルについて求めたものでもよい。また、予測次数P0の求め方は、Levinson-Durbin法やBurg法のように、低次から順次次数を増加させながら、順次増加させた次数分のみのPARCOR係数または線形予測係数を求める逐次的方法(以下、逐次法と呼ぶ)でもよいし、共分散法や数値計算法のように、予測次数ごとに全次の線形予測係数またはPARCOR係数を求める厳密法でもよい。
図5Aは、図4のStep400において逐次法を用いた場合の例をStep400Aとして示す。
ステップ410A:Levinson-Durbin法又はBurg法のような逐次法により最大予測次数PmaxまでのPARCOR係数を算出する。
Step420A:予め決めた範囲Pmin〜Pmaxの各予測次数の場合のPARCOR係数の係数符号量を求める。
Step430A:範囲Pmin〜Pmaxの各予測次数の場合の残差符号量を求める。
Step440A:係数符号量と残差符号量の合計が最小となる予測次数を最適予測次数探索の初期値P0とする。
図5Bは、図4のStep400において厳密法を用いた場合の例をStep400Bとして示す。
Step410B:共分散法又は数値計算法のような厳密な手法により予め決めた範囲Pmin〜Pmaxの各予測次数の場合の線形予測係数を求め、PARCOR係数に変換する。
Step420B:範囲Pmin〜Pmaxの各予測次数の場合の係数符号量を求める。
Step430B:範囲Pmin〜Pmaxの各予測次数の場合の残差符号量を求める。
Step440B:係数符号量と残差符号量の合計が最小となる予測次数を最適予測次数探索の初期値P0とする。
この発明で実施可能な組み合わせの例を以下に示す。ただし、Step400をAで表し、Step510〜step550をBで表す。また、マルチチャネル符号化において、後述のように自チャネル単独で厳密法による線形予測分析を行なう場合と、他チャネルとの相互相関を考慮した厳密法による線形予測分析を行なう場合があり、前者を「単独厳密法」、後者を「相関厳密法」と表す。ここで、他チャネルとの相関を考慮した厳密法とは、例えば鎌本、原田、守谷"MPEG-4 ALSのマルチチャネル符号化に対応した線形予測分析"、日本音響学会講演論文集、1-1-4、2007年3月13日、(以下「参考文献1」と呼ぶ)に記載されている、予測次数毎に全次の線形予測係数を自チャネルの線形予測残差と他チャネルの線形予測残差との重み付き差分が最小となる基準で線形予測係数を求める分析方法をさす。
(a) A:他チャネルで逐次法; B:自チャネルで単独厳密法
(b) A:他チャネルで逐次法; B:自チャネルで相関厳密法
(c) A:他チャネルで単独厳密法; B:自チャネルで単独厳密法
(d) A:他チャネルで単独厳密法; B:自チャネルで相関厳密法
(e) A:他チャネルで相関厳密法; B:自チャネルで単独厳密法
(f) A:他チャネルで相関厳密法; B:自チャネルで相関厳密法
(g) A:自チャネルで逐次法; B:自チャネルで単独厳密法
(h) A:自チャネルで逐次法; B:自チャネルで相関厳密法
(i) A:自チャネルで単独厳密法; B:自チャネルで相関厳密法
上記組み合わせのいずれの場合でも、Step510〜Step540を実施する代わりに初期値P0をそのまま最適次数Pvとして、最適次数Pvについて自チャネルで単独又は相関厳密法により予測係数を決定してもよい。これは、ΔPv=0とおいてStep510〜Step540を実施することに対応する。
図4のStep530における各予測次数での残差符号量を求める方法は、例えば得られた線形予測係数またはその予測係数を量子化した量子化済線形予測係数を使って入力信号に対し線形予測フィルタ処理を行って予測残差を求め、その予測残差を符号化して符号量を得る方法が一般的である。
残差符号量を推定する方法としては、例えば各予測次数で得られた線形予測係数をPARCOR係数に変換し、PARCOR係数を使って求まる予測残差のエネルギーから符号量を推定する方法がある。例えば、入力信号x(n)の1フレームあたりのエネルギーE(0)は
Figure 0004838774
となる。1次のPARCOR係数k(1)を用いて、1次の線形予測を行ったときの予測残差のエネルギーE(1)は、
E(1)=E(0){1−k(1)2} (6)
となる。2次の線形予測を行ったときの予測残差のエネルギーE(2)は、
E(2)=E(1){1−k(2)2} (7)
となる。これをPmaxまで繰り返すと、Pmax次の線形予測を行ったときの予測残差のエネルギーE(Pmax)は、
Figure 0004838774
となるので、それぞれの予測次数での残差エネルギーで予測残差の符号量を近似できる。
<第1実施例>
図4に示した方法を2チャネル線形予測符号化装置に適用した例を図6に示す。
例えばコンパクトディスク(CD)のオーディオ2チャネル信号(ステレオ信号)の左右チャネル信号間には比較的大きな相互相関があることが知られている。このことから、一方のチャネルにおいて線形予測分析に最適な予測次数は他方のチャネルにおける線形予測分析に最適な予測次数に近いことが推定される。図6の実施例では、このような2チャネルの線形予測符号化装置にこの発明を適用することにより演算処理量を減らす場合を示す。
右チャネルの符号化構成と左チャネルの符号化構成は図2の符号化構成と同様である。図6の装置で特徴的なことは、一方のチャネル、ここでは右チャネルの線形予測分析部で結果で得られた最適予測次数P0が他方のチャネルの線形予測分析に利用されるよう構成されていることである。図4で説明した組み合わせ(a) 又は(c) に対応する。
線形予測分析部11Rは、与えられた右チャネル入力信号xR(n)(n=1, 2, …, N、Nは各フレームのサンプル数)に対しフレーム毎に予め決めた第1の範囲の各予測次数で例えば図5Aで説明したLevinson-Durbin法やBurg法のような逐次法、あるいは図5Bで説明した共分散法や数値計算法のような厳密な手法により線形予測分析を行なって残差符号量と係数符号量の和が最小となる予測次数を最適予測次数P0と決め、その予測次数に対応する予測係数をPARCOR係数KR={kR(1), kR(2), …, kR(P0)}として出力する。即ち、予測係数を線形予測係数aR={αR(1), αR(2), …, αR(P0)}として求めた場合は、これらをPARCOR係数KR={kR(1), kR(2), …, kR(P0)}に変換する。量子化部12RはPARCOR係数KRを量子化し、量子化済PARCOR係数K'R={k'R(1), k'R(2), …, k'R(P0)}を出力する。逆変換部13Rは量子化済PARCOR係数K'Rを線形予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}に変換する。線形予測フィルタ14Rは線形予測係数a'Rを使って入力信号xR(n)を線形予測フィルタ処理し、予測残差eR(n)を出力する。線形予測分析部11R、量子化部12R、逆変換部13R、線形予測フィルタ14Rは線形予測分析手段10Rを構成している。
係数符号化部21Rは最適予測次数P0と量子化済PARCOR係数K'Rを符号化し、係数符号Ck Rを出力する。残差符号化部22Rは、予測残差eR(n)を例えばエントロピー符号化し、残差符号Ce Rを出力する。符号合成部23Rは、係数符号Ck Rと残差符号Ce Rを合成し、Rチャネル符号Cg Rとして出力する。符号合成部23Rは係数符号Ck Rと残差符号Ce Rを合成し、Rチャネル符号Cg Rとして出力する。係数符号化部21R、残差符号化部22R、符号合成部23Rは符号化手段20Rを構成している。
左チャネル側符号化構成においては、線形予測分析部31Lは線形予測部11Rから予測次数P0が探索初期値として与えられ、P0を含む第1の範囲より狭い第2の範囲の各予測次数で入力信号xL(n)に対し例えば共分散法または数値計算法のような厳密な手法で線形予測分析を行ない、残差符号量と係数符号量を求める。これらの符号量の合計がもっとも小さい予測次数を最適予測次数Pvと決定し、そのときの線形予測係数をPARCOR係数KL={kL(1), kL(2), …, kL(Pv)}に変換して出力する。
量子化部32LはPARCOR係数KLを量子化し、量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(Pv)}を出力する。逆変換部33Lは量子化済PARCOR係数K'Lを線形予測係数a'L={α'L(1), α'L(2), …, α'L(Pv)}に変換する。線形予測フィルタ34Lは線形予測係数a'Lを使って入力信号xL(n)を線形予測フィルタ処理し、予測残差eL(n)を出力する。線形予測分析部31L、量子化部32L、逆変換部33L、線形予測フィルタ34Lは線形予測分析手段30Lを構成している。
係数符号化部21Lは最適予測次数Pvと量子化済PARCOR係数K'Lを符号化し、係数符号Ck Lを出力する。残差符号化部22Lは、予測残差eL(n)を例えばエントロピー符号化し、残差符号Ce Lを出力する。符号合成部23Lは、係数符号Ck Lと残差符号Ce Lを合成し、Lチャネル符号Cg Lとして出力する。係数符号化部21L、残差符号化部22L、符号合成部23Lは符号化手段20Lを構成している。
この線形予測分析部31Lがこの発明の予測係数決定装置を実現している。この実施例の予測係数決定装置31Lの機能構成図を図7に示す。この実施例の予測係数決定装置31Lは、厳密線形予測分析部510と係数符号量算出部520と残差符号量算出部530と最適次数探索部540と最適係数決定部550とにより構成されている。
この例では図6における左チャネル信号xL(n)と、右チャネルの線形予測分析部11Rにおいて図4のStep400を実行することにより得られた最適次数探索初期値P0とが与えられ、Step510を実行して各予測次数の場合の線形予測係数を求める。係数符号量算出部520と残差符号量算出部530はそれぞれ図4のStep520とStep530を実行して各予測次数の場合の係数符号量と残差符号量を求める。最適次数探索部540は図4のStep540を実行して係数符号量と残差符号量の合計が最小となるときの予測次数を最適予測次数Pvと決定する。最適係数決定部550は、図4のStep550を行なって最適予測次数Pvが決定されたときの線形予測係数を最適な予測係数として出力する。
このように、この実施例では、左チャネルは他チャネル(この例では右チャネル)で得られた最適予測次数P0を暫定的な最適予測次数(最適予測次数探索の初期値)として利用し、更にその次数P0の周辺の各予測次数について共分散法や数値計算法による手法により求めた線形予測係数から残差符号の符号量を求めると共に、対応するPARCOR係数の符号量を求め、これらの残差符号量と係数符号量の合計が最小となる予測次数を最適予測次数Pvと決定する。従って、合計符号量を最小とする最適予測次数をより正確に、しかも比較的少ない演算処理量で得ることができる。もちろん、他チャネルから与えられた最適予測次数P0を自チャネルでそのまま最適予測次数P0=Pvとして使用すれば、更に演算量を削減できる。
以上の説明のように、マルチチャネル信号符号化にこの発明を適用する場合、あるチャネルにおける線形予測分析のための最適予測次数探索の初期値予測次数P0としては、他のチャネルの線形予測分析部において求めた最適予測次数を使用してもよい。
<第2実施例>
チャネル間相関を利用した符号化
マルチチャネル信号の圧縮符号化では、非特許文献3に示されているように、所望の1つのチャネルを親チャネルとし、他を子チャネルとし、それぞれのチャネルごとに独立に線形予測分析を行って予測残差の基準値(エネルギーなど)を最小化するように、例えばLevinson-Durbin法などにより線形予測分析が行なわれ、分析により得られた線形予測係数a={α(1), α(2), …, α(P)}, α(0)=1を用いたフィルタを通して得られる親チャネルの予測残差に対して各子チャネルの予測残差を重み付き減算処理して残差差分を求め、親チャネルについてはその予測係数と予測残差を符号化し、各子チャネルについてはその予測係数と残差差分を符号化している。
マルチチャネル信号間に相互相関がある場合、それぞれのチャネル毎に線形予測残差のエネルギーが小さくなるように求めた線形予測係数を用いて線形予測分析を行っても、子チャネルにおいて符号化の対象となる残差差分信号についてはエネルギーが最小となっているわけではなく、残差差分信号をエントロピー符号化した際の符号量は必ずしも少なくできず、効率の良い符号化を行っているとはいえない。そこで合計の基準値(言い換えれば実際に符号化される信号の基準値)、例えば入力信号が2チャネルステレオ信号の右チャネル信号xR(n)を親チャネル信号、左チャネル信号xL(n)を子チャネル信号とする場合、親チャネルの予測残差エネルギー基準と、親チャネル予測残差と子チャネル予測残差の重みつき減算処理後の残差差分信号エネルギー基準の合計
Figure 0004838774
が最小となるように、子チャネル予測残差を求めるための線形予測係数を決めることが非特許文献3に示されている。ここで、重み係数γは前述のように減算処理後のエネルギーが最小となるように、
Figure 0004838774
によって決められる。
このようにチャネル間の相互相関を考慮した式(9)を最小化する線形予測係数を求めるため、式(9)を線形予測係数で偏微分して0とおいた式を解くことにより線形予測係数を求める変形された共分散法(以降、変形共分散法と呼ぶ)は、参考文献1に示されている。以下のマルチチャネル信号符号化装置の実施例においても、相互相関を利用した線形予測分析部においてこの手法を使うものとする。
図8はチャネル間相関を利用した線形予測分析を行なうマルチチャネル信号符号化装置の例を示し、図4で説明した組み合わせ(b) 又は(d) に対応する。
あるフレーム(Nサンプル)のRチャネルの信号をxR(n)(n=1, 2, …, N)、Lチャネルの信号をxL(n)(n=1, 2, …, N)とする。ここでは、Rチャネルを親チャネル、Lチャネルを子チャネルとする。
線形予測分析部11Rは入力された親チャネル信号xR(n)から図5A又は5Bで説明した方法により最適予測次数P0を決定し、その予測次数でのPARCOR係数KR={kR(1), kR(2), …, kR(P0)}を得る。また、その最適予測次数P0を探索初期値としてチャネル間相関を利用した線形予測分析部54Mに与える。量子化部12Rは入力されたPARCOR係数KR={kR(1), kR(2), …, kR(P0)}を量子化し、量子化済PARCOR係数K'R={k'R(1), k'R(2), …, k'R(P0)}を出力する。逆変換部13Rは入力された量子化済PARCOR係数K'R={kR(1), k'R(2), …, k'R(P0)}を量子化済予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}に逆変換する。線形予測フィルタ14Rは量子化済予測係数a'R={α'R(1), α'R(2), …, α'R(P0)}をフィルタ係数として、入力された親チャネル原信号xR(n)を次式でフィルタリングし予測残差eR(n)を得る。ただしα'R(0)=1とする。
Figure 0004838774
係数符号化部21Rは最適予測次数P0と量子化済PARCOR係数K'R={k'R(1), k'R(2), …, k'R(P0)}を符号化し係数符号Ck Rを出力する。残差符号化部22Rは予測残差eR(n)を符号化し残差符号Ce Rを出力する。符号合成部23Rは残差符号Ce Rと係数符号Ck Rを合成し、親チャネル合成符号Cg Rを出力する。
チャネル間相関を利用した線形予測分析部54Mは、与えられた最適予測次数の初期値P0の周辺(P0±ΔPvの範囲)の各予測次数Ph(h=−ΔPv, …, +ΔPv)について以下のStep1〜Step4を行う。
Step1:入力された子チャネル信号xL(n)と、線形予測フィルタ14Rからの親チャネル予測残差eR(n)とを使ってチャネル間の相互相関を考慮した変形共分散法により相互相関を考慮した線形予測係数aM={αM(1), αM(2), …, αM(Ph)}を求める。
Step2:線形予測係数aMをPARCOR係数に変換し、係数符号量を求める。
Step3:親チャネル予測残差eR(n)と相関を考慮した子チャネル予測残差eM(n)とから変形共分散法により残差差分信号e'M(n)=eR(n)−γeM(n)を推定し、その符号量を残差符号量として求める。
Step4:Step2とStep3で得た係数符号量と残差符号量の合計符号量を求める。
チャネル間相関を利用した線形予測分析部54Mは、すべての予測次数について得られた合計符号量から合計符号量を最小にする予測次数Phを最適予測次数Pvと決定する。
変換部55Mは線形予測係数aM={αM(1), αM(2), …, αM(Pv)}をPARCOR係数KM={kM(1), kM(2), …, kM(Pv)}に変換する。量子化部56Mは入力されたPARCOR係数KMを量子化し、量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を出力する。逆変換部57Mは入力された量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を量子化済予測係数a'M={α'M(1), α'M(2), …, α'M(Pv)}に逆変換する。線形予測フィルタ58Mは量子化済予測係数a'M={α'M(1), α'M(2), …, α'M(Pv)}をフィルタ係数として、入力された子チャネル信号xL(n)を以下の式でフィルタリングし予測残差eM(n)を得る。ただしα'M(0)=1とする。
Figure 0004838774
重み計算部51は親チャネルの予測残差eR(n)と相互相関を考慮した予測残差eM(n)を用いて以下の式から重み係数γを求める。
Figure 0004838774
重み量子化部52は重み係数γを量子化し、量子化済重み係数γ'を得る。重み付き減算処理部53は、予測残差eR(n)、eM(n)と量子化済重み係数γ'を用いて以下の式より、残差差分信号e'M(n)を得る。
Figure 0004838774
重み計算部51、重み量子化部52、重み付き減算処理部53、チャネル間相関を利用した線形予測分析部54M、変換部55M、量子化部56M、逆変換部57M、線形予測フィルタ58Mは線形予測分析手段50を構成している。
残差符号化部61Mは残差差分信号e'M(n)を符号化し残差符号Ce Mを出力する。係数符号化部64Mは最適予測次数Pvと量子化済PARCOR係数K'M={k'M(1), k'M(2), …, k'M(Pv)}を符号化し係数符号Ck Mを出力する。重み符号化部62Mは量子化済重み係数γ'を符号化し重み符号Cw Mを出力する。符号合成部63Mは残差符号Ce Mと重み符号Cw Mと係数符号Ck Mを合成し、子チャネル合成符号Cg Mを出力する。残差符号化部61M、重み符号化部62M、符号合成部63M、係数符号化部64Mは符号化手段60を構成している。
この実施例ではチャネル間相関を利用した線形予測分析ぶ54Mがこの発明の予測係数決定装置を実現している。
<第3実施例>
図8の実施例において、子チャネルについては、図7のように通常の線形予測分析を行なって求めた係数符号Ck Lと残差符号Ce Lとを合成して得た符号Cg Lと、図8の実施例で求めたチャネル間相関を考慮した合成符号Cg Mの符号量を比較し、少ないほうを子チャネル符号として出力してもよい。その実施例を図9に示す。この実施例は図8の実施例に対し線形予測分析部11L、量子化部12L、逆変換部13L、線形予測フィルタ14L、係数符号化部21L、残差符号化部22L、符号合成部23L、符号量比較部71が追加されている。
図9の実施例では、子チャネル信号xL(n)に対する線形予測分析部11Lにおいて逐次法あるいは厳密法により求めた最適予測次数P0を、同じ子チャネル信号xL(n)に対するチャネル間相関を利用した線形予測分析部54Mに与え、チャネル間相関を考慮した線形予測分析を厳密法で行なうための最適予測次数Pvを決めている。従って、この実施例は図4で説明した組み合わせ(h)または(i) に対応している。
線形予測分析部11Lは入力された子チャネル信号xL(n)を従来の線形予測分析方法(Levinson-Durbin法又はBurg法のような逐次法、または、共分散法や数値計算法などの厳密法など)により線形予測分析し、残差符号量と係数符号量の和が最小となる予測次数を最適予測次数P0として求め、最適予測次数に対応する予測係数をPARCOR係数KL={kL(1), kL(2), …, kL(P0)}として出力する。量子化部12Lは入力されたPARCOR係数KL={kL(1), kL(2), …, kL(P0)}を量子化し、量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(P0)}を出力する。逆変換部13Lは入力された量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(P0)}を量子化済予測係数a'L={α'L(1), α'L(2), …, α'L(P0)}に逆変換する。線形予測フィルタ14Lは量子化済予測係数a'L={α'L(1), α'L(2), …, α'L(P0)}をフィルタ係数として、入力された子チャネル信号xL(n)を以下の式でフィルタリングし予測残差eL(n)を得る。ただしα'L(0)=1とする。
Figure 0004838774
残差符号化部22Lは予測残差eL(n)を符号化し残差符号Ce Lを出力する。係数符号化部21Lは最適予測次数P0と量子化済PARCOR係数K'L={k'L(1), k'L(2), …, k'L(P0)}を符号化し係数符号Ck Lを出力する。符号合成部23Lは残差符号Ce Lと係数符号Ck Lを合成し、通常子チャネル合成符号Cg Lを出力する。
この実施例では、子チャネルの線形予測分析部11Lにおいて図5A又は5Bの方法により求めた最適予測次数P0がチャネル間相関を利用した線形予測分析部54Mに与えられる。チャネル間相関を利用した線形予測分析部54Mは、与えられた予測次数P0を初期値とし、図8で説明したと同様の手法でP0±ΔPvの範囲で各予測次数について前述の変形共分散法により線形予測係数を求め、残差差分の符号量と係数符号量の合計が最小となる予測次数Pvを最適予測次数と決め、そのときの線形予測係数を変換部55Mに与える。この線形予測係数に基づく量子化済線形予測係数を使って線形予測フィルタ58Mにより子チャネルのチャネル間相関を考慮した予測残差eM(n)を生成し、重み計算部51及び重み付き減算処理部53に与える。
符号合成部23Lからの合成符号Cg Lと符号合成部63Mからの合成符号Cg Mが符号量比較部71に与えられてそれらの符号量が比較され、少ない方の合成符号を選択してどちらを選択したかを表す情報と共に子チャネルの符号として出力する。
この実施例ではチャネル間相関を利用した線形予測分析部54Mがこの発明の予測係数決定装置を実現している。
この実施例によれば、減算処理を行わないほうが符号量が少ない場合には、通常の線形予測分析の結果を用いることになるので、従来法と比べて圧縮率が悪化することは常にない。
図10は図9において、線形予測分析部11Lにより入力信号xL(n)の各フレーム毎にLevinson-Durbin法により最適予測次数P0を求め、そのP0を初期値としてチャネル間相関を利用した線形予測分析部54Mにより変形共分散法に基づく連立方程式を解くことを繰り返すことにより最適予測次数Pvを求め、P0とPvの差を求めることを入力信号xL(n)の一連のフレームについて実行することにより得た、P0とPvの差に対する最適予測次数の出現確率分布を示す。入力信号xL(n)はサンプル周波数48kHz、各サンプル長16ビット、のステレオ音響信号で、それぞれ30秒のファイルを15ファイル用いた。最大次数Pmax=31とした。図9の実施例において、線形予測分析部11Lから与えられる最適予測次数P0に対し、チャネル間相関を利用した線形予測分析部54Mで探索を行なって得られる最適予測次数Pvが同じとなる出現確率は約40%であり、P0=Pvを中心に前後4の範囲に最適予測次数が存在する確率は、70%以上となることを示している。
図11は、図7又は図8又は図9における親チャネル符号化構成部11R〜14R,21R,22R,23Rの代わりに実施可能な変形例を示す。前述のようにLevinson-Durbin法では、信号に窓関数を掛けることで定常とみなし、分析を行なっている。そのため、正確な予測係数を得るには窓を用いない共分散法を用いたほうがよいが、共分散法を用いた場合のほうが常に符号量が小さくなるとは限らない。そこで、ここではLevinson-Durvin法で求めた最適次数P0を使って推定した符号量と、予測次数P0を初期値として、共分散法の最適予測次数を探索により見つけて、符号量を求めた場合を比較し、符号量の少ない方を採用する。
入力信号x(n)から符号化構成部11〜14,21,22,23により合成符号Cgxを出力するまでは図7,8と同様にLevinson-Durbin法により最適な予測次数P0が決定され、そのときの予測係数に基づいてPARCOR係数及び予測残差の符号化が行なわれ、符号合成部23で合成される。ここでは、線形予測分析部11Vで探索する予測次数の範囲をP0-ΔPv〜P0+ΔPvとする。ただし、P0-ΔPvが予め定められた下限Pmin(例えば0)を下回った場合は、ΔPb=P0-Pminとし(つまり次数が負にならないようにする)、同様にP0+ΔPvが予め定められた上限Pmaxを上回った場合は、ΔPt=P0+Pmaxとし、探索範囲をP0-ΔPb〜P0+ΔPv、P0-ΔPv〜P0+ΔPt、P0-ΔPb〜P0+ΔPt、というように非対称に変形することもある。また、すでに処理を終えたフレームまでの次数の差の出現確率分布に基づく統計量を用いてもよい。例えば統計的分布が左右対称でない場合は、3次統計量などを利用して、P0-ΔPb〜P0+ΔPtというような非対称の探索範囲としてもよい。ここで、ΔPbとΔPtは同じ値になることも、異なる値となることもありえる。
線形予測分析部11Vは以下の処理を実行する。
Step1:入力信号x(n)を用いて予測次数Pvi=P0の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={Pvi, kvi(1), kvi(2), …, kvi(Pvi)}に変換し、係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
Step2:入力信号x(n)を用いて予測次数Pv=P0−1の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={Pvi, kvi(1), kvi(2), …, kvi(Pvi)}に変換し、係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
Step3:入力信号x(n)を用いて予測次数Pvi=P0+1の共分散法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を得る。これをPARCOR係数Kvi={ kvi(1), kvi(2), …, kvi(Pvi)}に変換し、予測次数Pviの符号量を含む係数符号量を得る。式(8)においてPmax=Pviとし、エネルギー残差を求め、残差符号量を推定する。係数符号量と残差符号量を合計した符号量を求める。
このように上記StepをP0−ΔPvからP0+ΔPvまで繰り返し、最も合計符号量が小さくなる予測次数Pviを最適予測次数Pvと決定する。
線形予測分析部11Vは、最適予測次数とPARCOR係数Kv={ kv(1), kv(2), …, kv(Pv)}を出力する。量子化部12VはPARCOR係数Kvを量子化し、量子化済PARCOR係数K'v={ k'(1), k'(2), …, k'(Pv)}を出力する。逆変換部13Vは量子化済PARCOR係数K'vを線形予測係数a'v={α'v(1), α'v(2), …, α'(Pv)}に変換して出力する。線形予測フィルタ14Vは線形予測係数a'vをフィルタ係数として、入力された信号x(n)(n=1, 2, …, N)をPv次の線形予測フィルタ処理し、予測残差
Figure 0004838774
を得る。残差符号化部22Vは予測残差ev(n)を例えばエントロピー符号化し、残差符号Cevを出力する。係数符号化部21Vは最適予測次数Pvと量子化済PARCOR係数K'vを符号化し、係数符号Ckvを出力する。符号合成部23Vは残差符号Cevと係数符号Ckvを合成し、合成符号Cgvを出力する。符号量比較部24は、合成符号Cgxと合成符号Cgvを比較し、符号量の小さいほうを合成符号Cgとして出力する。線形予測分析部11V、量子化部12V、逆量子化部13V、線形予測フィルタ14Vは線形予測分析手段10Vを構成し、係数符号化部21V、残差符号化部22V、符号合成部23Vは符号化手段を構成している。
図11の変形例は図9における子チャネル側符号化構成部31L〜34L,42L,43L,44Lにも同様に適用できる。また、図11の装置を単独のチャネルの符号化装置として使用してもよい。
図12は、図11の変形実施例である。入力信号x(n)から符号化構成部11〜14,21〜23により合成符号Caを出力するまでは図11と同様にLevinson-Durbin法やBurg法などにより最適予測次数P0が決定され、そのときの予測次数に基づいてPARCOR係数及び予測残差の符号化が行なわれ、符号合成部23で合成される。図11では線形予測分析部11Vは入力信号x(n)から各予測次数ごとに共分散法に基づく線形予測分析により係数符号量及び残差符号量を推定して合計符号量が最小となる予測次数を決定した。しかし、図12では、線形予測分析部11Vは各予測次数Pvi=P0-ΔPv,P0−ΔPv+1, …, P0, …, P0+ΔPv−1, P0+ΔPvごとに共分散法に基づく線形予測分析により線形予測係数を求め、PARCOR係数に変換して出力し、以下、そのPARCOR係数から量子化部12V、逆変換部13V,線形予測フィルタ14V、係数符号化部21V、残差符号化部22V、符号合成部23Vにより実際に係数符号及び残差符号を求め、合成符号を生成し、線形予測分析部11Vに与える。線形予測分析部11Vは各予測次数Pvに対する合成符号の符号量を比較し、最小符号量となる予測次数を決定する。
以下では、線形予測分析部11から与えられた最適予測次数の初期値P0に対し、探索予測次数をPvi=P0+iとおき、iを−ΔPv〜ΔPvの範囲で変化させる場合の各予測次数Pviでの処理手順を説明する。
Step1:線形予測分析部11Vでは、入力信号x(n)を用いて予測次数Pviの共分散法又は数値計算法による線形予測分析を行ない、線形予測係数avi={αvi(1), αvi(2), …, αvi(Pvi)}を変換したPARCOR係数Kvi={ kvi(1), kvi(2), …, kvi(Pvi)}を出力する。
Step2:量子化部12VはPARCOR係数Kviを量子化し、量子化済PARCOR係数K'vi={ k'vi(1), k'vi(2), …, k'vi(Pvi)}を出力する。
Step3:逆量子化部13Vは量子化済PARCOR係数K'viを線形予測係数a'vi={α'vi(1), α'vi(2), …, α'vi(Pvi)}に変換して出力する。
Step4:線形予測フィルタ14Vは線形予測係数a'vi={α'vi(1), α'vi(2), …, α'vi(Pvi)}をフィルタ係数として、入力信号x(n)(n=1, 2, …, N)を次式でPvi次の線形予測フィルタ処理を行い、予測残差evi(n)を得る。
Figure 0004838774
Step5:残差符号化部22Vは予測残差evi(n)を例えばエントロピー符号化し、残差符号Ceviを出力する。
Step6:係数符号化部21Vは予測次数Pviと量子化済PARCOR係数K'vi={ k'vi(1), k'vi(2), …, k'vi(Pvi)}を符号化し、係数符号Ckviを出力する。
Step7:符号合成部23Vは残差符号Ceviと係数符号Ckviを合成し、合成符号Cgviを線形予測分析部11Vに与える。
上記Step1〜Step7が−ΔPv〜+ΔPv の範囲のiについてすべて実行され、それによって線形予測分析部11Vは各予測次数Pvi=P0+iに対する合成符号の符号量を得て、それらの中で最小の符号量に対応する予測次数を最適予測次数と決定し、符号合成部24Vはその最適予測次数に対応する合成符号Cgvを符号量比較部24に出力する。符号量比較部24は符号合成部23及び23Vからの合成符号Cgx及びCgvの符号量を比較し、小さいほうを合成符号Cgとして出力する。
予測次数Pvの探索範囲が広くなれば、圧縮率は向上するが、処理量が増えるため処速度が低下するので、図10の結果を参考にすれば、予測次数P0の周辺5次程度で探索すれば十分な性能が得られる。図12の装置も単独チャネルの符号化装置として使用してもよい。
<応用例1>
前述の図7及び8のマルチチャネル線形予測符号化においては、1つのチャネルでの線形予測分析で決めた最適予測次数P0を他の1つのチャネルの線形予測分析における最適予測次数探索の初期値として利用する場合を示した。脳磁場計測(MEG)信号やマイクロホンアレー信号などのようなマルチチャネル信号(Mチャネル、Mは3以上の整数)において、Hチャネル(Hは2以上M未満の整数)の最適次数の平均値や中央値(即ち、統計的な代表値)を初期値として、残りのM−Hチャネルの最適係数をそれぞれ求めてもよい。M−Hチャネルのうちの1つのチャネルにおけるその処理手順を図13に示す。
Step450:複数の他チャネルについて求めた最適予測次数の平均値又は中央値などを厳密法による最適予測次数探索の初期値P0とする。
Step510:厳密法によりP0−ΔPv〜P0+ΔPvの範囲の各予測次数の場合の線形予測係数を算出する。
Step520:上記範囲の各予測次数の場合の係数符号量を求める。
Step530:上記範囲の各予測次数の場合の残差符号量を求める。
Step540:係数符号量と残差符号量の合計が最小となる予測次数を最適予測次数Pvとする。
Step550:最適予測次数Pvのときの線形予測係数を最適な予測係数とする。
例えば、512チャネルのMEG信号(M=512)であれば、その10分の1程度の50チャネルをHとし、残りの462チャネルのそれぞれについて上記処理を実行する。
<応用例2>
上記応用例1において、探索範囲を決めるΔPvの値は例えば標準偏差などの統計量に基づいて決めることができる。その場合の処理手順を図14に示す。
Step460:複数の他チャネルについて求めた最適予測次数の平均値又は中央値などを厳密法による最適予測次数探索の初期値P0とする。
Step470:複数の他のチャネルについて求めた最適予測次数の標準偏差に最も近い整数値(切り上げ、切り捨て、四捨五入など)をΔPvとする。ただし、P0-ΔPvが予め定められた下限Pmin(例えば0)を下回った場合は、ΔPb=P0-Pminとし(つまり次数が負にならないようにする)、同様にP0+ΔPvが予め定められた上限Pmaxを上回った場合は、ΔPt=P0+Pmaxとし、探索範囲をP0-ΔPb〜P0+ΔPv、P0-ΔPv〜P0+ΔPt、P0-ΔPb〜P0+ΔPt、というように非対称に変形することもある。また、標準偏差に限らず他の統計量を用いてもよい。例えば統計的分布が左右対称でない場合は、3次統計量などを利用して、P0-ΔPb〜P0+ΔPtというような非対称の探索範囲としてもよい。ここで、ΔPbとΔPtは同じ値になることも、異なる値となることもありえる。
以降のStep510〜Step550は図13の場合と同様なので説明を省略する。
ここで、Step460において平均値や中央値などを求める対象のチャネルやチャネル数と、Step470において標準偏差を求める対象のチャネルやチャネル数とは同じとするのが通常であるが、必ずしも同じである必要はなく、異なってもよい。
以上説明したこの発明による予測係数決定装置は、この発明による予測係数決定方法を処理手順として表したコンピュータプログラムを実行するコンピュータにより実現してもよい。また、そのコンピュータは、記録媒体に記録された上記プログラムを読み取り、実行するように構成してもよい。
ロスレス符号化における予測次数と符号量の関係を説明するためのグラフ。 従来の2チャネル線形予測符号化装置の機能構成ブロック図。 従来の予測係数決定方法の処理手順を示すフロー図。 この発明による予測係数決定方法の処理手順を示すフロー図。 Aは図4におけるStep400を逐次法により実行する処理手順を示すフローであり、Bは厳密法により実行する処理手順を示すフロー。 この発明の位置実施例による予測次数決定装置の機能構成ブロック図。 この発明が適用されたマルチチャネル符号化装置の第1実施例を示す機能構成ブロック図。 この発明を適用したマルチチャネル符号化装置の第2実施例を示す機能構成ブロック図。 この発明を適用したマルチチャネル符号化装置の第3実施例を示す機能構成ブロック図。 入力された予測次数からのずれに対する最適予測次数の出現確率の例を示すグラフ。 この発明が適用された符号化装置の変形実施例を示す機能構成ブロック図。 この発明が適用された符号化装置の他の変形実施例を示す機能構成ブロック図。 マルチチャネル予測符号化におけるこの発明の応用例を説明するためのフロー図。 図13における初期予測次数の決め方を説明するためのフロー図。

Claims (22)

  1. マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法であり、
    予測係数決定手段が、該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とする
    ことを特徴とする予測係数決定方法。
  2. マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法であり、
    (a) 線形予測分析手段が、該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の残差符号量または推定符号量と、を求めるステップと、
    (b) 最適次数探索手段が、上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を第2の最適予測次数と決定するステップと、
    (c) 最適係数決定手段が、上記ステップ(a) で求めた予測係数のうち、上記第2の最適予測次数に対応する線形予測係数を最適予測係数とするステップ、
    とを含むことを特徴とする予測係数決定方法。
  3. マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法であり、
    予測係数決定手段が、該チャネル以外のチャネルについて得られた最適予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とする
    ことを特徴とする予測係数決定方法。
  4. マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する方法であり、
    (a) 線形予測分析手段が、該チャネル以外のチャネルについて得られた最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の符号量または推定符号量と、を求めるステップと、
    (b) 最適次数探索手段が、上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を該チャネルの最適予測次数と決定するステップと、
    (c) 最適係数決定手段が、上記ステップ(a) で求めた予測係数のうち、該チャネルの最適予測次数に対応する線形予測係数を最適予測係数とするステップ、
    とを含むことを特徴とする予測係数決定方法。
  5. 請求項3記載の予測係数決定方法において、
    最適予測係数を決定する対象以外の複数個のチャネルの最適予測次数の統計的な代表値を上記該チャネル以外のチャネルについて得られた最適予測次数とする
    ことを特徴とする予測係数決定方法。
  6. 請求項4記載の予測係数決定方法において、
    最適予測係数を決定する対象以外の複数個のチャネルの最適予測次数の統計的な代表値を上記該チャネル以外のチャネルについて得られた最適予測次数とする
    ことを特徴とする予測係数決定方法。
  7. 請求項4または6記載の予測係数決定方法において、
    最適予測係数を決定する対象以外の複数個のチャネルについて求めた最適予測次数の統計的分布に基づく値をΔPb及びΔPt、上記該チャネル以外のチャネルについて得られた最適予測次数をP0としたとき、上記予め決めた範囲の代わりにP0−ΔPbからP0+ΔPtまでの範囲を用いることを特徴とする予測係数決定方法。
  8. 請求項7記載の予測係数決定方法において、上記ΔPb及びΔPtは上記複数個のチャネルについて得られた最適予測次数の標準偏差に最も近い整数であることを特徴とする予測係数決定方法。
  9. 請求項7又は8記載の予測係数決定方法において、上記P0-ΔPbが予め設定した下限値を下回る場合は、上記予め設定した下限値を上記P0-ΔPbの代わりに範囲の下限として用い、及び/又は上記P0+ΔPtが予め設定した上限値を上回る場合は、上記予め設定した上限値を上記P0+ΔPtの代わりに範囲の上限値として用いることを特徴とする予測係数決定方法。
  10. 請求項1または2記載の予測係数決定方法において、
    上記第1の線形予測分析は、低次から順次次数を増加させながら、順次増加させた次数分のみの線形予測係数を求める分析手順である
    ことを特徴とする予測係数決定方法。
  11. 請求項1乃至4の何れか記載の予測係数決定方法において、
    上記第1の線形予測分析は、該チャネルの線形予測残差が最小となる基準で線形予測係数を求める分析手順であり、
    上記全次の線形予測係数を求める分析は、予測次数毎に全次の線形予測係数を該チャネルの線形予測残差と他チャネルの線形予測残差との重み付き差分が最小となる基準で決める分家器手順である
    ことを特徴とする予測係数決定方法。
  12. マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する装置であり、
    該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とする手段、
    を含むことを特徴とする予測係数決定装置。
  13. マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する装置であり、
    該チャネルの時系列信号について第1の線形予測分析を行い、予め決めた範囲の各予測次数のうち、予測係数の係数符号量または推定符号量と、予測残差の残差符号量または推定符号量、の合計が最小となる次数を第1の最適予測次数として求め、求めた第1の最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し上記第1の線形予測分析とは異なる、全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の残差符号量または推定符号量と、を求める手段と、
    上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を第2の最適予測次数と決定する手段と、
    上記厳密な線形予測分析により求めた予測係数のうち、上記第2の最適予測次数に対応する線形予測係数を最適予測係数とする手段、
    とを含むことを特徴とする予測係数決定装置。
  14. マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する装置であり、
    該チャネル以外のチャネルについて得られた最適予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって求めた予測係数を該チャネルの最適予測係数とする手段、
    を含むことを特徴とする予測係数決定装置。
  15. マルチチャネル時系列信号中の何れかのチャネルに対する最適予測係数を決定する装置であり、
    該チャネル以外のチャネルについて得られた第1の最適予測次数を含む予め決めた範囲の各予測次数について、該チャネルの時系列信号に対し全次の線形予測係数を求める分析を行なって予測係数を求め、さらに、該予測係数の符号量または推定符号量と、予測残差の符号量または推定符号量とを求める手段と、
    上記係数の符号量または推定符号量と、上記残差符号量または推定符号量と、の合計が最小となる予測次数を該チャネルの最適予測次数と決定する手段と、
    上記全次の線形予測係数を求める分析により求めた予測係数のうち、該チャネルの最適予測次数に対応する線形予測係数を最適予測係数とする手段、
    とを含むことを特徴とする予測係数決定装置。
  16. 請求項14記載の予測係数決定装置において、
    最適予測係数を決定する対象以外の複数個のチャネルの最適予測次数の統計的な代表値を上記外チャネル以外のチャネルについて得られた最適予測次数とする
    ことを特徴とする予測係数決定装置。
  17. 請求項15記載の予測係数決定装置において、
    最適予測係数を決定する対象以外の複数個のチャネルの最適予測次数の統計的な代表値を上記外チャネル以外のチャネルについて得られた最適予測次数とする
    ことを特徴とする予測係数決定装置。
  18. 請求項15または17記載の予測係数決定装置において、
    最適予測係数を決定する対象以外の複数個のチャネルについて求めた最適予測次数の統計的分布に基づく値をΔPb及びΔPt、上記該チャネル以外のチャネルについて得られた最適予測次数をP0としたとき、上記予め決めた範囲の代わりにP0−ΔPbからP0+ΔPtまでの範囲を用いることを特徴とする予測係数決定装置。
  19. 請求項18記載の予測係数決定装置において、上記ΔPb及びΔPtは上記複数個のチャネルについて得られた最適予測次数の標準偏差に最も近い整数であることを特徴とする予測係数決定装置。
  20. 請求項18又は19記載の予測係数決定装置において、上記P0-ΔPbが予め設定した下限値を下回る場合は、上記予め設定した下限値を上記P0-ΔPbの代わりに範囲の下限として用い、及び/又は上記P0+ΔPtが予め設定した上限値を上回る場合は、上記予め設定した上限値を上記P0+ΔPtの代わりに範囲の上限値として用いることを特徴とする予測係数決定装置。
  21. コンピュータを請求項12乃至20のいずれか記載の予測係数決定装置として機能させるためのプログラム。
  22. コンピュータを請求項12乃至20の何れか記載の予測係数決定装置として機能させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2007187684A 2007-07-18 2007-07-18 マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 Active JP4838774B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007187684A JP4838774B2 (ja) 2007-07-18 2007-07-18 マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007187684A JP4838774B2 (ja) 2007-07-18 2007-07-18 マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体

Publications (2)

Publication Number Publication Date
JP2009025497A JP2009025497A (ja) 2009-02-05
JP4838774B2 true JP4838774B2 (ja) 2011-12-14

Family

ID=40397364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007187684A Active JP4838774B2 (ja) 2007-07-18 2007-07-18 マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP4838774B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4848049B2 (ja) * 2008-12-09 2011-12-28 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP4918108B2 (ja) * 2009-02-18 2012-04-18 日本電信電話株式会社 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5866575B1 (ja) * 2014-10-31 2016-02-17 株式会社アクセル 音声信号の線形予測装置、音声信号の線形予測方法
JP5891500B1 (ja) * 2014-12-11 2016-03-23 株式会社アクセル 音声信号の線形予測装置、音声信号の線形予測方法
JP5891502B1 (ja) * 2014-12-11 2016-03-23 株式会社アクセル 音声信号の線形予測装置、音声信号の線形予測方法
JP5891501B1 (ja) * 2014-12-11 2016-03-23 株式会社アクセル 音声信号の線形予測装置、音声信号の線形予測方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2560785B2 (ja) * 1988-05-31 1996-12-04 沖電気工業株式会社 自己回帰モデル自動次数決定方法
JP2625998B2 (ja) * 1988-12-09 1997-07-02 沖電気工業株式会社 特徴抽出方式
JP2000020099A (ja) * 1998-06-26 2000-01-21 Oki Electric Ind Co Ltd 線形予測分析器,コード励振線形予測符号器及びコード励振線形予測復号器
JP4634969B2 (ja) * 2006-05-29 2011-02-16 日本電信電話株式会社 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2009025497A (ja) 2009-02-05

Similar Documents

Publication Publication Date Title
JP5975243B2 (ja) 符号化装置および方法、並びにプログラム
AU2010249173B2 (en) Complex-transform channel coding with extended-band frequency coding
RU2369917C2 (ru) Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования
US11532315B2 (en) Linear prediction analysis device, method, program, and storage medium
US20090204397A1 (en) Linear predictive coding of an audio signal
JP4838774B2 (ja) マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体
JP5340261B2 (ja) ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR20110020846A (ko) 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
US9548056B2 (en) Signal adaptive FIR/IIR predictors for minimizing entropy
KR20170017873A (ko) 오디오 신호 처리 장치 및 방법, 부호화 장치 및 방법, 및 프로그램
JP2008519308A5 (ja)
JP2008519308A (ja) 信号特性を用いた効率的なオーディオ符号化
JP4838773B2 (ja) 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体
EP3610481B1 (en) Audio coding
JP4914245B2 (ja) マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体
JP4963973B2 (ja) マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体
JP6179122B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
JP5799824B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US9837085B2 (en) Audio encoding device and audio coding method
Kırbız et al. Perceptual coding-based informed source separation
JP6051621B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置
RU2807462C1 (ru) Устройство квантования аудиоданных, устройство деквантования аудиоданных и соответствующие способы
Cantzos Statistical enhancement methods for immersive audio environments and compressed audio

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110930

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4838774

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350