JP2009069309A - Linear prediction model order determination device and method, and program, and recording medium thereof - Google Patents

Linear prediction model order determination device and method, and program, and recording medium thereof Download PDF

Info

Publication number
JP2009069309A
JP2009069309A JP2007235904A JP2007235904A JP2009069309A JP 2009069309 A JP2009069309 A JP 2009069309A JP 2007235904 A JP2007235904 A JP 2007235904A JP 2007235904 A JP2007235904 A JP 2007235904A JP 2009069309 A JP2009069309 A JP 2009069309A
Authority
JP
Japan
Prior art keywords
model order
code amount
model
order
prediction error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007235904A
Other languages
Japanese (ja)
Other versions
JP4691082B2 (en
Inventor
Masaru Kamamoto
優 鎌本
Noboru Harada
登 原田
Takehiro Moriya
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007235904A priority Critical patent/JP4691082B2/en
Publication of JP2009069309A publication Critical patent/JP2009069309A/en
Application granted granted Critical
Publication of JP4691082B2 publication Critical patent/JP4691082B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To determine an optimal model order of a linear prediction model without actually calculating a coding amount with each model order. <P>SOLUTION: A PARCOR coefficient of each linear prediction model up to a model order m, and prediction error energy at the time of the model order m, are calculated from an input signal. Then, the coding amount of a prediction error waveform which is an error between a prediction value of the linear prediction model of the model order m and the input signal, is estimated from the prediction error energy at the time of the model order m. Moreover, an individual coding amount corresponding to each PARCOR coefficient up to the model order m, or a whole coding amount corresponding to a whole PARCOR efficient is calculated. A sum coding amount of either the whole coding amount or a sum of each individual coding amount up to the model order j, and the estimated coding amount of the prediction error waveform, with each model order j, is calculated for a plurality of model orders, to determine one of the model orders from the sum coding amount. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

信号分析や信号の符号化などに用いられる線形予測分析技術に関する。   The present invention relates to a linear prediction analysis technique used for signal analysis and signal coding.

線形予測モデルは、ある時点{t}における時系列離散信号のサンプル値xと、その時点{t}よりも過去のp個の時点{t−1}、時点{t−2}、・・・、時点{t−p}における時系列離散信号のサンプル値xt−1、xt−2、・・・、xt−pのそれぞれに係数φ(i=1、・・・、p)による重み付けをしたものと、線形予測誤差εと間に線形1次結合が成り立つと仮定したモデルとして式(A)によって表すことができる。なお、例えば係数φのいずれかが0となる場合、厳密には線形予測モデルは過去p個の時系列離散信号のサンプル値に基づくものとは言えないが、このような場合も含めて、過去p個の時系列離散信号のサンプル値に基づくものであると考える。ここでpは、線形予測モデルが要するサンプル数を表し、これをモデル次数ということにする。

Figure 2009069309
The linear prediction model includes a sample value x t of a time-series discrete signal at a certain time point {t}, p time points {t-1} past the time point {t}, a time point {t-2},. - the sample value x t-1 of the time-series discrete signal at the time {t-p}, x t -2, ···, respectively coefficients φ i (i = 1 to x t-p, · · ·, p and those weighted by) may be represented by formula (a) as the assumed model and linear combination holds between the linear prediction error epsilon t. For example, when any of the coefficients φ i is 0, strictly speaking, the linear prediction model cannot be said to be based on the sample values of the past p time-series discrete signals, but including such a case, It is considered to be based on the past p time series discrete signal sample values. Here, p represents the number of samples required for the linear prediction model, and this is referred to as a model order.
Figure 2009069309

全極型の線形予測分析では、線形予測モデルのモデル次数の決定を要求される場合がある。例えば、圧縮符号化を例とすると、線形予測係数に係わる補助情報および予測誤差波形の各符号量の和を最小化するためにモデル次数を決める必要がある。このように決定されるべきモデル次数を最適モデル次数ということにする。   In all-pole linear prediction analysis, determination of the model order of the linear prediction model may be required. For example, taking compression coding as an example, it is necessary to determine the model order in order to minimize the sum of the code amounts of the auxiliary information related to the linear prediction coefficient and the prediction error waveform. The model order to be determined in this way is referred to as the optimal model order.

従来技術は、最適モデル次数の決定を、FPE(Final Prediction Error:最終予測誤差)やAIC(Akaike Information Criterion:赤池情報量基準)などを用いて決定していた〔非特許文献1参照〕。また、MDL原理(Minimum Description Length Principle)に基づき、最適モデル次数を決定する手法もあった〔非特許文献2参照〕。   In the prior art, the optimal model order is determined using FPE (Final Prediction Error: Final Prediction Error), AIC (Akaike Information Criterion: Akaike Information Criterion), etc. [see Non-Patent Document 1]. There is also a method for determining the optimal model order based on the MDL principle (Minimum Description Length Principle) [see Non-Patent Document 2].

MDL原理による2段階符号化では、(符号語長)=(モデルの記述長)+(そのモデルによるデータの記述長)と表される。これを、例えばロスレス符号化〔Lossless Coding〕での慣用表現に置き換えれば、(ロスレスで復号するために必要な符号量)=(PARCOR係数に必要な符号量)+(予測誤差波形に必要な符号量)・・・(B)と表現できる。図8に示すように、モデル次数を増加させるほど予測誤差波形に必要な符号量(符号503)を減少させることができるが、PARCOR係数に必要な符号量(符号502)が増加してしまうため、モデル次数を大きく設定することによって、ロスレスで復号するために必要な符号量(符号501)を減少させることができるわけではない。そこで、式(B)に従い、ロスレスで復号するために必要な符号量が最小となるモデル次数を探索し、これを最適モデル次数として決定していた。   In the two-stage encoding based on the MDL principle, (code word length) = (description length of model) + (description length of data based on the model). If this is replaced with, for example, a conventional expression in lossless coding (Lossless Coding), (code amount necessary for lossless decoding) = (code amount necessary for PARCOR coefficient) + (code necessary for prediction error waveform) Amount)... (B). As shown in FIG. 8, the code amount (symbol 503) required for the prediction error waveform can be decreased as the model order is increased, but the code amount (symbol 502) required for the PARCOR coefficient is increased. By setting the model order large, it is not possible to reduce the amount of code (symbol 501) required for lossless decoding. Therefore, according to the equation (B), a model order that minimizes the amount of codes necessary for lossless decoding is searched, and this is determined as the optimum model order.

このことを、PARCOR係数を算出する場合を一例として図9に示して説明する。
所定の時間間隔で標本化された時間離散信号をフレーム毎に分割した各フレームを入力信号yとする。ここではロスレス符号化を例とし、入力信号yは整数変換された整数値からなるとする。また、最適モデル次数は、モデル次数をNminからNmaxまでとした探索範囲をn次〔但し、nはn≧1を満たす整数である。また、NminおよびNmaxはNmax>Nminを満たす正整数である。〕ごとに調べたものの中から決定することにする。なお、以下ではモデル次数mを正整数とする。
This will be described with reference to FIG. 9 as an example of calculating the PARCOR coefficient.
Each frame obtained by dividing a time discrete signal sampled at a predetermined time interval for each frame is set as an input signal y. Here, lossless encoding is taken as an example, and the input signal y is assumed to be an integer value obtained by integer conversion. The optimal model order is an n-order search range in which the model order is from N min to N max (where n is an integer that satisfies n ≧ 1). N min and N max are positive integers that satisfy N max > N min . ] Will be decided from those investigated. In the following, the model order m is a positive integer.

PARCOR係数算出部(901)は、入力信号yを入力として、モデル次数が1,2,・・・,Nmaxの各線形予測モデルのPARCOR係数γ〔m=1,2,・・・,Nmax〕をそれぞれ算出する〔PARCOR係数の算出方法については非特許文献3または後述の《PARCOR係数・予測誤差エネルギーの算出》を参照のこと。〕。モデル次数が1,2,・・・,Nmaxのときの各PARCOR係数γ〔m=1,2,・・・,Nmax〕は、PARCOR係数量子化部(902)の入力となる。 PARCOR coefficient calculation unit (901) is input with an input signal y, the model order is 1, 2, · · ·, PARCOR coefficient of each linear prediction model of N max gamma m [m = 1, 2, · · ·, N max ] is calculated [refer to Non-Patent Document 3 or “Calculation of PARCOR coefficient / prediction error energy” described later for the PARCOR coefficient calculation method]. ]. Model order is 1, 2, each PARCOR coefficient when the N max gamma m [m = 1,2, ..., N max] becomes an input of PARCOR coefficient quantizer (902).

PARCOR係数量子化部(902)は、各PARCOR係数γ〔m=1,2,・・・,Nmax〕を量子化して、モデル次数が1,2,・・・,Nmaxのときの量子化済PARCOR係数qγ〔m=1,2,・・・,Nmax〕をそれぞれ算出する。
また、PARCOR係数量子化部(902)は、量子化済PARCOR係数qγ〔m=1,2,・・・,Nmax〕それぞれについて、量子化表を用いて量子化済PARCOR係数をインデックスの数値に変換し、これらを符号化して、係数符号Cp〔m=1,2,・・・,Nmax〕をそれぞれ算出する。
The PARCOR coefficient quantization unit (902) quantizes each PARCOR coefficient γ m [m = 1, 2,..., N max ], and the model order is 1, 2 ,. Quantized PARCOR coefficients qγ m [m = 1, 2,..., N max ] are calculated.
Further, the PARCOR coefficient quantizing unit (902) uses the quantization table for each quantized PARCOR coefficient qγ m [m = 1, 2,..., N max ] as an index. These are converted into numerical values and encoded to calculate coefficient codes Cp m [m = 1, 2,..., N max ].

量子化方法は公知・周知の手法を用いることができるので、その詳細な説明を略する〔例えば非特許文献4を参照のこと。〕。なお、上記のように量子化済PARCOR係数qγ〔m=1,2,・・・,Nmax〕それぞれについて量子化してもよいが、それらの一部または全部をまとめてベクトル量子化してもよい。但し、ベクトル量子化する場合には、探索範囲に含まれる各モデル次数までの符号〔つまり、モデル次数が1からNminまでの符号、モデル次数が1から(Nmin+n)までの符号、モデル次数が1から(Nmin+2n)までの符号、・・・、である。〕を最適モデル次数探索・符号選択部(906)で選択できるようにまとめる範囲を設定するか、それぞれの符号を最適モデル次数探索・符号選択部(906)に出力するか、の何れかにすることを要する。
各量子化済PARCOR係数qγ〔m=1,2,・・・,Nmax〕は、線形予測係数変換部(903)の入力となる。
各係数符号Cp〔m=1,2,・・・,Nmax〕は、最適モデル次数探索・符号選択部(906)の入力となる。
Since the quantization method can use a known and well-known method, a detailed description thereof is omitted [for example, see Non-Patent Document 4]. ]. As described above, each of the quantized PARCOR coefficients qγ m [m = 1, 2,..., N max ] may be quantized, but some or all of them may be vector quantized together. Good. However, in the case of vector quantization, codes up to each model order included in the search range [that is, codes from model order 1 to N min , codes from model order 1 to (N min + n), models The orders are codes from 1 to (N min + 2n),. ] Is set so that it can be selected by the optimal model order search / code selection unit (906), or each code is output to the optimal model order search / code selection unit (906). It takes a thing.
Each quantized PARCOR coefficient qγ m [m = 1, 2,..., N max ] is input to the linear prediction coefficient conversion unit (903).
Each coefficient code Cp m [m = 1, 2,..., N max ] is input to the optimum model order search / code selection unit (906).

線形予測係数変換部(903)は、各量子化済PARCOR係数qγ〔m=1,2,・・・,Nmax)から、モデル次数がNminからNmaxまでのnごとの各モデル次数に応じた線形予測モデルの〔量子化済みの〕線形予測係数a (m) m,k〔探索対象モデル次数m=Nmin,Nmin+n,Nmin+2n,・・・,Nmin+n×i,・・・,Nmin+n×[(Nmax−Nmin)/n]、但し[・]はガウス記号である。imax=[(Nmax−Nmin)/n]として、「i=0,1,2,・・・,imax」などと表記する。また、k=1,2,・・・,mである。〕をそれぞれ算出する〔線形予測係数の算出方法については非特許文献3または後述の《PARCOR係数・予測誤差エネルギーの算出》を参照のこと。〕。つまり、i=0,1,2,・・・,imaxとして、モデル次数(Nmin+n×i)の線形予測モデルの線形予測係数a (g)〔k=1,2,・・・,g〕を算出する〔Nmin+n×i=gとして記号の置き換えをした。〕。なお、線形予測係数a (g)は、PARCOR係数として既に与えられていることに留意すること。
モデル次数(Nmin+n×i)の線形予測モデルの線形予測係数a (g)〔k=1,2,・・・,g〕は、予測誤差フィルタ部(904−i)〔但し、i=0,1,2,・・・,imax〕の入力となる。
The linear prediction coefficient conversion unit (903) calculates each model order for each n of the model orders from N min to N max from each quantized PARCOR coefficient qγ m [m = 1, 2,..., N max]. [Quantized] linear prediction coefficients a k (m) m, k [search target model order m = N min , N min + n, N min + 2n,..., N min + n × i,..., N min + n × [(N max −N min ) / n], where [·] is a Gaussian symbol. As i max = [(N max −N min ) / n], it is expressed as “i = 0, 1, 2,..., i max ”. K = 1, 2,..., M. [Refer to Non-Patent Document 3 or << Calculation of PARCOR coefficient / prediction error energy >> described later for the calculation method of the linear prediction coefficient]. ]. That is, assuming that i = 0, 1, 2,..., I max , the linear prediction coefficient a k (g) of the linear prediction model of model order (N min + n × i ) [k = 1, 2,. , G] is calculated [N min + n × i = g, and the symbols are replaced. ]. Note that the linear prediction coefficient a g (g) is already given as a PARCOR coefficient.
The linear prediction coefficient a k (g) [k = 1, 2,..., G] of the linear prediction model of model order (N min + n × i) is a prediction error filter unit (904-i) [where i = 0, 1, 2,..., I max ].

予測誤差フィルタ部(904−i)〔i=0,1,2,・・・,imax〕はそれぞれ、入力信号yも入力として、線形予測係数a (g)〔k=1,2,・・・,g〕を予測係数とした予測誤差フィルタに入力信号yを例えば前向きで通し、入力信号yと線形予測係数a (g)からなるモデル次数gの線形予測モデルの予測値との誤差である予測誤差信号〔予測誤差波形〕eを出力する。
線形予測誤差信号eは、誤差信号符号化部(905−i)〔i=0,1,2,・・・,imax〕の入力となる。
The prediction error filter unit (904-i) [i = 0, 1, 2,..., I max ] receives the input signal y as an input, and linear prediction coefficients a k (g) [k = 1, 2, .., G] are passed through a prediction error filter with a prediction coefficient, for example, the input signal y is passed forward, and the input signal y and the prediction value of the linear prediction model of the model order g consisting of the linear prediction coefficient a k (g) and it outputs a prediction error signal [prediction error waveform] e i is the error.
The linear prediction error signal e i is input to an error signal encoding unit (905-i) [i = 0, 1, 2,..., I max ].

誤差信号符号化部(905−i)〔i=0,1,2,・・・,imax〕はそれぞれ、予測誤差信号eを符号化して、モデル次数(Nmin+n×i)の誤差信号符号C〔g=Nmin+n×i〕を出力する。
誤差信号符号C〔g=Nmin+n×i〕は、最適モデル次数探索・符号選択部(906)の入力となる。
Each of the error signal encoding units (905-i) [i = 0, 1, 2,..., I max ] encodes the prediction error signal e i to generate an error of the model order (N min + n × i). The signal code C g [g = N min + n × i] is output.
The error signal code C g [g = N min + n × i] is input to the optimum model order search / code selection unit (906).

最適モデル次数探索・符号選択部(906)は、i=0,1,2,・・・,imaxについて、モデル次数(Nmin+n×i)のときの誤差信号符号C〔g=Nmin+n×i〕の符号量と、モデル次数が(Nmin+n×i)までの係数符号Cp(m=1,2,・・・,Nmin+n×i)の符号量との和である合計符号量を求め、求めた各合計符号量のうち最小の合計符号量を探索する。そして、例えば最小合計符号量のものがi=Iの場合、つまりモデル次数(Nmin+n×I)のときの誤差信号符号C〔g=Nmin+n×I〕の符号量とモデル次数が(Nmin+n×I)までの係数符号Cp(m=1,2,・・・,Nmin+n×I)の符号量との合計符号量が最小であったとすると、最適モデル次数は(Nmin+n×I)であると決定できる。
そして、通信路に対して、最適モデル次数(Nmin+n×I)までのPARCOR係数に対応した係数符号Cp(m=1,2,・・・,Nmin+n×I)および最適モデル次数(Nmin+n×I)のときの誤差信号符号C〔g=Nmin+n×I〕が送り出される。なお、係数符号Cp(m=1,2,・・・,Nmin+n×I)から最適モデル次数を判別できない場合には、最適モデル次数を表す情報〔次数情報〕を適宜符号化し、この符号化された次数情報も通信路に対して送り出される。
The optimal model order search / code selection unit (906) performs error signal code C g [g = N for model order (N min + n × i) for i = 0, 1, 2,..., I max. min + n × the amount of code i], the model order is (n min + n × i) coefficients up code Cp m (m = 1,2, ··· , n min + n × i) the sum of the code amount of A certain total code amount is obtained, and a minimum total code amount is searched for among the obtained total code amounts. For example, when the code having the minimum total code amount is i = I, that is, when the model order is (N min + n × I), the code amount and the model order of the error signal code C g [g = N min + n × I] are (n min + n × I) to the coefficient code Cp m (m = 1,2, ··· , n min + n × I) the total code amount of the code amount of is assumed to be minimal, optimal model order is ( N min + n × I).
Then, the communication path, coefficients corresponding to the PARCOR coefficient to the optimal model order (N min + n × I) code Cp m (m = 1,2, ··· , N min + n × I) and optimal model order (n min + n × I) error signal code C g in the case of [g = n min + n × I] is sent out. If the optimum model order cannot be determined from the coefficient code Cp m (m = 1, 2,..., N min + n × I), information representing the optimum model order [order information] is encoded as appropriate. The encoded order information is also sent to the communication path.

上記の例のように、従来では、言わば総当りで各モデル次数における合計符号量を求め、最小のものを探索していた。
尾▲崎▼統、北川源四郎著、“時系列解析の方法”、朝倉書店、pp.82-92、1998 情報理論とその応用学会編、“情報理論とその応用シリーズ 1-I 情報源符号化-無歪みデータ圧縮”、培風館、1998 日野幹雄著、“スペクトル解析”、朝倉書店、1979 守谷健弘著、“音声符号化”、社団法人電子情報通信学会、1998
As in the above example, conventionally, the total code amount in each model order is obtained by brute force, and the smallest one is searched.
Osamu Ozaki, Genshiro Kitagawa, “Method of Time Series Analysis”, Asakura Shoten, pp.82-92, 1998 Information Theory and Its Applied Society, “Information Theory and Its Applied Series 1-I Information Source Coding-Undistorted Data Compression”, Baifukan, 1998 By Hino Mikio, “Spectral Analysis”, Asakura Shoten, 1979 Takehiro Moriya, “Speech coding”, The Institute of Electronics, Information and Communication Engineers, 1998

それぞれのモデル次数ごとに、予測係数に係わる補助情報および予測誤差波形を符号化して合計符号量を求め、合計符号量が最小となる場合のモデル次数を最適モデル次数として決定することは可能であるが、多大な処理時間を要するといった問題があった。   For each model order, the auxiliary information related to the prediction coefficient and the prediction error waveform are encoded to obtain the total code amount, and the model order when the total code amount is minimized can be determined as the optimal model order. However, there is a problem that a lot of processing time is required.

そこで本発明は、上記の問題点に鑑み、実際に各モデル次数での合計符号量を求めることなく線形予測モデルの最適モデル次数を決定する線形予測モデル次数決定装置、方法、プログラム、記録媒体を提供することを目的とする。   Therefore, in view of the above problems, the present invention provides a linear prediction model order determination apparatus, method, program, and recording medium that determine the optimal model order of a linear prediction model without actually obtaining the total code amount at each model order. The purpose is to provide.

上記課題を解決するために、本発明は、次のような構成とする。即ち、入力信号から、モデル次数が1,・・・,m〔但し、mは2以上の整数Nsupに対して1≦m≦Nsupを満たす整数である。〕の各線形予測モデルのPARCOR係数と、モデル次数mのときの予測誤差エネルギーとをそれぞれ算出する。そして、モデル次数mのときの予測誤差エネルギーから、モデル次数が1,・・・,mのときの各PARCOR係数によって与えられる線形予測係数からなるモデル次数mの線形予測モデルの予測値と入力信号との誤差である予測誤差波形の符号量〔予測誤差符号量〕を推定する。また、モデル次数が1,・・・,mのときの各PARCOR係数に対応した符号量〔個別符号量〕、あるいは全てのPARCOR係数に対応する符号量〔全体符号量〕を算出する。0からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数jにおける、全体符号量あるいはモデル次数が1,・・・,jのときの各個別符号量の合計と、予測誤差符号量との合計〔合計符号量〕を求め、合計符号量からモデル次数を1つに決定する。この決定された1つのモデル次数が最適モデル次数である。
このように、実際に各モデル次数での符号量を求めるのではなく、PARCOR係数の算出過程で得られた予測誤差エネルギーによって予測誤差符号量を推定する構成としている。
In order to solve the above problems, the present invention is configured as follows. That is, from the input signal, the model order is 1,..., M [where m is an integer that satisfies 1 ≦ m ≦ N sup for an integer N sup of 2 or more. ] The PARCOR coefficient of each linear prediction model and the prediction error energy at the model order m are calculated. Then, from the prediction error energy when the model order is m, the prediction value of the linear prediction model of the model order m and the input signal composed of the linear prediction coefficients given by the respective PARCOR coefficients when the model order is 1,. The code amount [prediction error code amount] of the prediction error waveform, which is an error from the above, is estimated. Also, the code amount [individual code amount] corresponding to each PARCOR coefficient when the model order is 1,..., M, or the code amount [total code amount] corresponding to all PARCOR coefficients is calculated. For a plurality of model orders included in model orders from 0 to N sup , the total code amount or the total of individual code amounts when the model order is 1,. A total [total code amount] with the code amount is obtained, and one model order is determined from the total code amount. The determined model order is the optimum model order.
In this way, the code amount at each model order is not actually obtained, but the prediction error code amount is estimated by the prediction error energy obtained in the PARCOR coefficient calculation process.

この発明によれば、PARCOR係数の算出過程で得られた予測誤差エネルギーによって予測誤差符号量を推定するから、実際に各モデル次数での符号量〔係数符号量と予測誤差波形の符号量との合計符号量〕を求めることなく、線形予測モデルの最適モデル次数を決定することができる。   According to the present invention, since the prediction error code amount is estimated based on the prediction error energy obtained in the PARCOR coefficient calculation process, the code amount at each model order [the coefficient code amount and the code amount of the prediction error waveform is actually calculated. The optimum model order of the linear prediction model can be determined without obtaining the total code amount].

[技術説明]
本発明では、PARCOR係数の算出過程で得られた予測誤差エネルギーを有効利用して最適モデル次数を決定する。
[Technical explanation]
In the present invention, the optimal model order is determined by effectively using the prediction error energy obtained in the PARCOR coefficient calculation process.

《PARCOR係数・予測誤差エネルギーの算出》
全極型の線形予測分析の一つとしてPARCOR係数を直接求める方法が知られている。この算出方法は、上記非特許文献4などに説明されている。ここでは、一例としてLevinson-Durbin法を説明する。
<< Calculation of PARCOR coefficient and prediction error energy >>
A method for directly obtaining a PARCOR coefficient is known as one of all-pole linear prediction analysis. This calculation method is described in Non-Patent Document 4 and the like. Here, the Levinson-Durbin method will be described as an example.

与えられた入力信号の時系列サンプル値x,x,・・・,xに対して、式(1)の線形予測モデルを考える。一般的にp<Nである。式(1)で表されるp次の自己回帰過程(autoregressive process)の両辺にxt−τを乗じて期待値をとることで式(2)を得る。なお{ε}は白色過程である。また、vm−n=vn−m=E[xt−mt−n]=Σt=1 t−mt−nは自己相関関数を表す。

Figure 2009069309
Time series sampled values of the given input signals x 1, x 2, ···, against x N, consider a linear predictive model of equation (1). In general, p <N. Expression (2) is obtained by multiplying both sides of the p-th order autoregressive process represented by Expression (1) by x t−τ to obtain an expected value. Note that {ε t } is a white process. Also, v m−n = v n−m = E [x t−m x t−n ] = Σ t = 1 N x t−m x t−n represents an autocorrelation function.
Figure 2009069309

−τ=vτであることに注意して、式(2)においてτ=1,2,…,pを代入すると、式(3)を得る。式(3)は所謂Yule-Walker方程式である。σは、p次での予測誤差分散(予測誤差エネルギー)である。

Figure 2009069309
v-tau = v in mind that the tau, tau = 1, 2 in the formula (2), ..., substituting p, to obtain a formula (3). Equation (3) is a so-called Yule-Walker equation. σ 2 is a p-order prediction error variance (prediction error energy).
Figure 2009069309

ここで説明の便宜から、pをmに、iをkに、記号の置き換えをする。また、m次モデルのk番目の線形予測係数をa (m)と表記する。
このとき、式(4)および式(5)を定義する。式(4)はm次の予測誤差分散(予測誤差エネルギー)、式(5)はm次の偏相関値である。

Figure 2009069309
Here, for convenience of explanation, p is replaced with m, i is replaced with k, and symbols are replaced. In addition, the k-th linear prediction coefficient of the m- th model is denoted as a k (m) .
At this time, Expression (4) and Expression (5) are defined. Equation (4) is the mth-order prediction error variance (prediction error energy), and Equation (5) is the mth-order partial correlation value.
Figure 2009069309

式(3)を変形して式(4)を導入すると、式(6)を得る。

Figure 2009069309
If formula (3) is transformed and formula (4) is introduced, formula (6) is obtained.
Figure 2009069309

式(6)に式(5)を導入すると、式(7)を得る。

Figure 2009069309
When formula (5) is introduced into formula (6), formula (7) is obtained.
Figure 2009069309

式(7)を連立方程式と見立てて、m+2本の方程式間で任意の係数γm+1を乗じて方程式の辺ごとに引き算を行い、式(7)を変形すると式(8)を得る。

Figure 2009069309
The equation (7) is regarded as a simultaneous equation, an arbitrary coefficient γ m + 1 is multiplied between m + 2 equations, subtraction is performed for each side of the equation, and the equation (7) is transformed to obtain the equation (8).
Figure 2009069309

係数γm+1は任意であるからu−γm+1σ =0となるように定めることができる。このとき式(8)は、式(6)において、mをm+1に拡張したものと理解できる。従って、式(9)、式(10)、式(11)を得る。γm+1はm+1次のPARCOR係数、a (m+1)はm+1次モデルのk番目の線形予測係数、σm+1 はm+1次の予測誤差分散(予測誤差エネルギー)である。

Figure 2009069309
Since the coefficient γ m + 1 is arbitrary, it can be determined so that u m −γ m + 1 σ m 2 = 0. At this time, the expression (8) can be understood as an expansion of m to m + 1 in the expression (6). Accordingly, Expression (9), Expression (10), and Expression (11) are obtained. γ m + 1 is an m + 1 order PARCOR coefficient, a k (m + 1) is a kth linear prediction coefficient of the m + 1 order model, and σ m + 1 2 is an m + 1 order prediction error variance (prediction error energy).
Figure 2009069309

以上では、Levinson-Durbin法に拠るPARCOR係数などの算出を説明したが、この方法に限定するものではなく例えばBurg法に拠るものであってもよい。Burg法については、上記非特許文献3を参照のこと。
以上で《PARCOR係数・予測誤差エネルギーの算出》の説明は終わりである。
The calculation of the PARCOR coefficient or the like based on the Levinson-Durbin method has been described above. However, the calculation is not limited to this method, and may be based on the Burg method, for example. For the Burg method, see Non-Patent Document 3 above.
This completes the description of “Calculation of PARCOR coefficient / prediction error energy”.

《PARCOR係数の情報量》
次に、PARCOR係数の情報量について説明する。
PARCOR係数の情報量の計算は、PARCOR係数の量子化方法、符号化方法に依存する。そこで、ここでは一般的な手法を一例として説明する。
一般的には最子化表〔PARCOR係数とその量子化値とが対応したデータテーブルである。〕を用いて、PARCOR係数をインデックスの数値に変換する。さらに、その数値の符号化方法として2つの例を示す。一つ目の方法は、インデックスの数値を予め決められたビット数で符号ビット(正負を表すビット)を含めて符号化する場合で、係数符号は、インデックスの数値に対応する符号の表〔インデックスの数値と係数符号とが対応したデータテーブルである。〕を参照して求めることができる。二つ目の方法は、PARCOR係数のインデックスの数値に依存して可変長符号を用いる場合である。この場合、PARCOR係数のインデックス値の絶対値によってビット数が異なるので、インデックスの数値の絶対値に対応する符号の表〔インデックスの数値の絶対値と係数符号とが対応したデータテーブルである。〕を参照して係数符号を求める。ここで求めた係数符号の符号量が、PARCOR係数の情報量に相当する。なお、符号化に用いる表を符号化表〔データテーブルである。〕と云うことにする。
<< Information amount of PARCOR coefficient >>
Next, the information amount of the PARCOR coefficient will be described.
The calculation of the information amount of the PARCOR coefficient depends on the quantization method and the encoding method of the PARCOR coefficient. Therefore, here, a general method will be described as an example.
Generally, it is a data table in which a child element table [PARCOR coefficient and its quantized value correspond to each other. ] Is used to convert the PARCOR coefficient into an index value. Further, two examples are shown as encoding methods of the numerical values. The first method is to encode an index value with a predetermined number of bits including a sign bit (a bit representing positive / negative), and the coefficient code is a table of codes corresponding to the index value [index. Is a data table in which the numerical values of and the coefficient codes correspond. ] Can be obtained with reference to. The second method is a case where a variable length code is used depending on the numerical value of the index of the PARCOR coefficient. In this case, since the number of bits varies depending on the absolute value of the index value of the PARCOR coefficient, the code table corresponding to the absolute value of the index value [the data table in which the absolute value of the index value corresponds to the coefficient code. ] To obtain the coefficient code. The code amount of the coefficient code obtained here corresponds to the information amount of the PARCOR coefficient. The table used for encoding is an encoding table [data table. I will say.

また、それぞれ別々のデータテーブルである量子化表および符号化表を用いるのではなく、PARCOR係数の範囲とその範囲に対応する量子化値と符号との組み合わせが、PARCOR係数の取りえる範囲の全てについて記載された量子化・符号化表〔データテーブルである。〕を用いるとしてもよい。
例えば、固定長符号化の場合であれば表1に簡単に例示する量子化・符号化表などを用いることができる。また、可変長符号化の場合であれば表2に簡単に例示する量子化・符号化表などを用いることができる。なお、表2で示す符号は0を指標とする瞬時復号可能な符号となっている。

Figure 2009069309
Figure 2009069309
In addition, the quantization table and the coding table, which are separate data tables, are not used, but the range of the PARCOR coefficient and the combination of the quantization value and the code corresponding to the range are all the ranges that the PARCOR coefficient can take. Quantization / coding table [Data table. ] May be used.
For example, in the case of fixed-length coding, a quantization / coding table that is simply exemplified in Table 1 can be used. In the case of variable length coding, a quantization / coding table that is simply exemplified in Table 2 can be used. The codes shown in Table 2 are codes that can be instantaneously decoded with 0 as an index.
Figure 2009069309
Figure 2009069309

係数符号の符号量の算出には、2つの方法が考えられる。一つ目の方法は、モデル次数1からモデル次数mまでの各モデル次数について求めた全てのPARCOR係数に対応する係数符号の全部の符号量〔全体符号量〕を算出するものである。二つ目の方法は、モデル次数1からモデル次数mまでの各モデル次数ごとに、各モデル次数のときのPARCOR係数に対応する係数符号の符号量〔個別符号量〕をそれぞれ算出するものである。二つ目の方法では、それぞれの係数符号の個別符号量を合計したものをPARCOR係数の情報量として取り扱うことになるが、このことは後述の《最適モデル次数の決定》でも説明する。
以上で《PARCOR係数の情報量》の説明は終わりである。
Two methods are conceivable for calculating the code amount of the coefficient code. The first method is to calculate all code amounts [total code amount] of coefficient codes corresponding to all PARCOR coefficients obtained for each model order from model order 1 to model order m. The second method is to calculate the code amount [individual code amount] of the coefficient code corresponding to the PARCOR coefficient at each model order for each model order from model order 1 to model order m. . In the second method, the sum of the individual code amounts of the respective coefficient codes is handled as the information amount of the PARCOR coefficient. This will also be described in <Determination of Optimal Model Order> described later.
This is the end of the description of “PARCOR coefficient information amount”.

《予測誤差波形の符号量の推定》
次に、線形予測モデルの予測値と入力信号との誤差である予測誤差波形の符号量の推定について説明する。予測誤差波形の符号量の推定は、予測誤差エネルギーを用いて行う。
<< Estimation of code amount of prediction error waveform >>
Next, estimation of the code amount of the prediction error waveform that is an error between the prediction value of the linear prediction model and the input signal will be described. The estimation of the code amount of the prediction error waveform is performed using the prediction error energy.

式(11)を用いると、m次の正規化された予測誤差エネルギーξ について、式(12)が成り立つ。ここでm次の正規化された予測誤差エネルギーξ は、例えば予測誤差エネルギーσ をサンプル数Nで除したものとして与えられる。σ =v=E[x ]であるから、ξ は入力信号の1フレーム分のサンプル系列x,x,・・・,xの平均エネルギーである。但し、正規化は予測誤差エネルギーσ に対するスケーリングの適用であるから、サンプル数Nで除することに限定するものではなく、N−1で除するとしてもよいし、N−mで除するとしてもよく、適宜に設定できる。

Figure 2009069309
When Expression (11) is used, Expression (12) is established for the m-th order normalized prediction error energy ξ m 2 . Here, the m-th order normalized prediction error energy ξ m 2 is given by, for example, dividing the prediction error energy σ m 2 by the number of samples N. Since σ 0 2 = v 0 = E [x t 2 ], ξ 0 2 is the average energy of the sample series x 1 , x 2 ,..., x N for one frame of the input signal. However, since normalization is the application of scaling to the prediction error energy σ m 2, it is not limited to dividing by the number of samples N, and may be divided by N−1 or divided by N−m. And can be set appropriately.
Figure 2009069309

このとき、入力信号が平均0、分散ξ のガウス分布に従うとしたときの、平均絶対値和Dは、式(13)で与えられる。但し、入力信号の時系列サンプル値の平均μが0でない場合には、予め入力信号の時系列サンプル値をμだけ減じることで平均0とすることができる。あるいは、入力信号の時系列サンプル値をそのままに、式(13)に表れる確率変数xをx−μに書き改めるとしてもよい。この場合でも式(13)と同様の結論を得る。なお、このことは後述するラプラス分布の適用についても同様である。

Figure 2009069309
At this time, the mean absolute value sum D when the input signal follows a Gaussian distribution with mean 0 and variance ξ m 2 is given by Expression (13). However, when the average μ of the time series sample values of the input signal is not 0, the average 0 can be obtained by previously subtracting the time series sample values of the input signal by μ. Alternatively, the random variable x shown in the equation (13) may be rewritten to x−μ while keeping the time-series sample value of the input signal as it is. Even in this case, the same conclusion as in the equation (13) is obtained. This also applies to the application of the Laplace distribution described later.
Figure 2009069309

つまり、D≒ξ×0.798として近似できる。 That is, it can be approximated as D≈ξ m × 0.798.

ラプラス分布の場合であれば、平均絶対値和Dは式(14)で与えられる。

Figure 2009069309
In the case of a Laplace distribution, the average absolute value sum D is given by Expression (14).
Figure 2009069309

つまり、D≒ξ×0.707として近似できる。 That is, it can be approximated as D≈ξ m × 0.707.

このように、重みWを用いてD≒ξ×Wと近似できる。ここで、重みWは対象となる信号の統計的性質によって定めることができる。実際に48kHz、16bitの録音時間30秒の音声ファイル15個を用いて、各モデル次数にて、D/ξを求めたところ、頻度は図7に示すようになった(平均値は0.77)。明らかに0.707から0.798の間にある傾向である。従って、対象信号が音響信号の場合には、重みWを概ね0.70以上0.82以下の値に設定すればよい。 In this way, it is possible to approximate D≈ξ m × W using the weight W. Here, the weight W can be determined by the statistical properties of the signal of interest. Actually, D / ξ m was determined for each model order using 15 audio files of 48 kHz, 16 bits and recording time of 30 seconds, and the frequency was as shown in FIG. 77). Obviously, it tends to be between 0.707 and 0.798. Therefore, when the target signal is an acoustic signal, the weight W may be set to a value of approximately 0.70 to 0.82.

ところで、例えば長符号として表3のようなゴロム-ライス符号を用いる場合では、フレームにおける予測誤差波形に必要な符号量の推定値〔推定符号量〕Sは、平均絶対値和Dを用いて式(15)で与えられる。lnは自然対数である。

Figure 2009069309
By the way, for example, when a Golomb-Rice code as shown in Table 3 is used as a long code, an estimated value [estimated code amount] S required for a prediction error waveform in a frame is expressed by an average absolute value sum D. It is given by (15). In is a natural logarithm.
Figure 2009069309

また、入力信号が音声信号のようにラプラス分布を仮定できるものである場合、ラプラス分布のエントロピーHは、式(16)で与えられるから、フレームにおける予測誤差波形に必要な符号量の推定値〔推定符号量〕Sは、式(17)によって近似できる。式中のeはネイピア数である。但し、モデル次数を増加させると、ラプラス分布からガウス分布に近づくため、Nやkを変数とする関数の出力値を重みとして推定符号量Sを補正することで推定精度の向上が望める。処理済のフレーム(前のフレームなど)における実際の符号量と推定符号量とを比較し、その差が小さくなるような重みを用いて、該当フレームの重みを変化させてもよい。多チャネル入力の場合には、他のチャネルの結果と推定量を加味して、重み係数を変化させてもよい。また、単に符号量最小化基準だけでなく、演算量も加味して重み付けを行ってもよい(例えば、モデル次数が低いほうがフィルタのタップ数が少ないため演算量は少なくなる。)。

Figure 2009069309
Figure 2009069309
Also, when the input signal can assume a Laplace distribution like a speech signal, the entropy H of the Laplace distribution is given by Equation (16), so that the estimated amount of code required for the prediction error waveform in the frame [ Estimated code amount] S can be approximated by equation (17). E in the equation is the number of Napier. However, when the model order is increased, the Laplace distribution approaches the Gaussian distribution. Therefore, the estimation accuracy can be improved by correcting the estimated code amount S using the output value of the function having N and k as variables. The actual code amount in the processed frame (such as the previous frame) may be compared with the estimated code amount, and the weight of the corresponding frame may be changed using a weight that reduces the difference. In the case of multi-channel input, the weight coefficient may be changed in consideration of the results of other channels and the estimated amount. Further, weighting may be performed by considering not only the code amount minimization criterion but also the calculation amount (for example, the lower the model order, the smaller the number of filter taps, the smaller the calculation amount).
Figure 2009069309
Figure 2009069309

正規化された予測誤差エネルギーξ として、式(11)で得られる予測誤差エネルギーσ をサンプル数で除したものを採用することに限らず、式(11)のPARCOR係数γを量子化済PARCOR係数qγに置換して得られる予測誤差エネルギーσ をサンプル数で除したものを採用してもよい。 The normalized prediction error energy ξ m 2 is not limited to the one obtained by dividing the prediction error energy σ m 2 obtained by Equation (11) by the number of samples, and the PARCOR coefficient γ m of Equation (11) is it may be employed those obtained by dividing the prediction error energy sigma m 2 obtained by substituting the quantized PARCOR coefficient Qganma m in samples.

また、ここでは予測誤差エネルギーσ として、Levinson-Durbin法で得られた予測誤差エネルギーσ を用いて説明した。しかし、Levinson-Durbin法で得られた予測誤差エネルギーσ に限定する趣旨のものではない。Burg法で得られるm次の平均出力P〔モデル次数mの線形予測モデルにデータx,x,・・・,xを前向きに通す場合および後向きに通す場合の平均出力である。〕についても式(12)と同様の関係が得られるから、この関係に基づく前向き予測誤差エネルギー、後向き予測誤差エネルギーを求め、その算術平均を上記予測誤差エネルギーσ として用いることもできる。
以上で《予測誤差波形の符号量の推定》の説明は終わりである。
In addition, here, the prediction error energy σ m 2 is described using the prediction error energy σ m 2 obtained by the Levinson-Durbin method. However, it is not intended to limit the prediction error energy σ m 2 obtained by the Levinson-Durbin method. M- order average output P m obtained by the Burg method [average output when data x 1 , x 2 ,..., X N are passed forward and backward through a linear prediction model of model order m. ], The same relationship as in the equation (12) is obtained. Therefore, the forward prediction error energy and the backward prediction error energy based on this relationship can be obtained, and the arithmetic average thereof can be used as the prediction error energy σ m 2 .
This is the end of the description of “Estimation of Code Amount of Prediction Error Waveform”.

《最適モデル次数の決定》
最適モデル次数の決定の方法について、特に限定はなく、ここでは4つの方法を例示する。
一つ目の方法(方法A)は、予め設定した探索範囲の各モデル次数m〔探索範囲の全モデル次数ではなく、その一部、例えばnごとの各モデル次数としてもよい。〕について、そのモデル次数におけるPARCOR係数の情報量〔つまり、係数符号量であるが、係数符号量として全体符号量が算出されている場合にはそのまま全体符号量を、係数符号量として個別符号量が算出されている場合にはモデル次数が1からmまでの全モデル次数に対応した各個別符号量を合計した符号量を、PARCOR係数の情報量として扱う。以下同様である。〕と、そのモデル次数における予測誤差波形の推定符号量との合計〔合計符号量〕を求め、その合計符号量が最小になるときのモデル次数を最適モデル次数として決定する。
<Determining the optimal model order>
The method for determining the optimal model order is not particularly limited, and four methods are exemplified here.
In the first method (method A), each model order m in the search range set in advance [not all model orders in the search range, but a part thereof, for example, each model order for each n may be used. ], The information amount of the PARCOR coefficient in the model order [that is, the coefficient code amount, but when the overall code amount is calculated as the coefficient code amount, the entire code amount is used as it is, and the individual code amount is used as the coefficient code amount. Is calculated, the code amount obtained by summing up the individual code amounts corresponding to all model orders of model orders 1 to m is handled as the information amount of the PARCOR coefficient. The same applies hereinafter. And the estimated code amount of the prediction error waveform in the model order [total code amount] is determined, and the model order when the total code amount is minimized is determined as the optimal model order.

二つ目の方法(方法B)は、1つ前に設定されたモデル次数よりも大となるように逐次にモデル次数を設定し、設定されたモデル次数における合計符号量が1つ前に設定されたモデル次数における合計符号量よりも大となったときに、1つ前に設定されたモデル次数を最適モデル次数として決定する。   In the second method (Method B), the model order is sequentially set so as to be larger than the model order set immediately before, and the total code amount in the set model order is set to the previous one. When the total code amount in the model order is set, the model order set immediately before is determined as the optimum model order.

この二つ目の方法では、設定されたモデル次数における合計符号量が1つ前に設定されたモデル次数における合計符号量よりも大となったとき、1つ前に設定されたモデル次数〔暫定最適次数〕から、さらに予め定められただけの先のモデル次数〔例えば、暫定最適次数に正整数Fを加えたモデル次数とする。〕までの各モデル次数における合計符号量〔モニタ合計符号量〕を求め、もし、暫定最適次数での合計符号量よりも少ないモニタ合計符号量となるモデル次数が存在する場合には、暫定最適次数での合計符号量よりも少ないモニタ合計符号量のうち最小のモニタ合計符号量となるときのモデル次数を最適モデル次数とする方法に変形することも可能である。この変形方法(方法C)は、基本的には合計符号量が1つ前に設定されたモデル次数における合計符号量よりも大となった時点での1つ前に設定されたモデル次数〔暫定最適次数〕を最適モデル次数の有力候補としつつ、念のためその先のモデル次数まで合計符号量の増減のチェックを行うものである。   In the second method, when the total code amount in the set model order becomes larger than the total code amount in the previous model order, the model order set in the previous [provisional From the optimal order], a model order that is only a predetermined number (for example, a model order obtained by adding a positive integer F to the provisional optimal order). The total code amount [monitor total code amount] in each model order is obtained, and if there is a model order having a monitor total code amount smaller than the total code amount in the provisional optimum order, the provisional optimum order It is also possible to change to a method in which the model order when the minimum monitor total code amount is smaller than the total code amount in the above is the optimal model order. This modification method (method C) basically uses the model order set immediately before the total code amount larger than the total code amount in the model order set immediately before [provisional The optimal code order] is a promising candidate for the optimal model order, and as a precaution, the increase or decrease in the total code amount is checked up to the model order ahead.

四つ目の方法(方法D)は、設定されたモデル次数における合計符号量が1つ前に設定されたモデル次数における合計符号量よりも大となったとき、1つ前に設定されたモデル次数〔暫定最適次数〕での合計符号量を暫定最小合計符号量とし、暫定最適次数からさらに先のモデル次数における合計符号量を順次に求めていき、この合計符号量が暫定最小合計符号量よりも予め定められた閾値δ以上(あるいは閾値δより大)となったときに処理を中止して、上記暫定最適次数を最適モデル次数として決定する。
以上で《最適モデル次数の決定》の説明は終わりである。
In the fourth method (method D), when the total code amount in the set model order is larger than the total code amount in the model order set immediately before, the model set immediately before The total code amount in the order [provisional optimal order] is set as the provisional minimum total code amount, and the total code amount in the model order further from the provisional optimal order is sequentially obtained. This total code amount is calculated from the provisional minimum total code amount. When the threshold value δ is equal to or greater than a predetermined threshold value δ (or larger than the threshold value δ), the process is stopped and the provisional optimum order is determined as the optimum model order.
This completes the description of “Determining the optimal model order”.

[実施形態]
以下、本発明の実施形態について説明を行う。本発明は線形予測モデルの最適モデル次数を決定するものであるところ、最適モデル次数を決定することを所望として実施するとしてもよいし、例えば信号分析や信号の符号化などに用いられることを所望として実施するとしてもよい。
ここでは、上記従来技術との対比から本発明の特徴を明らかにする観点から、本発明が信号符号化に用いられる場合を例として実施形態の説明を行う。
[Embodiment]
Hereinafter, embodiments of the present invention will be described. In the present invention, the optimal model order of the linear prediction model is determined. The optimal model order may be determined as desired. For example, the optimal model order may be used for signal analysis or signal encoding. You may carry out as.
Here, from the viewpoint of clarifying the characteristics of the present invention from the comparison with the above-described prior art, the embodiment will be described by taking as an example the case where the present invention is used for signal coding.

《第1実施形態》
本発明の第1実施形態について、図面を参照しながら説明する。
<第1実施形態の線形予測モデル次数決定装置>
線形予測モデル次数決定装置(1)は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)、ROM(Read Only Memory)やハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、線形予測モデル次数決定装置(1)に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
<< First Embodiment >>
A first embodiment of the present invention will be described with reference to the drawings.
<Linear Prediction Model Order Determination Device of First Embodiment>
The linear prediction model order determining apparatus (1) may include an input unit to which a keyboard or the like can be connected, an output unit to which a liquid crystal display or the like can be connected, a CPU (Central Processing Unit) [cache memory, or the like. ] RAM (Random Access Memory), ROM (Read Only Memory), and external storage devices such as hard disks, and the exchange of data between these input units, output units, CPU, RAM, ROM, and external storage devices It has a bus that connects as much as possible. If necessary, the linear prediction model order determination device (1) may be provided with a device (drive) that can read and write a storage medium such as a CD-ROM. A physical entity having such hardware resources includes a general-purpose computer.

線形予測モデル次数決定装置(1)の外部記憶装置〔あるいはROMなど〕には、線形予測モデルの最適モデル次数決定のためのプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されており、必要に応じてこれらがメモリに読み込まれる。また、これらのプログラムの処理によって得られるデータなどは、RAMなどのメモリに適宜に記憶されて、さらに適宜に読み出されるなどして情報処理の用に供される。   The external storage device (or ROM, etc.) of the linear prediction model order determination device (1) stores a program for determining the optimal model order of the linear prediction model, data necessary for processing of this program, and the like. These are read into memory as needed. Further, data obtained by the processing of these programs is appropriately stored in a memory such as a RAM, and further read out as appropriate for use in information processing.

所定の時間間隔で標本化された時間離散信号をフレーム毎に分割した各フレームを入力信号xとする。ここではロスレス符号化〔Lossless Coding〕を例とし、入力信号xは整数変換された整数値からなり、サンプル数Nのデータ列としてx,x,・・・,xと表されるとする。入力信号xは、外部記憶装置にデータとして記憶されているとする。また、最適モデル次数は、モデル次数をNminからNmaxまでとした探索範囲をn次〔但し、nはn≧1を満たす整数である。また、NminおよびNmaxはNmax>Nminを満たす正整数である。〕ごとに調べたものの中から決定することにする。なお、以下ではモデル次数mを正整数とする。一般的には、モデル次数の上限をNsupとすると〔無限のモデル次数を調査対象とすることは事実上不可能だからモデル次数の上限を定める。〕、モデル次数が0からNsupまでの範囲に含まれるように探索範囲を設定できる。つまり、0≦Nmin<Nmax≦Nsupである。ただ、Nmax<Nsupの場合は、Nmax+1からNsupまでのモデル次数についてPARCOR係数などを求めても無意味なってしまうので、通常は、Nmax=Nsupとして考えればよい。本明細書ではNmax=Nsupとする。また、Nmin=0の場合を含めるのは、入力信号が例えば白色雑音の場合、ゼロ次の線形予測モデルが最も符号量最小(圧縮率最大)となるからである。 Each frame obtained by dividing a time discrete signal sampled at a predetermined time interval for each frame is set as an input signal x. Here, lossless coding [Lossless Coding] is taken as an example, and the input signal x is composed of integer values obtained by integer conversion, and is expressed as x 1 , x 2 ,..., X N as a data string of N samples. To do. It is assumed that the input signal x is stored as data in the external storage device. The optimal model order is an n-order search range in which the model order is from N min to N max (where n is an integer that satisfies n ≧ 1). N min and N max are positive integers that satisfy N max > N min . ] Will be decided from those investigated. In the following, the model order m is a positive integer. In general, if the upper limit of the model order is N sup [the infinite model order is virtually impossible to investigate, the upper limit of the model order is determined. ], The search range can be set so that the model order is included in the range from 0 to Nsup . That is, 0 ≦ N min <N max ≦ N sup . However, in the case of N max <N sup , it is meaningless to obtain the PARCOR coefficient or the like for the model order from N max +1 to N sup, and therefore it is usually considered that N max = N sup . In this specification, N max = N sup . Also, the case where N min = 0 is included because, for example, when the input signal is white noise, the zero-order linear prediction model has the smallest code amount (maximum compression rate).

各実施形態で扱う信号は、人の音声、音楽、騒音・雑音などの音響信号とする。勿論、音響信号に限定されず、例えば地震波や生体信号(脳波や筋電波形)などでもよい。要するに、線形予測モデルとして表現することが好ましい信号であればよい。   Signals handled in each embodiment are acoustic signals such as human voice, music, and noise / noise. Of course, the signal is not limited to an acoustic signal, and may be, for example, an earthquake wave or a biological signal (an electroencephalogram or a myoelectric waveform). In short, any signal that is preferably expressed as a linear prediction model may be used.

入力信号xが予め外部記憶装置に記憶される構成とするのではなく、例えば、CD−ROMなどの記憶媒体から入力信号xを読み込み外部記憶装置に記憶する構成でも、あるいは、音声信号の場合に、線形予測モデル次数決定装置(1)を具備する信号符号化装置(2)がマイクロフォンを備えるとし、このマイクロフォンで得られた収音信号をA/D変換・整数変換して入力信号xを得る構成とすることなどが考えられる。いずれにしても、A/D変換などを実行するために必要となる構成要素(手段)や記録媒体からのデータ提供技術は、公知技術の常套手段によって達成されるから、説明および図示を略する。   The input signal x is not stored in the external storage device in advance. For example, the input signal x is read from a storage medium such as a CD-ROM and stored in the external storage device, or in the case of an audio signal. Suppose that the signal encoding device (2) including the linear prediction model order determining device (1) includes a microphone, and an input signal x is obtained by performing A / D conversion and integer conversion on the collected sound signal obtained by the microphone. It can be considered to be configured. In any case, the component (means) necessary for executing A / D conversion and the like and the data providing technology from the recording medium are achieved by conventional means of the publicly known technology, and therefore the description and illustration are omitted. .

外部記憶装置には、上述した量子化・符号化表(データテーブル)が記憶されている。   The external storage device stores the above-described quantization / coding table (data table).

また外部記憶装置には、PARCOR係数・予測誤差エネルギーを算出するためのプログラム、予測誤差波形の符号量の推定をするためのプログラム、係数符号量を算出するためのプログラム、最適モデル次数を決定するためのプログラムが記憶されている。その他、これらのプログラムに基づく処理を制御するための制御プログラムも適宜に保存しておいてよい。   In the external storage device, a program for calculating the PARCOR coefficient / prediction error energy, a program for estimating the code amount of the prediction error waveform, a program for calculating the coefficient code amount, and an optimal model order are determined. A program for storing is stored. In addition, a control program for controlling processing based on these programs may be stored as appropriate.

線形予測モデル次数決定装置(1)では、外部記憶装置に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(PARCOR係数算出部、予測誤差符号量推定部、係数符号量算出部、最適モデル次数探索部、制御部)を実現することで線形予測モデルの最適モデル次数決定が実現される。   In the linear prediction model order determination device (1), each program stored in the external storage device and data necessary for processing each program are read into the RAM as necessary, and are interpreted and executed by the CPU. As a result, the CPU realizes predetermined functions (PARCOR coefficient calculation unit, prediction error code amount estimation unit, coefficient code amount calculation unit, optimal model order search unit, control unit), thereby determining the optimal model order of the linear prediction model. Realized.

<第1実施形態の線形予測モデル次数決定処理>
次に、図1および図2を参照して、線形予測モデル次数決定装置(1)における最適モデル次数決定処理の流れを叙述的に説明する。第1実施形態は上記方法Aによって最適モデル次数を決定する。
<Linear Prediction Model Order Determination Process of First Embodiment>
Next, with reference to FIG. 1 and FIG. 2, the flow of the optimal model order determination process in the linear prediction model order determination apparatus (1) will be described descriptively. In the first embodiment, the optimal model order is determined by the above method A.

まず、PARCOR係数算出部(141)は、入力信号xを入力として、モデル次数が1からNmaxまでの各モデル次数について、それぞれのモデル次数におけるPARCOR係数γ〔m=1,2,・・・,Nmax〕、予測誤差エネルギーσ 〔m=1,2,・・・,Nmax〕をそれぞれ算出する(ステップS11)。PARCOR係数・予測誤差エネルギーの算出方法は、《PARCOR係数・予測誤差エネルギーの算出》で説明したとおりであり、式(9)に従ってPARCOR係数γを求め、式(11)に従って予測誤差エネルギーσ を求めることができる。予測誤差エネルギーσ は式(9)に拠るPARCOR係数算出の過程で得られるから、予測誤差エネルギー算出部(141a)はPARCOR係数算出過程で記憶しておいた予測誤差エネルギーσ を出力すればよい。
各予測誤差エネルギーσ 〔m=1,2,・・・,Nmax〕は予測誤差符号量推定部(142)の入力となる。各PARCOR係数γ〔m=1,2,・・・,Nmax〕は、係数符号量算出部(143)の入力となる。
First, the PARCOR coefficient calculation unit (141) receives the input signal x and inputs the PARCOR coefficient γ m [m = 1, 2,... At each model order for each model order from 1 to N max. ., N max ] and prediction error energy σ m 2 [m = 1, 2,..., N max ] are calculated (step S11). The calculation method of the PARCOR coefficient / prediction error energy is as described in << Calculation of PARCOR coefficient / prediction error energy >>, the PARCOR coefficient γ m is obtained according to the equation (9), and the prediction error energy σ m is calculated according to the equation (11). 2 can be obtained. Since the prediction error energy σ m 2 is obtained in the process of calculating the PARCOR coefficient according to the equation (9), the prediction error energy calculation unit (141a) outputs the prediction error energy σ m 2 stored in the PARCOR coefficient calculation process. do it.
Each prediction error energy σ m 2 [m = 1, 2,..., N max ] is input to the prediction error code amount estimation unit (142). Each PARCOR coefficient γ m [m = 1, 2,..., N max ] is input to the coefficient code amount calculation unit (143).

次いで、予測誤差符号量推定部(142)は、各予測誤差エネルギーσ 〔m=1,2,・・・,Nmax〕を用いて、予測誤差波形の符号量の推定値〔推定符号量〕Ce〔m=1,2,・・・,Nmax〕を算出する(ステップS12)。各推定符号量の算出は、《予測誤差波形の符号量の推定》で説明したとおりであり、いずれか1つの方法を用いてm=1,2,・・・,Nmaxの各モデル次数ごとに行う。例えば、D≒ξ ×Wの演算結果を用いて式(15)により推定符号量Sを算出する。なお、重みWおよび正規化で用いるサンプル数Nは、例えば予め外部記憶装置等に記憶しておく。この推定符号量Sが推定符号量Ce〔m=1,2,・・・,Nmax〕である。
各推定符号量Ce〔m=1,2,・・・,Nmax〕は、最適モデル次数探索部(144)の入力となる。
Next, the prediction error code amount estimation unit (142) uses each prediction error energy σ m 2 [m = 1, 2,..., N max ] to estimate the code error estimated value [estimated code]. Amount] Ce m [m = 1, 2,..., N max ] is calculated (step S12). The calculation of each estimated code amount is as described in << Estimation of code amount of prediction error waveform >>, and for each model order of m = 1, 2,..., N max using any one method. To do. For example, the estimated code amount S is calculated by Expression (15) using the calculation result of D≈ξ m 2 × W. The weight W and the number N of samples used for normalization are stored in advance in an external storage device, for example. The estimated code amount S is the estimated code amount Ce m [m = 1, 2,..., N max ].
Each estimated code amount Ce m [m = 1, 2,..., N max ] is input to the optimum model order search unit (144).

また、係数符号量算出部(143)は、各PARCOR係数γ〔m=1,2,・・・,Nmax〕を用いて、係数符号量Cp〔m=1,2,・・・,Nmax〕を算出する(ステップS13)。係数符号量の算出は、《PARCOR係数の情報量》で説明したとおりであり、いずれか1つの方法を用いて行うが、この実施形態では一例として個別符号量を求める場合とする。
各係数符号量Cp〔m=1,2,・・・,Nmax〕は、最適モデル次数探索部(144)の入力となる。
In addition, the coefficient code amount calculation unit (143) uses each PARCOR coefficient γ m [m = 1, 2,..., N max ] to use the coefficient code amount Cp m [m = 1, 2,. , N max ] is calculated (step S13). The calculation of the coefficient code amount is as described in << Information amount of PARCOR coefficient >>, and is performed using any one method. In this embodiment, the individual code amount is obtained as an example.
Each coefficient code amount Cp m [m = 1, 2,..., N max ] is input to the optimum model order search unit (144).

ステップS12およびステップS13は、いずれを先行するものとしてもよい。つまり、ステップS11、ステップS12、ステップS13の順序で処理することもできるし、ステップS11、ステップS13、ステップS12の順序で処理することもできる。   Either step S12 or step S13 may precede. That is, processing can be performed in the order of step S11, step S12, and step S13, and processing can also be performed in the order of step S11, step S13, and step S12.

次に、最適モデル次数探索部(144)は、各係数符号量Cp〔m=1,2,・・・,Nmax〕および各推定符号量Ce〔m=1,2,・・・,Nmax〕から線形予測モデルの最適モデル次数を決定する。その処理を説明する。 Then, the optimal model order searching unit (144), each coefficient code amount Cp m [m = 1,2, ···, N max] and each estimated amount of code Ce m [m = 1, 2, · · · , N max ] determines the optimal model order of the linear prediction model. The process will be described.

まず、最適モデル次数探索部(144)は、探索範囲であるNminからNmaxまでの各モデル次数について、各モデル次数における合計符号量を算出する(ステップS14)。つまり、Nmin≦m≦Nmaxなるnごとの各モデル次数m〔上記探索対象モデル次数〕について、モデル次数mまでの個別符号量の合計と、モデル次数mにおける予測誤差波形の推定符号量との合計を求める。 First, the optimum model order search unit (144) calculates the total code amount in each model order for each model order from N min to N max that is the search range (step S14). That is, for each model order m [the search target model order] for each of n min ≦ m ≦ N max , the total of the individual code amounts up to the model order m, and the estimated code amount of the prediction error waveform at the model order m Find the sum of

次に、最適モデル次数探索部(144)は、反復処理用のパラメータjにNminを設定し、最小合計符号量の探索用のパラメータMに任意の値(初期値)を設定する(ステップS15)。この初期値は十分に大きな値に設定する。 Next, the optimum model order search unit (144) sets N min to the parameter j for iterative processing, and sets an arbitrary value (initial value) to the parameter M for searching for the minimum total code amount (step S15). ). This initial value is set to a sufficiently large value.

次に、最適モデル次数探索部(144)は、モデル次数jにおける合計符号量〔つまりモデル次数1からjまでの各個別符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計である。〕とMとの大小を判定する(ステップS16)。第1実施形態では、M>(モデル次数jにおける合計符号量)の成立を判定する。
M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)はステップS17の処理を実行する。M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)はステップS18の処理を実行する。
Next, the optimum model order search unit (144) calculates the total code amount in the model order j (that is, the sum of the individual code amounts from the model orders 1 to j and the estimated code amount of the prediction error waveform in the model order j). Total. ] And M are determined (step S16). In the first embodiment, it is determined whether M> (total code amount in model order j) is satisfied.
If it is true that M> (total code amount in model order j) is true, optimal model order search unit (144) executes the process of step S17. If the establishment of M> (total code amount in model order j) is false, the optimal model order search unit (144) executes the process of step S18.

M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)は、最適モデル次数決定用のパラメータNoptにパラメータjの値を代入し、さらに、パラメータMにモデル次数jにおける合計符号量を代入する(ステップS17)。次いで、ステップS18の処理が実行される。 If it is true that M> (total code amount in model order j) is true, the optimum model order search unit (144) substitutes the value of parameter j for parameter N opt for determining the optimum model order, and parameter M Is substituted with the total code amount in the model order j (step S17). Next, the process of step S18 is executed.

最適モデル次数探索部(144)は、パラメータjとモデル次数Nmaxとの大小を比較判定する(ステップS18)。第1実施形態では、j≧Nmaxの成立を判定する。
j≧Nmaxの成立が真ならば、最適モデル次数探索部(144)は最適モデル次数決定処理を終了する。つまり、この時点でのパラメータNoptの値が最適モデル次数である。この最適モデル次数Noptを表す次数情報は信号符号化装置(2)の出力となる場合がある。また、最適モデル次数Noptは、PARCOR係数量子化部(145)の入力となる。
j≧Nmaxの成立が偽ならば、最適モデル次数探索部(144)はステップS19の処理を実行する。
The optimum model order search unit (144) compares and determines the magnitude of the parameter j and the model order Nmax (step S18). In the first embodiment, it is determined whether j ≧ N max is satisfied.
If the establishment of j ≧ N max is true, the optimum model order search unit (144) ends the optimum model order determination process. That is, the value of the parameter N opt at this time is the optimal model order. The order information representing the optimum model order N opt may be output from the signal encoding device (2). The optimal model order N opt is an input to the PARCOR coefficient quantization unit (145).
If the establishment of j ≧ N max is false, the optimum model order search unit (144) executes the process of step S19.

最適モデル次数探索部(144)は、パラメータjにnを加算したもの、つまりj+nをパラメータjの新たな値に設定し(ステップS19)、ステップS16〜S18の処理を行う。   The optimal model order search unit (144) sets n to the parameter j, that is, j + n as a new value of the parameter j (step S19), and performs the processing of steps S16 to S18.

以下、最適モデル次数を得た後の信号符号化に関わる処理を説明する。
PARCOR係数量子化部(145)は、PARCOR係数算出部(141)によって得られた各PARCOR係数γ〔m=1,2,・・・,Nopt〕を量子化して、モデル次数が1からNoptまでの各モデル次数について量子化済PARCOR係数qγ〔m=1,2,・・・,Nopt〕をそれぞれ算出する。各量子化済PARCOR係数qγ〔m=1,2,・・・,Nopt〕は、線形予測係数変換部(146)の入力となる。
また、PARCOR係数量子化部(145)は、各量子化済PARCOR係数qγ〔m=1,2,・・・,Nopt〕それぞれについて、量子化表を用いて量子化済PARCOR係数をインデックスの数値に変換し、これらを符号化して、係数符号Cp〔m=1,2,・・・,Nopt〕をそれぞれ算出する。各係数符号Cp〔m=1,2,・・・,Nopt〕は信号符号化装置(2)の出力となる。
Hereinafter, processing related to signal encoding after obtaining the optimal model order will be described.
The PARCOR coefficient quantization unit (145) quantizes each PARCOR coefficient γ m [m = 1, 2,..., N opt ] obtained by the PARCOR coefficient calculation unit (141). Quantized PARCOR coefficients qγ m [m = 1, 2,..., N opt ] are calculated for each model order up to N opt . Each quantized PARCOR coefficient qγ m [m = 1, 2,..., N opt ] is an input to the linear prediction coefficient conversion unit (146).
Further, the PARCOR coefficient quantizing unit (145) indexes the quantized PARCOR coefficient using the quantization table for each quantized PARCOR coefficient qγ m [m = 1, 2,..., N opt ]. Are encoded, and coefficient codes Cp m [m = 1, 2,..., N opt ] are respectively calculated. Each coefficient code Cp m [m = 1, 2,..., N opt ] is an output of the signal encoding device (2).

次に、線形予測係数変換部(146)は、各量子化済PARCOR係数qγm,m〔m=1,2,・・・,Nopt〕から、式(10)に従い、〔量子化済みの〕線形予測係数a (g)〔g=Nopt、k=1,2,・・・,g〕を算出する。〔量子化済みの〕各線形予測係数a (g)〔g=Nopt、k=1,2,・・・,g〕は、予測誤差フィルタ部(147)の入力となる。 Next, the linear prediction coefficient conversion unit (146) calculates [quantized] from each quantized PARCOR coefficient qγ m, m [m = 1, 2,..., N opt ] according to the equation (10). ] Linear prediction coefficient a k (g) [g = N opt , k = 1, 2,..., G] is calculated. The [quantized] linear prediction coefficients a k (g) [g = N opt , k = 1, 2,..., G] are input to the prediction error filter unit (147).

次に、予測誤差フィルタ部(147)は、入力信号xも入力として、線形予測係数a (g)〔k=1,2,・・・,g〕を予測係数とした予測誤差フィルタに入力信号xを例えば前向きで通し、入力信号xと線形予測係数a (g)からなるモデル次数gの線形予測モデルの予測値との誤差である予測誤差信号〔予測誤差波形〕eを出力する。
線形予測誤差信号eは、誤差信号符号化部(148)の入力となる。
Next, the prediction error filter unit (147) receives the input signal x as an input and inputs it to the prediction error filter using the linear prediction coefficients a k (g) [k = 1, 2,..., G] as prediction coefficients. the signal x through prospective example, and outputs a prediction error signal [prediction error waveform] e g is the error between the predicted value of the linear prediction model of model order g consisting of the input signal x and the linear prediction coefficients a k (g) .
Linear prediction error signal e g becomes an input of the error signal encoding unit (148).

次に、誤差信号符号化部(148)は、予測誤差信号eを符号化して、誤差信号符号C〔g=Nopt〕を出力する。この誤差信号符号C〔g=Nopt〕は信号符号化装置(2)の出力となる。 Next, the error signal encoding unit (148) is to encode the prediction error signal e g, to output an error signal code C g [g = N opt]. This error signal code C g [g = N opt ] is the output of the signal encoding device (2).

第1実施形態では、係数符号量算出部(143)が個別符号量を算出する場合として説明した。係数符号量算出部(143)が全体符号量を算出する場合には、ステップS16の処理において、最適モデル次数探索部(144)は、モデル次数jにおける合計符号量〔つまり全体符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計である。〕とMとの大小を判定すればよい。   In the first embodiment, the coefficient code amount calculation unit (143) has been described as the case of calculating the individual code amount. When the coefficient code amount calculation unit (143) calculates the total code amount, in the process of step S16, the optimum model order search unit (144) determines the total code amount in the model order j [that is, the total code amount and , And the estimated code amount of the prediction error waveform at the model order j. ] And M may be determined.

《第2実施形態》
本発明の第2実施形態について、図面を参照しながら説明する。
第2実施形態の線形予測モデル次数決定装置のハードウェア構成やプログラムなどは第1実施形態の場合と同様であるから説明を略する。
<第2実施形態の線形予測モデル次数決定処理>
図1、図3および図4を参照して、第2実施形態の線形予測モデル次数決定装置(1)における最適モデル次数決定処理の流れを叙述的に説明する。第2実施形態は上記方法Cによって最適モデル次数を決定する。なお、《PARCOR係数・予測誤差エネルギーの算出》、《予測誤差波形の符号量の推定》、《PARCOR係数の情報量》については既に説明したとおりであるから説明を略する〔[技術説明]および《第1実施形態》を参照のこと。〕。
<< Second Embodiment >>
A second embodiment of the present invention will be described with reference to the drawings.
Since the hardware configuration and program of the linear prediction model order determination device of the second embodiment are the same as those of the first embodiment, description thereof will be omitted.
<Linear Prediction Model Order Determination Process of Second Embodiment>
With reference to FIG. 1, FIG. 3, and FIG. 4, the flow of the optimal model order determination process in the linear prediction model order determination apparatus (1) of the second embodiment will be described descriptively. In the second embodiment, the optimal model order is determined by the above method C. Note that << calculation of PARCOR coefficient / prediction error energy >>, << estimation of code amount of prediction error waveform >>, and << amount of information of PARCOR coefficient >> are as described above, and thus description thereof is omitted [[technical description] and See << First Embodiment >>. ].

まず、制御部(190)は、パラメータjにNminを設定し、パラメータfに1を設定する(ステップS21)。 First, the control unit (190) sets N min for the parameter j and 1 for the parameter f (step S21).

次に、PARCOR係数算出部(141)は、入力信号xを入力として、モデル次数が1からjまでの各モデル次数について、それぞれのモデル次数におけるPARCOR係数γ〔m=1,2,・・・,j〕、予測誤差エネルギーσ 〔m=1,2,・・・,j〕をそれぞれ算出する(ステップS22)。
各予測誤差エネルギーσ 〔m=1,2,・・・,j〕は予測誤差符号量推定部(142)の入力となる。各PARCOR係数γ〔m=1,2,・・・,j〕は、係数符号量算出部(143)の入力となる。
Next, the PARCOR coefficient calculation unit (141) receives the input signal x and inputs the PARCOR coefficient γ m [m = 1, 2,... , J] and prediction error energy σ m 2 [m = 1, 2,..., J] are calculated (step S22).
Each prediction error energy σ m 2 [m = 1, 2,..., J] is input to the prediction error code amount estimation unit (142). Each PARCOR coefficient γ m [m = 1, 2,..., J] is input to a coefficient code amount calculation unit (143).

次いで、予測誤差符号量推定部(142)は、各予測誤差エネルギーσ 〔m=1,2,・・・,j〕を用いて、予測誤差波形の符号量の推定値〔推定符号量〕Ce〔m=j〕を算出する(ステップS23)。
各推定符号量Ce〔m=j〕は、最適モデル次数探索部(144)の入力となる。
Next, the prediction error code amount estimation unit (142) uses each prediction error energy σ m 2 [m = 1, 2,..., J] to estimate the code error estimated value [estimated code amount]. ] Ce m [m = j] is calculated (step S23).
Each estimated code amount Ce m [m = j] is input to the optimum model order search unit (144).

また、係数符号量算出部(143)は、各PARCOR係数γ〔m=1,2,・・・,j〕を用いて、個別符号量として係数符号量Cp〔m=1,2,・・・,j〕を算出する(ステップS24)。各係数符号量Cp〔m=1,2,・・・,j〕は、最適モデル次数探索部(144)の入力となる。 The coefficient code amount calculating section (143), each PARCOR coefficient gamma m [m = 1,2, ···, j] using a coefficient as a separate code amount code amount Cp m [m = 1, 2, ..., J] are calculated (step S24). Each coefficient code amount Cp m [m = 1, 2,..., J] is input to the optimum model order search unit (144).

ステップS23およびステップS24は、いずれを先行するものとしてもよい。つまり、ステップS21、ステップS22、ステップS23、ステップS24の順序で処理することもできるし、ステップS21、ステップS22、ステップS24、ステップS23の順序で処理することもできる。   Either step S23 or step S24 may precede. That is, it can also process in the order of step S21, step S22, step S23, and step S24, and can also process in the order of step S21, step S22, step S24, and step S23.

次に、最適モデル次数探索部(144)は、逐次に設定されるモデル次数mの係数符号量Cp〔m=1,2,・・・,j〕および推定符号量Ce〔m=j〕を用いて線形予測モデルの最適モデル次数を決定する。その処理を説明する。 Next, the optimal model order search unit (144) sequentially sets the coefficient code amount Cp m [m = 1, 2,..., J] and the estimated code amount Ce m [m = j] of the model order m. ] Is used to determine the optimal model order of the linear prediction model. The process will be described.

まず、最適モデル次数探索部(144)は、モデル次数jにおける合計符号量を算出する(ステップS25)。つまり、モデル次数1からjまでの各個別符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計を求める。   First, the optimal model order search unit (144) calculates the total code amount in the model order j (step S25). That is, the sum of the individual code amounts from model orders 1 to j and the estimated code amount of the prediction error waveform at model order j is obtained.

次に、最適モデル次数探索部(144)は、パラメータjがNminに等しいか否かの判定する(ステップS26)。
パラメータjがNminに等しいならば、最適モデル次数探索部(144)はステップS29の処理を実行する。パラメータjがNminに等しくないならば、最適モデル次数探索部(144)はステップS27の処理を実行する。
Next, the optimal model order search unit (144) determines whether or not the parameter j is equal to N min (step S26).
If the parameter j is equal to N min , the optimal model order search unit (144) executes the process of step S29. If the parameter j is not equal to N min , the optimal model order search unit (144) executes the process of step S27.

この段階ではj=Nminであるから、ステップS29の処理を行う。
最適モデル次数探索部(144)は、パラメータMにモデル次数jにおける合計符号量を設定する(ステップS29)。次いで制御部(190)は、パラメータjにnを加算したもの、つまりj+nをパラメータjの新たな値に設定し(ステップS30)、ステップS22〜S26の処理を行うように制御する。
Since j = N min at this stage, the process of step S29 is performed.
The optimum model order search unit (144) sets the total code amount in the model order j as the parameter M (step S29). Next, the control unit (190) sets the parameter j obtained by adding n, that is, j + n to a new value of the parameter j (step S30), and performs control so as to perform the processing of steps S22 to S26.

この段階を経れば、ステップS26の処理でパラメータjがNminに等しいと判定されることはないので、ステップS27の処理を行うことになる。
最適モデル次数探索部(144)は、モデル次数jにおける合計符号量〔つまりモデル次数1からjまでの各個別符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計である。〕とMとの大小を判定する(ステップS27)。第2実施形態では、第1実施形態と同様にM>(モデル次数jにおける合計符号量)の成立を判定する。
M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)はステップS28の処理を実行する。M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)はステップS32aの処理を実行する。
After this stage, since it is not determined that the parameter j is equal to N min in the process of step S26, the process of step S27 is performed.
The optimal model order search unit (144) is the total code amount in the model order j [that is, the sum of the individual code amounts from model orders 1 to j and the estimated code amount of the prediction error waveform in model order j. . ] And M are determined (step S27). In the second embodiment, whether or not M> (total code amount in model order j) is determined as in the first embodiment.
If it is true that M> (total code amount in model order j) is true, optimal model order search unit (144) executes the process of step S28. If the establishment of M> (total code amount in model order j) is false, the optimum model order search unit (144) executes the process of step S32a.

最適モデル次数探索部(144)は、j−nの値をパラメータjtempに代入する(ステップS32a)。 The optimal model order search unit (144) substitutes the value of j−n for the parameter j temp (step S32a).

次に、最適モデル次数探索部(144)は、パラメータfと定数F〔上記の正整数Fに同じであり、予めメモリに記憶されている。〕との大小を比較判定する(ステップS32b)。第2実施形態では、f≧Fの成立を判定する。
この段階では、f≧Fの成立が偽であり、ステップS33の処理が実行される。
Next, the optimum model order search unit (144) has a parameter f and a constant F [the same as the positive integer F described above, and is stored in the memory in advance. ] Is compared and determined (step S32b). In the second embodiment, it is determined whether f ≧ F is satisfied.
At this stage, establishment of f ≧ F is false, and the process of step S33 is executed.

最適モデル次数探索部(144)は、パラメータfに1を加算したもの、つまりf+1をパラメータfの新たな値に設定する(ステップS33)。   The optimum model order search unit (144) sets a value obtained by adding 1 to the parameter f, that is, f + 1 to a new value of the parameter f (step S33).

続いて、最適モデル次数探索部(144)は、パラメータjに1を加算したもの、つまりj+1をパラメータjの新たな値に設定する(ステップS34)。   Subsequently, the optimum model order search unit (144) sets the parameter j plus 1, that is, j + 1 as a new value of the parameter j (step S34).

そして、制御部(190)は、ステップS35〜S39の処理を実行するように制御する。ステップS35の処理はステップS22の処理に、ステップS36の処理はステップS23の処理に、ステップS37の処理はステップS24の処理に、ステップS38の処理はステップS25の処理に、ステップS39の処理はステップS27の処理に同じであるから説明を略する。   And a control part (190) is controlled to perform the process of step S35-S39. The process of step S35 is the process of step S22, the process of step S36 is the process of step S23, the process of step S37 is the process of step S24, the process of step S38 is the process of step S25, and the process of step S39 is the step. Since it is the same as the process of S27, description is abbreviate | omitted.

ステップS39の処理で、M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)はステップS40の処理を実行する。ステップS40の処理はステップS29の処理に同じであるから説明を略する。ステップS40の処理に続いてステップS41の処理が行われる。即ち、最適モデル次数探索部(144)は、パラメータjの値をパラメータjtempに代入する(ステップS41)。
ステップS39の処理で、M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)はステップS32bの処理を実行する。
If M> (total code amount in model order j) is true in the process of step S39, the optimum model order search unit (144) executes the process of step S40. Since the process of step S40 is the same as the process of step S29, description is abbreviate | omitted. Following the process of step S40, the process of step S41 is performed. That is, the optimal model order search unit (144) substitutes the value of the parameter j for the parameter j temp (step S41).
If it is determined in step S39 that M> (total code amount in model order j) is false, the optimum model order search unit (144) executes step S32b.

ステップS32bの処理において、f≧Fの成立が真になるまで、ステップS33〜S41の処理が行われる。
ステップS32bの処理において、f≧Fの成立が真ならば、最適モデル次数探索部(144)は最適モデル次数Noptにパラメータjtempの値を代入する(ステップS42)。そして、最適モデル次数探索部(144)は最適モデル次数決定処理を終了する。この最適モデル次数Noptを表す次数情報は信号符号化装置(2)の出力となる場合がある。また、最適モデル次数Noptは、PARCOR係数量子化部(145)の入力となりえる。
In the process of step S32b, the processes of steps S33 to S41 are performed until f ≧ F is true.
If f ≧ F is true in the process of step S32b, the optimum model order search unit (144) substitutes the value of the parameter j temp for the optimum model order N opt (step S42). Then, the optimum model order search unit (144) ends the optimum model order determination process. The order information representing the optimum model order N opt may be output from the signal encoding device (2). Further, the optimal model order N opt can be input to the PARCOR coefficient quantization unit (145).

ステップS27の処理において、M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)は、パラメータjとモデル次数Nmaxとの大小を比較判定する(ステップS28)。第2実施形態では、第1実施形態と同様に、j≧Nmaxの成立を判定する。
j≧Nmaxの成立が真ならば、最適モデル次数探索部(144)は最適モデル次数Noptにパラメータjの値を代入する(ステップS31)。そして、最適モデル次数探索部(144)は最適モデル次数決定処理を終了する。この最適モデル次数Noptを表す次数情報は信号符号化装置(2)の出力となる場合がある。また、最適モデル次数Noptは、PARCOR係数量子化部(145)の入力となりえる。
ステップS28の処理において、j≧Nmaxの成立が偽ならば、最適モデル次数探索部(144)はステップS29の処理を実行する。ステップS29以降の処理は上記に説明したとおりである。
If M> (total code amount in model order j) is true in the process of step S27, the optimum model order search unit (144) compares and determines the magnitude of parameter j and model order N max (step S27). S28). In the second embodiment, as in the first embodiment, it is determined whether j ≧ N max is satisfied.
If the establishment of j ≧ N max is true, the optimum model order search unit (144) substitutes the value of the parameter j for the optimum model order N opt (step S31). Then, the optimum model order search unit (144) ends the optimum model order determination process. The order information representing the optimum model order N opt may be output from the signal encoding device (2). Further, the optimal model order N opt can be input to the PARCOR coefficient quantization unit (145).
If it is determined in step S28 that j ≧ N max is false, the optimal model order search unit (144) executes step S29. The processing after step S29 is as described above.

第2実施形態では、係数符号量算出部(143)が個別符号量を算出する場合として説明した。係数符号量算出部(143)が全体符号量を算出する場合には、ステップS27の処理において、最適モデル次数探索部(144)は、全体符号量と、モデル次数jにおける予測誤差波形の推定符号量との合計を求めればよい。また、ステップS27の処理において、最適モデル次数探索部(144)は、モデル次数jにおける合計符号量〔つまり全体符号量の合計と、モデル次数jにおける予測誤差波形の推定符号量との合計である。〕とMとの大小を判定すればよい。   In the second embodiment, the case where the coefficient code amount calculation unit (143) calculates the individual code amount has been described. When the coefficient code amount calculation unit (143) calculates the total code amount, in the process of step S27, the optimum model order search unit (144) determines the total code amount and the estimated code of the prediction error waveform at the model order j. What is necessary is just to calculate | require the total with quantity. In the process of step S27, the optimal model order search unit (144) calculates the total code amount in the model order j [that is, the sum of the total code amount and the estimated code amount of the prediction error waveform in the model order j. . ] And M may be determined.

最適モデル次数を得た後の例えば信号符号化に関わる処理を行う場合は、第1実施形態で説明したとおりであるから説明を略する。   For example, when processing related to signal encoding after obtaining the optimal model order is performed, the description is omitted because it is as described in the first embodiment.

《第3実施形態》
本発明の第3実施形態について、図面を参照しながら説明する。
第3実施形態の線形予測モデル次数決定装置のハードウェア構成やプログラムなどは、第1実施形態、第2実施形態の場合と同様であるから説明を略する。
<第3実施形態の線形予測モデル次数決定処理>
図1、図5および図6を参照して、第3実施形態の線形予測モデル次数決定装置(1)における最適モデル次数決定処理の流れを叙述的に説明する。第3実施形態は上記方法Dによって最適モデル次数を決定する。
処理の骨子は第2実施形態と同様であるから、ここでは第2実施形態と異なる部分について説明を行う。
<< Third Embodiment >>
A third embodiment of the present invention will be described with reference to the drawings.
Since the hardware configuration and program of the linear prediction model order determination device of the third embodiment are the same as those of the first embodiment and the second embodiment, description thereof will be omitted.
<Linear Prediction Model Order Determination Processing of Third Embodiment>
With reference to FIG. 1, FIG. 5, and FIG. 6, the flow of the optimum model order determination process in the linear prediction model order determination apparatus (1) of the third embodiment will be described narratively. In the third embodiment, the optimum model order is determined by the above method D.
Since the outline of the processing is the same as that of the second embodiment, only parts different from those of the second embodiment will be described here.

まず、制御部(190)は、パラメータjにNminを設定する(ステップS21a)。ステップS21aに続いて、第2実施形態で説明したステップS22以降の処理を行う。 First, the control unit (190) sets N min to the parameter j (step S21a). Subsequent to step S21a, the processing after step S22 described in the second embodiment is performed.

第3実施形態ではステップS27の処理において、M>(モデル次数jにおける合計符号量)の成立が偽ならば、ステップS32以降の処理を実行する。   In the third embodiment, if M> (total code amount in model order j) is false in the process of step S27, the processes after step S32 are executed.

最適モデル次数探索部(144)は、j−nの値をパラメータjtempに代入する(ステップS32)。 The optimal model order search unit (144) substitutes the value of j−n for the parameter j temp (step S32).

次に、最適モデル次数探索部(144)は、ステップS33の処理を行う。ステップS33の処理は、ステップS28の処理と同じである。
j≧Nmaxの成立が偽ならば、ステップS34の処理を行う。j≧Nmaxの成立が真ならば、ステップS42の処理を行う。
Next, the optimal model order search unit (144) performs the process of step S33. The process of step S33 is the same as the process of step S28.
If the establishment of j ≧ N max is false, the process of step S34 is performed. If the establishment of j ≧ N max is true, the process of step S42 is performed.

最適モデル次数探索部(144)は、パラメータjに1を加算したもの、つまりj+1をパラメータjの新たな値に設定する(ステップS34)。なお、この例では1加算とするが、2以上の値を加算するとしてもよい。   The optimal model order search unit (144) sets a value obtained by adding 1 to the parameter j, that is, j + 1 as a new value of the parameter j (step S34). In this example, 1 is added, but two or more values may be added.

そして、制御部(190)は、ステップS35〜S39の処理を実行するように制御する。ステップS35の処理はステップS22の処理に、ステップS36の処理はステップS23の処理に、ステップS37の処理はステップS24の処理に、ステップS38の処理はステップS25の処理に、ステップS39の処理はステップS27の処理に同じであるから説明を略する。   And a control part (190) is controlled to perform the process of step S35-S39. The process of step S35 is the process of step S22, the process of step S36 is the process of step S23, the process of step S37 is the process of step S24, the process of step S38 is the process of step S25, and the process of step S39 is the step. Since it is the same as the process of S27, description is abbreviate | omitted.

ステップS39の処理で、M>(モデル次数jにおける合計符号量)の成立が真ならば、最適モデル次数探索部(144)はステップS40の処理を実行する。ステップS40の処理はステップS29の処理に同じであるから説明を略する。ステップS40の処理に続いてステップS41の処理が行われる。即ち、最適モデル次数探索部(144)は、パラメータjの値をパラメータjtempに代入する(ステップS41)。ステップS41の処理の後、ステップS33の処理が行われる。
ステップS39の処理で、M>(モデル次数jにおける合計符号量)の成立が偽ならば、最適モデル次数探索部(144)はステップS39aの処理を実行する。
If M> (total code amount in model order j) is true in the process of step S39, the optimum model order search unit (144) executes the process of step S40. Since the process of step S40 is the same as the process of step S29, description thereof is omitted. Following the process of step S40, the process of step S41 is performed. That is, the optimal model order search unit (144) substitutes the value of the parameter j for the parameter j temp (step S41). After the process of step S41, the process of step S33 is performed.
If it is determined in step S39 that M> (total code amount in model order j) is false, the optimum model order search unit (144) executes step S39a.

最適モデル次数探索部(144)は、(モデル次数jにおける合計符号量)≧(M+δ)の成立を判定する。(モデル次数jにおける合計符号量)≧(M+δ)の成立が偽ならばステップS33の処理が行われる。(モデル次数jにおける合計符号量)≧(M+δ)の成立が真ならばステップS42の処理が行われる。   The optimal model order search unit (144) determines whether (total code amount in model order j) ≧ (M + δ). If the establishment of (total code amount in model order j) ≧ (M + δ) is false, the process of step S33 is performed. If the establishment of (total code amount in model order j) ≧ (M + δ) is true, the process of step S42 is performed.

ステップS33の処理において、j≧Nmaxの成立が真になるまで、ステップS33〜S41の処理が行われる。
ステップS33の処理において、j≧Nmaxの成立が真ならば、最適モデル次数探索部(144)は最適モデル次数Noptにパラメータjtempの値を代入する(ステップS42)。そして、最適モデル次数探索部(144)は最適モデル次数決定処理を終了する。この最適モデル次数Noptを表す次数情報は信号符号化装置(2)の出力となる場合がある。また、最適モデル次数Noptは、PARCOR係数量子化部(145)の入力となりえる。
In the process of step S33, the processes of steps S33 to S41 are performed until j ≧ N max is true.
In the processing of step S33, if the establishment of j ≧ N max is true, the optimal model order search unit (144) substitutes the value of the parameter j temp for the optimal model order N opt (step S42). Then, the optimum model order search unit (144) ends the optimum model order determination process. The order information representing the optimum model order N opt may be output from the signal encoding device (2). Further, the optimal model order N opt can be input to the PARCOR coefficient quantization unit (145).

最適モデル次数を得た後の例えば信号符号化に関わる処理を行う場合は、第1実施形態で説明したとおりであるから説明を略する。   For example, when processing related to signal encoding after obtaining the optimal model order is performed, the description is omitted because it is as described in the first embodiment.

以上の各実施形態の他、本発明である線形予測モデル次数決定装置・方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記線形予測モデル次数決定装置・方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。   In addition to the above embodiments, the linear prediction model order determination apparatus and method according to the present invention are not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention. In addition, the processing described in the linear prediction model order determination device / method is not only executed in time series according to the order of description, but also in parallel or individually according to the processing capability of the device that executes the processing or as necessary. It may be executed.

また、上記線形予測モデル次数決定装置における処理機能をコンピュータによって実現する場合、線形予測モデル次数決定装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記線形予測モデル次数決定装置における処理機能がコンピュータ上で実現される。   When the processing function in the linear prediction model order determination device is realized by a computer, the processing contents of the function that the linear prediction model order determination device should have are described by a program. Then, by executing this program on a computer, the processing function in the linear prediction model order determination device is realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、線形予測モデル次数決定装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, the linear prediction model order determination device is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware. Good.

本発明は、全極型の線形予測モデルを用いた信号分析や信号の符号化などに有用である。   The present invention is useful for signal analysis and signal encoding using an all-pole linear prediction model.

線形予測モデル次数決定装置の機能構成例を示すブロック図。The block diagram which shows the function structural example of a linear prediction model order determination apparatus. 第1実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図。The figure which shows the processing flow of the linear prediction model order determination process concerning 1st Embodiment. 第2実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図。The figure which shows the processing flow of the linear prediction model order determination process concerning 2nd Embodiment. 第2実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図(図3に附属する図である。)。The figure which shows the processing flow of the linear prediction model order determination process concerning 2nd Embodiment (it is a figure attached to FIG. 3). 第3実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図。The figure which shows the processing flow of the linear prediction model order determination process concerning 3rd Embodiment. 第3実施形態に係わる線形予測モデル次数決定処理の処理フローを示す図(図5に附属する図である。)。The figure which shows the processing flow of the linear prediction model order determination process concerning 3rd Embodiment (it is a figure attached to FIG. 5). 実際の音声データを用いたときの、平均絶対値和と予測誤差エネルギーの平方根との比の出現頻度を示した図。The figure which showed the frequency of appearance of ratio of the average absolute value sum and the square root of prediction error energy when using actual speech data. ロスレスで復号するために必要な符号量と、PARCOR係数に必要な符号量と、予測誤差波形に必要な符号量との関係を示す図。The figure which shows the relationship between the code amount required for decoding losslessly, the code amount required for a PARCOR coefficient, and the code amount required for a prediction error waveform. 従来の線形予測モデル次数決定装置の機能構成例を示すブロック図。The block diagram which shows the function structural example of the conventional linear prediction model order determination apparatus.

符号の説明Explanation of symbols

1 線形予測モデル次数決定装置
141 予測誤差符号量推定部
142 係数符号量算出部
143 最適モデル次数探索部
145 PARCOR係数量子化部
146 線形予測係数変換部
147 予測誤差フィルタ部
148 誤差信号符号化部
190 制御部
1 linear prediction model order determination device 141 prediction error code amount estimation unit 142 coefficient code amount calculation unit 143 optimal model order search unit 145 PARCOR coefficient quantization unit 146 linear prediction coefficient conversion unit 147 prediction error filter unit 148 error signal encoding unit 190 Control unit

Claims (9)

PARCOR係数算出手段が、入力信号から、モデル次数が1,・・・,m〔但し、mは2以上の整数Nsupに対して1≦m≦Nsupを満たす整数である。〕の各線形予測モデルのPARCOR係数と、モデル次数mのときの予測誤差エネルギーと、をそれぞれ算出するPARCOR係数算ステップと、
予測誤差符号量推定手段が、モデル次数mのときの上記予測誤差エネルギーから、モデル次数が1,・・・,mのときの各上記PARCOR係数によって与えられる線形予測係数からなるモデル次数mの線形予測モデルの予測値と上記入力信号との誤差である予測誤差波形の符号量〔予測誤差符号量〕を推定する予測誤差符号量推定ステップと、
係数符号量算出手段が、モデル次数が1,・・・,mのときの各上記PARCOR係数に対応した符号量〔個別符号量〕、あるいは全てのPARCOR係数に対応する符号量〔全体符号量〕を算出する係数符号量算出ステップと、
最適モデル次数探索手段が、0からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数jにおける、上記全体符号量あるいはモデル次数が1,・・・,jのときの上記各個別符号量の合計と、上記予測誤差符号量との合計〔合計符号量〕を求め、合計符号量からモデル次数を1つに決定する最適モデル次数探索ステップと
を有する線形予測モデル次数決定方法。
The PARCOR coefficient calculation means has a model order of 1,..., M from the input signal, where m is an integer that satisfies 1 ≦ m ≦ N sup for an integer N sup of 2 or more. A PARCOR coefficient calculating step for calculating a PARCOR coefficient of each linear prediction model of FIG.
The prediction error code amount estimation means uses the prediction error energy when the model order is m, and the linearity of the model order m composed of the linear prediction coefficients given by the PARCOR coefficients when the model order is 1,. A prediction error code amount estimation step for estimating a code amount [prediction error code amount] of a prediction error waveform that is an error between a prediction value of a prediction model and the input signal;
The coefficient code amount calculation means has a code amount corresponding to each PARCOR coefficient when the model order is 1,..., M [individual code amount], or a code amount corresponding to all PARCOR coefficients [total code amount]. A coefficient code amount calculating step for calculating
The optimum model order search means, for a plurality of model orders included in the model orders from 0 to N sup , for each model order j, when the overall code amount or model order is 1,. A linear prediction model order determination method comprising: an optimal model order search step for obtaining a total [total code amount] of a total of individual code amounts and the prediction error code amount and determining one model order from the total code amount.
上記予測誤差符号量推定ステップは、
上記入力信号の平均絶対値和を、正規化された上記予測誤差エネルギーの平方根に予め定めた重み係数を乗じて求め、この平均絶対値和を用いて上記予測誤差符号量を推定するものである
ことを特徴とする請求項1に記載の線形予測モデル次数決定方法。
The prediction error code amount estimation step includes:
The average absolute value sum of the input signal is obtained by multiplying the normalized square root of the prediction error energy by a predetermined weighting factor, and the prediction error code amount is estimated using the average absolute value sum. The linear prediction model order determination method according to claim 1.
上記予測誤差符号量推定ステップは、
正規化された上記予測誤差エネルギーを分散とするラプラス分布のエントロピーを用いて上記予測誤差符号量を推定するものである
ことを特徴とする請求項1に記載の線形予測モデル次数決定方法。
The prediction error code amount estimation step includes:
The linear prediction model order determination method according to claim 1, wherein the prediction error code amount is estimated using entropy of a Laplace distribution in which the normalized prediction error energy is distributed.
上記最適モデル次数探索ステップは、
0からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数jにおける、上記全体符号量あるいはモデル次数が1,・・・,jのときの上記各個別符号量の合計と、上記予測誤差符号量との合計符号量を求め、合計符号量が最小になるときのモデル次数を最適モデル次数として決定するものである
ことを特徴とする請求項1から請求項3のいずれかに記載の線形予測モデル次数決定方法。
The optimal model order search step includes
For a plurality of model orders included in the model orders from 0 to N sup , for each model order j, the total code quantity or the sum of the individual code quantities when the model order is 1,. The total code amount with the prediction error code amount is obtained, and the model order when the total code amount is minimized is determined as the optimal model order. The linear prediction model order determination method described.
制御手段が、最適モデル次数探索ステップにおいてモデル次数が決定されるまで、モデル次数が1つ前のモデル次数よりも大となるように逐次にモデル次数を設定し、設定されたモデル次数ごとに、設定されたモデル次数jについて、上記PARCOR係数算出ステップ、上記予測誤差符号量推定ステップ、上記係数符号量算出ステップ、最適モデル次数探索ステップの各処理を実行させる制御ステップを有し、
上記制御ステップにおいて実行を制御される最適モデル次数探索ステップは、
上記制御ステップにおいて設定されたモデル次数jにおける、上記全体符号量またはモデル次数が1,・・・,jのときの上記各個別符号量の合計と、上記予測誤差符号量との合計符号量を求め、その合計符号量がモデル次数jの1つ前に設定されたモデル次数rにおける合計符号量よりも大となったときのモデル次数r〔暫定最適次数〕から予め定められただけの先のモデル次数までの各モデル次数における合計符号量〔モニタ合計符号量〕について、暫定最適次数での合計符号量よりも少ないモニタ合計符号量となるモデル次数が存在する場合には、当該モニタ合計符号量のうち最小のモニタ合計符号量となるときのモデル次数を最適モデル次数として決定し、暫定最適次数での合計符号量よりも少ないモニタ合計符号量となるモデル次数が存在しない場合には、暫定最適次数を最適モデル次数として決定するものである
ことを特徴とする請求項1から請求項3のいずれかに記載の線形予測モデル次数決定方法。
Until the model order is determined in the optimal model order search step, the control means sequentially sets the model order so that the model order is larger than the previous model order, and for each set model order, For the set model order j, there is a control step for executing the PARCOR coefficient calculation step, the prediction error code amount estimation step, the coefficient code amount calculation step, and the optimum model order search step.
The optimal model order search step whose execution is controlled in the control step is:
The total code amount of the individual code amount when the overall code amount or the model order is 1,..., J and the prediction error code amount in the model order j set in the control step. The model order r (provisional optimum order) when the total code quantity is larger than the total code quantity in the model order r set immediately before the model order j is determined in advance. When there is a model order that has a monitor total code amount that is smaller than the total code amount in the provisional optimum order for the total code amount [monitor total code amount] in each model order up to the model order, the monitor total code amount The model order when the minimum monitor total code amount is determined as the optimal model order, and the model order is the monitor total code amount smaller than the total code amount at the provisional optimal order. If but not, linear prediction model order determination method according to any one of claims 1 to 3, characterized in that what determines the temporary optimal order as the optimal model order.
制御手段が、最適モデル次数探索ステップにおいてモデル次数が決定されるまで、モデル次数が1つ前のモデル次数よりも大となるように逐次にモデル次数を設定し、設定されたモデル次数ごとに、設定されたモデル次数jについて、上記PARCOR係数算出ステップ、上記予測誤差符号量推定ステップ、上記係数符号量算出ステップ、最適モデル次数探索ステップの各処理を実行させる制御ステップを有し、
上記制御ステップにおいて実行を制御される最適モデル次数探索ステップは、
上記制御ステップにおいて設定されたモデル次数jにおける、上記全体符号量またはモデル次数が1,・・・,jのときの上記各個別符号量の合計と、上記予測誤差符号量との合計符号量を求め、その合計符号量がモデル次数jの1つ前に設定されたモデル次数rにおける合計符号量〔暫定最小合計符号量〕よりも大となったときのモデル次数r〔暫定最適次数〕から先のモデル次数における合計符号量〔モニタ合計符号量〕が、上記暫定最小合計符号量よりも予め定められた閾値δ以上となった場合に、上記暫定最適次数を最適モデル次数として決定するものである
ことを特徴とする請求項1から請求項3のいずれかに記載の線形予測モデル次数決定方法。
Until the model order is determined in the optimal model order search step, the control means sequentially sets the model order so that the model order is larger than the previous model order, and for each set model order, For the set model order j, there is a control step for executing the PARCOR coefficient calculation step, the prediction error code amount estimation step, the coefficient code amount calculation step, and the optimum model order search step.
The optimal model order search step whose execution is controlled in the control step is:
The total code amount of the individual code amount when the overall code amount or the model order is 1,..., J and the prediction error code amount in the model order j set in the control step. The model order r [provisional optimal order] when the total code quantity is larger than the total code quantity [provisional minimum total code quantity] in the model order r set immediately before the model order j is obtained. When the total code amount [monitor total code amount] in the model order is equal to or greater than a predetermined threshold δ than the provisional minimum total code amount, the provisional optimum order is determined as the optimum model order. The linear prediction model order determination method according to any one of claims 1 to 3, wherein
入力信号から、モデル次数が1,・・・,m〔但し、mは2以上の整数Nsupに対して1≦m≦Nsupを満たす整数である。〕の各線形予測モデルのPARCOR係数と、モデル次数mのときの予測誤差エネルギーと、をそれぞれ算出するPARCOR係数算出手段と、
モデル次数mのときの上記予測誤差エネルギーから、モデル次数が1,・・・,mのときの各上記PARCOR係数によって与えられる線形予測係数からなるモデル次数mの線形予測モデルの予測値と上記入力信号との誤差である予測誤差波形の符号量〔予測誤差符号量〕を推定する予測誤差符号量推定手段と、
モデル次数が1,・・・,mのときの各上記PARCOR係数に対応した符号量〔個別符号量〕、あるいは全てのPARCOR係数に対応する符号量〔全体符号量〕を算出する係数符号量算出手段と、
0からNsupまでのモデル次数に含まれる複数のモデル次数について、各モデル次数jにおける、上記全体符号量あるいはモデル次数が1,・・・,jのときの上記各個別符号量の合計と、上記予測誤差符号量との合計〔合計符号量〕を求め、合計符号量からモデル次数を1つに決定する最適モデル次数探索手段と
を備えた線形予測モデル次数決定装置。
From the input signal, the model order is 1,..., M [where m is an integer that satisfies 1 ≦ m ≦ N sup for an integer N sup of 2 or more. PARCOR coefficient calculating means for calculating the PARCOR coefficient of each linear prediction model and the prediction error energy when the model order is m,
From the prediction error energy when the model order is m, the prediction value of the linear prediction model of the model order m and the input including the linear prediction coefficient given by each PARCOR coefficient when the model order is 1,. A prediction error code amount estimation means for estimating a code amount [prediction error code amount] of a prediction error waveform which is an error with a signal;
Coefficient code amount calculation for calculating a code amount [individual code amount] corresponding to each PARCOR coefficient when the model order is 1,..., M, or a code amount [overall code amount] corresponding to all PARCOR coefficients. Means,
For a plurality of model orders included in the model orders from 0 to N sup , for each model order j, the total code quantity or the sum of the individual code quantities when the model order is 1,. A linear prediction model order determining device comprising: an optimal model order search means for obtaining a total [total code amount] with the prediction error code amount and determining one model order from the total code amount.
コンピュータに請求項1から請求項6のいずれかに記載の線形予測モデル次数決定方法の各処理を実行させるためのプログラム。       The program for making a computer perform each process of the linear prediction model order determination method in any one of Claims 1-6. 請求項8に記載のプログラムを記録した、コンピュータに読み取り可能な記録媒体。       A computer-readable recording medium on which the program according to claim 8 is recorded.
JP2007235904A 2007-09-11 2007-09-11 Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium Active JP4691082B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007235904A JP4691082B2 (en) 2007-09-11 2007-09-11 Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007235904A JP4691082B2 (en) 2007-09-11 2007-09-11 Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium

Publications (2)

Publication Number Publication Date
JP2009069309A true JP2009069309A (en) 2009-04-02
JP4691082B2 JP4691082B2 (en) 2011-06-01

Family

ID=40605667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007235904A Active JP4691082B2 (en) 2007-09-11 2007-09-11 Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium

Country Status (1)

Country Link
JP (1) JP4691082B2 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010067800A1 (en) * 2008-12-09 2010-06-17 日本電信電話株式会社 Encoding method, decoding method, encoding device, decoding device, program, and recording medium
WO2010084951A1 (en) * 2009-01-23 2010-07-29 日本電信電話株式会社 Parameter selection method, parameter selection apparatus, program, and recording medium
WO2010140591A1 (en) * 2009-06-03 2010-12-09 日本電信電話株式会社 Prediction order determining method, prediction order determining device, program, and recording medium
JP2010276848A (en) * 2009-05-28 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> Bidirectional predictive coding device and method, bidirectional predictive decoding device and method, and program and recording medium therefor
WO2010140590A1 (en) * 2009-06-03 2010-12-09 日本電信電話株式会社 Parcor coefficient quantization method, parcor coefficient quantization device, program and storage medium
JP2013120225A (en) * 2011-12-06 2013-06-17 Nippon Telegr & Teleph Corp <Ntt> Encoding method, encoding device, program, and recording medium
CN107945812A (en) * 2014-04-25 2018-04-20 株式会社Ntt都科摩 Linear predictor coefficient converting means and linear predictor coefficient transform method
JP2019004301A (en) * 2017-06-14 2019-01-10 日本電信電話株式会社 Class determination apparatus, data number determination apparatus, class determination method, data number determination method, class determination program, and data number determination program
JP2020205653A (en) * 2017-06-14 2020-12-24 日本電信電話株式会社 Data number determination apparatus, data number determination method, and data number determination program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01141426A (en) * 1987-11-27 1989-06-02 Sony Corp Predictive coder
JPH0477799A (en) * 1990-07-19 1992-03-11 Oki Electric Ind Co Ltd Feature amount extracting method for pitch signal
JP2007279385A (en) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Multichannel encoding method, its device, its program and recording medium

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01141426A (en) * 1987-11-27 1989-06-02 Sony Corp Predictive coder
JPH0477799A (en) * 1990-07-19 1992-03-11 Oki Electric Ind Co Ltd Feature amount extracting method for pitch signal
JP2007279385A (en) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Multichannel encoding method, its device, its program and recording medium

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010067800A1 (en) * 2008-12-09 2010-06-17 日本電信電話株式会社 Encoding method, decoding method, encoding device, decoding device, program, and recording medium
US8576910B2 (en) 2009-01-23 2013-11-05 Nippon Telegraph And Telephone Corporation Parameter selection method, parameter selection apparatus, program, and recording medium
WO2010084951A1 (en) * 2009-01-23 2010-07-29 日本電信電話株式会社 Parameter selection method, parameter selection apparatus, program, and recording medium
JP2010276848A (en) * 2009-05-28 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> Bidirectional predictive coding device and method, bidirectional predictive decoding device and method, and program and recording medium therefor
JP2014222369A (en) * 2009-06-03 2014-11-27 日本電信電話株式会社 Parcor coefficient quantization method and device, and program
JPWO2010140590A1 (en) * 2009-06-03 2012-11-22 日本電信電話株式会社 PARCOR coefficient quantization method, PARCOR coefficient quantization apparatus, program, and recording medium
WO2010140590A1 (en) * 2009-06-03 2010-12-09 日本電信電話株式会社 Parcor coefficient quantization method, parcor coefficient quantization device, program and storage medium
JP5562332B2 (en) * 2009-06-03 2014-07-30 日本電信電話株式会社 Prediction order determination method, prediction order determination device, program, and recording medium
WO2010140591A1 (en) * 2009-06-03 2010-12-09 日本電信電話株式会社 Prediction order determining method, prediction order determining device, program, and recording medium
US8902997B2 (en) 2009-06-03 2014-12-02 Nippon Telegraph And Telephone Corporation PARCOR coefficient quantization method, PARCOR coefficient quantization apparatus, program and recording medium
JP2013120225A (en) * 2011-12-06 2013-06-17 Nippon Telegr & Teleph Corp <Ntt> Encoding method, encoding device, program, and recording medium
CN107945812A (en) * 2014-04-25 2018-04-20 株式会社Ntt都科摩 Linear predictor coefficient converting means and linear predictor coefficient transform method
CN107945812B (en) * 2014-04-25 2022-01-25 株式会社Ntt都科摩 Linear prediction coefficient conversion device and linear prediction coefficient conversion method
JP2019004301A (en) * 2017-06-14 2019-01-10 日本電信電話株式会社 Class determination apparatus, data number determination apparatus, class determination method, data number determination method, class determination program, and data number determination program
JP2020205653A (en) * 2017-06-14 2020-12-24 日本電信電話株式会社 Data number determination apparatus, data number determination method, and data number determination program

Also Published As

Publication number Publication date
JP4691082B2 (en) 2011-06-01

Similar Documents

Publication Publication Date Title
JP4691082B2 (en) Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium
JP4634969B2 (en) Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium
JP5603484B2 (en) Encoding method, decoding method, encoding device, decoding device, program, recording medium
KR100304092B1 (en) Audio signal coding apparatus, audio signal decoding apparatus, and audio signal coding and decoding apparatus
JP5612698B2 (en) Encoding method, decoding method, encoding device, decoding device, program, recording medium
JP6422813B2 (en) Encoding device, decoding device, method and program thereof
EP2650878B1 (en) Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
JP3344962B2 (en) Audio signal encoding device and audio signal decoding device
JP5872034B2 (en) Encoding method, encoding device, program, and recording medium
JP2002335161A (en) Signal processor and processing method, signal encoder and encoding method, signal decoder and decoding method
JP5694751B2 (en) Encoding method, decoding method, encoding device, decoding device, program, recording medium
JP4989095B2 (en) Multi-channel encoding method, apparatus thereof, program thereof and recording medium
JP6457552B2 (en) Encoding device, decoding device, method and program thereof
JP4691050B2 (en) PARCOR coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof
JP5663461B2 (en) Encoding method, encoding apparatus, program, and recording medium
JP5336942B2 (en) Encoding method, decoding method, encoder, decoder, program
JP2000132194A (en) Signal encoding device and method therefor, and signal decoding device and method therefor
JP4746532B2 (en) Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof
JP6387117B2 (en) Encoding device, decoding device, these methods, program, and recording medium
JPH09230898A (en) Acoustic signal transformation and encoding and decoding method
WO2013118835A1 (en) Encoding method, encoding device, decoding method, decoding device, program, and recording medium
JP5579932B2 (en) Encoding method, apparatus, program, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110218

R150 Certificate of patent or registration of utility model

Ref document number: 4691082

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140225

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350