JP2016024450A - Arithmetic device and sound encoding system - Google Patents

Arithmetic device and sound encoding system Download PDF

Info

Publication number
JP2016024450A
JP2016024450A JP2014151276A JP2014151276A JP2016024450A JP 2016024450 A JP2016024450 A JP 2016024450A JP 2014151276 A JP2014151276 A JP 2014151276A JP 2014151276 A JP2014151276 A JP 2014151276A JP 2016024450 A JP2016024450 A JP 2016024450A
Authority
JP
Japan
Prior art keywords
function
unit
sound
approximation
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014151276A
Other languages
Japanese (ja)
Other versions
JP5964897B2 (en
Inventor
蒔田 憲和
Norikazu Makita
憲和 蒔田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tamura Corp
Original Assignee
Tamura Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tamura Corp filed Critical Tamura Corp
Priority to JP2014151276A priority Critical patent/JP5964897B2/en
Publication of JP2016024450A publication Critical patent/JP2016024450A/en
Application granted granted Critical
Publication of JP5964897B2 publication Critical patent/JP5964897B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an arithmetic device capable of doing high-accuracy approximation when an arithmetic for approximating a logarithmic function is included in an arithmetic process, and a sound encoding system using this arithmetic device.SOLUTION: The present invention is an arithmetic device including an arithmetic unit for performing arithmetic on a function that approximates a function, as the object of approximation, that includes a logarithmic function. The arithmetic unit approximates a function that is the object of approximation by a diode function that does not exceed a function value connecting a plurality of points on said function with a line segment and constituting the object of approximation. The arithmetic unit finds a plurality of points at which an approximation error derived by subtracting, from the function that is the object of approximation, the diode function obtained by connecting a plurality of points on said function is minimum, and finds a diode function that does not exceed the plurality of points as the end points of the respective line segment of the diode function.SELECTED DRAWING: Figure 4

Description

本発明は、対数関数を含む関数を近似して演算する演算装置、及び当該演算装置を適用した適応差分パルス符号変調(ADPCM:Adpative Differntial Pulse Code Modulation)を用いた音符号化システムに関する。   The present invention relates to an arithmetic device that approximates and calculates a function including a logarithmic function, and a sound encoding system that uses adaptive differential pulse code modulation (ADPCM) to which the arithmetic device is applied.

携帯電話やワイヤレスマイクなど、音声を伝送する際にはアナログである音をデジタル化し、デジタル音声信号に圧縮して伝送する方法が採られている。このデジタル音声信号の圧縮方式としては、デジタル音声が近接するサンプル間で高い相関を持つ性質を利用した方式が多く提案されており、DPCM(差分パルス符号変調:Differntial Pulse Code Modulation)方式やADPCM方式が知られている。   When transmitting sound, such as a mobile phone or a wireless microphone, a method is adopted in which analog sound is digitized and compressed into a digital sound signal for transmission. As a digital audio signal compression method, many methods utilizing the property of high correlation between adjacent samples of digital audio have been proposed, such as DPCM (Differential Pulse Code Modulation) method and ADPCM method. It has been known.

何れの方式を用いる音声符号化システムの場合も、入力された音声を符号化する音声符号化装置と、符号化された音声を復号する音声復号化装置とを備える。何れの方式も、音声符号化装置において、サンプリングされた実際のデジタル音声とその予測値との差分によって予測誤差を求め、この予測誤差を量子化及び符号化して伝送路を介して音声復号化装置に伝送する。音声復号化装置ではこの符号化されたものを復号した音声と、サンプリングされた実際のデジタル音声の予測値とを加算して入力された音声を再生する。このように、何れの方式も差分情報のみを伝送し、伝送先で入力音声を復元する構成となっているので、伝送する情報量を少なくすることができる利点がある。   In the case of a speech encoding system using any method, a speech encoding device that encodes input speech and a speech decoding device that decodes the encoded speech are provided. In any of the methods, in the speech coding apparatus, a prediction error is obtained by the difference between the sampled actual digital speech and the predicted value, and the prediction error is quantized and encoded, and then the speech decoding apparatus via the transmission path. Transmit to. In the speech decoding apparatus, the input speech is reproduced by adding the speech obtained by decoding the encoded signal and the predicted value of the sampled actual digital speech. As described above, each of the systems transmits only difference information and restores the input voice at the transmission destination. Therefore, there is an advantage that the amount of information to be transmitted can be reduced.

一方、DPCM方式とADPCM方式には次のような違いがある。すなわち、DPCM方式では、上記の予測誤差は、サンプリングされた現在時刻の標本値と、その一つ前の標本値との差分としている。この差分値を一定の量子化単位で量子化している。音声復号化装置では、伝送され復号した予測誤差に現在時刻から1標本時間だけ遅延させたデジタル音声を加算することで音声を再生する。   On the other hand, there are the following differences between the DPCM method and the ADPCM method. That is, in the DPCM method, the prediction error is a difference between the sampled sample value at the current time and the previous sample value. This difference value is quantized in a certain quantization unit. The speech decoding apparatus reproduces speech by adding digital speech delayed by one sample time from the current time to the transmitted and decoded prediction error.

一方、ADPCM方式では、ITU−T G.726に代表されるように、音声信号のレベルが時間変動するため、量子化する際に一定の量子化単位で量子化するよりも、音声レベルの大小に応じてステップサイズを変えながら適応的に量子化する。すなわち、レベルの大きい音声信号は大きなステップサイズで大まかに量子化し、レベルの小さな音声信号は小さなステップサイズで細かく量子化する。このようにすることで、量子化する際に発生する量子化誤差を小さくすることができ、より正確な音声の再現が可能となる。   On the other hand, in the ADPCM system, ITU-T G.I. As represented by 726, since the level of the audio signal fluctuates with time, it is more adaptive while changing the step size according to the level of the audio level, rather than quantizing with a constant quantization unit when quantizing. Quantize. That is, a speech signal with a large level is roughly quantized with a large step size, and a speech signal with a small level is finely quantized with a small step size. By doing so, it is possible to reduce the quantization error that occurs at the time of quantization, and it is possible to reproduce the voice more accurately.

特開平11−150480号公報JP-A-11-150480 国際公開第2004/112256号International Publication No. 2004/112256

ところで、ITU−T G.726に代表される従来のADPCM方式を用いた音声符号化システムでは、予測誤差を符号化する際に、予測誤差の絶対値xを対数化している。その際、その対数を整数部xと小数部xとに分解する。すなわち、logx=x+xとして、整数部xと小数部xとを求めている。ここで、整数部xは、xと2の大小をk=0から比較し、xを超えない最大の2による指数kとして求めている。一方、小数部xは、演算量を少なくする観点から、x=log(1+x)と近似して求めている。 By the way, ITU-TG In a speech encoding system using a conventional ADPCM method represented by 726, the absolute value x of the prediction error is logarithmized when the prediction error is encoded. At that time, degrades the logarithm to the integer part x e and fraction x m. That is, log 2 x = x e + x m, seeking an integer part x e and fraction x m. Here, the integer part x e is obtained by comparing the magnitudes of x and 2 k from k = 0 and obtaining the maximum exponent k by 2 k that does not exceed x. On the other hand, the decimal part x m is obtained by approximating x m = log 2 (1 + x m ) from the viewpoint of reducing the amount of calculation.

しかし、この近似は、演算量を少なくする観点からなされたものであるため、必ずしも精度の良いものではなかった。そのため、従来のADPCM方式を用いた音声符号化システムでは、再現できる音声の音質が劣化してしまう虞があった。   However, since this approximation is made from the viewpoint of reducing the amount of calculation, it is not always accurate. Therefore, in a speech encoding system using the conventional ADPCM method, there is a possibility that the sound quality of the reproducible speech may be deteriorated.

さらに、このような精度の悪い近似は、上記の近似方法に限らず、演算過程で対数関数を近似する一般の演算装置に対しても、同様に行われうるものである。   Further, such approximation with poor accuracy is not limited to the above approximation method, and can be similarly performed for a general arithmetic device that approximates a logarithmic function in an arithmetic process.

本発明は、上記のような課題を解決するためになされたものであり、演算過程に対数関数を近似する演算を含む場合に、精度良く近似することのできる演算装置及びこの演算装置を用いた音符号化システムを提供することにある。   The present invention has been made in order to solve the above-described problems. When the calculation process includes an operation for approximating a logarithmic function, an arithmetic device capable of approximating with high accuracy and the arithmetic device are used. It is to provide a sound encoding system.

本発明の演算装置は、対数関数を含む関数を近似して演算する演算部を備えた演算装置であって、次の構成を備えることを特徴とする。
(1)演算部は、近似対象となる関数を、当該関数上の複数の点を線分で結んだ近似対象となる関数値を上回らない折れ線関数により近似すること。
An arithmetic device of the present invention is an arithmetic device including an arithmetic unit that approximates and calculates a function including a logarithmic function, and has the following configuration.
(1) The calculation unit approximates the function to be approximated by a line function that does not exceed the function value to be approximated by connecting a plurality of points on the function by line segments.

また、次の構成を備えるようにしても良い。
(2)演算部は、近似対象となる関数から、当該関数上の複数の点を線分で結んで得られる折れ線関数を引いたものの近似誤差が最小となる複数の点を求め、この複数の点を折れ線関数の各線分の端点として上回らない折れ線関数を求めること。
Moreover, you may make it provide the following structure.
(2) The calculation unit obtains a plurality of points where the approximation error is minimized by subtracting a polygonal line function obtained by connecting a plurality of points on the function with line segments from the function to be approximated, Find a line function that does not exceed a point as the end point of each line segment of the line function.

また、本発明の演算装置は、対数関数を含む関数を近似して演算する演算部を備えた演算装置であって、次の構成を備えることを特徴とする。
(3)演算部は、近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を下回らない折れ線関数により近似すること。
An arithmetic device of the present invention is an arithmetic device including an arithmetic unit that approximates and calculates a function including a logarithmic function, and has the following configuration.
(3) The calculation unit approximates the function to be approximated by a line function that does not fall below the function value to be approximated by connecting a plurality of points on the function with line segments.

また、次の構成を備えるようにしても良い。
(4)下回らない折れ線関数は、各線分が、その定義域内で前記複数の点として近似対象となる関数との接点を有する接線であり、演算部は、接点を、その接点が乗る線分とこれに隣接する両線分による近似対象となる関数との近似誤差が最小となるように求めること。
Moreover, you may make it provide the following structure.
(4) A polygonal line function that does not fall is a tangent line in which each line segment has a contact point with the function to be approximated as the plurality of points within the domain of definition, and the calculation unit defines the contact point as a line segment on which the contact point is placed. Find the approximation error with the function to be approximated by the two adjacent line segments.

また、本発明の演算装置は、対数関数を含む関数を近似して演算する演算部を備えた演算装置であって、次の構成を備えることを特徴とする。
(5)演算部は、近似対象となる関数を、当該関数と交差する線分を含んでなる折れ線関数により近似し、折れ線関数は、端点(x,y)と(xn+1,yn+1)を持つ線分Sを式(31)で表し、この線分Sによる区分誤差評価関数Eを式(32)で表した場合に、式(33)の誤差評価関数Eを最小化したときに得られるものであること。
An arithmetic device of the present invention is an arithmetic device including an arithmetic unit that approximates and calculates a function including a logarithmic function, and has the following configuration.
(5) The calculation unit approximates the function to be approximated by a polygonal line function including a line segment that intersects with the function, and the polygonal line function includes the end points (x n , y n ) and (x n + 1 , y n + 1). a line segment S n with) represented by the formula (31), the division error evaluation function E S according to the line segment S n when expressed in equation (32), minimizes the error evaluation function E of equation (33) What you get when you do.

さらに、本発明の音符号化システムは、次の構成を備えたことを特徴とする。
(6)入力された音を符号化する符号化装置と、入力された音符号を復号化する復号化装置と、符号化装置が出力した音符号を復号化装置に伝送する伝送媒体と、を備え、符号化装置及び復号化装置は、上記(1)〜(5)の何れか構成を有する演算装置をそれぞれ備えたこと。
Furthermore, the sound encoding system of the present invention is characterized by having the following configuration.
(6) An encoding device that encodes the input sound, a decoding device that decodes the input sound code, and a transmission medium that transmits the sound code output by the encoding device to the decoding device. The encoding device and the decoding device each include an arithmetic device having any one of the configurations (1) to (5).

また、次の構成を備えるようにしても良い。
(7)符号化装置及び復号化装置は、上記(1)〜(5)の何れか構成を有する演算装置として、音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、適応正規化部は、正規化予測誤差を求める関数に、予測誤差の絶対値の対数関数を含むこと。
Moreover, you may make it provide the following structure.
(7) The encoding device and the decoding device, as an arithmetic device having any one of the configurations (1) to (5) described above, a prediction error that is a difference between the sound information and a predicted value of the sound information, and the prediction An adaptive normalization unit that obtains a normalized prediction error obtained by normalizing the prediction error based on the prediction value of the error, and the adaptive normalization unit uses a logarithm of the absolute value of the prediction error as a function for obtaining the normalized prediction error. Including functions.

本発明によれば、近似精度を向上させることのできる演算装置、及び当該演算装置を適用した音符号化システムを得ることができる。   According to the present invention, it is possible to obtain an arithmetic device capable of improving the approximation accuracy and a sound encoding system to which the arithmetic device is applied.

第1の実施形態に係る音符号化システムの全体構成を示す図である。It is a figure which shows the whole structure of the sound coding system which concerns on 1st Embodiment. 第1の実施形態に係るエンコーダ及びデコーダの概略構成を示す図である。It is a figure which shows schematic structure of the encoder and decoder which concern on 1st Embodiment. 第1の実施形態に係る適応正規化部を示す図である。It is a figure which shows the adaptive normalization part which concerns on 1st Embodiment. 上回らない折れ線近似を説明するためのグラフである。It is a graph for demonstrating the broken line approximation which does not exceed. 下回らない折れ線近似を説明するためのグラフである。It is a graph for demonstrating the broken line approximation which is not less than. 線分数又は節点数に対する近似誤差の二乗平均値を両対数軸にプロットしたグラフである。It is the graph which plotted the square mean value of the approximation error with respect to the number of line segments or the number of nodes on the logarithmic axis. 符号化装置の動作フローチャートである。It is an operation | movement flowchart of an encoding apparatus. 復号化装置の動作フローチャートである。It is an operation | movement flowchart of a decoding apparatus.

以下、図面を参照して、本発明の実施形態の音符号化システムについて説明する。   Hereinafter, a sound encoding system according to an embodiment of the present invention will be described with reference to the drawings.

[1.第1の実施形態]
[1−1.概略構成]
図1は、本実施形態に係る音符号化システムの全体構成を示す図である。本音符号化システムは、符号化装置10、復号化装置20、及び符号された音情報を伝送する伝送媒体30を備えている。
[1. First Embodiment]
[1-1. Schematic configuration]
FIG. 1 is a diagram showing an overall configuration of a sound encoding system according to the present embodiment. The present sound encoding system includes an encoding device 10, a decoding device 20, and a transmission medium 30 for transmitting encoded sound information.

符号化装置10は、システム外部から入力されたアナログ信号である音やデジタル信号を符号化し、音符号を含む情報として出力する。符号化装置10と復号化装置20は伝送媒体30を介して接続されており、伝送媒体30は、符号化装置10から出力された音符号を含む情報を復号化装置20へ伝送する。復号化装置20は、符号化装置10から伝送された音符号を含む情報をアナログ信号に復号し、本システム外部へ出力する。本音符号化システムは、例えば、ワイヤレスマイクシステムに用いることができる。   The encoding device 10 encodes a sound or a digital signal that is an analog signal input from the outside of the system, and outputs it as information including a sound code. The encoding device 10 and the decoding device 20 are connected via a transmission medium 30, and the transmission medium 30 transmits information including a sound code output from the encoding device 10 to the decoding device 20. The decoding device 20 decodes information including the sound code transmitted from the encoding device 10 into an analog signal and outputs the analog signal to the outside of the system. The present sound encoding system can be used for a wireless microphone system, for example.

[1−2.各部構成]
(符号化装置)
符号化装置10は、ユーザインターフェイスUI11、外部接続I/F12、制御部13、記憶部14、音入力I/F15、エンコーダ16、及び符号出力I/F17を備えている。
[1-2. Configuration of each part]
(Encoding device)
The encoding device 10 includes a user interface UI11, an external connection I / F 12, a control unit 13, a storage unit 14, a sound input I / F 15, an encoder 16, and a code output I / F 17.

ユーザインターフェイスUI11は、図示しない操作入力部と状態出力部を有し、本システムとユーザとのインターフェイスを提供する。操作入力部は、スイッチやモーションセンサなどの検出器によりユーザが要求する操作を検出し、制御部13へ伝達する。状態出力部は、LEDやLCDなどの表示器や、バイブレータによる振動、スピーカによる音声出力などにより装置の内部状態を出力し、ユーザへのフィードバックを与える。   The user interface UI11 has an operation input unit and a status output unit (not shown), and provides an interface between the system and the user. The operation input unit detects an operation requested by the user with a detector such as a switch or a motion sensor, and transmits the operation to the control unit 13. The status output unit outputs the internal status of the apparatus by a display device such as an LED or LCD, vibration by a vibrator, sound output by a speaker, and the like, and gives feedback to the user.

内部状態の出力としては、例えば、表示器に後述するエンコーダ16の駆動に用いられているパラメータの表示を行うことができる。また、システムに入力される音源が変更される等の理由でユーザの要求により当該音源に適したパラメータに変更する場合は、操作入力部によりユーザ所望のパラメータを受け付けて制御信号として制御部13へ出力し、制御部13への当該信号の入力を契機として制御部13によりシステム各部のパラメータを変更する。なお、ユーザインターフェイスUI11は、操作入力部か状態出力部のいずれか一方のみを実装するようにしても良い。また、操作入力部がタッチパネル及び表示器を備え、記憶部14に記憶された複数のパラメータを表示し、ユーザによるパラメータの選択を受け付けるようにしても良いし、当該表示器にエンコーダ16の駆動に用いられるパラメータも表示しても良い。パラメータの表示は、パラメータに一意に対応した識別子を表示しても良いし、エンコーダ16内の各処理部に区分けして表示しても良い。   As an output of the internal state, for example, a parameter used for driving an encoder 16 described later can be displayed on a display. In addition, when changing to a parameter suitable for the sound source according to a user's request because the sound source input to the system is changed, the operation input unit accepts a user desired parameter and sends it to the control unit 13 as a control signal. The parameters of each part of the system are changed by the control unit 13 triggered by the input of the signal to the control unit 13. Note that only one of the operation input unit or the state output unit may be mounted on the user interface UI11. Further, the operation input unit may include a touch panel and a display, display a plurality of parameters stored in the storage unit 14, and accept a parameter selection by the user, or drive the encoder 16 on the display. The parameters used may also be displayed. The parameter may be displayed by displaying an identifier that uniquely corresponds to the parameter, or by dividing the display into each processing unit in the encoder 16.

外部接続I/F12は、外部接続装置とのインターフェイスを提供する。外部接続I/F12と外部接続装置との接続媒体は有線又は無線である。外部接続装置は、外部接続I/F12を介して本システムの内部状態を取得し、また動作制御を行うことができるものを用いる。外部接続装置としては、コンピュータやモバイル端末などが挙げられる。外部接続装置は、エンコーダ16内部の処理部で用いられるパラメータを有し、当該パラメータを外部接続I/F12を介して記憶部13に入力し記憶させるようにしても良い。なお、外部接続装置はそのパラメータを予め保持していても良いし、取得した本システムの内部状態から別途生成するようにしても良い。また、外部接続装置は、エンコーダ16内の処理部のパラメータを取得するようにしても良く、さらに当該パラメータを保持して記憶部13への入力のために用いても良い。   The external connection I / F 12 provides an interface with an external connection device. A connection medium between the external connection I / F 12 and the external connection device is wired or wireless. An external connection device that can acquire the internal state of the system via the external connection I / F 12 and can perform operation control is used. Examples of the external connection device include a computer and a mobile terminal. The external connection device may have parameters used in the processing unit inside the encoder 16, and the parameters may be input and stored in the storage unit 13 via the external connection I / F 12. Note that the external connection device may hold the parameter in advance, or may be generated separately from the acquired internal state of the system. Further, the external connection device may acquire parameters of the processing unit in the encoder 16, and may further hold the parameters and use them for input to the storage unit 13.

制御部13は、ユーザインターフェイスUI11、外部接続I/F12、記憶部14、音入力I/F15、エンコーダ16、及び符号出力I/F17とそれぞれ接続されており、制御手段として機能する。すなわち、制御部13は、本システムの内部状態の管理、各部動作制御、並びに、外部接続I/F12、音入力I/F15、及び符号出力I/F17との通信を行う。   The control unit 13 is connected to the user interface UI11, the external connection I / F 12, the storage unit 14, the sound input I / F 15, the encoder 16, and the code output I / F 17, and functions as a control unit. That is, the control unit 13 performs management of the internal state of the system, operation control of each unit, and communication with the external connection I / F 12, the sound input I / F 15, and the code output I / F 17.

制御部13は、起動時に本システム各部の内部状態をリセットする。また、各部からの要求若しくは特定の内部状態の検出により、予め指定された内部状態をリセットし、本システム全体若しくは所定の部位を再起動させても良い。また、各部からの要求若しくは特定の内部状態の検出により、所定のパラメータを記憶部14から参照し、後述する所定の動作制御I/Fのパラメータを動的に更新しても良い。なお、各部からの要求には、ユーザインターフェイスUI11を介したユーザからの要求と、外部接続装置からの要求と、処理部からの要求との少なくともいずれかを含む。さらに、外部から動的に入力されたパラメータを含め、パラメータが正当であるか、後述のエンコーダ16及びデコーダ26とで共通のパラメータが整合しているかの確認をし、各部へ確認結果を通知しても良い。   The control unit 13 resets the internal state of each part of the system at startup. Further, the internal state designated in advance may be reset by a request from each unit or detection of a specific internal state, and the entire system or a predetermined part may be restarted. Further, a predetermined parameter may be dynamically updated by referring to a predetermined parameter from the storage unit 14 based on a request from each unit or detection of a specific internal state. The request from each unit includes at least one of a request from the user via the user interface UI11, a request from the external connection device, and a request from the processing unit. Further, it is confirmed whether the parameters including the parameters dynamically input from the outside are valid, or whether the parameters common to the encoder 16 and the decoder 26 described later are consistent, and the confirmation result is notified to each unit. May be.

制御部13は、音や音情報、音符号を各部が入出力するための周期的なタイミングを生成し、各部にそのタイミングを与える。或いは、周期的なタイミング以外にも、各部の動作に必要となる所定のタイミングを生成しても良い。また、制御部13は、音情報や音符号など情報全般の記憶部14への蓄積、及び記憶部14からその蓄積した情報の各部への転送を行う。   The control unit 13 generates a periodic timing for each unit to input and output sound, sound information, and sound code, and gives the timing to each unit. Alternatively, in addition to the periodic timing, a predetermined timing necessary for the operation of each unit may be generated. The control unit 13 accumulates general information such as sound information and sound codes in the storage unit 14 and transfers the accumulated information from the storage unit 14 to each unit.

記憶部14は、内部状態や各部の動作を決める複数種類のパラメータを記憶し、制御部13を介して又は直接それらの情報の参照と更新を行う。この複数種類のパラメータは、複数の音源に対応したものであり、これらのパラメータの中から少なくとも何れかのパラメータが、後述のエンコーダ16及びデコーダ26の処理部において、音情報や音符号などの処理に用いられる。記憶部14は、個別にパラメータを参照と更新を行えるようにしても良く、各パラメータを一意に識別する識別値を各パラメータに紐付けて記憶しても良い。また、状態変化の履歴や音情報、音符号を蓄積して記憶するようにしても良い。   The storage unit 14 stores a plurality of types of parameters that determine the internal state and the operation of each unit, and refers to and updates the information via the control unit 13 or directly. The plurality of types of parameters correspond to a plurality of sound sources, and at least one of these parameters is processed by the processing unit of the encoder 16 and the decoder 26, which will be described later, such as sound information and sound code. Used for. The storage unit 14 may individually refer to and update the parameters, or may store an identification value that uniquely identifies each parameter in association with each parameter. In addition, state change history, sound information, and sound codes may be accumulated and stored.

音入力I/F15は、本システム外部の音源の音を所定のタイミングで入力して時系列の音情報に変換し、出力する。音入力I/F15は、例えばマイクなどの音響的トランスデューサーを有し、到来した音を所定のパラメータに応じて電気信号化し、音情報として出力する。この音情報は、エンコーダ16及び/又は制御部13へ出力される。なお、音入力I/F15は、音情報をプリエンファシス処理などにより変換してもよいし、外部接続装置からの音情報を直接入出力するようにしても良い。   The sound input I / F 15 inputs the sound of the sound source outside the system at a predetermined timing, converts it into time-series sound information, and outputs it. The sound input I / F 15 has an acoustic transducer such as a microphone, for example, converts an incoming sound into an electrical signal according to a predetermined parameter, and outputs it as sound information. This sound information is output to the encoder 16 and / or the control unit 13. Note that the sound input I / F 15 may convert sound information by pre-emphasis processing or the like, or may directly input / output sound information from an external connection device.

エンコーダ16は、入力された音情報を変換して音符号として出力する。すなわち、音入力I/F15から入力された音情報を量子化及び符号化し、音符号として符号出力I/F17及び制御部13に出力する。このエンコーダ16の詳細な構成は後述する。   The encoder 16 converts the input sound information and outputs it as a sound code. That is, the sound information input from the sound input I / F 15 is quantized and encoded, and is output to the code output I / F 17 and the control unit 13 as a sound code. The detailed configuration of the encoder 16 will be described later.

符号出力I/F17は、エンコーダ16から入力された音符号を所定のタイミングで伝送媒体30へ出力する。なお、符号出力I/F17は、音符号の出力タイミングと同期させるための情報、例えば音符号をフレーミングして出力する場合のフレーム同期信号等を併せて制御部13に出力しても良い。また、符号出力I/F17は、音符号に関連する又は独立した情報を併せて出力しても良いし、制御部13経由で記憶部14に蓄積された音符号を、制御部13を介して所定のタイミングで出力するようにしても良い。   The code output I / F 17 outputs the sound code input from the encoder 16 to the transmission medium 30 at a predetermined timing. Note that the code output I / F 17 may output information for synchronizing with the output timing of the sound code, for example, a frame synchronization signal in the case of outputting the sound code after framing to the control unit 13. The code output I / F 17 may also output information related to or independent from the sound code, and the sound code stored in the storage unit 14 via the control unit 13 may be output via the control unit 13. It may be output at a predetermined timing.

(伝送媒体)
伝送媒体30は、符号化装置10の符号出力I/F17から出力される音符号を含む情報を、復号化装置20の後述する符号入力I/F25へ出力する。伝送媒体30は、有線であっても無線であっても良い。また、伝送媒体30の伝送は、逐次伝送する実時間伝送形式であっても、記憶装置などに蓄積し、蓄積したものを順次伝送する蓄積形式であっても良い。
(Transmission medium)
The transmission medium 30 outputs information including a sound code output from the code output I / F 17 of the encoding device 10 to a code input I / F 25 described later of the decoding device 20. The transmission medium 30 may be wired or wireless. Further, the transmission of the transmission medium 30 may be a real-time transmission format in which transmission is performed sequentially, or may be a storage format in which data stored in a storage device or the like is transmitted sequentially.

(復号化装置)
復号化装置20は、ユーザインターフェイスUI21、外部接続I/F22、制御部23、記憶部24、符号入力I/F25、デコーダ26、及び音出力I/F27を備えている。ユーザインターフェイスUI21、外部接続I/F22、制御部23、及び記憶部24については、符号化装置10のユーザインターフェイスUI11、外部接続I/F12、制御部13、及び記憶部14とそれぞれ同様の構成であるため、その説明は省略する。
(Decryption device)
The decoding device 20 includes a user interface UI21, an external connection I / F22, a control unit 23, a storage unit 24, a code input I / F25, a decoder 26, and a sound output I / F27. The user interface UI21, the external connection I / F 22, the control unit 23, and the storage unit 24 have the same configurations as the user interface UI11, the external connection I / F 12, the control unit 13, and the storage unit 14 of the encoding device 10, respectively. Therefore, the description thereof is omitted.

符号入力I/F25は、伝送媒体30から音符号を含む情報を所定のタイミングで入力し、デコーダ26及び/又は制御部23へ出力する。なお、符号入力I/F25は、入力情報に含まれる音符号とのタイミング同期信号を制御部23へ出力するようにしても良いし、入力情報に含まれる音符号に関連する又は独立した情報を制御部23へ出力するようにしても良い。また、符号入力I/F25は、伝送媒体30が蓄積形式である場合、所定のタイミングで順次伝送媒体30から音符号を含む情報を入力する。   The code input I / F 25 inputs information including a sound code from the transmission medium 30 at a predetermined timing, and outputs the information to the decoder 26 and / or the control unit 23. The code input I / F 25 may output a timing synchronization signal with a sound code included in the input information to the control unit 23, or may include information related to or independent of the sound code included in the input information. You may make it output to the control part 23. FIG. The code input I / F 25 inputs information including a sound code from the transmission medium 30 sequentially at a predetermined timing when the transmission medium 30 is in the storage format.

デコーダ26は、入力された音符号を変換して音情報として音出力I/F27に出力する。デコーダ26の詳細な構成は後述する。   The decoder 26 converts the input sound code and outputs it as sound information to the sound output I / F 27. The detailed configuration of the decoder 26 will be described later.

音出力I/F27は、デコーダ26から入力された時系列的な音情報を所定のタイミングで本システム外部へ音に変換して出力する。音出力I/F27は、例えば、スピーカなどの音響的トランスデューサーを有し、音情報を所定のパラメータに応じて音に変換して出力する。なお、音出力I/F27は、音情報をデエンファシス処理などにより変換しても良いし、入力された音情報を外部接続装置へ直接出力するようにしても良い。   The sound output I / F 27 converts the time-series sound information input from the decoder 26 into sound outside the system at a predetermined timing and outputs the sound. The sound output I / F 27 includes, for example, an acoustic transducer such as a speaker, and converts sound information into sound according to a predetermined parameter and outputs the sound. Note that the sound output I / F 27 may convert the sound information by de-emphasis processing or the like, or may directly input the input sound information to the external connection device.

[1−3.エンコーダ及びデコーダの詳細構成]
(エンコーダ)
図2に示すように、エンコーダ16は、前処理部41、加算器42、適応正規化部43、最適量子化部44、最適逆量子化部45、適応予測部46、加算器47、及び後処理部48を有している。
[1-3. Detailed configuration of encoder and decoder]
(Encoder)
As shown in FIG. 2, the encoder 16 includes a preprocessing unit 41, an adder 42, an adaptive normalization unit 43, an optimal quantization unit 44, an optimal inverse quantization unit 45, an adaptive prediction unit 46, an adder 47, and a post-processing unit. A processing unit 48 is included.

これらの各処理部は、動作制御I/F41p、43p〜46p、48pを有し、これらには、各処理部の処理に必要なパラメータが一時的に記憶及び/又は予め格納されている。動作制御I/F41p、43p〜46p、48pは、自身が設けられた処理部の処理に用いられるパラメータが一時的に記憶される。これらの各処理部は、制御部13からの要求に応じて当該パラメータに基づいて、各種の処理を行う。なお、動作制御I/F41p、43p〜46p、48pは、パラメータの記憶を行うので記憶手段と称することもできる。   Each of these processing units has operation control I / Fs 41p, 43p to 46p, and 48p, and parameters necessary for processing of each processing unit are temporarily stored and / or stored in advance. The operation control I / Fs 41p, 43p to 46p, and 48p temporarily store parameters used for processing of the processing unit provided with the operation control I / Fs 41p, 43p to 46p, and 48p. Each of these processing units performs various processes based on the parameters in response to a request from the control unit 13. The operation control I / Fs 41p, 43p to 46p, and 48p can also be referred to as storage means because they store parameters.

パラメータは、各種の人の音声(老若男女に限らず特定の人物など)や楽器等の音などの複数種の音源に対して、それぞれ最適に設計されている。この各パラメータは、制御部13からの要求に応じて記憶部14に記憶されたパラメータを動的に参照したものを用いても良い。より詳細には、動作制御I/F41p、43p〜46p、48pは、自身が設けられた処理部に入力された音情報又は音符号に応じて、当該処理部で用いるパラメータを更新するための制御信号を制御部13に出力する。そして、制御部13は、記憶部14に記憶されたパラメータの中から当該制御信号に対応するパラメータを参照し、そのパラメータに処理部で用いるパラメータを更新できるようになっている。   The parameters are optimally designed for a plurality of types of sound sources such as voices of various people (not only men and women of all ages but specific persons) and sounds of musical instruments. As each parameter, a parameter that dynamically refers to a parameter stored in the storage unit 14 in response to a request from the control unit 13 may be used. More specifically, the operation control I / Fs 41p, 43p to 46p, and 48p are controls for updating parameters used in the processing unit according to sound information or a sound code input to the processing unit provided with the operation control I / F 41p, 43p to 46p, 48p. The signal is output to the control unit 13. And the control part 13 can update the parameter used with a process part with reference to the parameter corresponding to the said control signal from the parameters memorize | stored in the memory | storage part 14. FIG.

更新後のパラメータとしては、動作制御I/F41p、43p〜46p、48pに予め格納されたものを用いても良い。さらに、ユーザインターフェイスUI11、12によりユーザからの入力を受け付けたものや、外部接続I/F12、22を介して外部接続装置から入力されたものを用いても良い。   As the updated parameters, those stored in advance in the operation control I / Fs 41p, 43p to 46p, and 48p may be used. Furthermore, the input from the user via the user interface UIs 11 and 12 or the input from the external connection device via the external connection I / Fs 12 and 22 may be used.

このように、エンコーダ16の各部は、パラメータが音源に応じて可変であり、音源に応じて動的にも静的にもできるので、量子化誤差を小さくすることができるとともに、音源に適したコーデックを構成して音質の良い音を得ることができるようになっている。   As described above, each part of the encoder 16 has a variable parameter according to the sound source, and can be dynamic or static according to the sound source, so that the quantization error can be reduced and it is suitable for the sound source. The codec can be configured to obtain sound with good sound quality.

前処理部41は、音入力I/F17若しくは制御部13から入力された音情報に対して所定の処理を行い、その処理された音情報を加算器42に出力する。この所定の処理としては、例えば、所定のパラメータに応じて処理を行っても良いし、入力された音情報をそのまま出力しても良い。また、入力された音情報の振幅をスケーリングして出力しても良いし、その振幅が過大である場合、クリッピングして出力しても良い。   The pre-processing unit 41 performs a predetermined process on the sound information input from the sound input I / F 17 or the control unit 13 and outputs the processed sound information to the adder 42. As the predetermined processing, for example, processing may be performed according to predetermined parameters, or input sound information may be output as it is. Further, the amplitude of the input sound information may be scaled and output, or if the amplitude is excessive, it may be output after clipping.

加算器42は、前処理部41、適応正規化部43及び適応予測部46と接続されている。前処理部41から入力された音情報と、適応予測部46から入力された音情報の予測値との差分を算出し、この差分を予測誤差として適応正規化部43に出力する。   The adder 42 is connected to the preprocessing unit 41, the adaptive normalization unit 43, and the adaptive prediction unit 46. The difference between the sound information input from the preprocessing unit 41 and the predicted value of the sound information input from the adaptive prediction unit 46 is calculated, and this difference is output to the adaptive normalization unit 43 as a prediction error.

適応正規化部43は、入力された予測誤差とその予測値とに基づいて正規化した正規化予測誤差を算出する。具体的には、適応正規化部43は、最適量子化部44と接続されており、加算器42から入力された予測誤差を正規化関数により正規化予測誤差を求め、最適量子化部44、適応予測部46及び加算器47に出力する。   The adaptive normalization unit 43 calculates a normalized prediction error normalized based on the input prediction error and its predicted value. Specifically, the adaptive normalization unit 43 is connected to the optimal quantization unit 44, obtains a normalization prediction error from the prediction error input from the adder 42 using a normalization function, and obtains an optimal quantization unit 44, The data is output to the adaptive prediction unit 46 and the adder 47.

正規化関数は、予測誤差とその予測値との関数である。正規化関数としては、詳しくは後述するが、例えば、後述の式(2)又は式(3)である。正規化関数は、動作制御I/F43pに格納される。なお、動作制御I/F43pに複数の正規化関数がパラメータとして格納されている場合には、制御部13からのパラメータ制御により所望の関数を選択することができる。   The normalization function is a function of the prediction error and its predicted value. The normalization function will be described later in detail, and is, for example, an expression (2) or an expression (3) described later. The normalization function is stored in the operation control I / F 43p. When a plurality of normalization functions are stored as parameters in the operation control I / F 43p, a desired function can be selected by parameter control from the control unit 13.

適応正規化部43は、予測誤差の予測値(以下、正規化係数ともいう。)を後述する式(11)のように、過去を含めて入力された後述の量子正規化予測誤差に応じて予測誤差予測関数により更新する。正規化関数は、所定のパラメータ及び正規化係数に応じて予測誤差を正規化するものである。なお、前述の予測誤差予測関数を含め、本明細書において「過去を含め」とは、更新する次の時刻より前の時刻のことを指し、現在時刻及び現在より前の時刻を含むことをいう。   The adaptive normalization unit 43 sets a prediction value of a prediction error (hereinafter also referred to as a normalization coefficient) according to a quantum normalization prediction error described later including the past, as in Expression (11) described later. Update with prediction error prediction function. The normalization function normalizes the prediction error according to a predetermined parameter and a normalization coefficient. In addition, including the above-described prediction error prediction function, “including the past” in this specification refers to a time before the next time to be updated, and includes the current time and a time before the current time. .

一方、適応正規化部43は、最適逆量子化部45とも接続されており、最適逆量子化部45から入力される後述の量子正規化予測誤差と、その正規化に対応する逆正規化関数により正規化を解き、関数値を量子化予測誤差として適応予測部46及び加算器47に出力する。逆正規化関数は、正規化関数の逆関数であり、所定のパラメータ及び正規化係数に応じて入力値の正規化を解くものである。なお、正規化係数は正規化関数と逆正規化関数とで同一である。   On the other hand, the adaptive normalization unit 43 is also connected to the optimum inverse quantization unit 45, and a later-described quantum normalized prediction error input from the optimum inverse quantization unit 45 and an inverse normalization function corresponding to the normalization. The normalization is solved, and the function value is output to the adaptive prediction unit 46 and the adder 47 as a quantized prediction error. The inverse normalization function is an inverse function of the normalization function and solves the normalization of the input value according to a predetermined parameter and a normalization coefficient. The normalization coefficient is the same for the normalization function and the denormalization function.

正規化係数は、同期収束構造を有する。すなわち、初期値の異なる正規化係数同士は同条件で逐次更新を進めると同一の値に収束する。同期収束構造については詳しくは後述する。   The normalization coefficient has a synchronous convergence structure. In other words, normalization coefficients having different initial values converge to the same value when update is sequentially performed under the same conditions. Details of the synchronous convergence structure will be described later.

適応正規化部43は、異常制御機能を有している。例えば、動作制御I/F43pに所定の閾値を予め格納しておき、正常時にはない予測誤差や量子正規化予測誤差の入力を検出した場合、異常値の伝播を速やかに解消させる機能であり、詳しくは後述する。   The adaptive normalization unit 43 has an abnormality control function. For example, when a predetermined threshold value is stored in advance in the operation control I / F 43p and an input of a prediction error that is not normal or an input of a quantum normalized prediction error is detected, this is a function that quickly eliminates the propagation of an abnormal value. Will be described later.

最適量子化部44は、適応正規化部43から入力された正規化予測誤差を量子化し、対応する音符号を求める。最適量子化部44は、最適逆量子化部45及び後処理部48と接続されており、これらに求めた音符号を出力する。より詳細には、最適量子化部44は、動作制御I/F44pに格納され最適に設計されたパラメータにより量子化し、量子正規化予測誤差に対応する量子化レベルを音符号として出力する。この量子化範囲は、適応的に更新させず、コーデック駆動時で一定である。なお、音符号は、量子正規化予測誤差に対応する値以外に、異常を表すための値としても良い。   The optimal quantization unit 44 quantizes the normalized prediction error input from the adaptive normalization unit 43 and obtains a corresponding phonetic code. The optimum quantization unit 44 is connected to the optimum inverse quantization unit 45 and the post-processing unit 48, and outputs the obtained sound code to these. More specifically, the optimum quantization unit 44 quantizes the parameters stored in the operation control I / F 44p and optimally designed, and outputs the quantization level corresponding to the quantum normalized prediction error as a sound code. This quantization range is not updated adaptively and is constant when the codec is driven. Note that the phonogram may be a value for representing an abnormality other than the value corresponding to the quantum normalized prediction error.

最適逆量子化部45は、最適量子化部44から入力された音符号に対応する量子化値、すなわち量子正規化予測誤差を出力する。より詳細には、最適逆量子化部45は、動作制御I/F45pに格納され最適に設計されたパラメータにより逆量子化し、量子正規化予測誤差を適応正規化部43に出力する。   The optimal inverse quantization unit 45 outputs a quantization value corresponding to the phone code input from the optimal quantization unit 44, that is, a quantum normalized prediction error. More specifically, the optimal inverse quantization unit 45 performs inverse quantization using the optimally designed parameters stored in the operation control I / F 45 p and outputs a quantum normalized prediction error to the adaptive normalization unit 43.

加算器47は、適応正規化部43、及び適応予測部46と接続されている。加算器47は、適応正規化部43からの量子化予測誤差と、適応予測部46からの予測値とを加算し、得られた音情報を適応予測部46に出力する。なお、この加算して得た音情報は、最終的にデコーダ26が出力する音情報と同じになる。   The adder 47 is connected to the adaptive normalization unit 43 and the adaptive prediction unit 46. The adder 47 adds the quantized prediction error from the adaptive normalization unit 43 and the predicted value from the adaptive prediction unit 46, and outputs the obtained sound information to the adaptive prediction unit 46. Note that the sound information obtained by the addition is the same as the sound information finally output from the decoder 26.

適応予測部46は、過去を含めて入力された量子化予測誤差と過去の復号音情報から、所定のパラメータで規定される後述の適応予測モデルを駆動し、次に入力される音情報の予測値を求め、加算器42、47に出力する。出力した予測値と直前の量子化予測誤差の和が復号音情報となる。適応予測モデルは、予測係数を逐次更新することで入力される音情報系列に適応化していく。予測係数は同期収束構造を有する。すなわち、初期値の異なる予測係数同士は同条件で逐次更新を進めると同一の値に収束する。   The adaptive prediction unit 46 drives an adaptive prediction model (described later) defined by a predetermined parameter from the quantized prediction error and past decoded sound information including the past, and predicts sound information to be input next. A value is obtained and output to the adders 42 and 47. The sum of the output prediction value and the previous quantization prediction error becomes decoded sound information. The adaptive prediction model is adapted to the input sound information sequence by sequentially updating the prediction coefficient. The prediction coefficient has a synchronous convergence structure. That is, prediction coefficients having different initial values converge to the same value when update is performed sequentially under the same conditions.

適応予測部46は、異常制御機能を有している。例えば、動作制御I/F46pに所定の閾値を予め格納しておき、予測値が期待する音情報の振幅範囲を超えて求められた場合、同範囲にクリッピングする機能などであり、詳しくは後述する。   The adaptive prediction unit 46 has an abnormality control function. For example, a predetermined threshold value is stored in advance in the operation control I / F 46p, and when the predicted value is obtained beyond the expected amplitude range of the sound information, it is a function of clipping to the same range, which will be described in detail later. .

後処理部48は、入力された音符号を、動作制御I/F48pに予め格納された所定のパラメータに応じて処理し、その処理された音符号を符号出力I/F17に出力する。当該処理としては、例えば、入力された音符号をそのまま出力する処理や、入力された音符号の正負を反転する処理などが挙げられる。   The post-processing unit 48 processes the input sound code in accordance with predetermined parameters stored in advance in the operation control I / F 48p, and outputs the processed sound code to the code output I / F 17. Examples of the process include a process of outputting the input phonetic as it is, a process of inverting the sign of the input phonetic.

(デコーダ)
図2に示すように、デコーダ26は、前処理部51、最適逆量子化部55、適応正規化部53、適応予測部56、加算器57、及び後処理部58を有している。なお、これらの各部は、動作制御I/F51p、53p、55p、56p、58pを有し、各種の処理とそれぞれ対応したパラメータが格納されている。動作制御I/F51p、53p、55p、56p、58pは、パラメータの記憶を行うので記憶手段と称することもできる。適応正規化部53、最適逆量子化部55及び適応予測部56は、エンコーダ16の適応正規化部43、最適逆量子化部45及び適応予測部46と同様の構成であるので、その説明は省略する。
(decoder)
As shown in FIG. 2, the decoder 26 includes a preprocessing unit 51, an optimal inverse quantization unit 55, an adaptive normalization unit 53, an adaptive prediction unit 56, an adder 57, and a postprocessing unit 58. Each of these units has operation control I / Fs 51p, 53p, 55p, 56p, and 58p, and stores parameters corresponding to various processes. The operation control I / Fs 51p, 53p, 55p, 56p, and 58p can also be referred to as storage means because they store parameters. Since the adaptive normalization unit 53, the optimal inverse quantization unit 55, and the adaptive prediction unit 56 have the same configuration as the adaptive normalization unit 43, the optimal inverse quantization unit 45, and the adaptive prediction unit 46 of the encoder 16, the description thereof will be given. Omitted.

前処理部51は、符号入力I/F25若しくは制御部23から入力された音符号を、動作制御I/F51pに予め格納された所定のパラメータに応じて処理し、その処理された音符号を最適逆量子化部55に出力する。当該処理としては、例えば、入力された音符号をそのまま出力することが挙げられる。また、前処理部51は、例えば、入力された音符号が、動作制御I/F51pに予め格納した異常を示す値であった場合、その旨を制御部23へ通知し、動作制御I/F51pに予め格納したパラメータにより指定された正常な音符号に替えて出力しても良い。   The preprocessing unit 51 processes the sound code input from the code input I / F 25 or the control unit 23 according to a predetermined parameter stored in advance in the operation control I / F 51p, and optimizes the processed sound code The result is output to the inverse quantization unit 55. As this process, for example, an input phonetic code is output as it is. In addition, for example, when the input sound code is a value indicating an abnormality stored in advance in the operation control I / F 51p, the preprocessing unit 51 notifies the control unit 23 to that effect, and the operation control I / F 51p. May be output in place of normal phonetic symbols designated by parameters stored in advance.

後処理部58は、加算器57から入力された復号音情報を、動作制御I/F58pに予め格納された所定のパラメータに応じて処理し、その処理された復号音情報を音出力I/F27に出力する。当該処理としては、例えば、入力された音符号をそのまま出力することが挙げられる。また、後処理部58は、例えば、動作制御I/F58pに所定の閾値を予め格納しておき、入力された復号音情報が期待する音情報の振幅範囲を超えて求められた場合、同範囲にクリッピングして出力するようにしても良い。   The post-processing unit 58 processes the decoded sound information input from the adder 57 in accordance with a predetermined parameter stored in advance in the operation control I / F 58p, and the processed decoded sound information is output to the sound output I / F 27. Output to. As this process, for example, an input phonetic code is output as it is. The post-processing unit 58 stores, for example, a predetermined threshold value in the operation control I / F 58p in advance, and when the input decoded sound information is obtained beyond the expected amplitude range of the sound information, You may make it output by clipping to.

[1−3.作用]
次に、上記の構成を有する本システムの音符号化及び復号化の作用について説明する。本システムは、エンコーダ16及びデコーダ26の各動作制御I/Fに格納された多様なパラメータにより、その振る舞いや特性が制御される。ここでは、以下の点を前提する。
・所望のシステム性能を満足するように全てのパラメータが最適に設計されているものとする。
・エンコーダ16及びデコーダ26は、予め設計されたサンプリング周波数と音情報の情報量に従って音情報の入出力を行うものとする。
・音情報を時系列に取り扱うため、サンプル番号をkで表し、ある瞬間kにサンプルされた時系列情報sの瞬時情報をs(k)と表現するものとする。
[1-3. Action]
Next, the sound encoding and decoding operations of the present system having the above configuration will be described. The behavior and characteristics of this system are controlled by various parameters stored in each operation control I / F of the encoder 16 and the decoder 26. Here, the following points are assumed.
• All parameters are optimally designed to meet the desired system performance.
The encoder 16 and the decoder 26 input and output sound information according to a sampling frequency and sound information amount designed in advance.
In order to handle sound information in time series, the sample number is represented by k, and the instantaneous information of the time series information s sampled at a certain moment k is represented as s (k).

[予測誤差]
エンコーダ16の前処理部41から出力された音情報s(k)に対する適応予測部46の予測値p(k)が与えられたとき、予測誤差d(k)は式(1)のように表せる。
[Prediction error]
When the prediction value p (k) of the adaptive prediction unit 46 with respect to the sound information s i (k) output from the preprocessing unit 41 of the encoder 16 is given, the prediction error d (k) is as shown in Equation (1). I can express.

適応予測部46の適応予測モデルが理想的に駆動されているならば、予測誤差は白色化されてそれ以上予測の余地がない。そのためこの場合は直ちに量子化の手続きを踏めば良い。しかし、現実には入力される音情報は非定常であるため予測しきれず、有色性が残存する。また、音情報の時系列によっては準周期性をも呈してしまう。   If the adaptive prediction model of the adaptive prediction unit 46 is ideally driven, the prediction error is whitened and there is no room for further prediction. Therefore, in this case, the quantization procedure should be immediately followed. However, in reality, the input sound information is non-stationary and therefore cannot be predicted, and the color remains. Moreover, depending on the time series of sound information, quasi-periodicity is also exhibited.

[適応正規化]
そこで、本システムでは、予測誤差をも予測し、予測誤差の予測乖離度d(k)を求めて、より白色化された時系列情報を量子化する。ここで、適応的に予測された予測誤差d(k)の予測値をp(k)とし、予測乖離度d(k)を求める関数をf()で表すと、予測乖離度d(k)は、例えば、式(2)のように、予測誤差をその予測値で除したものとする。p(k)の予測方法は後述するが、理想的に予測誤差の変動を予測できたならば、予測乖離度の期待値E[f(d(k)、p(k))]は1となる。
[Adaptive normalization]
Therefore, in this system, the prediction error is also predicted, the prediction divergence d d (k) of the prediction error is obtained, and the time series information that has been whitened is quantized. Here, when the prediction value of the prediction error d (k) adaptively predicted is p d (k), and the function for obtaining the prediction divergence d d (k) is represented by f d (), the prediction divergence d For example, d (k) is obtained by dividing the prediction error by the predicted value as shown in Equation (2). A method of predicting p d (k) will be described later. If the fluctuation of the prediction error can be predicted ideally, the expected value E [f d (d (k), p d (k))] of the prediction divergence degree. Becomes 1.

或いは、予測乖離度d(k)は、対数ドメインでのd(k)を予測して、f()を比rと予測誤差の符号sを成分とするベクトルを出力する関数として式(3)の通り求めても良い。
sgn(x)は、x≧0で1、x<0で−1を出力する符号関数である。なお、関数f()の構造そのものは、予め動作制御I/F43pに格納されたものを用いても良いし、関数f()の構造そのものをパラメータとして制御部13から適応正規化部43に入力し、適応正規化部43を動的に構築するようにしても良い。
Alternatively, the prediction divergence degree d d (k) is expressed by a function that predicts d (k) in the logarithmic domain and outputs f d () as a function having a ratio r and a prediction error code s as a component. You may obtain | require as 3).
sgn (x) is a sign function that outputs 1 when x ≧ 0 and −1 when x <0. The structure of the function f d () may be stored in advance in the operation control I / F 43 p, or the structure of the function f d () may be used as a parameter from the control unit 13 to the adaptive normalization unit 43. The adaptive normalization unit 43 may be dynamically constructed.

適応正規化部43は後段の最適量子化部44に予測乖離度を出力するが、量子化構造は適応的に更新させず、コーデック駆動時は一定である。すなわち、最適量子化部44における量子化閾値のリストは制御部13からパラメータとして与えられ、本システムの駆動時では一定である。そのため、予測誤差を正規化により、変動する予測誤差の値を規定の範囲に収まるように変換するわけであるから、この予測乖離度を求めることによる白色化を正規化と称する。すなわち、この予測乖離度d(k)が正規化予測誤差であり、予測値p(k)が正規化係数である。 The adaptive normalization unit 43 outputs the prediction divergence degree to the optimal quantization unit 44 in the subsequent stage, but the quantization structure is not updated adaptively and is constant when the codec is driven. That is, the list of quantization thresholds in the optimum quantization unit 44 is given as a parameter from the control unit 13, and is constant when the system is driven. Therefore, since the prediction error is converted by normalization so that the fluctuating prediction error value falls within a specified range, whitening by obtaining the prediction divergence is referred to as normalization. That is, the prediction divergence degree d d (k) is a normalized prediction error, and the predicted value p d (k) is a normalization coefficient.

以上のように、適応正規化部43が予測誤差を正規化することにより、予測誤差の分散を小さくすることができる。これにより、正規化した予測誤差(正規化予測誤差=予測乖離度)を規定の範囲に収めることができるので、量子誤差を小さくすることができる。結果として音の質を向上させ、音の再現性を向上させることができる。   As described above, the adaptive normalization unit 43 normalizes the prediction error, whereby the variance of the prediction error can be reduced. As a result, the normalized prediction error (normalized prediction error = prediction divergence) can be kept within a specified range, so that the quantum error can be reduced. As a result, sound quality can be improved and sound reproducibility can be improved.

[最適量子化]
次に、正規化予測誤差を量子化し、対応する音符号を求める。この量子化において量子化レベルLは予め設定されている。音符号は伝送媒体30を介して最終的にデコーダ26に入力されるため、情報量を最大化する目的からも量子化レベルL=2(mは自然数)と設計するのが望ましい。量子化閾値のリストはパラメータとして制御部13から与えられる。量子化閾値は昇順に整列されており、i番目の閾値をqth(i)で表すものとする。
[Optimum quantization]
Next, the normalized prediction error is quantized to obtain a corresponding phonetic code. In this quantization, the quantization level L is set in advance. Since the sound code is finally input to the decoder 26 via the transmission medium 30, it is desirable to design the quantization level L = 2 m (m is a natural number) for the purpose of maximizing the amount of information. The list of quantization thresholds is given from the control unit 13 as a parameter. The quantization threshold values are arranged in ascending order, and the i-th threshold value is represented by q th (i).

量子化区間が量子化範囲で連続であるとすれば、音符号c(x)は式(4)の通り求めることができる。
If the quantization interval is continuous in the quantization range, the phonetic code c (x) can be obtained as shown in Equation (4).

音符号c(x)への入力は正規化予測誤差であるため、量子化閾値のドメインも適応正規化部43のドメインと整合をとって設計する。   Since the input to the phoneme c (x) is a normalized prediction error, the quantization threshold domain is designed in conformity with the domain of the adaptive normalization unit 43.

適応正規化部43が対数ドメインで駆動され式(3)が音符号c(x)のxに入力される場合、音符号は式(5)の通り求めることができる。ここで、x.mはベクトルxのm成分を表す。
When the adaptive normalization unit 43 is driven in the logarithmic domain and Expression (3) is input to x of the sound code c (x), the sound code can be obtained as Expression (5). Where x. m represents the m component of the vector x.

一方、量子化区間は不連続であっても良い。この場合、量子化閾値は対象区間の両端の値を指定する。なお、量子化区間の探索には二分探索を用いて探索時間を低減するようにしても良い。   On the other hand, the quantization interval may be discontinuous. In this case, the quantization threshold specifies values at both ends of the target section. Note that the search time may be reduced by using a binary search for the search of the quantization interval.

また、符号化装置10の各部や復号化装置20でも異常検出が行えるように、量子化とは独立した異常レベルを式(6)のように定義しても良い。式(6)ではc(x)=0が異常レベルに該当する。
Further, an anomaly level independent of quantization may be defined as in equation (6) so that each part of the encoding device 10 and the decoding device 20 can also detect an anomaly. In Expression (6), c (x) = 0 corresponds to the abnormal level.

以上のように、最適量子化部44で量子化及び符号化され生成された音符号は、最適逆量子化部45と後処理部48へ出力され、最終的にデコーダ26へ入力される。   As described above, the sound code quantized and encoded by the optimal quantization unit 44 is output to the optimal inverse quantization unit 45 and the post-processing unit 48 and finally input to the decoder 26.

[最適逆量子化]
最適逆量子化部45は、最適量子化部44から入力された音符号に対応する量子化値、すなわち量子正規化予測誤差を求め、適応正規化部43に出力する。ここで、量子化値のリストは、最適な設計によりパラメータとして制御部13から与えられるが、量子化閾値と対応するものである。量子化値は昇順に整列されており、i番目量子化値をq(i)で表すものとする。
[Optimum inverse quantization]
The optimum inverse quantization unit 45 obtains a quantization value corresponding to the sound code input from the optimum quantization unit 44, that is, a quantum normalized prediction error, and outputs the quantization value to the adaptive normalization unit 43. Here, the list of quantization values is given as a parameter by the optimal design from the control unit 13 and corresponds to the quantization threshold. The quantized values are arranged in ascending order, and the i-th quantized value is represented by q (i).

量子正規化予測誤差をQ[d(k)]、量子化誤差をe(k)とすれば、量子正規化予測誤差Q[d(k)]と正規化予測誤差d(k)の関係は、式(7)となる。
If the quantum normalized prediction error is Q [d d (k)] and the quantization error is e q (k), the quantum normalized prediction error Q [d d (k)] and the normalized prediction error d d (k) ) Is expressed by Equation (7).

量子化区間を最小化することで量子化誤差を最小化できることが分かる。量子化区間を小さくするには、量子化レベルを大きくするか、量子化範囲を小さくすれば良い。すなわち、最適量子化部44へ入力される正規化予測誤差d(k)の分散を小さくすれば良い。このため、量子正規化予測誤差Q[d(k)]は、適応正規化部43へフィードバックされる。 It can be seen that the quantization error can be minimized by minimizing the quantization interval. In order to reduce the quantization interval, the quantization level may be increased or the quantization range may be decreased. That is, the variance of the normalized prediction error d d (k) input to the optimal quantization unit 44 may be reduced. For this reason, the quantum normalization prediction error Q [d d (k)] is fed back to the adaptive normalization unit 43.

[適応逆正規化]
適応正規化部43は、最適逆量子化部45から入力された量子正規化予測誤差Q[d(k)]と予測誤差d(k)の正規化に用いた正規化係数p(k)との関数により正規化を解き、その関数値を量子化予測誤差として適応予測部46に出力する。この関数は、正規化関数の正規化を解くものであるため、正規化関数f()の逆関数f −1()と考えることができる。
[Adaptive denormalization]
The adaptive normalization unit 43 uses the normalization coefficient p d (k) used to normalize the quantum normalized prediction error Q [d d (k)] and the prediction error d (k) input from the optimal inverse quantization unit 45. ) And the function value is output to the adaptive prediction unit 46 as a quantized prediction error. Since this function solves the normalization of the normalization function, it can be considered as an inverse function f d −1 () of the normalization function f d ().

ここで、正規化予測誤差を式(2)とした場合、量子化予測誤差Q[d(k)]は式(8)の通り表される。
Here, when the normalized prediction error is represented by Equation (2), the quantization prediction error Q [d (k)] is represented as Equation (8).

一方、正規化予測誤差を式(3)の対数ドメインとした場合、量子化予測誤差Q[d(k)]は、音符号も用いて式(9)の通り表される。
On the other hand, when the normalized prediction error is the logarithmic domain of Equation (3), the quantized prediction error Q [d (k)] is expressed as Equation (9) using the sound code.

ここで、量子化予測誤差と予測誤差との誤差を検証する。そのために、式(8)を次の式(10)の通り展開する。
Here, the error between the quantization prediction error and the prediction error is verified. For this purpose, the expression (8) is expanded as the following expression (10).

この式(10)から明らかなように、予測誤差に対し、正規化、量子化、逆量子化、及び逆正規化のプロセスを経たことにより、予測誤差にe(k)p(k)だけノイズが付加されることが分かる。また、このノイズを最小化するためには量子化誤差e(k)及び正規化係数p(k)を最小化すれば良いことも分かる。 As is clear from the equation (10), the prediction error is converted into e q (k) p d (k) through the normalization, quantization, inverse quantization, and inverse normalization processes. It can be seen that only noise is added. It can also be seen that in order to minimize this noise, the quantization error e q (k) and the normalization coefficient p d (k) may be minimized.

前述の通り、量子化誤差e(k)を小さくするためには、量子化レベルが一定の条件下では正規化予測誤差d(k)の分散が小さいほど良い。正規化係数p(k)を最小化するためには、予測誤差を最小化することに加えて、理想的に予測誤差を予測できれば良い。 As described above, in order to reduce the quantization error e q (k), it is better that the variance of the normalized prediction error d d (k) is smaller under a condition where the quantization level is constant. In order to minimize the normalization coefficient p d (k), in addition to minimizing the prediction error, it is sufficient that the prediction error can be predicted ideally.

これらの最適化を実現するため、適応正規化部43は入力される予測誤差d(k)を適応的に予測する必要がある。ここで、デコーダ26へは音符号が入力されるため、予測誤差d(k)の予測構造が同期収束制御されなければエンコーダ16とデコーダ26の内部状態が不一致のまま進行し、期待したとおりの音は復元されなくなる。   In order to realize these optimizations, the adaptive normalization unit 43 needs to adaptively predict the input prediction error d (k). Here, since the sound code is input to the decoder 26, if the prediction structure of the prediction error d (k) is not subjected to synchronous convergence control, the internal state of the encoder 16 and the decoder 26 proceeds with a mismatch, and as expected. Sound will not be restored.

そのため、予測誤差d(k)の予測構造としては、同期収束構造を備える必要がある。そこで、上記の通り、予測誤差d(k)の予測値は正規化係数p(k)であるから、正規化係数p(k)に同期収束構造を与える。 Therefore, it is necessary to provide a synchronous convergence structure as a prediction structure of the prediction error d (k). Therefore, as described above, since the predicted value of the prediction error d (k) is the normalized coefficient p d (k), a synchronous convergence structure is given to the normalized coefficient p d (k).

すなわち、正規化係数p(k+1)は過去を含めた量子正規化予測誤差Q[d(k)]及び正規化係数p(k)から、式(11)の形式の予測誤差予測関数P()で更新される。
That is, the normalization coefficient p d (k + 1) is obtained from the quantum normalization prediction error Q [d d (k)] including the past and the normalization coefficient p d (k) in the form of a prediction error prediction function of the formula (11). Updated with P d ().

予測誤差予測関数P()は同期収束構造を備え、例えば、量子正規化予測誤差Q[d(k)]及び正規化係数p(k)の線形結合として表すことができる。この関数P()は、内部状態が異なる同構造の複数システムに同一の入力を時系列に与えていくと、システムの時定数に応じて全システムの内部状態が同期し、同一状態へ収束する制御構造を有する。なお、量子正規化予測誤差及び正規化係数の初期値は予め設定しておく。 The prediction error prediction function P d () has a synchronous convergence structure, and can be expressed as, for example, a linear combination of a quantum normalized prediction error Q [d d (k)] and a normalization coefficient p d (k). When the same input is given to a plurality of systems having the same structure with different internal states in time series, the function P d () synchronizes the internal states of all the systems according to the system time constant and converges to the same state. Control structure. Note that the initial values of the quantum normalization prediction error and the normalization coefficient are set in advance.

より詳細には、予測誤差予測関数P()は、次の特徴を有する。
(i) 利得項と減衰項を含み構成される。
(ii) 量子正規化予測誤差の正負で利得項が異なる。
(iii) 過去を含む量子正規化予測誤差で利得項が異なる。
(iv) 過去を含む量子正規化予測誤差に比例した利得率
(v) 過去を含む量子正規化予測誤差の変化量で利得項が異なる。
(vi) 過去を含む量子正規化予測誤差の変化量に比例した利得率
(vii) 過去を含む正規化係数に比例した減衰率
(viii) 量子正規化予測誤差に下限閾値を設ける。
(ix) 比例係数や閾値をパラメータとする。
More specifically, the prediction error prediction function P d () has the following characteristics.
(i) Consists of gain and attenuation terms.
(ii) The gain term differs depending on whether the quantum normalization prediction error is positive or negative.
(iii) The gain term differs depending on the quantum normalized prediction error including the past.
(iv) Gain factor proportional to the quantum normalized prediction error including the past
(v) The gain term differs depending on the amount of change in the quantum normalization prediction error including the past.
(vi) Gain factor proportional to the amount of change in the quantum normalized prediction error including the past
(vii) Decay rate proportional to the normalization factor including the past
(viii) A lower threshold is set for the quantum normalized prediction error.
(ix) Proportional coefficient and threshold are used as parameters.

この関数P()をブロック図としたものを図3に示す。すなわち、適応正規化部43は、上記の関数P()として機能する正規化係数更新部を備える。この正規化係数更新部は、複数の利得項算出部431、利得項選択条件部432、切替部433、及び減衰項算出部434を有する。 FIG. 3 shows a block diagram of the function P d (). That is, the adaptive normalization unit 43 includes a normalization coefficient update unit that functions as the function P d (). The normalization coefficient updating unit includes a plurality of gain term calculation units 431, a gain term selection condition unit 432, a switching unit 433, and an attenuation term calculation unit 434.

利得項選択条件部432は、直接又は遅延素子432aを介して入力された過去を含む量子正規化予測誤差に応じて、複数の利得項算出部431のうち正規化係数更新の算出にどの利得項算出部431を用いるかを選択し、その切り替え信号を切替部433に出力する。切替部433は、利得項選択条件部432からの信号を受けて正規化係数更新の算出に用いる利得項算出部431に切り換える。   The gain term selection condition unit 432 selects which gain term to calculate the normalization coefficient update among the plurality of gain term calculation units 431 according to the quantum normalization prediction error including the past input directly or via the delay element 432a. It is selected whether to use the calculation unit 431, and the switching signal is output to the switching unit 433. The switching unit 433 receives the signal from the gain term selection condition unit 432 and switches to the gain term calculation unit 431 used to calculate the normalization coefficient update.

各利得項算出部431は、複数の係数制御条件部4310〜431nを有し、これらは直接又は遅延素子431aを介して入力された量子正規化予測誤差に応じて利得率である係数k(i=1,2,…n)を決定する。また、係数制御条件部4310〜431nは、直接又は遅延素子431aを介して入力された量子正規化予測誤差の変化量に応じて利得率である係数k(i=1,2,…n)を決定するようにしても良い。利得項算出部431は、加算器431bによってこの係数と量子正規化予測誤差とを線形結合し、利得項を算出する。減衰項算出部434は、遅延素子434a、減衰率である係数a(i=1,2,…l)及び加算器434bを複数含み構成され、過去分の正規化係数から、遅延素子434a及び係数aに基づいた線形結合により減衰項を算出する。このように、正規化係数更新部は、求めた利得項及び減衰項から次の正規化係数を求める。なお、利得項選択条件部432及び切替部433による利得項算出部431の切り替えは、利得項算出部431による利得項の算出と並行して行うようにしても良い。 Each gain term calculation unit 431 includes a plurality of coefficient control condition units 4310 to 431n, which are coefficients k i (a gain factor according to a quantum normalized prediction error input directly or via the delay element 431a). i = 1, 2,... n) is determined. Also, the coefficient control condition units 4310 to 431n are coefficients k i (i = 1, 2,... N) that are gain rates according to the amount of change of the quantum normalization prediction error input directly or via the delay element 431a. May be determined. The gain term calculation unit 431 linearly combines this coefficient and the quantum normalized prediction error by the adder 431b to calculate the gain term. The attenuation term calculation unit 434 includes a plurality of delay elements 434a, coefficients a i (i = 1, 2,...) That are attenuation factors, and an adder 434b. From the normalization coefficients for the past, the delay elements 434a and An attenuation term is calculated by linear combination based on the coefficient a i . As described above, the normalization coefficient update unit obtains the next normalization coefficient from the obtained gain term and attenuation term. Note that the switching of the gain term calculation unit 431 by the gain term selection condition unit 432 and the switching unit 433 may be performed in parallel with the calculation of the gain term by the gain term calculation unit 431.

なお、上記(ix)のように予測誤差予測関数P()が用いる係数等をパラメータとするが、この関数自体をパラメータとしてもよい。例えば、動作制御I/F43pに予め格納しておいても良いし、記憶部14に予め記憶させておき制御部13経由で取得するようにしても良い。また、上記(viii)のように量子化正規化予測誤差に下限値を設けることにより、量子化誤差を小さくすることができる。 As described in (ix) above, the coefficient used by the prediction error prediction function P d () is used as a parameter, but this function itself may be used as a parameter. For example, it may be stored in advance in the operation control I / F 43p, or may be stored in advance in the storage unit 14 and acquired via the control unit 13. Further, by providing a lower limit value for the quantized normalized prediction error as in (viii) above, the quantization error can be reduced.

以上のように、適応正規化部43は、過去を含めた量子正規化予測誤差Q[d(k)]及び正規化係数p(k)を駆動源として、これらを予測誤差予測関数P()に代入していくことにより、正規化係数を更新していく。このように、適応正規化部43は、予測誤差d(k)の予測値p(k)を更新させ予測誤差d(k)を予測するため、予測誤差の予測部としての機能を有しているということができる。更新した正規化係数は、次の正規化、逆量子化、及び正規化係数の次の更新に用いられる。 As described above, the adaptive normalization unit 43 uses the quantum normalized prediction error Q [d d (k)] including the past and the normalization coefficient p d (k) as drive sources, and these are used as the prediction error prediction function P. By substituting for d (), the normalization coefficient is updated. Thus, the adaptive normalization unit 43 updates the prediction value p d (k) of the prediction error d (k) and predicts the prediction error d (k), and thus has a function as a prediction error prediction unit. It can be said that The updated normalization coefficient is used for the next normalization, inverse quantization, and the next update of the normalization coefficient.

[適応予測]
適応正規化部43の量子化予測誤差Q[d(k)]と適応予測部46の予測値p(k)から、入力された音情報s(k)は、式(1)を用いて式(12)の通りs(k)として復元される。デコーダ26は最終的にこの音情報s(k)を出力する。なお、式(12)を示すに当たり、式(8)、(10)について、量子化予測誤差Q[d(k)]と予測誤差d(k)との誤差をe(k)とし両者の関係を式(13)の通り一般化している。
[Adaptive prediction]
From the quantization prediction error Q [d (k)] of the adaptive normalization unit 43 and the prediction value p (k) of the adaptive prediction unit 46, the input sound information s i (k) is expressed by using the equation (1). It is restored as s o (k) as in equation (12). The decoder 26 finally outputs the sound information s o (k). Note that in expressing the equation (12), regarding the equations (8) and (10), the error between the quantized prediction error Q [d (k)] and the prediction error d (k) is assumed to be e (k), and the relationship between the two. Is generalized as shown in equation (13).

式(12)から正規化と量子化による誤差が出力音に含まれてしまうことが分かるが、この誤差の根源は予測誤差である。そのため、適応正規化部43で理想的に予測誤差を予測できたとしても、予測誤差自体の分散が大きければ量子化誤差も大きいものとなってしまう。   Although it can be seen from equation (12) that errors due to normalization and quantization are included in the output sound, the source of this error is the prediction error. Therefore, even if the adaptive normalization unit 43 can predict the prediction error ideally, if the variance of the prediction error itself is large, the quantization error becomes large.

そこで、適応予測部46では、過去を含む復元した音情報と適応正規化部43から入力された量子化予測誤差から、予測誤差の分散が最小となるように、次に入力される音情報を予測して出力する。この予測には、本システムに入力される時系列な音情報の空間を上手く記述できる予測モデルを用いる。   Therefore, the adaptive prediction unit 46 determines the next input sound information from the restored sound information including the past and the quantized prediction error input from the adaptive normalization unit 43 so that the variance of the prediction error is minimized. Predict and output. For this prediction, a prediction model capable of well describing the space of time-series sound information input to the system is used.

前述のように、予測モデルは、予測係数を適応的に更新させ、この予測係数によりその振る舞いを制御する。予測係数の適応的な更新方法として、予測誤差を最小化させるように予測誤差を調整する方法を用いることができる。例えば、最小二乗法や最急降下法を採用することができる。なお、予測モデル自体をパラメータとしても良い。   As described above, the prediction model adaptively updates the prediction coefficient, and the behavior is controlled by the prediction coefficient. As a method for adaptively updating the prediction coefficient, a method for adjusting the prediction error so as to minimize the prediction error can be used. For example, a least square method or a steepest descent method can be employed. Note that the prediction model itself may be used as a parameter.

入力空間が音声である場合、予測モデルとして複数極モデルが適している。本システムでは、安定条件の問題から式(14)の通り3次以上の極を多数の零モデルで近似している点で実用的である。この場合、量子正規化予測誤差を駆動源とする。a、bは予測係数である。Mは2以上の整数である。
When the input space is speech, a multipole model is suitable as the prediction model. This system is practical in that the third-order or higher-order pole is approximated by a large number of zero models as shown in Equation (14) due to the problem of stability conditions. In this case, a quantum normalized prediction error is used as a drive source. a i and b i are prediction coefficients. M is an integer of 2 or more.

零モデルの次数は入力空間のスペクトル分布との関連があり、予測誤差に影響するため、予め入力空間に最適な次数の設計をしておく必要がある。なお、この次数をパラメータとして与えるようにしても良い。   Since the order of the zero model is related to the spectral distribution of the input space and affects the prediction error, it is necessary to design an optimal order for the input space in advance. This order may be given as a parameter.

零モデル近似は多くの次数を必要としそれと同数の乗算を行うため計算規模が大きくなる。これを回避するために式(15)のように近似を行っても良い。これによれば、式(14)よりも精度良く予測が可能になる。
The zero model approximation requires a large number of orders and performs the same number of multiplications, which increases the computational scale. In order to avoid this, approximation may be performed as in Expression (15). According to this, it becomes possible to predict with higher accuracy than Expression (14).

以上のように、適応予測部46において、予測誤差の分散が最小となるように音情報の予測値を求める。但し、適応予測部46、56は、適応正規化部43、53と同様にエンコーダ16とデコーダ26とで内部状態が非同期に駆動される可能性がある。このため、予測係数の更新式は同時に同期収束制御の構造を有していなければならない。   As described above, the adaptive prediction unit 46 obtains the prediction value of the sound information so that the variance of the prediction error is minimized. However, the adaptive prediction units 46 and 56 may be driven asynchronously by the encoder 16 and the decoder 26 in the same manner as the adaptive normalization units 43 and 53. For this reason, the prediction coefficient update formula must have a synchronous convergence control structure at the same time.

[同期収束制御]
次に、同期収束制御について説明する。本システムでは、適応正規化部43、53や適応予測部46、56がそれぞれ過去の出力値を入力とするフィードバック適応形式である。この場合、エンコーダ16とデコーダ26との間で、適応パラメータ等の同一適応器(適応システム)の内部状態が同期しなければならない。非同期状態のままでは意図しない音情報がデコーダ26から出力されてしまうからである。
[Synchronous convergence control]
Next, synchronous convergence control will be described. In the present system, the adaptive normalization units 43 and 53 and the adaptive prediction units 46 and 56 are feedback adaptive formats in which past output values are input. In this case, the internal state of the same adaptor (adaptive system) such as adaptive parameters must be synchronized between the encoder 16 and the decoder 26. This is because unintended sound information is output from the decoder 26 in the asynchronous state.

しかし、エンコーダ16とデコーダ26は一般的に非同期に駆動を開始する。このため、速やかにこの非同期状態を解消し、同期のとれた状態へ収束させることが望ましい。そこで、本システムでは、適応正規化部43、53及び適応予測部46、56が、同期収束制御の構造を有する。   However, the encoder 16 and the decoder 26 generally start driving asynchronously. For this reason, it is desirable to quickly resolve this asynchronous state and converge to a synchronized state. Therefore, in this system, the adaptive normalization units 43 and 53 and the adaptive prediction units 46 and 56 have a synchronous convergence control structure.

非同期状態から同期状態へ収束させるためには、適応システム、すなわち適応正規化部43、53、適応予測部46、56が次の条件(1)〜(5)を満足する必要があり、条件(6)、(7)を満足するようにしても良い。換言すると、次の条件(1)〜(5)を満足することが同期収束構造を有するということであり、条件(1)〜(5)を満たすことを前提として、さらに条件(6)、(7)を満たすようにしても良い。なお、条件(1)〜(4)及び(6)において、システムとは、同期収束させる対象をいい、例えば、一対の適応正規化部43、53や、一対の適応予測部46、56である。また、制御式は、例えば、上記の式(11)、(14)、(15)である。
(1) システムの入力と出力に対する関係は制御式により表される。
(2) システムの入力は内部状態を有しない単純入力とシステム出力とからなる。
(3) 同期対象システム間(例えば、適応正規化部43と適応正規化部53)の単純入力及び制御式は同一とする。
(4) 制御式は入力と内部状態を含み、入力されたシステム出力は内部状態に含まれる。
(5) 制御式の内部状態を含む項は任意速度(時定数)でその絶対値が逓減するように更新するが、この速度は収束時定数で決まるものとする。
(6) 過去の自システム出力を入力しても良い。
(7) 制御式の内部状態を含む項は逓減率を十分下回る程度に量子化できる。
In order to converge from the asynchronous state to the synchronous state, the adaptive system, that is, the adaptive normalization units 43 and 53 and the adaptive prediction units 46 and 56 must satisfy the following conditions (1) to (5). You may make it satisfy 6) and (7). In other words, satisfying the following conditions (1) to (5) has a synchronous convergence structure, and on the premise that the conditions (1) to (5) are satisfied, the conditions (6), ( 7) may be satisfied. In the conditions (1) to (4) and (6), the system refers to a target to be synchronized and converged, for example, a pair of adaptive normalization units 43 and 53 and a pair of adaptive prediction units 46 and 56. . The control formula is, for example, the above formulas (11), (14), and (15).
(1) The relationship between system input and output is expressed by a control equation.
(2) The system input consists of a simple input with no internal state and a system output.
(3) The simple inputs and control expressions between the synchronization target systems (for example, the adaptive normalization unit 43 and the adaptive normalization unit 53) are the same.
(4) The control expression includes the input and internal state, and the input system output is included in the internal state.
(5) The term including the internal state of the control equation is updated so that the absolute value decreases at an arbitrary speed (time constant). This speed is determined by the convergence time constant.
(6) Past system output may be input.
(7) The term including the internal state of the control equation can be quantized to a level well below the rate of decrease.

なお、収束時定数をパラメータとしても良い。これにより収束速度制御が可能となる。また、同期収束速度は、入力空間のスペクトル分布との関連があり、予測誤差に影響するため、予め入力空間に最適な収束時定数の設計をしておく必要がある。   The convergence time constant may be used as a parameter. As a result, the convergence speed can be controlled. The synchronous convergence speed is related to the spectral distribution of the input space and affects the prediction error. Therefore, it is necessary to design an optimal convergence time constant for the input space in advance.

以上のように、適応システムが同期収束構造を有することにより、エンコーダ16とデコーダ26の始動タイミングによらずに同期収束させ、音の再現性を向上させることができる。特に、適応正規化部43、53が同期収束構造を有することにより、予測誤差の予測がより正確にできるようになる。適応予測部46、56が同期収束構造を有することにより、音情報の予測がより正確にできるようになる。   As described above, since the adaptive system has the synchronous convergence structure, it is possible to achieve the synchronous convergence regardless of the start timing of the encoder 16 and the decoder 26 and improve the sound reproducibility. In particular, since the adaptive normalization units 43 and 53 have a synchronous convergence structure, prediction errors can be predicted more accurately. Since the adaptive prediction units 46 and 56 have a synchronous convergence structure, sound information can be predicted more accurately.

[異常制御]
本システムでは、外部からの入力や予測における内部状態のフィードバックによる閉ループ構造を有するため、異常発生によって復帰不可能な状態に陥る可能性がある。異常状態としては、例えば、システムの各部が非同期状態であること、システムの各部への入力が期待する範囲を超えていること等が挙げられる。この異常状態の要因としては、通信路としての伝送媒体30の故障等が挙げられる。本システムでは、このような異常発生によって復帰不可能な状態に陥ることを回避するため、以下の方法を採ることができる。なお、以下の方法は、何れか一つだけ行っても良いし、二以上を組み合わせて行っても良い。
[Abnormal control]
Since this system has a closed-loop structure based on external input and feedback of the internal state in prediction, there is a possibility that the system may fall into an unrecoverable state due to the occurrence of an abnormality. Examples of the abnormal state include that each part of the system is in an asynchronous state and that an input to each part of the system exceeds an expected range. As a factor of this abnormal state, there is a failure of the transmission medium 30 as a communication path. In this system, the following method can be adopted in order to avoid a situation in which the system cannot recover due to such an abnormality. Note that only one of the following methods may be performed, or two or more methods may be combined.

(1) エンコーダ16及び/又はデコーダ26の各処理部に期待する範囲外の値が入力された場合は、その範囲の境界値へクリッピングする。例えば、前処理部41の動作制御I/F41pに所定の閾値又は範囲を格納しておき、当該閾値又は範囲を基準に前処理部41に入力された音情報と比較し、異常かどうかを判定する。異常である場合は、クリッピングを行う。 (1) When a value outside the expected range is input to each processing unit of the encoder 16 and / or the decoder 26, clipping is performed to the boundary value of the range. For example, a predetermined threshold value or range is stored in the operation control I / F 41p of the preprocessing unit 41, and compared with the sound information input to the preprocessing unit 41 based on the threshold value or range, whether or not there is an abnormality is determined. To do. If it is abnormal, clipping is performed.

(2) デコーダ26の前処理部51が、入力された音符号と動作制御I/F51pに予め格納された所定の閾値とを比較し、入力音符号が当該閾値を超えて異常であると判定した場合、その旨を制御部53に通知する。この場合、例えば、制御部53の制御により、ユーザインターフェイスUI21を介して異常をユーザに通知したり、音出力I/F27からパラメータにより指定された音情報を出力させたりする。 (2) The pre-processing unit 51 of the decoder 26 compares the input sound code with a predetermined threshold value stored in advance in the operation control I / F 51p, and determines that the input sound code exceeds the threshold value and is abnormal. If so, the control unit 53 is notified accordingly. In this case, for example, under the control of the control unit 53, the user is notified of the abnormality via the user interface UI21, or the sound information specified by the parameter is output from the sound output I / F 27.

上記の方法によれば、異常な音情報若しくは音符号を正常な音情報若しくは音符号へ変換することができる。但し、同期収束するまでの期間、適応正規化部43、53への入力系列とその内部状態がエンコーダ16とデコーダ26との間で相違してしまう。さらに、エンコーダ16の適応正規化部43の出力をデコーダ26の入力とするため、同期収束するまではデコーダ26から過大なレベルで出力が発散するなど意図せぬ音情報が出力されてしまう可能性がある。そこで、本システムでは、同期の早期回復処置として以下の処置を行う。   According to the above method, abnormal sound information or sound code can be converted into normal sound information or sound code. However, the input sequence to the adaptive normalization units 43 and 53 and the internal state thereof differ between the encoder 16 and the decoder 26 until the period until the convergence converges. Furthermore, since the output of the adaptive normalization unit 43 of the encoder 16 is used as the input of the decoder 26, there is a possibility that unintended sound information such as output diverges from the decoder 26 at an excessive level until the synchronous convergence occurs. There is. Therefore, in this system, the following measures are taken as an early recovery procedure for synchronization.

(同期の早期回復)
(a) 異常音符号入力期間にデコーダ26を停止させる。例えば、デコーダ26の前処理部51に入力された音符号の異常を検出する検出部を設ける。検出部には、入力された音符号が異常であるかを判定するための所定の閾値又は範囲が予め設定されており、入力された音符号と当該所定の閾値又は範囲とを比較することにより異常か否かを判定する。動作制御I/F51pにこの所定の閾値又は範囲を予め格納しておき、動作制御I/F51pを検出部として機能させるようにしても良い。このように、デコーダ26を停止させることで、異常入力検出時点の内部状態を保持できるので、非同期化の進行を最小限に抑制することができる。従って、エンコーダ16とデコーダ26の非同期問題を早期に解消することができる。
(Early recovery of synchronization)
(a) The decoder 26 is stopped during the abnormal sound code input period. For example, a detection unit is provided that detects an abnormality of the sound code input to the preprocessing unit 51 of the decoder 26. The detection unit is preset with a predetermined threshold value or range for determining whether or not the input sound code is abnormal, and by comparing the input sound code with the predetermined threshold value or range. Determine if it is abnormal. The predetermined threshold value or range may be stored in advance in the operation control I / F 51p so that the operation control I / F 51p functions as a detection unit. As described above, by stopping the decoder 26, the internal state at the time of detecting the abnormal input can be maintained, so that the progress of desynchronization can be minimized. Therefore, the asynchronous problem between the encoder 16 and the decoder 26 can be solved early.

(b) デコーダ26の内部状態を、異常と判定した時の内部状態よりも初期状態の方向へ遷移させる。すなわち、同期収束するまでの意図せぬ音情報の生成は、異常入力解消時点でデコーダ26に残留している異常な音符号の影響を要因とするものであることが分かった。つまり、異常検出時点から異常解消時点までに入力された異常な音符号によって、デコーダ26の内部状態を示す状態変数が変わっていくため、デコーダ26の内部状態が遷移していき、初期状態からの遷移度合いが大きくなる。このように異常入力解消時点のデコーダ26の内部状態には異常な音符号による影響が過去の積算情報として残存するため、予期せぬ作用を生じさせる可能性がある。よって、異常入力解消時にデコーダ26の内部状態を初期状態の方向へ遷移させることにより、異音生成を抑制でき、同期収束の高速化を図ることができる。内部状態の初期状態の方向への遷移は、異常入力解消時点の内部状態より遷移させれば良い。より好ましくは、異常入力検出の開始時点の内部状態より初期状態の方向へ遷移させる。デコーダ26の内部状態の遷移には、正規化係数を現在値に応じて調整すること、及び内部状態のリセットが含まれる。正規化係数の調整と内部状態のリセットの両方を行っても良い。 (b) The internal state of the decoder 26 is shifted in the direction of the initial state from the internal state when it is determined as abnormal. That is, it has been found that the unintentional generation of sound information until synchronous convergence is caused by the influence of an abnormal sound code remaining in the decoder 26 when the abnormal input is resolved. That is, since the state variable indicating the internal state of the decoder 26 is changed by the abnormal sound code input from the abnormality detection time point to the abnormality resolving time point, the internal state of the decoder 26 is changed, and the state from the initial state is changed. The degree of transition increases. As described above, since the influence of the abnormal sound code remains as past accumulated information in the internal state of the decoder 26 at the time of eliminating the abnormal input, there is a possibility of causing an unexpected action. Therefore, by causing the internal state of the decoder 26 to transition toward the initial state when the abnormal input is resolved, the generation of abnormal noise can be suppressed and the speed of synchronization convergence can be increased. The transition of the internal state in the direction of the initial state may be performed from the internal state at the time of eliminating the abnormal input. More preferably, a transition is made from the internal state at the start of abnormal input detection toward the initial state. The transition of the internal state of the decoder 26 includes adjusting the normalization coefficient according to the current value and resetting the internal state. Both the adjustment of the normalization coefficient and the reset of the internal state may be performed.

(c) 上記(a)及び(b)の処理を組み合わせて行っても良い。例えば、異常入力期間にデコーダ26を停止させ、伝送媒体30等の異常が解消され、再びデコーダ26を起動する際に正規化係数の調整及び/又は内部状態のリセットを実行しても良い。 (c) The above processes (a) and (b) may be combined. For example, the decoder 26 may be stopped during the abnormal input period, the abnormality of the transmission medium 30 or the like is resolved, and the normalization coefficient may be adjusted and / or the internal state may be reset when the decoder 26 is activated again.

(d) 同期収束に関連するパラメータのうち、時定数に関するパラメータの利得を、同期収束するまでの間一時的に引き上げる。これにより、例えば、異常入力が解消しデコーダ26の再起動の際に、同期収束を高速化させることができる。また、同期収束するまでの短期間に留め、その期間経過後に復元させることで、音質劣化を抑制することができる。 (d) Among the parameters related to synchronous convergence, the gain of the parameter related to the time constant is temporarily increased until the synchronous convergence. Thereby, for example, when the abnormal input is resolved and the decoder 26 is restarted, the synchronization convergence can be accelerated. Moreover, sound quality deterioration can be suppressed by keeping it for a short time until the convergence is completed, and restoring it after the period.

一方、異常の発生により上記のような処置を施したとしても、異常が解消されない間は情報が欠落しているため、エンコーダ16が符号化した音情報を期待通りに復元できない場合が多い。この点、音情報の流れは非定常であるが、音情報は雑音でなければ短期定常な音情報セグメントが遷移するシーケンスとみなすことができる。このセグメントでは一定のピッチで音の振幅波形が繰り返すものと解釈できる。従って、情報欠落による音情報の正常な復元ができない場合は、以下の補間処理を行うことができる。   On the other hand, even if the above-described measures are taken due to the occurrence of an abnormality, the information is missing as long as the abnormality is not resolved, so that the sound information encoded by the encoder 16 cannot often be restored as expected. In this regard, the flow of sound information is non-stationary, but if the sound information is not noise, it can be regarded as a sequence in which a short-term steady sound information segment transitions. In this segment, it can be interpreted that the sound amplitude waveform repeats at a constant pitch. Therefore, when sound information cannot be restored normally due to missing information, the following interpolation processing can be performed.

すなわち、異常入力期間が音情報セグメントよりも短い期間という条件においては、欠落した音情報を直近に出力した音情報セグメントから抽出し、欠落部分を補間し再生させることでより確からしい音情報を出力することができる。この補間する音情報の抽出には、欠落部分と関連する音情報セグメントのピッチ推定が必要となる。   In other words, under the condition that the abnormal input period is shorter than the sound information segment, the missing sound information is extracted from the sound information segment that was most recently output, and the missing information is interpolated and reproduced to output more reliable sound information. can do. The extraction of the sound information to be interpolated requires the pitch estimation of the sound information segment associated with the missing part.

ピッチ推定には、音情報の流れの短期間の自己相関関数を用いることができる。時刻nでサンプリングされた音情報の瞬時値をs[n]とすれば、ラグmにおける短期自己相関関数R(n,m)を式(16)の通りとすることができる。但し、kとkは音情報セグメントの定常期間に関連するパラメータとし、対象セグメント以前の影響の度合いを制御させても良い。
For the pitch estimation, a short-term autocorrelation function of the sound information flow can be used. If the instantaneous value of the sound information sampled at time n is s [n], the short-term autocorrelation function R s (n, m) at the lag m can be expressed by equation (16). However, k l and k g may be parameters related to the stationary period of the sound information segment, and the degree of influence before the target segment may be controlled.

時系列音情報s[n]における任意の短期自己相関関数R(n,m)を用いて、式(17)の通り時刻nにおけるピッチp[n]を推定する。
Using an arbitrary short-term autocorrelation function R s (n, m) in the time-series sound information s [n], the pitch p s [n] at the time n is estimated as in Expression (17).

異常入力検出時点nで推定された出力音情報のピッチp[n]より、デコーダ26の出力音情報系列s[n−p[n]+1]からs[n]までを、異常入力が解消するまで繰り返し再生して音情報と出力させても良い。 The pitch p s [n] of the estimated abnormal input detection time n a output sound information, from the output sound information sequence s of the decoder 26 [n a -p s [n a] +1] to s [n a] The sound information may be output by repeatedly playing until the abnormal input is resolved.

このピッチ推定は常時行っても良いし、異常入力検出時にのみ行っても良い。また、再生音情報の振幅を徐々に低減させフェードアウトするようにしても良い。異常入力解消時点からデコードされた音情報と再生音情報を一定期間クロスフェードによりブレンドさせて出力しても良い。   This pitch estimation may be performed all the time or only when an abnormal input is detected. Also, the amplitude of the reproduced sound information may be gradually reduced to fade out. The sound information decoded from the abnormal input resolution time point and the reproduced sound information may be blended by a cross fade for a certain period and output.

ところで、デコーダ26の適応予測部56においては、予測モデルが閉ループ構造を含む場合、安定領域境界近傍に予測係数が配置更新されるなどで、予測値が音情報の振幅範囲を超える可能性もある。この場合は、予測値を振幅範囲内にクリッピングしても良い。また予測係数をより安定的な領域へ再配置しても良い。   By the way, in the adaptive prediction unit 56 of the decoder 26, when the prediction model includes a closed-loop structure, the prediction value may exceed the amplitude range of the sound information because the prediction coefficient is arranged and updated near the stable region boundary. . In this case, the predicted value may be clipped within the amplitude range. Further, the prediction coefficient may be rearranged in a more stable region.

[対数関数と指数関数の近似解法]
適応正規化部43、53では、予測誤差の正規化に対数関数を、逆正規化に指数関数を用いる場合がある。この場合、これらの両関数の実装は適用する問題の要求を満たしつつ、計算コストや精度の観点で効率的に行われるべきである。以下では、本システムにおける対数関数及び指数関数の近似解法について説明する。そのため、まず、近似解法の基礎的な部分と、従来のG.726での誤差解析、及び本システムが満たすべき条件について説明する。
[Approximate solution of logarithmic and exponential functions]
The adaptive normalization units 43 and 53 may use a logarithmic function for normalizing a prediction error and an exponential function for denormalization. In this case, both of these functions should be implemented efficiently from the viewpoint of calculation cost and accuracy while satisfying the requirements of the problem to be applied. Below, the approximate solution method of the logarithmic function and exponential function in this system is demonstrated. Therefore, first, the basic part of the approximate solution and the conventional G.P. The error analysis at 726 and the conditions that the system should satisfy will be described.

なお、当該近似解法は、適応正規化部43、53で実装されるが、これに限られない。すなわち、本システムの対数関数及び指数関数の近似解法は、対数関数や指数関数を用いるCPUを備えた一般の演算装置に対しても適用可能である。   The approximate solution is implemented by the adaptive normalization units 43 and 53, but is not limited thereto. That is, the approximate solution of the logarithmic function and exponential function of the present system can also be applied to a general arithmetic unit including a CPU that uses a logarithmic function or an exponential function.

(近似解法の基礎)
任意の正数xについて、基数bを用いて表すことを考える。x’を1以上b未満の実数、xを整数とすれば、このxは式(18)の通り一意に表すことができる。
(Basic of approximate solution)
Consider representing an arbitrary positive number x using a radix b. If x ′ m is a real number greater than or equal to 1 and less than b and x e is an integer, this x can be uniquely expressed as in equation (18).

式(18)を用いれば、bを底とするxの対数は式(19)の通り求めることができる。ここで、x=logx’とした。
は0以上1未満の実数であるため、式(19)は、式(18)の定義により、xの対数を整数部と小数部に分けて求めることができる。
Using Equation (18), the logarithm of x with b as the base can be obtained as Equation (19). Here, x m = log b x ′ m .
Since x m is a real number from 0 to less than 1, the formula (19), by definition of formula (18) can be obtained by dividing the logarithm of x to the integer and fractional parts.

一方、y=x+xを指数とする基数bの指数関数bは、yを任意の実数としても、指数関数は対数関数の逆関数であるため、定義よりx’はbのx乗であるから、式(18)の通りxとして求めることができる。また、実用上、対数変換される値は有界と考えても問題ないため、対数の整数部xも有界であると考えてよい。しかし、小数部xは何らかの解法により近似的に求める必要がある。 On the other hand, exponential function of base b to index the y = x e + x m b y also y as any real number, for exponential function is an inverse function of the logarithmic function, x the definition 'm is b of x Since it is the m- th power, it can be obtained as x as in equation (18). Further, practically, because the value to be logarithmically converted no problem even considered bounded, may be considered an integral part x e logarithm is also bounded. However, fractional part x m is required to obtain approximately by some solution.

以降は式(18)、(19)の定義による対数関数と指数関数の近似解法について考えるが、一般的な2値演算を基礎とするCPUによる演算を容易にするため、基数bを2と固定しても問題ない。これは、式(20)、(21)のとおり定数logbに関する係数を乗ずることにより任意の基数へ変換可能であることによる。
In the following, the approximate solution of the logarithmic function and the exponential function defined by the equations (18) and (19) will be considered, but the radix b is fixed to 2 in order to facilitate the calculation by the CPU based on the general binary calculation. There is no problem. This is because it can be converted into an arbitrary radix by multiplying by a coefficient related to the constant log 2 b as shown in equations (20) and (21).

さらに、指数関数は対数関数の逆関数であるため、以降は対数関数の近似解法について説明する。   Furthermore, since the exponential function is an inverse function of the logarithmic function, an approximate solution method of the logarithmic function will be described below.

(G.726の実装と誤差解析)
従来のADPCM方式を用いるITU−T G.726では、予測誤差の絶対値xを対数化するが、その対数の整数部xは、xと2の大小をk=0から比較し、xを超えない最大の2による指数kとして求めている。この手法による演算量はΟ(k)である。小数部xは式(18)のx’を1+xとおき、x=log(1+x)として、演算量を優先的に近似して求めている。この近似による誤差は平均で0.05をも上回ってしまう。
(G.726 implementation and error analysis)
ITU-TG using the conventional ADPCM method. In 726, although logarithmic absolute value x of the prediction error, the integer part x e of the logarithm, and compares the x and 2 k from k = 0, as an index k by maximum 2 k that does not exceed x Seeking. The amount of calculation by this method is Ο (k). Fractional part x m the formula (18) x 'a 1 + x m Distant m, as x m = log 2 (1 + x m), are obtained by preferentially approximating the amount of calculation. The error due to this approximation exceeds 0.05 on average.

(多項式近似)
G.726の実装も近似誤差を低減するべく、x’が[1,2)の区間でlogx’を多項式近似することも考えられる。そこで、このn次多項式を式(22)のfPL(x,n)とする。
(Polynomial approximation)
G. In order to reduce the approximation error in the implementation of 726, it is also conceivable that log 2 x ′ m is polynomial approximated in the interval where x ′ m is [1, 2] . Therefore, this n-th order polynomial is defined as f PL (x, n) in Expression (22).

logxをn次多項式fPL(x,n)で最適近似するには、fPL(x,n)−logxの平均二乗誤差を最小とすれば良い。そのためには、式(23)のn元連立方程式を解けば良い。
In order to optimally approximate log 2 x with an n-order polynomial f PL (x, n), the mean square error of f PL (x, n) −log 2 x may be minimized. For that purpose, the n-ary simultaneous equations of Expression (23) may be solved.

しかし、たとえ2次の多項式によって精度良く近似できたとしても、その逆関数である指数関数の近似式を解析的に求めると、xの平方根を含む関数となってしまい、指数関数を効率的に解くことができない。3次以上ではなおさらである。また、当然にlogxの逆関数である指数関数2を式(23)と同様のアプローチで多項式近似すれば、同程度の精度で近似することはできる。但し、このアプローチによるとそれぞれの近似多項式は相互に逆関数の関係とはならない。 However, even if it can be accurately approximated by a quadratic polynomial, if an approximate expression of an exponential function that is its inverse function is analytically obtained, it becomes a function including the square root of x, and the exponential function is efficiently I can't solve it. This is especially true at the third order and higher. Naturally, if the exponential function 2 x , which is the inverse function of log 2 x, is approximated by a polynomial expression using the same approach as the equation (23), it can be approximated with the same degree of accuracy. However, according to this approach, the approximate polynomials are not inversely related to each other.

(適応正規化部の変換に対する要求)
上記のように対数関数の近似式とその逆関数となる指数関数の近似式が相互に逆関数とならない場合、双方の近似式を用いてある数を対数変換し、さらに指数変換したとしても元の数には復元できず、計算誤差以外の二重の近似誤差を含んでしまう。適応正規化部43、53における予測誤差の量子化誤差がエンコーダ16とデコーダ26の適応予測部46、56に伝播するが、これに加えてこの対数−指数変換における恒等変換誤差をも伝播することになり、予想誤差の増加、ひいてはデコーダ26の復号音情報の品質劣化を招く虞がある。
(Requirements for conversion of the adaptive normalization unit)
If the logarithmic function approximation formula and the exponential function approximation formula, which are inverse functions of the logarithmic function approximation formula, do not become inverse functions of each other, even if the number is logarithmically converted using both approximation formulas, The number cannot be restored, and double approximation errors other than calculation errors are included. The quantization error of the prediction error in the adaptive normalization units 43 and 53 is propagated to the adaptive prediction units 46 and 56 of the encoder 16 and the decoder 26. In addition to this, the identity conversion error in the logarithm-exponential transformation is also propagated. As a result, there is a possibility that the prediction error increases, and consequently the quality of the decoded sound information of the decoder 26 is deteriorated.

また、近似対象とする定義域または値域の全域に亘り近似可能でなければならない。すなわち、G.726のように、0≦x≦1では0≦log(1+x)≒x≦1の全域を近似可能であるような条件をいう。しかし、最適な多項式近似ではたとえ2次の多項式であったとしても、この条件を満足することができず変換領域が制限されてしまい、性能劣化を招く虞がある。 Moreover, it must be possible to approximate over the entire domain of definition or value range. That is, G. As in 726, when 0 ≦ x m ≦ 1, the condition is such that the entire range of 0 ≦ log 2 (1 + x m ) ≈x m ≦ 1 can be approximated. However, even if the polynomial approximation is optimal, even if it is a quadratic polynomial, this condition cannot be satisfied and the conversion area is limited, which may lead to performance degradation.

さらに近似精度については、多項式の次数を上げれば精度も向上するが、乗算を含む演算量も増加してしまい望ましくない。これらの多項式近似による問題を解決するために、両関数の最適な折れ線近似とその最適化法を提案する。   Furthermore, with regard to the approximation accuracy, if the degree of the polynomial is increased, the accuracy is improved, but the amount of calculation including multiplication is increased, which is not desirable. In order to solve the problems caused by these polynomial approximations, we propose an optimal polyline approximation of both functions and its optimization method.

[折れ線近似の基礎]
本システムの近似方法は、近似対象の関数を当該関数上の複数の点を線分で結んだ折れ線により近似する方法である。この折れ線近似で用いられる折れ線関数は、区分的な1次式で表される線分の連結である。そのため、その逆関数もまた1次式で表される線分の連結となり、解析的に容易に逆関数を求めることができる。このため、多項式近似のような恒等変換誤差を含むことはないという利点が得られる。
[Basics of broken line approximation]
The approximation method of this system is a method of approximating a function to be approximated by a broken line obtained by connecting a plurality of points on the function with line segments. The polygonal line function used in this polygonal line approximation is a connection of line segments represented by piecewise linear equations. Therefore, the inverse function is also a line segment represented by a linear expression, and the inverse function can be easily obtained analytically. For this reason, there is an advantage that an identity conversion error such as polynomial approximation is not included.

また、折れ線近似による演算量は、その線分数の対数に比例する回数の比較と、乗算と加算が1回のみであり、線分数を増加させ近似精度を向上させたとしても、算術演算量は一定である優位性を有する。   In addition, the amount of computation by line-line approximation is only a comparison of the number of times proportional to the logarithm of the line segment, multiplication and addition, and even if the number of line segments is increased and the approximation accuracy is improved, the amount of arithmetic operation is Has the advantage of being constant.

端点が(x,y)、(xn+1,yn+1)の線分を有するN線分による折れ線関数fBL(x,N)は式(24)の通り表すことができる。なお、対数関数の近似においてはxn+1=xとなることはない。
以下では、後述の上回らない折れ線近似、下回らない折れ線近似、制約のない折れ線近似の3通りの方法を示すが、何れを用いてもよい。これらの折れ線近似は、例えば、適応正規化部43、53において、式(3)に示すように正規化予測誤差を求める関数に、予測誤差の絶対値の対数関数が含まれる場合に用いることができる。
A polygonal line function f BL (x, N) by an N line segment having end points (x n , y n ) and (x n + 1 , y n + 1 ) can be expressed as in Expression (24). Note that in the approximation of the logarithmic function, x n + 1 = x n does not occur.
In the following, the following three methods are described: a polygonal line approximation that does not exceed, a polygonal line approximation that does not fall below, and an unconstrained polygonal line approximation, but any method may be used. These broken line approximations are used when the logarithmic function of the absolute value of the prediction error is included in the function for obtaining the normalized prediction error in the adaptive normalization units 43 and 53 as shown in Expression (3), for example. it can.

[上回らない折れ線近似]
まず、近似する関数値を上回らない条件が付される、負の誤差のみの場合の折れ線近似について考える。また、線分数は2の累乗とする。このようにしても一般性は失われない。
[Linear approximation not exceeding]
First, let us consider a polygonal line approximation in the case of only a negative error to which a condition not exceeding the function value to be approximated is attached. The number of line segments is a power of 2. Even in this way, generality is not lost.

はじめに、線分数2での近似を求める。定義域と値域の条件により端点(x (1),y (1))=(1,0)、(x (1),y (1))=(2,1)は決まっているため、(x (1),y (1))を求める問題となる。ここで、線分数2とした場合の端点nの位置を(x (m),y (m))と表す。 First , an approximation with the line number 21 is obtained. The end points (x 0 (1) , y 0 (1) ) = (1, 0), (x 2 (1) , y 2 (1) ) = (2, 1) are determined by the conditions of the domain and range Therefore, (x 1 (1) , y 1 (1) ) is a problem to be obtained. Here, the position of the end point n when the number of line segments is 2 m is represented as (x n (m) , y n (m) ).

近似誤差最小とするためには、折れ線関数が有するすべての端点を、近似する対数関数上に配置されなければならない。そうするとy (1)はy (1)=log (1)で表せるから、結果的に近似誤差最小となるx (1)を求める問題に帰着する。 In order to minimize the approximation error, all end points of the polygonal line function must be placed on the logarithmic function to be approximated. Then, y 1 (1) can be expressed as y 1 (1) = log 2 x 1 (1) , resulting in a problem of finding x 1 (1) that minimizes the approximation error.

(1)を求めるために、ここで、図4に示すように、誤差曲線logx−(x−1)を考える。ただし、1≦x≦2である。この誤差曲線は線分数2での折れ線近似、すなわちG.726と同様の近似における誤差を表す。ここから線分数2とした場合の近似誤差は図3の網掛け領域となる。この領域を最小とするためには三角形(x (1),y (1))、(x (1),y (1))、(x (1),y (1))の面積を最大化すれば良いことがわかる。 To obtain x 1 (1 ), consider an error curve log 2 x− (x−1) as shown in FIG. However, 1 ≦ x ≦ 2. The error curve is polygonal line approximation in the line number 2 0, i.e. G. An error in approximation similar to 726 is represented. Approximation error in the case of the line segment number 2 1 here is the shaded region in FIG. In order to minimize this region, triangles (x 0 (1) , y 0 (1) ), (x 1 (1) , y 1 (1) ), (x 2 (1) , y 2 (1) It can be seen that the area of) should be maximized.

すなわち、(x (1),y (1))がこの誤差曲線の極大点に配置されればよい。これは式(25)を満足するx (1)を求めることになる。この場合x (0)<x (1)<x (0)の範囲で求める。
式(25)では線分数2のときの任意の端点(x (m),y (m))を、線分数2m+1へと更新したときの端点(x2n (m+1),y2n (m+1))と対応付け、同一としている。
That is, (x 1 (1) , y 1 (1) ) may be arranged at the maximum point of this error curve. This is to obtain x 1 (1) that satisfies Expression (25). In this case, it is determined in the range of x 0 (0) <x 1 (1) <x 1 (0) .
Any endpoints of formula (25) in case of the line segment number 2 m (x n (m) , y n (m)) , and end point when the update to the segment number 2 m + 1 (x 2n ( m + 1), y 2n (M + 1) ) and the same.

このようにして求められた線分数2における近似最適化された端点群を、線分数2の折れ線関数へ継承する。同様に、継承により対応付けられていない端点群を、式(25)を用いて近似最適化する。同様にして線分2において近似最適化された端点群を、線分数2m+1の折れ線関数へ継承しさらに近似最適化していくことで、所望の近似精度をもつ負の誤差のみの折れ線関数を求めることができる。 In this way an approximation optimized endpoint group in line number 2 1 obtained, to inherit the polygonal line function of segment number 2 2. Similarly, approximate optimization is performed on the endpoints that are not associated by inheritance using Expression (25). Similarly, the end point group approximated and optimized in the line segment 2 m is inherited to the polygonal line function having the line number 2 m + 1 and further approximated to optimize the line function with only the negative error having the desired approximation accuracy. Can be sought.

[下回らない折れ線近似]
次に、近似する関数値を下回らない条件が付される、正の誤差のみの場合の折れ線近似について考える。
[Linear approximation not lower]
Next, let us consider a polygonal line approximation in the case of only a positive error to which a condition not lower than the function value to be approximated is attached.

はじめに、線分数2での近似を求める。端点(x (1),y (1))、(x (1),y (1))は上回らない折れ線近似と同様であるが、近似する関数を下回らない条件により、各線分は定義域内で接点を有する近似対象関数の接線となることが近似誤差を最小とする条件の一つである。 First , an approximation with the line number 21 is obtained. The end points (x 0 (1) , y 0 (1) ), (x 2 (1) , y 2 (1) ) are similar to the polygonal line approximation that does not exceed, but each line segment is subject to the condition that it does not fall below the function to be approximated. One of the conditions for minimizing the approximation error is to be the tangent of the approximation target function having a contact in the domain.

端点(x (1),y (1))、(x (1),y (1))は、近似対象関数上にあるため接点であり、両端点を有する2線分はそれを通る接線としてそれぞれ確定している。そのため(x (1),y (1))には自由度がなく、両線分の交点として一意に求めることができる。 The end points (x 0 (1) , y 0 (1) ), (x 2 (1) , y 2 (1) ) are contact points because they are on the approximation target function, and the two line segments having both end points are Each tangent passing through is fixed. Therefore, (x 1 (1) , y 1 (1) ) has no degree of freedom and can be uniquely obtained as the intersection of both line segments.

このように下回らない折れ線近似では、図5に示す線分数2の折れ線関数が近似の基本状態であるため、上回らない折れ線近似とは端点の表現を変更し、線分数は2+1で定まるものとする。この場合の端点nの位置を(x (m),y (m))と表す。0≦mは同様である。よって、端点(x (1),y (1))は、線分数2+1における端点(x (0),y (0))と表現し直す。残る2端点(x (1),y (1))、(x (1),y (1))についても同様に、(x (0),y (0))、(x (0),y (0))とする。 The polygonal line approximation which is not less than this, because the polygonal line function of segment number 2 1 shown in FIG. 5 is a basic state of the approximation, the polygonal line approximation is not exceeded to change the representation of the end points, the number of line segments is determined by 2 m +1 Shall. The position of the end point n in this case is represented as (x n (m) , y n (m) ). 0 ≦ m is the same. Therefore, the end point (x 0 (1) , y 0 (1) ) is re-expressed as the end point (x 0 (0) , y 0 (0) ) in the line number 2 0 +1. Similarly for the remaining two end points (x 1 (1) , y 1 (1) ), (x 2 (1) , y 2 (1) ), (x 1 (0) , y 1 (0) ), ( x 2 (0) , y 2 (0) ).

続いて、線分数2+1での近似を求める。これは基本状態の線分数2+1から増加した1線分の、近似誤差最小となる両端点を求める問題となる。ここで、線分数2+1における、端点(x (m),y (m))と(xn+1 (m),yn+1 (m))を有する線分S (m)は式(26)の通り表すことができる。
Subsequently, an approximation with a line number 2 1 +1 is obtained. This is a problem of finding both end points that minimize the approximation error for one line segment increased from the number of line segments 2 0 +1 in the basic state. Here, the line number 2 m +1, end point (x n (m), y n (m)) and (x n + 1 (m) , y n + 1 (m)) segment S n (m) having the formula ( 26).

また、近似対象関数の接線Tは、その接点を(x、y=log(x))とすれば式(27)の通り表すことができる。
さらに、線分S (m)に属する接点を(u (m),v (m))と表すものとする。
Further, the tangent line T of the approximation target function can be expressed as in Expression (27) if the point of contact is (x T , y T = log 2 (x T )).
Further, a contact belonging to the line segment S n (m ) is represented as (u n (m) , v n (m) ).

上記表記によれば、既に定まっている最左端点(x (1),y (1))と最右端点(x (1),y (1))は、(u (1),v (1))、(u (1),v (1))でもある。一方、(x (1),y (1))、(x (1),y (1))更には(u (1),v (1))は未定である。 According to the above notation, the leftmost end point (x 0 (1) , y 0 (1) ) and the rightmost end point (x 3 (1) , y 3 (1) ) that have already been determined are (u 0 (1 ) , V 0 (1) ), (u 2 (1) , v 2 (1) ). On the other hand, (x 1 (1) , y 1 (1) ), (x 2 (1) , y 2 (1) ) and (u 1 (1) , v 1 (1) ) are undecided.

この(x (1),y (1))は接線T(x,u (1))とT(x,u (1))の交点であり、(x (1),y (1))は接線T(x,u (1))とT(x,u (1))の交点であることに注目すれば、T(x,u (1))とT(x,u (1))はすでに確定しているため(u (1),v (1))を定めれば(x (1),y (1))と(x (1),y (1))も定まることがわかる。 This (x 1 (1) , y 1 (1) ) is the intersection of tangents T (x, u 0 (1) ) and T (x, u 1 (1) ), and (x 2 (1) , y 2 (1) ) is the intersection of tangents T (x, u 1 (1) ) and T (x, u 2 (1) ), T (x, u 0 (1) ) and T Since (x, u 2 (1) ) has already been determined, if (u 1 (1) , v 1 (1) ) is defined, (x 1 (1) , y 1 (1) ) and (x 2 It can be seen that (1) , y 2 (1) ) are also determined.

この点、接点(u (1),v (1))は、自身が乗る線分S (1)と隣接する線分S (1)、S (1)による近似誤差が最小となるように求めればよい。それには式(28)の区分誤差評価関数E()を用いることができる。この関数は接線T(x,x)による区間[a,b]での近似誤差の二乗平均を求める。
In this regard, the contact point (u 1 (1) , v 1 (1) ) has the smallest approximate error due to the line segment S 1 (1) on which it is placed and the adjacent line segments S 0 (1) , S 2 (1). What is necessary is just to ask. For this purpose, the section error evaluation function E S () of the equation (28) can be used. This function obtains the mean square of the approximation error in the interval [a, b] by the tangent line T (x, x T ).

一方、近似誤差の最小化には、接点(u (1),v (1))で定まる(x (1),y (1))、(x (1),y (1))とともに式(28)を用いて式(29)をE(1,1)として最小化することもできる。この場合、E(1,1)=E(u (1),1,x (1))+E(u (1),x (1),x (1))+E(u (1),x (1),2)となる。
On the other hand, in order to minimize the approximation error, (x 1 (1) , y 1 (1) ), (x 2 (1) , y 2 ( ) determined by the contacts (u 1 (1) , v 1 (1) ) ) . It is also possible to minimize Eq. (29) as E (1, 1) using Eq. (28) together with 1) ). In this case, E (1,1) = E S (u 0 (1), 1, x 1 (1)) + E S (u 1 (1), x 1 (1), x 2 (1)) + E S (U 2 (1) , x 2 (1) , 2).

式(29)のE(m,n)はu (m)の関数である。このため、その最小化には式(30)の通り、導関数を0とするu (m)を解析的に求めてもよいし、非線形最適化問題を解いてE(m,n)が最小となるu (m)を求めてもよい。前者の場合、解析的であるから誤差なく最小化することができる。
E (m, n) in equation (29) is a function of u n (m) . Therefore, for minimization, u n (m) with a derivative of 0 may be obtained analytically as shown in equation (30), or E (m, n) is obtained by solving a nonlinear optimization problem. The minimum u n (m) may be obtained. In the former case, since it is analytical, it can be minimized without error.

上記のような方法により、近似誤差を最小とする接点(u (1),v (1))を求める。求めた接点、端点は、線分数2+1での折れ線近似を最適化する際に継承して利用する。その際、接点(u (m),v (m))を(u2n (m+1),v2n (m+1))と対応付け、同一点とする。 The contact (u 1 (1) , v 1 (1) ) that minimizes the approximation error is obtained by the method described above. The obtained contact points and end points are inherited and used when optimizing the broken line approximation with the line number 2 2 +1. At that time, the contact points (u n (m) , v n (m) ) are associated with (u 2n (m + 1) , v 2n (m + 1) ) to be the same point.

線分数2+1では近似誤差最小化のために、接線T(x,u (2))とT(x,u (2))から最適な接点(u (2),v (2))を求め、接線T(x,u (2))とT(x,u (2))から最適な接点(u (2),v (2))を求める。このように順次隣接する接線T(x,unー1 (m)),T(x,un+1 (m))から関与する近似誤差を最小とする接点(u (m),v (m))を求めていく。 In the line number 2 2 +1, the optimum contact (u 1 (2) , v 1 ( from the tangents T (x, u 0 (2) ) and T (x, u 2 (2) ) is used to minimize the approximation error. 2) ), and the optimum contact (u 3 (2) , v 3 ( 2) ) is obtained from the tangents T (x, u 2 (2) ) and T (x, u 4 (2) ). Tangent T in this manner sequentially adjacent (x, u n over 1 (m)), T ( x, u n + 1 (m)) contacts which minimizes the approximation error involved from (u n (m), v n ( m) )

同様に線分2+1において、近似最適化され確定した接点群を、線分数2m+1+1の折れ線関数へ継承し、さらに近似最適化していくことで、所望の近似精度をもつ正の誤差のみの折れ線関数を求めることができる。 Similarly, in the line segment 2 m +1, the contact group determined by the approximation optimization is inherited to the line function of the line segment number 2 m + 1 +1, and further approximate optimization is performed so that only a positive error having a desired approximation accuracy can be obtained. Can be obtained.

[制約のない折れ線近似]
上回らない折れ線近似のごとき端点に関する制約や、下回らない折れ線近似のごとき線分に関する制約がない折れ線近似について考える。すなわち、(1,0)、(2,1)以外の端点については、同じx座標値において近似対象関数上の点を上回る端点、及び同じx座標値において近似対象関数上の点を下回る端点を含む。つまり、制約がない折れ線近似関数は、近似対象関数を交差する線分を含んでなる折れ線近似関数であり、近似対象関数を上回る線分、下回る線分、近似対象関数と接する線分、及び少なくとも一方の端点が近似対象関数上に乗る線分、の少なくともいずれかを含んでいても良い。これまでの折れ線近似のように順次折れ線数を増やして直前の最適化情報を継承しつつ近似誤差を改善する必要がないため、端点を(x,y)と表現する。また、端点(x,y)と(xn+1,yn+1)を持つ線分Sも式(31)の通り表せる。
[Linear approximation without constraints]
Consider a polygonal line approximation that has no constraints on end points, such as a polyline approximation that does not exceed, and no restrictions on line segments, such as a polyline approximation that does not fall below. That is, for the end points other than (1, 0) and (2, 1), the end points that exceed the points on the approximation target function at the same x coordinate value and the end points that fall below the points on the approximation target function at the same x coordinate value. Including. In other words, the unrestricted broken line approximation function is a broken line approximation function including a line segment that intersects the approximation target function, a line segment that exceeds the approximation target function, a line segment that falls below, a line segment that touches the approximation target function, and at least One end point may include at least one of the line segments on the approximation target function. Since there is no need to improve the approximation error while increasing the number of broken lines sequentially and inheriting the immediately preceding optimization information as in the conventional broken line approximation, the end point is expressed as (x n , y n ). Also, the line segment S n with the end points (x n, y n) and a (x n + 1, y n + 1) expressed as equation (31).

このSによる区分誤差評価関数Eも式(32)を用いる。
Classification error evaluation function E S according to the S n also using equation (32).

線分数Nの場合の総合的な誤差評価関数EはEを用いて式(33)と表すことができる。
Overall error evaluation function E if the number of segments N can be expressed as Equation (33) using E S.

式(33)のすべての端点による偏導関数を0とする連立方程式を解析的に解ける場合は、それにより求まった端点群が近似誤差最小の最適近似を構成する。この連立方程式が解析的に解けない場合は、非線形最適化法などにより式(33)を最小化させればよいが、その際は端点数を上回らない折れ線近似や下回らない折れ線近似と同数とし、それぞれの近似での最適解である端点群を初期状態とすれば、良好な最適解が得られる。   When the simultaneous equations having the partial derivatives of all the end points of Equation (33) as 0 can be solved analytically, the end point groups obtained thereby constitute the optimum approximation with the minimum approximation error. If this simultaneous equation cannot be solved analytically, the equation (33) may be minimized by a nonlinear optimization method or the like. If the end point group which is the optimal solution in each approximation is set as an initial state, a favorable optimal solution can be obtained.

(比較)
これら3種の折れ線近似の、線分数又は節点数に対する近似誤差の二乗平均値を両対数軸にプロットしたグラフを図6に示す。下回らない折れ線近似のみ横軸を節点数としている。従来のG.726の平均二乗誤差が0.004程度であるのに対し、図6に示すように、本近似方法はいずれも一桁以上良好な近似結果が得られる。なお、対数化の際の整数部は、二分探索によればO(logk)の演算量であるから、従来のG.726の演算量O(k)よりも少ないので、従来よりも高速に求めることができる。
(Comparison)
FIG. 6 shows a graph in which the mean square values of approximation errors with respect to the number of line segments or the number of nodes of these three types of broken line approximation are plotted on the logarithmic axis. The horizontal axis is the number of nodes only for the polygonal line approximation that does not fall below. Conventional G.M. While the mean square error of 726 is about 0.004, as shown in FIG. 6, this approximation method can obtain an approximation result that is better by one digit or more. Note that the integer part at the time of logarithm is the amount of computation of O (log 2 k) according to the binary search. Since the calculation amount O (k) is less than 726, it can be obtained at a higher speed than the conventional method.

[1−4.動作]
図7及び図8を参照し、本システムの動作について説明する。図7は、符号化装置10の動作フローチャートである。図8は、復号化装置20の動作フローチャートである。なお、これらは動作の一例であり、これらの順序に限定されない。
[1-4. Operation]
The operation of this system will be described with reference to FIGS. FIG. 7 is an operation flowchart of the encoding apparatus 10. FIG. 8 is an operation flowchart of the decoding device 20. Note that these are examples of operations and are not limited to the order.

本システムの運用の前提条件として、パラメータは所望のシステム特性を満足するように設計されているものとするが、パラメータとシステム特性との対応関係を運用時に測定又は調整する場合は、その測定又は調整したパラメータを用いる。   As a prerequisite for the operation of this system, the parameters are designed to satisfy the desired system characteristics, but when measuring or adjusting the correspondence between parameters and system characteristics during operation, Use the adjusted parameters.

[初期化]
図7及び図8に示すように、まず、運用開始時の初期設定として、符号化装置10と復号化装置20ともに各部のパラメータを設定する(ステップS01)。すなわち、各装置10、20の記憶部14、24に予め記憶されているパラメータか、ユーザインターフェイスUI11、21若しくは外部接続I/F12、22経由で入力されるパラメータを各装置10、20の各部に設定する。
[Initialize]
As shown in FIGS. 7 and 8, first, as initial settings at the start of operation, the parameters of each unit are set for both the encoding device 10 and the decoding device 20 (step S01). That is, parameters stored in advance in the storage units 14 and 24 of the devices 10 and 20 or parameters input via the user interface UIs 11 and 21 or the external connection I / Fs 12 and 22 are input to the units of the devices 10 and 20. Set.

なお、制御部13、23は、パラメータ識別値を用いて設定されたパラメータの適用可否を判定し、適用不可の場合は、表示器に表示する等ユーザインターフェイスUI11、21若しくは外部接続I/F12、22経由で外部へ通知するとともに、本運用を保留しても良い。   The control units 13 and 23 determine whether or not the parameter set using the parameter identification value is applicable. If the parameter is not applicable, the user interface UI11 or 21 or the external connection I / F 12 is displayed on the display. The notification may be notified to the outside via 22 and this operation may be suspended.

次に、各装置10、20は、状態変数などの内部状態をリセットして初期状態とする(ステップS02)。運用開始前の不定な状態変数により意図しない音が出力されるのを防止するためである。   Next, each device 10 and 20 resets an internal state such as a state variable to an initial state (step S02). This is to prevent an unintended sound from being output due to an undefined state variable before the start of operation.

[情報入力及び出力]
符号化装置10は、設定されたパラメータに従って音又は音情報を音入力I/F15等により外部から入力するか、記憶部14に記憶している音情報をエンコーダ16に入力する(ステップS03)。エンコーダ16は設定されたパラメータに従って音符号へ符号化し(ステップS04)、設定されたパラメータに従って同期信号などエンコードされた音符号及びその再生に必要な情報や、記憶部14に蓄積された音符号を復号化装置20へ出力する(ステップS05)。エンコードされた音符号に再生に必要な情報には、パラメータ識別値を含む。
[Information input and output]
The encoding device 10 inputs sound or sound information from the outside through the sound input I / F 15 or the like according to the set parameters, or inputs sound information stored in the storage unit 14 to the encoder 16 (step S03). The encoder 16 encodes the sound code according to the set parameter (step S04), and encodes the sound code encoded according to the set parameter, such as a synchronization signal, information necessary for reproduction thereof, and the sound code stored in the storage unit 14. The data is output to the decryption device 20 (step S05). Information necessary for reproduction of the encoded sound code includes a parameter identification value.

復号化装置20には、設定されたパラメータに従って伝送媒体30から入力された音符号及びその再生に必要な情報が入力される(ステップS06)。ここで、エンコーダ16とデコーダ26に共通するパラメータは同一でなければならない。特に、本システムでは、パラメータ可変であるため、音符号のデコードに先立って、パラメータの整合性を確認する。   The decoding apparatus 20 receives the sound code input from the transmission medium 30 according to the set parameters and information necessary for reproduction thereof (step S06). Here, the parameters common to the encoder 16 and the decoder 26 must be the same. In particular, in this system, since the parameters are variable, the consistency of the parameters is confirmed prior to the decoding of the sound code.

すなわち、復号化装置20の制御部23は、入力情報に含まれるパラメータ識別値と復号化装置20に現在設定されているパラメータ識別値を照合する(ステップS07)。整合する場合は(ステップS07のYES)、入力された音符号のデコードを許可し、設定されたパラメータに従ってデコードして音情報に復号する(ステップS08)。さらに、復号された音情報を音出力I/F27を介して復号化装置20外部へ出力する(ステップS09)。   That is, the control unit 23 of the decoding device 20 collates the parameter identification value included in the input information with the parameter identification value currently set in the decoding device 20 (step S07). If they match (YES in step S07), decoding of the input sound code is permitted, decoding is performed according to the set parameters, and decoded into sound information (step S08). Further, the decoded sound information is output to the outside of the decoding device 20 via the sound output I / F 27 (step S09).

一方、パラメータ識別値が整合しない場合は(ステップS07のNO)、不整合処理を行う(ステップS10)。すなわち、ユーザインターフェイスUI21や外部接続I/F22を介して不整合を外部に通知するとともに、デコードを許可しない。また、符号化装置10から入力されたパラメータ識別値と対応するパラメータを記憶部24や各部の動作制御I/Fに有していれば、そのパラメータに切り換えて整合させる。なお、デコーダ26のパラメータにエンコーダ16のパラメータを合わせるようにしても良い。   On the other hand, if the parameter identification values do not match (NO in step S07), inconsistency processing is performed (step S10). That is, inconsistency is notified to the outside via the user interface UI 21 and the external connection I / F 22 and decoding is not permitted. If the parameter corresponding to the parameter identification value input from the encoding device 10 is included in the storage unit 24 or the operation control I / F of each unit, the parameter is switched to that parameter for matching. Note that the parameters of the encoder 16 may be matched with the parameters of the decoder 26.

ステップS05又はステップS09の後、制御部13、23が、ユーザや外部接続装置からのリセット要求、及び、エンコーダ16又はデコーダ26において異常を検出した部位からのリセット要求を確認する(ステップS11)。リセット要求がある場合は(ステップS11のYES)、ステップS02に戻る。一方、リセット要求がない場合は(ステップS11のNO)、ステップS12に進む。ユーザ等により、本システムの運用中にユーザインターフェイスUI11、12若しくは外部接続I/F12、22経由でパラメータ設定変更の要求がある場合(ステップS12のYES)、ステップS01に戻り要求されたパラメータを更新する。この場合、必要に応じて更新前に装置10、20を一時停止の上リセットし、更新後に再始動しても良い。パラメータ設定変更の要求がない場合(ステップS12のNO)、音入力のステップS03、符号入力のステップS06に戻るか(ステップS13のNO)、終了する(ステップS13のYES)。   After step S05 or step S09, the control units 13 and 23 confirm the reset request from the user or the external connection device and the reset request from the part where the abnormality is detected in the encoder 16 or the decoder 26 (step S11). If there is a reset request (YES in step S11), the process returns to step S02. On the other hand, if there is no reset request (NO in step S11), the process proceeds to step S12. If there is a request for parameter setting change via the user interface UI11, 12 or the external connection I / F 12, 22 by the user or the like during operation of this system (YES in step S12), the process returns to step S01 and the requested parameter is updated. To do. In this case, if necessary, the devices 10 and 20 may be temporarily stopped and reset before the update, and restarted after the update. If there is no request for parameter setting change (NO in step S12), the process returns to step S03 for sound input, step S06 for code input (NO in step S13), or ends (YES in step S13).

なお、ステップS01、S02、S11、S12は、符号化装置10と復号化装置20とで同時並行して行っても良いし、それぞれ独立に行っても良く、その前後も任意である。また、何れか一方だけ行うようにしても良い。   Note that steps S01, S02, S11, and S12 may be performed in parallel by the encoding device 10 and the decoding device 20, or may be performed independently of each other, and before and after that are arbitrary. Further, only one of them may be performed.

[1−5.効果]
(1)本実施形態の音符号化システムでは、対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部となる適応正規化部43、53を有し、適応正規化部43、53は、近似対象となる関数を、当該関数上の複数の点を線分で結んだ近似対象となる関数値を上回らない折れ線関数により近似するようにした。特に、適応正規化部43、53は、近似対象となる関数から、当該関数上の複数の点を線分で結んで得られる折れ線関数を引いたものの近似誤差が最小となる複数の点を求め、この複数の点を折れ線関数の各線分の端点として上回らない折れ線関数を求めるようにした。
[1-5. effect]
(1) The sound encoding system according to the present embodiment includes adaptive normalization units 43 and 53 serving as calculation units for calculating a function approximate to a function including a logarithmic function as an approximation target. Nos. 43 and 53 approximate the function to be approximated by a line function that does not exceed the function value to be approximated by connecting a plurality of points on the function with line segments. In particular, the adaptive normalization units 43 and 53 obtain a plurality of points that minimize the approximation error of a function to be approximated by subtracting a polygonal line function obtained by connecting a plurality of points on the function with line segments. Then, a line function that does not exceed these multiple points as the end points of each line segment of the line function is obtained.

これにより、ITU−T G.726に代表される従来のADPCM方式を用いたものよりも、近似精度を向上させることができる。例えば、平均二乗誤差は、ITU−T G.726よりも一桁以上良好な近似結果を得ることができる。従って、音の質を向上させることができ、音の再現性を向上させることができる。   As a result, ITU-T G.I. Approximation accuracy can be improved as compared with the conventional ADPCM method represented by 726. For example, the mean square error is ITU-T GG. An approximation result that is one digit or more better than 726 can be obtained. Therefore, sound quality can be improved and sound reproducibility can be improved.

(2)適応正規化部43、53は、近似対象となる関数を、当該関数上の複数の点を線分で結んだ近似対象となる関数値を下回らない折れ線関数により近似するようにした。特に、下回らない折れ線関数は、各線分が、その定義域内で複数の点として近似対象となる関数との接点を有する接線であり、適応正規化部43、53は、接点を、その接点が乗る線分とこれに隣接する両線分による近似対象となる関数との近似誤差が最小となるように求めるようにした。 (2) The adaptive normalization units 43 and 53 approximate the function to be approximated by a polyline function that does not fall below the function value to be approximated by connecting a plurality of points on the function with line segments. In particular, a polygonal line function that does not fall is a tangent line in which each line segment has a contact point with a function to be approximated as a plurality of points within the domain of definition, and the adaptive normalization units 43 and 53 ride on the contact point. The approximation error between the line segment and the function to be approximated by both adjacent line segments is determined to be minimum.

これにより、ITU−T G.726に代表される従来のADPCM方式を用いたものよりも、近似精度を向上させることができる。例えば、平均二乗誤差は、ITU−T G.726よりも一桁以上良好な近似結果を得ることができる。さらに、下回らない折れ線近似よりも近似精度を向上させることができる。従って、音の質をより向上させることができ、音の再現性を更に向上させることができる。   As a result, ITU-T G.I. Approximation accuracy can be improved as compared with the conventional ADPCM method represented by 726. For example, the mean square error is ITU-T GG. An approximation result that is one digit or more better than 726 can be obtained. Furthermore, the approximation accuracy can be improved as compared with the broken line approximation that does not fall below. Therefore, sound quality can be further improved, and sound reproducibility can be further improved.

(3)適応正規化部43、53は、近似対象となる関数を、当該関数と交差する線分を含んでなる折れ線関数により近似し、折れ線関数は、端点(x,y)と(xn+1,yn+1)を持つ線分Sを式(31)で表し、この線分Sによる区分誤差評価関数Eを式(32)で表した場合に、式(33)の誤差評価関数Eを最小化したときに得られるものとした。これにより、ITU−T G.726に代表される従来のADPCM方式を用いたものよりも、近似精度を向上させることができるだけでなく、上記の上回らない折れ線近似や下回らない折れ線近似よりも更に近似精度を向上させることができる。 (3) The adaptive normalization units 43 and 53 approximate the function to be approximated by a polygonal line function including a line segment intersecting with the function, and the polygonal line function is expressed by the end points (x n , y n ) and ( when representing the x n + 1, y n + 1) line S n with expressed by equation (31), the division error evaluation function E S according to the line segment S n in formula (32), the error evaluation of the expression (33) It was obtained when function E was minimized. As a result, ITU-T G. The approximation accuracy can be improved as compared with the conventional ADPCM method represented by 726, and the approximation accuracy can be further improved than the above-described broken line approximation and the broken line approximation not below.

[2.他の実施形態]
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。以下は、その一例である。
[2. Other Embodiments]
The present invention is not limited to the above-described embodiments as they are, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. The following is an example.

(1)第1の実施形態の音符号化システムでは、パラメータの設定は、ユーザの要求に基づくものとして説明したが、これに限られない。符号化装置10、復号化装置20で用いられる各パラメータは、音や音情報、音符号などの各装置10、20への入力を契機として、自動的に変更するように構成しても良い。例えば、符号化装置10の音入力I/F15への入力が、男性の音声から楽器の音に切り替わった場合、予測誤差の確率分布が変わってくるため、音の信号レベル、周波数特性等の変化を検知して、エンコーダ16及びデコーダ26の動作制御I/Fのパラメータを、当該楽器の音に適したパラメータに変更するようにしても良い。入力の変化を判定する方法としては、例えば、エンコーダ16及びデコーダ26各部の動作制御I/Fに入力変化を判別する閾値や範囲を設定する。 (1) In the sound encoding system according to the first embodiment, the parameter setting has been described based on the user's request, but the present invention is not limited to this. The parameters used in the encoding device 10 and the decoding device 20 may be configured to be automatically changed when triggered by input to the devices 10 and 20 such as sound, sound information, and sound code. For example, when the input to the sound input I / F 15 of the encoding device 10 is switched from a male voice to a musical instrument sound, the probability distribution of the prediction error changes, so that the sound signal level, frequency characteristics, etc. change. And the parameters of the operation control I / F of the encoder 16 and the decoder 26 may be changed to parameters suitable for the sound of the instrument. As a method for determining an input change, for example, a threshold or a range for determining an input change is set in the operation control I / F of each part of the encoder 16 and the decoder 26.

(2)第1の実施形態の音符号化システムでは、エンコーダ16とデコーダ26とが別体として構成したが、これらを一体として構成したシステムとして構成しても良い。また、適応予測部56が復号した音情報を出力するエンコーダが実装された単一装置としてシステムを構成しても良い。この場合、設定パラメータとシステム特性との対応関係を求める場合に有用である。 (2) In the sound encoding system of the first embodiment, the encoder 16 and the decoder 26 are configured as separate bodies, but may be configured as a system in which these are integrated. Further, the system may be configured as a single device on which an encoder that outputs sound information decoded by the adaptive prediction unit 56 is mounted. In this case, it is useful for obtaining the correspondence between the setting parameter and the system characteristic.

(3)第1の実施形態に係る音符号化システムでは、エンコーダ16及びデコーダ26の処理部に設けられた動作制御I/Fによって、当該処理部に入力された音情報又は音符号に応じてパラメータ更新のための制御信号を制御部13、23に出力し、制御部13、23によってパラメータを更新させたが、これに限られず、逆の関係であっても良い。すなわち、動作制御I/Fにより、当該動作制御I/Fが設けられた所定の内部状態の検知及び制御部13、23への通知を行い、制御部13、23が通知された各処理部の内部状態に応じてパラメータを更新させる制御信号を各処理部へ出力し、動作制御I/Fがその制御信号に基づいて処理部で用いるパラメータを更新するようにしても良い。 (3) In the sound encoding system according to the first embodiment, the operation control I / F provided in the processing units of the encoder 16 and the decoder 26 is used according to the sound information or the sound code input to the processing unit. Although a control signal for parameter update is output to the control units 13 and 23 and the parameters are updated by the control units 13 and 23, the present invention is not limited to this, and the reverse relationship may be used. That is, the operation control I / F detects a predetermined internal state in which the operation control I / F is provided and notifies the control units 13 and 23, and the control units 13 and 23 are notified of each processing unit. A control signal for updating the parameter according to the internal state may be output to each processing unit, and the operation control I / F may update the parameter used in the processing unit based on the control signal.

10 符号化装置
11 ユーザインターフェイスUI
12 外部接続I/F
13 制御部
14 記憶部
15 音入力I/F
16 エンコーダ
17 符号出力I/F
20 復号化装置
21 ユーザインターフェイスUI
22 外部接続I/F
23 制御部
24 記憶部
25 符号入力I/F
26 デコーダ
27 音出力I/F
30 伝送媒体
41、51 前処理部
42 加算器
43、53 適応正規化部
44 最適量子化部
45、55 最適逆量子化部
46、56 適応予測部
47、57 加算器
48、58 後処理部
41p、43p〜46p、48p 動作制御I/F
51p、53p、55p、56p、58p 動作制御I/F
431 利得項算出部
431a 遅延素子
431b 加算器
4310〜431n 係数制御条件部
432 利得項選択条件部
432a 遅延素子
433 切替部
434 減衰項算出部
434a 遅延素子
434b 加算器
10 Encoder 11 User interface UI
12 External connection I / F
13 Control unit 14 Storage unit 15 Sound input I / F
16 Encoder 17 Code output I / F
20 Decoding Device 21 User Interface UI
22 External connection I / F
23 Control unit 24 Storage unit 25 Code input I / F
26 Decoder 27 Sound output I / F
30 Transmission medium 41, 51 Preprocessing unit 42 Adder 43, 53 Adaptive normalization unit 44 Optimal quantization unit 45, 55 Optimal inverse quantization unit 46, 56 Adaptive prediction unit 47, 57 Adder 48, 58 Post processing unit 41p 43p-46p, 48p Operation control I / F
51p, 53p, 55p, 56p, 58p Operation control I / F
431 Gain term calculation unit 431a Delay element 431b Adder 4310 to 431n Coefficient control condition unit 432 Gain term selection condition unit 432a Delay element 433 Switching unit 434 Attenuation term calculation unit 434a Delay element 434b Adder

Claims (7)

対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部を備えた演算装置であって、
前記演算部は、近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を上回らない折れ線関数により近似すること、
を特徴とする演算装置。
An arithmetic unit including a calculation unit that calculates a function that approximates a function including a logarithmic function as an approximation target,
The calculation unit approximates the function to be approximated by a line function that does not exceed the function value to be approximated by connecting a plurality of points on the function with line segments,
An arithmetic unit characterized by the above.
前記演算部は、前記近似対象となる関数から、当該関数上の複数の点を線分で結んで得られる折れ線関数を引いたものの近似誤差が最小となる前記複数の点を求め、この複数の点を折れ線関数の各線分の端点として前記上回らない折れ線関数を求めること、
を特徴する請求項1に記載の演算装置。
The calculation unit obtains the plurality of points where the approximation error is minimized by subtracting a polygonal line function obtained by connecting a plurality of points on the function with line segments from the function to be approximated. Obtaining a line function that does not exceed the point with the point as the end point of each line segment of the line function,
The arithmetic unit according to claim 1, wherein:
対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部を備えた演算装置であって、
前記演算部は、近似対象となる関数を、当該関数上の複数の点を線分で結んだ前記近似対象となる関数値を下回らない折れ線関数により近似すること、
を特徴とする演算装置。
An arithmetic unit including a calculation unit that calculates a function that approximates a function including a logarithmic function as an approximation target,
The calculation unit approximates the function to be approximated by a line function that is not lower than the function value to be approximated by connecting a plurality of points on the function with line segments,
An arithmetic unit characterized by the above.
前記下回らない折れ線関数は、各線分が、その定義域内で前記複数の点として前記近似対象となる関数との接点を有する接線であり、
前記演算部は、前記接点を、その接点が乗る線分とこれに隣接する両線分による前記近似対象となる関数との近似誤差が最小となるように求めること、
を特徴とする請求項3に記載の演算装置。
The non-lower polygonal line function is a tangent line in which each line segment has a point of contact with the function to be approximated as the plurality of points within the domain,
The computing unit determines the contact point such that an approximation error between the line segment on which the contact point is placed and the function to be approximated by both line segments adjacent thereto is minimized;
The arithmetic unit according to claim 3.
対数関数を含む関数を近似対象として、これに近似する関数を演算する演算部を備えた演算装置であって、
前記演算部は、近似対象となる関数を、当該関数と交差する線分を含んでなる折れ線関数により近似し、
前記折れ線関数は、端点(x,y)と(xn+1,yn+1)を持つ線分Sを式(1)で表し、この線分Sによる区分誤差評価関数Eを式(2)で表した場合に、式(3)の誤差評価関数Eを最小化したときに得られるものであること、
を特徴とする演算装置。
N:線分数、x:線分上のx座標、y:線分上のy座標
An arithmetic unit including a calculation unit that calculates a function that approximates a function including a logarithmic function as an approximation target,
The calculation unit approximates a function to be approximated by a line function including a line segment intersecting with the function,
The polygonal line function, end point (x n, y n) and (x n + 1, y n + 1) expressed by equation (1) the line segment S n with the formula a classification error evaluation function E S by the line segment S n ( 2), it is obtained when the error evaluation function E of Equation (3) is minimized.
An arithmetic unit characterized by the above.
N: number of line segments, x: x coordinate on the line segment, y: y coordinate on the line segment
入力された音を符号化する符号化装置と、
入力された音符号を復号化する復号化装置と、
前記符号化装置が出力した音符号を前記復号化装置に伝送する伝送媒体と、
を備え、
前記符号化装置及び前記復号化装置は、請求項1〜5の何れかの演算装置をそれぞれ備えたこと、
を特徴とする音符号化システム。
An encoding device for encoding the input sound;
A decoding device for decoding the input sound code;
A transmission medium for transmitting the sound code output by the encoding device to the decoding device;
With
The encoding device and the decoding device each include the arithmetic device according to any one of claims 1 to 5,
A sound coding system characterized by.
前記符号化装置及び前記復号化装置は、請求項1〜5の何れかの演算装置として、音情報とこの音情報の予測値との差分である予測誤差と、この予測誤差の予測値とに基づいて予測誤差を正規化した正規化予測誤差を求める適応正規化部を有し、
前記適応正規化部は、前記正規化予測誤差を求める関数に、前記予測誤差の絶対値の対数関数を含むこと、
を特徴とする請求項6に記載の音符号化システム。
The encoding device and the decoding device, as the arithmetic device according to any one of claims 1 to 5, include a prediction error that is a difference between sound information and a prediction value of the sound information, and a prediction value of the prediction error. An adaptive normalization unit for obtaining a normalized prediction error obtained by normalizing the prediction error based on
The adaptive normalization unit includes a logarithmic function of an absolute value of the prediction error in a function for obtaining the normalized prediction error;
The sound encoding system according to claim 6.
JP2014151276A 2014-07-24 2014-07-24 Sound encoding system, encoding device, and decoding device Active JP5964897B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014151276A JP5964897B2 (en) 2014-07-24 2014-07-24 Sound encoding system, encoding device, and decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014151276A JP5964897B2 (en) 2014-07-24 2014-07-24 Sound encoding system, encoding device, and decoding device

Publications (2)

Publication Number Publication Date
JP2016024450A true JP2016024450A (en) 2016-02-08
JP5964897B2 JP5964897B2 (en) 2016-08-03

Family

ID=55271208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014151276A Active JP5964897B2 (en) 2014-07-24 2014-07-24 Sound encoding system, encoding device, and decoding device

Country Status (1)

Country Link
JP (1) JP5964897B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019121258A (en) * 2018-01-10 2019-07-22 国立研究開発法人情報通信研究機構 Information processing device and sensing system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274613A (en) * 1993-03-19 1994-09-30 Fujitsu Ltd Curve approximating device
JPH09159445A (en) * 1995-12-07 1997-06-20 Kansei Corp Barometric altimeter
JP2002215608A (en) * 2001-01-23 2002-08-02 Denso Corp Approximate operation device and map decoder
JP2009210644A (en) * 2008-02-29 2009-09-17 Nippon Telegr & Teleph Corp <Ntt> Linear prediction coefficient calculator, linear prediction coefficient calculation method, linear prediction coefficient calculation program, and storage medium
JP2013025467A (en) * 2011-07-19 2013-02-04 Hitachi Advanced Digital Inc Approximation operation circuit for logarithmic function

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274613A (en) * 1993-03-19 1994-09-30 Fujitsu Ltd Curve approximating device
JPH09159445A (en) * 1995-12-07 1997-06-20 Kansei Corp Barometric altimeter
JP2002215608A (en) * 2001-01-23 2002-08-02 Denso Corp Approximate operation device and map decoder
JP2009210644A (en) * 2008-02-29 2009-09-17 Nippon Telegr & Teleph Corp <Ntt> Linear prediction coefficient calculator, linear prediction coefficient calculation method, linear prediction coefficient calculation program, and storage medium
JP2013025467A (en) * 2011-07-19 2013-02-04 Hitachi Advanced Digital Inc Approximation operation circuit for logarithmic function

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019121258A (en) * 2018-01-10 2019-07-22 国立研究開発法人情報通信研究機構 Information processing device and sensing system

Also Published As

Publication number Publication date
JP5964897B2 (en) 2016-08-03

Similar Documents

Publication Publication Date Title
KR102072780B1 (en) Audio signal classification method and device
US8996373B2 (en) State detection device and state detecting method
KR102132500B1 (en) Harmonicity-based single-channel speech quality estimation
RU2643646C2 (en) Coder for audio signal coding, audio transmission system and method of determining correction values
JP2007279444A (en) Feature amount compensation apparatus, method and program
JP4691082B2 (en) Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium
JP6182895B2 (en) Processing apparatus, processing method, program, and processing system
CN110491398B (en) Encoding method, encoding device, and recording medium
KR101971268B1 (en) Audio coding method and related apparatus
JP5964897B2 (en) Sound encoding system, encoding device, and decoding device
JP5964895B2 (en) Sound coding system
JP6061901B2 (en) Sound coding system
JP4598877B2 (en) Encoding method, apparatus using the method, program, and recording medium
US20200075042A1 (en) Detection of music segment in audio signal
JP5964896B2 (en) Sound coding system
US9319645B2 (en) Encoding method, decoding method, encoding device, decoding device, and recording medium for a plurality of samples
CN114708876B (en) Audio processing method, device, electronic equipment and storage medium
JP5057334B2 (en) Linear prediction coefficient calculation device, linear prediction coefficient calculation method, linear prediction coefficient calculation program, and storage medium
JP5336942B2 (en) Encoding method, decoding method, encoder, decoder, program
JP4603429B2 (en) Client / server speech recognition method, speech recognition method in server computer, speech feature extraction / transmission method, system, apparatus, program, and recording medium using these methods
US20200126575A1 (en) Audio coding
JP6261381B2 (en) Signal processing apparatus, signal processing method, and program
CN111326166A (en) Voice processing method and device, computer readable storage medium and electronic equipment
JP2009063700A (en) Device, method and program for estimating voice signal section, and storage medium recording the program
JP5006773B2 (en) Encoding method, decoding method, apparatus using these methods, program, and recording medium

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160630

R150 Certificate of patent or registration of utility model

Ref document number: 5964897

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150