JPS60237500A - Multipulse type vocoder - Google Patents

Multipulse type vocoder

Info

Publication number
JPS60237500A
JPS60237500A JP59094040A JP9404084A JPS60237500A JP S60237500 A JPS60237500 A JP S60237500A JP 59094040 A JP59094040 A JP 59094040A JP 9404084 A JP9404084 A JP 9404084A JP S60237500 A JPS60237500 A JP S60237500A
Authority
JP
Japan
Prior art keywords
pitch
prediction coefficient
pulse
vocoder
pitch prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59094040A
Other languages
Japanese (ja)
Other versions
JPH0411040B2 (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59094040A priority Critical patent/JPS60237500A/en
Publication of JPS60237500A publication Critical patent/JPS60237500A/en
Publication of JPH0411040B2 publication Critical patent/JPH0411040B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (技術分野) 本発明はマルチパルス型ボコーダに関する。[Detailed description of the invention] (Technical field) The present invention relates to a multipulse vocoder.

(従来技術) 入力音声を分析して、この入力音声信号の音声情報を構
成するスペクトル包絡情報と音源情報とを分析側で抽出
し、これら音声情報を伝送路を介して合成側に送出して
入力音声信%f、再生するボコーダはよく知られている
(Prior art) Input audio is analyzed, spectral envelope information and sound source information that constitute the audio information of this input audio signal are extracted on the analysis side, and these audio information are sent to the synthesis side via a transmission path. Vocoders for reproducing input audio signals are well known.

上述したスペクトル包絡情報は、入力音声信号を発生す
る声道系のスペクトル分布情報を表わすもので、通常L
PG分析によって得らnた分析次数に対応する個数のL
PG係数、たとえばαパラメータ、にパラメータ等によ
って表現され、まm音源情報はスペクトル包絡の微細構
造を示すもので入力音声信号からスペクトル分布情報を
除いた、いわゆる残差信号として知ら几るもので、入力
音声信号の音源の強さ、ピッチ周期および有声・熱声に
関する情報が含まn、通常これらの情報は入力音声信号
の分析フレームごとの自己相関係数を介して抽出さルる
こともよく知らnている。
The above-mentioned spectral envelope information represents the spectral distribution information of the vocal tract system that generates the input speech signal, and is usually L
The number of L corresponding to n analysis order obtained by PG analysis
The sound source information is expressed by PG coefficients, such as the α parameter, and parameters, etc., and the sound source information indicates the fine structure of the spectral envelope, and is known as the so-called residual signal, which is obtained by removing the spectral distribution information from the input audio signal. It contains information about the source strength, pitch period, and voicing/voicing of the input audio signal, and it is also well known that this information is usually extracted via the autocorrelation coefficient for each analysis frame of the input audio signal. There are n.

サテ、スペクトル包絡情報はボコーダの合成側で入力音
声信号を合成する場合、通常全極型のデジタルフィルタ
を利用して近似的声道系を形成せしめるLPC合成器の
係数として利用さ扛、音源情報はこのデジタルフィルタ
の駆動音源として利用さn、このデジタルフィルタによ
って入力音声信号が合成される。
When synthesizing input audio signals on the synthesis side of a vocoder, spectral envelope information is usually used as coefficients for an LPC synthesizer that uses an all-pole digital filter to form an approximate vocal tract system. is used as a driving sound source for this digital filter, and input audio signals are synthesized by this digital filter.

このようにして得らルる従来のLPCボコーダは、約4
Kb(キロビット)以下の低ビツトレートでも音声の合
成が可能であり多用さnているものの、高品質の音声合
成は高ピントレートにおいても困難であるという欠点を
有する。この原因は音源情報のモデル化の場合、有声音
に対してはその内容に対応するピッチ周期を抽出してこ
のピッチ周期に対応する単一のインパルス列で近似的に
表現し、ランダム周期の無声音に対しては白色雑音で近
似的に表現するという単純なモデル化処理を前提として
いるため、入力音声信号の音源情報を忠実に抽出したも
のとならず、従って音源情報に含まする入力音声信号の
波形情報の分析、合成が実施さ扛ていないことによる。
The conventional LPC vocoder obtained in this way has approximately 4
Although it is possible to synthesize speech even at a low bit rate of Kb (kilobits) or less, and it is widely used, it has the drawback that high-quality speech synthesis is difficult even at a high focus rate. The reason for this is that when modeling sound source information, for voiced sounds, the pitch period corresponding to the content is extracted and approximately represented by a single impulse train corresponding to this pitch period, while unvoiced sounds with random periods are is assumed to be a simple modeling process in which it is approximated by white noise, so it does not faithfully extract the sound source information of the input audio signal, and therefore the input audio signal contained in the sound source information This is because the analysis and synthesis of waveform information has not been performed.

マルチパルス型ボコーダは、このような波形非伝送によ
る問題の改善を図るため波形伝送を行なって入力音声信
号の合成を実施するボコーダのひとつとして近時よく知
られつつあるものでおる。
A multi-pulse vocoder has recently become well known as a type of vocoder that performs waveform transmission and synthesizes input audio signals in order to improve the problem caused by non-transmission of waveforms.

第1図り従来のマルチパルス型ボコーダの分析側に於け
る基本的構成を示すブロック図である。
FIG. 1 is a block diagram showing the basic configuration on the analysis side of a conventional multi-pulse vocoder.

LPG合成器1は声道をシミユレートする全極型デジタ
ルフィルタを備え、その係数は入力端子20旧を介して
入力さルる入力音声信号x(n)(n−1,2,3・−
・・・・n)をLPC分析器2により分析フレームごと
に分析したLPG係数が供給さ几る。
The LPG synthesizer 1 is equipped with an all-pole digital filter that simulates the vocal tract, and its coefficients are based on the input audio signal x(n) (n-1, 2, 3, -
.

音源パルス発生器3は、入力音声信号の音源情報がら複
数個のインパルス系列、すなわちマルチノくルスからな
る駆動音源系列V(n)を得て、こnをLPC合成器1
の駆動音源として供給する。
The sound source pulse generator 3 obtains a driving sound source sequence V(n) consisting of a plurality of impulse sequences, that is, multinoculus, from the sound source information of the input audio signal, and converts this n into an LPC synthesizer 1.
supplied as a driving sound source.

LPC合成器1はこうして入力するI、PC係数を、通
常は全極型デジタルフィルタを利用する合ポM J I
l−jlの瓜勃ト1 マルチIくルスをffimGfl
fiとして駆動さn合成信号′3i″(n) e出力す
る。この場合、マルチパルスは入力音声信号の波形情報
を含むものであり、LPG合成器lは波形情報を含む入
力音声信号の合成を行なうこととなる。
The LPC synthesizer 1 converts the input I and PC coefficients into a combination using an all-pole digital filter.
l-jl's melon erection 1 Multi I Kurusu ffimGfl
n synthesized signal '3i'' (n) e is driven as fi. In this case, the multipulse contains the waveform information of the input audio signal, and the LPG synthesizer l synthesizes the input audio signal including the waveform information. It will be done.

さて、LPC合成器1から出力する合成信号X(n)は
次に減算器4で入力音声信号x(n)との差をとり、誤
差e(n)を得てこnを聴感重み付は器5に送出する。
Next, the synthesized signal X(n) output from the LPC synthesizer 1 is subtracted by the subtracter 4, which takes the difference from the input audio signal x(n) to obtain the error e(n). Send to 5.

聴感重み付は器5は、誤差e(n)に対して次の(1)
式に示す特性W(Z)を有する重み付はフィルタによっ
て聴感的な重み付けを付与したうえ、こルらを2乗誤差
最小化器6に送出するものである。
The auditory weighting device 5 calculates the following (1) for the error e(n).
The weighting having the characteristic W(Z) shown in the equation is performed by applying perceptual weighting using a filter, and then sending these to the squared error minimizer 6.

W(Z)=(1−5; a Z−”)/(1−整a*r
’Z”〕〕k−1kk− 1・・・・・・・・・・・ (1) (1)式においてak はLPC合成器1の全極型デジ
タルフィルタの係数とすべきLPC係数、pはその次数
であシ従ってLPG分析次数、γは重み付は係数、Zは
全極型デジタルフィルタのZ変換表示による伝達関数H
(Z−’)におけるZ=exp(j’)を示し、ここに
λ=2πΔTfでありΔTは分析フレームの標本化すy
プリング周期、fは周波数を示す。
W(Z)=(1-5; a Z-”)/(1-set a*r
'Z'']]k-1kk-1... (1) In equation (1), ak is the LPC coefficient that should be the coefficient of the all-pole digital filter of LPC synthesizer 1, p is the order, therefore the LPG analysis order, γ is the weighting coefficient, and Z is the transfer function H in the Z-transform representation of the all-pole digital filter.
(Z-'), where λ = 2πΔTf and ΔT is the sampling rate of the analysis frame y
The pulling period, f indicates the frequency.

また(1)式において重み付は係数γは、0〈γ〈1の
範囲で設定される。
Further, in equation (1), the weighting coefficient γ is set in the range of 0<γ<1.

(1)式に示すW(Z)はr=1に対しては1、γ=0
に対してはW(Z)=1−p(Z)の範囲の範囲で変化
し、rの値は誤差e(n)の周波数スペクトルにおける
フォルマント領域に現わ扛る過大なレベルを抑圧する程
度に対応して前述した範囲の中で設定さ1、合成すべき
信号の聴感的重み付けの役割を果たすものであり、通常
予め最適聴感テストによってその最適値が選定さ几る。
W(Z) shown in equation (1) is 1 for r=1 and γ=0
The value of r varies within the range of W(Z) = 1-p(Z), and the value of r is set to an extent that suppresses the excessive level that appears in the formant region of the frequency spectrum of error e(n). It is set within the above-mentioned range corresponding to 1, and plays the role of perceptual weighting of the signals to be synthesized, and its optimal value is usually selected in advance by an optimal auditory test.

このようにして重み付けさ扛た誤差e(n)は、音源パ
ルス発生器3から出力される駆動音源系列V (n )
、すなわちマルチパルスの最適時間位置と振幅とを決定
するために2乗誤差最小化器6に送出さ扛、次の(2)
式による2乗誤差εを計算し、εを最小にするように駆
動音源系列V(n)が選択される。
The error e(n) weighted in this way is the drive sound source series V (n ) output from the sound source pulse generator 3.
, that is, the following (2) is sent to the squared error minimizer 6 to determine the optimal time position and amplitude of the multi-pulse.
The squared error ε is calculated using the formula, and the driving sound source sequence V(n) is selected so as to minimize ε.

ε=l: (e(n)薫W(n))” ・・−・・・・
・・・・・・・・(2)−1 (2)式において記号簀は聴感重み付は器5の重み付は
フィルタによるたたみ込み積分、Nはマルチパルスを計
算する区間長を示す。
ε=l: (e(n) Kaoru W(n))” ・・・-・・・・・・
(2)-1 In equation (2), the symbol box indicates the auditory weighting, the weighting of the device 5 indicates convolution integration by a filter, and N indicates the interval length for calculating the multipulse.

上述した処理はマルチパルスのパルスごとに繰返され、
分析による合成がマルチパルスごとに行なわルる、いわ
ゆるAnalysis−by−8ynthesis手法
(以下A−b−8手法と略称する)である。
The above process is repeated for each pulse of the multipulse,
This is a so-called analysis-by-8 synthesis method (hereinafter abbreviated as A-b-8 method) in which synthesis by analysis is performed for each multipulse.

L71”しながら、マルチパルス型ボコーダには次に述
べるような欠点がある。
However, the multi-pulse vocoder has the following drawbacks.

すなわち、フレーム内で分析の結果発生するパルス数よ
りもフレーム内に存在する所望の音質の合成音を再生す
るために必要なパルス数が多いときには合成信号は人力
音声信号の音源情報に関する波形伝送を忠実に実行した
ものとならず、合成信号の音声品質が上述したパルス数
の差に対応した程度の劣化を伴なうこととなる。
In other words, when the number of pulses required to reproduce the synthesized sound of the desired sound quality existing within the frame is greater than the number of pulses generated as a result of analysis within the frame, the synthesized signal transmits the waveform related to the sound source information of the human voice signal. The result will not be faithfully executed, and the audio quality of the synthesized signal will deteriorate to a degree corresponding to the difference in the number of pulses described above.

マルチパルス型ボコーダでは、たとえば分析周期t−2
0m S E Cとする1フームにおいて発生すべき音
源駆動パルスの数はピットレートに対応して通常4〜1
6個のうち予め設定した固定数を利用する、入力音声信
号が女声あるいは幼児声の如くピッチ周期が小さい高声
の場合、音源信号のピッチ周期が25m5EC程度とな
ることも珍しくない、この場合1分析フレーム中に設定
すべき駆動音源パルスの数としては少なくとも8個必要
となる。このような場合、分析フレーム内で発生すべき
駆動音源パルスの数が8個以下、たとえば4個に設定し
であるときにはこのような駆動音源パルスを利用するマ
ルチパルス型ボコーダでは倍ピツチエラーと同様な結果
を含む合成音が発生し合成音質が著しく劣化することと
なる。
In a multi-pulse vocoder, for example, the analysis period t-2
The number of sound source drive pulses that should be generated in one frame with 0m S E C is usually 4 to 1 depending on the pit rate.
When the input audio signal is a high-pitched voice with a small pitch period, such as a female voice or a child's voice, it is not uncommon for the pitch period of the sound source signal to be about 25m5EC, in this case 1. At least eight driving sound source pulses are required to be set in an analysis frame. In such a case, if the number of driving sound source pulses to be generated within the analysis frame is set to 8 or less, for example 4, a multi-pulse type vocoder that uses such driving sound source pulses will suffer from a double pitch error. A synthesized sound containing the result will be generated, and the synthesized sound quality will be significantly degraded.

上述した欠点を除去する目的でマルチパルス型ボコーダ
にピッチ予測係数の導入が試みら几ている。ピッチ予測
係数は音声がピッチ周期、即ち声帯の撮動周期、を繰返
し周期として概周期性を有する性質を表わすものである
。マルチパルス型ボコーダに於けるピッチ予測係数の利
用は音源パルス発生器とLPG合成器との間にピッチ周
期とピッチ予測係数とにエリ伝達関数の決定さ江るピッ
チ合成器を挿入することにより行なわれる。
Attempts have been made to introduce pitch prediction coefficients into multi-pulse vocoders in order to eliminate the above-mentioned drawbacks. The pitch prediction coefficient represents the property that speech has approximately periodicity, with the pitch period, that is, the imaging period of the vocal cords being the repetition period. The use of pitch prediction coefficients in a multi-pulse vocoder is achieved by inserting a pitch synthesizer between the sound source pulse generator and the LPG synthesizer, which determines the transfer function based on the pitch period and pitch prediction coefficients. It will be done.

第2図はマルチパルス型ボコーダにピッチ合成器を挿入
する場合に於ける分析側の一構成例でろる。第2図に於
いて参照番号1〜6は第1図に於ける同一の参照番号の
ブロックと同一のものでろる。ピンチ分析器7は自己相
関法等により音声信号のピッチ周期T とピッチ予測係
数b l(i =Tp−j、 Tp−j+1.・・・・
・・、 T、、 T、 +1.・・・・・−2T、 十
j−1,T、十j )を算出する。ピッチ合成器8は音
源パルス列により駆動される一種のフィルタであり、下
記(3)式に示すピッチ予測特性に相等する伝達関数を
有する。
FIG. 2 shows an example of a configuration on the analysis side when a pitch synthesizer is inserted into a multi-pulse vocoder. Reference numbers 1-6 in FIG. 2 may be the same as blocks with the same reference numbers in FIG. The pinch analyzer 7 calculates the pitch period T of the audio signal and the pitch prediction coefficient b l (i = Tp-j, Tp-j+1...) using an autocorrelation method or the like.
..., T,, T, +1. ...-2T, 1j-1, T, 1j). The pitch synthesizer 8 is a type of filter driven by the sound source pulse train, and has a transfer function equivalent to the pitch prediction characteristic shown in equation (3) below.

ピッチ合成器8を用いることにより音源パルス発生器3
にめら扛るパルス発生数はエリ少ないものでよいことに
なる。従って音源駆動パルス数を固定とした場合、上述
の欠点が緩和さ几る。なお、マルチパルス型ボコーダに
於けるピッチ予測係数の利用法については小浜等「ピッ
チ情報を用いたマルチパルス駆動形音声符号化法」、日
本音響学会、昭和58年度秋季研究発表会講演論文集。
By using the pitch synthesizer 8, the sound source pulse generator 3
This means that the number of flashing pulses that can be generated can be kept to a minimum. Therefore, when the number of sound source driving pulses is fixed, the above-mentioned drawbacks are alleviated. For information on how to use pitch prediction coefficients in multi-pulse vocoders, see Obama et al., ``Multi-pulse driven speech coding method using pitch information,'' Acoustical Society of Japan, 1988 Autumn Research Presentation Proceedings.

Oct、 1983 2−2−14に詳しく述べらnて
いる。
Oct. 1983 2-2-14.

しがしながら、ピッチ予測係数の導入はピッチ予測係数
等を分析側から合成側へ伝送する必要を生じる。従って
前記係数の導入は例えば96008P8等伝送ビット速
度が一定のマルチパルス型ボコーダに於いては他のパラ
メータの情報量を削除して行なわnる。故にピッチ予測
係数の導入は音質の点で以下の3通りの結果を招く。
However, the introduction of pitch prediction coefficients creates a need to transmit pitch prediction coefficients and the like from the analysis side to the synthesis side. Therefore, in a multi-pulse vocoder with a constant transmission bit rate, such as the 96008P8, the coefficients are introduced by deleting the amount of information of other parameters. Therefore, the introduction of pitch prediction coefficients has the following three consequences in terms of sound quality.

■ ピッチ予測係数の導入により合成音の音質が改善さ
ルる。
■ The sound quality of synthesized speech is improved by introducing pitch prediction coefficients.

■ ピッチ予測係数の導入によるピッチ予測効果と、ピ
ッf 予I11係数以外の他のパラメータを削減した結
果による音質劣化とが相殺さ几、殆んど音質改善の効果
がない。
■ The pitch prediction effect due to the introduction of the pitch prediction coefficient and the deterioration in sound quality due to the reduction of parameters other than the pitch prediction coefficient cancel each other out, and there is almost no effect of improving sound quality.

■ ピッチ予測効果よりもピッチ予測係数以外の他のパ
ラメータを削減した結果による音質劣化の影響が木きく
、むしろ合成音の劣化を招く。
■ The effect of sound quality deterioration due to the reduction of parameters other than the pitch prediction coefficient is more significant than the pitch prediction effect, and rather leads to deterioration of the synthesized sound.

従来、ピッチ予測係数を導入したマルチパルス型ボコー
ダに於いては画一的にピッチ予測を実施していたために
、上記■のごとく、むしろ合成音質を劣化させる場合が
あるという欠点を有していた。
Conventionally, multi-pulse vocoders that have introduced pitch prediction coefficients have uniformly performed pitch prediction, which has the disadvantage of sometimes deteriorating the synthesized sound quality, as described in (■) above. .

(発明の目的) 本発明の目的は上述の欠点を除去し、所定の伝送ビット
速度のマルチパルス型ボコーダに於いて、最も音質の優
rt、た符号化手段を有するマルチパルス型ボコーダを
提供することにある。
(Object of the Invention) The object of the present invention is to eliminate the above-mentioned drawbacks and provide a multi-pulse vocoder having the best sound quality encoding means in a multi-pulse vocoder with a predetermined transmission bit rate. There is a particular thing.

(発明の構成) 本発明のマルチパルス型ボコーダの具体例は、入力音声
信呆ヲ分析フレームごとにLPC分析して抽出し7jL
PC係数をスペクトル包絡情報としこのスペクトル包絡
情報とともに前記入力音声信号の音声情報を構成する音
源情報を分析フレームごとにこの音源情報の特徴に対応
する発生時間位置と振幅とを有する複数個のインパルス
系列(マルチパルス)を以って表現し前記入力音声信号
の分析器よび合成を行なうマルチパルス型ボコーダに2
いて、前記入力音声信号の分析フレームごとに抽出する
ピッチ周期とピッチ予測係数とを介して、ピッチ予測効
果と、ピッチ予測を行なう場合に削減される他のパラメ
ータの影響とを比較判断したうえ、ピッチ予測効果が大
なる場合には、ピッチ周期及びピッチ予測係数を分析側
より合成側へ伝送し、前記効果が小なる場合には、前記
周期および/又はピッチ予測係数の代りにマルチパルス
駆動音源の情報をより多く伝送する手段を備えて構成さ
几る。
(Structure of the Invention) A specific example of the multi-pulse vocoder of the present invention performs LPC analysis and extracts input speech signals for each analysis frame.
Using the PC coefficients as spectral envelope information, together with this spectral envelope information, the sound source information constituting the audio information of the input audio signal is analyzed. A plurality of impulse sequences having generation time positions and amplitudes corresponding to the characteristics of this sound source information are generated for each frame. A multi-pulse vocoder is used to analyze and synthesize the input audio signal.
and comparing and determining the pitch prediction effect with the influence of other parameters that are reduced when pitch prediction is performed, using the pitch period and pitch prediction coefficient extracted for each analysis frame of the input audio signal, If the pitch prediction effect is large, the pitch period and pitch prediction coefficient are transmitted from the analysis side to the synthesis side, and if the effect is small, a multi-pulse driven sound source is used instead of the period and/or pitch prediction coefficient. The device is constructed with means for transmitting more information.

(笑施例) 次に図面を参照して本発明の詳細な説明する。(lol example) Next, the present invention will be described in detail with reference to the drawings.

第3図は本発明にIるマルチパルス型ボコーダの分析側
の一実施例を示すブロック図、第4図は本発明によるマ
ルチパルス型ボコーダの合成側の一実施例を示すブロッ
ク図である。
FIG. 3 is a block diagram showing an embodiment of the analysis side of a multi-pulse vocoder according to the present invention, and FIG. 4 is a block diagram showing an embodiment of the synthesis side of the multi-pulse vocoder according to the present invention.

第3図に示す本発明によるマルチパルス型ボコーダの分
析側は、LPC合成器1.LPC分析器2、音源パルス
発生器3.減算器4.聴感重み付は器5.2乗誤差最小
化器6.ピッチ分析器7゜ピッチ合成器8.切替器9.
量子化器10.量子化復号化器(1)11.ピッチ予測
制御信号発生器12゜量子化復号化器(2) 13 、
マルチプレクサ14工り構成されている。図に於いて参
照番号1〜8は第2図に於ける同一参照番号のブロック
と同一であり、本発明を特徴付ける主要な構成はピッチ
予測制御信号発生器12と切替器9とである。
The analysis side of the multi-pulse vocoder according to the present invention shown in FIG. 3 consists of an LPC synthesizer 1. LPC analyzer 2, sound source pulse generator 3. Subtractor 4. Auditory weighting unit 5. Square error minimizer 6. Pitch analyzer 7° pitch synthesizer 8. Switcher 9.
Quantizer 10. Quantization decoder (1) 11. Pitch prediction control signal generator 12° quantization decoder (2) 13,
It consists of 14 multiplexers. In the figure, reference numbers 1 to 8 are the same as blocks with the same reference numbers in FIG.

波形入力端子2001e介して入力音声信号がLPC分
析器2.減算器4.ピッチ分析器7へ供給さする。LP
C分析器2は入力音声信号を自己相関法等工く知らする
LPC分析を利用してLPG分析し、LPG係数を算出
する。LPG分析器2は更に算出したLPG係数を量子
化復号化器(2)13へ出力する。量子化復号器(2)
13は供給さnたLPC係数を所要のビット数、例えば
48bits程度で表現するために量子化する。量子化
さしたLPC係数は出力ライ/131を介してマルチプ
レクサ14へ供給さ扛る。量子化復号化器(2)13は
更に量子化さnたLPG係数を復号化し出力ライン13
2を介してLPC合成器1と聴感重み付け器5とへ供給
する。ピッチ分析器7は入力音声信号のピッチ周期とピ
ッチ予測係数とを例えば自己相関係数を介して算出する
。第5図はピッチ分析器7の動作を説明するための波形
図である。第5図に於いて自己相関係数列501は入力
音声信号から下記(4)式により算出さ几る係数列であ
る。
The input audio signal is input to the LPC analyzer 2 through the waveform input terminal 2001e. Subtractor 4. The signal is supplied to the pitch analyzer 7. LP
The C analyzer 2 performs LPG analysis on the input audio signal using LPC analysis using techniques such as an autocorrelation method, and calculates LPG coefficients. The LPG analyzer 2 further outputs the calculated LPG coefficients to the quantization decoder (2) 13. Quantization decoder (2)
13 quantizes the supplied LPC coefficients in order to express them with a required number of bits, for example, about 48 bits. The quantized LPC coefficients are supplied to multiplexer 14 via output line/131. The quantization decoder (2) 13 further decodes the quantized LPG coefficients and outputs the output line 13.
2 to the LPC synthesizer 1 and perceptual weighter 5. The pitch analyzer 7 calculates the pitch period and pitch prediction coefficient of the input audio signal, for example via an autocorrelation coefficient. FIG. 5 is a waveform diagram for explaining the operation of the pitch analyzer 7. In FIG. 5, an autocorrelation coefficient sequence 501 is a coefficient sequence calculated from the input audio signal using the following equation (4).

点502はピッチ周期Tpに対応するピッチ予測係数b
Tp−11点504は周期Tp−2に対応するピッチ予
1fltl係数bTp4.・・−・・・、を示す。又、
点512は周期Tp+1に対応するピンチ予測係数bT
、+1゜点513は周期Tp+2に対応するピッチ予測
係数bT、+2# ・・・・・−0を示す。閘ピッチ周
期Tpはピッチ周期分布範囲、例えば2.5m5EC〜
15m5EC(8幻tす/プルで20〜120タップ遅
れに相等する)に於ける自己相関係数列501の最大値
に付随してめら扛る。
Point 502 is pitch prediction coefficient b corresponding to pitch period Tp
The Tp-11 point 504 is the pitch pre-1fltl coefficient bTp4.corresponding to the period Tp-2. ...-..., is shown. or,
Point 512 is the pinch prediction coefficient bT corresponding to the period Tp+1
, +1° point 513 indicates the pitch prediction coefficient bT, +2# . . . -0 corresponding to the period Tp+2. The lock pitch period Tp is within the pitch period distribution range, for example 2.5m5EC~
There is a dizziness associated with the maximum value of the autocorrelation coefficient sequence 501 at 15m5EC (equivalent to a delay of 20 to 120 taps with 8 taps/pull).

再び第3図に戻って、ピッチ分析器7により算出@n、
fcピッチ周期データとピッチ予測係数とは量子化復号
化器(1)11とピッチ予測側(財)信号発生器12と
へ出力さ江る。量子化復号化器(1)11は供給さfた
ピンチ周期データとピッチ予測係数とを有限のビット数
に量子化しマルチプレクサ14へ出力する。更に量子化
復号化器(1)11は量子化さ几たピッチ周期データと
ピッチ予測係数とを復号化しピッチ合成器8へ出力する
。ピッチ予測制御信号発生器12はピッチ分析器7よシ
供給さnるピッチ周期データTpとピッチ予測係数bT
、を用いて下記(4)式が成立するか否かを判定する。
Returning to FIG. 3 again, the pitch analyzer 7 calculates @n,
The fc pitch period data and pitch prediction coefficients are output to a quantization decoder (1) 11 and a pitch prediction side signal generator 12. The quantization decoder (1) 11 quantizes the supplied pinch period data and pitch prediction coefficient into a finite number of bits and outputs it to the multiplexer 14. Furthermore, the quantization decoder (1) 11 decodes the quantized pitch period data and pitch prediction coefficients and outputs them to the pitch synthesizer 8. The pitch prediction control signal generator 12 receives pitch period data Tp and pitch prediction coefficient bT supplied from the pitch analyzer 7.
, it is determined whether the following equation (4) holds true.

Tp−LE−TR−AND−b丁、、・G’l’−bR
・・・・・・・・・(4)(4)式に於いてT、は例え
ば63にbRは例えば07に設定さnる定数である。な
2、T&・bB等は音質評価等が実験的にめらnる。(
4)式はピッチ周期T、が予じめ設定さルた範囲T、以
内であり。
Tp-LE-TR-AND-b,,・G'l'-bR
(4) In equation (4), T is a constant set to, for example, 63, and bR is set to, for example, 07. 2. The sound quality of T&bB etc. has been experimentally evaluated. (
4) In equation 4, the pitch period T is within the preset range T.

且つ、ピッチ予測係数bTpが予じめ設定さ几た値bR
を超える場合のみに成立する。(4)式が成立する場合
にはピッチ予測制御信号発生器12は切替器9をピッチ
合成器8側へ接続する制御信号を、又、(4)式が不成
立の場合には切替器9を音源パルス発生器3側へ接続す
る制御信号を発生する。従って上記(4)式が不成立の
場合には本実施例は第1図に示す従来のピッチ予測を実
施しない型式のマルチパルス型ボコーダの分析側と処理
構造が一致し、上記(4)式が成立する場合には本実施
例は第2図IC示す従来のピッチ予測型のマルチパルス
型ボコーダの分析側と処理構造が一致する。ピッチ予測
制御信号発生器12は更に切替器9に対する制御信呆と
同等の2短信号をマルチプレクサ14と量子化器10と
音源パルス発生器3とへ出力する。
In addition, the pitch prediction coefficient bTp is a preset value bR
This only holds true if it exceeds . If the equation (4) holds true, the pitch prediction control signal generator 12 sends a control signal to connect the switch 9 to the pitch synthesizer 8 side, and if the equation (4) does not hold, the pitch prediction control signal generator 12 connects the switch 9 to the pitch synthesizer 8 side. Generates a control signal to be connected to the sound source pulse generator 3 side. Therefore, if the above equation (4) does not hold, the processing structure of this embodiment matches that of the analysis side of the conventional multi-pulse vocoder that does not perform pitch prediction, as shown in FIG. If this holds true, the processing structure of this embodiment matches that of the analysis side of the conventional pitch prediction type multi-pulse vocoder shown in FIG. 2IC. The pitch prediction control signal generator 12 further outputs two short signals equivalent to the control signals for the switch 9 to the multiplexer 14, the quantizer 10, and the excitation pulse generator 3.

切替器9の接続具合により、2乗誤差最小化器6゜音曲
パルス発生器3.ピッチ合成器8.LPC合成合成器械
潰二器4.聴感重み付は器5エリなるA−’b −B手
法によるループは適宜ピッチ予測を実施しつつ最適な音
源パルス系列を決定する。音源パルス系列は音源情報の
特徴に対応する発生時間位置と振幅とを有する予じめ定
めた複数個のインパルス系列(マルチパルス)であり、
直接的ICU喜11百バ117 ’1 ”蓼出叫’l 
Iff ? h益圧シ引与ユIし典1^へ出力さnる。
Depending on the connection condition of the switch 9, the square error minimizer 6° music pulse generator 3. Pitch synthesizer8. LPC synthesis instrument crusher 4. The loop based on the A-'b-B method in which perceptual weighting is performed determines an optimal sound source pulse sequence while appropriately performing pitch prediction. The sound source pulse sequence is a plurality of predetermined impulse sequences (multipulses) having generation time positions and amplitudes corresponding to the characteristics of the sound source information,
Direct ICU Ki 11 Hyakuba 117 '1 ``Tade Shout''l
If? The benefit pressure is given and output to the source 1^.

無論ピッチ予i117il:実施しない場合にはヒツチ
データ相等分のマルチパルス数の増加を実施し得る。
Of course, if the pitch pre-planning is not carried out, the number of multi-pulses can be increased by the same amount as the hitch data.

量子化器10扛マルチパルス列を有限のビット数(上述
の制御信会によりビット数は変化する)に量子化しマル
チプレクサ14へ出力する、マルチプレクサ14は量子
化器10より供給さnる量−半化さ牡たマルチパルスと
、量子化復号化器(1)、]1より供給さnる量子化さ
tl−たピッチ周期2工びピッチ予測係数と、ピッチ予
測制御信号発生器12より供給さnる切替器9に対する
制御信号と同等の2値信呆と、量子化復号化器(2)1
3工9供給でしる量子化さ几たLPC係数とを多重化し
データ出力端子141へ出力する。無論−Ml記得制御
信呆と同等の2短信号を直接伝送せずに、2短信号がピ
ッチ予測を実施しないことを意味するときに、ピッチ周
期又はピッチ予測係数に割当てらnた符号ビットを特定
の符号に設定することによりピッチ予測を実施しない意
味の情報を伝透し得る。
The quantizer 10 quantizes the multi-pulse train into a finite number of bits (the number of bits changes depending on the control signal mentioned above) and outputs it to the multiplexer 14. quantized multi-pulse, quantized decoder (1), quantized pitch period 2 pitch prediction coefficient supplied from the pitch prediction control signal generator 12; A binary signal equivalent to the control signal for the switch 9 and the quantization decoder (2) 1
It multiplexes the quantized LPC coefficients supplied by the third unit 9 and outputs it to the data output terminal 141. Of course - without directly transmitting the two short signals equivalent to Ml memorized control information, it is possible to use the n sign bits assigned to the pitch period or the pitch prediction coefficient when the two short signals mean that no pitch prediction is carried out. By setting a specific code, information that does not involve pitch prediction can be transmitted.

例えばピッチ周期を0″として伝送す扛ばよい。For example, the pitch period may be set to 0'' and transmitted.

第4図に示す合成側は、分析側データ出力端子141を
経由しデータ入力端子15011に介して分析側伝送さ
nたデータに基づいて入力音声信号の合成を行なうもの
であり、デマルチプレクサ16゜復号化器(1)17 
、復号化器(2)18 、復号化器(3) 19 。
The synthesis side shown in FIG. 4 synthesizes input audio signals based on the data transmitted to the analysis side via the analysis side data output terminal 141 and the data input terminal 15011, and the demultiplexer 16° Decoder (1) 17
, decoder (2) 18 , decoder (3) 19 .

ピッチ合成器20.切替器23.LPC合成器21゜L
 P F (Low Pa5s Filtcr) 等を
備えて構成さnる。
Pitch synthesizer 20. Switcher 23. LPC synthesizer 21゜L
PF (Low Pa5s Filtcr) and the like.

デマルチプレクサ16は、データ入力端子1501を介
して入力した各糧データをマルチプレクサ14の多重化
前の状態に復元踵マルチノくルスデータは出力ライン1
61を介して復号化器(1)17に、LPC係数データ
は出力ライ/162を介して復号化器(2) 18に、
ピッチ周期及びピッチ予測係数データは出力ライ/16
3を介して復号化器(3)19に、上述の切替器9に対
する制御信号と同等の2短信号は出力ライン164e介
して切替器23にそ肛ぞれ供給さ扛、こ律らの復号化器
によってデータの復号化を行なつ1こうえ、そ几ぞ几出
カライン171,181.191に送出する。
The demultiplexer 16 restores each food data input through the data input terminal 1501 to the state before multiplexing of the multiplexer 14, and the heel multi-noise data is output on the output line 1.
61 to the decoder (1) 17, and the LPC coefficient data to the decoder (2) 18 via the output line/162.
Pitch period and pitch prediction coefficient data are output lie/16
3 to the decoder (3) 19, and two short signals equivalent to the control signals for the switch 9 described above are supplied to the switch 23 via the output line 164e. The encoder decodes the data and then sends it to the output lines 171, 181, and 191.

ピンチ合成器20は第3図分析側に於けるピッチ合成器
8と同一の構造のものである。切替器23は出力ライン
164より供給さルる2短信号によりピッチ合成器20
の出力パルス1LPc合成器21へ供給するか、復号化
器(1)17より出力さnるマルチパルスヲ直接LPC
合成器21へ供給するかを制御する。
The pinch synthesizer 20 has the same structure as the pitch synthesizer 8 on the analysis side in FIG. The switch 23 switches the pitch synthesizer 20 by two short signals supplied from the output line 164.
The output pulse 1 of LPc can be supplied to the LPc combiner 21, or the multipulses output from the decoder (1) 17 can be directly converted into LPC.
It controls whether or not it is supplied to the synthesizer 21.

LPG合成器21は、このようにして入力するピッチ予
測を適宜付加さnたマルチパルスを音源情報としてp次
の全極型デジタルフィルタの駆動音源に利用し、また出
力ライy18 it介して入力するp次のLPG係数デ
ータを上記全極型デジタルフィルタの係数としてこのL
PC合成フィルタを制御して入力音声信号を合成し、こ
tLk出カシカライン211してLPF22に送出し、
所定の1成域フィルタリングを行ってアナログ量の合成
音声として出力ライン221に送出する。
The LPG synthesizer 21 uses the input multi-pulse to which the pitch prediction is appropriately added as sound source information for the drive sound source of the p-order all-pole digital filter, and also inputs it through the output line y18 it. Using this LPG coefficient data as the coefficient of the all-pole digital filter,
Controls the PC synthesis filter to synthesize the input audio signal, and sends it to the LPF 22 via the Lk output line 211.
A predetermined one-band filtering is performed and the resultant signal is sent to the output line 221 as an analog synthesized voice.

なお、分析側に於いて切替器9の制御信央と同等の2短
信号を直接伝送せずに、例えばピッチ予損11係数を”
0”に設定する等の手段でピッチ予測を実施しない意味
の情報を送出する場合には、合成側に於いては復号化器
(3)19がピッチ予測係数を101に復号化すること
により容易に対応し得ることは明らかである。この場合
には切替器23及び出力ライン164は不要となる。
In addition, on the analysis side, without directly transmitting the 2-short signal equivalent to the control signal of the switch 9, for example, the pitch reserve loss 11 coefficient can be calculated.
When transmitting information meaning that pitch prediction is not performed by means such as setting it to 0'', the decoder (3) 19 on the synthesis side can easily decode the pitch prediction coefficient to 101. It is clear that the switch 23 and the output line 164 are unnecessary in this case.

また、第3図および第4図に示す本発明の実施例におい
ては、LPC係数としてにパラメータを用いているがこ
nは他のLPG係数、たとえばαパラメータ等を利用し
てもよく、また符号化器とマルチプレクサ、pよび復号
化器とデマルチプレクサはそルぞnこれらを一体化した
構成のものとしても同様に実施し得ることは明らかであ
り、またLPC合成フィルタは全極型以外の非極型デジ
タルフィルタ等と置換してもほぼ同様に実施しうろこと
もまた明らかである。
Furthermore, in the embodiments of the present invention shown in FIGS. 3 and 4, parameters are used as LPC coefficients, but other LPG coefficients such as the α parameter may also be used. It is clear that the encoder and multiplexer, the decoder and the demultiplexer can be implemented in the same way as integrated components, and the LPC synthesis filter can also be implemented as a non-all-pole type. It is also clear that the implementation can be carried out in almost the same way even if a polar digital filter or the like is substituted.

(発明の効果) 以上説明した如く本発明に工【ば、マルチパルスボコー
ダにおいて、伝送ビット速度が一定の条件下に於いてピ
ッチ周期およびピッチ予測係数にビットを割当てる有効
性を判断しつつ最適なビットの割当てを行なうことによ
り、最も合成音質を高め得るという効果がある。
(Effects of the Invention) As explained above, the present invention enables a multi-pulse vocoder to determine the effectiveness of allocating bits to pitch periods and pitch prediction coefficients under conditions where the transmission bit rate is constant. By allocating bits, the synthesized sound quality can be improved the most.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来のピッチ予測を実施しないマルチパルス型
ボコーダの基本的構成を示すブロック図、第2図は従来
のピッチ予測を実施するマルチパルス型ボコーダの基本
的構5!2を説明するためのブロック図、第3図は本発
明によるマルチパルス型ボコーダの分析側の一実施例を
示すブロック図、第4図は本発明によるマルチパルス型
ボコーダの合成側の一実施例を示すブロック図、第5図
はピッチ分析器7の動作を説明するための波形図である
。 1.21・・・・・・LPC合成器、2・・・・・・L
PC分析器、3・・・・・−音源パルス発生器、4・・
・・・・減算器、5・・・・・・聴感重み付は器、6・
・−・・・2乗誤差最小化器、7・・・・・・ピッチ分
析器、8,20・・・・・・ピッチ合成器、9.23・
・・・・・切替器、10・・・・・・量子化器、11・
−・・・・量子化復号化器(1)、12・・・・・・ピ
ッチ予測制御信号発生器、13・・・・−・量子化復号
化器(2)、14・・・・・・マルチプレクサ、16・
・・・・・デマルチプレクサ、17・・・−・復号化器
(1)、18・・・・・・復号化器(2)、19・す・
復号化器(3)、22・・・・・・LPF処) YI圀
Figure 1 is a block diagram showing the basic configuration of a multi-pulse vocoder that does not perform conventional pitch prediction, and Figure 2 is for explaining the basic configuration of a multi-pulse vocoder that performs conventional pitch prediction. FIG. 3 is a block diagram showing an embodiment of the analysis side of the multi-pulse vocoder according to the present invention, and FIG. 4 is a block diagram showing an embodiment of the synthesis side of the multi-pulse vocoder according to the present invention. FIG. 5 is a waveform diagram for explaining the operation of the pitch analyzer 7. 1.21...LPC synthesizer, 2...L
PC analyzer, 3...-Sound source pulse generator, 4...
...Subtractor, 5... Auditory weighting is device, 6.
... Square error minimizer, 7 ... Pitch analyzer, 8, 20 ... Pitch synthesizer, 9.23.
...Switcher, 10...Quantizer, 11.
-...Quantization decoder (1), 12...Pitch prediction control signal generator, 13...-Quantization decoder (2), 14...・Multiplexer, 16・
...Demultiplexer, 17...Decoder (1), 18...Decoder (2), 19...
Decoder (3), 22...LPF processing)

Claims (1)

【特許請求の範囲】[Claims] (1)入力音声信号を分析フレームごとにLPC(Li
near Prediction Coefficie
nt 、線形予測係数)分析して抽出したLPG係数を
スペクトル包絡情報としこのスペクトル包絡情報ととも
に前記入力音声信号の音声情報を構成する音源情報を分
析フレームごとにこの音源情報の特徴に対応する発生時
間位置と振幅とを有する予じめ定めた複数個のインパル
ス系列(マルチパルス)を以って表現して前記入力音声
信号の分析および合成を行なうマルチパルス型ボコーダ
において、前記入力音声信号の分析フレーム内のピッチ
周期とピッチ予測係数とをめるためのピッチ分析手段と
、前記ピッチ周期が予じめ設定きれた範囲内であり、且
つ、ピッチ予測係数が予じめ設定さnた値を超える場合
のみにピッチ周期とピッチ予測係数とを合成側へ伝送し
、他の場合には前記場合に於いてピッチ周期とピッチ予
測係数とに割当てたビットをマルチパルス符号化ビット
として利用して伝送し更にピッチ周期とピッチ予測係数
とを伝送するか否かを合成側へ知らしめる符号を合成9
へ伝送する符号化制御手段とを分析側に有し、前記符号
化制御手段と対応する復号化制御手段とピッチ合成器と
を合成側に有すること1に特徴とするマルチパルス型ボ
コーダ。 (り 特許請求の範囲第(1)項記載のマルチパルス型
ボコーダに於いて、前記符号化制御手段はピッチ周期又
はピッチ予測係数に割当てら几たビットのどちらかの構
成ビットの全部又は一部を特定の符号に設定することに
より、ピッチ周期とピッチ予測係数とを伝送するか否か
全合成側へ知らしめる手段であることを特徴とするマル
チパルス型ボコーダ。
(1) Input audio signal is analyzed by LPC (Li
near Prediction Coefficie
nt, linear prediction coefficient) is analyzed and extracted as spectral envelope information, and together with this spectral envelope information, sound source information constituting the audio information of the input audio signal is analyzed, and the generation time corresponding to the characteristics of this sound source information is determined for each analysis frame. In a multi-pulse vocoder that analyzes and synthesizes the input audio signal by expressing it using a plurality of predetermined impulse sequences (multipulses) having positions and amplitudes, an analysis frame of the input audio signal is used. a pitch analysis means for determining a pitch period and a pitch prediction coefficient; and the pitch period is within a preset range, and the pitch prediction coefficient exceeds a preset value. In this case, the pitch period and pitch prediction coefficient are transmitted to the synthesis side, and in other cases, the bits assigned to the pitch period and pitch prediction coefficient in the above case are transmitted using as multipulse encoded bits. Furthermore, a code that informs the synthesis side whether or not to transmit the pitch period and the pitch prediction coefficient is synthesized 9.
1. A multi-pulse vocoder characterized in that the analysis side has a coding control means for transmitting data to the coding control means, and the synthesis side has a decoding control means corresponding to the coding control means and a pitch synthesizer on the synthesis side. In the multi-pulse vocoder according to claim (1), the encoding control means controls all or part of the constituent bits of either the pitch period or the bits allocated to the pitch prediction coefficient. A multi-pulse vocoder characterized in that it is a means for notifying a total synthesis side whether or not to transmit a pitch period and a pitch prediction coefficient by setting the pitch period and pitch prediction coefficient to a specific code.
JP59094040A 1984-05-11 1984-05-11 Multipulse type vocoder Granted JPS60237500A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59094040A JPS60237500A (en) 1984-05-11 1984-05-11 Multipulse type vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59094040A JPS60237500A (en) 1984-05-11 1984-05-11 Multipulse type vocoder

Publications (2)

Publication Number Publication Date
JPS60237500A true JPS60237500A (en) 1985-11-26
JPH0411040B2 JPH0411040B2 (en) 1992-02-27

Family

ID=14099451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59094040A Granted JPS60237500A (en) 1984-05-11 1984-05-11 Multipulse type vocoder

Country Status (1)

Country Link
JP (1) JPS60237500A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01187597A (en) * 1988-01-21 1989-07-26 Nec Corp Voice encoding system
JPH02165200A (en) * 1988-12-20 1990-06-26 Matsushita Electric Ind Co Ltd Encoding/decoding device
US5274741A (en) * 1989-04-28 1993-12-28 Fujitsu Limited Speech coding apparatus for separately processing divided signal vectors
US5352917A (en) * 1990-07-04 1994-10-04 Tadahiro Ohmi Electronic device provided with metal fluoride film

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01187597A (en) * 1988-01-21 1989-07-26 Nec Corp Voice encoding system
JPH02165200A (en) * 1988-12-20 1990-06-26 Matsushita Electric Ind Co Ltd Encoding/decoding device
US5274741A (en) * 1989-04-28 1993-12-28 Fujitsu Limited Speech coding apparatus for separately processing divided signal vectors
US5352917A (en) * 1990-07-04 1994-10-04 Tadahiro Ohmi Electronic device provided with metal fluoride film

Also Published As

Publication number Publication date
JPH0411040B2 (en) 1992-02-27

Similar Documents

Publication Publication Date Title
JPS6046440B2 (en) Audio processing method and device
JPH0668680B2 (en) Improved multi-pulse linear predictive coding speech processor
JPH0439679B2 (en)
JP2586043B2 (en) Multi-pulse encoder
JPS60237500A (en) Multipulse type vocoder
JP3166673B2 (en) Vocoder encoding / decoding device
JPS6162100A (en) Multipulse type encoder/decoder
JP3063087B2 (en) Audio encoding / decoding device, audio encoding device, and audio decoding device
JP3006790B2 (en) Voice encoding / decoding method and apparatus
JPH043876B2 (en)
JPS6087400A (en) Multipulse type voice code encoder
JP2581050B2 (en) Voice analysis and synthesis device
JP2853126B2 (en) Multi-pulse encoder
JPH043560B2 (en)
JP2639118B2 (en) Multi-pulse speech codec
JP2754558B2 (en) Multi-pulse quantization method for multi-pulse encoder
JPS5915299A (en) Voice analyzer
JPS61128299A (en) Voice analysis/analytic synthesization system
JPH0242239B2 (en)
JPS60102699A (en) Voice analyzer/synthesizer
JPH01314300A (en) Voice coding and decoding system and device thereof
JPS62215300A (en) Multipulse type vocoder
JPH0438360B2 (en)
JPH10105200A (en) Voice coding/decoding method
JPH0291697A (en) System and device for encoding and decoding sound