JPH0738117B2 - Multi-pulse encoder - Google Patents
Multi-pulse encoderInfo
- Publication number
- JPH0738117B2 JPH0738117B2 JP62013582A JP1358287A JPH0738117B2 JP H0738117 B2 JPH0738117 B2 JP H0738117B2 JP 62013582 A JP62013582 A JP 62013582A JP 1358287 A JP1358287 A JP 1358287A JP H0738117 B2 JPH0738117 B2 JP H0738117B2
- Authority
- JP
- Japan
- Prior art keywords
- pulse
- pitch
- waveform
- pitch prediction
- adder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明はマルチパルス符号化装置に関し、特にピッチ予
測ループを含んで最適マルチパルス列の決定を行なうマ
ルチパルス符号化装置において、再生すべき音声信号に
対する量子化雑音の影響の大幅な低減を図ったマルチパ
ルス符号化装置に関する。Description: TECHNICAL FIELD The present invention relates to a multi-pulse coding device, and more particularly to a speech signal to be reproduced in a multi-pulse coding device including a pitch prediction loop to determine an optimum multi-pulse train. The present invention relates to a multi-pulse encoding device that significantly reduces the influence of quantization noise on the.
ピッチ予測ループを含んで分析側を構成し、ピッチ予測
利得を期待して入力音声電力Sと再生音声量子化ノイズ
Nとの比S/Nの改善を図るマルチパルス符号化装置はよ
く知られつつある。It is well known that a multi-pulse coding apparatus that includes a pitch prediction loop and configures the analysis side to improve the ratio S / N between the input speech power S and the reproduced speech quantization noise N by expecting the pitch prediction gain. is there.
従来のこの種のピッチ予測ループを利用するマルチパル
ス符号化装置におけるピッチ予測方法は次の3種類に大
別される。Pitch prediction methods in a conventional multi-pulse coding apparatus using this type of pitch prediction loop are roughly classified into the following three types.
(1)ピッチ予測系とマルチパルス処理系とを互いに独
立的に取扱うピッチ予測方法。(1) A pitch prediction method in which a pitch prediction system and a multi-pulse processing system are handled independently of each other.
(2)スペクトル包絡パラメータ分析のための近接予測
系とピッチ予測系とを縦続接続形式として構成するピッ
チ予測方法。(2) A pitch prediction method in which a proximity prediction system and a pitch prediction system for spectrum envelope parameter analysis are configured in a cascade connection form.
(3)ピッチ予測ループ内にマルチパルス符号化系を挿
入する形式のピッチ予測方法。(3) A pitch prediction method in which a multi-pulse coding system is inserted in the pitch prediction loop.
ここで、先ずピッチ予測の原理について説明する。Here, the principle of pitch prediction will be described first.
第7図はピッチ予測器の一般的構成を示すブロック図で
ある。FIG. 7 is a block diagram showing a general structure of the pitch predictor.
ピッチ予測器は一種のディジタルフィルタとして構成さ
れ、基本的には入力と極力類似する出力を得べきフィル
タ係数、第7図の場合はβ1〜β3を音声入力を受けるご
とにディジタルフィルタに提供しつつフォワード(forw
ard)的に最適予測信号としての音声出力を得るもので
ある。ピッチ予測係数自体の算出法については後で詳細
に説明する。The pitch predictor is configured as a kind of digital filter, and basically provides filter coefficients that should obtain an output as similar as possible to the input, β 1 to β 3 in the case of FIG. 7, to the digital filter each time a voice input is received. While forward (forw
ard) to obtain a voice output as an optimum prediction signal. The method of calculating the pitch prediction coefficient itself will be described in detail later.
入力としては、音声信号でもあるいは声帯振動波形とし
ての音源でもいずれでも成立する。また全体としては第
7図に示す如く、ピッチ周期ポイントを中心とし前後1
周期ずつ離れた2ポイントを含むフィルタを決定する条
件で実用上ほぼ満足すべき最適予測信号を確保しうるこ
とも多くの実験結果等から明らかになっている。The input is either a voice signal or a sound source as a vocal cord vibration waveform. Also, as a whole, as shown in FIG.
It has also been clarified from many experimental results that it is possible to secure an optimum predicted signal which is practically almost satisfactory under the condition of determining a filter including two points separated by a period.
ひとつ前のフレーム分析情報から得たピッチ周期TPにも
とづいて可変遅延回路55は入力に対してTP−1周期の遅
延を付与し、この結果単位遅延素子56−1および56−2
の出力点の時間情報はそれぞれTPおよびTP+1週期の時
間状態保持される。これら3ポイントの出力はそれぞれ
乗算器57−1〜57−3によってβ1〜β3との乗算後加算
器58で加算して出力されるが、こうして出力される音声
出力が音声入力に対する3点予測形式の予測出力であ
る。次にこのようなピッチ予測器を利用して行なう前述
したピッチ予測の3種類の方法について述べる。The variable delay circuit 55 gives a delay of T P −1 period to the input based on the pitch period T P obtained from the previous frame analysis information, and as a result, the unit delay elements 56-1 and 56-2 are provided.
The output point time information is retention time status of each T P and T P +1 week period. The outputs of these three points are added by the adders 58 after being multiplied by β 1 to β 3 by the multipliers 57-1 to 57-3, respectively, and output. It is a prediction output in the prediction format. Next, three types of the above-described pitch prediction methods performed by using such a pitch predictor will be described.
第4図はピッチ予測系とマルチパルス処理系が互いに独
立したマルチパルス符号復号系を示すブロック図であ
る。FIG. 4 is a block diagram showing a multi-pulse code decoding system in which the pitch prediction system and the multi-pulse processing system are independent of each other.
分析側のピッチ予測器34の出力は加算器35で音声入力か
ら減算されてピッチ予測残差としてマルチパルス符号化
器36に供給される。The output of the pitch predictor 34 on the analysis side is subtracted from the speech input by the adder 35 and supplied to the multi-pulse encoder 36 as the pitch prediction residual.
マルチパルス符号化器36は、入力したピッチ予測残差に
もとづいてマルチパルスの検索、符号化を行ない合析側
のマルチパルス復号化器37に供給する。マルチパルス復
号化器37は入力を復号化してマルチパルス列を復元した
のち加算器38に供給する。加算器38にはピッチ予測器39
の出力する予測波形も供給され、加算器38の出力にもと
づいてピッチ予測器39で発生する予測波形が次次に累
加、出力される形式で音声出力が得られる。The multi-pulse encoder 36 searches for and encodes multi-pulses based on the input pitch prediction residual, and supplies them to the multi-pulse decoder 37 on the analysis side. The multi-pulse decoder 37 decodes the input to restore the multi-pulse train, and then supplies it to the adder 38. The adder 38 has a pitch predictor 39
Is also supplied, and a speech output is obtained in a format in which the predicted waveform generated by the pitch predictor 39 is successively added and output based on the output of the adder 38.
第5図はピッチ予測系を近接予測系に縦続接続したマル
チパルス符号復号系を示すブロック図である。分析側と
合成側にはそれぞれピッチ予測器41と45が近接予測フィ
ルタ42と46に縦続接続する形式で配置される。近接予測
フィルタ42,46は、ピッチ検索に比して十分に接近した
数サンプル間におけるLPC(Linear Prediction Codin
g、線形予測符号化)係数をピッチ予測器41,45から提供
される予測波形を対象として所定の分析フレームごとに
抽出する。加算器43は近接予測フィルタ42の出力と音声
入力との近接予測誤差をとりこれを誤差分析器44に供給
する。誤差分析器44は入力のスペクトルならびに電力レ
ベルを分析しつつその情報をマルチパルス符号化器40に
提供、マルチパルス符号化器40はこうして提供される近
接予測誤差波形のスペクトルのホワイトノイズ化ならび
に電力の最小化が得られるマルチパルスの検索符号化を
行ないこれをピッチ予測器41,45に音源情報として提供
し、近接予測フィルタ46からは音声出力が得られる。FIG. 5 is a block diagram showing a multi-pulse code decoding system in which the pitch prediction system is cascade-connected to the proximity prediction system. Pitch predictors 41 and 45 are respectively arranged on the analysis side and the synthesis side in a form of cascade connection to the proximity prediction filters 42 and 46. The proximity prediction filters 42 and 46 are used for LPC (Linear Prediction Codin) between several samples that are sufficiently close to each other compared to pitch search.
g, linear predictive coding) coefficient is extracted for each predetermined analysis frame for the predicted waveform provided from the pitch predictors 41 and 45. The adder 43 takes the proximity prediction error between the output of the proximity prediction filter 42 and the voice input, and supplies this to the error analyzer 44. The error analyzer 44 provides input to the multi-pulse encoder 40 while analyzing the input spectral and power levels, which multi-pulse encoder 40 provides white noise and power to the spectrum of the proximity prediction error waveform thus provided. Is obtained and provided as pitch source information to the pitch predictors 41 and 45, and a speech output is obtained from the proximity prediction filter 46.
第6図はピッチ予測ループ内にマルチパルス符号化系を
挿入したマルチパルス符号復号系を示すブロック図であ
る。この場合のピッチ予測方法は、分析側のピッチ予測
ループ内にマルチパルス符号化処理部分が含まれ、符号
化器を介して発生する量子化ノイズの再生音声に対する
影響が分析系全体としてのネガティブフィードバックル
ープの働きで緩和されたことを期待するものである。FIG. 6 is a block diagram showing a multi-pulse code decoding system in which a multi-pulse coding system is inserted in the pitch prediction loop. The pitch prediction method in this case includes a multi-pulse coding processing part in the pitch prediction loop on the analysis side, and the influence of the quantization noise generated via the encoder on the reproduced voice is negative feedback of the entire analysis system. It is hoped that it was alleviated by the action of the loop.
第6図で、音声入力をx、また加算器47にピッチ予測器
51から供給される予測波形yで表わすものとする。In FIG. 6, the voice input is x, and the adder 47 is a pitch predictor.
It is represented by the predicted waveform y supplied from 51.
マルチパルス符号化器48の入力はx−yであり、マルチ
パルス符号化器48とマルチパルス復号化器49はx−yに
対してマルチパルスの検索符号化ならびに復号化を実施
し、マルチパルス復号化器49からは出力−が出力さ
れる。分析側に含まれるマルチパルス復号化器49の存在
理由は合成側と量子化ノイズに対する条件の均等化を図
るものである。The input of the multi-pulse encoder 48 is x-y, and the multi-pulse encoder 48 and the multi-pulse decoder 49 perform multi-pulse search coding and decoding on x-y to obtain the multi-pulse. The output − is output from the decoder 49. The reason for the existence of the multi-pulse decoder 49 included in the analysis side is to equalize the conditions for the synthesis side and the quantization noise.
さて、−は加算器50に供給され、この結果、ピッチ
予測器51には+y−の入力が提供される。上述した
−は符号化および復号化における量子化ノイズを含
むx−yであり、ピッチ予測器51はy−がに比して
十分小さいため近似的にはをもととして予測波形yを
得る内容のピッチ予測を実施しこれを加算器47,50に供
給する。Now, the-is fed to the adder 50, which results in the pitch estimator 51 being provided with a + y- input. The above-is xy which includes the quantization noise in the encoding and decoding, and the pitch predictor 51 obtains the predicted waveform y based on approximately since y- is sufficiently smaller than Pitch prediction is performed and this is supplied to the adders 47 and 50.
x−yは明らかにピッチ予測残差であり、このピッチ予
測残差はマルチパルス符号化、復号化系に対するネガテ
ィブフィードバックループの効果でそのS/N比が改善さ
れる。xy is obviously the pitch prediction residual, and the pitch prediction residual is improved in its S / N ratio due to the effect of the negative feedback loop for the multi-pulse coding / decoding system.
合成側は、マルチパルス復号化器52で−を復元し、
これとピッチ予測器54から得るyとを加算器53で加算、
+y−を出力する。これは近似的にほぼに等し
く、ネガティブフィードバックループで改善されたS/N
の量子化ノイズを含む音声入力xである。On the combining side, the multi-pulse decoder 52 restores −,
This and y obtained from the pitch predictor 54 are added by the adder 53,
Outputs + y-. This is approximately equal to and the improved S / N with the negative feedback loop.
Is an audio input x containing the quantization noise of.
従来のピッチ予測手法としては、前述した、第6図に
示す内容がネガティブフィードバック(以下単にフィー
ドバックと呼ぶ)の効能で符号化器、復号化器における
量子化雑音の影響が原理的に緩和されるという期待のも
とに主流となっている。As a conventional pitch prediction method, the effect of the quantization noise in the encoder and decoder is theoretically mitigated by the effect of the negative feedback (hereinafter simply referred to as "feedback") shown in FIG. It has become the mainstream with the expectation that.
上述した従来のピッチ予測ループを含むマルチパルス符
号化装置は、マルチパルス決定の過程でフィードバック
ループとは独立的にマルチパルスが決定されている。こ
のことは、たとえばピッチ予測ループを含む多くのAPC
(Adaptive Predictive Ccding、適応予測符号化)方式
等でも見られる如く、マルチパルス検索する場合は、入
力音声を数10mSECごとに切出しつつ数10mSECの分析フレ
ーム単位でブロック処理し、一方、ピッチ予測は、ひと
つのピッチから1つ先に存在すべきピッチをいわゆるフ
ォワード的に予測する。従って、マルチパルスに対する
ピッチ予測フィードバックループの量子化雑音改善効果
は実効上全く消減してしまうという欠点がある。In the multi-pulse coding apparatus including the conventional pitch prediction loop described above, the multi-pulse is determined independently of the feedback loop in the process of determining the multi-pulse. This is true for many APCs, including pitch prediction loops, for example.
As can be seen in (Adaptive Predictive Ccding) method, etc., when performing multi-pulse search, block processing is performed in units of tens of msec of analysis frames while extracting input speech every tens of msec, while pitch prediction is A pitch that should be one ahead of one pitch is predicted in a so-called forward manner. Therefore, there is a drawback in that the effect of improving the quantization noise of the pitch prediction feedback loop for multi-pulses is practically eliminated.
本発明の目的は上述した欠点を除去し、ピッチ予測系の
フィードバックループによるS/N改善効果の影響を確実
に保証しうるマルチパルス符号化装置を提供することに
ある。An object of the present invention is to eliminate the above-mentioned drawbacks and to provide a multi-pulse encoding device which can surely guarantee the influence of the S / N improvement effect by the feedback loop of the pitch prediction system.
本発明の装置は、ピッチ予測ループを有するマルチパル
ス符号化装置において、あらかじめ予備的に必要数より
も多く設定より成るマルチパルス列を予備的に仮決定し
たのちこの仮決定マルチパルス列を対象としてピッチ予
測を行ないつつ必要数のパルスから成る最適マルチパル
ス列をパルス振幅量子化レベルとともに本決定する手段
を備えて構成される。The apparatus of the present invention is, in a multi-pulse encoding apparatus having a pitch prediction loop, preliminarily preliminary tentatively deciding a multi-pulse train consisting of settings larger than a necessary number, and then performing pitch prediction on the tentatively decided multi-pulse train The optimum multi-pulse train consisting of the required number of pulses is determined along with the pulse amplitude quantization level.
次に図面を参照して本発明を詳細に説明する。 The present invention will now be described in detail with reference to the drawings.
第1図は本発明のマルチパルス符号化装置の分析側の一
実施例を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of the analysis side of the multi-pulse coding apparatus of the present invention.
第1図に示す実施例の構成は、H′(Z)/H(Z)変換
器1、LPC分析器2、K量子化/復号化器3、K/α変換
器4、減衰係数算出器5、ピッチ予測器6、ピッチ予測
係数算出器7、メモリ8、加算器9、メモリ10、量子化
/復号化器11、マルチパルス予備分析器12、パルス振幅
量子化器13、メモリ14、DP(Dynamic Programing、動的
計画法)プロセッサ5、加算器16、LPC合成フィルタ1
7、加算器18、誤差電力算出器19、加算器20、ピッチ予
測器21ならびに多量化器22等を有して構成される。The configuration of the embodiment shown in FIG. 1 has an H '(Z) / H (Z) converter 1, an LPC analyzer 2, a K quantizer / decoder 3, a K / α converter 4, and an attenuation coefficient calculator. 5, pitch predictor 6, pitch prediction coefficient calculator 7, memory 8, adder 9, memory 10, quantizer / decoder 11, multi-pulse preliminary analyzer 12, pulse amplitude quantizer 13, memory 14, DP (Dynamic Programming) Processor 5, adder 16, LPC synthesis filter 1
7, an adder 18, an error power calculator 19, an adder 20, a pitch predictor 21, a multiplicator 22 and the like.
H′(Z)/H(Z)変換器1は、いわゆる聴感重み付け
フィルタであり、K/α変換器4から受けるαパラメータ
をフィルタ係数とする伝達関数H(Z)のフィルタを、
フィルタに変換し、音声入力をこれに通して前処理とし
てのノイズシエーピング(noise shaping)を行なうも
のである。ここにγは減衰係数であり、0<γ<1の範
囲に設定され、減衰係数算出器5からγαの形で提供さ
れる。このノイズシエーピングは量子化雑音をフィード
バックすることにとり量子化雑音のスペクトルを音声信
号のスペクトルに近くなるように処理し、マスキング効
果による聴覚上の雑音低減を行なうものである。つま
り、このγαによって形成されるフィルタの特性は音声
入力のスペクトル包絡に相似で、入力する音声信号の量
子化雑音スペクトルを音声信号のスペクトル包絡に近似
せしめて有色化を図り、人間の聴覚特性による実効的雑
音低減を図るものである。The H ′ (Z) / H (Z) converter 1 is a so-called perceptual weighting filter, and is a filter of a transfer function H (Z) having a filter coefficient of the α parameter received from the K / α converter 4.
It is converted into a filter, and a voice input is passed through the filter to perform noise shaping as preprocessing. Here, γ is an attenuation coefficient, which is set in the range of 0 <γ <1 and is provided from the attenuation coefficient calculator 5 in the form of γα. In this noise shaping, the quantization noise is fed back to process the spectrum of the quantization noise so as to be close to the spectrum of the voice signal, and the auditory noise is reduced by the masking effect. In other words, the characteristics of the filter formed by γα are similar to the spectral envelope of the voice input, and the quantization noise spectrum of the input voice signal is approximated to the spectrum envelope of the voice signal to achieve colorization, which depends on the human auditory characteristics. It is intended to effectively reduce noise.
H′(Z)/H(Z)変換器1による聴感重み付けフィル
タの伝達関数は次の(1)式のW(Z)で示される。The transfer function of the perceptual weighting filter by the H '(Z) / H (Z) converter 1 is represented by W (Z) in the following equation (1).
(1)式でPは分析次数である。 In equation (1), P is the analysis order.
さて、LPC分析器2は音声入力を所定の分析フレームご
とにLPC分析しP次のKパラメータをLPC係数として出力
しこれをK量子化/復号化器3に供給する。Now, the LPC analyzer 2 performs LPC analysis on the speech input for each predetermined analysis frame, outputs a P-order K parameter as an LPC coefficient, and supplies this to the K quantizer / decoder 3.
K量子化/復号化器3は、入力したKパラメータを量子
化したのち再び復号化してK/α変換器4に供給する。K
量子化/復号化器3におけるこのような処理は、分析側
における量子化誤差発生の条件を合成側とほぼ同一の状
態に設定することを目的として行なわれる。The K quantizer / decoder 3 quantizes the input K parameter, decodes it again, and supplies it to the K / α converter 4. K
Such processing in the quantizer / decoder 3 is performed for the purpose of setting the condition of the quantization error generation on the analysis side to be substantially the same as that on the synthesis side.
K/α変換器4はP次のKパラメータをK次のαパラメー
タに変換し減衰係数算出器5ならびにH′(Z)/H
(Z)変換器1に提供する。The K / α converter 4 converts the P-th order K parameter into the K-th order α parameter, and the attenuation coefficient calculator 5 and H ′ (Z) / H.
(Z) Provide to the converter 1.
減衰係数算出器5から出力されるγαはマルチパルス予
備分析器12、およびLPC合成フィルタ17にも供給され
る。The γα output from the attenuation coefficient calculator 5 is also supplied to the multi-pulse preliminary analyzer 12 and the LPC synthesis filter 17.
γαは音声入力のLPC係数を分析フレームごとに求めた
P次のαパラメータに聴音重み付け処理における減衰係
数γ(0<γ<1)を乗じただけのもので、基本的には
LPC係数と同じものである。マルチパルス予備分析器12
は、このγαの形で受けるLPC係数を利用し公知の処理
手法、本実施例では相関領域処理を利用し分析フレーム
ごとにマルチパルス列を検索する。γα is obtained by multiplying the P-order α parameter obtained for each analysis frame of the LPC coefficient of the voice input by the attenuation coefficient γ (0 <γ <1) in the perceptual sound weighting process.
It is the same as the LPC coefficient. Multi-pulse preliminary analyzer 12
Is a known processing method using the LPC coefficient received in the form of γα, and in this embodiment, the correlation region processing is used to search the multi-pulse train for each analysis frame.
第8図は相関領域処理によるマルチパルス検索の基本的
ブロック図であり、マルチパルス予備分析器12も第8図
の処理内容でマルチパルス列を検索する。FIG. 8 is a basic block diagram of the multi-pulse search by the correlation region processing, and the multi-pulse preliminary analyzer 12 also searches the multi-pulse train with the processing contents of FIG.
いま、K個のマルチパルスによって合成された合成信号
と音声入力の差をεとすると、εは次の(2)式で示さ
れる。Now, letting ε be the difference between the synthesized signal synthesized by K multi-pulses and the voice input, ε is expressed by the following equation (2).
(2)式でNは分析フレーム長、gi,miはそれぞれ分析
フレーム内のi番目のパルスの振幅ならびに位置を示
す。εを最小とするパルスの振幅ならびに位置は(2)
式をgiについて偏微分して零とおくことによって得られ
る次の(3)式を最大にするものとして決定される。 In the equation (2), N is the analysis frame length, and gi and mi are the amplitude and position of the i-th pulse in the analysis frame, respectively. The pulse amplitude and position that minimize ε are (2)
It is determined as maximizing the following expression (3) obtained by partially differentiating the expression with respect to gi and setting it to zero.
(3)式において、Rhhは音声合成フィルタのインパル
ス応答の自己相関係数、hsは音声入力波形と前記イン
パルス応答との相互相関係数である。この(3)式の示
す内容は、時間位置miにパルスをたてる場合には振幅と
してgi(mi)が最適であるということである。また、gi
(mi)を求めるには、マルチパルスとしてのパルスが決
定されるごとに(3)式の右辺分子の演算を行ないつつ
hs(mi)の補正を行ない、そのあと遅れ時間零におけ
る自己相関係数Rhh(0)で正規化したうえその絶対値
の最大なものを検索する形式で次次に求める。この処理
において、相互相関係数の補正値としての(3)式分子
の第2項は、直前に検索された最大値の振幅glと時間位
置情報me、最大値からの遅れ時間|me−mi|における自己
相関係数Rhh(|me−mi|)、検索すべきマルチパルスの
分析フレーム内の位置情報等にもとづいて求められる。 In the equation (3), Rhh is an autocorrelation coefficient of the impulse response of the voice synthesis filter, and hs is a cross-correlation coefficient of the voice input waveform and the impulse response. The content of the equation (3) is that gi (mi) is optimum as the amplitude when a pulse is generated at the time position mi. Also, gi
To obtain (mi), the numerator on the right side of equation (3) is calculated each time a pulse as a multi-pulse is determined.
The value of hs (mi) is corrected and then normalized by the autocorrelation coefficient Rhh (0) at the delay time of zero, and the maximum absolute value is searched for next. In this process, the second term of the numerator of the equation (3) as the correction value of the cross-correlation coefficient is the amplitude gl of the maximum value and the time position information me retrieved immediately before, and the delay time from the maximum value | me-mi. It is obtained based on the autocorrelation coefficient Rhh (| me-mi |) at |, the position information in the analysis frame of the multipulse to be searched, and the like.
第8図のインパルス応答算出器59はγαを入力してイン
パルス応答を求め、自己相関係数算出器60はその自己相
関係数を算出する。また、相互相関係数算出器61は入力
波形と前記インパルス応答との相互相関係数を算出す
る。The impulse response calculator 59 in FIG. 8 inputs γα to obtain an impulse response, and the autocorrelation coefficient calculator 60 calculates the autocorrelation coefficient. Further, the cross-correlation coefficient calculator 61 calculates the cross-correlation coefficient between the input waveform and the impulse response.
マルチパルス検索器62は、これらデータを利用し(3)
式にもとづき分析フレームごとのマルチパルス列を仮決
定する。なお、こうして仮決定されるマルチパルスの数
は後述するDP処理のため必要数よりも多く設定される。The multi-pulse searcher 62 uses these data (3)
The multi-pulse train for each analysis frame is provisionally determined based on the formula. Note that the number of multi-pulses provisionally determined in this way is set to be larger than the necessary number for the DP processing described later.
ふたたび第1図に戻って実施例の説明を続行する。マル
チパルス予備分析器12は、LPC係数としてのγα、また
入力波形としては加算器9から出力されるピッチ予測残
差波形を利用してマルチパルス列を分析フレームごとに
検索しこれをパルス振幅量子化器13に供給する。Returning to FIG. 1 again, the description of the embodiment will be continued. The multi-pulse pre-analyzer 12 retrieves a multi-pulse train for each analysis frame by using γα as the LPC coefficient and the pitch prediction residual waveform output from the adder 9 as the input waveform, and pulse amplitude quantization Supply to the vessel 13.
ピッチ予測器6は、H′(Z)/H(Z)変換器1から出
力される聴音重み付け後の音声信号と、量子化/復号化
器11から提供される復号化ピッチ予測係数とを入力しつ
つ予測波形を発生しこれを加算器9に出力する。これに
より、加算器9からはピッチ予測残差波形がマルチパル
ス予備分析器12に供給され、またメモリ10にも格納され
る。The pitch predictor 6 inputs the speech signal after the weighting of the hearing sound output from the H ′ (Z) / H (Z) converter 1 and the decoded pitch prediction coefficient provided from the quantizer / decoder 11. While generating the predicted waveform, the predicted waveform is output to the adder 9. As a result, the pitch prediction residual waveform is supplied from the adder 9 to the multi-pulse preliminary analyzer 12 and also stored in the memory 10.
ピッチ予測係数算出器7はピッチ予測に必要なピッチ予
測係数を算出する。このピッチ予測係数は、第7図で説
明したように、ピッチ予測フィルタのフィルタ係数とす
べきβ1〜β3で通常は3個が決定される。The pitch prediction coefficient calculator 7 calculates a pitch prediction coefficient necessary for pitch prediction. As described with reference to FIG. 7, three pitch prediction coefficients are usually determined by β 1 to β 3 which are filter coefficients of the pitch prediction filter.
ピッチ予測係数の算出は次の如き算出根にもとづいて行
なわれる。The pitch prediction coefficient is calculated on the basis of the following calculation roots.
いま、ピッチ周期に最も近い整数を仮りにQとすると次
の(4)式が成立する。Now, assuming that the integer closest to the pitch period is Q, the following expression (4) is established.
ei+Q+Si+Q=β1Si+1+β2Si+β3Si-1 ……(4) (4)式において、ei+Qはサンプル時間i+Qの位置に
おけるピッチ予測残差波形、Si+Qはピッチ予測値、にも
とづく波形Si+1〜Si-1はi+1,i,i−1の位置における
原音声波形、β1+β3はこれら原音声波形に対するピッ
チ予測係数である。つまり、(4)式は予測波形と原波
形に対する予測値との関係を示すものである。e i + Q + S i + Q = β 1 S i + 1 + β 2 S i + β 3 S i-1 (4) In formula (4), e i + Q is the pitch prediction residual at the position of sample time i + Q. Difference waveform, S i + Q is a pitch prediction value, waveforms based on S i + 1 to S i-1 are original speech waveforms at positions i + 1, i, i−1, β 1 + β 3 are pitches with respect to these original speech waveforms It is a prediction coefficient. That is, the equation (4) shows the relationship between the predicted waveform and the predicted value for the original waveform.
(4)式にもとづき原波形と予測されるべき波形とのβ
1〜β3を介しての3ポイント対応を考慮し次の(4)〜
(6)式が成立する。Β between the original waveform and the waveform to be predicted based on equation (4)
Considering the correspondence of 3 points via 1 ~ β 3 , the following (4) ~
Formula (6) is materialized.
ei+Q・Si+1+Si+Q・Si=β1Si+1・Si+1+β2Si・Si+1+
β3Si-1・Si+1 ……(4) ei+Q・Si+Si+Q・Si=β1Si+1・Si+β2Si・Si+β3S
i-1・Si ……(5) ei+Q・Si-1+Si+Q・Si-1=β1Si+1・Si-1+β2Si-1・S
i-1+β3Si-1・Si-1 ……(6) 原音声波形が定常性を有するものと仮定し、さらにピッ
チ予測残差と原音声波形とが無相関であると仮定する。
この仮定は音声処理上、実用的には殆んど問題のない仮
定である。e i + Q・ S i + 1 + S i + Q・ S i = β 1 S i + 1・ S i + 1 + β 2 S i・ S i + 1 +
β 3 S i-1・ S i + 1 (4) e i + Q・ S i + S i + Q・ S i = β 1 S i + 1・ S i + β 2 S i・ S i + β 3 S
i-1・ S i …… (5) e i + Q・ S i-1 + S i + Q・ S i-1 = β 1 S i + 1・ S i-1 + β 2 S i-1・ S
i-1 + β 3 S i-1 · S i-1 (6) It is assumed that the original speech waveform has stationarity, and that the pitch prediction residual and the original speech waveform are uncorrelated. .
This assumption is an assumption that has practically no problem in speech processing.
ところで(4),(5)および(6)式は、原音声波形
と、3個のピッチ予測係数β1,β2およびβ3を介して
再生されるべき波形との間の関係式を示すもので、両波
形間で対応すべき時間における波形乗算値にもとづく等
式で両波形を関係づけている。求むべき未知数β1,
β2,β3は、これら3つの等式で表現される原音声波形
と再生波形間の電力誤差が最小となるものでなければな
らない。この解は(4),(5)および(6)式の等式
の右辺と左辺との差を零とするようなβ1〜β3の組合せ
を見出すことで求まり、最小自乗法の適用によって容易
に見出しうる。ただし(4),(5),(6)は波形乗
算のベクトル積の形式で表現しているので一旦これらを
音声電力で表現変換し最小自乗法の適用を可能ならしめ
る。By the way, the equations (4), (5) and (6) show the relational expressions between the original speech waveform and the waveform to be reproduced via the three pitch prediction coefficients β 1 , β 2 and β 3. However, the two waveforms are related by an equation based on the waveform multiplication value at the corresponding time between the two waveforms. Unknown β 1 to be obtained ,
β 2 and β 3 must be such that the power error between the original speech waveform represented by these three equations and the reproduced waveform is minimized. This solution is found by finding a combination of β 1 to β 3 that makes the difference between the right side and the left side of the equations (4), (5), and (6) zero, and by applying the method of least squares. Easy to find. However, since (4), (5), and (6) are expressed in the form of vector products of waveform multiplication, they are once converted into expression by voice power and the least square method can be applied.
波形乗算は、この場合自己相関をとることと同様であり
従って(4),(5),(6)式はiについて積分し次
の(7),(8),(9)式に変換しうる。Waveform multiplication is similar to taking autocorrelation in this case. Therefore, equations (4), (5) and (6) are integrated for i and converted into the following equations (7), (8) and (9). sell.
ρQ-1=β1ρ0+β2ρ1+β3ρ2 ……(7) ρQ=β1ρ1+β2ρ0+β3ρ1 ……(8) ρQ+1=β1ρ2+β2ρ1+β3ρ0 ……(9) (7),(8)および(9)式において、ρQ-1,ρQ,
ρQ+1はそれぞれQ−1,QおよびQ+1に再生されるべき
波形の自己相関係数、ρ0,ρ1,ρ2はそれぞれi+1,
i,i−1における原音声波形の自己相関係数である。ρ Q-1 = β 1 ρ 0 + β 2 ρ 1 + β 3 ρ 2 …… (7) ρ Q = β 1 ρ 1 + β 2 ρ 0 + β 3 ρ 1 …… (8) ρ Q + 1 = β 1 ρ 2 + β 2 ρ 1 + β 3 ρ 0 (9) In equations (7), (8) and (9), ρ Q-1 , ρQ,
ρ Q + 1 is the autocorrelation coefficient of the waveform to be reproduced on Q-1, Q and Q + 1, respectively, and ρ 0 , ρ 1 , and ρ 2 are i + 1,
It is an autocorrelation coefficient of the original speech waveform at i, i-1.
(7),(8)および(9)式から次の(10)式が得ら
れ、β1〜β3は容易に求められる。The following equation (10) is obtained from equations (7), (8) and (9), and β 1 to β 3 can be easily obtained.
ピッチ予測係数分析器7は、入力する聴音重み付け音声
信号を利用し、その自己相関係数を求めつつ(10)式に
もとづきピッチ予測係数β1〜β3を算出し、これを量子
化/復号化器11に供給する。 The pitch prediction coefficient analyzer 7 uses the input weighted speech signal, calculates the pitch correlation coefficients β 1 to β 3 based on the equation (10) while obtaining the autocorrelation coefficient, and quantizes / decodes the pitch prediction coefficients β 1 to β 3. Supply to the chemicalizer 11.
量子化/復号化器11は、β1〜β3を符号化して多重化器
22に供給するとともに、これを復号化してピッチ予測器
6,21に供給する。この符号化/復号化は合成側と量子化
誤差の条件を同一とするために行なわれる。The quantizer / decoder 11 encodes β 1 to β 3 and multiplexes them.
22 and decodes it to pitch predictor
Supply to 6,21. This encoding / decoding is performed in order to make the quantization error conditions the same as those on the combining side.
マルチパルス予備分析器12から出力されるマルチパルス
列はパルス振幅量子化器13で振幅を量子化されメモリ14
に格納される。The multi-pulse train output from the multi-pulse preliminary analyzer 12 has its amplitude quantized by the pulse amplitude quantizer 13 and the memory 14
Stored in.
こうしてメモリ8には聴感重み付け音声入力が、メモリ
10にはピッチ予測残差波形が、さらにメモリ14には振幅
量子化マルチパルス列がそれぞれ格納される。In this way, the perceptual weighted voice input is stored in the memory 8.
A pitch prediction residual waveform is stored in 10, and an amplitude quantized multipulse train is stored in the memory 14.
DPプロセッサ15は、これら各メモリに格納された必要デ
ータを利用しつつ、予備的に仮決定された振幅量子化マ
ルチパルス列を構成する分析フレームごとのパルスを利
用してDP手法により最適マルチパルス列を次のようにし
て決定する。The DP processor 15 uses the necessary data stored in each of these memories and uses the pulse for each analysis frame that constitutes the preliminary tentatively determined amplitude-quantized multi-pulse train to obtain the optimum multi-pulse train by the DP method. Determine as follows.
マルチパルス予備分析器12から出力される仮決定マルチ
パルス列のパルス数は、DP手法適用の目的から必要数よ
りも多くなっている。この増数は、たとえば必要数が分
析フレームごとに4ビット16個であるとすると20個程度
に設定される。The number of pulses of the tentatively determined multi-pulse train output from the multi-pulse preliminary analyzer 12 is larger than the required number for the purpose of applying the DP method. For example, if the required number is 16 in 4 bits for each analysis frame, this increase is set to about 20.
DPプロセッサ15によって決定すべき処理は、仮決定した
マルチパルスからの余分のパルスを除去した最適のパル
スを本決定すること、ならびに本決定されたパルスの最
適量子化の決定であり、いずれも原音声波形と再生音声
波形との誤差電力を評価尺度とし、これを最小とするDP
パスを見出す形式で行なわれる。The processing to be determined by the DP processor 15 is to make a final determination of the optimum pulse from which extra pulses have been removed from the tentatively determined multi-pulse, and a determination of the optimum quantization of the finally determined pulse. DP that minimizes the error power between the speech waveform and the reproduced speech waveform
It is done in the form of finding a path.
不要パルスは除去し必要な最適パルスとするDP処理は、
本実施例の場合を例とすると基本的には次のようにして
行なわれる。DP processing that removes unnecessary pulses and makes the optimum pulse necessary
Taking the case of this embodiment as an example, the operation is basically performed as follows.
すなわち、仮決定した分析フレームごとの20個のパルス
のうち本決定の1番目となり得る候補パルスは、仮決定
パルスの1番目から5番目までのパルスからだけ選択可
能である。このことは6番目のパルスを本決定のパルス
とすれば5個を除去してしまうこととなることにもとづ
く。That is, the candidate pulse that can be the first in the final determination among the 20 pulses that are temporarily determined in each analysis frame can be selected only from the first to fifth pulses of the temporary determination pulse. This is based on the fact that if the sixth pulse is used as the final determination pulse, five pulses will be removed.
引続き、本決定の第2番目の候補となり得るパルスは本
決定された第1番目のパルスとなったものを除き、仮決
定した1から6番目のパルスから選択可能である。この
ような組合せで20個のパルスから成る複数の選択可能な
パルス列を選択しつつそれぞれのパルス列ごとに音声信
号を再生し、これら再生音声との誤差電力を最小とする
パルス列を形成するマルチパルスを最適マルチパルス列
として本決定する。従って、選択可能なパルス列に対応
した誤差電力の評価のみで最適マルチパルス列の決定が
可能となり、総当り的組合せ評価に比し決定に要する演
算量が大幅に削減される。Subsequently, the pulse that can be the second candidate for the final determination can be selected from the tentatively determined first to sixth pulses, except for the pulse that is the first pulse for the final determination. With such a combination, a plurality of selectable pulse trains consisting of 20 pulses are selected, an audio signal is reproduced for each pulse train, and a multi-pulse that forms a pulse train that minimizes the error power between these reproduced voices is generated. This is determined as the optimum multi-pulse train. Therefore, the optimum multi-pulse train can be determined only by evaluating the error power corresponding to the selectable pulse train, and the amount of calculation required for the determination can be greatly reduced as compared with the brute force combination evaluation.
一方、最適量子化レベルの決却は基本的には次にように
して行なわれる。On the other hand, the determination of the optimum quantization level is basically performed as follows.
すなわち、20個のパルスに対し一旦仮量子化を施したう
え、この量子化レベルがパルスごとに所定の量子化ステ
ップたとえば+1、および−1低い値を用意し、パルス
ごとにこの3つの量子化レベルのうち最適なレベルを選
択するDP形式で最適量子化レベルを分析フレームごとの
選択可能なマルチパルス列ごとに決定する。この量子化
レベル選択のDP処理も誤差電力を評価尺度として行なわ
れる。That is, 20 pulses are tentatively quantized once, and a predetermined quantization step such as +1 and -1 lower value is prepared for each pulse, and the three quantization values are obtained for each pulse. The optimum quantization level is determined for each selectable multi-pulse train for each analysis frame in the DP format that selects the optimum level among the levels. The DP processing for selecting the quantization level is also performed using the error power as an evaluation measure.
上述した最適パルスの選択、および最適量子化レベルの
決定を行なうDP処理は、時間的に連続した分離処理で
も、また並行処理としてもいずれでも差支えないが、本
実施例では再生音声を配慮し並行処理を行なっている。The above-described DP process for selecting the optimum pulse and determining the optimum quantization level may be either a temporally continuous separation process or a parallel process. It is processing.
このようにして誤差電力を評価尺度とし、最適DPパスを
選択する形式で最適パルスとその量子化レベルの決定を
行なっているが、このDP処理手法については多くの文献
に紹介されており、本実施の場合に類似のDP処理内容
も、たとえば「特願昭59−128730、マルチパルス型符号
化装置」に詳述されている。In this way, the error power is used as the evaluation scale, and the optimum pulse and its quantization level are determined in the form of selecting the optimum DP path.However, this DP processing method has been introduced in many documents. The DP processing contents similar to those in the case of implementation are also described in detail, for example, in Japanese Patent Application No. 59-128730, multi-pulse type encoding device.
DPプロセッサ15は、選択可能なマルチパルス列を分析フ
レームごとに次次にLPC合成フィルタ17の駆動音源とし
て供給し、LPC合成フィルタ17は減衰係数算出器5から
入力するγαをそのフィルタ係数として聴音重み付け音
声を再生して加算器18と20に供給する。DPプロセッサ15
からLPC合成フィルタ17に供給されるマルチパルス列
は、DPプロセッサ15で最適マルチパルス列として本決定
するに必要な最適マルチパルス列候補数であり、これら
それぞれの候補対象について誤差電力の算出が行なわれ
る。このような背景からDP処理ルートは太枠の矢印でこ
れを表現している。なお、LPC合成フィルタ17は全極型
ディジタルフィルタを利用している。The DP processor 15 supplies a selectable multi-pulse train as a driving sound source of the LPC synthesis filter 17 for each analysis frame next, and the LPC synthesis filter 17 uses γα input from the attenuation coefficient calculator 5 as its filter coefficient to weight the sound. The voice is reproduced and supplied to the adders 18 and 20. DP processor 15
The multi-pulse train supplied from LPC synthesis filter 17 to the LPC synthesis filter 17 is the optimum number of candidates for the multi-pulse train necessary for the DP processor 15 to make a final decision as the optimum multi-pulse train, and the error power is calculated for each candidate. From this background, the DP processing route is represented by a thick arrow. The LPC synthesis filter 17 uses an all-pole digital filter.
さて、加算器18は、メモリ10から受けるピッチ予測残差
波形に関するデータとLPC合成フィルタ17から受ける再
生波形に関するデータとの差分をDPパスごとに出力し、
これを誤差電力算出器19に供給する。Now, the adder 18 outputs the difference between the data regarding the pitch prediction residual waveform received from the memory 10 and the data regarding the reproduced waveform received from the LPC synthesis filter 17, for each DP path,
This is supplied to the error power calculator 19.
誤差電力算出器19は、この入力にもとづいて聴音重み付
け音声入力波形との誤差電力を算出しつつDPプロセッサ
15に評価尺度用のデータとして供給する。The error power calculator 19 is a DP processor while calculating the error power with respect to the weighted audio input waveform based on this input.
It is supplied to 15 as data for evaluation scale.
ピッチ予測器21は加算器20とともにピッチ予測フィルタ
を形成し、LPC合成フィルタ17から再生波形を受けつつ
予測波形を発生しこれを加算器16に供給する。The pitch predictor 21 forms a pitch prediction filter together with the adder 20, receives the reproduced waveform from the LPC synthesis filter 17, generates a predicted waveform, and supplies this to the adder 16.
ピッチ予測器21は、前述した第6図の分析側のピッチ予
測器51に対応し、ピッチ予測ループ内で機能しフィード
バック効果によって量子化ノイズを大幅に減少させつつ
加算器20と加算器16に予測波形を提供するものであり、
これを第6図と関連づけてみると、加算器20からピッチ
予測器21に送出されるデータは+y−に対応し、ピ
ッチ予測器21からの出力はyに対応、従って加算器16か
らDPプロセッサ15に対する入力はx−yで表わされるピ
ッチ予測残差波形となる。The pitch predictor 21 corresponds to the pitch predictor 51 on the analysis side in FIG. 6 described above, functions in the pitch prediction loop, and significantly reduces the quantization noise due to the feedback effect, and is added to the adder 20 and the adder 16. Which provides the predicted waveform,
Relating this to FIG. 6, the data sent from the adder 20 to the pitch predictor 21 corresponds to + y-, and the output from the pitch predictor 21 corresponds to y. Therefore, the adder 16 to the DP processor The input to 15 is a pitch prediction residual waveform represented by xy.
DPプロセッサ15に入力するピッチ予測残差波形はこのよ
うなピッチ予測ループのフィードバック効果を受けつつ
常にS/Nの改善が保持される。The pitch prediction residual waveform input to the DP processor 15 is always improved with S / N while receiving the feedback effect of such a pitch prediction loop.
なお、メモリ14は、DPプロセッサ15による量子化レベル
最適DP処理によるマルチパルス振幅値の更新データの格
納用として利用される。The memory 14 is used for storing the update data of the multi-pulse amplitude value by the quantization level optimum DP processing by the DP processor 15.
こうして得られる最適マルチパルスの位置ならびに振幅
情報はDPプロセッサ15から多重化器22に供給される。The optimum multi-pulse position and amplitude information thus obtained are supplied from the DP processor 15 to the multiplexer 22.
多重化器22は、K量子化/復号化器30から提供されるK
パラメータ、量子化/復号化器11から得られるピッチ予
測係数ならびにDPプロセッサ15から提供されるマルチパ
ルスに関するデータを適宜組合せて多重化し伝送路を介
して合成側に送出する。The multiplexer 22 receives the K provided from the K quantizer / decoder 30.
The parameters, the pitch prediction coefficient obtained from the quantizer / decoder 11 and the data related to the multi-pulse provided from the DP processor 15 are appropriately combined and multiplexed, and the multiplexed data is sent to the combining side via the transmission path.
こうして、ピッチ予測ループ内にマルチパルス符号化部
分を挿入配置した状態で、しかもピッチ予測ループのフ
ィードバック効果によりマルチパルス符号化系による量
子化雑音の影響を確実に緩和しうるマルチパルス符号化
装置の分析側が実現できる。Thus, in a state in which the multi-pulse coding portion is inserted and arranged in the pitch prediction loop, and further, the influence of the quantization noise due to the multi-pulse coding system can be reliably mitigated by the feedback effect of the pitch prediction loop. The analysis side can be realized.
次に合成側について説明する。第2図は本発明によるマ
ルチパルス符号化装置の合成側の第1の実施例を示すブ
ロック図である。Next, the combining side will be described. FIG. 2 is a block diagram showing a first embodiment on the combining side of the multi-pulse encoding apparatus according to the present invention.
第2図の実施例は、多重化分離器23、マルチパルス復号
化器24、化復号化器25、LPC合成フィルタ26、減衰係数
算出器27、K/α変換器28、加算器29、ピッチ復号化器3
0、ピッチ予測器31およびH(Z)/H′(Z)変換器32
を備えて構成される。In the embodiment shown in FIG. 2, the demultiplexer 23, the multi-pulse decoder 24, the decoder 25, the LPC synthesis filter 26, the attenuation coefficient calculator 27, the K / α converter 28, the adder 29, and the pitch. Decoder 3
0, pitch predictor 31 and H (Z) / H '(Z) converter 32
It is configured with.
多重化分離器23は、分析側から伝送された多重化データ
入力の多重化を分離し、マルチパルスとKパラメータな
らびにピッチ予測係数をそれぞれマルチパルス復号化器
24、K復号化器25、ピッチ復号化器30に供給する。The demultiplexer 23 demultiplexes the multiplexed data input transmitted from the analysis side, and multipulses, K parameters, and pitch prediction coefficients are respectively decoded by the multipulse decoder.
24, K decoder 25, and pitch decoder 30.
マルチパルス復号化器24は、符号化マルチパルスをもと
のデータに復号化しLPC合成フィルタ26の入力として供
給する。The multi-pulse decoder 24 decodes the encoded multi-pulse into original data and supplies it as an input to the LPC synthesis filter 26.
K復号化器25は入力したKパラメータを復号化しK/α変
換器28に供給する。The K decoder 25 decodes the input K parameter and supplies it to the K / α converter 28.
K/α変換器28は入力したKパラメータをαパラメータに
変換し、これを減衰係数算出器28とH(Z)/H′(Z)
変換器32に供給する。The K / α converter 28 converts the input K parameter into an α parameter, which is used by the attenuation coefficient calculator 28 and H (Z) / H ′ (Z).
Supply to the converter 32.
減衰係数算出器27は、入力したαパラメータに対して減
衰係数γを乗算、γαをLPC合成フィルタ26に送出す
る。この場合のγの値は分析側と同一で、あらかじめ設
定される。このγαを受けたLPC合成フィルタ26はこれ
をフィルタ係数として利用し伝達関係H′(Z)を有す
る全極型ディジタルフィルタを形成せしめる。The attenuation coefficient calculator 27 multiplies the input α parameter by the attenuation coefficient γ and sends γα to the LPC synthesis filter 26. The value of γ in this case is the same as that on the analysis side and is set in advance. The LPC synthesis filter 26 receiving this γα uses this as a filter coefficient to form an all-pole digital filter having a transfer relationship H '(Z).
LPC合成フィルタ26はマルチパルスを入力として駆動さ
れ再生音声を出力し加算器29に供給する。The LPC synthesizing filter 26 is driven with the multi-pulse as an input, outputs a reproduced voice and supplies it to the adder 29.
ピッチ復号化器30はピッチ予測係数を復号化しピッチ予
測器31に供給する。ピッチ予測器31は加算器29とともに
ピッチ予測フィルタを形成し、加算器29の出力する再生
波形を入力しつつ、これとピッチ予測係数を利用して予
測波形を次次に加算器28から出力せしめ、これをH
(Z)/H′(Z)変換器32に供給せしめる。The pitch decoder 30 decodes the pitch prediction coefficient and supplies it to the pitch predictor 31. The pitch predictor 31 forms a pitch prediction filter together with the adder 29, inputs the reproduced waveform output from the adder 29, and uses this and the pitch prediction coefficient to output the predicted waveform from the next adder 28. , This is H
The (Z) / H '(Z) converter 32 is supplied.
H(Z)/H′(Z)変換器32は、第1図に示す聴音重み
付けフィルタであるH′(Z)/H(Z)変換器1とは逆
特性のフィルタであり、加算器29から再生波形は聴音重
み付けのための減衰常数付与を解除されたうえ音声出力
として送出される。H(Z)/H′(Z)変換器31のフィ
ルタ形成に必要なαパラメータならびにγαパラメータ
はそれぞれK/γ変換器25および減衰係数算出器27から供
給される。The H (Z) / H '(Z) converter 32 has a characteristic opposite to that of the H' (Z) / H (Z) converter 1 which is the perceptual weighting filter shown in FIG. Therefore, the reproduced waveform is released as an audio output after the addition of the attenuation constant for weighting the listening sound is canceled. The α parameter and the γα parameter necessary for forming the filter of the H (Z) / H ′ (Z) converter 31 are supplied from the K / γ converter 25 and the attenuation coefficient calculator 27, respectively.
第3図は本発明によるマルチパルス符号化装置の合成側
の第2の実施例を示すブロック図である。第3図に示す
合成側は、多重化分離器23、マルチパルス復号化器24、
K復号化器25、K/α変換器28、加算器29、ピッチ予測器
30、ピッチ復号化器30、ピッチ予測器31およびLPC合成
フィルタ33等を備えて構成され、これら構成要素中同一
記号番号のものは第2図に示すものと同一であるのでこ
れら同一のものに関する詳細な説明は詳細する。FIG. 3 is a block diagram showing a second embodiment on the combining side of the multi-pulse encoder according to the present invention. The combining side shown in FIG. 3 includes a demultiplexer 23, a multi-pulse decoder 24,
K decoder 25, K / α converter 28, adder 29, pitch predictor
30, a pitch decoder 30, a pitch predictor 31, an LPC synthesis filter 33, etc., and those having the same symbol numbers in these constituent elements are the same as those shown in FIG. Detailed description will be given in detail.
第3図の合成側は、第2図の合成側の構成に比し、減衰
係数算出器27とH(Z)/H′(Z)変換器32が削除さ
れ、またLPC合成フィルタ33の伝達関数がH(Z)であ
る点が異る。このことは、第2図のLPC合成フィルタ26
の伝達関数がH′(Z)であり、これとH(Z)/H′
(Z)変換器32による総合フィルタ特性はH(Z)の伝
達関数で表わしうることとなり、従って、結局H(Z)
の伝達特性を有するLPC合成フィルタ33で置換しうるこ
ととなる。これに関連して減衰係数算出器27は不要とな
るといった構成変換を示すものであり、このような構成
によっても第2図の場合と同様に音声入力の再生が可能
となる。Compared to the composition side of FIG. 2, the composition side of FIG. 3 does not include the attenuation coefficient calculator 27 and the H (Z) / H ′ (Z) converter 32, and the transmission of the LPC composition filter 33 is different. The difference is that the function is H (Z). This means that the LPC synthesis filter 26 shown in FIG.
The transfer function of is H '(Z), and this and H (Z) / H'
The total filter characteristic of the (Z) converter 32 can be represented by the transfer function of H (Z), and therefore H (Z) is eventually obtained.
Can be replaced by the LPC synthesis filter 33 having the transfer characteristic of. In this connection, the attenuation coefficient calculator 27 is not necessary, and the configuration conversion is performed. With such a configuration, the voice input can be reproduced as in the case of FIG.
以上説明した如く本発明は、ピッチ予測ループを有する
マルチパルス符号化装置において、あらかじめ予備的に
仮決定したマルチパルス列を対象としてピッチ予測にも
とづく最適マルチパルス列を決定する手段を備えること
により、量子化雑音を実効的かつ著しく低減しうるとい
う効果がある。As described above, the present invention provides a multi-pulse encoding device having a pitch prediction loop, which includes means for determining an optimum multi-pulse train based on pitch prediction for a multi-pulse train that is tentatively preliminarily determined. There is an effect that noise can be effectively and remarkably reduced.
第1図は本発明のマルチパルス符号化装置の分析側の一
実施例を示すブロック図、第2図は本発明のマルチパル
ス符号化装置の合成測の第1の実施例を示すブロック
図、第3図は本発明のマルチパルス符号化装置の合成側
の第2の実施例を示すブロック図、第4図はピッチ予測
系とマルチパルス処理系が互いに独立したマルチパルス
符号復号系を示すブロック図、第5図はピッチ予測系を
近接予測系に縦続接続したマルチパルス符号復号系を示
すブロック図、第6図はピッチ予測ループ内にマルチパ
ルス符号化系を挿入したマルチパルス符号復号系を示す
ブロック図、第7図はピッチ予測器の一般的構成を示す
ブロック図、第8図は相関領域処理によるマルチパルス
検索の基本的ブロック図である。 1……H′(Z)/H(Z)変換器、2……LPC分析器、
3……K量子化/復号化器、4……K/α変換器、5……
減衰係数算出器、6……ピッチ予測器、7……ピッチ予
測係数算出器、8……メモリ、9……加算器、10……メ
モリ、11……量子化/復号化器、12……マルチパルス予
備分析器、13……パルス振幅量子化器、14……メモリ、
15……DPプロセッサ、16……加算器、17……LPC合成フ
ィルタ、18……加算器、19……誤差電力算出器、20……
加算器、21……ピッチ予測器、22……多重化器、23……
多重化公離器、24……マルチパルス復号化器、25……K
復号化器、26……LPC合成フィルタ、27……減衰係数算
出器、28……K/α変換器、29……加算器、30……ピッチ
復号化器、31……ピッチ予測器、32……H(Z)/H′
(Z)変換器、33……LPC合成フィルタ、34……ピッチ
予測器、35……加算器、36……マルチパルス符号化器、
37……マルチパルス復号化器、38……加算器、39……ピ
ッチ予測器、40……マルチパルス符号化器、41……ピッ
チ予測器、42……近接予測フィルタ、43……加算器、44
……誤差分析器、45……ピッチ予測器、46……近接予測
フィルタ、47……加算器、48……マルチパルス符号化
器、49……マルチパルス復号化器、50……加算器、51…
…ピッチ予測器、52……マルチパルス復号化器、53……
加算器、54……ピッチ予測器、55……可変遅延回路、56
−1,56−2……単位遅延素子、57−1,57−3……乗算
器、58……加算器、59……インパルス応答算出器、60…
…自己相関係数算出器、61……相互相関係数算出器、62
……マルチパルス検索器。FIG. 1 is a block diagram showing an embodiment of the analysis side of the multi-pulse encoding apparatus of the present invention, and FIG. 2 is a block diagram showing a first embodiment of the composite measurement of the multi-pulse encoding apparatus of the present invention. FIG. 3 is a block diagram showing a second embodiment on the combining side of the multi-pulse encoding device of the present invention, and FIG. 4 is a block showing a multi-pulse code decoding system in which a pitch prediction system and a multi-pulse processing system are independent of each other. FIG. 5 is a block diagram showing a multi-pulse code decoding system in which a pitch prediction system is cascade-connected to a proximity prediction system, and FIG. 6 is a multi-pulse code decoding system in which a multi-pulse coding system is inserted in a pitch prediction loop. FIG. 7 is a block diagram showing the general configuration of the pitch predictor, and FIG. 8 is a basic block diagram of multi-pulse search by correlation region processing. 1 ... H '(Z) / H (Z) converter, 2 ... LPC analyzer,
3 ... K quantizer / decoder, 4 ... K / α converter, 5 ...
Attenuation coefficient calculator, 6 ... pitch predictor, 7 ... pitch prediction coefficient calculator, 8 ... memory, 9 ... adder, 10 ... memory, 11 ... quantizer / decoder, 12 ... Multi-pulse preliminary analyzer, 13 ... Pulse amplitude quantizer, 14 ... Memory,
15 …… DP processor, 16 …… adder, 17 …… LPC synthesis filter, 18 …… adder, 19 …… error power calculator, 20 ……
Adder, 21 …… Pitch predictor, 22 …… Multiplexer, 23 ……
Multiplexer, 24 …… Multipulse decoder, 25 …… K
Decoder, 26 LPC synthesis filter, 27 attenuation coefficient calculator, 28 K / α converter, 29 adder, 30 pitch decoder, 31 pitch predictor, 32 …… H (Z) / H ′
(Z) converter, 33 ... LPC synthesis filter, 34 ... pitch predictor, 35 ... adder, 36 ... multi-pulse encoder,
37 ... Multi-pulse decoder, 38 ... Adder, 39 ... Pitch predictor, 40 ... Multi-pulse encoder, 41 ... Pitch predictor, 42 ... Proximity prediction filter, 43 ... Adder , 44
…… Error analyzer, 45 …… Pitch predictor, 46 …… Proximity prediction filter, 47 …… Adder, 48 …… Multi-pulse encoder, 49 …… Multi-pulse decoder, 50 …… Adder, 51 ...
… Pitch predictor, 52 …… Multi-pulse decoder, 53 ……
Adder, 54 ... Pitch predictor, 55 ... Variable delay circuit, 56
-1,56-2 ... unit delay element, 57-1, 57-3 ... multiplier, 58 ... adder, 59 ... impulse response calculator, 60 ...
… Autocorrelation coefficient calculator, 61 …… Cross-correlation coefficient calculator, 62
...... Multi-pulse searcher.
Claims (1)
る手段と、 入力音声信号からピッチ予測成分を除去する手段と、 ピッチ予測成分を除去された音声波形からマルチパルス
を仮決定する手段と、 仮決定されたマルチパルスの一部分で最適なパルス選択
及び量子化を実施するために、合成フィルタとピッチ予
測器とを有して、音声波形を再生しつつ入力音声と最も
よく一致するマルチパルスの組合せを決定する手段とを 備えるマルチパルス符号化装置。1. A means for obtaining a pitch prediction coefficient from an input speech signal, a means for removing a pitch prediction component from an input speech signal, a means for tentatively determining a multipulse from a speech waveform from which the pitch prediction component has been removed, A combination of multi-pulses having the best match with the input speech while reproducing the speech waveform, having a synthesis filter and a pitch predictor in order to perform optimum pulse selection and quantization on a part of the determined multi-pulses. And a multi-pulse encoding device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62013582A JPH0738117B2 (en) | 1987-01-22 | 1987-01-22 | Multi-pulse encoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62013582A JPH0738117B2 (en) | 1987-01-22 | 1987-01-22 | Multi-pulse encoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63181517A JPS63181517A (en) | 1988-07-26 |
JPH0738117B2 true JPH0738117B2 (en) | 1995-04-26 |
Family
ID=11837169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62013582A Expired - Lifetime JPH0738117B2 (en) | 1987-01-22 | 1987-01-22 | Multi-pulse encoder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0738117B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2893691B2 (en) * | 1988-11-25 | 1999-05-24 | ソニー株式会社 | Digital signal processor |
-
1987
- 1987-01-22 JP JP62013582A patent/JPH0738117B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS63181517A (en) | 1988-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10026411B2 (en) | Speech encoding utilizing independent manipulation of signal and noise spectrum | |
EP0443548B1 (en) | Speech coder | |
EP0898267B1 (en) | Speech coding system | |
EP0409239A2 (en) | Speech coding/decoding method | |
USRE43190E1 (en) | Speech coding apparatus and speech decoding apparatus | |
EP0575511A1 (en) | Speech coder and method having spectral interpolation and fast codebook search | |
EP0477960A2 (en) | Linear prediction speech coding with high-frequency preemphasis | |
WO2010079164A1 (en) | Speech coding | |
US5027405A (en) | Communication system capable of improving a speech quality by a pair of pulse producing units | |
US4720865A (en) | Multi-pulse type vocoder | |
JPH10143199A (en) | Voice coding and decoding methods | |
US4908863A (en) | Multi-pulse coding system | |
JPH0738117B2 (en) | Multi-pulse encoder | |
JPH05265495A (en) | Speech encoding device and its analyzer and synthesizer | |
EP1204094A2 (en) | Frequency dependent long term prediction analysis for speech coding | |
JP2947012B2 (en) | Speech coding apparatus and its analyzer and synthesizer | |
JP2000298500A (en) | Voice encoding method | |
JP3296411B2 (en) | Voice encoding method and decoding method | |
JP3552201B2 (en) | Voice encoding method and apparatus | |
JPS6162100A (en) | Multipulse type encoder/decoder | |
EP0780832A2 (en) | Speech coding device for estimating an error of power envelopes of synthetic and input speech signals | |
JPH07168596A (en) | Voice recognizing device | |
JP3192051B2 (en) | Audio coding device | |
JP2853170B2 (en) | Audio encoding / decoding system | |
JP2778035B2 (en) | Audio coding method |