JPS63179399A - Voice encoding system - Google Patents

Voice encoding system

Info

Publication number
JPS63179399A
JPS63179399A JP62011536A JP1153687A JPS63179399A JP S63179399 A JPS63179399 A JP S63179399A JP 62011536 A JP62011536 A JP 62011536A JP 1153687 A JP1153687 A JP 1153687A JP S63179399 A JPS63179399 A JP S63179399A
Authority
JP
Japan
Prior art keywords
correlation
cross
pulse
absolute value
impulse response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62011536A
Other languages
Japanese (ja)
Inventor
中川 富士夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62011536A priority Critical patent/JPS63179399A/en
Publication of JPS63179399A publication Critical patent/JPS63179399A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 技術分野 本発明はマルチパルス駆動音声符号化方式に関し、特に
演算量の制限下で符号化音質の優れたパルスを探索する
方法に関する。
DETAILED DESCRIPTION OF THE INVENTION Technical Field The present invention relates to a multi-pulse driven audio encoding system, and more particularly to a method of searching for pulses with excellent encoded audio quality under a limited amount of calculation.

東工且薯 8〜16kbpsのビットレートで音声を符号化する方
式の一つとして、20ミリ秒程度のフレームで、10〜
30個のパルスで線形予測フィルタを駆動するマルチパ
ルス駆動音声符号化方式がある。
As one method for encoding audio at a bit rate of 8 to 16 kbps, it is possible to encode audio at a bit rate of 8 to 16 kbps.
There is a multi-pulse driven speech encoding method that drives a linear predictive filter with 30 pulses.

本方式では、入力信号と合成信号の誤差が最小になるよ
うにパルスを求める必要があるが、演算の簡略化法とし
て、入力信号と線形予測フィルタのインパルス応答の相
互相関の絶対値が最大になる位置にパルスを立て、2つ
目以降のパルスは相互相関のパルスを立てた位置からイ
ンパルス応答を引いたものを新たな相互相関として、同
様にして求めてい(方法が提案されている。
In this method, it is necessary to find pulses so that the error between the input signal and the composite signal is minimized, but as a method to simplify the calculation, the absolute value of the cross-correlation between the input signal and the impulse response of the linear prediction filter is maximized. For the second and subsequent pulses, a new cross-correlation is obtained by subtracting the impulse response from the position where the cross-correlation pulse was set (a method has been proposed).

相互相関としては入力信号とインパルス応答の相互相関
より、前フレームの影響を除去するために、合成フィル
タの入力をゼロにして影響信号を求め入力信号から引き
、ノイズを聴感特性を利用してマスクするように聴感の
重み付はフィルタを通した信号を求め、この信号とイン
パルス応答の相互相関を用いるのが一般的である。
The cross-correlation is based on the cross-correlation between the input signal and the impulse response.In order to remove the influence of the previous frame, the input of the synthesis filter is set to zero, the influence signal is found and subtracted from the input signal, and the noise is masked using auditory characteristics. For auditory weighting, it is common to obtain a signal passed through a filter and use the cross-correlation between this signal and the impulse response.

パルス位置は、相互相関の絶対値が最大となるサンプル
の位置より求まるが、この絶対MR大の位置を求めるの
に、従来は、サンプル毎に絶対値の大小を比較すること
を行っていた。この様な従来方式についての詳細は、「
マルヂバルス駆動形音声符号化法の検討J 1983年
3月23日、′R子通信学会予稿l P、 115〜P
、122に開示されている。かかる従来方式は以下の如
き欠点を有している。
The pulse position is determined from the position of the sample where the absolute value of the cross-correlation is the maximum, but conventionally, in order to determine the position of the absolute MR, the magnitude of the absolute value was compared for each sample. For more information on this conventional method, see
Study of multi-valse-driven speech coding method J March 23, 1983, Proceedings of the R-Communication Society P, 115-P
, 122. Such conventional methods have the following drawbacks.

ここで、原音声として8にllzでサンプリングされた
ものを考え、2 Q m5ecのフレームで符号化する
とすると、フレーム内の原音声のサンプル数は160サ
ンプルとなり、相互相関も160サンプルとなる。また
、パルス探索においては、符号化フレーム内のみでなく
フレーム外も含めてパルス探索する方が、フレーム内の
みで探索するより符号化音質が優れていることが知られ
ている。従ってパルス探索に用いる相互相関は200サ
ンプル程度となる。
Here, if we consider that the original audio is sampled at 8 llz and encoded in a frame of 2 Q m5ec, the number of samples of the original audio in the frame will be 160 samples, and the cross-correlation will also be 160 samples. Furthermore, in pulse search, it is known that the encoded sound quality is better if the pulse search is performed not only within the encoded frame but also outside the frame, than when the pulse search is performed only within the frame. Therefore, the cross-correlation used for pulse search is about 200 samples.

従来のサンプル毎に大小比較する方法によって絶対Ia
R大の位置を探す場合、200サンプルの相互相関に対
しては199回の比較処理が必要になる。
Absolute Ia is determined by the conventional method of comparing the size of each sample.
When searching for the position of R size, 199 comparisons are required for the cross-correlation of 200 samples.

また、この絶対値最大の位置探索はパルス1つに対して
1回必要であるので、20 m5ecフレーム内に30
パルス求めるとすると、比較処理は、199x 30−
5970回/ 201secとなり、実時間で処理する
にはかなりの障害となる欠点がある。
Also, this position search for the maximum absolute value is required once for each pulse, so 30
When calculating the pulse, the comparison process is 199x 30-
The processing time is 5,970 times/201 seconds, which is a drawback that is a considerable obstacle to processing in real time.

発明の目的 本発明は上記従来のものの欠点を除去すべくなされたも
のであって、その目的とするところは、最大値検索にお
ける大小比較処理回数の大幅な削減を図り得る音声符号
化方式を提供することにある。
Purpose of the Invention The present invention has been made to eliminate the drawbacks of the above-mentioned conventional methods, and its purpose is to provide a speech encoding method that can significantly reduce the number of times of magnitude comparison processing in maximum value search. It's about doing.

発明の構成 本発明によれば、入力信号を線形予測分析し、該線形予
測フィルタのインパルス応答を求め、これ等入力信号と
インパルス応答との相互相関を求め、該相互相関の絶対
値の最大の位置に相互相関の大きさの第一のパルスを立
て、相互相関から、相互相関のパルスを立てた位置にイ
ンパルス応答の自己相関をパルスの大きさに正規化して
引いたものを新たな相互相関とし、該相互相関から、同
様にして、予め定めた個数のパルスを相互相関の予め定
めた範囲内でもとめ、前記線形予測フィルタの係数と予
め定めた個数のパルスの位置と大きさを伝送する音声符
号化方式であって、相互相関を2サンプル以上の間隔で
間引き、間引いた信号の中で絶対値の大きな1つ以上の
サンプルの位置を求め、さらに、値最大のサンプルの位
置を求め、該位置を相互相関の絶対値最大の位置とする
ことを特徴とする音声符号化方式が得られる。
Structure of the Invention According to the present invention, an input signal is linearly predictively analyzed, an impulse response of the linear prediction filter is determined, a cross-correlation between these input signals and the impulse response is determined, and the maximum absolute value of the cross-correlation is calculated. The first pulse with the magnitude of the cross-correlation is set at the position, and the new cross-correlation is obtained by subtracting the autocorrelation of the impulse response at the position where the cross-correlation pulse was set, normalized to the pulse magnitude. Similarly, from the cross-correlation, a predetermined number of pulses are determined within a predetermined range of the cross-correlation, and the coefficients of the linear prediction filter and the positions and magnitudes of the predetermined number of pulses are transmitted. A speech encoding method, in which cross-correlation is thinned out at intervals of two or more samples, the position of one or more samples with a large absolute value is determined in the thinned out signal, and the position of the sample with the maximum value is determined, A speech encoding method is obtained in which the position is set as the position where the absolute value of the cross-correlation is maximum.

1里1 以下、図面を用いて本発明について詳細に説明する。1 ri 1 Hereinafter, the present invention will be explained in detail using the drawings.

第1図は本発明の実施例に適用されるマルチパルス駆動
音声符号化方式のブロック図である。入力信号Xは重み
付Gノフィルタ1へ印加されて、聴感の重み付けがなさ
れた信号XWが求められる。
FIG. 1 is a block diagram of a multi-pulse driven speech encoding method applied to an embodiment of the present invention. The input signal X is applied to a weighted G filter 1 to obtain an auditory weighted signal XW.

また、入力信号XをLPG分析分析部上り線形予測分析
し、線形予測係数Aが求められる。線形予測係数Aを係
数に持つ線形予測フィルタのインパルス応答Rを、LP
Gパラメータ潰子化/符号化部4により求める。そして
、相互相関部2及び自己相関部5により前記重み付き信
号XVIとインパルス応答Rとの相互相関φx、r及び
、インパルス応答Rの自己相関φ「rを夫々求める。パ
ルス探索部6において、相互相関φxrと自己相関φr
「とによりパルス探索を行い、得られた音源パルスの位
置と振幅とを、符号化部7にて線形予測係数Aといっし
ょに符号化して伝送する。
Further, the input signal X is subjected to upstream linear prediction analysis by the LPG analysis unit, and a linear prediction coefficient A is obtained. The impulse response R of the linear prediction filter having the linear prediction coefficient A as a coefficient is expressed as LP
The G parameter is determined by the collapsing/encoding unit 4. Then, the cross-correlation section 2 and the autocorrelation section 5 calculate the cross-correlation φx,r between the weighted signal XVI and the impulse response R, and the autocorrelation φ'r of the impulse response R, respectively. Correlation φxr and autocorrelation φr
The position and amplitude of the obtained excitation pulse are encoded and transmitted together with the linear prediction coefficient A in the encoding section 7.

次に、パルス探索の方法について説明する。第2図は第
1図のパルス探索部6の内部構成例である。パルス探索
部6の内部には、相互相関保持手段61があり、長さl
xの相互相関φxr(i) 、  i−1〜l×が保持
されている。絶対値の最大値検索部62では、長さix
の相互相関φxr(i) 、  i=1〜lxの絶対値
が最大となる値φxr(is)を求め、位置ilに大き
さφxr(is)のパルスを立てる。
Next, a pulse search method will be explained. FIG. 2 shows an example of the internal configuration of the pulse search section 6 shown in FIG. 1. Inside the pulse search section 6, there is a cross-correlation holding means 61, which has a length l.
The cross-correlations φxr(i) of x, i-1 to lx are maintained. In the maximum absolute value search unit 62, the length ix
A value φxr(is) at which the absolute value of the cross-correlation φxr(i) of i=1 to lx is maximum is determined, and a pulse of magnitude φxr(is) is generated at the position il.

相互相関φX「から、長さ±lrの自己相関φ「rを位
置ilで大きさを位置・振幅修正部63にてφX「(i
■)に合わせ、しかる後に引算部64にて下式のように
引算を行う。
From the cross-correlation φX', the autocorrelation φ' of length ±lr is set at the position il and the magnitude is determined by the position/amplitude correction unit 63, φX'(i
(2), and then the subtraction unit 64 performs subtraction as shown in the following equation.

φxr(im+i)=  φXr(lll+1)−(φ
 xr(is)/ φ rr(0))×φrr(i) 
 (i −−Ir 〜Ir )この最大値探索と、相互
相関から自己相関を引算する処理は、パルス1つ求める
毎に1回行われる。そして、相互相関から自己相関を引
算した結果は、再び相互相関保持手段61に設定され次
のパルス探索において相互相関と共に用いられる。
φxr(im+i)=φXr(llll+1)−(φ
xr(is)/φrr(0))×φrr(i)
(i--Ir to Ir) This maximum value search and the process of subtracting autocorrelation from cross-correlation are performed once every time one pulse is obtained. Then, the result of subtracting the autocorrelation from the crosscorrelation is again set in the crosscorrelation holding means 61 and used together with the crosscorrelation in the next pulse search.

以上の処理における相互相関の絶対値の最大探索部62
における処理は、第3図に示す方法で行われる。まず、
相互相関φxr(i)を1/N間引き部621にてNサ
ンプル分の1に間引き、間引いた信号に対して絶対値の
最大値検出を検出部622にて行う。次に、得られた最
大値の位置を中心にして、N分の1間引きにおいて間引
かれた、前後それぞれN−1サンプルを含めて合計2X
 (N−1)+1サンプルでさらに最大値検出を部分検
出部623にて行う。
Maximum search unit 62 for the absolute value of cross-correlation in the above processing
The processing in is performed by the method shown in FIG. first,
A 1/N decimation section 621 decimates the cross-correlation φxr(i) to N samples, and a detection section 622 detects the maximum absolute value of the decimated signal. Next, centering on the position of the maximum value obtained, a total of 2
Maximum value detection is further performed in the partial detection unit 623 using (N-1)+1 samples.

即ち、この方法はまずN分の1間引きを行うことによっ
て最大値検出の粗検出を行い1、それによって得られた
最大値位置を中心にさらに精密検出を行うものである。
That is, this method first performs coarse detection of the maximum value by thinning out by 1/N, and then performs more precise detection around the maximum value position obtained thereby.

最大値の検出をサンプル間の大小比較で行うとすると、
大小比較処理の回数は、パルス1つを求めるのに、粗検
出におけるIx/N−1回と、精密検出における2x(
N−1)回で、合計lx /N+2 (N−1) −1
回となる。
Assuming that the maximum value is detected by comparing the size of samples,
The number of times of magnitude comparison processing is Ix/N-1 times in rough detection and 2x(
N-1) times, total lx /N+2 (N-1) -1
times.

これを、従来の間引きしないですべてのサンプルに対し
て大小比較する方法による大小比較処理回数1x−1回
と比べると、 (Ix /N+2 (N−1) −1)/(lx−1)
#1/N (lx>N)となり、IXがNより十分大き
いときは約1/Nになっている。
Comparing this with the number of size comparisons of 1x-1 in the conventional method of comparing all samples in size without thinning out, we get (Ix /N+2 (N-1) -1)/(lx-1)
#1/N (lx>N), and when IX is sufficiently larger than N, it is approximately 1/N.

尚、本実施例では相互相関の最大値の粗検出において最
大値を1つだけ検出しているが、最大なものから順に2
つ以上検出して最大値位置の候補とすることもできる。
In this embodiment, only one maximum value is detected in the coarse detection of the maximum value of cross-correlation, but two maximum values are detected in order from the maximum value.
It is also possible to detect more than one and use it as a candidate for the maximum value position.

この場合、精密検出は粗検出で求められた最大値位置の
候補すべてに対して行うことになる。
In this case, precise detection is performed on all candidates for the maximum value position determined by rough detection.

発明の詳細 な説明したように本発明によれば、相互相関の最大値検
索において、はじめにNサンプル分の1に間引いて最大
値検索の粗検索を行うことにより、相互相関のサンプル
数がNより十分大きいときには、最大値検索における大
小比較処理回数を従来の約1/Nにすることができると
いう効果がある。
DETAILED DESCRIPTION OF THE INVENTION According to the present invention, in the maximum value search for cross-correlation, the number of cross-correlation samples is reduced from N by first thinning out to 1 N samples and performing a coarse search for the maximum value. When the value is sufficiently large, there is an effect that the number of times of size comparison processing in the maximum value search can be reduced to about 1/N of the conventional value.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の実施例のブロック図、第2図は第1図
のパルス探索部の構成を示すブロック図、第3図は第2
図の絶対値の最大値探索部の構成を示すブロック図であ
る。 主要部分の符号の説明
FIG. 1 is a block diagram of an embodiment of the present invention, FIG. 2 is a block diagram showing the configuration of the pulse search section of FIG. 1, and FIG.
FIG. 2 is a block diagram showing the configuration of a maximum absolute value search unit shown in the figure. Explanation of symbols of main parts

Claims (1)

【特許請求の範囲】[Claims] 入力信号を線形予測分析し、該線形予測フィルタのイン
パルス応答を求め、これ等入力信号とインパルス応答と
の相互相関を求め、該相互相関の絶対値の最大の位置に
相互相関の大きさの第一のパルスを立て、相互相関から
、相互相関のパルスを立てた位置にインパルス応答の自
己相関をパルスの大きさに正規化して引いたものを新た
な相互相関とし、該相互相関から、同様にして、予め定
めた個数のパルスを相互相関の予め定めた範囲内でもと
め、前記線形予測フィルタの係数と予め定めた個数のパ
ルスの位置と大きさを伝送する音声符号化方式であつて
、相互相関を2サンプル以上の間隔で間引き、間引いた
信号の中で絶対値の大きな1つ以上のサンプルの位置を
求め、さらに、値最大のサンプルの位置を求め、該位置
を相互相関の絶対値最大の位置とすることを特徴とする
音声符号化方式。
Linear prediction analysis is performed on the input signal, the impulse response of the linear prediction filter is determined, the cross-correlation between these input signals and the impulse response is determined, and the position of the maximum absolute value of the cross-correlation is set at the position of the magnitude of the cross-correlation. A new cross-correlation is obtained by subtracting the autocorrelation of the impulse response at the position where the cross-correlation pulse was set, normalized to the pulse size, from the cross-correlation. A speech encoding method that detects a predetermined number of pulses within a predetermined range of cross-correlation and transmits the coefficients of the linear prediction filter and the positions and magnitudes of the predetermined number of pulses. Thin out the correlation at intervals of two or more samples, find the position of one or more samples with a large absolute value in the thinned out signal, find the position of the sample with the maximum value, and set this position as the maximum absolute value of the cross-correlation. A speech encoding method characterized by a position of .
JP62011536A 1987-01-21 1987-01-21 Voice encoding system Pending JPS63179399A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62011536A JPS63179399A (en) 1987-01-21 1987-01-21 Voice encoding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62011536A JPS63179399A (en) 1987-01-21 1987-01-21 Voice encoding system

Publications (1)

Publication Number Publication Date
JPS63179399A true JPS63179399A (en) 1988-07-23

Family

ID=11780684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62011536A Pending JPS63179399A (en) 1987-01-21 1987-01-21 Voice encoding system

Country Status (1)

Country Link
JP (1) JPS63179399A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317501B1 (en) 1997-06-26 2001-11-13 Fujitsu Limited Microphone array apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317501B1 (en) 1997-06-26 2001-11-13 Fujitsu Limited Microphone array apparatus

Similar Documents

Publication Publication Date Title
US4879748A (en) Parallel processing pitch detector
Laroche The use of the matrix pencil method for the spectrum analysis of musical signals
JP3392412B2 (en) Voice coding apparatus and voice encoding method
JPH08328588A (en) System for evaluation of pitch lag, voice coding device, method for evaluation of pitch lag and voice coding method
EP0957472B1 (en) Speech coding apparatus and speech decoding apparatus
US4736428A (en) Multi-pulse excited linear predictive speech coder
JPH04270398A (en) Voice encoding system
EP0550657A1 (en) A method of, and system for, coding analogue signals.
JPH09319398A (en) Signal encoder
JPS63179399A (en) Voice encoding system
JPH07199997A (en) Processing method of sound signal in processing system of sound signal and shortening method of processing time in itsprocessing
Moriya et al. Extended linear prediction tools for lossless audio coding
JP3255190B2 (en) Speech coding apparatus and its analyzer and synthesizer
EP0484339B1 (en) Digital speech coder with vector excitation source having improved speech quality
JPH03123113A (en) Pitch period retrieving system
US6049814A (en) Spectrum feature parameter extracting system based on frequency weight estimation function
JP3122540B2 (en) Pitch detection device
JPH087597B2 (en) Speech coder
JPS6324298A (en) Multi-pulse driving type voice encoder
EP1100076A2 (en) Multimode speech encoder with gain smoothing
JP3249144B2 (en) Audio coding device
JPH058839B2 (en)
JP2585214B2 (en) Pitch extraction method
JPS63197999A (en) Voice coding system
JPS63108400A (en) Voice encoder