JPS607500A - Multipulse type vocoder - Google Patents

Multipulse type vocoder

Info

Publication number
JPS607500A
JPS607500A JP58115538A JP11553883A JPS607500A JP S607500 A JPS607500 A JP S607500A JP 58115538 A JP58115538 A JP 58115538A JP 11553883 A JP11553883 A JP 11553883A JP S607500 A JPS607500 A JP S607500A
Authority
JP
Japan
Prior art keywords
pulse
sound source
input audio
audio signal
vocoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58115538A
Other languages
Japanese (ja)
Other versions
JPH0242239B2 (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58115538A priority Critical patent/JPS607500A/en
Priority to CA000457390A priority patent/CA1219079A/en
Priority to US06/625,055 priority patent/US4720865A/en
Publication of JPS607500A publication Critical patent/JPS607500A/en
Publication of JPH0242239B2 publication Critical patent/JPH0242239B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 本発明はマルチパルス型ボコーダに関する。入力音声信
号を分析して、この入力音声信号の音声1、?報をオ7
り成するスペクトル包絡情報と音源情報と全分析側で抽
出し、これら音声情報を(六送路全介して合成側に送出
して人力音声信号音ilT生ず、もボコーダはよく・I
【1られている。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a multi-pulse vocoder. Analyze the input audio signal and determine whether audio 1, ? News o7
The spectral envelope information and sound source information that are formed by the analysis side are extracted by the analysis side, and these audio information are sent to the synthesis side via all six transmission paths to generate a human voice signal sound.
[It's been 1.

上述したスペクトル包絡情報は、入力音声信号を発生す
る声道系のスペクトル分布情報ヲ咲わすもので1通常L
PC分析によって得られた分析次数に対応する個数のL
 P C係シ)1文、たとえばαパラメータ、にパラメ
ータ等によって衆現され、また音源情報はスペクトル色
落の微細構造を示すも・;)で入力音声信号からスペク
トル分布情報を除いた。
The above-mentioned spectral envelope information is information on the spectral distribution of the vocal tract system that generates the input speech signal.
The number of L corresponding to the analysis order obtained by PC analysis
The spectral distribution information is removed from the input audio signal in one sentence, for example, the α parameter, and the sound source information indicates the fine structure of spectral discoloration.

いわゆる残差信号とじて知られるもので、入力音声信号
の音源の強さ、ピッチ周期および有声・無声に関する情
報が含まれ1通常これらの情報は入力音声信号の分析フ
レームごとの自己相関係数ヲ介して抽出されることもよ
く知られている。
This is known as the so-called residual signal, and it contains information regarding the source strength, pitch period, and voiced/unvoiced input audio signal.1This information is usually calculated using the autocorrelation coefficient for each analysis frame of the input audio signal. It is also well known that it can be extracted through

さて、スペクトル包絡情報はボコーダの合成側で入力音
声信号を合成する場合9通常全極室のデジタルフィルタ
を利用して近似的声道系全形成せしめるLPC合成器の
係数として利用され、音源情報はこのデジタルフィルタ
の駆動音源として利用すれ、このデジタルフィルタによ
って入力音声信号が合成される。
Now, when the input audio signal is synthesized on the synthesis side of the vocoder, the spectral envelope information is usually used as the coefficients of the LPC synthesizer that uses an all-pole chamber digital filter to form an approximate complete vocal tract system, and the sound source information is It is used as a driving sound source for this digital filter, and input audio signals are synthesized by this digital filter.

このようにして得られる従来のLPCボコーダは、約4
Kb(キロビット)以下の低ピットレートでも音声の合
成が可能であシ多用されているものの、高品質の音声合
成は高ビットレートにおいても困難であるという欠点を
有する。この原因は音源情報のモデル化の場合、有声音
に対してはその内容に対応するピッチ周期を抽出してこ
のピッチ周期に対応する単一のインパルス列で近似的に
表現し、ランダム周期の無声音に対しては白色雑音で近
似的に表現するという単純なモデル化処理を前提として
いるため、入力音声信号の音源情報を忠実に抽出したも
のとならず、従って音源情報に含まれる入力音声信号の
波形情報の分析9合成が実施されていないことによる。
The conventional LPC vocoder thus obtained is approximately 4
Although it is possible to synthesize speech even at a low pit rate of Kb (kilobits) or less and is often used, it has the drawback that high-quality speech synthesis is difficult even at a high bit rate. The reason for this is that when modeling sound source information, for voiced sounds, the pitch period corresponding to the content is extracted and approximately represented by a single impulse train corresponding to this pitch period, while unvoiced sounds with random periods are is assumed to be a simple modeling process in which it is approximated by white noise, so the sound source information of the input audio signal is not faithfully extracted, and therefore the input audio signal contained in the sound source information is This is because analysis 9 synthesis of waveform information has not been performed.

マルチパルス型ボコーダは、このような波形非伝送によ
る問題の改善′ff:し」るため波形伝送を行なって入
力音声信号の合成を実施するボコーダのひとつとして近
時よく知られつつあるものである。
A multi-pulse vocoder has recently become well known as a type of vocoder that transmits waveforms and synthesizes input audio signals in order to improve the problem caused by non-transmission of waveforms. .

2=fNIJは従来のマルチパルス減ボコーダの基本的
構成を示すブロック図である。
2=fNIJ is a block diagram showing the basic configuration of a conventional multi-pulse reduction vocoder.

LPC@成器1岐器1全シミュレートする全極型デジタ
ルフィルタを備え、その係数tよ入力rr’A子200
1 を介して入力される入力音声信号x(nl(n=1
.2.3・・・・・・n)全LPC分析器2により分析
フレームごとに分析したLPC係数が供給される。音源
パルス発生¥::r 3は、入力音声信号の音源情報か
ら複数個のイ/パルス系列、すなわちマルチパルスから
なる駆動音源系列V(nl’t:得て、これ’(i)L
PC合成器1の駆動音源として供給する。
LPC @ generator 1 divider 1 is equipped with an all-pole digital filter that simulates the whole, whose coefficient t is the input rr'A child 200
1 input audio signal x(nl(n=1
.. 2.3...n) All LPC analyzers 2 supply LPC coefficients analyzed for each analysis frame. Sound source pulse generation ¥::r 3 is a drive sound source sequence V(nl't: obtained, this'(i)L
It is supplied as a driving sound source for the PC synthesizer 1.

LPC合成器1はこうして入力するLPG係数を1通常
は全極型デジタルフィルタ全利用する合成フィルタの係
数とし、マルチパルスを駆動音源として駆動され合成信
号Y(n)を出力する。この場合、マルチパルスは入力
音声信号の波形情報を含むものであシ、I、PC@−成
器1は波形情報を含む入力音声信号の合成を行なうこと
となる。
The LPC synthesizer 1 uses the input LPG coefficient as a coefficient of a synthesis filter that normally makes full use of an all-pole digital filter, and outputs a synthesized signal Y(n) driven by a multi-pulse as a driving sound source. In this case, the multi-pulse contains waveform information of the input audio signal, and the PC@-synthesizer 1 synthesizes the input audio signal including the waveform information.

さて、LPG合成器1から出力する@−成信号T(n)
は次に減算器4で入力音声信号x(n)との差をとり、
誤差e (n)を得てこれを聴感重み付は器5に送出す
る。
Now, the @-composed signal T(n) output from the LPG synthesizer 1
Next, the subtracter 4 takes the difference from the input audio signal x(n),
The error e(n) is obtained and sent to the perceptual weighting device 5.

聴感重み付は器5は、誤差e(n)に対して次の(1)
式に示す特性W■)を有する重み付はフィルタによって
聴感的な重み付けを付与したうえ、これらを2乗誤差最
小化器6に送出するものである。
The auditory weighting device 5 calculates the following (1) for the error e(n).
The weighting having the characteristic W■) shown in the equation is performed by applying perceptual weighting using a filter and then sending these weights to the squared error minimizer 6.

・・・・・・・・・ (1) (1)式においてa、はLPC合成器1の全極型デジタ
ルフィルタの係数とすべきLPC係数、pはその次数で
あシ従ってLPC分析次λQ、rij、重み付は係数、
Zは全極型デジタルフィルタのZ変換表示による伝達関
数11(Z””)におけるZ = exp(jλ)を示
し、λ=2πΔTfでありΔTは分析フレームの標本化
サンプリング周期、f[周波数を示す。
...... (1) In equation (1), a is the LPC coefficient that should be the coefficient of the all-pole digital filter of the LPC synthesizer 1, and p is its order. Therefore, the LPC analysis order λQ , rij, weighting is a coefficient,
Z indicates Z = exp (jλ) in the transfer function 11 (Z"") according to the Z transformation representation of the all-pole digital filter, λ = 2πΔTf, and ΔT is the sampling period of the analysis frame, f[indicates the frequency .

また(1)式において重み付は係数rfよ、0<r<1
の範囲で設定される。
Also, in equation (1), the weighting is done by the coefficient rf, 0<r<1
It is set within the range of .

+1+弐に示−jW(Z)it r = 1 ニ対シテ
td、 1 、 r= 0に対してはW(Z) = t
 −p (Z)の範囲の範囲で変化し。
+1+2 -jW(Z)it r = 1 two pairs td, 1, for r= 0 W(Z) = t
−p (Z).

1゛の値は誤差e(n)の周波数スペクトルにおけるフ
ォルマント領域に現われる過大なレベルを押庄する程バ
(に対応して前述した範囲の中で設定され。
The value of 1 is set within the above-mentioned range so as to suppress the excessive level appearing in the formant region of the frequency spectrum of the error e(n).

合成すべき信号の聴感的重み付けの役ψ111′ff:
果すものであり1通常予め最適聴感テストによってその
最適値が選定される。
Auditory weighting role of signals to be synthesized ψ111'ff:
The optimum value is usually selected in advance through an optimum hearing test.

このようにして重み付けされた誤差e (nlは、音源
パルス発生器3から出力される駆動音源系列V(n)、
すなわちマルチパルスの最適時間位置と振幅と全決定す
るために2乗誤差最小化器6に送出され9次の(2)式
による2乗誤差ε全計算し、εを最小にするように駆F
il+音源系列V(n)が選択される。
The error e (nl) weighted in this way is the driving sound source series V(n) output from the sound source pulse generator 3,
That is, in order to determine the optimal time position and amplitude of the multi-pulse, it is sent to the square error minimizer 6, which calculates the square error ε according to the 9th order equation (2), and then drives the F to minimize ε.
il+sound source series V(n) is selected.

ε=Σ(e(n)−X−ω(rl〕” +++++・・
+ (2)1?1 (2)式において記号→(・は聴感重み付は器50重み
付はフィルタによるたたみ込み積分、Nはマルチパルス
を計算する区間長を示す。
ε=Σ(e(n)-X-ω(rl)" +++++++...
+ (2) 1?1 In the formula (2), the symbol → (• indicates the auditory weighting is the convolution integral by the filter, and N indicates the interval length for calculating the multipulse.

上述した処理はマルチパルスのパルスごとに操返され9
分析による合成がマルチパルスごとに行なわれる。いわ
ゆるAnalysis−by−8yntbesis手法
(以下A−b−8手法と略称する)であって。
The above process is repeated for each multi-pulse.
Synthesis by analysis is performed for each multipulse. This is a so-called Analysis-by-8yntbesis method (hereinafter abbreviated as A-b-8 method).

このA−b−8手法は上述した内存からもtplらかな
如<、マルチパルス1つずつについてパルス発生、2乗
誤差計算およびパルス位置・損11’7! N4整のル
ープで行なわれるため、低ピットレート領域における有
効な手段であるにもかかわらずその演算量が極めて膨大
なものとなるという火照がある。
This A-b-8 method is also clear from the above-mentioned inherent nature.Pulse generation for each multi-pulse, square error calculation, and pulse position/loss 11'7! Since this is performed in a loop of N4, although it is an effective means in a low pit rate region, the amount of calculations required is extremely large.

なお、このA−b−8手法については、 B、S。Regarding this A-b-8 method, B, S.

Atal et al 、“A New Model 
of LPCExc+−tation for Pro
ducing Natural−8oundingSp
eech at Low flit Rates″、P
roc、ICASSP82、TRp614−617.(
1982)等に詳述されている。
Atal et al., “A New Model
of LPCExc+-tation for Pro
ducing Natural-8oundingSp
eech at Low flit Rates'', P
roc, ICASSP82, TRp614-617. (
1982) and others.

このような従来のA−b−8手法における欠点に対して
、相関演1.゛γにもとづき〕′1)適なマルチパルス
を効率的に計算する次のような演)1処理アルゴリズム
が最近紹介さり、でいる。
To address these shortcomings in the conventional A-b-8 method, correlation calculation 1. [Based on γ]'1) The following processing algorithm has been recently introduced to efficiently calculate suitable multi-pulses.

すなわち、入力音声信号x(n)はNリーンプル゛ごと
処理アレーン、によって区分され、このフレームごとに
マルチパルスが包括的に計jvされるものである。
That is, the input audio signal x(n) is divided into N lean pulls by processing arrays, and multipulses are comprehensively counted for each frame.

(0ま、1分析フレーム内に音源パルスかに個存在する
ものとし、i番目のパルスがフレーム引から時間位置m
iにあり、かつその振幅がgiであるとすると、LPG
合成フィルタの駆動音源d(ロ)tよ次の(3)式で示
される。
(0, it is assumed that there are several sound source pulses in one analysis frame, and the i-th pulse is at a time position m from the frame draw.)
i, and its amplitude is gi, then LPG
The driving sound source d(b)t of the synthesis filter is expressed by the following equation (3).

d(n) ==、Σfi−δn、 ml ・・−団・ 
(3)+−1 (3)式においてδn、miはクロネッカーのデルタ関
数であり、δH,mi = l (n =jil、 )
、δn。
d(n) ==, Σfi−δn, ml ・・−group・
(3)+-1 In equation (3), δn and mi are Kronecker's delta functions, and δH,mi = l (n = jil, )
, δn.

mI=O(n〜mj)である。mI=O(n~mj).

LPG合成フィルタはこの駆動音源d inlによって
駆動され合成信号マーを出力する。
The LPG synthesis filter is driven by this driving sound source d inl and outputs a synthesized signal.

LPC合成フィルタとして、たとえば全極型デジタルフ
ィルタを考えるものとし、その伝達+JJ数全インパル
ス応答k(n)(0≦n≦M−1)で表現するものとす
ると1合成信号x(n)は次の(4)式で表わされる。
As an LPC synthesis filter, let us consider, for example, an all-pole digital filter, and if it is expressed by its transmission + JJ number total impulse response k(n) (0≦n≦M-1), one synthesized signal x(n) is It is expressed by the following equation (4).

?(nl =Σd(gJ−h(n−−g) ・−・−・
・・−t41−0 (4)式においてd験)はi動音源を穴わす。
? (nl = Σd(gJ-h(n--g) ・-・-・
...-t41-0 In equation (4), the d test) penetrates the i-motion sound source.

次に入力音声信号x (n)と合成信号マ(n)との誤
差に対し聴感的な補正を施した重み付は誤差をew(n
)とするとe、(n)は次の(5)式で示される。
Next, weighting that performs auditory correction on the error between the input audio signal x (n) and the composite signal ma (n) reduces the error to ew (n
), then e and (n) are expressed by the following equation (5).

% !”) = (x In) −T I、n))+v
v:n) −−(5)さらに2乗誤差は(5ン式から誘
導して次の(6)式で示すことができる。
%! ”) = (x In) − T I, n)) + v
v:n) --(5) Further, the square error can be derived from the equation (5) and expressed by the following equation (6).

・・・・・・・・・ (6) (6)式においてMは誤差を最小化する区間の妥ンプル
数金示し、たとえば1分析フレーム長に選ぶ。
(6) In equation (6), M represents a reasonable number of intervals that minimizes the error, and is selected to be one analysis frame length, for example.

最適な音源パルス列としてのマルチパルスは(6)弐k
Ja小化するPi ′fK:得ることによってJiられ
、この%iは上述した(3)、 t4+および(6)式
から次の(7)式の如く誘導される。
The optimal sound source pulse train is (6) 2k.
Ja is reduced by obtaining Pi'fK: This %i is derived from the above-mentioned equations (3), t4+, and (6) as shown in the following equation (7).

(n−rnz)・hw(n−ryg ))/Σh、y(
n−m、)。
(n-rnz)・hw(n-ryg))/Σh,y(
nm, ).

1−1 h、(n−ml) =・・”・ (7)(7)式におい
てXw(n)はx(rl−Xw(n)、hw(nli、
J:h (nl % w(n) f示す。(7)式の右
辺の分子の第1項けxW(nlとh v (n)との時
間遅れmiの相互相間関数9’bx(m+)を示すもの
であ)、また、第2項の関数?)、)、 (mz m、
 ) (1≦mtm、≦M)ffi示す。
1-1 h, (n-ml) =...” (7) In equation (7), Xw(n) is x(rl-Xw(n), hw(nli,
J: h (nl % w(n) f is shown. The first term of the numerator on the right side of equation (7) is the mutual correlation function 9'bx (m+) of the time delay mi between nl and h v (n) ), and the function of the second term?), ), (mz m,
) (1≦mtm,≦M)ffi.

共分散関数ψhh (mtm、 )は自己相関関数Rb
h< l mt−mt I >と等しくなシ、従って(
7)式は次の(8)式の如く表わすことができる。
The covariance function ψhh (mtm, ) is the autocorrelation function Rb
h< l mt-mt I >, so (
Equation 7) can be expressed as the following equation (8).

・・・・・・・・・ (8) (8)式によれば9時間位置m1においてパルス全発生
せしめると振幅Pi(mi)が最適なものとして決定し
うろこととなる。なお(8)式において1≦mi≦Mで
ある。
(8) According to equation (8), if all pulses are generated at the 9-hour position m1, the amplitude Pi (mi) will be determined as the optimum one. Note that in equation (8), 1≦mi≦M.

つまシ、音源パルスに着目し2種々の時間位置において
(8)式によシその振幅を計算したうえ、その振幅の絶
対値を最大とするものが(6)式に示す2乗誤差を最小
化するパルスとなり、このような手続を繰返して複数個
の音源パルス金求めることができる。
After focusing on the sound source pulse and calculating its amplitude using equation (8) at two different time positions, the one that maximizes the absolute value of the amplitude is the one that minimizes the squared error shown in equation (6). By repeating this procedure, a plurality of sound source pulses can be obtained.

なお、上述した計算アルゴリズムに関してに。Regarding the calculation algorithm mentioned above.

小浜、荒関、小野“マルチパルス駆動形音声符号化法の
検討”、1983年3月電子通信学会通信方式研究会に
詳述されている。
Obama, Araseki, and Ono, ``Study of multi-pulse driven speech coding method'', detailed at the Institute of Electronics and Communication Engineers' Communication Systems Study Group, March 1983.

このような計算アルゴリズムに基5いて行なわレルマル
チパルスの発生によれば、相互相関間数と自己相関関数
ならびに最大値演算からl量適なマルチパルスの計算が
可能となるため、構成が非常にI’+1素化されたもの
となり演算−吟を大幅に低減しうるマルチパルス型ボコ
ーダを実現すること/バできる。
By generating real multipulses based on such a calculation algorithm, it is possible to calculate an appropriate amount of multipulses from the cross-correlation number, autocorrelation function, and maximum value calculation, so the configuration is very simple. It is possible to realize a multi-pulse vocoder which is subjected to I'+1 elements and which can significantly reduce the calculation time.

しかしながら、このようにして改善したマルチパルス型
ボコーダにあってもさらに次に述べるような久喜がある
However, even with the multi-pulse vocoder improved in this way, there are still problems as described below.

すなわち、フレーム内で発生するパルス(、(よりも7
1/−ム内に存在するパルス数が多いとき((は合成イ
ボ号Vよ入力音声13号の音源情報に門する波彩伝送を
忠実に実行したものとならず9合成信号の音声品うTが
上述したパルス数の差に対応した程度の劣化全件なうこ
ととなる。
That is, the pulses (, ( than 7
1/- When the number of pulses existing in the signal is large (((is the synthesized signal V), the wave transmission based on the sound source information of the input audio signal No. 13 is not faithfully executed, and the audio product of the synthesized signal No. 9 There will be a degree of deterioration in which T corresponds to the difference in the number of pulses mentioned above.

マルチパルス型ボコーダでは、たとえば分析周JIJ]
′fc20mSECとする1フームにおいて発生すべき
音源駆動パルスの数はピントレートに対応して通常4〜
16(2〜2 )個のうち予め設定した固定数を利用す
る。入力音声信号が女声あるいは幼児声の如くピッチ周
期が小さい高声の場合。
In a multi-pulse vocoder, for example, analysis frequency JIJ]
The number of sound source drive pulses to be generated in one frame with fc20mSEC is usually 4 to 4 depending on the focus rate.
A preset fixed number out of 16 (2 to 2) is used. When the input audio signal is a high-pitched voice with a small pitch period, such as a female voice or a child's voice.

音源信号のピッチ周間が2. s m S EC6度と
なることも珍しくない、この場合1分析フレーム中に設
定すべき駆動音源パルスの数としては少なくとも8個必
要となる。このような場合9分析フレーム内で発生すべ
き駆動音源パルスの数が8個以下。
The pitch period of the sound source signal is 2. It is not uncommon for s m S EC to be 6 degrees, and in this case, at least 8 driving sound source pulses are required to be set in one analysis frame. In such a case, the number of driving sound source pulses to be generated within 9 analysis frames is 8 or less.

たとえば4個に設定しであるときにはこのような駆動音
源パルスを利用するマルチパルス型ボコーダでは倍ピツ
チエラーと同様な結果を含む合成音が発生し合成音質が
著しく劣化することとなる。
For example, when the number is set to four, in a multi-pulse vocoder that utilizes such drive sound source pulses, a synthesized sound containing a result similar to a double pitch error will be generated, and the synthesized sound quality will be significantly degraded.

本発明の目的は上述した欠点全除去し、マルチパルス型
ボコーダにおいて9分析フレーム内で発生すべき駆動音
源パルスよシも分析フレーム内に存在するパルス数が多
いときには人力音声信号から抽出したピッチ周期にもと
づいてモデル化して発生するi動音源パルス全マルチパ
□ルスに代えて利用する手段を備えることにより9合成
音質の劣化を大幅に改善した1t(1単な溝57のマル
チパルス型ボコーダを提供することにある。
The purpose of the present invention is to eliminate all of the above-mentioned drawbacks, and to improve the pitch period extracted from a human voice signal when the number of pulses present in an analysis frame is larger than the drive sound source pulses that should be generated within 9 analysis frames in a multi-pulse vocoder. 1T (1 single groove 57 multi-pulse type vocoder) which greatly improves the deterioration of synthesized sound quality by providing a means to use it in place of all multi-pulse i-motion sound source pulses generated by modeling based on It's about doing.

本発明のマルチパルス型ボコーダの具体例は。A specific example of the multi-pulse vocoder of the present invention is as follows.

入力音声信号全分析アレーン・ごとにT、 P C分析
しで抽出したL P G係数全スペクトル包絡情報とし
このスペクトル包絡留止とともに前記入力音声信号の音
声情報全構成する音源情報を分析フレームごとにこの音
源情報の特徴に対応する発生時間位jIlと振幅とを有
する複数個のインパルス系列(マルチパルス)を以って
衣現し前記入力音声信号の分析および合成を行なうマル
チパルス型ボコーダにおいて、前記入力音声1言号の分
析アレーン・ごとに抽出するピッチ周期金倉して分析フ
レーム内に存在する記音源情報によるパルス数全判11
:lr l、たうえこれが分析7レーム内で発生すべき
前記−マルチパルスの数よりも多い場合には前記ピッチ
族」1すに対応する複数個のインパルス系列によるマル
チパルス全前記マルチパルスに代えて発生する手段全イ
、llえて構成される。
Analyze all of the input audio signals, analyze the entire spectrum of the LPG coefficients extracted by T, PC, and analyze the entire spectral envelope information of the input audio signal, and analyze the sound source information constituting all of the audio information of the input audio signal for each frame. In a multipulse vocoder that analyzes and synthesizes the input audio signal by expressing it with a plurality of impulse sequences (multipulses) having generation time positions jIl and amplitudes corresponding to the characteristics of the sound source information, The number of pulses extracted from the pitch period Kanakura and recorded sound source information existing in the analysis frame for each analysis frame of one speech word is 11.
:lr l, and if this is greater than the number of said multipulses to be generated within the analysis 7 frames, then all said multipulses are replaced by a plurality of impulse sequences corresponding to said pitch group 1. All of the means for generating this information are constructed separately.

次に図面を尋j!1して本発明の詳細な説明する。Next, ask for the drawing! 1, the present invention will be explained in detail.

第2図は本発明によるマルチパルス型ボコーダの分析側
の一実施例を示すブロック1」、第3図は本発明による
マルチパルス型ボコーダの合成側の一実施例を示すブロ
ック図である。
FIG. 2 is a block diagram showing an embodiment of the analysis side of the multi-pulse vocoder according to the present invention, and FIG. 3 is a block diagram showing an embodiment of the synthesis side of the multi-pulse vocoder according to the present invention.

第2図に示す本発明によるマルチパルス型ボコーダの分
析側は、LPC分析器7.相互相関敢算出器8.ピッチ
抽出器9.第1の符号化器10゜自己相関関数算出器1
1.音源パルス発生器12゜第2の符号化器13.第3
の符号化器14およびマルチブレフサ15t−備えて構
成される。
The analysis side of the multi-pulse vocoder according to the present invention shown in FIG. 2 includes an LPC analyzer 7. Cross-correlation calculator 8. Pitch extractor9. First encoder 10° autocorrelation function calculator 1
1. Source pulse generator 12. Second encoder 13. Third
The encoder 14 and the multi-blephr 15t are constructed.

入力端子7001を介して入力した入力音声信号は、L
PC分析器7.相互相関関数算出器8およびピッチ抽出
器9にそれぞれ供給される。
The input audio signal input via the input terminal 7001 is
PC analyzer7. The signals are supplied to a cross-correlation function calculator 8 and a pitch extractor 9, respectively.

LPG分析器7は入力音声信号全分析フレームごとに、
予め設定するビット数のデジタル〕−,″Cとして量子
化化し、この量子化音声信号@Lpc分析してLPC係
数としてのp次のにパラメータ(偏自己相関係数)を抽
出し、これを出力ライン701を介して第1の符号化器
10に供給する。本実施例においては分析フV−ムは2
0m8Ecに設定している。
The LPG analyzer 7 analyzes every frame of the input audio signal,
Quantize as digital]-,''C with a preset number of bits, analyze this quantized audio signal @Lpc, extract the p-order parameter (partial autocorrelation coefficient) as an LPC coefficient, and output it. is supplied to the first encoder 10 via line 701. In this example, the analysis frame V-frame is
It is set to 0m8Ec.

第1の符号化器lOは、入力したL I) C係数のj
 I’、子化と符号化全行なったのち、出力う・イン1
001全介してマルチプレクサ15に送出する。
The first encoder lO j of the input L I) C coefficients
I', after all childization and encoding, output In1
001 to the multiplexer 15.

L P C分析器7Fよまた。LPC係数からインパル
ス応答h(n)(0≦n≦M−1)全計算し、出カシイ
ン702.第1の符号化&StO,出カライフカライン
を介して相互41旧↓I4閣数算出器8および自己40
間関数算出器11に供給する。
LPC analyzer 7F again. The impulse response h(n) (0≦n≦M-1) is fully calculated from the LPC coefficients, and the output signal 702. 1st encoding & StO, mutual 41 old ↓ I4 cabinet number calculator 8 and self 40 via output lifecar line
is supplied to the interval function calculator 11.

相互相関関数算出器8は、入力音声信号どインパルス応
答h(n)と全利用して相互相関関数ψh8全計算し、
これ金山カライン801 全弁して音源パルス発生器1
2に送出する。
The cross-correlation function calculator 8 fully calculates the cross-correlation function ψh8 by fully utilizing the input audio signal impulse response h(n),
This is Kanayama Karain 801, all valves, sound source pulse generator 1
Send to 2.

また、自己A目関門数算出器11(よ、入力したインパ
ルス応答11(n)の自己相四門5’(CRhh ?−
泪Jし。
In addition, the self-phase four gates 5' (CRhh?-
Tears J.

これを出力ライン1101ffi介して音源パルス算出
器12に:1人出する。
This is output to the sound source pulse calculator 12 via the output line 1101ffi.

音源パルス算出器12tよ、こうして入力し定分析フレ
ームごとの相互相開関数ψ、X と自己相関間数”I+
h と全利用して(8)式の計算を実行し所定の故の音
源パルス列を得て、これらのパルスの振幅および位置情
報を出力ライン1201全介して第2の符号化器13に
送出し、これによって量子化および符号化を行なったの
ち出力ライン1301を介してマルチプレクサ15に送
出する。
Sound source pulse calculator 12t, input the mutual phase open function ψ,
h and performs the calculation of equation (8) to obtain a predetermined sound source pulse train, and sends the amplitude and position information of these pulses to the second encoder 13 via the output line 1201. , which performs quantization and encoding, and then sends it to the multiplexer 15 via an output line 1301.

このようにして、量子化および符号化されてマルチプレ
クサ15に送出されるLPG係数およびマルチパルスデ
ータは、入力音声信号のスペクトル包絡および音源情報
全表わすデータとしてマルチプレクサ15を介して所定
の方式で時分割され。
In this way, the LPG coefficients and multipulse data that are quantized and encoded and sent to the multiplexer 15 are time-divided in a predetermined manner via the multiplexer 15 as data representing all the spectral envelope and sound source information of the input audio signal. It is.

伝送路1501を介して第2図に示す分析側から第31
」に示す合成側に伝送されるが1分析側における処理に
おいて9分析フレーム内で発生すべきマルチパルスの数
は伝送ビットレートに対応して予め固定数のものとして
設定されており9女声もしくは幼児声の如く高ピッチ周
J!IIの入力音声信号全人力して1分析フレーム内に
存在する音源情報のパルス数の方が多い場合には忠実に
音源情報全分析して波形伝送を図ることができなくなシ
、このために合成側で再生される音声品質がこれら2っ
のパルス数の差に対応して劣化するという欠点を生ずる
ことは前述し友とおりである。
31 from the analysis side shown in FIG.
The number of multipulses that should be generated within an analysis frame in the processing on the analysis side is set as a fixed number in advance according to the transmission bit rate. High pitch Shu J like a voice! If the number of pulses of the sound source information existing in one analysis frame is larger than the number of pulses of the sound source information that exists in one analysis frame, it becomes impossible to faithfully analyze all of the sound source information and transmit the waveform. As mentioned above, the quality of the audio reproduced on the synthesis side deteriorates in response to the difference in the number of these two pulses, as mentioned above.

そこで9本実施例にあっては第2図に示すピッチ抽出器
9および第3の符号化器14ならびに後述する第3図に
示す切・)Y器20および代替性γ厚パルス発生器23
等金備え9次のようにしてこの欠点の除去を図っている
Therefore, in this embodiment, the pitch extractor 9 and the third encoder 14 shown in FIG.
Isometal Provision 9 attempts to eliminate this drawback as follows.

ピッチ抽出器9は入力音声信号を受けると1分析フレー
ムごとにその自己相関関数全算出し、これによってピッ
チ周期をめている。これは、入力音声信号が周44.Q
的であれば、この入力音声信号のピッチ族4jjlと同
じ遅れ時間における阿己相1”l閏を攻が最大値をとる
という原理に基づ(八て一般的によく利用されている手
法である。
When the pitch extractor 9 receives the input audio signal, it calculates the entire autocorrelation function for each analysis frame, and determines the pitch period based on this. This means that the input audio signal is around 44. Q
If the input audio signal has a pitch family of 4jjl and the delay time is the same as the pitch family of be.

ピッチ抽出器9は、入力音声信号の分析フレームごとに
そのピッチ周m*抽出し、このピッチ族1iJJが第2
1aに示すマルチパルス型ボコーダにおいて予め設にし
た固定数のマルチパルスよりも多いと判断したときはこ
れらの情報ff1i21:4に示す分析101からW、
3 L¥1に示す合成(illに伝送して、予め設定し
た個数のマルチパルスの代シに検出したピンチ周期に基
づいてモデル化したマルチパルスを発生せしめ、これを
音源情報すなわち、嘔動音源パルスとじてLPG合成を
行なわせるものであり、そのrlb作は次の如く行なわ
れる。
The pitch extractor 9 extracts the pitch range m* for each analysis frame of the input audio signal, and this pitch family 1iJJ is the second pitch family 1iJJ.
In the multi-pulse type vocoder shown in 1a, when it is determined that the number of multi-pulses is greater than the fixed number of multi-pulses set in advance, W from the analysis 101 shown in ff1i21:4 is performed.
3 Synthesis shown in L\1 (transmit to ill) to generate a multi-pulse modeled based on the detected pinch period instead of a preset number of multi-pulses, and use this as sound source information, that is, a vomiting sound source. LPG synthesis is performed as a pulse, and the rlb production is performed as follows.

すなわち、ピッチ抽出器9は分析フレームごとのピッチ
周期全抽出し、これを予め設定し几マルチパルスの個数
に対応するピッチ周期の判断域値と比較し、この判断域
値よりも小さいピッチ周期金有する分析フレームのピッ
チ4?f報9分析フレーム内に存在する音源パルスの先
頭および最終パルスもしくは先頭パルスのみの時間的位
置情報およびその振幅情報等を出力ライン901 ?介
して第3の符号化器14に送出するとともに8分析フレ
ームの音源パルスの個数がマルチパルスの個数よりも多
いことを合成側に通知する。2値の論理値〃INレベル
のマルチパルス代替制御信号を出力ライン902を介し
て出力しこれ全マルチプレクサ15に送出する。
That is, the pitch extractor 9 extracts all pitch periods for each analysis frame, compares them with a pitch period judgment threshold value set in advance and corresponding to the number of multi-pulses, and selects a pitch period period smaller than this judgment threshold value. Pitch 4 of analysis frame with? Output line 901 ? temporal position information and amplitude information of the first and last pulses of the sound source pulses existing in the analysis frame of f-report 9 or only the first pulse. It notifies the synthesis side that the number of excitation pulses in the eight analysis frames is greater than the number of multipulses. A multi-pulse alternative control signal with a binary logic value (IN) level is outputted via an output line 902 and sent to all multiplexers 15.

第3の符号化器14は、ピッチ抽出器9から入力した前
記諸情報に関するデータの団子化および符号化全行ない
これら全出力ライン1401’lr介してマルチプレク
サ15に送出する。
The third encoder 14 aggregates and encodes all the data related to the various information inputted from the pitch extractor 9, and sends it to the multiplexer 15 via these output lines 1401'lr.

マルチプレクサ15はこのようにして、ピンチ抽出器9
によって抽出されたピッチ周jiQがマルチパルスのピ
ッチ周期と同じかそれ以上の大きさであり、すなわち分
析フレームで発生すべきマルチパルスのパルス数が分析
フレーム1ノ]に、fr、在する音源パルスの数に等し
いかそれ以下の:、1+台には、出カライノ1001を
介して受けるI、P’C係数データ。
Multiplexer 15 thus connects pinch extractor 9
If the pitch period jiQ extracted by I, P'C coefficient data received via the output rhino 1001 are equal to or less than the number of :, 1+ units.

および出力ライン1301金介して受けるマルチパルス
データの転送音で凋送路15(11金介して予め定める
時分割方式によシ同時伝送し、またピッチ抽出器9によ
り°C抽出されたピッチト1期がマルチパルスのピンチ
周期よりも小さく、すなわち鋒11)V−ムで発生すべ
きマルチパルスのパルス数が分析フレーム内に存在する
音源パルスの故よりも多い場会には上述したデータのは
かに、出力う・1/1401全介して受ける上述した諸
′i+Llにl−4するデータおよび出力ライン902
 金ブCL/ −(□−1け6マルチパルス代替Wi制
御信号を含めて時分割同時伝送する。
The transmission sound of the multi-pulse data received via the output line 1301 is simultaneously transmitted in a predetermined time-sharing manner via the output line 15 (11K), and the pitch 1 period extracted by the pitch extractor 9 is is smaller than the pinch period of the multi-pulse, i.e. the number of pulses of the multi-pulse to be generated at V-me is greater than the number of source pulses present in the analysis frame. In addition, the above-mentioned data received through the output line 1/1401 and the output line 902
Metal block CL/-(□-1 digit 6 Multi-pulse alternative Wi control signal is included and transmitted simultaneously in time division.

第3図に示す合成側は、伝送路15o1を介して合成側
から伝送されたデータに基づいて入力音声信号の合成を
行なうものであシ、デマルチプレクサ16.第1の復号
化器17.第2の復号化器18、第3の復号化器19.
切替器20.LPC合成器21. LPF(LowPa
ssF’1lter)22および代替音源パルス発生器
23等を4ifiえて溝底される。
The synthesis side shown in FIG. 3 synthesizes input audio signals based on data transmitted from the synthesis side via a transmission path 15o1, and a demultiplexer 16. First decoder 17. Second decoder 18, third decoder 19.
Switcher 20. LPC synthesizer 21. LPF (Low Pa
ssF'lter) 22 and an alternative sound source pulse generator 23, etc., are installed.

デマルチプレクサ16は、伝送路1501 f介して入
力した各種データをマルチプレクサ15の時分割伝送形
式による変換前の状態に復元し、LPC係数データは出
力ライン161を介してε1↓lの復号化器17に、マ
ルチパルスデータは出方ライン162を介して第2の復
号化器18に、また判足域値以下のピッチ周期全抽出し
た分析フレームのピッチ周期、音源パルスの先頭および
最終パルスもしくは先頭パルスのみの時間的位置情報お
よびその振幅1青報は出力ライン163を介して第3の
復号化器19にそれぞれイ((給され、こ11.らの復
号化器によってデータの復号化全行なったりえ。
The demultiplexer 16 restores the various data input via the transmission line 1501f to the state before conversion by the time division transmission format of the multiplexer 15, and the LPC coefficient data is sent via the output line 161 to the decoder 17 of ε1↓l. Then, the multi-pulse data is sent to the second decoder 18 via the output line 162, and the pitch period of the analysis frame in which all pitch periods below the judgment threshold are extracted, the first and last pulses of the sound source pulses, or the first pulse. The temporal position information and its amplitude information are respectively supplied to the third decoders 19 via output lines 163, and these decoders perform all the decoding of the data. picture.

それぞれ出力ライン171,181,191 に送出す
る。
They are sent to output lines 171, 181, and 191, respectively.

また、デマルチグレクザ16’!f:介して出力される
マルチパルス化・滓叩制御信号データは出力ライン16
4を介して切替器20および代替音源パルス発生器23
に送出される。
Also, Demultigrex 16'! f: The multi-pulsing/drilling control signal data output via the output line 16
4 via the switch 20 and the alternative sound source pulse generator 23
will be sent to.

レリ替器20は、出力ライン164を介して入力するマ
ルチパルス代替側(I11信号がないとき、゛ずなわち
分析f111のピップ−抽出器9によっ′C分析さfl
、た分析フレームのピッチ周期がマルチパルスのピッチ
周期とypしいかそれ以上の時間であって9分析フレー
ム内で発生されるマルチパルスの故が分析クレーム内に
存在する音源パルスのル(にパ)シいかそれよりも多く
て9発生すべきマルチパルス金音源留止として利用して
も合成音[J【の劣化の71よれかないときには出力ラ
イン181 を介して入力するマルチパルスデータを出
力ライン201 ffi介してLPG合成器21に送出
するように切替える。
The relay changer 20 receives a multi-pulse alternative input via the output line 164 (when there is no I11 signal, the pip-extractor 9 of the analyzer f111
, the pitch period of the analysis frame is yp equal to or longer than the pitch period of the multipulse, and the multipulse generated within nine analysis frames is the reason why the pitch period of the sound source pulse present in the analysis claim is ) or more than 9 multi-pulses should be generated even if used as a sound source stop, the synthesized sound [J The signal is switched to be sent to the LPG synthesizer 21 via the ffi.

LPC合成器21は、このようにして入力するマルチパ
ルスを音源情報としてp次の全極型デジタルフィルタの
駆動音源に利用し、また出力ライン171t−介して入
力するp次のLPG係数データを上記全極型デジタルフ
ィルタの係紋としてこのLPG会成フィルタを制御して
入力音声信号を合成し、これを出力ライン211 を介
してI、PF22に送出し、所定の低域フィルタリング
全行ってアナログ量の合成音声として出力ライン221
に送出する。
The LPC synthesizer 21 uses the thus inputted multipulses as sound source information for the driving sound source of the p-order all-pole digital filter, and also uses the p-order LPG coefficient data input via the output line 171t as the sound source information. This LPG composition filter is controlled as a link to the all-pole type digital filter to synthesize the input audio signal, and sends it to I and PF 22 via the output line 211, and performs all the predetermined low-pass filtering to convert it into an analog signal. Output line 221 as synthesized voice of
Send to.

さて、出力ライン164を介して論理値〃IIのマルチ
パルス代替制御信号が切替器20に供給されるとき、す
なわち分析側におけるピッチ抽出器9によって抽出され
た分析フレームのピンチ周期が判定域値よシも小さく、
従って分析71/−ム内で発生されるマルチパルスの故
よシも分析フレーム内に存在する音源パルスの数が多い
ときには。
Now, when the multi-pulse alternative control signal of logical value II is supplied to the switch 20 via the output line 164, that is, the pinch period of the analysis frame extracted by the pitch extractor 9 on the analysis side is equal to or less than the decision threshold value. The size is also small,
Therefore, due to the multipulses generated within the analysis frame, when the number of source pulses present in the analysis frame is large.

切替器20は次に述べるような代替晋源パルス金山カラ
イン231全介して代替音源パルス発生器23から受け
、これを出力ライン201を介して送出する音源パルス
デー夕に代えて代替音源パルスとして出力ライン202
を介してLP’C合成器21にIJI:給するように切
替える。
The switch 20 receives an alternative sound source pulse from the alternative sound source pulse generator 23 through the Jinshan line 231 and outputs it as an alternative sound source pulse in place of the sound source pulse data sent out through the output line 201. 202
IJI: is switched to be supplied to the LP'C synthesizer 21 via the LP'C synthesizer 21.

代替音源パルス発生器23は、出力ライン164を介し
てピッチ周期が判定域値よシも小さい分析フレームのピ
ッチ周期に関するデータを、また出力ライン191 ’
に介してこの分析フレームに含マれる音源パルスの先頭
パルスと最終パルスの時間fL置・11〒報ならびに4
腫幅情報に関するデータ、もしくは先頭パルスのみの時
間位1凌情報と振1惰青゛報にしコするデータ全入力す
る。
The alternative sound source pulse generator 23 sends data on the pitch period of the analysis frame whose pitch period is smaller than the decision threshold value via an output line 164 and also to an output line 191'.
The time fL position of the first pulse and the last pulse of the sound source pulses included in this analysis frame is determined through 11 and 4.
Enter all the data related to the tumor width information or the time and frequency information of only the first pulse.

分析フレームに対するスペクトル包絡情報ならびに音源
情報の標本1直抽出のためのヤンブリ/ダ周波f(は予
め既知であり1分析フレームの時間もまた予め設定され
、かつ短時間の分析フレーム内では音声信号の変化は緩
やかで船1ぼ定常的な信号と見なしうる。従って、サン
プリング周/1!数のピッチI:1期に対して分析フレ
ームに存在する音源パルスのピッチ周stI]tその大
きさに比I’11する整故比で対応せしめ、かつ音源パ
ルスの先頭パルスお上び最終パルスの時間的位置と糸幅
との情報にもとづいて、ピッチ抽出器9によって抽出し
たピッチ周期でモデル化しfc ′PILlのインパル
ス系列kg易に発生することができ、しかも音源パルス
の先頭パルスと最終パルスの時間位置情報全利用しうろ
ことによシ、これら複数のインパルス系列はすべて分析
フレーム内に含まれるように乎ることができる。
The spectral envelope information and the sound source information for the analysis frame are sampled directly. The change is gradual and can be regarded as a stationary signal.Therefore, the pitch period of the sound source pulse existing in the analysis frame for one period stI]t is compared to its magnitude. It is modeled using the pitch period extracted by the pitch extractor 9 based on the temporal position and thread width information of the first and last pulses of the sound source pulses. Impulse sequences of PILl can be easily generated, and all of the time position information of the first and last pulses of the sound source pulses can be used, so that all of these multiple impulse sequences are included in the analysis frame. I can buy it.

代替音源パルス発生器23はこのような内存の1紋のイ
ンパルス系列上発生し、この分析ピッチ周期でモデル化
したマルチパルス群を通常のマル、チパルスに対する代
替マルチパルス、すなわち代替音源パルスとして出力ラ
イン231に送出する。
The alternative sound source pulse generator 23 outputs a multi-pulse group generated on such an internal one-stroke impulse sequence and modeled with this analysis pitch period as an alternative multi-pulse to the normal multi-pulse, that is, as an alternative sound source pulse. 231.

なお、この代替音源パルス発生において利用すべき音源
パルスをその先頭パルスのみとしてモデル化する場合に
は9発生する代替音源パルスの全部が分析フレーム内に
包含されず1代替音源パルスのうち最終パルス分が次の
分析フレームと共通して存在する。いわゆる端数パルス
の存在が起シこのぶんだけ再生音質の劣化を招くという
点のみが異なる。
Note that if the sound source pulse to be used in generating this alternative sound source pulse is modeled as only its first pulse, all nine generated alternative sound source pulses will not be included in the analysis frame, and the last pulse of one alternative sound source pulse will not be included in the analysis frame. exists in common with the following analysis frame. The only difference is that the existence of so-called fractional pulses causes a corresponding deterioration in the reproduced sound quality.

このようにして発生した代替音源パルスは、切替器20
によってJ常のマルチパルスと代替えてLI’C合成器
21VC送出され、LPC分析器21はこの代替マルチ
パルスを駆動音源と17でLPcフィルタ金制呻して入
力音声信号の再生のためのLPC合成を行ない9分析ア
レーン・内で発生するマルチパルスの紋よシも分析フレ
ーム内に存在する音源パルスの数が多いときでも音質の
劣化fci=<ことなく入力音声信号の分析1合成を行
なうことができる。
The alternative sound source pulse generated in this way is transferred to the switch 20
The LI'C synthesizer 21 VC is sent to the LI'C synthesizer 21 VC instead of the normal multi-pulse, and the LPC analyzer 21 uses this substitute multi-pulse as a driving sound source and LPc filter filter 17 to perform LPC synthesis for reproducing the input audio signal. Analysis 1 synthesis of input audio signals can be performed without deterioration of sound quality fci=< even when there are many sound source pulses present in an analysis frame. can.

なオ、21(2L、<Ikp jびF43 B::、I
 K示す不発’jl (7) ’4% 7#[11;′
ll K オイテ&よ、]、PC係数としてIぐパラメ
ータを用いているが、これは他のLPC係故係数とえば
αパラメータ等を利用してもよく、また符号化)′、÷
とマルチプレクサ、:I、−よび復号化器とデマルチプ
レクサはそ五ぞれこれらを一体化した]4成のものとし
ても同1,1に実施し得ることは明らがであシ。
Nao, 21 (2L, <Ikp j and F43 B::,I
K indicates misfire'jl (7) '4% 7#[11;'
Although the I parameter is used as the PC coefficient, other LPC coefficients such as the α parameter may also be used.
It is clear that the same structure can also be implemented as a four-component structure, in which the decoder and demultiplexer are integrated.

またL P C合成フィルタtよ全極型以外の非極型デ
ジタルフィルタ等と置づ、1してもtよぼ同様に実IN
しうろこともまた明らかである。
Also, if we put LPC synthesis filter t as a non-polar type digital filter other than all-pole type, even if 1 is used, the actual IN is almost the same as t.
Shiuroko is also obvious.

以上説明した如く本発明によれば、マルチパルスボコー
ダにおいて1分析フレーム内で発生すべきマルチパルス
の数よシも分析フレーム内に存在する音源パルスの数が
多いときには分析フレームから抽出しtピッチ周期にも
とすいてモデル化した?J[のインパルス系列を前記マ
ルチパルスの代替用の代替音源パルスとして利用すると
いう手段を備えて入力音声信号の分析1合成を図ること
によって入力音声信号が女声もしくは幼児声の如くその
ピッチ周期が短い高声の場合でも再生音質の劣化全大幅
に改善することができるマルチパルス型ボコーダが実現
できるという効果がある。
As explained above, according to the present invention, in a multipulse vocoder, when the number of sound source pulses existing in an analysis frame is greater than the number of multipulses that should be generated within one analysis frame, the pulses extracted from the analysis frame are Did you model it after Totomo? Analysis and synthesis of the input audio signal is performed using a means for using the impulse sequence of J[ as an alternative sound source pulse for replacing the multi-pulse, so that the input audio signal has a short pitch period such as a female voice or a child's voice. This has the effect of realizing a multi-pulse vocoder that can significantly improve the quality of reproduced sound even in the case of high-pitched voices.

【図面の簡単な説明】[Brief explanation of drawings]

第11.1は従来のマルチパルス型ボコーダの基本的オ
ニ°厚成を示すブロック図、第2図は本発明によるマル
チパルス型ボコーダの分析側の一実施例金示すブロック
図、第3図は本発明によるマルチパルス型ボコーダの合
成側の一実施例を示すブロック図である。 1・・・・・・T、 P C@−戊器、2・・・・・・
I、PC分析器、3・・・・・・音源パルス発生器、4
・・・・・・減W器、訃旧・・聰感重み付は器、6・・
・・・・2乗胆差最小化器、7・・・用LPG分析器、
8・・・・・・相互相門関数算出器、9・・・・・・ピ
ッチ抽出i:丸 1o・・・・・・箒1の符号化器、1
2・・・・・・音源パルス発生器、13・・・・・・第
2の符号化器。 14・・団・箒3の符号化器、15・・・・・・マルチ
プレクサ、16・・・・・・デマルチプレクサ、17・
・・・・・第1の復号化器、18・・・川@2の復号化
器、19・・・°・・・第3の復号化器、20・・・・
・・ちU替器、21・・・・・・L P C合成器、2
2・・・・・・LPF、23・・・・・・代替竹原パル
ス発生器。 代理人 弁理士 内 原 蕊′− ″ 、)
Fig. 11.1 is a block diagram showing the basic structure of a conventional multi-pulse vocoder, Fig. 2 is a block diagram showing an embodiment of the analysis side of the multi-pulse vocoder according to the present invention, and Fig. 3 is a block diagram showing the basic structure of a conventional multi-pulse vocoder. FIG. 2 is a block diagram showing an embodiment of the synthesis side of a multi-pulse vocoder according to the present invention. 1...T, P C@-Bouki, 2...
I, PC analyzer, 3...Sound source pulse generator, 4
・・・・・・Reducing W device, old and new...Sensitive weighting is device, 6...
...square difference minimizer, LPG analyzer for 7...,
8... Mutual phase function calculator, 9... Pitch extraction i: circle 1o... Encoder of broom 1, 1
2... Sound source pulse generator, 13... Second encoder. 14... Dan Houki 3 encoder, 15... Multiplexer, 16... Demultiplexer, 17...
...First decoder, 18...River@2 decoder, 19...°...Third decoder, 20...
・・・Chi U changer, 21... LPC synthesizer, 2
2...LPF, 23...Alternative Takehara pulse generator. Agent: Patent Attorney Uchihara Uchihara

Claims (2)

【特許請求の範囲】[Claims] (1) 入力音声信号全分析フレームごとにLPC(L
inear Prediction Coeffici
ent、線形予測係数)分析して抽出したLPC係ik
スペクトル包絡情報とし、このスペクトル包絡情報とと
もに前記入力音声信号の音声情報音4苫成する音源情報
を分析フン−ムごとに、この音源情報の特徴に対応する
発生時間位置と振4!囁とを有する予め定めた複数個の
インノくルス系列(マルチパルス)を以って餞現して前
記入力音声信号の分析お工び合成を行なうマルチノくル
ス型ボコーダにおいて、前記入力音声信号の分析フレー
ムごとにピッチ周期を抽出し、前記分析フレーム長を前
記抽出されたピッチ周期で7111って得られる商値を
基皐とし、この商値に対応する数のインパルス系列を発
生させる手段t−有することを特徴とするマルチパルス
型ボコーダ。
(1) LPC (L
Inear Prediction Coeffici
ent, linear prediction coefficient) analyzed and extracted LPC coefficient ik
The spectral envelope information is used together with the spectral envelope information to analyze the sound source information forming the audio information sound 4 of the input audio signal. In a multi-nox vocoder that analyzes and synthesizes the input audio signal by analyzing and synthesizing the input audio signal by generating a plurality of predetermined innolux sequences (multipulses) having a whisper, the input audio signal is analyzed. A means for extracting a pitch period for each frame, using a quotient value obtained by multiplying the analysis frame length by 7111 times the extracted pitch period as a basis, and generating a number of impulse sequences corresponding to this quotient value. A multi-pulse vocoder characterized by:
(2)前記手段が、前記商値が前記予め定めた複数個の
数よりも大きいときに前記商値に対応する故のインパル
ス系列全発生させる手段であること全特徴とするマルチ
パルス型ボコーダ。
(2) A multi-pulse vocoder characterized in that the means is means for generating all impulse sequences corresponding to the quotient value when the quotient value is larger than the plurality of predetermined numbers.
JP58115538A 1983-06-27 1983-06-27 Multipulse type vocoder Granted JPS607500A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP58115538A JPS607500A (en) 1983-06-27 1983-06-27 Multipulse type vocoder
CA000457390A CA1219079A (en) 1983-06-27 1984-06-26 Multi-pulse type vocoder
US06/625,055 US4720865A (en) 1983-06-27 1984-06-26 Multi-pulse type vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58115538A JPS607500A (en) 1983-06-27 1983-06-27 Multipulse type vocoder

Publications (2)

Publication Number Publication Date
JPS607500A true JPS607500A (en) 1985-01-16
JPH0242239B2 JPH0242239B2 (en) 1990-09-21

Family

ID=14665007

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58115538A Granted JPS607500A (en) 1983-06-27 1983-06-27 Multipulse type vocoder

Country Status (1)

Country Link
JP (1) JPS607500A (en)

Also Published As

Publication number Publication date
JPH0242239B2 (en) 1990-09-21

Similar Documents

Publication Publication Date Title
US5295224A (en) Linear prediction speech coding with high-frequency preemphasis
JPS607500A (en) Multipulse type vocoder
JP2829978B2 (en) Audio encoding / decoding method, audio encoding device, and audio decoding device
CN101490749B (en) Audio data decoding device
JPH0411040B2 (en)
JPS6162100A (en) Multipulse type encoder/decoder
JPH0362280B2 (en)
JPH043879B2 (en)
JPH028900A (en) Voice encoding and decoding method, voice encoding device, and voice decoding device
JPS60239799A (en) Multipulse type vocoder
JPS6041100A (en) Multipulse type vocoder
JPS6087400A (en) Multipulse type voice code encoder
JPS6051900A (en) System and apparatus for encoding voice
JPH043878B2 (en)
US5216745A (en) Sound synthesizer employing noise generator
JPH01233499A (en) Method and device for coding and decoding voice signal
JPH0250200A (en) Voice encoder
JPS62215300A (en) Multipulse type vocoder
JPH01258000A (en) Voice signal encoding and decoding method, voice signal encoder, and voice signal decoder
Ni et al. Waveform interpolation at bit rates above 2.4 kb/s
JPS59116794A (en) Voice coding system and apparatus used therefor
JPH034300A (en) Voice encoding and decoding system
JPH01257999A (en) Voice signal encoding and decoding method, voice signal encoder and voice signal decoder
JPH01261700A (en) Voice coding system
JPH01293399A (en) System and device for speech encoding and decoding