JPS627098A - Multipulse encoder - Google Patents

Multipulse encoder

Info

Publication number
JPS627098A
JPS627098A JP60147256A JP14725685A JPS627098A JP S627098 A JPS627098 A JP S627098A JP 60147256 A JP60147256 A JP 60147256A JP 14725685 A JP14725685 A JP 14725685A JP S627098 A JPS627098 A JP S627098A
Authority
JP
Japan
Prior art keywords
filter
analysis
pulse
multipulse
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60147256A
Other languages
Japanese (ja)
Other versions
JPH059040B2 (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60147256A priority Critical patent/JPS627098A/en
Publication of JPS627098A publication Critical patent/JPS627098A/en
Publication of JPH059040B2 publication Critical patent/JPH059040B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はマルチパルス符号化装置に関し、特に音声合成
フィルタの出力波形に対して利得調整を施す機能を有す
るとともに分析側の分析フレーム周期と同期しかつ分析
フレーム間の連続性を保持しつつ分析フレームごとに独
立的に合成した音声波形をそれぞれ利得SA輩したのち
線形加算して合成音声を得る手段を有するマルチパルス
符号化装蓋におけるマルチパルス列符号化効率の改善を
図ったマルチパルス符号化装置に関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a multipulse encoding device, and in particular has a function of performing gain adjustment on the output waveform of a speech synthesis filter, and synchronizes with the analysis frame period on the analysis side. A multi-pulse string code in a multi-pulse encoding device having a means for obtaining synthesized speech by linearly adding the speech waveforms independently synthesized for each analysis frame while maintaining continuity between the analysis frames and then linearly adding them. The present invention relates to a multi-pulse encoding device with improved coding efficiency.

〔従来の技術〕[Conventional technology]

マルチパルス符号化装置は音源波形情報とじてマルチパ
ルスを利用する符号化装置であり、通常は固定小数点に
よる有限種度演算で音声波形を合成している。また音声
合成においては音声合成フィルタのダイナミックレンジ
、 S /N (S i gna l/No1se)比
を極力改善する目的でフィルタの出力側で音源の強さに
対応した利得Allを行なっている0 このようなマルチパルス符号化装置では、分析側で抽出
したマルチパルス列を音源情報としこれをαパラメータ
やにパラメータの如きLPC(Linear Pred
iction Coding、 @形予測符号化)係数
によるスペクトル包絡情報とともに合成側に送出して音
声合成を行なっている。
A multipulse encoding device is an encoding device that uses multipulses as sound source waveform information, and usually synthesizes audio waveforms using fixed-point finite-kind calculations. In addition, in speech synthesis, in order to improve the dynamic range and S/N (Signal/No1se) ratio of the speech synthesis filter as much as possible, all gains are performed on the output side of the filter in accordance with the strength of the sound source. In a multi-pulse encoding device such as
The signal is sent to the synthesis side together with spectral envelope information based on coefficients (e.g., @-type predictive coding) to perform speech synthesis.

分析側から合成側に送出するこれら時微パラメータは分
析フレーム単位、もしくは可変長フレームで伝送される
がいずれにせよ音声合成は分析フレーム単位で処理され
る。
These time-varying parameters sent from the analysis side to the synthesis side are transmitted in units of analysis frames or variable length frames, but in either case, speech synthesis is processed in units of analysis frames.

さて、上述した分析フレームは特徴パラメータの分析、
伝送上の都合等の観点でその時間長が設定されており従
って特徴パラメータの忠実な伝送とは原則的に無関係な
ものとなっている0このため、折角マルチパルス列を利
用し音源波形伝送を前提とするマルチパルス符号化装置
も、このような画一的な分析フレームごとの特徴パラメ
ータを合成側で連続的に利用するだけでは分析フレーム
境界に′またがる合成波形の忠実な連続性が基本的に無
視されてその波形再現性にも劣化をきたすことが避けら
れないという問題点がある。
Now, the analysis frame mentioned above is the analysis of feature parameters,
The length of time is set from the viewpoint of transmission convenience, and therefore it is basically unrelated to faithful transmission of characteristic parameters.For this reason, it is assumed that the sound source waveform is transmitted using a multi-pulse train. Even in multi-pulse encoding devices, it is difficult to ensure faithful continuity of the synthesized waveform across analysis frame boundaries by simply continuously using such uniform feature parameters for each analysis frame on the synthesis side. There is a problem in that it is ignored and the waveform reproducibility inevitably deteriorates.

この問題点に対し近時次のような改善策を考照したもの
が紹介されている0 すなわち1分析側の分析フレームに同期し、分析フレー
ム間の連続性を保持しつつマルチパルス列の音声合成フ
ィルタによるインパルス応答波形の合算としての合成波
形をインパルス応答持続時間を加味しながら再生してい
くという手段を介して分析フレーム間の不連続性の問題
を基本的に排除したマルチパルス符号化装置である。本
発明もこのようなマルチパルス符号化装置を対象とする
ものである。
To address this problem, the following improvement measures have recently been introduced.0 In other words, speech synthesis of multi-pulse trains while synchronizing with the analysis frame on the analysis side and maintaining continuity between analysis frames. This is a multi-pulse encoding device that basically eliminates the problem of discontinuity between analysis frames by reproducing a composite waveform as a summation of impulse response waveforms by a filter while taking into account the impulse response duration. be. The present invention is also directed to such a multipulse encoding device.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

しかしながら、分析フレーム間の不連続性の問題を排除
した従来のこの櫨のマルチパルス符号化装置にも次のよ
うなマルチパルス符号化装置特有の問題点が残留する。
However, even with this conventional multipulse encoding device by Hajiashi, which eliminates the problem of discontinuity between analysis frames, the following problems unique to the multipulse encoding device remain.

すなわちマルチパルスは元米、全極型モデルとして構成
する音声合成フィルタのインパルス応答の線形加算が入
力音声成形に極力近似したものとして検索されたもので
あり、従ってf#波形を近似する複数のパルス列として
検索されている。この検索にも極々のy5法があるがい
ずれにせよ声帯撮動波形11対応した複数の励振点を形
成しうるような数多くのパルスの乗合として構成され、
このためその符号化効率にも限定があるという問題があ
るO 本発明の目的は上述した欠点を除去し複数の励振点を1
個もしくはたかだか数11m程贋で代表しうる励振点を
もつようなマルチパルスを検索する手段を備えてマルチ
パルスの個数を大幅に低減しその符向化効率を大幅に改
善したマルチパルス符号化装置を提供することにある。
In other words, multi-pulse is a search for a linear summation of impulse responses of a speech synthesis filter configured as an all-pole model that approximates as much as possible the input speech shaping, and therefore a multiple pulse train that approximates the f# waveform. is being searched as. There are extreme y5 methods for this search, but in any case, it is configured as a multiplication of many pulses that can form a plurality of excitation points corresponding to the vocal cord imaging waveform 11.
Therefore, there is a problem that the coding efficiency is limited.The purpose of the present invention is to eliminate the above-mentioned drawbacks and to combine multiple excitation points into one.
A multi-pulse encoding device that is equipped with a means to search for a multi-pulse having an excitation point that can be represented by a fake or at most several 11 m, thereby greatly reducing the number of multi-pulses and greatly improving their encoding efficiency. Our goal is to provide the following.

〔1司4点を解決するための手段〕 本発明の装置は、音声合成フィルタの出力波形に対して
利得調整を施す機能を有するとともに分析側の分析クレ
ーム周期と同期しかつ分析フレーム間の連続性と保持し
つつ分析7V−ムごとに独立的に合成した音声波形をそ
れぞれ利得調整したのち線形加算して音声合成を得る手
段を有するマルチパルス符号化装置において、マルチパ
ルス分析を行なって検索されたマルチパルス列にもとづ
き分析フレームごとの入力背戸信号の位相等化フィルタ
のフィルタ係数を決定する位相等化フィルタ係数決定手
段と、前記位相等化フィルタによって位相等化を施され
た入力背戸信号に対して分析フレームごとにマルチパル
ス分析を再度5に施して出力マルチパルスを決定するマ
ルチパルス決定手段とを備えて構成される0 〔実施例〕 次ttC図面を参照して不発明の詳細な説明する0第1
図は本発明によるマルチパルス符号化装置の一実施例の
構成を示すブロック図である0第1図に示すマルチパル
ス符号化装置は分析側1と合成側2とから構成され、さ
らに分析側1は窓処理器101.切替器102.位相寺
化フィルタ103.切替器104.係数算出器1o5.
マルチパルス分析器106.1.PC分析器107゜マ
ルチパルス符号化器108.LPC係数符号化器109
およびマルチブレフサ110を備えて構成される。また
1合成側2はデマルチブレフサ201、LPC係数復号
化器202.正規化マルチパルス復号化器203.・最
大振幅復号化器2o4゜LPC合成フィルタ2051乗
算器206および波形接続器207を備えて構成される
[Means for solving 1 and 4 points] The device of the present invention has a function of performing gain adjustment on the output waveform of the speech synthesis filter, and is synchronized with the analysis claim period of the analysis side and is continuous between analysis frames. In a multipulse encoding device having a means for obtaining speech synthesis by linearly adding the speech waveforms independently synthesized for each 7V-me while maintaining their characteristics, after adjusting the gain, multipulse analysis is performed and the search is performed. a phase equalization filter coefficient determining means for determining a filter coefficient of a phase equalization filter of an input back door signal for each analysis frame based on a multi-pulse train; and a multi-pulse determining means for determining the output multi-pulse by performing multi-pulse analysis again for each analysis frame. 0th 1st
The figure is a block diagram showing the configuration of an embodiment of the multi-pulse encoding device according to the present invention. The multi-pulse encoding device shown in FIG. is the window treatment device 101. Switcher 102. Phase conversion filter 103. Switcher 104. Coefficient calculator 1o5.
Multipulse analyzer 106.1. PC analyzer 107° multipulse encoder 108. LPC coefficient encoder 109
and a multi-breather 110. Furthermore, the 1 synthesis side 2 includes a demultiplexer 201, an LPC coefficient decoder 202, and so on. Normalized multipulse decoder 203. - Maximum amplitude decoder 2o4° Consists of LPC synthesis filter 2051, multiplier 206, and waveform connector 207.

入力ライン1001 t−介して入力した入力音声信号
信号は窓処理器101によってLPF(LowPass
 Filter )にかけられて下漬の高域周波数を遮
断したのちA/Dコンバータによって所定のサンプリン
グ周波数81d(zで標本化されたのち所定のど、ト数
12ビ、トでサンプルごとに量子化される。この量子化
音声信号は−H内部メモリにあらかじめ設定する時間分
ずつ、たとえば20m5ECすなわち160サンプル分
ずつあらかじめ設定する窓関数たとえは矩形関数によっ
て切出され格納される。
The input audio signal input through the input line 1001 is passed through the window processor 101 through an LPF (Low Pass Pass).
The sample is sampled by an A/D converter at a predetermined sampling frequency of 81d (z), and then quantized for each sample at a predetermined number of 12 bits. This quantized audio signal is cut out and stored in the -H internal memory by a preset window function, for example, a rectangular function, for each preset time, for example, 20m5EC, that is, 160 samples.

こうして格納された量子化音声信号はまた20m5EC
ずつ次々に読出され切替器102.104を介してマル
チパルス分析器106に供給されこれがマルチパルス分
析における基本分析フレーム長となる。
The quantized audio signal thus stored is also 20m5EC
The signals are read out one after another and supplied to the multi-pulse analyzer 106 via switchers 102 and 104, and this becomes the basic analysis frame length in multi-pulse analysis.

マルチパルス分析5106は公知のマルチパルス抽出技
術を利用し基本分析フレームごとにマルチパルス列を抽
出する。
Multipulse analysis 5106 extracts a multipulse train for each basic analysis frame using a known multipulse extraction technique.

公知のマルチパルス列抽出技術としては、いわゆるスペ
クトル領域評価としてのAbS(Ana Iys i 
5−bysynthesis)処理や、いわゆる相関領
域評価としての相関関数処理等があるが本実施例では後
者の手法を利用している。
As a known multi-pulse train extraction technique, AbS (Ana Iys i) is a so-called spectral domain evaluation.
5-bysynthesis) processing, correlation function processing as so-called correlation region evaluation, etc., and in this embodiment, the latter method is used.

この相関領域評価は、入力音声信号と分析側における分
析評価用合成フィルタのインパルス応答との相互相関お
よびインパルス応答の自己相関を利用して所望のマルチ
パルス列を検索するものである。この目的に利用する分
析評価用合成フィルタはLPC分析器107に内蔵され
ておシマルチパルス分析器106はLPC分析器107
からインパルス応trt入力しつつマルチパルスの検索
ヲ行なう。本実施例においてはこのマルチパルスの検索
は最先頭の基本分析フレーム分を除き各分析フレーム長
く次々にマルチパルスによるインパルス応答持続時間を
加味してあらかじめ設定するいわゆる孤立時間で実行し
その旺細は次のとおりである。
This correlation region evaluation searches for a desired multipulse sequence by using the cross-correlation between the input audio signal and the impulse response of the analysis-evaluation synthesis filter on the analysis side and the autocorrelation of the impulse response. The analysis and evaluation synthesis filter used for this purpose is built into the LPC analyzer 107.
A multi-pulse search is performed while inputting an impulse response from . In this embodiment, this multi-pulse search is performed for a long period of time for each analysis frame, except for the first basic analysis frame, using a so-called isolated time that is preset by taking into account the impulse response duration due to multi-pulses. It is as follows.

LPC分析器107は量子化音声信号を30rnSBC
のハミング関数で切出しつつ20m5ECの基本分析フ
レーム長で読出しながらこの童子化音声信号に公知のL
PG分析を行ない所定の次数のLPC係数を抽出する。
The LPC analyzer 107 converts the quantized audio signal into 30rnSBC
While cutting out using the Hamming function of
PG analysis is performed to extract LPC coefficients of a predetermined order.

このLPC係数は内蔵合成フィルタの係数として利用さ
れ声道フィルタの聴感重みづけインパルス応答が求めら
れる。このインパルス応答はマルチパルス分析m106
に供給される。
These LPC coefficients are used as coefficients of the built-in synthesis filter to obtain the auditory weighted impulse response of the vocal tract filter. This impulse response is multipulse analysis m106
supplied to

マルチパルス分析器106は基本分析フレームごとの量
子化音声信号とインパルス応答との相互相関演算ならび
にインパルス応答の自己相関演算を介して゛まず最先頭
の基本分析フレームのマルチパルス列を検索する。
The multipulse analyzer 106 first searches for the multipulse train of the foremost basic analysis frame through a cross-correlation calculation between the quantized audio signal and the impulse response for each basic analysis frame and an autocorrelation calculation of the impulse response.

さて、こうして求められた最先頭の基本分析フレームの
マルチパルス列はLPC分析器107に供給され内蔵合
成フィルタによるインパルス応答が求められる。このマ
ルチパルスによるインパルス応答波形は、基本分析フレ
ームにわたる部分と基本分析フレームを超えて接続する
部分との両刀をマルチパルス分析器106に供給される
。ただし、基本分析フレームを超えて接続するインパル
ス応答接続時間は合成音声の品質レベル等を勘案してあ
らかじめ設定する時間範囲に限定している。
Now, the multi-pulse train of the foremost basic analysis frame obtained in this way is supplied to the LPC analyzer 107, and an impulse response is obtained by the built-in synthesis filter. The impulse response waveform generated by this multi-pulse is supplied to the multi-pulse analyzer 106 with both a portion spanning the basic analysis frame and a portion connecting beyond the basic analysis frame. However, the impulse response connection time beyond the basic analysis frame is limited to a time range set in advance, taking into consideration the quality level of the synthesized speech.

マルチパルス分析器106は次の基本:A−析フレーム
の量子化音声信号と、この基本分析フレームの時間領域
にまたがる前基本分析フレームのインパルス応答波形の
童子化データとを極性を考慮して加算合成し、基本分析
フレーム間の連続性を保持した量子化音声信号を相続く
基本分析フレームに対して次々に設定していく。こうし
て基本分析フレーム間の連続性を保持しつつ再度マルチ
パルス列を検索する。
The multipulse analyzer 106 adds the quantized audio signal of the following basic analysis frame and the doji-ized data of the impulse response waveform of the previous basic analysis frame spanning the time domain of this basic analysis frame, taking polarity into account. Quantized audio signals that are synthesized and maintain continuity between basic analysis frames are set one after another for successive basic analysis frames. In this way, the multipulse train is searched again while maintaining the continuity between the basic analysis frames.

こうして検索されるマルチパルス列は基本分析フレーム
相互間の連続性は保持されているもののマルチパルス列
符号化効率の観点から言えば従来のマルチパルス符号化
装置と基本的には何等変っていない。そこで本実施例で
は次のような位相等化を窓処理5101の出力に対して
施しこの問題の解決を図っている。
Although the multi-pulse train searched in this way maintains continuity between basic analysis frames, it is basically no different from the conventional multi-pulse encoding device from the viewpoint of multi-pulse train encoding efficiency. Therefore, in this embodiment, the following phase equalization is applied to the output of the window processing 5101 to solve this problem.

この位相等化の基本的な考え刀は次のとおりである。す
なわち、いま検索されたマルチパルス列があり、これが
LPCqf、数で構成される全極型ディジタルフィルタ
で構成きれる音声合成フィルタに印加されるときその・
インパルス応答波形の線形加算が所望の音源1#報を提
供するものとする。このようなディジタルフィルタは容
易に構成することができる。
The basic idea of this phase equalization is as follows. In other words, there is a multi-pulse train that has just been retrieved, and when this is applied to a speech synthesis filter that can be composed of an all-pole digital filter consisting of LPCqf, its ・
Assume that linear addition of the impulse response waveforms provides the desired source 1# information. Such a digital filter can be easily constructed.

この場合、検索されたマルチパルスの代りにこれらマル
チパルス列にもとづいである代表インパルスを設定し、
このインパルス応答も音源清報をほぼ満足しうるものが
得られるとする。このようなインパルスの設定も容易に
設定可能である。
In this case, instead of the searched multipulse, a representative impulse is set based on these multipulse trains,
It is assumed that this impulse response can also be obtained that almost satisfies the sound source information. Such impulse settings can also be easily set.

逆に、マルチパルス列によって得られるインパルス応答
波形を代表インパルスの応答波形rc変換するフィルタ
が存在すれば、入力音声信号をこのフィルタを通してか
らマルチパルスを検索すれば前記マルチパルス列の代シ
に前記代表インパルスが求められることは明らかである
。入力音声信号の位相等化の目的もかかるフィルタによ
つてマルチパルスの代シにパルス数を大幅に低減したか
かる代表インパルスを得ることにある。このようなフィ
ルタが位相等化フィルタである。なお、上記した代表イ
ンパルスはピッチ周期等に対応しつつ基本分析フレーム
ごとに通常複数個が得られることとなる。
On the other hand, if there is a filter that converts the impulse response waveform obtained by a multi-pulse train into the response waveform of a representative impulse (RC), then if the input audio signal is passed through this filter and then searched for a multi-pulse, the representative impulse is replaced by the multi-pulse train. It is clear that this is required. The purpose of phase equalization of the input audio signal is to use such a filter to obtain such a representative impulse with a significantly reduced number of pulses instead of a multi-pulse. Such a filter is a phase equalization filter. Note that a plurality of representative impulses described above are usually obtained for each basic analysis frame, corresponding to pitch periods and the like.

位相等化フィルタの基本的な概念は誉田9寸谷両氏によ
り紹介されておシ、例えば「位相等化処理を用いた音声
符号化」日本音響学会音声研究会資料584−05.1
984年4月に記載されている。
The basic concept of phase equalization filters was introduced by Mr. Honda 9, Sutani, for example, "Speech Coding Using Phase Equalization Processing," Acoustical Society of Japan Speech Study Group Material 584-05.1.
Written in April 1984.

さて、上述した位相等化フィルタはトランスバーサル型
のディジタルフィルタ等で容易に実現できることは明ら
かであり1位相等化フィルタ103はかかる目的のディ
ジタルフィルタである。
Now, it is clear that the above-mentioned phase equalization filter can be easily realized by a transversal type digital filter or the like, and the one-phase equalization filter 103 is a digital filter for such purpose.

係数算出器105は位相等化フィルタ103のフィルタ
係数を提供するものであり、このフィルタ係数はマルチ
パルス分析器106から供給されるマルチパルス列を利
用し次のようにして決定される。
The coefficient calculator 105 provides filter coefficients for the phase equalization filter 103, and the filter coefficients are determined as follows using the multipulse train supplied from the multipulse analyzer 106.

いまマルチパルス(もしくは予測残差波形)をe (n
)とし、また位相等化フィルタのインパルス応答をbi
n)(m=0 、1 、2.−、 M )で表わすと位
相等仕残差波形は次の(1)式のep(n)で示すこと
ができる。
Now, the multipulse (or predicted residual waveform) is expressed as e (n
), and the impulse response of the phase equalization filter is bi
n) (m=0, 1, 2.-, M), the phase equalization residual difference waveform can be expressed as ep(n) of the following equation (1).

またピ、テパルス列は(2)式のeM(n)で示される
Further, the pi,te pulse train is represented by eM(n) in equation (2).

(2)式のδはクロネオ力のデルタでありn=nzつま
りδ(0)のとき振幅1のパルスとなり、またnz’−
nt−tがピッチ周期となる。
δ in equation (2) is the delta of the Croneo force, and when n = nz, that is, δ(0), it becomes a pulse with an amplitude of 1, and nz'-
nt-t is the pitch period.

係数算出器105はマルチパルスe (n)を入力しe
(n)の自己相関係数を求め、この係数の最大値を検索
することによシ先ずピッチ周期を算出したあと、このピ
ッチ周期と同じ周期を有しかつその時間的位置もほぼ一
致するピ、テバルス列eM(n)をマルチパルス列から
選択する。
The coefficient calculator 105 inputs the multipulse e (n) and e
First, calculate the pitch period by finding the autocorrelation coefficient of (n) and searching for the maximum value of this coefficient. , the Teval pulse train eM(n) is selected from the multi-pulse train.

上記e p(n)とeM(n)とが最もよくマ、テング
する所望のh(ホ)は(1)式で示される位相等化残差
波形e p(nlと(2)式で示されるビ、テパルス列
e M(n)との自乗誤差を最小化することによって求
められる。
The desired h(e) which is best expressed by the above e p(n) and eM(n) is the phase equalized residual waveform e p(nl) shown by the equation (1) and the desired h(e) which is expressed by the equation (2). It is obtained by minimizing the squared error with the pulse train e M(n).

自乗誤差りは次の(3)式によって表現される。The squared error is expressed by the following equation (3).

・・・・・(3) ただしく3)式においてLは区間0〜M−IK含まれる
ピッチパルスの数である。
...(3) However, in equation 3), L is the number of pitch pulses included in the interval 0 to M-IK.

おくことによってe、in)とe yt (n)との自
乗誤差を最小化するインパルス応答h(ホ)が求まる0
・e(n−k))      ・・・・・・(4)(4
)式を零とおいて次の(5)式が得られる。
By setting
・e(n-k)) ・・・・・・(4)(4
) is set to zero, the following equation (5) is obtained.

・・・・・・(5) (k=0.1,2.・・・、M) (5)式からh−は(k+x )元(k+1)次号程式
から求められる0この算出式は次の(6)式に示す如き
マトリックス方程式として示すことができる。
......(5) (k = 0.1, 2..., M) From equation (5), h- is obtained from the (k+x) element (k+1) order equation. This calculation formula is as follows. It can be expressed as a matrix equation as shown in equation (6).

・・・・・(6) (6)式においてVβ)、φi8)はそれぞれ(7)i
8)式に示す内容である。
...(6) In equation (6), Vβ) and φi8) are each (7)i
8) The content is shown in formula.

(8)式においてy(n)はピッチパルス列の波形表現
である。
In equation (8), y(n) is a waveform representation of the pitch pulse train.

(6)式からも明らかな如く、係数マトリ、クスはマル
チパルスの自己相関係数であり、また係数ベクトルはマ
ルチパルスとピッチパルス列の相互相関係数である。
As is clear from equation (6), the coefficient matrix, x, is the autocorrelation coefficient of the multipulse, and the coefficient vector is the crosscorrelation coefficient of the multipulse and the pitch pulse train.

係数演算器105は+6)、(力および(8)弐にもと
−づ〈演算を実行し最適インパルス応答り一を算出した
あとこのインパルス応答をもつトランスバーサルフィル
タの係真を算出しこれを位相等化フィルタ103のフィ
ルタ係数として供給する。
The coefficient calculator 105 calculates the coefficient coefficient of the transversal filter having this impulse response after performing the calculation based on the force (+6) and (8)2 and calculating the optimum impulse response coefficient. It is supplied as a filter coefficient of the phase equalization filter 103.

位相等化フィルタ103は入力したフィルタ係数を利用
し所望のトランスパーサル型ディジタルフィルタとして
構成される。こうして構成される位相等化フィルタ10
3のインパルス応答は勿論htn)である。
The phase equalization filter 103 is configured as a desired transversal type digital filter using the input filter coefficients. Phase equalization filter 10 configured in this way
The impulse response of 3 is of course htn).

窓処理器101から出力される基本分析フレームごとの
童子化音声信号は切替器102を介して位相等化フィル
タ103に供給されそのインパルス応答出力が切替器1
04を介してマルチパルス分析器106およびLPC分
析器107に供給される〇 マルチパルス分析器106はこうして位相等化フイ”ル
タ103から基本分析7レ一人ごとの位相等化済みの童
子化音声信号を受けこれを対象としてマルチパルス検索
を相関領域評価によって前述した処理と同様にして実施
する。この場合LPC分釘器107も位相等化フィルタ
103から同じ入力を基本分析フレームごとrcgtけ
これをLPC分析しりつ所足の次数のLPC係数を抽出
しこれを内蔵音声合成フィルタの係数として求めたイン
パルス応答をマルチパルス分析器106に提供する。た
だし、こうしてLPC9pfr器107に入力される量
子化音声信号は位相等化フィルタ103を介して入力し
たものであるにせよ音源特性を基本的に保持しているこ
とば前述したとおシであシ、従って付号化装置の必要種
度、運用目的等を勘案し再度LPC分析を実施するか否
かを任意に決定してよい。
The doji-ized audio signal for each basic analysis frame output from the window processor 101 is supplied to the phase equalization filter 103 via the switch 102, and its impulse response output is sent to the switch 1.
04 to the multi-pulse analyzer 106 and the LPC analyzer 107. The multi-pulse analyzer 106 thus receives the phase-equalized doji-ized audio signal for each basic analysis 7 layer from the phase equalization filter 103. A multi-pulse search is performed using correlation region evaluation in the same way as the processing described above.In this case, the LPC divider 107 also receives the same input from the phase equalization filter 103 for each basic analysis frame and converts it into an LPC The impulse response obtained by extracting the LPC coefficients of the order required for analysis and using them as coefficients of the built-in speech synthesis filter is provided to the multipulse analyzer 106. However, the quantized speech signal input to the LPC9pfr device 107 in this way Although it is input through the phase equalization filter 103, it is the same as above that basically maintains the sound source characteristics. However, it may be arbitrarily determined whether or not to perform the LPC analysis again.

マルチパルス分析器105はこうして基本分析フレーム
ごとにビ、テ周期等に対応して設定される数の代表イン
パルスを従来のマルチパルスに代えて決定するが、この
代表インパルスによって表現されるマルチパルス(以下
単に代表マルチパルスと呼ぶ)は従来のマルチパルスよ
シも著しくその数を少なくすることができるほか次のよ
うな性徴がある。
In this way, the multipulse analyzer 105 determines the number of representative impulses set corresponding to the vi, te periods, etc. for each basic analysis frame, instead of the conventional multipulse, but the multipulse ( The number of representative multipulses (hereinafter referred to simply as representative multipulses) can be significantly reduced compared to conventional multipulses, and they also have the following characteristics.

すなわち、このよりな代表マルチパルスの決定において
は入力音声信号の電カスベクトルには全熱変更を加えず
ただ周波数対位相特性の賀化だけを介してマルチパルス
列のパルス数を減少せしめ、従ってパルス数/入出力の
信号対雑音比を大幅に減少、改善したものとしている0 さて、マルチパルス分析器106によって分析され決定
された代表マルチパルスからなるマルチパルス列はマル
チパルス符号化器108に供給され所定の形式で符号化
される。この符号化器108に対するマルチパルスの入
力は基本分析クレームの周期で行なわれるが、この基本
分析フレームは前述した如くインパルス応答持続時間の
内容をlH味して再設定したものである。このような再
設定基本分析フレームごとのマルチパルス列はその中の
レベル最大なものの振幅とその時間位置情報とを符号化
した最大振幅符号と、再設定基本分析フレームごとに得
られるマルチパルスを前記最大振幅を基準として正規化
した振幅値と七の時間位置情報に関する正規化マルチパ
ルス符号とに分けて出力しマルチプレクサ110に供給
する0本実施例においては正規化マルチパルス符号は最
大倣1鴫を1として正規化されたtマルチパルスの符号
化データでめる0 LPC係数符号化器109はLPC分析器107から再
設定基本分析フレームごとのLPG係数を受けこれを所
定の形式で符号化してLPC符号とシテマルテグレクサ
110に供給スル。
In other words, in determining a more representative multi-pulse, the number of pulses in the multi-pulse train is reduced only by changing the frequency vs. phase characteristics without making any total thermal change to the electric flux vector of the input audio signal. The multipulse train consisting of representative multipulses analyzed and determined by the multipulse analyzer 106 is supplied to the multipulse encoder 108. Encoded in a predetermined format. The input of multi-pulses to the encoder 108 is performed at the cycle of the basic analysis frame, and this basic analysis frame is reset with the content of the impulse response duration taken into consideration as described above. The multipulse train for each reset basic analysis frame has a maximum amplitude code that encodes the amplitude of the maximum level one among them and its time position information, and a multipulse obtained for each reset basic analysis frame as the maximum amplitude code. In this embodiment, the normalized multi-pulse code is divided into an amplitude value normalized using the amplitude as a reference and a normalized multi-pulse code related to time position information, and is supplied to the multiplexer 110. The LPC coefficient encoder 109 receives the LPG coefficients for each reset basic analysis frame from the LPC analyzer 107 and encodes them in a predetermined format to generate an LPC code. and supplied to Shite Marte Grexa 110.

マルチプレクサ110はこうして受けた各符号化データ
を剪定の形式で多電化し伝送路1002を介して合成側
2に伝送する0 合成側2ではデマルチブレフサ201で入力の多電化を
分離したのちLPG符号はLPG係数復号化器202に
、正規化マルチパルス符号は正規化マルチパルス復号化
器203に、また最大振幅符号は最大振幅復号化器20
4にそれぞれ供給され復号化される。
The multiplexer 110 multiplies each encoded data received in this way in the form of pruning and transmits it to the combining side 2 via the transmission line 1002. On the combining side 2, the demultiplexer 201 separates the input multiplicity, and then the LPG code is converted into LPG code. The normalized multipulse code is sent to the coefficient decoder 202, the normalized multipulse code is sent to the normalized multipulse decoder 203, and the maximum amplitude code is sent to the maximum amplitude decoder 20.
4 and are decoded.

こうして復号化されたLPC係数はLPC合成フィルタ
205に供給されてそのフィルタ係数として利用される
The LPC coefficients thus decoded are supplied to the LPC synthesis filter 205 and used as filter coefficients.

また正規化マルチパルスはLPC合成フィルタ205の
駆動用音源として供給されさらに最大振幅は乗算器20
6に供給される0 LPC合成フィルタ205は分析側のLPC分析器10
7の内蔵の分析用合成フィルタと基本的にはほぼ同一の
全極型ディジタルフィルタでありLPG係数をフィルタ
係数とし正規化マルチパルスを音源情報として駆動され
ディジタル音声信号を出力する。ただこのディジタル音
声信号にはマルチパルスの振幅情報はまだ利用されてい
ない。
Further, the normalized multi-pulse is supplied as a driving sound source to the LPC synthesis filter 205, and the maximum amplitude is supplied to the multiplier 205.
6, the LPC synthesis filter 205 is supplied to the LPC analyzer 10 on the analysis side.
It is basically an all-pole type digital filter that is almost the same as the built-in analytical synthesis filter of No. 7, and uses LPG coefficients as filter coefficients and is driven with normalized multi-pulses as sound source information, and outputs a digital audio signal. However, multipulse amplitude information is not yet used in this digital audio signal.

ANのLPCボコーダ等ではLPG合成フィルタ205
0入力側で復号化した最大振幅を利用して正規化を復旧
し実レベル情報を付与したマルチパルス列とするが、本
実施例ではLPC合成フィルタ205の出力1111で
実施する。
LPG synthesis filter 205 in AN LPC vocoder etc.
The maximum amplitude decoded on the 0 input side is used to restore normalization and create a multi-pulse train with actual level information added. In this embodiment, this is performed at the output 1111 of the LPC synthesis filter 205.

LPC合成フィルタ205から出力されるディジタル音
声信号は再設定基本分析フレームごとに乗算器206に
供給される。
The digital audio signal output from the LPC synthesis filter 205 is supplied to the multiplier 206 for each reset basic analysis frame.

乗算器206にはまた再設定基本分析フレームごとに最
大振幅データが供給され、これら2人力の乗算を介して
実レベルの振幅情報を付与されたディジタル音声信号は
波形接続器207に供給される。
Maximum amplitude data is also supplied to the multiplier 206 for each reset basic analysis frame, and the digital audio signal to which actual level amplitude information has been added through these two manual multiplications is supplied to the waveform connector 207.

波形接続器207はこうして再設定分析フレームごとに
次々に入力するディジタル音声信号を時系列的に次々に
線形加算したあと1)/Aコンバータでアナログ音声信
号に変換し、ざらにLPFを介して不要な高周波成分を
除去して出力ライン2001に出力音声として送出し、
かくして分析側の分析フレーム周期と同期しかつ分析フ
レーム間の連続性を保持しつつ分析フレームごとに独立
的に音声波形を合成する処理を介しての音声合成がマル
チパルス列符号化効率の大幅な改善のもとに各局に実施
される。
In this way, the waveform connector 207 linearly adds the digital audio signals that are input one after another for each resetting analysis frame in time series, converts them into analog audio signals using the 1)/A converter, and roughly passes them through the LPF to eliminate unnecessary signals. high frequency components are removed and sent as output audio to the output line 2001.
In this way, speech synthesis through the process of independently synthesizing speech waveforms for each analysis frame while synchronizing with the analysis frame period on the analysis side and maintaining continuity between analysis frames greatly improves multipulse train coding efficiency. This will be implemented at each station under the

第2図は本発明の第2の実施例の構成を示すプロ、り図
であり分析側1′および合成側2′よりなり、また分析
側1′は窓処理器101.切替器102、位相等化フィ
ルタ103.切替器104゜係数算出器105.マルチ
パルス分析器106゜LPC分析器107.マルチパル
ス符号化器108゜LPC係数109.マルチプレクサ
110および等化係数符号化器111を備えて構成され
、また合成側2′はデマルチブレフサ201.LPC係
数符号化器202.正規化マルチパルス復号化器203
、最大振幅復号化器204.LPC合成フィルタ205
1乗算器206.波形接続器207゜等化係数復号化器
208および位相分散フィルタ209を備えて構成され
る。
FIG. 2 is a schematic diagram showing the configuration of a second embodiment of the present invention, which consists of an analysis side 1' and a synthesis side 2', and the analysis side 1' has a window processor 101. Switcher 102, phase equalization filter 103. Switcher 104° Coefficient Calculator 105. Multipulse analyzer 106° LPC analyzer 107. Multipulse encoder 108° LPC coefficients 109. It is configured to include a multiplexer 110 and an equalization coefficient encoder 111, and the synthesis side 2' includes a demultiplexer 201. LPC coefficient encoder 202. Normalized multipulse decoder 203
, maximum amplitude decoder 204 . LPC synthesis filter 205
1 multiplier 206. It is configured with a waveform connector 207, an equalization coefficient decoder 208, and a phase dispersion filter 209.

これら構成品目中、分析側i’i’cあっては等化係数
符号化器111、また合成@ll 2 ’にあつ℃は等
化係数後号器208と位相分散フィルタ209以外はす
べて第1図のに示す第1の実施例における分析側1′と
合成側2′における同一記号のものと全く同一であシ、
これら同一のものに関しては詳細な説明は省略する0 この第2の°犬施例は分析側で算出される位相等化フィ
ルタ係数を符号化してマルテノくルス、LPC係数等と
ともに合成側に伝送し、分析フレームごとに独立的に合
成した音声波形の位相分散を行なって合成音声の品質を
さらに改善しようとするものである。
Among these components, the analysis side i'i'c is the equalization coefficient encoder 111, and the synthesis @ll2' is the equalization coefficient post-encoder 208 and the phase dispersion filter 209. They are exactly the same as those with the same symbols on the analysis side 1' and the synthesis side 2' in the first embodiment shown in the figure.
Detailed explanations regarding these same items will be omitted. This second embodiment encodes the phase equalization filter coefficients calculated on the analysis side and transmits them to the synthesis side together with the Martenorculus, LPC coefficients, etc. , which attempts to further improve the quality of synthesized speech by performing phase dispersion of speech waveforms synthesized independently for each analysis frame.

分析側1′における等化係数符号化器111は係数算出
器105から位相等化フィルタ103に供給される位相
等化フィルタ係数と同じ内容のデータを受けてこれを所
定の形式で符号化したうえマルチプレクサ110に送出
するQ マルチブレフサ110は、最大振幅符号、正規化マルチ
パルス符号ならびにI、PC符号とともに等化係数符号
をあらかじめ定めた形式で多重化しこれを伝送路100
2を介して合成側2′に送出する0 合成側2′においてはデマルチプレクサ201で受信信
号の多重化を分離し等化係数符号は等化係数復号化器2
08に供給され、これによって復号化された等化係数は
位相分散フィルタ209に供給される。
The equalization coefficient encoder 111 on the analysis side 1' receives data having the same content as the phase equalization filter coefficients supplied to the phase equalization filter 103 from the coefficient calculator 105, encodes it in a predetermined format, and then encodes it in a predetermined format. Q to be sent to the multiplexer 110 The multiplexer 110 multiplexes the equalization coefficient code together with the maximum amplitude code, the normalized multipulse code, and the I and PC codes in a predetermined format and sends it to the transmission path 100.
2 to the combining side 2'. On the combining side 2', the demultiplexer 201 demultiplexes the received signal and the equalization coefficient code is sent to the equalization coefficient decoder 2.
The equalization coefficients decoded by the equalization coefficients are supplied to the phase dispersion filter 209.

位相分散フィルタ209はトランスバーサルフィルタと
して構成されるディジタルフィルタであり、そのフィル
タ係数として等化係数を利用し分析側で行なった位相等
化フィルタ103による入力音声信号に対する等化処理
の逆処理としての位相分散処理をLPC合成フィルタ2
05の出力に対して再設定基本分析フレームごとに実施
したあと出力を乗算器206に供給し、第1の実施例の
場合と同様にして合成音声を得る。
The phase dispersion filter 209 is a digital filter configured as a transversal filter, and uses equalization coefficients as its filter coefficients to perform inverse processing of the equalization processing performed on the input audio signal by the phase equalization filter 103 performed on the analysis side. Phase dispersion processing using LPC synthesis filter 2
After resetting the output of 05 for each basic analysis frame, the output is supplied to the multiplier 206, and synthesized speech is obtained in the same manner as in the first embodiment.

このように合成側で位相分散全図る目的は、マルチパル
ス列の符号化効率を大幅に改善する目的で分析側で実施
した位相等化の影響を合成側で解除することにあり、マ
ルチパルス符号化装置の運用目的合成音声の品質条件等
を勘案し任意に実施しうる。
The purpose of achieving full phase dispersion on the synthesis side in this way is to eliminate the effects of phase equalization performed on the analysis side, with the aim of greatly improving the encoding efficiency of multipulse sequences, and This can be carried out arbitrarily, taking into consideration the quality conditions of the synthesized speech for the purpose of operation of the device.

〔発明の効果〕〔Effect of the invention〕

以上説明した如く本発明によれば、音声合成フィルタの
出力波形に対し利得調整を施す機能を有するとともに、
分析側の分析フレーム周期と同期しかつ分析フレーム間
の連続性を保持しつつ分析フレームごとに独立的に合成
した音声波形をそれぞれ利得調整したのち線形加算して
合成音声を得るマルチパルス符号化装置において、検索
したマルチパルス列から位相等化フィルタの係数を決定
し分析フレームごとの入力音声を位相等化したあと再度
マルチパルス分析を実施する手段を備えることによシマ
ルテパルスの個数を大幅に減少しマルチパルス符号化効
率を大幅に改善したマルチパルス符号化装置が実現でき
るという効果がある。
As explained above, according to the present invention, it has the function of performing gain adjustment on the output waveform of the speech synthesis filter, and
A multipulse encoding device that obtains synthesized speech by linearly adding the speech waveforms synthesized independently for each analysis frame while synchronizing with the analysis frame period on the analysis side and maintaining continuity between the analysis frames, after adjusting the respective gains. In this method, the number of simultaneous pulses can be greatly reduced and the multipulse analysis can be performed again after determining the coefficients of the phase equalization filter from the retrieved multipulse train and phase equalizing the input audio for each analysis frame. This has the effect of realizing a multi-pulse encoding device with significantly improved pulse encoding efficiency.

【図面の簡単な説明】[Brief explanation of drawings]

if図は本発明の第1の実施例の構成を示すプロ、り図
、第2図は本発明の第2の実施例の構成を示すプロ、り
図である。 1.1′・・・・・・分析側、2.2’・・・・・・合
成側、101・・・・・・窓処理器、102・・・・・
切替器、103・・・・・・位相等化フィルタ% 10
4・・・・・切替器、105・・・・・係数算出器、1
06・・・・・マルチパルス分析器、107・・・・・
・LPC分4ff5.  l Os・・・・・・マルチ
パルス符号化器、109・・・・・L、PC係数符号化
器、110・・・・・・マルチプレクサ、111・・・
・・・等化係数符号化器、201・・・・・・デマルチ
プレクサ、2o2・・・・・・LPC係ei復号化器、
203・・・・・正規化マルチパルス復号化器、204
・・・・・・最大振幅復号化器。 205・・・・・・LPC合成フィルタ、206・・・
・・・乗算器、207・・・・・・波形接続器、208
・・・・・・等化係数復号化器、209・・・・・・位
相分散フィルタ。 茅 ! 凹 第 21!!]
The IF diagram is a diagram showing the configuration of the first embodiment of the present invention, and FIG. 2 is a diagram showing the configuration of the second embodiment of the invention. 1.1'... Analysis side, 2.2'... Synthesis side, 101... Window processor, 102...
Switcher, 103...Phase equalization filter% 10
4...Switcher, 105...Coefficient calculator, 1
06...Multipulse analyzer, 107...
・LPC portion 4ff5. l Os...Multipulse encoder, 109...L, PC coefficient encoder, 110...Multiplexer, 111...
... Equalization coefficient encoder, 201 ... Demultiplexer, 2o2 ... LPC coefficient ei decoder,
203... Normalized multipulse decoder, 204
...Maximum amplitude decoder. 205...LPC synthesis filter, 206...
... Multiplier, 207 ... Waveform connector, 208
. . . Equalization coefficient decoder, 209 . . . Phase dispersion filter. Kaya! Concave number 21! ! ]

Claims (2)

【特許請求の範囲】[Claims] (1)音声合成フィルタの出力波形に対して利得調整を
施す機能を有するとともに分析側の分析フレーム周期と
同期しかつ分析フレーム間の連続性を保持しつつ分析フ
レームごとに独立的に合成した音声波形をそれぞれ利得
調整したのち線形加算して合成音声を得る手段を有する
マルチパルス符号化装置において、マルチパルス分析を
行なって検索されたマルチパルス列にもとづき分析フレ
ームごとの入力音声信号の位相等化フィルタのフィルタ
係数を決定する位相等化フィルタ係数決定手段と、前記
位相等化フィルタによって位相等化を施された入力音声
信号に対して分析フレームごとにマルチパルス分析を再
度実施して出力マルチパルスを決定するマルチパルス決
定手段とを備えて成ることを特徴とするマルチパルス符
号化装置。
(1) It has a function to perform gain adjustment on the output waveform of the speech synthesis filter, and is synthesized independently for each analysis frame while synchronizing with the analysis frame cycle on the analysis side and maintaining continuity between analysis frames. In a multi-pulse encoding device having means for obtaining synthesized speech by linearly adding each waveform after adjusting the gain thereof, a phase equalization filter is applied to the input speech signal for each analysis frame based on the multi-pulse string retrieved by performing multi-pulse analysis. a phase equalization filter coefficient determining means for determining a filter coefficient of the filter; A multi-pulse encoding device comprising: multi-pulse determining means for determining a multi-pulse.
(2)前記位相等化フィルタのフィルタ係数を分析側か
ら合成側に伝送し分析フレームごとに独立的に合成した
音声波形の位相分散を前記位相等化による効果を消去す
るように行なうことを特徴とする第(1)項記載のマル
チパルス符号化装置。
(2) The filter coefficients of the phase equalization filter are transmitted from the analysis side to the synthesis side, and the phase dispersion of the speech waveform synthesized independently for each analysis frame is performed so as to eliminate the effect of the phase equalization. The multi-pulse encoding device according to item (1).
JP60147256A 1985-07-03 1985-07-03 Multipulse encoder Granted JPS627098A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60147256A JPS627098A (en) 1985-07-03 1985-07-03 Multipulse encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60147256A JPS627098A (en) 1985-07-03 1985-07-03 Multipulse encoder

Publications (2)

Publication Number Publication Date
JPS627098A true JPS627098A (en) 1987-01-14
JPH059040B2 JPH059040B2 (en) 1993-02-03

Family

ID=15426117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60147256A Granted JPS627098A (en) 1985-07-03 1985-07-03 Multipulse encoder

Country Status (1)

Country Link
JP (1) JPS627098A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0541445U (en) * 1991-11-16 1993-06-08 大建工業株式会社 Storage box
JPH05265494A (en) * 1992-03-23 1993-10-15 Idou Tsushin Syst Kaihatsu Kk Speech encoding and decoding device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0541445U (en) * 1991-11-16 1993-06-08 大建工業株式会社 Storage box
JPH05265494A (en) * 1992-03-23 1993-10-15 Idou Tsushin Syst Kaihatsu Kk Speech encoding and decoding device

Also Published As

Publication number Publication date
JPH059040B2 (en) 1993-02-03

Similar Documents

Publication Publication Date Title
US4220819A (en) Residual excited predictive speech coding system
US5027404A (en) Pattern matching vocoder
JPS60239798A (en) Voice waveform coder/decoder
JPS627098A (en) Multipulse encoder
JP3255190B2 (en) Speech coding apparatus and its analyzer and synthesizer
US5202953A (en) Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching
JPS642960B2 (en)
JPS6162100A (en) Multipulse type encoder/decoder
JPH0235994B2 (en)
JPH0738116B2 (en) Multi-pulse encoder
JPS60239800A (en) Residual excitation type vocoder
JP2947012B2 (en) Speech coding apparatus and its analyzer and synthesizer
CA1336841C (en) Multi-pulse type coding system
JPH0736119B2 (en) Piecewise optimal function approximation method
JP2715437B2 (en) Multi-pulse encoder
JP2629762B2 (en) Pitch extraction device
JPS61252600A (en) Lsp type pattern matching vocoder
JP3112462B2 (en) Audio coding device
JPH0449960B2 (en)
JPS62102294A (en) Voice coding system
JP2535809B2 (en) Linear predictive speech analysis and synthesis device
JPH0754438B2 (en) Voice processor
JPH058840B2 (en)
JPH053600B2 (en)
JPH043878B2 (en)