JPH059040B2 - - Google Patents
Info
- Publication number
- JPH059040B2 JPH059040B2 JP60147256A JP14725685A JPH059040B2 JP H059040 B2 JPH059040 B2 JP H059040B2 JP 60147256 A JP60147256 A JP 60147256A JP 14725685 A JP14725685 A JP 14725685A JP H059040 B2 JPH059040 B2 JP H059040B2
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- multipulse
- pulse
- analysis frame
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004458 analytical method Methods 0.000 claims description 75
- 230000004044 response Effects 0.000 claims description 24
- 230000015572 biosynthetic process Effects 0.000 claims description 21
- 238000003786 synthesis reaction Methods 0.000 claims description 21
- 230000005236 sound signal Effects 0.000 claims description 16
- 230000000694 effects Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Description
〔産業上の利用分野〕
本発明はマルチパルス符号化装置に関し、特に
分析側の分析フレーム周期と同期しかつ分析フレ
ーム間の連続性を保持しつつ分析フレームごとに
独立的に合成した音声波形をそれぞれ利得調整し
たのち線形加算して合成音声を得る手段を有する
マルチパルス符号化装置におけるマルチパルス列
符号化効率の改善を図つたマルチパルス符号化装
置に関する。
〔従来の技術〕
マルチパルス符号化装置は音源波形情報として
マルチパルスを利用する符号化装置であり、通常
は固定小数点による有限精度演算で音声波形を合
成している。また音声合成においては音声合成フ
イルタのダイナミツクレンジ、S/N(Signal/
Noise)比を極力改善する目的でフイルタの出力
側で音源の強さに対応した利得調整を行なつてい
る。
このようなマルチパルス符号化装置では、分析
側で抽出したマルチパルス列を音源情報としこれ
をαパラメータやKパラメータの如きLPC
(Linear Prediction Coding、線形予測符号化)
係数によるスペクトル包絡情報とともに合成側に
送出して音声合成を行なつている。
分析側から合成側に送出するこれら特徴パラメ
ータは分析フレーム単位、もしくは可変長フレー
ムで伝送されるがいずれにせよ音声合成は分析フ
レーム単位で処理される。
さて、上述した分析フレームは特徴パラメータ
の分析、伝送上の都合等の観点でその時間長が設
定されており従つて特徴パラメータの忠実な伝送
とは原則的に無関係なものとなつている。このた
め、折角マルチパルス列を利用し音源波形伝送を
前提とするマルチパルス符号化装置も、このよう
な画一的な分析フレームごとの特徴パラメータを
合成側で連続的に利用するだけでは分析フレーム
境界にまたがる合成波形の忠実な連続性が基本的
に無視されてその波形再現性にも劣化をきたすこ
とが避けられないという問題点がある。
この問題点に対し近時次のような改善策を考慮
したものが紹介されている。
すなわち、分析側の分析フレーム周期に同期
し、分析フレーム間の連続性を保持しつつマルチ
パルス列の音声合成フイルタによるインパルス応
答波形の合算としての合成波形をインパルス応答
持続時間を加味しながら再生していくという手段
を介して分析フレーム間の不連続性の問題を基本
的に排除したマルチパルス符号化装置である。本
発明もこのようなマルチパルス符号化装置を対象
とするものである。
〔発明が解決しようとする問題点〕
しかしながら、分析フレーム間の不連続性の問
題を排除した従来のこの種のマルチパルス符号化
装置にも次のようなマルチパルス符号化装置特有
の問題点を残留する。
すなわちマルチパルスは元来、全極型モデルと
して構成する音声合成フイルタのインパルス応答
の線形加算が入力音声波形に極力近似したものと
して検索されたものであり、従つて音源波形を近
似する複数のパルス列として検索されている。こ
の検索にも種々の方法があるがいずれにせよ声帯
振動波形に対応した複数の励振点を形成しうるよ
うな数多くのパルスの集合として構成され、この
ためその符号化効率にも限度があるという問題が
ある。
本発明の目的は上述した欠点が除去し複数の励
振点を1個もしくはたかだか数個程度で代表しう
る励振点をもつようなマルチパルスを検索する手
段を備えてマルチパルスの個数を大幅に低減しそ
の符号化効率を大幅に改善したマルチパルス符号
化装置を提供することにある。
〔問題点を解決するための手段〕
本発明のマルチパルス符号化装置は、分析側の
分析フレーム周期と同期しかつ相続く分析フレー
ムにおける次の分析フレームの時間領域に入り込
む前分析フレームのインパルス応答持続時間成分
を含めて加算する音声信号の再設定による分析フ
レーム間の連続性を保持しつつ分析フレームごと
に独立的に合成した音声波形に最大振幅を付与し
てそれぞれ利得調整したのち線形加算して合成音
声を得る手段を有するマルチパルス符号化装置に
おいて、マルチパルス分析を行なつて検索された
マルチパルス列にもとづき分析フレームごとの入
力音声信号の位相等化フイルタのフイルタ係数を
決定する位相等化フイルタ係数決定手段と、前記
位相等化フイルタによつて位相等化を施された入
力音声信号に対して分析フレームごとにマルチパ
ルス分析を再度実施して出力マルチパルスを決定
するマルチパルス決定手段とを備える。
〔実施例〕
次に図面を参照して本発明を詳細に説明する。
第1図は本発明によるマルチパルス符号化装置の
第1の実施例の構成を示すブロツク図である。
第1図に示すマルチパルス符号化装置は分析側
1と合成側2とから構成され、さらに分析側1は
窓処理器101、切替器102、位相等化フイル
ム103、切替器104、係数算出器105、マ
ルチパルス分析器106、LPC分析器107、
マルチパルス符号化器108、LPC係数符号化
器109およびマルチプレクサ110を備えて構
成される。また、合成側2はデマルチプレクサ2
01、LPC係数復号化器202、正規化マルチ
パルス復合化器203、最大振幅復号化器20
4、LPC合成フイルタ205、乗算器206お
よび波形接続器207を備えて構成される。
入力ライン1001を介して入力した入力音声
信号は窓処理器101によつてLPF(Low Pass
Filter)にかけられて不要の高域周波数を遮断し
たのちA/Dコンバータによつて所定のサンプリ
ング周波数8kHzで標本化されたのち所定のビツ
ト数12ビツトでサンプルごとに量子化される。こ
の量子化音声信号は一旦内部メモリにあらかじめ
設定する時間分ずつ、たとえば20mSECすなわち
160サンプル分ずつあらかじめ設定する窓関数た
とえば矩形関数によつて切出され格納される。
こうして格納された量子化音声信号はまた20m
SECずつ次々に読出され切替器102,104を
介してマルチパルス分析器106に供給されこれ
がマルチパルス分析における基本分析フレーム長
となる。
マルチパルス分析器106は公知のマルチパル
ス抽出技術を利用し基本分析フレームごとにマル
チパルス列を抽出する。
公知のマルチパルス列抽出技術としては、いわ
ゆるスペクトル領域評価としてのAbS(Analysis
−by Synthesis)処理や、いわゆる相関領域評価
としての相関関数処理等があるが本実施例では後
者の手法を利用している。
この相関領域評価は、入力音声信号と分析側に
おける分析評価用合成フイルタのインパルス応答
との相互相関およびインパルス応答の自己相関を
利用して所望のマルチパルス列を検索するもので
ある。この目的に利用する分析評価用合成フイル
タはLPC分析器107に内蔵されておりマルチ
パルス分析器106はLPC分析器107からイ
ンパルス応答を入力しつつマルチパルスの検索を
行なう。本実施例においてはこのマルチパルスの
検索は最先頭の基本分析フレーム分を除き各分析
フレーム長に次々にマルチパルスによるインパル
ス応答持続時間を加味してあらかじめ設定するい
わゆる孤立時間で実行しその詳細は次のとおりで
ある。
LPC分析器107は量子化音声信号を30m
SECのハミング関数で切出しつつ20mSECの基本
分析フレーム長で読出しながらこの量子化音声信
号に公知のLPC分析を行ない所定の次数のLPC
係数を抽出する。このLPC係数は内蔵合成フイ
ルタの係数として利用され声道フイルタの聴感重
みづけインパルス応答が求められる。このインパ
ルス応答はマルチパルス分析器106に供給され
る。
マルチパルス分析器106は基本分析フレーム
ごとの量子化音声信号とインパルス応答との相互
相関演算ならびにインパルス応答の自己相関演算
を介してまず最先頭の基本分析フレームのマルチ
パルス列を検索する。
さて、こうして求められた先端頭の基本分析フ
レームのマルチパルス列はLPC分析器107に
供給され内蔵合成フイルタによるインパルス応答
が求められる。このマルチパルスによるインパル
ス応答波形は、基本分析フレームにわたる部分と
基本分析フレームを超えて接続する部分との両方
をマルチパルス分析器106に供給される。ただ
し、基本分析フレームを超えて接続するインパル
ス応答接続時間は合成音声の品質レベル等を勘案
してあらかじめ設定する時間範囲に限定してい
る。
マルチパルス分析器106は次の基本分析フレ
ームの量子化音声信号と、この基本分析フレーム
の時間領域にまたがる前基本分析フレームのイン
パルス応答波形の量子化データとを極性を考慮し
て加算合成し、基本分析フレーム間の連続性を保
持した量子化音声信号を相続く基本分析フレーム
に対して次々に設定していく。こうして基本分析
フレーム間の連続性を保持しつつ再度マルチパル
ス列を検索する。
こうして検索されるマルチパルス列は基本分析
フレーム相互間の連続性は保持されているものの
マルチパルス列符号化効率の観点から言えば従来
のマルチパルス符号化装置と基本的には何等変つ
ていない。そこで本実施例では次のような位相等
化を窓処理器101の出力に対して施しこの問題
の解決を図つている。
この位相等化の基本的な考え方は次のとおりで
ある。すなわち、いま検索されたマルチパルス列
があり、これがLPC係数で構成される全極型デ
イジタルフイルタで構成される音声合成フイルタ
に印加されるときそのインパルス応答波形の線形
加算が所望の音源情報を提供するものとする。こ
のようなデイジタルフイルタは容易に構成するこ
とができる。
この場合、検索されたマルチパルスの代りにこ
れらマルチパルス列にもとづいてある代表インパ
ルスを設定し、このインパルス応答も音源情報を
ほぼ満足しうるものが得られるとする。このよう
なインパルスの設定も容易に設定可能である。
逆に、マルチパルス列によつて得られるインパ
ルス応答波形を代表インパルスの応答波形に変換
するフイルタが存在すれば、入力音声信号をこの
フイルタを通してからマルチパルスを検索すれば
前記マルチパルス列の代りに前記代表インパルス
が求められることは明らかである。入力音声信号
の位相等化の目的もかかるフイルタによつてマル
チパルスの代りにパルス数を大幅に低減したかか
る代表インパルスを得ることにある。このような
フイルタが位相等化フイルタである。なお、上記
した代表インパルスはピツチ周期等に対応しつつ
基本分析フレームごとに通常複数個が得られるこ
ととなる。
位相等化フイルタの基本的な概念は誉田、守谷
両氏により紹介されており、例えば「位相等化処
理を用いた音声符号化」日本音響学会音声研究会
資料S84−05、1984年4月に記載されている。
さて、上述した位相等化フイルタはトランスバ
ーサル型のデイジタルフイルタ等で容易に実現で
きることは明らかであり、位相等化フイルタ10
3はかかる目的のデイジタルフイルタである。
係数算出器105は位相等化フイルタ103の
フイルタ係数を提供するものであり、このフイル
タ係数はマルチパルス分析器106から供給され
るマルチパルス列を利用し次のようにして決定さ
れる。
いまマルチパルス(もしくは予測残差波形)を
e(n)とし、また位相等化フイルタのインパルス応
答をh(m)(m=0、1、2、…、M)で表わすと
位相等化残差波形は次の(1)式のep(n)で示すことが
できる。
ep(n)=M
〓m=0
h(m)e(n−m) ……(1)
またピツチパルス列は(2)式のeM(n)で示される。
eM(n)=∞
〓l=-∞
δ(n−nl) ……(2)
(2)式のδはクロネツカのデルタでありn=nlつ
まりδ(o)のとき振幅1のパルスとなり、またnl−
nl-1がピツチ周期となる。
係数算出器105はマルチパルスe(n)を入力し
e(n)の自己相関係数を求め、この係数の最大値を
検索することにより先ずピツチ周期を算出したあ
と、このピツチ周期と同じ周期を有しかつその時
間的位置もほぼ一致するピツチパルス列eM(n)をマ
ルチパルス列から選択する。
上記ep(n)とeM(n)とが最もよくマツチングする所
望のh(m)は(1)式で示される位相等化残差波形ep(n)
と(2)式で示されるピツチパルス列eM(n)との自乗誤
差を最小化することによつて求められる。自乗誤
差Dは次の(3)式によつて表現される。
D=N-1
〓n=0
(ep(n)−eM(n))2=N-1
〓n=0
(M
〓m=0
h(m)e(n−m)−L-1
〓l=0
δ(n−nl))2 ……(3)
ただし(3)式ににおいてLは区間0〜M−1に含
まれるピツチパルスの数である。
(3)式にもとづき偏微分∂D/∂h(k)を求めこれを零と
おくことによつてep(n)とeM(n)との自乗誤差を最小
化するインパルス応答h(m)が求まる。
∂D/∂h(k)=N-1
〓n=0
{2(M
〓m=0
h(m)e(n−m)−L-1
〓l=0
δ(n−nl))・e(n−k)} ……(4)
(4)式を零とおいて次の(5)式が得られる。N-1
〓n=0 M
〓m=0
h(m)e(n−m)e(n−k))h(m)=L-1
〓l=0
δ(n−nl)e(n−k) ……(5)
(k=0、1、2、…、M)
(5)式からh(m)は(k−1)元(k+1)次方程
式から求められる。この算出式は次の(6)式に示す
如きマトリツクス方程式として示すことができ
る。
[Industrial Field of Application] The present invention relates to a multipulse encoding device, and in particular, to a multipulse encoding device that generates audio waveforms synthesized independently for each analysis frame while synchronizing with the analysis frame period on the analysis side and maintaining continuity between analysis frames. The present invention relates to a multi-pulse encoding device that improves the multi-pulse train encoding efficiency in a multi-pulse encoding device that has means for linearly adding synthesized speech after each gain adjustment. [Prior Art] A multipulse encoding device is an encoding device that uses multipulses as sound source waveform information, and usually synthesizes audio waveforms using fixed-point finite precision calculations. In addition, in speech synthesis, the dynamic range of the speech synthesis filter, S/N (Signal/
In order to improve the noise ratio as much as possible, the gain is adjusted on the output side of the filter in accordance with the strength of the sound source. In such a multipulse encoding device, the multipulse sequence extracted on the analysis side is used as sound source information, and this is used as LPC such as α parameter and K parameter.
(Linear Prediction Coding)
It is sent to the synthesis side together with spectral envelope information based on coefficients to perform speech synthesis. These feature parameters sent from the analysis side to the synthesis side are transmitted in units of analysis frames or variable length frames, but in either case, speech synthesis is processed in units of analysis frames. Now, the time length of the above-mentioned analysis frame is set from the viewpoint of feature parameter analysis, transmission convenience, etc., and therefore, it is basically irrelevant to faithful transmission of feature parameters. For this reason, even with multipulse encoding devices that utilize multipulse trains and assume sound source waveform transmission, if the synthesis side continuously uses such uniform characteristic parameters for each analysis frame, the analysis frame boundaries will be lost. There is a problem in that the faithful continuity of the synthesized waveform that spans is basically ignored, and the waveform reproducibility inevitably deteriorates. In response to this problem, the following improvement measures have recently been introduced. In other words, it synchronizes with the analysis frame period on the analysis side, maintains continuity between analysis frames, and reproduces a synthesized waveform as a sum of impulse response waveforms by a multi-pulse train speech synthesis filter while taking into account the impulse response duration. This is a multi-pulse encoding device that basically eliminates the problem of discontinuity between analysis frames. The present invention is also directed to such a multipulse encoding device. [Problems to be Solved by the Invention] However, this type of conventional multipulse encoding device that eliminates the problem of discontinuity between analysis frames also has the following problems specific to the multipulse encoding device. remain. In other words, multipulse was originally searched for as a linear summation of impulse responses of a speech synthesis filter configured as an all-pole model that approximated the input speech waveform as much as possible, and was therefore a combination of multiple pulse trains that approximated the sound source waveform. is being searched as. There are various methods for this search, but in any case, it is composed of a collection of many pulses that can form multiple excitation points corresponding to the vocal fold vibration waveform, and therefore there is a limit to its encoding efficiency. There's a problem. The purpose of the present invention is to eliminate the above-mentioned drawbacks and to significantly reduce the number of multipulses by providing a means for searching for multipulses that have an excitation point that can represent a plurality of excitation points with one or at most a few excitation points. An object of the present invention is to provide a multi-pulse encoding device that greatly improves the encoding efficiency. [Means for Solving the Problems] The multipulse encoding device of the present invention provides an impulse response of a previous analysis frame that is synchronized with the analysis frame period on the analysis side and that enters the time domain of the next analysis frame in successive analysis frames. While maintaining continuity between analysis frames by resetting the audio signal to be added including the duration component, a maximum amplitude is given to the audio waveform independently synthesized for each analysis frame, and the gain is adjusted for each, followed by linear addition. In a multipulse encoding device having means for obtaining synthesized speech using a multipulse analysis, phase equalization is performed to determine filter coefficients of a phase equalization filter of an input speech signal for each analysis frame based on a multipulse sequence retrieved by performing multipulse analysis. filter coefficient determining means; and multi-pulse determining means for re-performing multi-pulse analysis for each analysis frame on the input audio signal subjected to phase equalization by the phase equalizing filter to determine an output multi-pulse. Equipped with. [Example] Next, the present invention will be described in detail with reference to the drawings.
FIG. 1 is a block diagram showing the structure of a first embodiment of a multipulse encoding device according to the present invention. The multi-pulse encoding device shown in FIG. 1 is composed of an analysis side 1 and a synthesis side 2. Furthermore, the analysis side 1 includes a window processor 101, a switch 102, a phase equalization film 103, a switch 104, and a coefficient calculator. 105, multipulse analyzer 106, LPC analyzer 107,
It is configured to include a multipulse encoder 108, an LPC coefficient encoder 109, and a multiplexer 110. In addition, the synthesis side 2 is a demultiplexer 2
01, LPC coefficient decoder 202, normalized multipulse decoder 203, maximum amplitude decoder 20
4, an LPC synthesis filter 205, a multiplier 206, and a waveform connector 207. The input audio signal input via the input line 1001 is processed by the window processor 101 into an LPF (Low Pass
After passing through a filter to cut out unnecessary high frequencies, it is sampled by an A/D converter at a predetermined sampling frequency of 8 kHz, and then quantized for each sample using a predetermined number of bits, 12 bits. This quantized audio signal is stored in the internal memory for a preset period of time, for example, 20 mSEC, or
Each 160 samples are cut out and stored using a preset window function, such as a rectangular function. The quantized audio signal stored in this way is also 20m
SECs are read out one after another and supplied to the multipulse analyzer 106 via the switches 102 and 104, which becomes the basic analysis frame length in multipulse analysis. Multipulse analyzer 106 extracts a multipulse train for each basic analysis frame using a known multipulse extraction technique. As a well-known multi-pulse train extraction technique, AbS (Analysis) is a so-called spectral domain evaluation technique.
-by Synthesis) processing, correlation function processing as so-called correlation region evaluation, etc., and in this embodiment, the latter method is used. This correlation region evaluation searches for a desired multi-pulse train by using the cross-correlation between the input audio signal and the impulse response of the analysis-evaluation synthesis filter on the analysis side and the autocorrelation of the impulse response. An analysis and evaluation synthesis filter used for this purpose is built into the LPC analyzer 107, and the multipulse analyzer 106 searches for multipulses while inputting impulse responses from the LPC analyzer 107. In this embodiment, this multi-pulse search is performed using a so-called isolated time that is preset by adding the impulse response duration of multi-pulses to the length of each analysis frame, excluding the first basic analysis frame. It is as follows. The LPC analyzer 107 analyzes the quantized audio signal for 30 m
A well-known LPC analysis is performed on this quantized audio signal while cutting it out using the SEC Hamming function and reading it out with a basic analysis frame length of 20 mSEC to obtain a predetermined order of LPC.
Extract the coefficients. These LPC coefficients are used as coefficients of the built-in synthesis filter to obtain the auditory weighted impulse response of the vocal tract filter. This impulse response is provided to a multipulse analyzer 106. The multipulse analyzer 106 first searches for the multipulse train of the foremost basic analysis frame through a cross-correlation calculation between the quantized audio signal and the impulse response for each basic analysis frame and an autocorrelation calculation of the impulse response. Now, the multi-pulse train of the basic analysis frame of the leading edge thus obtained is supplied to the LPC analyzer 107, and an impulse response is obtained by the built-in synthesis filter. This multi-pulse impulse response waveform is supplied to the multi-pulse analyzer 106 both in a portion spanning the basic analysis frame and in a portion connecting beyond the basic analysis frame. However, the impulse response connection time beyond the basic analysis frame is limited to a time range set in advance, taking into consideration the quality level of the synthesized speech. The multi-pulse analyzer 106 adds and synthesizes the quantized audio signal of the next basic analysis frame and the quantized data of the impulse response waveform of the previous basic analysis frame spanning the time domain of this basic analysis frame, taking into account the polarity, Quantized audio signals that maintain continuity between basic analysis frames are set one after another for successive basic analysis frames. In this way, the multipulse train is searched again while maintaining the continuity between the basic analysis frames. Although the multi-pulse train searched in this way maintains the continuity between the basic analysis frames, from the viewpoint of multi-pulse train coding efficiency, there is basically no difference from the conventional multi-pulse coding apparatus. Therefore, in this embodiment, the following phase equalization is applied to the output of the window processor 101 to solve this problem. The basic idea of this phase equalization is as follows. That is, there is a multi-pulse train that has just been retrieved, and when this is applied to a speech synthesis filter made up of an all-pole digital filter made up of LPC coefficients, the linear addition of its impulse response waveforms provides the desired sound source information. shall be taken as a thing. Such a digital filter can be easily constructed. In this case, it is assumed that a representative impulse is set based on these multi-pulse trains instead of the searched multi-pulse, and that this impulse response can also be obtained that substantially satisfies the sound source information. Such impulse settings can also be easily set. On the other hand, if there is a filter that converts the impulse response waveform obtained by a multi-pulse train into a representative impulse response waveform, then if the input audio signal is passed through this filter and then searched for a multi-pulse, the representative impulse is used instead of the multi-pulse train. It is clear that impulse is required. The purpose of phase equalization of the input audio signal is also to obtain such representative impulses with a significantly reduced number of pulses instead of multiple pulses by means of such a filter. Such a filter is a phase equalization filter. Note that a plurality of representative impulses are usually obtained for each basic analysis frame, corresponding to the pitch period and the like. The basic concept of phase equalization filters was introduced by Mr. Honda and Mr. Moriya, for example, in ``Speech Coding Using Phase Equalization Processing,'' Acoustical Society of Japan Speech Study Group Material S84-05, April 1984. has been done. Now, it is clear that the above-mentioned phase equalization filter can be easily realized by a transversal type digital filter, etc., and the phase equalization filter 10
3 is a digital filter for this purpose. The coefficient calculator 105 provides filter coefficients of the phase equalization filter 103, and the filter coefficients are determined as follows using the multipulse train supplied from the multipulse analyzer 106. Now, if the multi-pulse (or predicted residual waveform) is e(n) and the impulse response of the phase equalization filter is expressed as h(m) (m = 0, 1, 2,..., M), then the phase equalization residual is The difference waveform can be expressed as e p (n) in the following equation (1). e p (n)= M 〓 m=0 h(m)e(n-m)...(1) Also, the pitch pulse train is expressed as e M (n) in equation (2). e M (n)= ∞ 〓 l=-∞ δ (n-n l ) ...(2) δ in equation (2) is Kronetska's delta, and when n=n l , that is, δ(o), the amplitude is 1. It becomes a pulse, and n l −
n l-1 is the pitch period. The coefficient calculator 105 inputs the multi-pulse e(n), calculates the autocorrelation coefficient of e(n), first calculates the pitch period by searching for the maximum value of this coefficient, and then calculates the pitch period with the same period as this pitch period. A pitch pulse train e M (n) having a pitch pulse train e M (n) whose temporal position also almost coincides is selected from the multi-pulse train. The desired h(m) that best matches the above e p (n) and e M (n) is the phase equalized residual waveform e p (n) shown by equation (1).
It is obtained by minimizing the squared error between and the pitch pulse train e M (n) shown in equation (2). The squared error D is expressed by the following equation (3). D= N-1 〓 n=0 (e p (n)−e M (n)) 2 = N-1 〓 n=0 ( M 〓 m=0 h(m)e(n-m)− L- 1 〓 l=0 δ(n-n l )) 2 ...(3) However, in equation (3), L is the number of pitch pulses included in the interval 0 to M-1. By finding the partial differential ∂D/∂h(k) based on equation (3) and setting it to zero, the impulse response h( m) is found. ∂D/∂h(k)= N-1 〓 n=0 {2( M 〓 m=0 h(m)e(n-m)− L-1 〓 l=0 δ(n-n l ))・e(nk)} ...(4) Setting equation (4) to zero, the following equation (5) is obtained. N-1 〓 n=0 M 〓 m=0 h(m)e(n-m)e(n-k))h(m)= L-1 〓 l=0 δ(n-n l )e( n-k) ...(5) (k=0, 1, 2,..., M) From equation (5), h(m) can be found from a (k-1) element (k+1)-dimensional equation. This calculation formula can be expressed as a matrix equation as shown in equation (6) below.
以上説明した如く本発明によれば、分析側の分
析フレーム周期と同期しかつ分析フレーム間の連
続性を保持しつつ分析フレームごとに独立的に合
成した音声波形をそれぞれ利得調整したのち線形
加算して合成音声を得るマルチパルス符号化装置
において、検索したマルチパルス列から位相等化
フイルタの係数を決定し分析フレームごとの入力
音声を位相等化したあと再度マルチパルス分析を
実施する手段を備えることによりマルパルスの個
数を大幅に減少しマルチパルス符号化効率を大幅
に改善したマルチパルス符号化装置が実現できる
という効果がある。
As explained above, according to the present invention, audio waveforms synthesized independently for each analysis frame are linearly added after gain adjustment, while synchronizing with the analysis frame period on the analysis side and maintaining continuity between analysis frames. In the multi-pulse encoding device for obtaining synthesized speech using the multi-pulse encoding method, the multi-pulse encoding device is provided with means for determining the coefficients of a phase equalization filter from the searched multi-pulse train, equalizing the phase of the input speech for each analysis frame, and then performing multi-pulse analysis again. This has the effect of realizing a multi-pulse encoding device in which the number of multi-pulses is significantly reduced and multi-pulse encoding efficiency is greatly improved.
第1図は本発明の第1の実施例の構成を示すブ
ロツク図、第2図は本発明の第2の実施例の構成
を示すブロツク図である。
1,1′……分析側、2,2′……合成側、10
1……窓処理器、102……切替器、103……
位相等化フイルタ、104……切替器、105…
…係数算出器、106……マルチパルス分析器、
107……LPC分析器、108……マルチパル
ス符号化器、109……LPC係数符号化器、1
10……マルチプレクサ、111……等化係数符
号化器、201……デマルチプレクサ、202…
…LPC係数復号化器、203……正規化マルチ
パルス復号化器、204……最大振幅復号化器、
205……LPC合成フイルタ、206……乗算
器、207……波形接続器、208……等化係数
復号化器、209……位相分散フイルタ。
FIG. 1 is a block diagram showing the structure of a first embodiment of the invention, and FIG. 2 is a block diagram showing the structure of a second embodiment of the invention. 1, 1'... Analysis side, 2, 2'... Synthesis side, 10
1...Window treatment device, 102...Switching device, 103...
Phase equalization filter, 104...Switcher, 105...
... Coefficient calculator, 106 ... Multipulse analyzer,
107...LPC analyzer, 108...multipulse encoder, 109...LPC coefficient encoder, 1
10... Multiplexer, 111... Equalization coefficient encoder, 201... Demultiplexer, 202...
... LPC coefficient decoder, 203 ... Normalization multipulse decoder, 204 ... Maximum amplitude decoder,
205... LPC synthesis filter, 206... Multiplier, 207... Waveform connector, 208... Equalization coefficient decoder, 209... Phase dispersion filter.
Claims (1)
く分析フレームにおける次の分析フレームの時間
領域に入り込む前分析フレームのインパルス応答
持続時間成分を含めて加算する音声信号の再設定
による分析フレーム間の連続性を保持しつつ分析
フレームごとに独立的に合成した音声波形に最大
振幅を付与してそれぞれ利得調整したのち線形加
算して合成音声を得る手段を有するマルチパルス
符号化装置において、マルチパルス分析を行なつ
て検索されたマルチパルス列にもとづき分析フレ
ームごとの入力音声信号の位相等化フイルタのフ
イルタ係数を決定する位相等化フイルタ係数決定
手段と、前記位相等化フイルタによつて位相等化
を施された入力音声信号に対して分析フレームご
とにマルチパルス分析を再度実施して出力マルチ
パルスを決定するマルチパルス決定手段とを備え
ることを特徴とするマルチパルス符号化装置。 2 分析側から合成側に伝送される前記位相等化
フイルタのフイルタ係数に基づき分析フレームご
とに独立的に合成した音声波形の位相分散を前記
位相等化による効果を消去するように行なう手段
を備えることを特徴とする特許請求の範囲第1項
記載とマルチパルス符号化装置。[Claims] 1. Resetting of the audio signal in synchronization with the analysis frame period on the analysis side and including and adding the impulse response duration component of the previous analysis frame that enters the time domain of the next analysis frame in successive analysis frames. A multi-pulse encoding device having a means to give a maximum amplitude to a speech waveform independently synthesized for each analysis frame while maintaining continuity between analysis frames, adjust the gain for each, and then perform linear addition to obtain synthesized speech. a phase equalizing filter coefficient determining means for determining a filter coefficient of a phase equalizing filter of an input audio signal for each analysis frame based on a multi-pulse train retrieved by performing multi-pulse analysis; 1. A multipulse encoding device comprising: multipulse determining means for determining an output multipulse by re-performing multipulse analysis for each analysis frame on an input audio signal that has been subjected to phase equalization. 2. Means for dispersing the phase of the audio waveform independently synthesized for each analysis frame based on the filter coefficients of the phase equalization filter transmitted from the analysis side to the synthesis side so as to eliminate the effect of the phase equalization. A multi-pulse encoding device as claimed in claim 1, characterized in that:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60147256A JPS627098A (en) | 1985-07-03 | 1985-07-03 | Multipulse encoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60147256A JPS627098A (en) | 1985-07-03 | 1985-07-03 | Multipulse encoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS627098A JPS627098A (en) | 1987-01-14 |
JPH059040B2 true JPH059040B2 (en) | 1993-02-03 |
Family
ID=15426117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60147256A Granted JPS627098A (en) | 1985-07-03 | 1985-07-03 | Multipulse encoder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS627098A (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0541445U (en) * | 1991-11-16 | 1993-06-08 | 大建工業株式会社 | Storage box |
JPH05265494A (en) * | 1992-03-23 | 1993-10-15 | Idou Tsushin Syst Kaihatsu Kk | Speech encoding and decoding device |
-
1985
- 1985-07-03 JP JP60147256A patent/JPS627098A/en active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS627098A (en) | 1987-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wong et al. | Least squares glottal inverse filtering from the acoustic speech waveform | |
US5473759A (en) | Sound analysis and resynthesis using correlograms | |
US4220819A (en) | Residual excited predictive speech coding system | |
US4066842A (en) | Method and apparatus for cancelling room reverberation and noise pickup | |
EP0342687B1 (en) | Coded speech communication system having code books for synthesizing small-amplitude components | |
JPS61134000A (en) | Voice analysis/synthesization system | |
US5369730A (en) | Speech synthesizer | |
EP0772185A2 (en) | Speech decoding method and apparatus | |
JPH05281996A (en) | Pitch extracting device | |
Robinson | Speech analysis | |
JPH059040B2 (en) | ||
JP3255190B2 (en) | Speech coding apparatus and its analyzer and synthesizer | |
Farina et al. | Realisation of “virtual” musical instruments: measurements of the Impulse Response of Violins using MLS technique | |
US6049814A (en) | Spectrum feature parameter extracting system based on frequency weight estimation function | |
JPH087597B2 (en) | Speech coder | |
JPH058839B2 (en) | ||
JPH0650439B2 (en) | Multi-pulse driven speech coder | |
EP0475520B1 (en) | Method for coding an analog signal having a repetitive nature and a device for coding by said method | |
JP2947012B2 (en) | Speech coding apparatus and its analyzer and synthesizer | |
JPH0235994B2 (en) | ||
JP2621376B2 (en) | Multi-pulse encoder | |
JPS60239800A (en) | Residual excitation type vocoder | |
JP2629762B2 (en) | Pitch extraction device | |
JPH0736119B2 (en) | Piecewise optimal function approximation method | |
JPH058840B2 (en) |