JPS61252600A - Lsp type pattern matching vocoder - Google Patents

Lsp type pattern matching vocoder

Info

Publication number
JPS61252600A
JPS61252600A JP60094924A JP9492485A JPS61252600A JP S61252600 A JPS61252600 A JP S61252600A JP 60094924 A JP60094924 A JP 60094924A JP 9492485 A JP9492485 A JP 9492485A JP S61252600 A JPS61252600 A JP S61252600A
Authority
JP
Japan
Prior art keywords
lsp
pattern
spectral
coefficient
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60094924A
Other languages
Japanese (ja)
Other versions
JPH0650440B2 (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60094924A priority Critical patent/JPH0650440B2/en
Publication of JPS61252600A publication Critical patent/JPS61252600A/en
Publication of JPH0650440B2 publication Critical patent/JPH0650440B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号を低速度の符号列に変換するLSP型
パタンマツチングボコーダに関する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to an LSP pattern matching vocoder that converts an audio signal into a low-speed code string.

(従来の技術) 入力音声信号のスペクトル包絡に最近似するスペクトル
包絡を、予め音声資料を分析して得られた標準パタンと
照合して選択し、これを入力音声信号に関する有声およ
び無声ならびに無声に関する情報のほか、ピッチ周期お
よび音の強さ等の音源情報とともに分析側から合成側に
伝送して入力音声信号の波形を再生するパタンマツチン
グボコーダは近時よく知られており、またこのようなパ
タンマツチングボコーダの分析側と合成側とにおける分
析および合成パラメータとしてLSP係数を利用するL
fMP型バタソパタンマツチングボコーダよく知られて
いる。
(Prior art) A spectral envelope that most closely resembles the spectral envelope of an input audio signal is selected by comparing it with a standard pattern obtained by analyzing audio materials in advance, and this is selected as a spectral envelope that is most similar to the spectral envelope of an input audio signal. Pattern matching vocoders, which reproduce the waveform of an input audio signal by transmitting information as well as sound source information such as pitch period and sound intensity, from the analysis side to the synthesis side are well known these days. LSP coefficients are used as analysis and synthesis parameters on the analysis and synthesis sides of a pattern matching vocoder.
The fMP type bataso pattern matching vocoder is well known.

このLSP係数は巌形予測係数、PA凡C0R(偏自己
相関)係数等とともに声道の共振特性を表わすパラメー
タとして利用されるものでるり、声門を仮想的に完全開
放および完全閉塞した場合の一道伝達胸数の巌スペクト
ル周波数によるパラメータであることはよく知られてい
る。
This LSP coefficient is used as a parameter representing the resonance characteristics of the vocal tract, along with the rock shape prediction coefficient and the PA C0R (partial autocorrelation) coefficient. It is well known that the number of transmitted breasts is a parameter depending on the spectral frequency.

このよりなLSP係数は周波数領域で表わされるパラメ
ータであシ、αパラメータ等が時間領域で表わされるパ
ラメータであるのに対してよシ直観的に扱い得る量であ
るうえ、少ない情報量でしかも合成すべき入力音声信号
の音質も高い精度のものが得られるといったさまざまな
特徴を有し、従ってこのLSF係数を声道フィルタの伝
達関数を決定する分析および合成パラメータとして利用
し入力音声信号の分析、合成を行なうLSP型ボコーダ
も上述したような特徴を有するものとして構成される。
This more precise LSP coefficient is a parameter expressed in the frequency domain, and unlike the α parameter, etc., which is expressed in the time domain, it is a quantity that can be handled more intuitively, and can be synthesized with a small amount of information. The LSF coefficients are used as analysis and synthesis parameters to determine the transfer function of the vocal tract filter, and are used to analyze input speech signals. The LSP type vocoder that performs synthesis is also configured to have the above-mentioned characteristics.

このLSP型ボコーダを利用するLSP型パターンマツ
チングボコーダは、LSP分析器で分析されたLSP係
数と、予め音声賃料をLSP分析して得られる音声の標
準的なLSF係数の分布内容に関する標準パタンとを照
合することによって両者の類似度が最大となる最近似標
準パタンを選択し、これを合成側に音源情報とともに伝
送して入力音声信号の合成を図るものであシ、スペクト
ル包絡を10ビット前後の低情報量で分析、合成しうる
方法として近時よく知られつつあ、j5、LPCボコー
ダにパタン照合、復号を行なう機能を付加することによ
って容易lIC41g成しうるものでるる。
The LSP type pattern matching vocoder that uses this LSP type vocoder uses the LSP coefficients analyzed by an LSP analyzer and the standard pattern regarding the distribution content of the standard LSF coefficients of the voice obtained by LSP analysis of the voice rent in advance. The system selects the closest standard pattern that maximizes the similarity between the two, and transmits this to the synthesis side along with the sound source information to synthesize the input audio signal.The spectral envelope is approximately 10 bits. Recently, it has become well known as a method that allows analysis and synthesis with a low amount of information.It can be easily achieved by adding pattern matching and decoding functions to the j5 and LPC vocoder.

このようなLSPgパタンマツチングボコーダにおける
LSPボコーダは、通常L P C(LinearPr
ediction Coefficient、 線形予
測係数)分析器によって得られたLPG係数からLSP
係数を誘導するという手段によってLSF係数を得てい
る。
The LSP vocoder in such an LSPg pattern matching vocoder is usually LPC (LinearPr
LSP from the LPG coefficient obtained by the LPG coefficient (Linear prediction coefficient) analyzer
The LSF coefficients are obtained by inducing the coefficients.

さて、パタンマツチングの単位としては入力音声のスペ
クトル包絡の如く音−の物理的特徴に着目した物理単位
と、音声の言甜的竹倣に着目した言語単位とがあシ、い
ずれを利用するかはパタンマツチングボコーダの構成内
谷寺に対応して効率のいいものが選択され、またこれら
の単位をマツチングの尺度として行なうパタン照合によ
る標準パタンの選択にはパラメータの見間距離による方
法と言賭的な要素との対応による方法とがある。
Now, as a unit for pattern matching, either a physical unit that focuses on the physical characteristics of the sound, such as the spectral envelope of the input voice, or a linguistic unit that focuses on the linguistic imitation of the voice, can be used. The most efficient pattern matching vocoder configuration is selected according to the Uchidera, and standard patterns are selected by pattern matching using these units as a matching measure. There is a method that deals with gambling elements.

従って、たとえはLaP型パタンマツチングボコーダの
如(、LPCボコーダの機能を内戚するものKあっては
、LPCボコーダの機能との親和性を考慮し、マツチン
グ単位には物理単位、選択方法にはパラメータ空間距離
を利用することが望ましいと言える。
Therefore, for example, a LaP pattern matching vocoder (or one that has the functions of an LPC vocoder), the matching unit is a physical unit, and the selection method is It can be said that it is desirable to use the parameter spatial distance.

LSP型パタンマツチングボコーダにおけるパタンマツ
チング尺度として利用されるパラメータ空1’14m1
mハ、LSP 係数4LPC,PARCOR4fiと同
様に空間ベクトルと見做すことができ、この空間ベクト
ル間の距離を尺度としてその大小比較によって入力音声
信号のLSP係数に最も近い標準パタンを選択するため
に利用される。このような空間ベクトルであるLSP係
数間の距離は次の(1)弐に示すスペクトル距離Dff
ijによりて示される。
Parameter space 1'14m1 used as a pattern matching measure in LSP type pattern matching vocoder
mc, LSP coefficient 4LPC, PARCOR4fi can be regarded as a space vector, and in order to select the standard pattern closest to the LSP coefficient of the input audio signal by comparing the magnitude using the distance between these space vectors as a measure. used. The distance between LSP coefficients, which are space vectors, is the spectral distance Dff shown in (1) 2 below.
It is indicated by ij.

l  π Dij= −/  (8i(−−83((4)” dω
−・−−−−−(1)π   ・ (1)式社また次の(2)式の如く近似等式に変換しう
る。
l π Dij= −/ (8i(−−83((4)” dω
−・−−−−(1)π ・(1) Equation can also be converted into an approximate equation as shown in Equation (2) below.

(1)および(2)式において、i、jijL8F分析
および合成における処理単位区間でるる7レーム(ブロ
ック)の番号s S l (’4−8 J (−は周波
数ωの関数としてのフレームiおよびjの対数スペクト
ル、pk(1)、 palはフレームiおよびjにおけ
るN次のLSP係数%WkはN次のI、8Pスペクトル
径度である。
In equations (1) and (2), the number s S l ('4-8 J (- is the frame i and The logarithmic spectrum of j, pk(1), pal is the Nth-order LSP coefficient in frames i and j, %Wk is the Nth-order I, 8P spectral diameter.

L8F係数の次数は、L8F係数によって実現すべき声
道フィルタを構成するための全極型デジタルフィルタの
次数と対応し、N次の全極型デジタルフィルタにあって
は、通常LSP周波数と呼ばれるN個の巌スペクトルω
1.ω鵞、ω3・・・・・・ωNを示す。またN次のL
SPスペクトル感度WkはN次のL8F係数の微少変化
によって起るスペクトル変化の程度を示すものであって
、通常LSP周波数に対応して決定されるL8F周波数
スペクトル感度が用いられる。
The order of the L8F coefficients corresponds to the order of an all-pole digital filter for configuring the vocal tract filter to be realized by the L8F coefficients, and in an N-order all-pole digital filter, the order of N individual rock spectrum ω
1. ω goose, ω3...shows ωN. Also, the Nth L
The SP spectral sensitivity Wk indicates the degree of spectral change caused by a minute change in the N-th order L8F coefficient, and the L8F frequency spectral sensitivity determined in accordance with the LSP frequency is usually used.

さて、人力背戸信号のスペクトル色釉に最も近似した標
準パタンを、予め登録された橡準パタン鮮から選択する
には(1)式によるスペクトル距離の計算を入力音声信
号の全フレームにわたって全標準パタンとの間で実行す
ればよいことKなるが、この演算量は極めて膨大なもの
となるため、一般的には(2)式の近似等式を利用して
いわゆる簡易スペクトル距離を計測する。これは、分析
された入力音声信号の空間特徴ベクトルであるN次のL
SP係数pJUと、標準パタンに登録されている空間特
徴ベクトルpH1lとの内積を各次数のLSF係数ごと
に求めたうえ、LSP係数の次数に対応するLSF周波
数ごとに予め設定する重みづけ%数をしてのWkを乗じ
た簡易スペクトル距離計測を行なうものである。
Now, in order to select the standard pattern that is most similar to the spectral color glaze of the human-powered back door signal from among the pre-registered semi-patterns, the spectral distance calculation using equation (1) is performed using all the standard patterns over all frames of the input audio signal. However, since the amount of calculation is extremely large, the approximate equation (2) is generally used to measure the so-called simple spectral distance. This is the spatial feature vector of the analyzed input audio signal of order N
The inner product of the SP coefficient pJU and the spatial feature vector pH1l registered in the standard pattern is calculated for each order of LSF coefficient, and the weighting percentage set in advance for each LSF frequency corresponding to the order of the LSP coefficient is calculated. Simple spectral distance measurement is performed by multiplying by Wk.

(発明が解決しようとする問題点) 従来のこの種のLSPfiパタンマツチングボコーダは
、(2)式に示す重みづけ係数WkにI8P8r数に対
応するLSP周技数スペクトル感度を利用しているが、
とのLSP周波数スペクトル感度はり、8r周rf!1
.数間隔によって異なるため、単純にこのようなスペク
トルm度を用いて計測したスペクトル距離をパタンマツ
チングの尺にとして標準パタンを選択した場合には合成
すべき音7!!Iヲ大きく劣化することが多いという欠
点がある。
(Problems to be Solved by the Invention) This type of conventional LSPfi pattern matching vocoder uses the LSP frequency spectrum sensitivity corresponding to the I8P8r number as the weighting coefficient Wk shown in equation (2). ,
LSP frequency spectrum sensitivity with 8r frequency rf! 1
.. Since it differs depending on the number interval, if a standard pattern is selected using the spectral distance measured using such a spectrum m degree as the measure for pattern matching, the sound to be synthesized is 7! ! The disadvantage is that I often deteriorate significantly.

本発明の目的は上述した欠点を除去し、少数の標準パタ
ンを予備選択し、前記選択された標準パタンと入力音声
信号とのスペクトル包絡との差を直接比較する手質を備
えることによシ、音質の劣化を大幅に改善し得るLSP
fiパタンマツチングボコーダを提供することにある。
The object of the present invention is to eliminate the above-mentioned drawbacks by providing a system with the ability to preselect a small number of standard patterns and directly compare the difference between the selected standard patterns and the spectral envelope of the input audio signal. , LSP that can significantly improve sound quality deterioration
An object of the present invention is to provide a fi pattern matching vocoder.

(問題点を解決するだめの手段) 本発明のボコーダは、音声資料のL 8 P (Lin
e8pectrum Pa1r )係数の分布を考慮し
て作成された標準パタンと入力音声信号をLSP分析し
で得られるLSP係数に関するパタンとを照合して入力
音声信号の合成を行なうLSP型パタンマツチングボコ
ーダにおいて、前記標準パタンの1.SP係数と前記入
力音声信号のL8F係数との重みづけ内積によるスペク
トル距離を計測して少数の標準パタンを予備選択し、前
記選択されたli!準パタンよシスベクトル包絡を算出
し、算出されたスペクトル包絡と入力音/!1信号を分
析して求められたスペクトル包絡との差を計測し、前記
計測された差が最小となる@準パタンを代表パタンとし
て選゛択する手段を備えて構成される。
(Means for Solving the Problems) The vocoder of the present invention is capable of processing L8P (Lin
e8pectrum Pa1r) In an LSP type pattern matching vocoder that synthesizes an input audio signal by comparing a standard pattern created in consideration of the coefficient distribution with a pattern related to LSP coefficients obtained by LSP analysis of the input audio signal, 1. of the standard pattern. A small number of standard patterns are preliminarily selected by measuring the spectral distance based on the weighted inner product of the SP coefficient and the L8F coefficient of the input audio signal, and the selected li! Calculate the cisvector envelope of the quasi-pattern, and use the calculated spectral envelope and input sound /! The present invention is configured to include means for measuring a difference from a spectrum envelope obtained by analyzing one signal, and selecting a quasi-pattern for which the measured difference is the minimum as a representative pattern.

(実施例) 次に図面を参照して本発明の詳細な説明する。(Example) Next, the present invention will be described in detail with reference to the drawings.

第1図四、郵)は本発明の第一の実施例を示すブロック
図であシ第1図(5)は分析側、第1図(ロ)は合成側
の構成を示すブロック図である。
Fig. 1 (4) is a block diagram showing the first embodiment of the present invention, Fig. 1 (5) is a block diagram showing the structure of the analysis side, and Fig. 1 (b) is a block diagram showing the structure of the synthesis side. .

第1図(5)に示す分析図1は、L P F (Low
 Pa5sFilter) l l 、 A/Dコyパ
ータ12.窓関数処理器13.自己相関係数計側器14
 、LPC分析器15.有声/無声/無音判別器16.
ピッチ抽出器17 、LSP分析器18.スペクトル距
離計測器19.標準パタンメモリ20.周波数スペクト
ル感度メモ’J21 、標準パタン選択器22および符
号化@23を備えて構成され、また第1図(B)に示す
合成111!12は、復号器24.パタン復号器25゜
標準パタンメモ926.LbP合成器27.可変利得増
1M器28.切替器29.パルス発生器30゜雑音発生
器31.D/ムコンバータ32およ0LPP33を備え
て構成される。
The analytical diagram 1 shown in FIG. 1 (5) shows that L P F (Low
Pa5sFilter) l l, A/D Coy Parter 12. Window function processor 13. Autocorrelation coefficient meter 14
, LPC analyzer 15. Voiced/unvoiced/silent discriminator 16.
Pitch extractor 17, LSP analyzer 18. Spectral distance measuring instrument 19. Standard pattern memory 20. The synthesis 111!12 shown in FIG. Pattern decoder 25° standard pattern memo 926. LbP synthesizer 27. Variable gain multiplier 1M unit 28. Switcher 29. Pulse generator 30° noise generator 31. It is configured to include a D/mu converter 32 and an 0LPP 33.

第1図(5)において、入力ライン111を介して入力
する人力音声信号はLPFIIによって所定の分析帯域
の周波数成分がフィルタリングされ、出力2イン112
を介してA/Dコンバータ12に送出されて所定のビッ
ト数でデジタル化されたのち量子化音声信号として出力
ライン121を介して窓関数処理器13に送出される。
In FIG. 1 (5), the human voice signal input via the input line 111 is filtered for frequency components in a predetermined analysis band by the LPFII, and the output 2-in 112
The signal is sent to the A/D converter 12 via the A/D converter 12, where it is digitized with a predetermined number of bits, and then sent to the window function processor 13 via the output line 121 as a quantized audio signal.

窓関数処理器13は、入力した音声信号の30m5EC
ずつにハミング関数を乗算する窓関数処理を行なうがこ
の窓関数処理は10m5EC周期で繰返されこれを基本
フレーム周期としている。
The window function processor 13 processes 30m5EC of the input audio signal.
Window function processing is performed in which each frame is multiplied by a Hamming function, and this window function processing is repeated at a cycle of 10m5EC, which is defined as the basic frame cycle.

こうして窓関数処理された入力音声信号の音声波形デー
タは基本フレームごとに出力ライン131を介して自己
相関係数計測器14に送出される。
The audio waveform data of the input audio signal subjected to the window function processing is sent to the autocorrelation coefficient measuring device 14 via the output line 131 for each basic frame.

自己相関係数計61j器14社、入力した音声波形デー
タを乗算回路等を利用して各遅れ時間における自己相関
係数を必貴な遅れ時間内で計測し、この自己相関91.
数データを出力2イン151を介してLPC分析器15
に、また出力ライン152を介して有声/無声/無音判
別器16およびピッチ抽出器17に送出するとともに、
遅れ時間苓にお−ける自己相関係数をとシこれを基本フ
レームあたシの短時間音声電力データとして出力ライン
153を介して符号化器23に送出する。
An autocorrelation coefficient meter 61j from 14 manufacturers measures the autocorrelation coefficient at each delay time within the required delay time using a multiplication circuit or the like using the input audio waveform data, and calculates the autocorrelation coefficient 91.
LPC analyzer 15 outputs numerical data via 2-in 151
In addition, it is sent to the voiced/unvoiced/silent discriminator 16 and the pitch extractor 17 via the output line 152, and
The autocorrelation coefficient at the delay time is determined and sent to the encoder 23 via the output line 153 as short-time audio power data for each basic frame.

有声/無声/無音判別器16は入力した自己相関係数デ
ータを利用し、各基本フレームごとに含まれる音声信号
の有声あるいは無声、もしく紘無音状態を判別しこれを
有声/無声/無音判別データとして出力ライン161を
介して符号化器23に送出、またピッチ抽出器17は入
力した自己相関係数データを利用して各基本フレームご
とに含まれる音声信号のピッチデータを抽出、これを出
力2イン171を介して符号化器23に送出する。
The voiced/unvoiced/silent discriminator 16 uses the input autocorrelation coefficient data to determine whether the audio signal included in each basic frame is voiced, unvoiced, or completely silent, and determines whether it is voiced/unvoiced/silent. It is sent as data to the encoder 23 via the output line 161, and the pitch extractor 17 uses the input autocorrelation coefficient data to extract the pitch data of the audio signal included in each basic frame and outputs it. It is sent to the encoder 23 via the 2-in 171.

LPC分析器15は、後述するLSP分析器18ととも
に可変長フレームLSP分析回路を構成するものであシ
、本実施例においてはLSP分析器18において、有声
/°無戸/無音判別器16から出力ライン162を介し
て受ける有声/無声/無音判別データにもとづきフレー
ムを、有声および無声に対応する有音区間と、それ以外
の無音区間とに分けこれら2つの区間にそれぞれ予め設
定する可変長伝送フレームを設定している。この場合、
LPG分析器15はよく知られたレビンソン法によって
、入力したフレームごとの自己相関係数を利用して線形
予測係数を予め定める次数、本実施例の場合は10次ま
で算出し、これを出力ライン154を介してLSP分析
器18に送出し、LSP分析器18紘この線形予測係数
をNewtonの反復法を利用する高次方程式法によっ
て10次のL8F係数に変′換し、さらに基本フレーム
ごとの一定周期をもったこのLSP8P係数、出力ライ
ン162を介して入力する有声/無声/無音判別データ
による情報を利用しながら予め設定する近似関数による
最適近似法によって可変長周期化した可変フレーム長に
変換する。
The LPC analyzer 15 constitutes a variable-length frame LSP analysis circuit together with an LSP analyzer 18 (to be described later). Based on the voiced/unvoiced/silent discrimination data received via the line 162, the frame is divided into voiced sections corresponding to voiced and unvoiced, and other silent sections, and a variable length transmission frame is set in advance for each of these two sections. is set. in this case,
The LPG analyzer 15 uses the autocorrelation coefficient of each input frame to calculate linear prediction coefficients up to a predetermined order (in the case of this embodiment, up to the 10th order) using the well-known Levinson method, and outputs the linear prediction coefficients to the output line. 154 to the LSP analyzer 18, and the LSP analyzer 18 converts the linear prediction coefficients into 10th-order L8F coefficients by a higher-order equation method using Newton's iterative method, and further converts the linear prediction coefficients into 10th-order L8F coefficients for each basic frame. This LSP8P coefficient with a constant period is converted into a variable frame length with a variable period by an optimal approximation method using an approximation function set in advance while using information from voiced/unvoiced/silent discrimination data input via the output line 162. do.

また、このようなLSP分析の前処理として、入力音声
データの高域強調を行なうために波形の1次差分を利用
し波形領域における高域成分の事前強調を行なうプリエ
ンファシス(Pre −Emphasis)処理、およ
び自己相関係数領域におけるLag@数によるLagウ
ィンド処理が行なわれるが、これらの前処理はLSP8
P係数最小間隔を広げ、後述する合成1112における
LAF合成−270全極形デジタルフイルタの安定性全
増大させるためLSP量子化感脱の低域を図って行表わ
れるものである。
In addition, as pre-processing for such LSP analysis, pre-emphasis processing is performed to pre-emphasize high-frequency components in the waveform region using the first-order difference of the waveform in order to emphasize the high-frequency components of the input audio data. , and Lag window processing using Lag@ numbers in the autocorrelation coefficient region, but these preprocessings are performed using LSP8
This is done by widening the minimum interval of the P coefficients and increasing the stability of the LAF synthesis-270 all-pole digital filter in synthesis 1112, which will be described later, by reducing the LSP quantization sensitivity in the low range.

さて、このように得られた10次のLSF係数は出力ラ
イン181を介してスペクトル距離計側器19に送出さ
れる。またLSP分析器18からは可変長フレームを形
成する際に基本フレーム長を伸縮したフレーム変化率情
報、いわゆるレピートビットデータを出力ライン182
を介して符号化器23に送出する。
Now, the 10th-order LSF coefficient obtained in this way is sent to the spectral distance meter side unit 19 via the output line 181. In addition, from the LSP analyzer 18, frame change rate information obtained by expanding or contracting the basic frame length when forming a variable length frame, so-called repeat bit data, is output to an output line 182.
The data is sent to the encoder 23 via the encoder 23.

LAF分析器18から出力ライン181を介してスペク
トル距離計測器19に送出されたlO次LSP係数は、
スペクトル距離計測器19において(2)式の近似等式
によ〕、いわゆる簡易スペクトル距離を演算する〇 (2)式による(資)易スペクトル演算における入力音
声慎号の特徴ベクトル、すなわちpk(i)K相当する
lO次LSP係数と、標準パタンメモリ20に登録され
た標準パタンの%倣ベクトル、すなわちpk(j) K
相当する標準10次LSP係数との内積が(2)式の如
くまずyL算され、この内積に対して周波数スペクトル
感度Wkが重みづけ係数として乗算されたものが1次の
LSP係数から10次のLSP係数まで、入力電声信号
の可変長フレームのおのおのについて標準パターンメモ
!720に登録されたLSP係数の☆パターンとの間で
実行され、スペクトル距離Dijが決定し、可変長フレ
ームのおのおのについてこのスペクトル距離Dijが最
も小さいものがそれぞれ標準パターンとして選択される
。このような標準パターンは、標準パタンメモリ20に
おける標準パタン登録アドレスコードを指定する標準パ
タン指定コードデータとして次次に出力ライン191を
介して符号化23に送出される。
The lO-order LSP coefficients sent from the LAF analyzer 18 to the spectral distance measuring device 19 via the output line 181 are:
The spectral distance measuring device 19 calculates the so-called simple spectral distance using the approximate equation of equation (2). ) K corresponding lO-order LSP coefficients and the % imitation vector of the standard pattern registered in the standard pattern memory 20, that is, pk(j) K
The inner product with the corresponding standard 10th-order LSP coefficient is first calculated as yL as shown in equation (2), and this inner product is multiplied by the frequency spectral sensitivity Wk as a weighting factor to calculate the 10th-order LSP coefficient from the 1st-order LSP coefficient. Standard pattern memo for each variable length frame of the input voice signal, up to the LSP coefficient! The spectral distance Dij is determined, and the pattern with the smallest spectral distance Dij is selected as the standard pattern for each variable length frame. Such standard patterns are sequentially sent to the encoder 23 via the output line 191 as standard pattern designation code data that designates the standard pattern registration address code in the standard pattern memory 20.

糠早パタンメモリ20に登録され、ストアされている標
準パタンは、本実施例の場合、次のようにして予め別な
シンピ為−夕によるオフ:)イン処理で作成されるが、
これを本実施例によるボコーダを利用して予め作成して
おいても一向に差支えない。
In the case of this embodiment, the standard pattern registered and stored in the Nukahaya pattern memory 20 is created in advance by a separate input process as follows.
There is no problem even if this is created in advance using the vocoder according to this embodiment.

まず、予め設定した音声資料を利用しLPC分析等の手
法によって無音区間の除去、不要な近接フレームの除去
、有声、無音、無音による介抱等の前飽理を実施する。
First, pre-saturation such as removal of silent sections, removal of unnecessary adjacent frames, and voiced, silent, and silent assistance is performed using a method such as LPC analysis using preset audio data.

この場合、フレーム周期は10m8ECとし、この各フ
レームごとに有声、無声、無音および有声の無声との境
界音いずれに属するかのタグコードを与える。次に無音
フレームを除去し残シのフレームを有声と無声とに分離
し、このとき境界音は有声と無声とのいずれか又は双方
に含ませるものとする。
In this case, the frame period is 10 m8 EC, and a tag code is given to each frame to indicate whether it belongs to voiced, unvoiced, unvoiced, or voiced/unvoiced boundary sound. Next, silent frames are removed and the remaining frames are separated into voiced and unvoiced frames, and at this time, boundary sounds are included in either or both of the voiced and unvoiced frames.

さらに、時間的に接近しスペクトル距離の小さいフレー
ムを除去し、このようにして必要とするサンプル数の削
減を図ったうえこれらを従来から知られている標準パタ
ン選択手法によって、予め設定する各スペクトル距離ご
とに分類して標準パタンとして登録、ストアしておくも
のでおる。
Furthermore, frames that are close in time and have a small spectral distance are removed, thus reducing the number of required samples. The patterns are classified by distance and registered and stored as standard patterns.

上述した標準パタン手法は、本実施例の場合10次元L
8F係数の空間υがN(−のパタンから成るものとし、
このN個のパタンのおのおのについて(り式によってス
ペクトル距離を計測し、これが予じめ設定するスペクト
ル距離域値#dBj”をもつものをN個のパタンすべて
について求め、このパタン数Mi=(i=1.2.・・
・・・・N)のうち最大のMiをもつパタンPLを決定
したうえ、パタンPLにおけるスペクトル距離が、予め
設定する値#dB”以下のパタンを10次元LSP係数
の空間Uから除去したのちPLを標準パタンとして登録
し、このような操作を空間UK含まれるパタンかなくな
るまで繰返して実施して標準パタンとして登録するもの
である。
In the case of this example, the standard pattern method described above is 10-dimensional L
Assume that the space υ of 8F coefficients consists of N(- patterns,
For each of these N patterns, the spectral distance is measured using the following formula, and the number of N patterns that has a preset spectral distance range value #dBj is determined, and the number of patterns Mi = (i =1.2...
After determining the pattern PL with the maximum Mi among . is registered as a standard pattern, and this operation is repeated until there are no more patterns including the space UK, and the pattern is registered as a standard pattern.

また、周波数スペクトル感度メモリ21にそれぞれスト
アされている内容は次のようにして決定される。
Further, the contents stored in each frequency spectrum sensitivity memory 21 are determined as follows.

音声資料を(1)式によりて実測して得られるLSPの
に番目(K次)の要素Pkのスペクトル感度は、次の(
3)弐によって求められる。
The spectral sensitivity of the second (Kth) element Pk of the LSP obtained by actually measuring the audio material using equation (1) is as follows (
3) Required by Ni.

/(ΔPk)”dB”/?ジアン・・・・・・・・・(
3)(2)式においてΔPkはPkの微少変化であ1.
8i(→はこの場合P、、P、、・・・・・・Pk・・
・・・・PL等から求めたスペクトル包Wts 8j(
ロ)はP、 、P、 、・・・・・・Pk+ΔPk・・
・・・・PLから求めたスペクトル包絡を用いている。
/(ΔPk)”dB”/? Jian......(
3) In equation (2), ΔPk is a minute change in Pk, and 1.
8i (→ in this case P,,P,,...Pk...
...spectral envelope Wts 8j (
b) is P, ,P, ,...Pk+ΔPk...
...The spectrum envelope obtained from PL is used.

従って(3)式によって、ΔPkを予め設定する値θラ
ジアンとした場合、10次のLSF係数の各周波数に関
するLSP周波数スペクトル感度が得られる。
Therefore, according to equation (3), when ΔPk is a preset value θ radian, the LSP frequency spectrum sensitivity for each frequency of the 10th-order LSF coefficient can be obtained.

パタン照合においては、こうして得られた周波数スペク
トル感度を重みづけ係数として入力音声信号のLAF分
析データと標準パタンとのスペクトル距離を(2)式に
よって演算し、スペクトル距離が最小となるものから小
いさい順に所望の数の標準パタンを可変長フレーム毎に
検索し、こ五らの*準パタンデータ(10次1.8P)
と標準パタン指定コードデータとを出力ライン191を
介して標準パタン選択器22へ出力する。
In pattern matching, the spectral distance between the LAF analysis data of the input audio signal and the standard pattern is calculated using equation (2) using the frequency spectral sensitivity obtained as a weighting factor, and the spectral distance is calculated from the one with the minimum spectral distance to the smallest one. A desired number of standard patterns are searched for each variable length frame in order of size, and these five * quasi-pattern data (10th order 1.8P) are
and standard pattern designation code data are output to the standard pattern selector 22 via the output line 191.

標準パタン選択622は本発明の最も重要な部分で64
)、その詳細な動作は後述するが、概略、以下の機能を
有する。msパタン選択器22はスペクトル距離計測器
19によシ予備選択された所望の数の標準パタンからス
ペクトル包絡を算出し、これとスペクトル距離計測器、
L8F8P器を介してLPC分析器よシ供給される縁形
予測係数から算出されるスペクトル包絡の差を算出し、
前記差が最小となる標準パタンに対応する標準パタン指
定コードデータを符号化器23へ出力する。
Standard pattern selection 622 is the most important part of the invention 64
), its detailed operation will be described later, but generally it has the following functions. The ms pattern selector 22 calculates a spectral envelope from a desired number of standard patterns preselected by the spectral distance measuring device 19, and calculates the spectral envelope from the spectral distance measuring device 19,
Calculating the difference in spectral envelope calculated from the edge shape prediction coefficients supplied by the LPC analyzer via the L8F8P device,
Standard pattern designation code data corresponding to the standard pattern with the minimum difference is output to the encoder 23.

符号化器23は、このようにして供給された各データを
予め設定する符号形式によって符号化しこれを伝送路2
31を介して合成側2に伝送する。
The encoder 23 encodes each data thus supplied in a preset code format and transmits it to the transmission path 2.
31 to the combining side 2.

合成114112では伝送路231を介して入力した各
極符号化情報の復号化を行ない、標準パタン指定。
In the synthesis 114112, each pole encoded information input via the transmission line 231 is decoded and a standard pattern is specified.

コードデータは入力ライン251を介してパタン復号器
25、レピートビットデータは入力ライン271を介し
てL8F8P器27、短時間音声電力データは入力ライ
ン281をプrして可変利得増幅器28、有声/無声/
無音判別データおよびピッチデータはそれぞれ人力ライ
ン291および301を介して切替器29およびパルス
発生器30に供給する。
Code data is input to the pattern decoder 25 via the input line 251, repeat bit data is input to the L8F8P unit 27 via the input line 271, and short-time audio power data is input to the input line 281 to the variable gain amplifier 28, voiced/unvoiced. /
Silence discrimination data and pitch data are supplied to switch 29 and pulse generator 30 via human power lines 291 and 301, respectively.

パタン復号器25は、入力した標準パタン指定コードデ
ータによって指定される標準パタンを標準パタンメモリ
26から出力ライン261を介して耽出し、これを出力
ライン252を介してLSF合成器27に送出する。I
I準パタンメモリ26は分析$111における標準パタ
ンメモリ2oと#1ぼ同一のものであ)、パタン復号器
25によってLSP合成器27に供給されるデータは分
析−のパタン照合の結果入力音声信号の内容に対応して
可変長フレームごとに選択された標準パタンによるL8
F8F係数すなわちLSF周波数列である。
The pattern decoder 25 extracts the standard pattern specified by the input standard pattern designation code data from the standard pattern memory 26 via the output line 261 and sends it to the LSF synthesizer 27 via the output line 252. I
The I semi-pattern memory 26 is almost the same as the standard pattern memory 2o in the analysis $111), and the data supplied to the LSP synthesizer 27 by the pattern decoder 25 is the input audio signal as a result of pattern matching in the analysis. L8 according to a standard pattern selected for each variable length frame corresponding to the content of
This is an F8F coefficient, that is, an LSF frequency sequence.

LSP合成器27は、こうして入力したLSF係数列を
含む可変長フレームを、入力ライン271を介して受け
るレピートビットデータによってもとの基本7レームご
とに復元し、これを予め設定する近似関数を利用して入
力音声信号の標本化間隔、すなわち合成@1の窓@数処
理器14における標本化周期でLSP係数を補間する。
The LSP synthesizer 27 restores the variable length frame containing the LSF coefficient sequence inputted in this manner into the original basic 7 frame units using the repeat bit data received via the input line 271, and uses an approximation function to set this in advance. Then, the LSP coefficients are interpolated at the sampling interval of the input audio signal, that is, at the sampling period in the synthesis@1 window@number processor 14.

こうして補間処理を受けた基本フレームごとのL8F係
数は全極形モデルによる10次のLSP音声合成デジタ
ルフィルタのフィルタ係数として供給される。
The L8F coefficients for each basic frame subjected to interpolation processing in this manner are supplied as filter coefficients of a 10th-order LSP speech synthesis digital filter based on an all-pole model.

LSP音声合成デジタルフィルタはこのようにして入力
するフィルタ係数と、可変利得増幅器28から出力ライ
ン282を介して入力する音源励振電力とによって音声
合成デジタルフィルタとしての演算を行ない、デジタル
形式の合成音声出力を得てこれを出力ライン272t−
介してL)/Aコンバータ32に送信する〇 上述した音源励振電力は、入力音声信号からスペクトル
包絡成分を除いたいわゆる残差電力に対応するものであ
)、入力音声信号を再現する場合にスペクトル包絡成分
としてのL8F係数とともに必要な音源情報を付与する
ものでこれは次のようにして発生する。
The LSP voice synthesis digital filter performs calculations as a voice synthesis digital filter using the input filter coefficients and the sound source excitation power input from the variable gain amplifier 28 via the output line 282, and outputs synthesized voice in digital format. and output this to the output line 272t-
The above-mentioned sound source excitation power, which is transmitted to the L)/A converter 32 via the input audio signal, corresponds to so-called residual power obtained by removing the spectral envelope component from the input audio signal. Necessary sound source information is added together with the L8F coefficient as an envelope component, and this is generated as follows.

入力ライン281を介して入力した各基本フレームごと
の短時間音声電力データは可変利得増幅器28に供給さ
れる。
Short-term audio power data for each basic frame input via input line 281 is supplied to variable gain amplifier 28 .

一方、パルス発生器30は入力ライン301を介してピ
ッチデータを受け、このピッチデータに対応し予め設定
された周波数のパルスをピッチパルスとして発生しこれ
を出力ライン302を介して切替器29に送出する。
On the other hand, the pulse generator 30 receives pitch data via an input line 301, generates a pulse with a preset frequency corresponding to the pitch data as a pitch pulse, and sends this to the switch 29 via an output line 302. do.

切替器29は、入力ライン291を介して受ける有声/
無声/無音判別データが有声を指定するときは上述した
ピッチパルスを選択し、また無声もしくは無音を指定す
るときには雑音発生器31の出力する白色雑音を出力ラ
イン311を介して入力するように切替える動作を行な
う。切替器29によって選択出力されるパルス発生器3
0もしくは雑音発生fF31の出力は、出力ライン29
2を介して可変利得増幅器28に供給され、入力ライン
281を介して入力した短時間音声電力データの大きさ
に対応する重みづけを受けるように可変増幅されて音源
励振電力として出力ライン282に送出される。
The switch 29 receives voiced/
When the unvoiced/silent discrimination data specifies voiced, the pitch pulse described above is selected, and when unvoiced or silent, the white noise output from the noise generator 31 is switched to be input via the output line 311. Do the following. Pulse generator 3 selectively output by switch 29
0 or the output of the noise generating fF31 is output on the output line 29.
2 to the variable gain amplifier 28, where it is variably amplified so as to receive weighting corresponding to the magnitude of the short-time voice power data input through the input line 281, and is sent to the output line 282 as sound source excitation power. be done.

ζうしてLSP合成器27から出力したデジタル形式の
合成音声信号は次にD/Aコンバータ32によってアナ
ログ化され、LPF33によりて所要の帯域をフィルタ
リングして合成音声信号として出力ライン331に送出
される。
ζThe digital synthesized voice signal outputted from the LSP synthesizer 27 is then converted into an analog signal by the D/A converter 32, filtered for a required band by the LPF 33, and sent to the output line 331 as a synthesized voice signal. .

このようにしてLSP周波数間隔スペクトル感度を重み
づけ係数として計測したスペクトル距離によるパタン照
合を介して行なう入力音声信号の分析1合成が容易に実
施できる。
In this way, analysis 1 synthesis of input audio signals can be easily performed through pattern matching using spectral distances measured using LSP frequency interval spectral sensitivities as weighting factors.

次に標準パタン選択器22の動作を詳細に説明する。第
2図は標準パタン選択器22の動作を詳細に説明するた
めのブロック図である。
Next, the operation of the standard pattern selector 22 will be explained in detail. FIG. 2 is a block diagram for explaining the operation of the standard pattern selector 22 in detail.

スペクトル距離計測器19によシ予備選択された所望の
数の標準パタンデータは出力2イン191を介してω/
α変換器40へ、標準パタン指定コードデータは2ベル
メモリ41へ各々供給される。
The desired number of standard pattern data preselected by the spectral distance measuring device 19 is sent to ω/
The standard pattern designation code data is supplied to the α converter 40 and the 2-bell memory 41, respectively.

尚、標準パタンデータはスペクトル距離計測器19での
計測結果に基づき、前記距離の最小のものよシ順々に、
前記距離を昇べきに出力される。ω/α変換器40マイ
クロプロセッサであ)%スペクトル距離が昇べきとなる
順序で入力される標準パタンデータを所定の番地に記録
する。ω/α変換器は更に記録した標準パタンデータ(
10次LSP)を10次のαパラメータに変換し、前記
スペクトル距離が昇べきとなる順序で変換結果をαバラ
メ−タメモリ42へ出力する。尚、L8F係数をαパラ
メータへ変換する方法は次の通シである。LSP係数は
下記(3)弐におけるωiであることが板倉氏らによシ
示されている。(音声研究会資料879−46第10式
) %式% 従がって下記■〜■の手順に従りてLSPよシーパラメ
ータへ変換される。
In addition, the standard pattern data is based on the measurement results with the spectral distance measuring device 19, and in order from the one with the minimum distance,
The distance is output as the distance increases. Standard pattern data input to the ω/α converter 40 microprocessor in the order in which the % spectral distance increases is recorded at a predetermined address. The ω/α converter also uses the recorded standard pattern data (
The 10th order LSP) is converted into a 10th order α parameter, and the conversion results are output to the α parameter memory 42 in the order in which the spectral distance increases. Note that the method for converting the L8F coefficient into the α parameter is as follows. Itakura et al. have shown that the LSP coefficient is ωi in (3) 2 below. (Voice Study Group Material 879-46, Formula 10) % Formula % Therefore, the LSP is converted into a sea parameter according to the steps ① to ② below.

■Pp(Z)=(1−Z−”Xl 2cos a+1Z
−’+Z−”)(1−2cosm4Z−1+Z−” )
 −−−−(1−2cos 0)16z−”+Z−” 
)=(1−Z−凰)(1+PtZ−’+P1Z−”−1
”・・+P1@Z−”)    (6)ただしpt=p
t・P雪=P・・・・P、= P。
■Pp(Z)=(1-Z-”Xl 2cos a+1Z
-'+Z-") (1-2cosm4Z-1+Z-")
-----(1-2cos 0)16z-"+Z-"
)=(1-Z-凰)(1+PtZ-'+P1Z-''-1
"...+P1@Z-") (6) However, pt=p
t・P snow=P...P,=P.

テh ”) P iハPplZ)/ (1−Z−” )
 を展開したときの係数 Qp(Z)= (1+Z−’ ) (1−2cos ω
、Z−”+Z−” ) (1−2cos#5z−1+z
=)、−−−−−(1−2c08 m、z−t+z−s
)=(1+Z−”)(1+qlZ−”+q雪Z−”4”
+qto+Z−”)   (7)ただしqt=Qt・ 
Qs=q・・・・qs=(1・であシ qiはQt)/
(1+Z−1)を展開したときの係数 ” (2+(Pt+qt)Z−’+(P*+ql)Z−
”+・・・+=丁 (P、。+qt。)Z−” ) −’ Z−” ((P
t −qt )Z−”+(Pg−qs)Z−”+”・+
(Plo   Qto)Z−”)=1+4(Pt+qt
)Z−”+ 2 ((Ps+qs)−(Pt Qt) 
)Z−S + −・・     (8) ことKz−iの係数がαパラメータαiである。
Teh ”) PihaPplZ)/ (1-Z-”)
Coefficient Qp(Z) when expanded = (1+Z-') (1-2cos ω
,Z-"+Z-") (1-2cos#5z-1+z
=), -----(1-2c08 m, z-t+z-s
)=(1+Z-”)(1+qlZ-”+qSnow Z-”4”
+qto+Z-”) (7) However, qt=Qt・
Qs=q...qs=(1・adashi qi is Qt)/
Coefficient when expanding (1+Z-1)"(2+(Pt+qt)Z-'+(P*+ql)Z-
"+...+=Ding(P,.+qt.)Z-" ) -'Z-" ((P
t −qt )Z−”+(Pg−qs)Z−”+”・+
(Plo Qto)Z-”)=1+4(Pt+qt
)Z-”+ 2 ((Ps+qs)-(Pt Qt)
) Z-S + -... (8) The coefficient of Kz-i is the α parameter αi.

再び第2図に於いてスペクトル距離計測器19゜LSP
分析器18を介してLPC分析器15よ)供給される線
形予測係数(ai、i=1.2・・・10)はスペクト
ル包絡算出器43へ入力される。スペクトル包絡算出器
43はマイクロプルセッサであシ公知の方法によシ離散
的スペク°トル包絡データFi(N)(N=o、1.・
・・、101)を算出する。なお、この手法は斉藤、中
田両氏の共著1音声情報処理の基礎”オーム社、昭和5
6年11月の第7章1スペクトル推定”ページ96に述
べられている。算出されたFi(N)は出力ライン43
1t−介してスペクトル包絡メモリ44へ供給される。
Again in Figure 2, the spectral distance measuring device 19°LSP
The linear prediction coefficients (ai, i=1.2...10) supplied to the LPC analyzer 15 via the analyzer 18 are input to the spectral envelope calculator 43. The spectral envelope calculator 43 is a microprocessor that calculates discrete spectral envelope data Fi(N) (N=o, 1..
..., 101) is calculated. This method was co-authored by Messrs. Saito and Nakata, 1. Fundamentals of Speech Information Processing, Ohmsha, 1930.
Chapter 7 1 Spectrum Estimation” page 96 of November 2006. The calculated Fi(N) is the output line 43.
1t- to the spectral envelope memory 44.

スペクトル包絡メモリ44は前記Bi(N)を記録し必
要に応じてスペクトル包絡差算出器45へ出力する。α
パラメータメモリはスペクトル距離計測器19に於ける
スペクトル距−〇昇べき釦αパラメータを頃々にスペク
トル包絡算出器43へ出力する。スペクトル包絡算出器
43は離散的スペクトル包絡データ町(’)(N) (
N=o 、 l、・・・101 ) (ただしj=1 
、2・・・、であシーパラメータの供給9番と一致する
)を算出し出力ライン432を介してスペクトル包格差
算出器45へ出力する。スペクトル包絡差算出器45は
]Fi(N)とP /’2N)とから下記スペクトル距
離DIを を算出し最小距離パタン検索器46へ出力する。
The spectral envelope memory 44 records the Bi(N) and outputs it to the spectral envelope difference calculator 45 as required. α
The parameter memory outputs the spectral distance minus 0 button α parameter in the spectral distance measuring device 19 to the spectral envelope calculator 43 from time to time. The spectral envelope calculator 43 calculates discrete spectral envelope data (') (N) (
N=o, l,...101) (however, j=1
, 2, . The spectral envelope difference calculator 45 calculates the following spectral distance DI from ]Fi(N) and P/'2N) and outputs it to the minimum distance pattern searcher 46.

最小距離パタン検索器46はm1n(DI)となる!(
αパラメータの供給順序)を決定し、データjをラベル
メモリ41へ出力する。ラベルメモリ41はデータjK
よシスベクトル距離計測器19にょ一〕予備選択された
標準パタンのうちスペクトル距離が1番目に小いさい標
準パタンの標準パタン指定コードデータを符号化器23
へ出力する。
The minimum distance pattern searcher 46 becomes m1n(DI)! (
The order in which the α parameters are supplied is determined, and the data j is output to the label memory 41. Label memory 41 has data jK
System vector distance measuring device 19] Encoder 23 converts the standard pattern designation code data of the standard pattern with the smallest spectral distance among the preselected standard patterns.
Output to.

尚、予備選択するパタン数を所望の数として説明したが
、これは測定数でも可変数でも差しつかえない。可変数
とする場合には入力音声信号を分析して得られるLSP
パラメータの最小間隔、予備選択でのスペクトル距離勢
を利用して予備選択パタン数を決定できる。
Although the number of patterns to be preselected has been described as a desired number, it may be a measured number or a variable number. If the number is variable, the LSP obtained by analyzing the input audio signal
The number of preliminary selection patterns can be determined using the minimum interval of parameters and the spectral distance trend in preliminary selection.

上述した各実施例における分析側で、LSF分析器1B
によって得られるLSP係数は高次方程式法によって演
算しているが、これは高次方程式法とともKよ〈知られ
た零点探索法によりて実施してもよく、またこのLAF
係数は可変長フレームととに分析抽出しているが、この
可変長フレームは所望に応じ固定長フレームとしても差
支えない。
On the analysis side in each of the above embodiments, LSF analyzer 1B
The LSP coefficients obtained by
Although the coefficients are analyzed and extracted in a variable length frame, the variable length frame may be a fixed length frame if desired.

また、L8F8F係数の前処理として行なわれるプリエ
ンファシス処理およびLag関数処理は分析および合成
すべき入力音声信号の特徴、音声合成デジタルフィルタ
の内容、データビット数の配分勢を勘案し所望に応じて
実施の有無を選択しうろことは明らかである。
In addition, the pre-emphasis processing and Lag function processing performed as pre-processing of the L8F8F coefficients are performed as desired, taking into account the characteristics of the input audio signal to be analyzed and synthesized, the contents of the speech synthesis digital filter, and the distribution of the number of data bits. It is clear that there is a choice to be made with or without.

さらに、上述した各実施例においては10次のL8F係
数を利用して分析および合成を実施しているが、L8F
係数の次数を他の次数としても何様に実施しうろことは
明らかである。
Furthermore, in each of the above-mentioned examples, analysis and synthesis are performed using the 10th order L8F coefficient, but L8F
It is obvious that the coefficients can be implemented in other orders as well.

(発明の効果) 以上説明したように本発明によれば%LaP型パタンマ
ツチングボコーダにおいて、標準パタンのLSP係数と
入力音声信号のLAF係数とのスペクトル距離をLSP
係数のスペクトル感度を介して算出し、複数の標準パタ
ン候補を予備選択し、更に予備選択された標準パタン候
補から、実際のスペクトル包絡データを介して算出され
るスペクトル距離に基づいて最良の標準パタンを選択す
ることにより、LSP周波数間隔によりLSP周波数ス
ペクトル感度が異なるために必ずしも最適な標準パタン
か選択されない欠点を解決し、且つ、予備選択によシパ
タン候補を限定するととくよシ演算量の増加を最小限に
とどめるという効果がある。
(Effects of the Invention) As explained above, according to the present invention, in the %LaP pattern matching vocoder, the spectral distance between the LSP coefficient of the standard pattern and the LAF coefficient of the input audio signal is
The spectral sensitivity of the coefficient is calculated, multiple standard pattern candidates are preselected, and from the preselected standard pattern candidates, the best standard pattern is calculated based on the spectral distance calculated through the actual spectral envelope data. By selecting , it solves the problem that the optimal standard pattern is not necessarily selected because the LSP frequency spectrum sensitivity differs depending on the LSP frequency interval, and also minimizes the increase in the amount of computation by limiting the pattern candidates by preliminary selection. It has the effect of limiting

【図面の簡単な説明】[Brief explanation of the drawing]

第1図囚、@は本発明の第一の実施例によるLaP型パ
タンマツチングボコーダの分析側(5)および合成側但
)の構成を示すブロック図、第2図は本発明に於いて特
に重要な標準パタン選択器22を詳細に説明するための
ブロック図である。 l・・・・・・分析側、2・・・・・・合成側、11・
・・・・・LPF。 12・・・・・・ム/Dコンバータ、13・・・・・・
窓関数処理器、14・・・・・・自己相関係数計測器、
15・・・・・・LPC分析器、16・・・・・・有声
/無声/焦音判別器、17・・・・・・ピッチ抽出器、
18・・・・・・LSP分析器、19・・・・・・スペ
クトル距離計測器、20・・・・・・標準パ/yメモリ
、21・・・・・・周波数間隔スペクトル感度メモリ、
22・・・・・・標準パタン選択器、23・・・・・・
符号化器、24・・・・・・復号器、25・・・・・・
パタン復号器、26・・・・・・標準パタンメモリ、2
7・・・・・・LSP合成器、28・・・・・・可変利
得増暢器、29・・・・・・切替器、30・・・・・・
パルス発生器、31・・・・・・雑音発生器、32・・
・・・・D/Aコンバータ、33・・・・・・LPF、
40・・・・・・ω/α変換器、41・・・・・・ラベ
ルメモリ、42・・・・・・パラメータメモリ、43・
・・・・・スペクトル包絡算出器、44・・・・・・ス
ペクトル包絡メモリ、45・・・・・・スペクトル包絡
差算出器、46・・・・・・最小距離パタン検索器。 代理人 弁理士  内 原   晋 1、−、’、:、y− ゝ−一一、、、−
Figure 1 is a block diagram showing the structure of the analysis side (5) and the synthesis side of the LaP pattern matching vocoder according to the first embodiment of the present invention, and Figure 2 is a block diagram showing the configuration of the analysis side (5) and synthesis side of the LaP pattern matching vocoder according to the first embodiment of the present invention. FIG. 2 is a block diagram for explaining in detail the important standard pattern selector 22. FIG. l... Analysis side, 2... Synthesis side, 11.
...LPF. 12...Mu/D converter, 13...
Window function processor, 14...Autocorrelation coefficient measuring device,
15... LPC analyzer, 16... Voiced/unvoiced/focused discriminator, 17... Pitch extractor,
18... LSP analyzer, 19... Spectral distance measuring device, 20... Standard PA/Y memory, 21... Frequency interval spectral sensitivity memory,
22...Standard pattern selector, 23...
Encoder, 24... Decoder, 25...
Pattern decoder, 26...Standard pattern memory, 2
7...LSP synthesizer, 28...Variable gain amplifier, 29...Switcher, 30...
Pulse generator, 31...Noise generator, 32...
...D/A converter, 33...LPF,
40...ω/α converter, 41... Label memory, 42... Parameter memory, 43.
... Spectrum envelope calculator, 44 ... Spectrum envelope memory, 45 ... Spectrum envelope difference calculator, 46 ... Minimum distance pattern search device. Agent Patent Attorney Susumu Uchihara1,-,',:,y- ゝ-11,,-

Claims (1)

【特許請求の範囲】[Claims] 音声資料のLSP(Line Spectrum Pa
ir)係数の分布に関する標準パタンと入力音声信号を
LSP分析して得られるLSP係数に関するパタンとを
照合して入力音声信号の合成を行なうLSP量パタンマ
ッチングボコーダにおいて、前記標準パタンのLSP係
数と前記入力音声信号のLSP係数との重みづけ内積に
よるスペクトル距離を計測して少数の標準パタンを予備
選択する手段と、前記予備選択された標準パタンから算
出されるスペクトル包絡信号と入力音声信号を分析して
得られるスペクトル包絡信号とから算出されるスペクト
ル距離を用いて標準パタンを選択する手段とを有するこ
とを特徴とするLSP型パタンマッチングボコーダ。
LSP (Line Spectrum Pa) of audio materials
ir) In an LSP amount pattern matching vocoder that synthesizes an input audio signal by comparing a standard pattern regarding coefficient distribution with a pattern regarding LSP coefficients obtained by LSP analysis of an input audio signal, the LSP coefficients of the standard pattern and the means for preliminarily selecting a small number of standard patterns by measuring a spectral distance by a weighted inner product with an LSP coefficient of an input audio signal; and analyzing a spectral envelope signal calculated from the preselected standard patterns and the input audio signal. and means for selecting a standard pattern using a spectral distance calculated from the spectral envelope signal obtained by the LSP pattern matching vocoder.
JP60094924A 1985-05-02 1985-05-02 LSP type pattern matching vocoder Expired - Lifetime JPH0650440B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60094924A JPH0650440B2 (en) 1985-05-02 1985-05-02 LSP type pattern matching vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60094924A JPH0650440B2 (en) 1985-05-02 1985-05-02 LSP type pattern matching vocoder

Publications (2)

Publication Number Publication Date
JPS61252600A true JPS61252600A (en) 1986-11-10
JPH0650440B2 JPH0650440B2 (en) 1994-06-29

Family

ID=14123519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60094924A Expired - Lifetime JPH0650440B2 (en) 1985-05-02 1985-05-02 LSP type pattern matching vocoder

Country Status (1)

Country Link
JP (1) JPH0650440B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0275000A (en) * 1988-09-12 1990-03-14 Nippon Telegr & Teleph Corp <Ntt> Voice encoding method
JPH07212239A (en) * 1993-12-27 1995-08-11 Hughes Aircraft Co Method and device for quantizing vector-wise line spectrum frequency
US7392179B2 (en) 2000-11-30 2008-06-24 Matsushita Electric Industrial Co., Ltd. LPC vector quantization apparatus

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0856499A (en) * 1994-08-19 1996-03-05 Tomita Tekkosho:Kk Sheet fixer for vinyl house

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0275000A (en) * 1988-09-12 1990-03-14 Nippon Telegr & Teleph Corp <Ntt> Voice encoding method
JPH07212239A (en) * 1993-12-27 1995-08-11 Hughes Aircraft Co Method and device for quantizing vector-wise line spectrum frequency
US7392179B2 (en) 2000-11-30 2008-06-24 Matsushita Electric Industrial Co., Ltd. LPC vector quantization apparatus
KR100872538B1 (en) 2000-11-30 2008-12-08 파나소닉 주식회사 Vector quantizing device for lpc parameters
KR100910282B1 (en) * 2000-11-30 2009-08-03 파나소닉 주식회사 Vector quantizing device for lpc parameters, decoding device for lpc parameters, recording medium, voice encoding device, voice decoding device, voice signal transmitting device, and voice signal receiving device

Also Published As

Publication number Publication date
JPH0650440B2 (en) 1994-06-29

Similar Documents

Publication Publication Date Title
JP3557662B2 (en) Speech encoding method and speech decoding method, and speech encoding device and speech decoding device
JP3707116B2 (en) Speech decoding method and apparatus
CA2140329C (en) Decomposition in noise and periodic signal waveforms in waveform interpolation
JP4005154B2 (en) Speech decoding method and apparatus
JPH079600B2 (en) Method and apparatus for encoding and decoding audio signals
JPH096397A (en) Voice signal reproducing method, reproducing device and transmission method
US5295224A (en) Linear prediction speech coding with high-frequency preemphasis
USRE43099E1 (en) Speech coder methods and systems
JP2954588B2 (en) Audio encoding device, decoding device, and encoding / decoding system
JPH0990995A (en) Speech coding device
JPH04270398A (en) Voice encoding system
JPH10149199A (en) Voice encoding method, voice decoding method, voice encoder, voice decoder, telephon system, pitch converting method and medium
US4975955A (en) Pattern matching vocoder using LSP parameters
JP2779325B2 (en) Pitch search time reduction method using pre-processing correlation equation in vocoder
JPH10105195A (en) Pitch detecting method and method and device for encoding speech signal
US5812966A (en) Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair
JPS61252600A (en) Lsp type pattern matching vocoder
JPH0782360B2 (en) Speech analysis and synthesis method
Burnett et al. Multi-prototype waveform coding using frame-by-frame analysis-by-synthesis
JP3088204B2 (en) Code-excited linear prediction encoding device and decoding device
JPH0235994B2 (en)
JP2605256B2 (en) LSP pattern matching vocoder
JPH0235993B2 (en)
Chang et al. Quality enhancement of sinusoidal transform vocoders
Bao Harmonic excitation LPC (HE-LPC) speech coding at 2.3 kb/s