JPS597996A - Phoneme piece editing pattern voice synthesizer - Google Patents

Phoneme piece editing pattern voice synthesizer

Info

Publication number
JPS597996A
JPS597996A JP57117158A JP11715882A JPS597996A JP S597996 A JPS597996 A JP S597996A JP 57117158 A JP57117158 A JP 57117158A JP 11715882 A JP11715882 A JP 11715882A JP S597996 A JPS597996 A JP S597996A
Authority
JP
Japan
Prior art keywords
phoneme
data
phoneme piece
equation
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57117158A
Other languages
Japanese (ja)
Inventor
朋明 阿部
英雄 渋谷
稔 豊田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57117158A priority Critical patent/JPS597996A/en
Publication of JPS597996A publication Critical patent/JPS597996A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 本発明は、音声分析合成方法、特に音素片編集型音声分
析合成方法に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a speech analysis and synthesis method, particularly to a phoneme segment editing type speech analysis and synthesis method.

音素片編集型音声分析合成方法は、音声特に有声音の隣
接波形間の強い類似性に基いて、原音声信号から代表的
な音素片データをピンチ周期単位で抽出し、抽出した音
素片テークを音声合成制御情報に従って複数回繰り返し
ながら順次接続することによって、所望の音声信号を合
成する方法である。
The phoneme segment editing speech analysis and synthesis method extracts representative phoneme data from the original speech signal in units of pinch cycles based on the strong similarity between adjacent waveforms of speech, especially voiced sounds, and extracts the extracted phoneme segment data from the original speech signal. This is a method of synthesizing a desired audio signal by sequentially connecting multiple times while repeating the audio synthesis control information.

第1図に、音素片編集型音声分析合成方法によって合成
された音声信号波形の一部を示す。第1図は、音素片P
Hムを3回繰り返し、次いで音素片PHBを接続し、P
HBを2回繰り返すことによって得られた音声信号を示
している。
FIG. 1 shows a part of the speech signal waveform synthesized by the phoneme segment editing speech analysis and synthesis method. Figure 1 shows the phoneme P.
Repeat Hm three times, then connect the phoneme piece PHB, and
It shows an audio signal obtained by repeating HB twice.

音素片編集型音声分析合成方法は、音素片データを音声
合成制御情報に従って順次接続していくことにより音声
信号を合成するので、PARCOR方式。
The phoneme segment editing type speech analysis and synthesis method synthesizes a speech signal by sequentially connecting phoneme segment data according to speech synthesis control information, so it is a PARCOR method.

LSP方式、ホルマント合成方式等パラメータ分析合成
方式と比較して、合成のための手順がwM単テ汎用のマ
イクロプロセッサ等を使用して容易に音声合成を実現で
きるという特徴を有する。
Compared to parameter analysis and synthesis methods such as the LSP method and the formant synthesis method, this method has the feature that the synthesis procedure allows voice synthesis to be easily realized using a general-purpose microprocessor or the like.

しかしながら、この方法では第1図に示すように音素波
形及びピンチ周期が、相異なる音素片の接続点で急激に
変化するために、音素片の繰り返しによる同期的なノイ
ズ音が発生し、滑らかな音声信号を得にくいという問題
点があった。
However, in this method, as shown in Figure 1, the phoneme waveform and the pinch period change rapidly at the connection points of different phoneme pieces, so synchronous noise sounds due to the repetition of phoneme pieces occur, and smooth There was a problem that it was difficult to obtain an audio signal.

このような問題点を改善するために、2つの音素片の間
に補間演算により得られる補間音素片を挿人することが
、従来より提案されてきた。
In order to improve such problems, it has been proposed in the past to insert an interpolated phoneme segment obtained by interpolation calculation between two phoneme segments.

すなわち、音声信号を一定のザシプリング周期でサンプ
リングすることによって得られる音素片データ詳の先行
する音素片PHAのi番目のデータ値をP HA(i)
(i=1.2 、・・・、NA、ただし、NAはPHA
のデータ数)とし、後続する音素片PHBの1番目のデ
ータ値をPHB(i)(1==−+ 。
That is, the i-th data value of the preceding phoneme piece PHA of the phoneme piece data details obtained by sampling the audio signal at a constant sampling period is PHA(i).
(i=1.2,..., NA, where NA is PHA
), and the first data value of the subsequent phoneme piece PHB is PHB(i) (1==-+.

2、・・ 、NB、ただし、NBはPHBのデータ数)
とする時、先行する音素片PHAと後続する音素片PH
Bの補間音素片PHIの1番目のデータ値P HI (
i)を(1)式から求めるものである。
2,..., NB, where NB is the number of PHB data)
, the preceding phoneme PHA and the following phoneme PH
The first data value PHI (
i) is obtained from equation (1).

PHI(i)= f (PH入(i) 、 P HB(
i) l    ・・・・・・・・・(1)ただし、f
(A、B)はA、Bの補間関数を示す。
PHI (i) = f (PH input (i), P HB (
i) l ・・・・・・・・・(1) However, f
(A, B) indicates the interpolation function of A and B.

ここで、2つの音素片テークの補間は、線形補間により
求まるものとし、捷た2つの音素片の間に挿入すべき補
間音素片の個数をMとすれば、第り番目の補間音素片の
i番目のデータ値PHI(i。
Here, the interpolation of two phoneme pieces is determined by linear interpolation, and if the number of interpolation phoneme pieces to be inserted between the two phoneme pieces is M, then the number of interpolation phoneme pieces to be inserted between the two phoneme pieces is i-th data value PHI(i.

h)は(2)式より求められる。h) is obtained from equation (2).

後続する音素片のデータ値P HB (i)は、(2)
式においてh=M−)−1と置くこと1でより求まるの
で、PHBを広義の意味での補間音素片と呼ぶことにす
る。また(3)式で定義されるM′を補間繰り返しと呼
ぶことにする。M′を使えば(2)式は(4)式で表わ
すことができる。
The data value P HB (i) of the following phoneme is (2)
By setting h=M-)-1 in the equation, it can be more easily determined, so PHB will be referred to as an interpolated phoneme in a broad sense. Furthermore, M' defined by equation (3) will be referred to as interpolation repetition. Using M', equation (2) can be expressed as equation (4).

M’=M+1           ・・・・・・・・
・(3)ただし、h:1,2・・・1M′である。
M'=M+1 ・・・・・・・・・
-(3) However, h: 1, 2...1M'.

次に、(4)式において音素片PHA(i)及びP H
B(i)をフーリエ変換して表わした式を(6)式とす
る。
Next, in equation (4), phoneme pieces PHA(i) and P H
The equation expressed by Fourier transforming B(i) is defined as equation (6).

ただし、Ckk及びOBkは、音素片PHA及びPHB
のに取高調波の周波数スペクトルである。
However, Ckk and OBk are phoneme pieces PHA and PHB
This is the frequency spectrum of the harmonics.

等サンプル数音素片編集型、音声合成方法では、最初に
その間を補間すべき音素片の音素片デ゛−タに関し、そ
のデータ数を所定のデータ数Nに等しくする。原理的に
は、異なるピンチ周期をもつ音素片のデータ数を等しく
するためには、音素片をサンプリングする時のクロック
周期を音素片のデータ数が一定になるように可変しなが
らサンプリングすれば良い。
In the equal sample number phoneme segment editing type and speech synthesis method, the number of phoneme segment data of phoneme segments to be interpolated is first set equal to a predetermined data number N. In principle, in order to equalize the number of data for phoneme segments with different pinch periods, it is possible to sample phoneme segments while varying the clock cycle when sampling the phoneme segments so that the number of data for the phoneme segment remains constant. .

しかしながら、実際に1は音素片のサンプリング・クロ
ック周期をピッチ周期に対応して可変する仁とは極めて
困蕾なので、音素片を一定のサンプリンククロック周期
τでサンプリングした後、例えば、PROCEEDIN
GS  OF  THE  IEEE誌の第69巻第3
′;3(1981年3月)の300頁から331頁にR
、E、CROCHIEREとL 、 R、RA B I
NERによって著わされた「INTERPOLATIO
N ANDDECIMATION OF DIGITA
L 5IeNALS −ATUTORIAL REVI
EWl という表題ノ論文ノ中でttl’細に論述され
ているような方法でテークの補間あるいは間引きを行な
ってデータ数の増減を行ない所定のデータ数にする。
However, in practice, it is extremely difficult to change the sampling clock period of a phoneme segment according to the pitch period, so after sampling a phoneme piece with a constant sampling clock period τ, for example, PROCEEDIN
GS OF THE IEEE Magazine Volume 69 No. 3
'; 3 (March 1981), pages 300 to 331
,E,CROCHIERE and L,R,RA B I
“INTERPOLATIO” written by NER
NANDDECIMATION OF DIGITA
L 5IeNALS-ATUTORIAL REVI
The number of data is increased or decreased by interpolating or thinning out the takes using the method described in detail in the paper titled EWl'ttl' to reach a predetermined number of data.

このとき、(5)式において音素片PHAのデータ数N
ムと後続する音素片PHBのデータ数NBは、等サンプ
ル数Nとなっているため、(6)式は整理されて次式と
なる。
At this time, in equation (5), the number of data N of phoneme piece PHA
Since the data number NB of the phoneme segment PHB that follows the sound element PHB is equal to the number of samples N, equation (6) can be rearranged to become the following equation.

ただし、ΔC*ak=Cak−Cムにである。However, ΔC*ak=Cak−Cmu.

ゆえに、音素片データに関しそのデータ数を所定のデー
タ数Nに等しくすることにより、(4)式において、(
6)式に示すごとくその補間された音素片PHI(i、
h)は、その高調波スペクトルが線形補間されることが
分かる。
Therefore, by setting the number of phoneme piece data equal to the predetermined number N of data, in equation (4), (
6) The interpolated phoneme piece PHI(i,
It can be seen that the harmonic spectrum of h) is linearly interpolated.

ただし、この時のサングリジグ時間τJは次式にて求め
られる。
However, the sangrijig time τJ at this time is obtained by the following equation.

ここでINT(x)は、Xの整数変換を示す。Here, INT(x) indicates an integer conversion of X.

この(7)式より求められたサンプリング時間τjで補
間データPHI(コ 、h)を両生することにより、周
波数軸上においても線形補吻iなされることになる。
By interpolating the interpolated data PHI (co, h) at the sampling time τj determined from equation (7), linear interpolation i is also performed on the frequency axis.

本発明は、上記等サンプル数音素片編集型音声合成方法
において、合成音質を損々わずよりメモリ圧縮を行なう
音声合成方法を提供するものである。
The present invention provides a speech synthesis method which performs memory compression without impairing synthesized sound quality in the above-mentioned speech synthesis method using phoneme segment editing with an equal number of samples.

以下、本発明の詳細な説明を行なう。The present invention will be explained in detail below.

自然音声において、基本ピッチ周波数は第2図に示すよ
うに、約2倍の範囲で変化する。この時、等サンプル数
を最低基本ピッチ周波数の持つデータ数と一致させると
第3図の斜線部のデータが無駄となる。寸だ、第4図の
ように等サンプル数をデータ数の平均値付近に選択する
と、斜線部のデータは無駄となりかつ格子部のデータは
一部削除される。
In natural speech, the fundamental pitch frequency varies over a range of about twice as much, as shown in FIG. At this time, if the equal number of samples is made to match the number of data possessed by the lowest fundamental pitch frequency, the data in the shaded area in FIG. 3 will be wasted. In fact, if the equal number of samples is selected near the average value of the number of data as shown in FIG. 4, the data in the shaded area will be wasted and the data in the lattice area will be partially deleted.

このように、等サンプル数の決定は合成音質に大きな影
響をおよぼす。
In this way, determining the equal number of samples has a large effect on the synthesized sound quality.

そこで、本発明では等サンプル数を基本ピッチ周期デー
タ数の変化に合わせ小区間毎に決定する適合等サンプル
数とするものであり、これを第5図に示す。このように
、適合等サンプル数化することにより合成音質を変化さ
せずにデータ圧縮を行なうことが可能となる。
Therefore, in the present invention, the number of equal samples is determined for each small section according to the change in the number of basic pitch period data, and this is shown in FIG. In this way, data compression can be performed without changing the synthesized sound quality by converting the number of samples into conformance.

本発明は上記のような構成であり、本発明によれば、合
成音質を変化させずにデータ圧縮が可能となるものであ
る。
The present invention has the above configuration, and according to the present invention, data compression can be performed without changing the synthesized sound quality.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は音素片編集型音声合成方法により合成した合成
音声波形図、第2図は自然音声の音素片ナンバーと音素
片データ数との関係を示す図、第3図、第4図はそれぞ
れ等サンプル数化した場合の無駄となるデータを示す図
、第6図は本発明の一実施例における音素片編集型音声
合成方法における等サンプル化により無駄となるデータ
を示す図である。
Figure 1 is a diagram of the synthesized speech waveform synthesized by the phoneme segment editing type speech synthesis method, Figure 2 is a diagram showing the relationship between the phoneme segment number and the number of phoneme segment data of natural speech, and Figures 3 and 4 are respectively FIG. 6 is a diagram showing data that is wasted when the number of samples is equalized. FIG. 6 is a diagram showing data that is wasted when the number of samples is equalized in the phoneme segment editing type speech synthesis method according to an embodiment of the present invention.

Claims (1)

【特許請求の範囲】[Claims] 音素片データを音声合成制御情報にしたがって順次接続
するとともに、2つの音素片の間に補間演算により得ら
れる補間音素片を挿入し、音声の基本ピッチ周波数ある
いは音素片データの周波数特性等にしたがって小区間毎
に対応した一定なサンプル数を定めることを特徴とする
音素片編集型音声合成方法。
The phoneme piece data are connected sequentially according to the speech synthesis control information, and an interpolated phoneme piece obtained by interpolation calculation is inserted between two phoneme pieces, and the phoneme piece data is connected sequentially according to the basic pitch frequency of the voice or the frequency characteristics of the phoneme piece data. A phoneme segment editing type speech synthesis method characterized by determining a constant number of samples corresponding to each section.
JP57117158A 1982-07-06 1982-07-06 Phoneme piece editing pattern voice synthesizer Pending JPS597996A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57117158A JPS597996A (en) 1982-07-06 1982-07-06 Phoneme piece editing pattern voice synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57117158A JPS597996A (en) 1982-07-06 1982-07-06 Phoneme piece editing pattern voice synthesizer

Publications (1)

Publication Number Publication Date
JPS597996A true JPS597996A (en) 1984-01-17

Family

ID=14704886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57117158A Pending JPS597996A (en) 1982-07-06 1982-07-06 Phoneme piece editing pattern voice synthesizer

Country Status (1)

Country Link
JP (1) JPS597996A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56168700A (en) * 1980-05-30 1981-12-24 Nippon Electric Co Waveform edition type voice synthesizer
JPS575100A (en) * 1980-06-12 1982-01-11 Matsushita Electric Industrial Co Ltd Voice synthesizer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56168700A (en) * 1980-05-30 1981-12-24 Nippon Electric Co Waveform edition type voice synthesizer
JPS575100A (en) * 1980-06-12 1982-01-11 Matsushita Electric Industrial Co Ltd Voice synthesizer

Similar Documents

Publication Publication Date Title
JP3294604B2 (en) Processor for speech synthesis by adding and superimposing waveforms
US4435832A (en) Speech synthesizer having speech time stretch and compression functions
JPH06502023A (en) Musical sound synthesis method
US5196639A (en) Method and apparatus for producing an electronic representation of a musical sound using coerced harmonics
KR100327969B1 (en) Sound reproducing speed converter
JPH0727397B2 (en) Speech synthesizer
JPH11259066A (en) Music sound signal separation method, device thereof and program recording medium thereof
JPS597996A (en) Phoneme piece editing pattern voice synthesizer
JP2600384B2 (en) Voice synthesis method
JPS6017120B2 (en) Phoneme piece-based speech synthesis method
JPS642960B2 (en)
JPS58105199A (en) Speech analysis and synthesis method
JPH0477320B2 (en)
JPS58172700A (en) Phoneme editing type speech analysis and synthesis method
JPS62102294A (en) Voice coding system
JPS58105197A (en) Speech analysis and synthesis method
JP3270869B2 (en) Pitch converter
JPS58216299A (en) Phoneme editing type voice synthesization
JPH0193796A (en) Voice quality conversion
JPS58105198A (en) Analysis and synthesization of voice
JPH10187180A (en) Tone generator
JP3206128B2 (en) Loop waveform generation device and loop waveform generation method
JPS61128299A (en) Voice analysis/analytic synthesization system
JPS5898798A (en) Interpolation system for phoneme editting type voice synthesization
JPS60150100A (en) Speech synthesis method