JPS63210899A - Voice synthesizer - Google Patents

Voice synthesizer

Info

Publication number
JPS63210899A
JPS63210899A JP4312087A JP4312087A JPS63210899A JP S63210899 A JPS63210899 A JP S63210899A JP 4312087 A JP4312087 A JP 4312087A JP 4312087 A JP4312087 A JP 4312087A JP S63210899 A JPS63210899 A JP S63210899A
Authority
JP
Japan
Prior art keywords
amplifier
interpolation
syllable
parameter
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4312087A
Other languages
Japanese (ja)
Inventor
利光 蓑輪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4312087A priority Critical patent/JPS63210899A/en
Publication of JPS63210899A publication Critical patent/JPS63210899A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力した文字列を、恰も人間が読み上げたか
のように音声化する音声合成装置に関するもので1本発
明の音声合成装置は、ワードプロセッサ等に入力した文
字列の読合せ、盲人の読書用等に利用される。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a speech synthesis device that converts an input character string into a voice as if it were read out by a human. It is used for reading aloud character strings entered in computers, etc., and for reading by blind people.

(従来の技術) 第4図は従来の音声合成装置の構成を示すもので、1は
、声道の特性を共振・反共振であられした声道パラメー
タがファイルされた声道パラメータファイルで、声道パ
ラメータは、約10m5毎に音声を分析して得たところ
のホルマント周波数及びバンド幅の情報や、スペクトル
を線スペクトル化したLSPパラメータ等で構成されて
いる。2は、文字列が入力すると、それ等の文字列に含
まれる音節の声道パラメータを声道パラメータファイル
1から選択して、時間的に配列した上、補間計算によっ
て算出した声道パラメータを各音節間の補間区間に挿入
して、それ等の音節を結合する声道パラメータ結合部、
3は、アンプ制御情報が入力すると、パルス列及び白色
雑音の振幅を決定するアンプ計算部、4は、抑揚制御情
報が入力すると、パルス列のパルス間隔を決定する抑揚
計算部、5はアンプ計算部3で決定された振幅及び抑揚
計算部で決定されたパルス間隔に基づいてパルス列を出
力するパルス列発生部、6はアンプ計算部3で決定され
た振幅に基づいて白色雑音を出力する白色雑音発生部、
7はパルス列及び白色雑音が声道に入力したときの声道
中の透過波及び反射波を計算することにより、口唇から
の透過波として所望の音声信号を得る音響計算部で、こ
の音響計算部7はデジタル計算機で構成されている。8
は音響計算部7から出力されたデジタル音声信号をアナ
ログ音声信号に変換するD/Aコンバータ、9はアナロ
グ音声信号によって駆動されるスピーカである。
(Prior art) Fig. 4 shows the configuration of a conventional speech synthesizer. 1 is a vocal tract parameter file containing vocal tract parameters obtained by comparing vocal tract characteristics with resonance and anti-resonance; The road parameters are composed of information on formant frequency and bandwidth obtained by analyzing speech every 10 m5, LSP parameters obtained by converting the spectrum into a line spectrum, and the like. 2, when character strings are input, the vocal tract parameters of the syllables included in those character strings are selected from the vocal tract parameter file 1, arranged temporally, and the vocal tract parameters calculated by interpolation calculation are a vocal tract parameter combining unit that is inserted into an interpolation interval between syllables and combines those syllables;
3 is an amplifier calculation unit that determines the amplitude of the pulse train and white noise when the amplifier control information is input; 4 is an intonation calculation unit that determines the pulse interval of the pulse train when the intonation control information is input; 5 is the amplifier calculation unit 3 a pulse train generation section that outputs a pulse train based on the amplitude determined by the amplitude and intonation calculation section 3, and a white noise generation section 6 that outputs white noise based on the amplitude determined by the amplifier calculation section 3;
7 is an acoustic calculation unit which obtains a desired audio signal as a transmitted wave from the lips by calculating transmitted waves and reflected waves in the vocal tract when a pulse train and white noise are input to the vocal tract; 7 consists of a digital computer. 8
9 is a D/A converter that converts the digital audio signal output from the acoustic calculation unit 7 into an analog audio signal, and 9 is a speaker driven by the analog audio signal.

このように構成された従来例において、文字列、アンプ
制御情報及び抑揚制御情報が入力すると、アンプ計算部
3は、アンプ補間法で生成したアンプパラメータにより
、先行音節の母音終端部と後続音節の子音部先端部との
間の補間区間を一様に直線補間していた(第5図参照)
In the conventional example configured in this way, when a character string, amplifier control information, and intonation control information are input, the amplifier calculation unit 3 calculates the vowel final part of the preceding syllable and the vowel final part of the following syllable using the amplifier parameters generated by the amplifier interpolation method. The interpolation interval between the tip of the consonant and the tip of the consonant was uniformly linearly interpolated (see Figure 5).
.

(発明が解決しようとする問題点) このため、各音節の結合時に、声道が早めに変化したり
、遅めに変化したりする音節では、音韻が劣化するとい
う問題があった。
(Problems to be Solved by the Invention) Therefore, when syllables are combined, syllables in which the vocal tract changes early or changes late have a problem in that the phoneme deteriorates.

本発明は、このような問題に鑑みてなされたもので、補
間区間における各音節間で特徴的なアンプパラメータの
変化を模擬できる音声合成装置を提供することを目的と
している。
The present invention has been made in view of these problems, and it is an object of the present invention to provide a speech synthesis device that can simulate characteristic changes in amplifier parameters between each syllable in an interpolation interval.

(問題点を解決するための手段) 本発明は、前述の目的を達成するために、文字列を音声
化するときの各音節間の補間区間におけるアンプパラメ
ータを、先行音節終端部のアンプパラメータと後続音節
先頭部のアンプパラメータとによって決められた非線形
の補間関数によって補間演算して決めるようにしたもの
である。
(Means for Solving the Problems) In order to achieve the above-mentioned object, the present invention sets the amplifier parameters in the interpolation interval between each syllable when converting a character string into sounds to be the same as the amplifier parameters at the end of the preceding syllable. This is determined by interpolation calculation using a non-linear interpolation function determined by the amplifier parameter of the beginning of the following syllable.

(作 用) 本発明によれば、声道の早めの変化或いは遅めの変化を
非線形の補間関数で演算することにより、音節間の過渡
音を自然音声に近づけることができるようになる。
(Function) According to the present invention, by calculating early or late changes in the vocal tract using a nonlinear interpolation function, it is possible to make transient sounds between syllables closer to natural speech.

(実施例) 以下、図面を参照しながら、本発明の実施例を詳細に説
明する。
(Example) Hereinafter, an example of the present invention will be described in detail with reference to the drawings.

第1図は本発明の一実施例の構成を示し、第2図は本発
明の一実施例におけるアンプ計算部の構成を示すもので
、第4図の符号と同一符号のものは同一部分を示してお
り、又、IOは、先行音節終端部のアンプパラメータを
一時記憶するアンプパラメータ格納部11と、音節毎に
決まったアンプパラメータ補間用の非線形の補間関数を
ファイルした補間関数ファイル12と、音節毎のアンプ
パラメータをファイルしたアンプパラメータファイル1
3と、先行音節終端部のアンプパラメータをアンプパラ
メータ格納部11から読み出すと共に、入力した後続の
音節に対応するアンプパラメータをアンプパラメータフ
ァイル13から選択し、先行音節終端部のアンプパラメ
ータとその後続音節のアンプパラメータとに対応するア
ンプパラメータ補間用の非線形の補間関数を補間関数フ
ァイル12から選択して演算し、補間区間のアンプパラ
メータを決定する補間計算部14と、この補間計算部1
4で演算された補間区間のアンプパラメータを一時記憶
する補間アンプパラメータ格納部15とからなるアンプ
パラメータ補間部である。
Fig. 1 shows the configuration of an embodiment of the present invention, and Fig. 2 shows the structure of an amplifier calculation section in an embodiment of the invention. In addition, the IO includes an amplifier parameter storage unit 11 that temporarily stores amplifier parameters at the end of the preceding syllable, and an interpolation function file 12 that stores a nonlinear interpolation function for interpolating amplifier parameters determined for each syllable. Amplifier parameter file 1 containing amplifier parameters for each syllable
3, reads the amplifier parameter at the end of the preceding syllable from the amplifier parameter storage unit 11, selects the amplifier parameter corresponding to the input subsequent syllable from the amplifier parameter file 13, and reads the amplifier parameter at the end of the preceding syllable and the following syllable. an interpolation calculation unit 14 that selects and calculates a nonlinear interpolation function for amplifier parameter interpolation corresponding to the amplifier parameters from the interpolation function file 12 and determines the amplifier parameters of the interpolation interval;
This amplifier parameter interpolation section includes an interpolation amplifier parameter storage section 15 that temporarily stores the amplifier parameters of the interpolation interval calculated in step 4.

尚、補間関数ファイル12にファイルされている非線形
の補間関数は次の通りである。
The nonlinear interpolation functions stored in the interpolation function file 12 are as follows.

a i (n)= (1−7(ntLc2)) a t
 (ne*ct)+/(ntLcz) a t (ns
*cJ・・・・・(1) 但し、 a、(n)  : 補間部のアンプパラメータ
ai(n、、C工): 先行音節C工の終端部アンプパ
ラメータa ((n@@c3)  : 後続音節C1の
先頭部アンプパラメータn@ : C1の終端時点 n・二02の先頭時点 n : サンプリング時点(neを起点とする)l :
 補間区間長 /(ntltcb) : 音節C2毎に定められた非線
形の補間関数且つ、単調増加関数 尚、 /(n+Leb)は自然音声中のアンプパラメー
タ変形データから統計的に抽出されるもので、(2)式
以外の制限はつけない。
a i (n) = (1-7(ntLc2)) a t
(ne*ct)+/(ntLcz) a t (ns
*cJ・・・・・・(1) However, a, (n): Amplifier parameter ai(n,,C) of the interpolation part: Amplifier parameter a of the terminal part of the preceding syllable C ((n@@c3): Amplifier parameter at the beginning of the subsequent syllable C1 n@: End time n of C1, start time n of 202: Sampling time (starting from ne) l:
Interpolation interval length/(ntltcb): Nonlinear interpolation function and monotonically increasing function determined for each syllable C2. /(n+Leb) is statistically extracted from the amplifier parameter deformation data in natural speech, and ( 2) No restrictions other than the formula are added.

このように構成された本実施例では、文字が入力すると
、補間計算部10は、1文字前に入力した先行音節終端
部のアンプパラメータをアンプパラメータ格納部11か
ら読み出すと共に、金入力した音節に対応するアンプパ
ラメータをアンプパラメータファイル13から選択し、
先行音節終端部のアンプパラメータと後続音節先頭部の
アンプパラメータとに対応するアンプパラメータ補間用
の非線形の補間関数を補間関数ファイル12から選択し
て、(1)式を演算することにより、各サンプリング時
点における補間区間のアンプパラメータを決定し。
In this embodiment configured as described above, when a character is input, the interpolation calculation section 10 reads out the amplifier parameter of the last part of the preceding syllable inputted one character ago from the amplifier parameter storage section 11, and also applies the amplifier parameter to the inputted syllable. Select the corresponding amplifier parameter from the amplifier parameter file 13,
By selecting a nonlinear interpolation function for amplifier parameter interpolation corresponding to the amplifier parameter at the end of the preceding syllable and the amplifier parameter at the beginning of the following syllable from the interpolation function file 12 and calculating equation (1), each sampling Determine the amplifier parameters of the interpolation interval at the time point.

その補間区間のアンプパラメータを補間アンプパラメー
タ格納部15に一時記憶させる。そして、アンプパラメ
ータ補間部10で決定された非線形なアンプパラメータ
を各音節間の補間区間に挿入して、それ等の音節を結合
する〔第3図(a)及び(b)参照〕。
The amplifier parameters of the interpolation section are temporarily stored in the interpolation amplifier parameter storage section 15. Then, the nonlinear amplifier parameters determined by the amplifier parameter interpolation section 10 are inserted into the interpolation interval between each syllable, and the syllables are combined (see FIGS. 3(a) and 3(b)).

尚、本実施例において、/(n、j!、c&)はck−
□(先行音節)と無関係であるとしているが、ch−i
までも考慮に入れると、アンプパラメータ変化の近似精
度が更に向上する。
In this example, /(n, j!, c&) is ck-
Although it is said that it is unrelated to □ (preceding syllable), ch-i
Taking this into account will further improve the approximation accuracy of amplifier parameter changes.

(発明の効果) 以上説明したように、本発明によれば、音節間の補間区
間のアンプパラメータの変化が自然音声に近くなって、
従来の音声合成装置よりも音韻性が良好になるという効
果がある。
(Effects of the Invention) As explained above, according to the present invention, the change in amplifier parameters in the interpolation interval between syllables becomes close to that of natural speech,
This has the effect of providing better phonology than conventional speech synthesizers.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例の構成図、第2図は本発明の
一実施例におけるアンプ計算部の構成図、第3図(a)
及び(b)は本発明の一実施例によるアンプパラメータ
の補間法の説明図、第4図は従来の音声合成装置の構成
図、第5図は従来の音声合成装置によるアンプパラメー
タの補間法の説明図である。 1 ・・・声道パラメータファイル、 2 ・・・声道
パラメータ結合部、 4 ・・抑揚計算部、 5 ・・
・パルス列発生部、 6 ・・・白色雑音発生部、 7
 ・・・音響計算部、 8 ・・D/Aコンバータ、 
9 ・・・ スピーカ、 10・・・アンプ計算部、1
1・・・アンプパラメータ格納部、12・・・補間関数
ファイル、13・・・アンプパラメータファイル、 1
4・・・補間計算部、15・・・補間アンプパラメータ
格納部。 第1図 第2図 、10 第3図 第4図 第5図 時閉(msl
FIG. 1 is a block diagram of an embodiment of the present invention, FIG. 2 is a block diagram of an amplifier calculation section in an embodiment of the present invention, and FIG. 3(a)
and (b) is an explanatory diagram of an amplifier parameter interpolation method according to an embodiment of the present invention, FIG. 4 is a block diagram of a conventional speech synthesis device, and FIG. 5 is an illustration of an amplifier parameter interpolation method by a conventional speech synthesis device. It is an explanatory diagram. 1...Vocal tract parameter file, 2...Vocal tract parameter combination unit, 4...Intonation calculation unit, 5...
・Pulse train generation section, 6...White noise generation section, 7
...Acoustic calculation section, 8 ...D/A converter,
9...Speaker, 10...Amplifier calculation section, 1
1... Amplifier parameter storage section, 12... Interpolation function file, 13... Amplifier parameter file, 1
4... Interpolation calculation unit, 15... Interpolation amplifier parameter storage unit. Figure 1 Figure 2, 10 Figure 3 Figure 4 Figure 5 Closed (msl)

Claims (1)

【特許請求の範囲】[Claims] 入力した文字列を音声化する音声合成装置において、前
記文字列を音声化するときの各音節間の補間区間におけ
るアンプパラメータを、先行音節終端部のアンプパラメ
ータと後続音節先頭部のアンプパラメータとによって決
められた非線形の補間関数によって補間演算して決める
手段が具備されていることを特徴とする音声合成装置。
In a speech synthesis device that vocalizes an input character string, the amplifier parameter in the interpolation interval between each syllable when vocalizing the character string is determined by the amplifier parameter at the end of the preceding syllable and the amplifier parameter at the beginning of the following syllable. A speech synthesis device characterized by comprising means for performing interpolation calculation and determination using a predetermined nonlinear interpolation function.
JP4312087A 1987-02-27 1987-02-27 Voice synthesizer Pending JPS63210899A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4312087A JPS63210899A (en) 1987-02-27 1987-02-27 Voice synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4312087A JPS63210899A (en) 1987-02-27 1987-02-27 Voice synthesizer

Publications (1)

Publication Number Publication Date
JPS63210899A true JPS63210899A (en) 1988-09-01

Family

ID=12654976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4312087A Pending JPS63210899A (en) 1987-02-27 1987-02-27 Voice synthesizer

Country Status (1)

Country Link
JP (1) JPS63210899A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04116599A (en) * 1990-09-07 1992-04-17 Sumitomo Electric Ind Ltd Voice rule synthesis device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04116599A (en) * 1990-09-07 1992-04-17 Sumitomo Electric Ind Ltd Voice rule synthesis device

Similar Documents

Publication Publication Date Title
JP3294604B2 (en) Processor for speech synthesis by adding and superimposing waveforms
JPS5953560B2 (en) How to synthesize audio
JPS62160495A (en) Voice synthesization system
JP3732793B2 (en) Speech synthesis method, speech synthesis apparatus, and recording medium
JP4490818B2 (en) Synthesis method for stationary acoustic signals
JP5360489B2 (en) Phoneme code converter and speech synthesizer
JP2612867B2 (en) Voice pitch conversion method
JPH05307395A (en) Voice synthesizer
JPS63210899A (en) Voice synthesizer
JPS63210900A (en) Voice synthesizer
JP2005523478A (en) How to synthesize speech
JPS5880699A (en) Voice synthesizing system
JP3394281B2 (en) Speech synthesis method and rule synthesizer
JPS63210898A (en) Voice synthesizer
JPH02153397A (en) Voice recording device
JPH01187000A (en) Voice synthesizing device
JPS5950079B2 (en) Speech synthesis method
Demri et al. Interface for dynamic modification of the transformation parameters of the psola algorithm
JPS63285597A (en) Phoneme connection type parameter rule synthesization system
JPS6265098A (en) Music vocoder
JPS62235996A (en) Variation of synthetic sound quality
JPS60144799A (en) Automatic interpreting apparatus
JPS59177597A (en) Musical note synthesizer
JPH0464080B2 (en)
JPH03296100A (en) Voice synthesizing device