JP2572961B2 - Voice synthesis method - Google Patents

Voice synthesis method

Info

Publication number
JP2572961B2
JP2572961B2 JP60160702A JP16070285A JP2572961B2 JP 2572961 B2 JP2572961 B2 JP 2572961B2 JP 60160702 A JP60160702 A JP 60160702A JP 16070285 A JP16070285 A JP 16070285A JP 2572961 B2 JP2572961 B2 JP 2572961B2
Authority
JP
Japan
Prior art keywords
sound source
unvoiced sound
synthesis method
generation unit
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60160702A
Other languages
Japanese (ja)
Other versions
JPS6221200A (en
Inventor
徹 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Denki Co Ltd
Original Assignee
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Denki Co Ltd filed Critical Sanyo Denki Co Ltd
Priority to JP60160702A priority Critical patent/JP2572961B2/en
Publication of JPS6221200A publication Critical patent/JPS6221200A/en
Application granted granted Critical
Publication of JP2572961B2 publication Critical patent/JP2572961B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は音声合成装置に関する。特に無声音源の発生
回路に関する。
The present invention relates to a speech synthesizer. In particular, it relates to a circuit for generating an unvoiced sound source.

(ロ)従来の技術 音声合成方式としては1980年2月4日発行の日経エレ
クトロニクスの記事「身近になった音声合成の各種方式
を比較する」に示されているように種々のものが提案さ
れており、一般には、音声波形をそのままの形で情報圧
縮する波形処理方式と、音源の基本周期(ピッチと称
す)と声道の伝達特性をあらわすパラメータを抽出し、
音源と該パラメータにより音声を合成する生成源方式に
大別される。近年では情報圧縮率が高く再生音声の品質
がよい点から生成源方式が主流になりつつある。第3図
は生成源方式の音声合成装置の概略を示したものであ
る。同図に於いて、(1)は有声音源生成部であり、ピ
ッチ振幅に対応した音源信号Pを発生する。(2)は、
無声音源生成部であり、声帯を振動させない場合のホワ
イトノイズとみなせる呼気流に対応する音源信号Nを発
生する。(3)は、有声無声判定情報Dにより上記両音
源生成部(1)(2)からの音源信号P,Nを切り換える
スイッチである。(4)は声道の伝達特性に対応するデ
ィジタルフィルタ部であり、上記スイッチ(3)からの
音源信号N,Pの入力により、合成音声Vを生成出力す
る。
(B) Conventional technology Various speech synthesis methods have been proposed as shown in the article "Comparison of Various Speech Synthesis Methods Familiar with You" published by Nikkei Electronics on February 4, 1980. In general, a waveform processing method that compresses information in the form of a voice waveform as it is, and a parameter representing a fundamental period (referred to as a pitch) of a sound source and a transfer characteristic of a vocal tract are extracted.
It is roughly classified into a sound source and a generation source method for synthesizing speech by the parameter. In recent years, the generation source method is becoming mainstream because of its high information compression ratio and good quality of reproduced sound. FIG. 3 shows an outline of a speech synthesizer of a generation source system. In the figure, (1) is a voiced sound source generation unit, which generates a sound source signal P corresponding to the pitch amplitude. (2)
The unvoiced sound source generation unit generates a sound source signal N corresponding to an expiratory flow that can be regarded as white noise when the vocal cords are not vibrated. (3) is a switch for switching the sound source signals P and N from the two sound source generation units (1) and (2) according to the voiced / unvoiced judgment information D. (4) is a digital filter unit corresponding to the transfer characteristic of the vocal tract, which generates and outputs a synthesized voice V in response to the input of the sound source signals N and P from the switch (3).

斯様な音声合成装置における無声音生成部(2)とし
ては、従来M系列(マキシムレングスヌルシーケンス)
のフィードバックカウンタを用いており、このカウンタ
は通常10ビット以上の構成となっている。
As the unvoiced sound generator (2) in such a speech synthesizer, a conventional M sequence (maximum length null sequence)
, And this counter usually has a configuration of 10 bits or more.

(ハ)発明が解決しようとする問題点 従来のM系列フィードバックカウンタ構成の無声音生
成部を採用した音声合成方法に於いては、その無声音生
成部でのM系列フィードバックカウンタは、その構成ビ
ット数を多くすれば、この出力の周期を長くする事がで
きるが、即ち1周期内のノイズ期間の時間長を大きくす
る事はできるが、完全はホワイトノイズ情報を得る事が
できなかった。従って、継続長の大きな無声音を合成す
る時に、周期性が表われて合成音声の品質の低下を招く
事になる。
(C) Problems to be Solved by the Invention In a conventional speech synthesis method employing an unvoiced sound generation section having an M-sequence feedback counter configuration, the M-sequence feedback counter in the unvoiced sound generation section has a number of constituent bits. If the number is increased, the output cycle can be lengthened, that is, the time length of the noise period within one cycle can be increased, but white noise information cannot be completely obtained. Therefore, when synthesizing an unvoiced sound having a large continuous length, periodicity appears and the quality of synthesized speech is deteriorated.

(ニ)問題点を解決する為の手段 本発明の音声合成方法は、無声音源生成部として従来
のフィードバックカウンタを用いる事なく、 なる漸化式の演算処理によって無声音のノイズ情報を得
るものである。
(D) Means for Solving the Problems The speech synthesis method of the present invention uses the conventional feedback counter as the unvoiced sound source generation unit, The noise information of the unvoiced sound is obtained by the arithmetic processing of the recurrence formula.

(ホ)作用 上記の漸化式は、Mayの提案であるファイグンパウム
分岐(数理科学No.207,SEPTEMBER,1980に詳しい)のお
こる簡単な定差方程式であり、これを演算する事によっ
て、ホワイトノイズ情報を得る事ができるのである。
(E) Action The above recurrence formula is a simple fixed-difference equation caused by May-proposed Figungpaum bifurcation (detailed in Mathematical Science No. 207, SEPTEMBER, 1980). You can get information.

(ヘ)実施例 第1図に本発明の音声合成方法に用いられる無声音源
生成部の機能構成を示す。同図に於いて、(5)は(1
−xn)を算出する減算器、(6)はaxnを算出する乗算
器、(7)はaxn(1−xn)を算出する乗算器であり、
この値xn+i=axn(1−xn)がレジスタ(8)に一旦
貯えられてから次のタイミング(n+1)においてフィ
ードバックされ上記減算器(5)への入力となる。
(F) Embodiment FIG. 1 shows a functional configuration of an unvoiced sound source generator used in the speech synthesis method of the present invention. In the figure, (5) is (1)
−xn), (6) is a multiplier for calculating axn, (7) is a multiplier for calculating axn (1−xn),
This value xn + i = axn (1-xn) is temporarily stored in the register (8) and then fed back at the next timing (n + 1) to be input to the subtracter (5).

而して、第1図の無声音源生成部はxn+i=axn(1
−xn)の漸化式を順次演算して数列{xn}を生成し、こ
の数列{xn}を、ノイズ情報の振幅情報として用いる。
この数列{xn}の演算に際しての初期値x0をo<x0<1
とする必要がある。又、数列{xn}をホワイトノイズと
する為の定数aの具体的数値については、3.9a<4
の範囲でさらに4に近づく程に近づく程好ましい事が実
験的に見い出されている。第2図に、a=3.99とし、n
=0,1,2,…,255の256個のサンプル列{xn}をフーリエ
変換した場合の周波数特性を示し、さらにこれと対比す
る為に、第4図に同条件にて従来の10ビット構成のM系
列のフィードバックカウンタの出力サンプル列の周波数
特性図を示す。
Thus, the unvoiced sound source generation unit in FIG. 1 has xn + i = axn (1
−xn) is sequentially calculated to generate a sequence {x n }, and this sequence {x n } is used as amplitude information of noise information.
The initial value x0 for the operation of this sequence {x n } is defined as o <x0 <1
It is necessary to The specific value of the constant a for making the sequence {xn} white noise is 3.9a <4
It has been experimentally found that the closer to 4 in the range, the better. FIG. 2 shows that a = 3.99 and n
= 0,1,2, ..., 255 shows the frequency characteristics when the Fourier transform is performed on 256 sample strings {xn}. To compare with this, Fig. 4 shows the conventional 10-bit under the same conditions. FIG. 4 shows a frequency characteristic diagram of an output sample sequence of an M-sequence feedback counter having a configuration.

これ等の図を比較すると、本発明方法にて得られる無
声音源のノイズ情報の方が従来方法によるそれよりも平
坦化が図れ、より周期性のないホワイトノイズとなって
いる事が分かる。
Comparing these figures, it can be seen that the noise information of the unvoiced sound source obtained by the method of the present invention can be flattened and white noise with less periodicity than that of the conventional method.

上述の第1図の説明に於いては、説明の都合上乗算器
(6)(7)を個別に示したが、単一の乗算器の時分割
使用が可能であり、簡単な構成にて本発明の実施が可能
となる。さらに、この乗算器は、無声音源生成部専用の
ものを設ける必要がなく、ディジタルフィルタ部に設け
られる乗算器を時分割使用する事ができる。例えば、パ
ーコール音声合成方式の場合、このフィルタ部での乗算
器は音声信号の1サンプルを合成する1サンプル期間に
通常20回程度の乗算を行なうが、上述した無声音源信号
を生成するためにこの1サンプル期間中に上述の如く2
回の乗算を追加するだけでよい。
In the above description of FIG. 1, the multipliers (6) and (7) are shown individually for the sake of explanation. However, a single multiplier can be used in a time-sharing manner, and the configuration is simple. The present invention can be implemented. Further, it is not necessary to provide a dedicated multiplier for the unvoiced sound source generating unit, and the multiplier provided in the digital filter unit can be time-divisionally used. For example, in the case of the Percall speech synthesis method, the multiplier in this filter unit normally performs about 20 multiplications in one sample period for synthesizing one sample of the speech signal. During one sample period, 2
You only need to add multiplications.

(ト)発明の効果 本発明の音声合成方法は、以上の説明から明らかな如
く、May提案の方程式を音声合成の為の無声音源生成部
に採用し得る事を見い出したものであり、これに依っ
て、無声音源信号を周期性のないホワイトノイズ信号と
でき、無声音の品質を大巾に向上せしめる事が可能とな
り、より自然な合成音声が得られる。しかも本発明方法
を用いれば、無声音源生成部の構成の簡略化が図れ、そ
の結果音声合成装置のコストダウンが望める。
(G) Effect of the Invention As is clear from the above description, the speech synthesis method of the present invention has found that the equation proposed by May may be employed in an unvoiced sound source generation unit for speech synthesis. Accordingly, the unvoiced sound source signal can be a white noise signal having no periodicity, and the quality of unvoiced sound can be greatly improved, so that a more natural synthesized voice can be obtained. Moreover, if the method of the present invention is used, the configuration of the unvoiced sound source generation unit can be simplified, and as a result, the cost of the speech synthesizer can be reduced.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の音声合成方法を用いた時の無声音源生
成部の機能構成図、第2図は本発明方法を採用した時の
無声音源信号の周波数特性図、第3図は一般的な音声合
成装置の構成図、第4図は従来方法による無声音源信号
の周波数特性図である。 (2)……無声音源生成部、(5)……減算器、(6)
(7)……乗算器、(8)……レジズタ。
FIG. 1 is a functional configuration diagram of an unvoiced sound source generating unit when the voice synthesis method of the present invention is used, FIG. 2 is a frequency characteristic diagram of an unvoiced sound source signal when the method of the present invention is used, and FIG. FIG. 4 is a diagram showing a frequency characteristic of an unvoiced sound source signal according to a conventional method. (2)… unvoiced sound source generation unit, (5)… subtractor, (6)
(7)… Multiplier, (8)… Register.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】有声音源生成部からの有声音のピッチ情報
を含む音源信号、並びに無声音源生成部からの無声音の
ノイズ情報を含む音源信号を声道特性フィルタ部の入力
とし、該フィルタ部にて上記音源信号に声道特性を付与
して音声信号を再生出力する音声合成方法に於いて、上
記無声音源生成部は、 xn+1=a xn(1−xn) n=0,1,2,3,…… 0<x0<1 aは定数 なる漸化式の演算を行ない、該演算にて得られる数列
{xn}を、上記ノイズ情報の振幅情報として用いる事を
特徴とした音声合成方法。
A sound source signal containing pitch information of a voiced sound from a voiced sound source generation unit and a sound source signal containing unvoiced sound noise information from an unvoiced sound source generation unit are input to a vocal tract characteristic filter unit. In the speech synthesis method for reproducing and outputting a speech signal by adding a vocal tract characteristic to the sound source signal, the unvoiced sound source generation unit includes: x n + 1 = ax n (1-x n ) n = 0,1 , 2,3,... 0 <x 0 <1 a is a constant The operation of a recurrence formula is performed, and the sequence {x n } obtained by the operation is used as amplitude information of the noise information. Speech synthesis method.
JP60160702A 1985-07-19 1985-07-19 Voice synthesis method Expired - Lifetime JP2572961B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60160702A JP2572961B2 (en) 1985-07-19 1985-07-19 Voice synthesis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60160702A JP2572961B2 (en) 1985-07-19 1985-07-19 Voice synthesis method

Publications (2)

Publication Number Publication Date
JPS6221200A JPS6221200A (en) 1987-01-29
JP2572961B2 true JP2572961B2 (en) 1997-01-16

Family

ID=15720621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60160702A Expired - Lifetime JP2572961B2 (en) 1985-07-19 1985-07-19 Voice synthesis method

Country Status (1)

Country Link
JP (1) JP2572961B2 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子通信学会技術研究報告(EMCJ85−13)1985Vol.85,No.70,P.15−18

Also Published As

Publication number Publication date
JPS6221200A (en) 1987-01-29

Similar Documents

Publication Publication Date Title
JP2921428B2 (en) Karaoke equipment
US6687674B2 (en) Waveform forming device and method
JPH11133995A (en) Voice converting device
JP2572961B2 (en) Voice synthesis method
JP2999806B2 (en) Music generator
Colonel et al. Conditioning autoencoder latent spaces for real-time timbre interpolation and synthesis
JPH01198797A (en) Electronic musical instrument
JP3540159B2 (en) Voice conversion device and voice conversion method
JP3502268B2 (en) Audio signal processing device and audio signal processing method
JPH1078791A (en) Pitch converter
JPS6239744B2 (en)
JP2504179B2 (en) Noise sound generator
JP2013041128A (en) Discriminating device for plurality of sound sources and information processing device interlocking with plurality of sound sources
JP3130305B2 (en) Speech synthesizer
JP3294192B2 (en) Voice conversion device and voice conversion method
JP3540609B2 (en) Voice conversion device and voice conversion method
Edgerton et al. Using nonlinear phenomena in contemporary musical composition and performance
JP2560277B2 (en) Speech synthesis method
JP2502169B2 (en) Music synthesizer
JPS58168097A (en) Voice synthesizer
JP3540160B2 (en) Voice conversion device and voice conversion method
JP2000003187A (en) Method and device for storing voice feature information
JP3935745B2 (en) Method for encoding acoustic signal
JPS59176782A (en) Digital sound apparatus
JP2572875B2 (en) Music synthesizer