JPS6347799A - Rhythm control system - Google Patents

Rhythm control system

Info

Publication number
JPS6347799A
JPS6347799A JP61191395A JP19139586A JPS6347799A JP S6347799 A JPS6347799 A JP S6347799A JP 61191395 A JP61191395 A JP 61191395A JP 19139586 A JP19139586 A JP 19139586A JP S6347799 A JPS6347799 A JP S6347799A
Authority
JP
Japan
Prior art keywords
prosody
parameters
analysis
function
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61191395A
Other languages
Japanese (ja)
Other versions
JP2749804B2 (en
Inventor
哲也 酒寄
佐々部 昭一
博雄 北川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61191395A priority Critical patent/JP2749804B2/en
Publication of JPS6347799A publication Critical patent/JPS6347799A/en
Application granted granted Critical
Publication of JP2749804B2 publication Critical patent/JP2749804B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Abstract] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 韮J鰻と訪 本発明は、音声の規則合成における韻律制御方式に関す
る。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a prosody control method in the rule synthesis of speech.

丸it析 音声合成において自然な韻律を付加するために、ピッチ
、振幅、リズム等を制御する韻律制御規則が不可欠であ
る。このような韻律を構成する数量を多変量統計解析的
に制御する方式についてはすでに提案したが、この方式
は以下のような欠点を持っている。
In order to add natural prosody in round-the-clock speech synthesis, prosody control rules that control pitch, amplitude, rhythm, etc. are essential. A method for controlling the quantities that make up prosody using multivariate statistical analysis has already been proposed, but this method has the following drawbacks.

(イ)制御すべき韻律を構成する数量を各々の要因の線
形和で表し、それ以外のモデルを扱うことができない。
(b) The quantity that constitutes the prosody to be controlled is expressed as a linear sum of each factor, and other models cannot be handled.

(ロ)定性的パラメータと定量的パラメータを同時に扱
うことができない。
(b) It is not possible to handle qualitative and quantitative parameters at the same time.

目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声の規則合成において自然性の高い韻律パター
ンを生成することを目的としてなされたものである。
Purpose The present invention was made in view of the above-mentioned circumstances.
In particular, it was developed with the aim of generating highly natural prosodic patterns in the regular synthesis of speech.

構   成 本発明は、上記目的を達成するために、予め用意した音
声素片のパラメータ系列を入力文字列に従って読み出し
、結合規則によって接続し、韻律規則によって韻律を付
加する音声規則合成方式において、種々のパラメータを
多変量統計解析的に処理して最適な制御値を得ることを
特徴としたものである。以下、本発明の実施例に基いて
説明する。
Configuration In order to achieve the above object, the present invention is a speech rule synthesis method in which a parameter sequence of speech segments prepared in advance is read out according to an input character string, connected by a combination rule, and prosody is added by a prosody rule. This method is characterized by processing parameters using multivariate statistical analysis to obtain optimal control values. Hereinafter, the present invention will be explained based on examples.

第1図及び第2図は5本発明による韻律制御方式の実施
例を説明するための図であるが、本発明は、上述のよう
な先行技術における欠点を改良するためになされたもの
であり、上記欠点を改善するために、韻律を構成する数
量に影響を与えると考えられる種々の定)を的パラメー
タに、数量化■類分析によって定性的パラメータを加え
て、それらの任意の関数としてモデルを構成し、そのモ
デルによって制御するようにしたものである。
1 and 2 are diagrams for explaining an embodiment of the prosody control method according to the present invention, but the present invention was made to improve the drawbacks of the prior art as described above. In order to improve the above-mentioned drawbacks, we added qualitative parameters through quantitative analysis to the target parameters (various constants that are thought to affect the quantities that make up the prosody), and created a model as an arbitrary function of them. is configured and controlled by that model.

第1図において、11は定量的パラメータ部、12は定
性的パラメータ部、13は数量化1類分析部、】、4:
よ任意関数部、15は韻律を構成する数量部で、韻律を
構成する数量の予測値をZl、実測値をzjとして、下
記の(1)、(2)、(3)式を満足するような数量(
ajk)及びfの係数を決定する。
In FIG. 1, 11 is a quantitative parameter section, 12 is a qualitative parameter section, 13 is a quantification type 1 analysis section, ], 4:
15 is the quantity part that makes up the prosody, where Zl is the predicted value of the quantity that makes up the prosody, and zj is the actual value, so that the following equations (1), (2), and (3) are satisfied. quantity (
ajk) and the coefficients of f.

Zj、=f(x、、 xz”’、 xml、 ’/sr
 8/21 ”’)’m2)”’ (1)Σ= (Zi
−zi)2→最小    ・・・(3)c=1 ここで、δ1(jk)は個体iが要因アイテムjのカテ
ゴリーKに反応するときに1.そうでないときOをとる
関数、xjは数量化I類分析によって求めたm1個の数
量、ylはZに直接寄与するm2個の定量的パラメータ
、Rはアイテムの数、cjはアイテムjのカテゴリー数
、a jkjはカテゴリーに対する数量、nはデータ数
である。
Zj, = f(x,, xz”', xml, '/sr
8/21 "')'m2)"' (1)Σ= (Zi
-zi) 2 → minimum (3) c=1 Here, δ1(jk) is 1 when individual i responds to category K of factor item j. Otherwise, the function takes O, xj is m1 quantities obtained by quantification type I analysis, yl is m2 quantitative parameters that directly contribute to Z, R is the number of items, cj is the number of categories of item j , a jkj is the quantity for the category, and n is the number of data.

第2図は、本発明の一実施例を説明するための図で、図
中、21はモーラ数の逆数部、22は係数す部、23は
係数C部、24は加算部、25は前後の音韻、長音、促
音等の定性パラメータ部。
FIG. 2 is a diagram for explaining one embodiment of the present invention. In the figure, 21 is the reciprocal part of the mora number, 22 is the coefficient part, 23 is the coefficient C part, 24 is the addition part, and 25 is the front and rear parts. Qualitative parameters such as phonology, long sounds, consonants, etc.

26は数量化1類分析部、27は音韻継続時間長部で、
ここでは韻律を構成する数量2として音韻継続時間長を
予測することを考えている。モデルとしては、前後の音
韻、長母音や促音などの特殊音韻か否か等の定性的パラ
メータを要因アイテムにとって、数址化I類分析を行な
って求めた数量x1と、発話を牲位のモーラ数の逆数y
工との線形1次結合を考える。このとき関数fは、 f: (x□t yz) =x、+by、+c   ”
’ (4)と表され、上記(1)、(2)式は、 という形になる。未知定数(ajk) 、 b、 cは
最小2乗法の原理により(5)式を各定数で偏微分し。
26 is the quantification type 1 analysis part, 27 is the phonological duration length part,
Here, we are considering predicting the phoneme duration length as the quantity 2 that constitutes the prosody. The model uses qualitative parameters such as the preceding and following phonemes and whether or not it is a special phoneme such as a long vowel or consonant as a factor, and the quantity x1 obtained by performing a type I analysis of the utterance, and the mora of the sacrifice position of the utterance. reciprocal of number y
Consider a linear combination with At this time, the function f is f: (x□t yz) =x, +by, +c”
'(4), and the above equations (1) and (2) have the following form. Unknown constants (ajk), b, and c are obtained by partially differentiating equation (5) with respect to each constant using the principle of least squares method.

たちのをOとおいた連立方程式を解くことによって簡単
に求めることが出来る。
It can be easily obtained by solving simultaneous equations with 0 as 0.

このように構成されたモデルによって、求めるべき音韻
における定性的パラメータとモーラ数を入力して音韻継
続時間長を求めることが出来る。
With the model configured in this manner, the phoneme duration length can be determined by inputting the qualitative parameters and mora number of the phoneme to be determined.

ここではZに直接寄与する定量的パラメータとしてモー
ラ数を用いたが、その他、モーラ位置、その音韻の平均
パワーや、ピッチなどを用いることも可能である。さら
に関数fの形もyの2次関数や、Xとyのかけ合わせ等
様々なものが考えられる。ただし、未知定数を決定する
連立方程式が非線形になる場合は、数値解析法を導入す
る必要がある。また、Zとし又ピッチ、振幅等の韻律を
構成する他の要素を予測することも同様に実現できる。
Here, the number of moras is used as a quantitative parameter that directly contributes to Z, but it is also possible to use the mora position, the average power of the phoneme, the pitch, etc. Furthermore, various forms of the function f can be considered, such as a quadratic function of y or a product of X and y. However, if the simultaneous equations determining the unknown constants are nonlinear, it is necessary to introduce a numerical analysis method. Furthermore, it is also possible to predict other elements constituting prosody such as Z, pitch, and amplitude.

匁−−−ス 以上の説明から明らかなように、本発明によるど、a拭
化I類分析を用いて定性的パラメータを数量化し、これ
を加えた定量的パラメータに対するモデルを構成し、自
然性の高い合成音を得ることができるように韻律を制御
することができる。
As is clear from the above explanation, according to the present invention, qualitative parameters are quantified using a-type I analysis, a model is constructed for quantitative parameters with this added, and naturalness is The prosody can be controlled so that a high synthesized sound can be obtained.

【図面の簡単な説明】[Brief explanation of the drawing]

第」−図及び第2図は、本発明による韻律制御方式の実
施例を説明するための構成図である。 11・・・定九(的パラメータ部、12・・・定性的パ
ラメータ部、13・・・数量化■類分析部、14・・・
任意関数部、15・・・韻律を構成する数量部、21・
・・モーラ数の逆数部、22・・係数す部、23・・・
係数C部、24・・・加算部、25・・・定性パラメー
タ部、26・・・数量化1類分析部、27・・・音韻継
続時間長部。 第  1  図 1!14 第2図
Figures 1 and 2 are configuration diagrams for explaining embodiments of the prosody control system according to the present invention. 11... Definite nine (material parameter part), 12... Qualitative parameter part, 13... Quantification ■ type analysis part, 14...
Arbitrary function part, 15... Quantity part forming prosody, 21.
・Reciprocal part of Mora number, 22 ・Coefficient part, 23...
Coefficient C part, 24... Addition part, 25... Qualitative parameter part, 26... Quantification type 1 analysis part, 27... Phoneme duration length part. 1st Figure 1!14 Figure 2

Claims (2)

【特許請求の範囲】[Claims] (1)、予め用意した音声素片のパラメータ系列を入力
文字列に従って読み出し、結合規則によって接続し、韻
律規則によって韻律を付加する音声規則合成方式におい
て、種々のパラメータを多変量統計解析的に処理して最
適な制御値を得ることを特徴とする韻律制御方式。
(1) In the speech rule synthesis method, which reads the parameter series of speech segments prepared in advance according to the input character string, connects them using connection rules, and adds prosody using prosody rules, various parameters are processed using multivariate statistical analysis. A prosody control method characterized by obtaining an optimal control value.
(2)、韻律を構成する数量(音韻時間長、ピッチパタ
ーン、振幅等)を、いくつかの定量的パラメータの関数
として表し、そのうちの少なくとも1つを外的基準に取
り、その定量的パラメータに寄与すると考えられる定性
的パラメータを要因アイテムにとって数量化 I 類分析
を行なうことによって予測モデルを設定し、このモデル
によって韻律を構成する数量を予測することを特徴とす
る特許請求範囲第(1)項に記載の韻律制御方式。
(2) Express the quantities that make up prosody (phonological duration, pitch pattern, amplitude, etc.) as a function of several quantitative parameters, take at least one of them as an external standard, and use that quantitative parameter as a function. Claim (1), characterized in that a prediction model is set by performing a quantification type I analysis of qualitative parameters that are considered to contribute to factor items, and the quantities constituting the prosody are predicted by this model. Prosody control method described in.
JP61191395A 1986-08-15 1986-08-15 Prosody control method Expired - Lifetime JP2749804B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61191395A JP2749804B2 (en) 1986-08-15 1986-08-15 Prosody control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61191395A JP2749804B2 (en) 1986-08-15 1986-08-15 Prosody control method

Publications (2)

Publication Number Publication Date
JPS6347799A true JPS6347799A (en) 1988-02-29
JP2749804B2 JP2749804B2 (en) 1998-05-13

Family

ID=16273889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61191395A Expired - Lifetime JP2749804B2 (en) 1986-08-15 1986-08-15 Prosody control method

Country Status (1)

Country Link
JP (1) JP2749804B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6050600A (en) * 1983-08-31 1985-03-20 株式会社東芝 Rule synthesization system
JPS6111798A (en) * 1984-06-26 1986-01-20 松下電器産業株式会社 Rhythm control for regular synthetic sound
JPS6346497A (en) * 1986-04-18 1988-02-27 株式会社リコー Voice synthesization system
JPS6346498A (en) * 1986-04-18 1988-02-27 株式会社リコー Rhythm control system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6050600A (en) * 1983-08-31 1985-03-20 株式会社東芝 Rule synthesization system
JPS6111798A (en) * 1984-06-26 1986-01-20 松下電器産業株式会社 Rhythm control for regular synthetic sound
JPS6346497A (en) * 1986-04-18 1988-02-27 株式会社リコー Voice synthesization system
JPS6346498A (en) * 1986-04-18 1988-02-27 株式会社リコー Rhythm control system

Also Published As

Publication number Publication date
JP2749804B2 (en) 1998-05-13

Similar Documents

Publication Publication Date Title
US6785652B2 (en) Method and apparatus for improved duration modeling of phonemes
CN112599113A (en) Dialect voice synthesis method and device, electronic equipment and readable storage medium
JPH0883098A (en) Parameter conversion and voice synthesis method
US6970819B1 (en) Speech synthesis device
JPS6347799A (en) Rhythm control system
EP0107945B1 (en) Speech synthesizing apparatus
JP6840124B2 (en) Language processor, language processor and language processing method
JP2004117662A (en) Voice synthesizing system
JP2596416B2 (en) Sentence-to-speech converter
JP2749802B2 (en) Voice synthesis method
JP3576792B2 (en) Voice information processing method
JPH06318094A (en) Speech rule synthesizing device
JP3771565B2 (en) Fundamental frequency pattern generation device, fundamental frequency pattern generation method, and program recording medium
JP5999092B2 (en) Pitch pattern generation method, pitch pattern generation device, speech synthesizer, and pitch pattern generation program
JP3078073B2 (en) Basic frequency pattern generation method
JP6552146B1 (en) Audio processing apparatus and audio processing method
JPS63100498A (en) Voice synthesization system
JP3314116B2 (en) Voice rule synthesizer
Stan et al. Interactive Intonation Optimisation Using CMA-ES and DCT Parameterisation of the F0 Contour for Speech Synthesis
JP2000221989A (en) Sound synthesizing device, regular sound synthesizing method, and memory medium
JP3078074B2 (en) Basic frequency pattern generation method
JPH0389300A (en) Rhythm control system
GIURGIU et al. Interactive Intonation Optimisation Using CMA-ES and DCT Parameterisation of the F0 Contour for Speech Synthesis
JPH0968993A (en) Prosody control method for musical tone synthesis
JPH0695696A (en) Speech synthesis system

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term