JP3303835B2 - Apparatus and method for generating pitch pattern for rule synthesis of speech - Google Patents

Apparatus and method for generating pitch pattern for rule synthesis of speech

Info

Publication number
JP3303835B2
JP3303835B2 JP12368699A JP12368699A JP3303835B2 JP 3303835 B2 JP3303835 B2 JP 3303835B2 JP 12368699 A JP12368699 A JP 12368699A JP 12368699 A JP12368699 A JP 12368699A JP 3303835 B2 JP3303835 B2 JP 3303835B2
Authority
JP
Japan
Prior art keywords
section
pitch pattern
spline function
pattern generation
control point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12368699A
Other languages
Japanese (ja)
Other versions
JP2000315092A (en
Inventor
玲史 近藤
幸夫 三留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP12368699A priority Critical patent/JP3303835B2/en
Publication of JP2000315092A publication Critical patent/JP2000315092A/en
Application granted granted Critical
Publication of JP3303835B2 publication Critical patent/JP3303835B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a device which generates a pitch pattern that is smooth and suitable to express naturalness and individuality for speech synthesis by rule. SOLUTION: The device is provided with an input section 11 which inputs a class of control points and the shape of the segment made by the points, a control point inspection section 12 which inspects the appropriateness concerning the class of the control points inputted, a pitch pattern generating section 14 which provides a restriction to the range of the values of a derivative for every interval of a spline function and then generates a spline function that passes through a desired point where the function values and the first order differential coefficients at the connecting points of the adjacent interval are equal on both sides, and a display section 20 which displays a decision control point, an auxiliary control point and a generated pitch pattern on a screen.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声合成装置に関
し、特に音声の規則合成装置に用いられるピッチパタン
の生成装置及び方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech synthesizer, and more particularly, to a pitch pattern generator and a method used in a speech rule synthesizer.

【0002】[0002]

【従来の技術】音声の規則合成装置において、音声の自
然性や個人性を表現する上で、ピッチパタン(基本周波
数パタン)は非常に大切な情報である。従来より、ピッ
チパタンを効率よく生成するための幾つかの方法が提案
されている。
2. Description of the Related Art Pitch patterns (fundamental frequency patterns) are very important information for expressing the naturalness and personality of speech in a speech rule synthesizer. Conventionally, several methods for efficiently generating a pitch pattern have been proposed.

【0003】第1の方法として、例えば刊行物1(特開
昭63−85797号公報)には、入力テキストからフレーズ
指令とアクセント指令を生成し、臨界制動2次線形系の
インパルス応答とステップ応答のモデルでピッチパタン
を表現する方法が開示されている。
As a first method, for example, in Publication 1 (Japanese Patent Laid-Open No. 63-85797), a phrase command and an accent command are generated from an input text, and the impulse response and the step response of the critical braking second-order linear system are generated. Discloses a method of expressing a pitch pattern using a model.

【0004】第2の方法として、発声中の複数のピッチ
周波数を点ピッチとして指定して、その間を直線補間す
るという方法がよく知られている。これは例えば、刊行
物2(岩田、三留、「発話テンポに依存しない韻律構造
のモデル化」、1994年電子情報通信学会春季大会SA−5
−2、1994年3月)等の記載が参照される。
As a second method, a method of designating a plurality of pitch frequencies during utterance as point pitches and performing linear interpolation between them is well known. This is described, for example, in Publication 2 (Iwata and Midome, “Modeling of Prosodic Structure Independent of Utterance Tempo”, IEICE Spring Meeting 1994, SA-5
-2, March 1994).

【0005】また、第3の方法として、直線補間の代わ
りに、区分的多項式(スプライン関数)による近似を行う
方法も用いられる。例えば、刊行物3(特開平4−36299
8で)には、3次以上のスプライン関数あるいはBスプ
ラインを用いる方法が開示している。
[0005] As a third method, a method of performing approximation using a piecewise polynomial (spline function) instead of linear interpolation is also used. For example, Publication 3 (JP-A-4-36299)
8) discloses a method using a cubic or higher-order spline function or B-spline.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上記し
た従来の方法は、次のような問題点を有している。
However, the above-mentioned conventional method has the following problems.

【0007】上記第1の方法においては、ピッチパタン
は各応答によって表現される呼気段落成分とアクセント
句成分の和として表現される。この方法によれば、制御
すべきパラメータが少ないため、制御が比較的楽で、安
定したパタンが得られるという特徴がある。その反面、
各インパルス応答あるいはステップ応答の成分は指数関
数的にしか変化できないため、近似の精度はそれほど高
くとることができない。このため、手動で自由なピッチ
パタンをデザインする際にも、作成できる形状に大きな
制約が加わる、という問題点がある。
In the first method, the pitch pattern is represented as a sum of a breath paragraph component and an accent phrase component represented by each response. According to this method, since there are few parameters to be controlled, there is a characteristic that control is relatively easy and a stable pattern can be obtained. On the other hand,
Since the components of each impulse response or step response can only change exponentially, the approximation accuracy cannot be so high. For this reason, there is a problem that even when a free pitch pattern is manually designed, a large restriction is imposed on a shape that can be created.

【0008】上記第2の方法においては、例えば指定す
る点として音節やモーラの時間的中心の周波数を用いる
ことで、比較的容易に実際の音声データからの自動生成
が可能であり、また手動でデザインすることが容易であ
る。その反面、近似の精度を上げるためには指定する点
の数を増やす必要があり、パラメータの数が多くなって
しまうという問題点がある。刊行物2では、指定する点
を減らす技術をあわせて開示しているが、これによって
も、ピッチパタンが折れ線であることは変わらないた
め、音声を合成した際に、ピッチパタンの屈曲点で異音
が発生する、という問題点が残る。
In the second method, for example, by using the frequency at the center of time of a syllable or a mora as a point to be specified, automatic generation from actual voice data can be relatively easily performed. Easy to design. On the other hand, in order to increase the approximation accuracy, it is necessary to increase the number of designated points, and there is a problem that the number of parameters increases. Publication 2 also discloses a technique for reducing the number of designated points. However, even with this, the pitch pattern is still a polygonal line, and therefore, when speech is synthesized, the pitch pattern is different at the bending point of the pitch pattern. The problem that sound is generated remains.

【0009】そして上記第3の方法においては、第1、
第2の方法に比べて近似の精度が高く取ることができ、
滑らかなピッチパタンを得ることができる。また、従来
の技術2に比べて、取り得る形状の柔軟性が高い。その
反面、一般にピッチパタンをスプライン関数で近似した
場合、ピッチパタンのあばれ(波打ち現象)など、実際の
音声のピッチパタンには有り得ないようなパタンが生成
されることがある。これは、実際の音声データからの自
動生成や手動によるデザインの際に、問題になる。これ
は、生成したピッチパタンを音声合成に使用する場合
に、音声の自然性の低下、了解性の低下などの悪影響を
もたらす。
In the third method, the first,
The accuracy of the approximation can be higher than in the second method,
A smooth pitch pattern can be obtained. Further, the flexibility of the shape that can be taken is higher than that of the conventional technology 2. On the other hand, in general, when a pitch pattern is approximated by a spline function, a pattern which is impossible in an actual voice pitch pattern, such as pitch pattern irregularity (undulation phenomenon), may be generated. This poses a problem during automatic generation from actual audio data or manual design. This causes adverse effects such as a decrease in naturalness of speech and a decrease in intelligibility when the generated pitch pattern is used for speech synthesis.

【0010】したがって本発明は、上記問題点に鑑みて
なされたものであって、その目的は、音声規則合成装置
において、滑らかで自然性が高い合成音声を得る事がで
きるピッチパタン生成装置及び方法を提供することにあ
る。
SUMMARY OF THE INVENTION Accordingly, the present invention has been made in view of the above-mentioned problems, and has as its object to provide a pitch pattern generating apparatus and method capable of obtaining a synthesized speech with high smoothness in a speech rule synthesizing apparatus. Is to provide.

【0011】また、本発明の他の目的は、効率よく制約
を満たすピッチパタンを計算することができる、ピッチ
パタン生成装置装置及び方法を提供することにある。こ
れ以外の本発明の目的、特徴等は以下の説明で容易に明
らかとされるであろう。
It is another object of the present invention to provide a pitch pattern generating apparatus and method capable of efficiently calculating a pitch pattern satisfying the constraint. Other objects, features, and the like of the present invention will be easily clarified in the following description.

【0012】[0012]

【課題を解決するための手段】前記目的を達成する本発
明は、音声の規則合成で用いるピッチパタンをあらわす
スプライン関数を出力するピッチパタン生成装置であっ
て、スプライン関数の区間毎に導関数の値の範囲に制約
を設けた上で、隣り合う区間の接続点における関数値お
よび一次の微係数が区間両側で等しい、所望の点を通る
スプライン関数を生成する手段を備えたことを特徴とす
る。
According to the present invention, there is provided a pitch pattern generating apparatus for outputting a spline function representing a pitch pattern used in rule synthesis of speech, wherein a derivative of a derivative is provided for each section of the spline function. Means for generating a spline function passing through a desired point in which a function value and a first-order differential coefficient at a connection point of an adjacent section are equal on both sides of the section while providing a constraint on a range of values. .

【0013】[0013]

【発明の実施の形態】本発明の実施の形態について説明
する。本発明は、ピッチパタンをスプライン関数によっ
て近似する際に、スプライン関数の区間毎に制約を設け
ることによって、実際の音声のピッチパタンとして有り
得ないパタンが生成されることを回避するものである。
Embodiments of the present invention will be described. According to the present invention, when a pitch pattern is approximated by a spline function, a constraint is provided for each section of the spline function, thereby avoiding generation of a pattern that is impossible as an actual voice pitch pattern.

【0014】具体的には、音声のピッチパタンとして
は、アクセント句の境界やアクセント位置によってピッ
チパタンが上昇したり下降したりするというように、大
まかな形状が決まっている。
[0014] More specifically, the pitch pattern of the voice is roughly determined such that the pitch pattern rises or falls depending on the boundary of the accent phrase or the accent position.

【0015】そこで、例えばある区間内の一次導関数
(スプライン関数の時間微分の一階微分係数)の値を、
常に正または0と制限することにより、その区間を単調
増加とすることができる。
Then, for example, the value of the first derivative (first derivative of the time derivative of the spline function) in a certain interval is
By always limiting to positive or 0, the section can be monotonically increased.

【0016】更に、二次導関数の値まで制限すると、上
に凸で単調増加などのように規定することができる。こ
れにより、ピッチパタンとしてふさわしい形状で、かつ
所望の点を通るようなピッチパタンを生成する。
Furthermore, if the value is restricted to the value of the second derivative, it can be defined as a convex upward and monotonically increasing. Thereby, a pitch pattern having a shape suitable for the pitch pattern and passing through a desired point is generated.

【0017】本発明のピッチパタン生成装置は、その好
ましい実施の形態において、ピッチパタンに関する確定
制御点と区間内の補助制御点との組と、前記制御点で定
義される区間の形状に関する制約情報を入力する入力手
段(11)と、前記入力された制御点の組についてピッ
チパタン生成が可能な情報であるかその妥当性を検証す
る検査手段(12)と、前記入力され妥当性が検証され
た確定制御点と補助制御点とを通過し、区間の形状に関
する前記制約を満たすスプライン関数、すなわちスプラ
イン関数の区間毎に導関数の値の範囲に制約を設けた上
で隣り合う区間の接続点における関数値および一次の微
係数が両側で等しい所望の点を通るスプライン関数を生
成することでピッチパタンを生成するピッチパタン生成
手段(14)と、前記各確定制御点と補助制御点、及び
生成されたピッチパタンを画面上に表示する表示手段
(20)と、を備える。
In a preferred embodiment of the present invention, in the preferred embodiment, a set of a fixed control point relating to the pitch pattern and an auxiliary control point in the section, and constraint information regarding the shape of the section defined by the control point are provided. Input means for inputting a set of control points, checking means (12) for verifying whether or not the input control point set is information capable of generating a pitch pattern, and inputting and verifying the input and validity. Spline function that passes through the determined control point and the auxiliary control point and satisfies the constraint on the shape of the section, that is, a connection point between adjacent sections after providing a constraint on the range of derivative values for each section of the spline function Pitch pattern generation means (14) for generating a pitch pattern by generating a spline function passing through a desired point having the same function value and first-order derivative on both sides; Comprising serial each determined control point and the auxiliary control points, and a display means for displaying the generated pitch pattern on the screen (20), the.

【0018】本発明の実施の形態においては、入力手段
(11)から入力された制約情報について各区間に与え
られた制約を調べ、単調増加あるいは単調減少が連続す
る区間を検出し、単調増加あるいは単調減少が連続する
区間を一つの推定連続区間としてまとめる連続推定区間
検出手段(18)を備えた構成としてもよい。
In the embodiment of the present invention, the constraint information input from the input means (11) is checked for constraints given to each section, and a section in which monotonic increase or monotonic decrease continues is detected, and a monotonic increase or A configuration may be provided that includes a continuous estimation section detection unit (18) that combines sections in which monotonous decrease continues as one estimated continuous section.

【0019】また本発明の実施の形態においては、確定
制御点の数、平叙文又は疑問文などの文のタイプ、区間
の形状を制約する情報として区間毎の単調増加/単調減
少の情報を含む入力対応表(17)を記憶手段に記憶保
持し、入力手段(11)は、入力された確定制御点の
数、及び、各区間毎の制約情報の代わりに入力された文
タイプを指定する情報から、前記入力対応表を検索し、
各区間の制約情報を決定する構成としてもよい。
Also, in the embodiment of the present invention, information on monotonous increase / monotone decrease for each section is included as information for restricting the number of fixed control points, the type of sentence such as declarative sentence or question sentence, and the shape of the section. The input correspondence table (17) is stored in the storage means, and the input means (11) specifies the number of input definite control points and information specifying the input sentence type instead of the constraint information for each section. From, search the input correspondence table,
It may be configured to determine the constraint information of each section.

【0020】[0020]

【実施例】上記した本発明の実施の形態についてさらに
詳細に説明すべく、本発明の実施例について図面を参照
して以下に説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing an embodiment of the present invention;

【0021】図1は、本発明の第1の実施例の構成を示
す図である。図1を参照すると、入力部11と、制御点
検査部12と、ピッチパタン生成部14と、表示部20
とを備えている。
FIG. 1 is a diagram showing the configuration of the first embodiment of the present invention. Referring to FIG. 1, an input unit 11, a control point inspection unit 12, a pitch pattern generation unit 14, a display unit 20
And

【0022】このうち入力部11には、制御点の組と、
その制御点が作る区間の制約が入力される。
The input unit 11 includes a set of control points,
The constraint of the section created by the control point is input.

【0023】入力される制御点の組として、図2に示す
ように、確定制御点(○)と補助制御点(×)のそれぞ
れの時刻と周波数からなる。図2において、横軸は時
刻、縦軸は周波数である。確定制御点と補助制御点は、
スプライン関数のパラメータに直接対応するものではな
いが、確定制御点のx座標すなわち時刻を、スプライン
関数の区間の接続点とする。
As shown in FIG. 2, a set of input control points is composed of a time and a frequency of each of a fixed control point (と) and an auxiliary control point (×). In FIG. 2, the horizontal axis represents time, and the vertical axis represents frequency. The fixed control point and auxiliary control point are
Although it does not directly correspond to the parameters of the spline function, the x-coordinate of the determined control point, that is, the time, is set as the connection point of the section of the spline function.

【0024】図2では、説明の便宜上、それぞれの確定
制御点と補助制御点に番号を付してある。また、隣接し
た2つの確定制御点が一つの区間を形成する。この実施
例では、区間の制約としては、単調増加あるいは単調減
少のいづれかの値を取るものとする。
In FIG. 2, for the sake of convenience of explanation, each fixed control point and auxiliary control point are numbered. Also, two adjacent fixed control points form one section. In this embodiment, it is assumed that the restriction of the section takes either a monotonically increasing value or a monotonically decreasing value.

【0025】制御点検査部12は、入力部11から入力
された制御点の組について、妥当性を検査する。この実
施例では、以下の5点の確認を行う。
The control point checking unit 12 checks the validity of the set of control points input from the input unit 11. In this embodiment, the following five points are confirmed.

【0026】(1)確定制御点の総数が2個以上である
ことを確認する。
(1) It is confirmed that the total number of fixed control points is two or more.

【0027】(2)それぞれの確定制御点の時刻が重な
らないことを確認する。
(2) Confirm that the times of the respective fixed control points do not overlap.

【0028】(3)それぞれの確定制御点の周波数が正
であることを確認する。
(3) Confirm that the frequency of each fixed control point is positive.

【0029】(4)補助制御点の時刻が一つの区間に必
ず1個づつあり、区間を形成している確定制御点の時刻
と重ならないことの確認を行う。
(4) It is confirmed that the time of the auxiliary control point is always one in one section and does not overlap with the time of the fixed control point forming the section.

【0030】(5)各区間を形成する確定制御点の周波
数の上下関係が、その区間の制約を満たすことを確認す
る。例えば、区間iの制約が単調増加の場合、確定制御
点i+1の値(周波数)が確定制御点iの値(周波数)より
も等しいか大きくなければならないという制約を満たす
ことを確認する。
(5) It is confirmed that the vertical relationship between the frequencies of the fixed control points forming each section satisfies the restrictions of the section. For example, when the constraint of the section i is monotonically increasing, it is confirmed that the constraint that the value (frequency) of the fixed control point i + 1 must be equal to or larger than the value (frequency) of the fixed control point i is satisfied.

【0031】制御点検査部12で、妥当でないと判断さ
れた場合には、ピッチパタンの生成は行わずに、エラー
を報告する。
If the control point inspection unit 12 determines that the pattern is not valid, an error is reported without generating a pitch pattern.

【0032】ピッチパタン生成部14は、与えられた確
定制御点と補助制御点を通過するスプライン関数を生成
する。与えられた確定制御点と補助制御点だけではスプ
ライン関数の全てのパラメータを確定できないが、残り
のパラメータを取り得る範囲で変化させ、逐次所望の条
件を満たすか否かを検査することにより、なるべく条件
を満たすスプライン関数を得ることが可能である。もち
ろん、これに対して始めから制御点の数を増やし、スプ
ライン関数を確定させてもよい。
The pitch pattern generator 14 generates a spline function passing through the given fixed control point and the given auxiliary control point. Although not all parameters of the spline function can be determined only by the given determined control points and auxiliary control points, by changing the remaining parameters within a possible range and sequentially checking whether or not the desired condition is satisfied, it is preferable to It is possible to obtain a spline function that satisfies the condition. Of course, the number of control points may be increased from the beginning to determine the spline function.

【0033】ところで、確定制御点を通過するピッチパ
タンを生成することはできても、そのピッチパタンが補
助制御点を通ること、および所望の制約を満たすことが
できない場合がある。このような場合、ピッチパタンを
生成することはせず、エラーを出力して、処理を中断す
る。
By the way, although a pitch pattern that passes through a fixed control point can be generated, the pitch pattern may not pass through an auxiliary control point and may not satisfy a desired constraint. In such a case, a pitch pattern is not generated, an error is output, and the processing is interrupted.

【0034】ピッチパタン生成部14は、ピッチパタン
そのものの形状を生成し、これが本ピッチパタン生成装
置の出力となるが、本発明は、かかる構成に限定される
ものでなく代わりにスプライン関数を規定するパラメー
タを出力するように構成してもよい。
The pitch pattern generation unit 14 generates the shape of the pitch pattern itself, which is the output of the pitch pattern generation apparatus. However, the present invention is not limited to such a configuration, but instead defines a spline function. May be output.

【0035】表示部20は、各確定制御点と補助制御
点、生成されたピッチパタンを画面上に表示する。ま
た、この時、該当する時刻や単位を一緒に表示すること
で、ユーザにとって見やすい表示を得ることができる。
The display unit 20 displays each fixed control point, auxiliary control point, and generated pitch pattern on a screen. Also, at this time, by displaying the corresponding times and units together, a display that is easy for the user to see can be obtained.

【0036】図4は、表示部20に表示されたピッチパ
タンの一例を示す図であり、横軸は時刻、縦軸は周波数
である。図4に示すように、各区間について確定制御
点、補助制御点及び制約を満たしたピッチパタンが表示
されている。
FIG. 4 is a diagram showing an example of the pitch pattern displayed on the display unit 20, wherein the horizontal axis represents time and the vertical axis represents frequency. As shown in FIG. 4, the fixed control points, the auxiliary control points, and the pitch patterns satisfying the restrictions are displayed for each section.

【0037】本発明の一実施例では、各区間の制約とし
て単調増加あるいは単調現象のいづれかの値としている
が、これに加えて上に凸で単調増加、下に凸で単調増
加、上に凸で単調減少、下に凸で単調減少のように細か
く分けるようにしてもよい。この場合は、区間内でのス
プライン関数の一次導関数の正負と、二次導関数の正負
で判断することができる。
In one embodiment of the present invention, each of the sections has a value of either monotonically increasing or monotonous phenomenon as a constraint. In addition to this, it is monotonically increasing when convex upward, monotonically increasing when convex downward, and convex when upward. May be finely divided, such as monotonically decreasing, and downwardly convex, monotonically decreasing. In this case, it can be determined by the sign of the first derivative of the spline function and the sign of the second derivative in the interval.

【0038】本発明の一実施例で求めるピッチパタン
は、一つのアクセント句に対応する一連の連続したパタ
ンを想定しているが、さらに、ポーズによって区切られ
る呼気段落全体を一つのピッチパタンで表現すること
や、一つの文全体を一つのピッチパタンで表現するよう
に拡張することも同様にして可能である。
The pitch pattern determined in the embodiment of the present invention is assumed to be a series of continuous patterns corresponding to one accent phrase, but the entire exhalation paragraph separated by a pause is represented by one pitch pattern. In the same manner, it is also possible to extend one sentence by expressing one sentence with one pitch pattern.

【0039】また本発明の一実施例では、区間の制約を
入力部11より外部から与えているが、この制約を固定
としておき、入力しないように構成するようにしてもよ
い。この場合、スプライン関数を適用する範囲を、一ア
クセント句とし、その形状が起伏型などに決まっている
場合に有効である。
In the embodiment of the present invention, the restriction of the section is given from the input unit 11 from the outside. However, the restriction may be fixed so that no input is made. In this case, it is effective when the range to which the spline function is applied is one accent phrase and its shape is determined to be undulating.

【0040】次に本発明の第2の実施例について説明す
る。図5は、本発明の第2の実施例の構成を示す図であ
る。図5を参照すると、本発明の第2の実施例は、図1
に示した前記実施例の構成に加えて、さらに連続推定区
間検出部18を備えている。
Next, a second embodiment of the present invention will be described. FIG. 5 is a diagram showing the configuration of the second embodiment of the present invention. Referring to FIG. 5, a second embodiment of the present invention is shown in FIG.
In addition to the configuration of the above-described embodiment, a continuous estimation section detection unit 18 is further provided.

【0041】連続推定区間検出部18は、各区間に与え
られた制約を調べ、単調増加あるいは単調減少が連続す
る区間を検出する。例えば、区間1から区間a−1まで
が単調増加であり、区間aから区間bまでが単調減少と
指定されている場合、連続推定区間検出部18は、区間
aから区間bまでを、一つの推定連続区間として検出す
る。
The continuous estimation section detecting section 18 examines restrictions given to each section, and detects a section in which the monotone increase or the monotone decrease continues. For example, when it is specified that the section 1 to the section a-1 is monotonically increasing and the section a to the section b is designated as monotonically decreasing, the continuous estimation section detecting unit 18 converts the section a to the section b into one section. It is detected as an estimated continuous section.

【0042】次にピッチパタン生成部14におけるスプ
ライン関数生成処理について説明する。
Next, the spline function generation processing in the pitch pattern generation section 14 will be described.

【0043】まず、区間iにおいて、補助制御点iを通
過するピッチパタンが生成できるか否かは、以下のよう
に判断できる。
First, whether or not a pitch pattern passing through the auxiliary control point i can be generated in the section i can be determined as follows.

【0044】ステップ1: 区間iの両端の補助制御点
の座標を、それぞれ、(xi,Yi0)、(xi+1,Yi1)とする。こ
こで、x座標は時刻、y座標は周波数である。また各区
間iは、時刻の昇順に重なること無く並ぶものとする。
Step 1: The coordinates of the auxiliary control points at both ends of section i are (xi, Yi0) and (xi + 1, Yi1), respectively. Here, the x coordinate is time, and the y coordinate is frequency. The sections i are arranged without overlapping in the ascending order of time.

【0045】ステップ2: 区間iにおいてピッチパタ
ンを表す関数をSi(t)とする。この時、(xi,Yi0)、(xi+
1,Yi1)において次式(1)の関係が成り立つ。
Step 2: A function representing the pitch pattern in the section i is defined as Si (t). At this time, (xi, Yi0), (xi +
1, Yi1), the relationship of the following equation (1) holds.

【0046】Yi0=Si(xi), …(1-1) Yi1=Si(xi+1) …(1-2)Yi0 = Si (xi),... (1-1) Yi1 = Si (xi + 1).

【0047】ステップ3: 関数Si(x)のxi、xi+1にお
ける微係数の符号を反転したものを、パラメータDi0、
Di1として定義する。ここで、符号を反転するのは、本
実施例で扱う区間のうち、単調減少の区間の方が多いた
めである。単調増加の場合も、同様に扱うことができる
ので、以下、単調減少区間について説明する。
Step 3: The inverse of the sign of the differential coefficient at xi and xi + 1 of the function Si (x) is converted to a parameter Di0,
It is defined as Di1. Here, the reason why the sign is inverted is that, of the sections handled in the present embodiment, there are more sections with monotonous decrease. Since the case of monotonous increase can be handled in the same way, the monotonically decreasing section will be described below.

【0048】パラメータDi0、Di1はそれぞれ次式
(2)で与えられる。なお、dSi(x)/dx|x=xiは、x=xi
におけるSi(x)のxに関する一階微係数を表している。
The parameters Di0 and Di1 are given by the following equations (2). Note that dSi (x) / dx | x = xi is obtained when x = xi
Represents the first-order derivative of Si (x) with respect to x.

【0049】Di0 = − dSi(x)/dx|x=xi …(2-1) Di1 = − dSi(x)/dx|x=xi+1 …(2-2)Di0 = −dSi (x) / dx | x = xi (2-1) Di1 = −dSi (x) / dx | x = xi + 1 (2-2)

【0050】ステップ4: 以下の変数変換を行うと、
関数Si(t) は、以下のように表すことができる。すな
わち、Si(x)の変数xを、t = ( x − xi )/hiで正規化
したSi(t)を扱う。ただし、hiはx軸の区間幅(= (xi+
1 − xi) )である。
Step 4: By performing the following variable conversion,
The function Si (t) can be expressed as follows. That is, Si (t) is obtained by normalizing the variable x of Si (x) by t = (x−xi) / hi. Where hi is the section width of the x-axis (= (xi +
1−xi)).

【0051】 Si(x)|t = (x−xi)/hi −> Si(t) …(3-1)Si (x) | t = (x−xi) / hi−> Si (t) (3-1)

【0052】 ただし、 t = ( x − xi )/hi …(3-2) hi = ( xi+1 − xi ) …(3-3)Where t = (x−xi) / hi (3-2) hi = (xi + 1−xi) (3-3)

【0053】また Gi = Yi0 − Yi1 …(3-4) とおくと、Si(t)は次式(3-5)と表わされる。Gi = Yi0−Yi1 (3-4) where Si (t) is expressed by the following equation (3-5).

【0054】 [0054]

【0055】ステップ5:Si(t) を x について微分す
ると、以下の式(4)が成り立つ。
Step 5: Differentiating Si (t) with respect to x, the following equation (4) is established.

【0056】 dSi(x)/dx = − Di0 + 2・( 2・Di0 + Di1 − 3・( 1/hi )・Gi )・t − 3・( ( Di0 + Di1 ) − 2・( 1/hi )・Gi )・t2 …(4)DSi (x) / dx = −Di0 + 2 · (2 · Di0 + Di1−3 · (1 / hi) · Gi) · t−3 · ((Di0 + Di1) −2 · (1 / hi ) ・ Gi) ・ t 2 … (4)

【0057】ステップ6: 関数が区間内において単調
減少になるためには、ステップ5の導関数が、区間内に
おいて、 同一符号(負)であることが必要である。こ
の条件を満たす領域を、区分毎に分類する。 各々の括
弧内の記号は、図3の該当領域に相当する。 また、図
3でハッチを施していない領域は、単調条件を満たさな
い。なお、図3の各領域[1]、[1−1]、[1−2]、[1−
3]、[2]、[3]、[3−1]、[3−1]、[3−2]、[3−
3]はそれぞれ以下の条件で定まる。
Step 6: In order for the function to be monotonically decreasing within the interval, the derivative of step 5 needs to have the same sign (negative) within the interval. The area satisfying this condition is classified for each section. The symbol in each parenthesis corresponds to the corresponding area in FIG. Further, the unhatched area in FIG. 3 does not satisfy the monotonic condition. In addition, each area [1], [1-1], [1-2], and [1-
3], [2], [3], [3-1], [3-1], [3-2], [3-
3] is determined under the following conditions.

【0058】[1] 2次の係数が正のとき: Di0 + Di1 < ( 2/hi )・Gi …(5-1)[1] When the second order coefficient is positive: Di0 + Di1 <(2 / hi) · Gi (5-1)

【0059】 [0059]

【0060】 [0060]

【0061】 [0061]

【0062】[2] 2次の係数が0のとき: Di0 + Di1 = (2/hi)・Gi …(5-5)[2] When the second order coefficient is 0: Di0 + Di1 = (2 / hi) · Gi (5-5)

【0063】[3] 2次の係数が負のとき: Di0 + Di1 > (2/hi)・Gi …(5-6)[3] When the second order coefficient is negative: Di0 + Di1> (2 / hi) · Gi (5-6)

【0064】 [0064]

【0065】 [0065]

【0066】 [3−3] 2・Di0 + Di1 > ( 3/hi )・Gi、 ( 3/hi )・Gi < Di0 + 2・Di1、 Di02 + Di0・Di1 + Di12 − 2・Di0・(3/hi)・Gi − 2・Di1・(3/hi) ・Gi + ((3/hi)・Gi)2≦ 0 …(5-9)[0066] [3-3] 2 · Di0 + Di1 > (3 / hi) · Gi, (3 / hi) · Gi <Di0 + 2 · Di1, Di0 2 + Di0 · Di1 + Di1 2 - 2 · Di0 · (3 / hi) ・ Gi − 2 ・ Di1 ・ (3 / hi) ・ Gi + ((3 / hi) ・ Gi) 2 ≤ 0… (5-9)

【0067】ステップ7:Si(t)は、3次(4階)のBスプ
ラインで表現されるとする。すなわち、Bスプラインの
各サポート関数の重み係数と、各節点での値すなわち確
定制御点の座標、ならびにその微係数とは、次式(6)
の関係が成り立つ。ここで、ai,0とai,1は、区間iに関
する重み係数である。
Step 7: Assume that Si (t) is represented by a cubic (fourth-order) B-spline. That is, the weight coefficient of each support function of the B-spline, the value at each node, that is, the coordinates of the definite control point, and the derivative thereof are expressed by the following equation (6).
Holds. Here, ai, 0 and ai, 1 are weighting factors for section i.

【0068】 Yi0 = ai,0・hi/( hi−1 + hi ) + ai,1・hi−1/( hi−1 + hi ) …(6-1 ) Di0 = ( 3/hi )・( Yi0 − ai,1 ) …(6-2) ai,0 = Yi0 + ( hi/3 )・Di0・hi−1/hi …(6-3) ai,1 = Yi0 − ( hi/3 )・Di0 …(6-4)Yi0 = ai, 0 · hi / (hi−1 + hi) + ai, 1 · hi−1 / (hi−1 + hi) (6-1) Di0 = (3 / hi) · (Yi0 − Ai, 1)… (6-2) ai, 0 = Yi0 + (hi / 3) · Di0 · hi−1 / hi… (6-3) ai, 1 = Yi0 − (hi / 3) · Di0… (6-4)

【0069】両端の区間では、h−1=0、もしくはhm=0と
すればよい。
In the sections at both ends, h−1 = 0 or hm = 0 may be set.

【0070】ステップ8:ここから、単調減少の条件を
満たすのは、ステップ6の[1−2]、[1−3]、[2]、[3−
1]の範囲であるため、生成するスプライン関数の係数と
各節点での関数値、その微係数の取り得る範囲の関係が
判る。
Step 8: From this, the condition of monotonous decrease is satisfied by [1-2], [1-3], [2], [3-
1], the relationship between the coefficient of the spline function to be generated, the function value at each node, and the possible range of the differential coefficient can be understood.

【0071】ステップ9:ここで区間i=aについて、
区間i−1が単調増加で区間iが単調減少であるから、こ
の接続点xiにおける微係数はDi0=0である。したがっ
て、図3において、ステップ8の範囲を満たすスプライ
ン関数が生成できるか否かは、Di0=0の点を通る直線が
ステップ8の範囲と交差するか否かで決定される。
Step 9: Here, for the section i = a,
Since the section i-1 is monotonically increasing and the section i is monotonically decreasing, the differential coefficient at this connection point xi is Di0 = 0. Therefore, in FIG. 3, whether or not a spline function satisfying the range of step 8 can be generated is determined by whether or not a straight line passing through the point of Di0 = 0 intersects with the range of step 8.

【0072】ステップ10:ステップ9の範囲が満たさ
れる場合は、その範囲で補助制御点を通るスプライン関
数を生成する。ここで、ステップ7で計算して、与えら
れた制約で補助制御点を通るスプライン関数が生成でき
ない場合は、エラーを返すようにする。
Step 10: If the range of Step 9 is satisfied, a spline function passing through the auxiliary control point is generated in that range. Here, if it is calculated in step 7 that a spline function passing through the auxiliary control point cannot be generated due to the given constraint, an error is returned.

【0073】ステップ11:区間iのパラメータが定ま
ると、反対側の接続点Di1の値が決まる。これを繰り返
すことで、図6のa、b、c、d、eの点で示すように、順
に各区間のスプライン関数のパラメータを求めることが
できる。
Step 11: When the parameters of the section i are determined, the value of the connection point Di1 on the opposite side is determined. By repeating this, the parameters of the spline function in each section can be obtained in order as indicated by points a, b, c, d, and e in FIG.

【0074】ステップ12:推定連続区間の終端が次の
推定連続区間と接続する場合、すなわちこの例では単調
減少から単調増加に転ずる場合は、その点でDi1=0(i=
b)となる必要がある。この条件が満たせない場合は、エ
ラーを出力する。
Step 12: If the end of the estimated continuous section is connected to the next estimated continuous section, that is, if the transition from monotonous decrease to monotone increase is performed in this example, Di1 = 0 (i =
b). If this condition cannot be satisfied, an error is output.

【0075】なお、ステップ8において、微係数の条件
だけでなく、ステップ6の各条件によるSi(t)の形状の
違いを利用して取り得る値をより絞り込むことも可能で
ある。
In step 8, it is possible to further narrow down possible values by utilizing not only the condition of the differential coefficient but also the difference in the shape of Si (t) depending on each condition of step 6.

【0076】また、ステップ10においてエラーを返す
代わりに、補助制御点を通る条件に最も近い、取り得る
範囲の端の点を使ってスプライン関数を生成するように
しても良い。この場合は、所望する補助制御点のなるべ
く近くを通るようにスプライン関数が生成されることに
なる。
Instead of returning an error in step 10, the spline function may be generated using the end point of the possible range that is closest to the condition passing the auxiliary control point. In this case, a spline function is generated so as to pass as close as possible to the desired auxiliary control point.

【0077】次に本発明の第3の実施例について説明す
る。図7は、本発明の第3の実施例の構成を示す図であ
る。本発明の第3の実施例では、入力部11に入力対応
表17が加えられる。
Next, a third embodiment of the present invention will be described. FIG. 7 is a diagram showing the configuration of the third exemplary embodiment of the present invention. In the third embodiment of the present invention, an input correspondence table 17 is added to the input unit 11.

【0078】入力部11において各区間の形状を入力す
る際に、区間毎の制約を入力する代わりに、「平叙
文」、「疑問文」などの文タイプを入力する。入力部1
1は、入力された確定制御点の数と、文タイプから、入
力対応表17を検索し、各区間の制約を決定する。図8
は、本発明の第3の実施例における入力対応表17の内
容の一例を示す図であり、文タイプ入力変換テーブルを
示したものである。
When inputting the shape of each section in the input unit 11, instead of inputting a constraint for each section, a sentence type such as "declaration sentence" or "question sentence" is input. Input unit 1
1 searches the input correspondence table 17 based on the number of input fixed control points and the sentence type, and determines the constraint of each section. FIG.
Is a diagram showing an example of the contents of the input correspondence table 17 in the third embodiment of the present invention, and shows a sentence type input conversion table.

【0079】図8を参照すると、確定制御点の数、文タ
イプ(「平叙文」、「疑問文」)、ピッチパタン生成の
可不可、区間の形状として区間毎の単調増加/減少の定
義情報よりなる。
Referring to FIG. 8, definition information of the number of fixed control points, sentence type ("declarative sentence", "question sentence"), whether pitch patterns can be generated, and monotone increase / decrease for each section as the section shape Consisting of

【0080】本発明の第3の実施例においては、入力対
応表17を適宜別のものと差し替えることによって、入
力の制限やパタンの違いに対応することができる。例え
ば、確定制御点の数は「5」であり、区間1では単調増
加、区間2、3、4では単調減少とするパタンだけを許
すことができる。
In the third embodiment of the present invention, the input correspondence table 17 is appropriately replaced with another one, so that it is possible to cope with input restrictions and differences in patterns. For example, the number of confirmed control points is “5”, and only a pattern of monotonically increasing in section 1 and monotonically decreasing in sections 2, 3, and 4 can be permitted.

【0081】この例では、アクセント句を上昇区間、平
坦区間、下降区間、終端区間の4つの区間で表現し、上
昇区間ではピッチ周波数の形状に対する制約は単調増加
であり、平坦区間、下降区間、終端区間では単調減少で
あるパタンを実現することができる。
In this example, the accent phrase is represented by four sections: a rising section, a flat section, a falling section, and a terminating section. In the end section, a pattern that is monotonically decreasing can be realized.

【0082】[0082]

【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
As described above, according to the present invention, the following effects can be obtained.

【0083】本発明の第1の効果は、滑らかで周波数の
あばれの無いピッチパタンが得られるため、これを使っ
て滑らかで自然性が高い合成音声を得ることができる、
ということである。
The first effect of the present invention is that a pitch pattern which is smooth and has no frequency unevenness can be obtained, so that a synthesized speech having high smoothness and naturalness can be obtained by using this.
That's what it means.

【0084】また、本発明の第2の効果は、第1の効果
に加えて、効率よく制約を満たすピッチパタンを計算す
ることができる、ということである。
A second effect of the present invention is that, in addition to the first effect, a pitch pattern satisfying the constraint can be calculated efficiently.

【0085】本発明の第3の効果は、ピッチパタンを手
動でデザインする場合にその作業効率を向上し、また、
ピッチパタンを既存の音声データのピッチ周波数情報を
用いて、自動でデザインする場合にも適用できる、とい
うことである。
The third effect of the present invention is that, when a pitch pattern is manually designed, the work efficiency can be improved.
This means that the present invention can also be applied to a case where a pitch pattern is automatically designed using pitch frequency information of existing audio data.

【0086】本発明の第4の効果は、ピッチパタンを自
動でデザインする場合に簡単な指定で効果を得ることが
でき、操作性を向上するということである。
A fourth effect of the present invention is that when a pitch pattern is automatically designed, the effect can be obtained by a simple designation, and the operability is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施例の構成を示す図である。FIG. 1 is a diagram showing a configuration of a first exemplary embodiment of the present invention.

【図2】本発明の第1の実施例を説明するための図であ
り、入力の各情報と出力されるピッチパタンの例を説明
する図である。
FIG. 2 is a diagram for explaining the first embodiment of the present invention, and is a diagram for explaining examples of input information and an output pitch pattern.

【図3】本発明の第1の実施例を説明するための図であ
り、補助制御点を通過するピッチパタンが生成できるか
否かを決定する方法を説明する図である。
FIG. 3 is a diagram for explaining the first embodiment of the present invention, and is a diagram for explaining a method of determining whether a pitch pattern passing an auxiliary control point can be generated.

【図4】本発明の第1の実施例を説明するための図であ
り、表示部の表示例を示す図である。
FIG. 4 is a diagram for explaining the first embodiment of the present invention, and is a diagram showing a display example of a display unit.

【図5】本発明の第2の実施例の構成を示す図である。FIG. 5 is a diagram showing a configuration of a second exemplary embodiment of the present invention.

【図6】本発明の第2の実施例を説明するための図であ
り、順に制約を満たすピッチパタンを生成する方法を説
明する図である。
FIG. 6 is a diagram for explaining a second embodiment of the present invention, and is a diagram for explaining a method of sequentially generating a pitch pattern satisfying a constraint.

【図7】本発明の第4の実施例の構成を示す図である。FIG. 7 is a diagram showing a configuration of a fourth embodiment of the present invention.

【図8】本発明の第4の実施例を説明するための図であ
り、入力対応表の内容の一例を説明する図である。
FIG. 8 is a diagram for explaining a fourth embodiment of the present invention, and is a diagram for explaining an example of the contents of an input correspondence table.

【符号の説明】[Explanation of symbols]

11 入力部 12 制御点検査部 14 ピッチパタン生成部 17 入力対応表 18 連続推定区間検出部 20 表示部 DESCRIPTION OF SYMBOLS 11 Input part 12 Control point inspection part 14 Pitch pattern generation part 17 Input correspondence table 18 Continuous estimation area detection part 20 Display part

フロントページの続き (56)参考文献 特開 平4−362998(JP,A) 特開 平8−76781(JP,A) 特開 平7−261778(JP,A) 特開 平6−259542(JP,A) 特開 平10−74268(JP,A) 特開 平5−90839(JP,A) 特開 平6−23197(JP,A) 特開 平5−19780(JP,A) 特公 平6−58603(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 13/08 Continuation of front page (56) References JP-A-4-362998 (JP, A) JP-A-8-76781 (JP, A) JP-A-7-261778 (JP, A) JP-A-6-259542 (JP) JP-A-10-74268 (JP, A) JP-A-5-90839 (JP, A) JP-A-6-23197 (JP, A) JP-A-5-19780 (JP, A) 6-58603 (JP, B2) (58) Field surveyed (Int. Cl. 7 , DB name) G10L 13/08

Claims (14)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】音声の規則合成で用いるピッチパタンをあ
らわすスプライン関数を出力するピッチパタン生成装置
であって、 スプライン関数の区間毎に導関数の値の範囲に制約を設
けた上で、隣り合う区間の接続点における関数値および
一次の微係数が区間両側で等しい、所望の点を通るスプ
ライン関数を生成する手段を備えたことを特徴とするピ
ッチパタン生成装置。
1. A pitch pattern generation device for outputting a spline function representing a pitch pattern used in rule synthesis of speech, wherein a range of values of a derivative is set for each section of the spline function and adjacent to each other. A pitch pattern generation device comprising means for generating a spline function passing through a desired point, wherein a function value and a first-order derivative at a connection point of the section are equal on both sides of the section.
【請求項2】音声規則合成装置におけるピッチパタン生
成装置において、 ピッチパタンに関する確定制御点と区間内の補助制御点
との組と、前記制御点で定義される区間の形状に関する
制約情報を入力する入力手段と、 前記入力された制御点の組についてピッチパタン生成が
可能な情報であるかその妥当性を検証する検査手段と、 前記妥当性が検証された確定制御点と補助制御点とを通
過し、区間の形状に関する前記制約を満たすスプライン
関数を生成することでピッチパタンを生成するピッチパ
タン生成手段と、 を備えたことを特徴とするピッチパタン生成装置。
2. A pitch pattern generating device in a speech rule synthesizing device, wherein a set of a fixed control point related to a pitch pattern and an auxiliary control point in a section and constraint information on a shape of a section defined by the control point are input. An input unit, an inspection unit for verifying whether or not the input control point set is information capable of generating a pitch pattern, and passing the fixed control point and the auxiliary control point whose validity has been verified. Pitch pattern generating means for generating a pitch pattern by generating a spline function that satisfies the constraint on the section shape.
【請求項3】前記入力手段から入力された制約情報につ
いて各区間に与えられた制約を調べ、単調増加あるいは
単調減少が連続する区間を検出し、単調増加あるいは単
調減少が連続する区間を一つの連続区間としてまとめる
連続推定区間検出手段を備えたことを特徴とする請求項
2記載のピッチパタン生成装置。
3. Checking the constraint given to each section with respect to the constraint information input from the input means, detecting a section in which monotonic increase or monotonic decrease continues, and identifying a section in which monotonic increase or monotone decrease continues in one section. 3. The pitch pattern generation device according to claim 2, further comprising a continuous estimation section detection unit that combines the continuous sections.
【請求項4】確定制御点の数、平叙文又は疑問文などの
文のタイプ、区間の形状を制約する情報として区間毎の
単調増加/単調減少の情報を含む入力対応表を記憶手段
に記憶保持し、 前記入力手段は、入力された確定制御点の数、及び、各
区間毎の制約情報の代わりに入力された文タイプを指定
する情報から、前記入力対応表を検索し、各区間の制約
情報を決定することを、特徴とする請求項2又は3記載
のピッチパタン生成装置。
4. An input correspondence table including monotonically increasing / monotonically decreasing information for each section as information for restricting the number of fixed control points, the type of a sentence such as a declarative sentence or a question sentence, and the shape of the section. The input means searches the input correspondence table from information specifying the input sentence type instead of the number of input fixed control points and the constraint information for each section, and The pitch pattern generation device according to claim 2, wherein the constraint information is determined.
【請求項5】前記ピッチパタン生成手段が、隣接する区
間の特定の接続点における微係数を決定し、前記微係数
と所望の制御点から前記区間のスプライン関数のパラメ
ータを決定し、前記パラメータから反対側の接続点の微
係数を決定する処理を繰り返すことで、順次、各区間の
スプライン係数のパラメータを決定していく、ことを特
徴とする、請求項1乃至4のいずれか一に記載のピッチ
パタン生成装置。
5. The pitch pattern generation means determines a derivative at a specific connection point of an adjacent section, determines a parameter of a spline function of the section from the derivative and a desired control point, and The method according to any one of claims 1 to 4, wherein a process of determining a differential coefficient of the connection point on the opposite side is repeated to sequentially determine parameters of a spline coefficient of each section. Pitch pattern generator.
【請求項6】前記ピッチパタン生成手段が、所望の制御
点を通るスプライン関数を生成できなかった場合に、前
記所望の制御点の近くをなるべく通るようなスプライン
関数を生成する、ことを特徴とする、請求項1乃至5の
いずれか一に記載のピッチパタン生成装置。
6. When the pitch pattern generation means cannot generate a spline function passing through a desired control point, the pitch pattern generation means generates a spline function passing as close as possible to the desired control point. The pitch pattern generation device according to claim 1, wherein
【請求項7】ピッチパタンを適用する範囲全体を、上昇
区間、平坦区間、下降区間、終端区間の4つの区間で表
現し、上昇区間では導関数の値の範囲は正または零であ
り、平坦区間、下降区間、終端区間では負または零とし
た、ことを特徴とする請求項1乃至6のいずれか一に記
載のピッチパタン生成装置。
7. The entire range to which the pitch pattern is applied is represented by four sections: an ascending section, a flat section, a descending section, and a terminating section. In the ascending section, the value range of the derivative is positive or zero. 7. The pitch pattern generation device according to claim 1, wherein the interval, the descending interval, and the end interval are set to be negative or zero.
【請求項8】ピッチパタンを適用する範囲全体をアクセ
ント句を、上昇区間、平坦区間、下降区間、終端区間、
終端上昇区間の5つの区間で表現し、上昇区間と終端上
昇区間では、導関数の値の範囲は正または零であり、平
坦区間、下降区間、終端区間では負または零である、こ
とを特徴とする、請求項1乃至6のいずれか一に記載の
ピッチパタン生成装置。
8. The entire phrase range to which the pitch pattern is applied is expressed by accent phrases, ascending sections, flat sections, descending sections, end sections,
It is expressed by five sections of the terminal rising section, and the derivative value range is positive or zero in the rising section and the terminal rising section, and is negative or zero in the flat section, the falling section, and the terminal section. The pitch pattern generation device according to any one of claims 1 to 6, wherein
【請求項9】前記ピッチパタン生成手段が、生成された
スプライン関数を規定するパラメータを出力することを
特徴とする、請求項1乃至8のいずれか一に記載のピッ
チパタン生成装置。
9. The pitch pattern generation device according to claim 1, wherein said pitch pattern generation means outputs a parameter defining the generated spline function.
【請求項10】音声の規則合成で用いるピッチパタンを
あらわすスプライン関数を出力するピッチパタン生成方
法であって、 スプライン関数の区間毎に導関数の値の範囲に制約を設
けた上で、隣り合う区間の接続点における関数値および
一次の微係数が区間両側で等しい、所望の点を通るスプ
ライン関数を生成する、ことを特徴とするピッチパタン
生成方法。
10. A pitch pattern generation method for outputting a spline function representing a pitch pattern used in rule synthesis of speech, wherein a range of a derivative value is set for each section of a spline function, and adjacent to each other. A pitch pattern generation method, characterized by generating a spline function passing through a desired point, in which a function value and a first-order derivative at a connection point of the section are equal on both sides of the section.
【請求項11】(a)隣接する区間の特定の接続点にお
ける微係数を決定するステップと、 (b)次に前記微係数と所望の点から前記区間のスプラ
イン関数のパラメータを決定するステップと、 (c)前記パラメータから反対側の接続点の微係数を決
定するステップと、 を繰り返すことで、順次、各区間のスプライン係数のパ
ラメータを決定する、ことを特徴とする、請求項10記
載のピッチパタン生成方法。
(A) determining a differential coefficient at a specific connection point in an adjacent section; and (b) determining a parameter of a spline function of the section from the differential coefficient and a desired point. 11. The method according to claim 10, further comprising: (c) determining a differential coefficient of a connection point on the opposite side from the parameter, thereby sequentially determining parameters of a spline coefficient of each section. Pitch pattern generation method.
【請求項12】所望の点を通るスプライン関数を生成で
きなかった場合に、所望の点の近くをなるべく通るよう
なスプライン関数を生成する、ことを特徴とする、請求
項10乃至11のいずれか一に記載のピッチパタン生成
方法。
12. A spline function which passes as close as possible to a desired point when a spline function passing through the desired point cannot be generated. A pitch pattern generation method according to one of the preceding claims.
【請求項13】ピッチパタンを適用する範囲全体を、上
昇区間、平坦区間、下降区間、終端区間の4つの区間で
表現し、上昇区間では導関数の値の範囲は正または零で
あり、平坦区間、下降区間、終端区間では負または零と
した、ことを特徴とする請求項10乃至12のいずれか
一に記載のピッチパタン生成方法。
13. The entire range to which the pitch pattern is applied is represented by four sections: an ascending section, a flat section, a descending section, and a terminating section. In the ascending section, the derivative value range is positive or zero. 13. The pitch pattern generation method according to claim 10, wherein the interval, the descending interval, and the end interval are set to be negative or zero.
【請求項14】ピッチパタンを適用する範囲全体を、上
昇区間、平坦区間、下降区間、終端区間、終端上昇区間
の5つの区間で表現し、上昇区間と終端上昇区間では、
導関数の値の範囲は正または零であり、平坦区間、下降
区間、終端区間では負または零である、ことを特徴とす
る、請求項10乃至12のいずれか一に記載のピッチパ
タン生成方法。
14. The entire range to which the pitch pattern is applied is represented by five sections of an ascending section, a flat section, a descending section, a terminal section, and a terminal ascending section.
13. The pitch pattern generation method according to claim 10, wherein a value range of the derivative is positive or zero, and is negative or zero in a flat section, a descending section, and a terminal section. .
JP12368699A 1999-04-30 1999-04-30 Apparatus and method for generating pitch pattern for rule synthesis of speech Expired - Fee Related JP3303835B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12368699A JP3303835B2 (en) 1999-04-30 1999-04-30 Apparatus and method for generating pitch pattern for rule synthesis of speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12368699A JP3303835B2 (en) 1999-04-30 1999-04-30 Apparatus and method for generating pitch pattern for rule synthesis of speech

Publications (2)

Publication Number Publication Date
JP2000315092A JP2000315092A (en) 2000-11-14
JP3303835B2 true JP3303835B2 (en) 2002-07-22

Family

ID=14866820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12368699A Expired - Fee Related JP3303835B2 (en) 1999-04-30 1999-04-30 Apparatus and method for generating pitch pattern for rule synthesis of speech

Country Status (1)

Country Link
JP (1) JP3303835B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4639532B2 (en) * 2001-06-05 2011-02-23 日本電気株式会社 Node extractor for natural speech
JP5262464B2 (en) * 2008-09-04 2013-08-14 ヤマハ株式会社 Voice processing apparatus and program
US8386547B2 (en) * 2008-10-31 2013-02-26 Intel Corporation Instruction and logic for performing range detection
JP6261924B2 (en) * 2013-09-17 2018-01-17 株式会社東芝 Prosody editing apparatus, method and program

Also Published As

Publication number Publication date
JP2000315092A (en) 2000-11-14

Similar Documents

Publication Publication Date Title
US8175881B2 (en) Method and apparatus using fused formant parameters to generate synthesized speech
JP2009047957A (en) Pitch pattern generation method and system thereof
JP2010230699A (en) Speech synthesizing device, program and method
Bellegarda et al. Statistical prosodic modeling: from corpus design to parameter estimation
JP2006309162A (en) Pitch pattern generating method and apparatus, and program
JP3303835B2 (en) Apparatus and method for generating pitch pattern for rule synthesis of speech
US5950152A (en) Method of changing a pitch of a VCV phoneme-chain waveform and apparatus of synthesizing a sound from a series of VCV phoneme-chain waveforms
JP2002358090A (en) Speech synthesizing method, speech synthesizer and recording medium
JP2008256942A (en) Data comparison apparatus of speech synthesis database and data comparison method of speech synthesis database
US20140236602A1 (en) Synthesizing Vowels and Consonants of Speech
JPH09319391A (en) Speech synthesizing method
JP3344487B2 (en) Sound fundamental frequency pattern generator
JP4639532B2 (en) Node extractor for natural speech
JP2000010581A (en) Speech synthesizer
JP3310226B2 (en) Voice synthesis method and apparatus
JP5999092B2 (en) Pitch pattern generation method, pitch pattern generation device, speech synthesizer, and pitch pattern generation program
JP2749802B2 (en) Voice synthesis method
JP2013011902A (en) Method for generating speech by processing text by using non-language dependent rhythm markup and device for the same
JP2011191528A (en) Rhythm creation device and rhythm creation method
JP2755478B2 (en) Text-to-speech synthesizer
JPH1097268A (en) Speech synthesizing device
JP2001282273A (en) Device and method for voice information processing and storage medium
JP2000047680A (en) Sound information processor
JP2006084854A (en) Device, method, and program for speech synthesis
JP2001092481A (en) Method for rule speech synthesis

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020402

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090510

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100510

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110510

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110510

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120510

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120510

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130510

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140510

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees