JPH06236197A - Pitch pattern generation device - Google Patents

Pitch pattern generation device

Info

Publication number
JPH06236197A
JPH06236197A JP5180056A JP18005693A JPH06236197A JP H06236197 A JPH06236197 A JP H06236197A JP 5180056 A JP5180056 A JP 5180056A JP 18005693 A JP18005693 A JP 18005693A JP H06236197 A JPH06236197 A JP H06236197A
Authority
JP
Japan
Prior art keywords
pattern
unit
pitch
generation device
pitch pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5180056A
Other languages
Japanese (ja)
Other versions
JP3425996B2 (en
Inventor
Tetsuya Sakayori
哲也 酒寄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP18005693A priority Critical patent/JP3425996B2/en
Publication of JPH06236197A publication Critical patent/JPH06236197A/en
Application granted granted Critical
Publication of JP3425996B2 publication Critical patent/JP3425996B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To attain generating a pitch pattern appliable to a device synthesizing an optional voice like regular synthesis and being natural more than usual. CONSTITUTION:This device is constituted so that a unit pattern cut out from the pitch pattern of human vocalization with a proper unit is stored in a pattern storage part 1, and the unit pattern suited to an input attribute is retrieved from the pattern storage part 1 based on the prescribed input attribute in a pattern retrieval part 2, and the unit pattern obtained by the retrieval is arranged on a time base in a pattern arrangement part 3, and the unit pattern arranged on the time base is deformed and the pitch pattern is generated in a pattern deformation part 4, and since the pitch pattern vocalized by a human is used as it is, the pitch pattern capable of expressing natural change and fluctuation, nuance, etc., being hardly generated with a rule is generated.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、規則音声合成装置など
に用いられ、ピッチ周波数の時間パターン,すなわちピ
ッチパターンを生成するピッチパターン生成装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a pitch pattern generator used for a regular speech synthesizer or the like to generate a time pattern of a pitch frequency, that is, a pitch pattern.

【0002】[0002]

【従来の技術】従来、規則音声合成装置による合成音
は、人間の発声とは明らかに異なる機械的で単調なもの
であり、自然さに欠け、聴く者にとって違和感があっ
た。自然音声に近い合成音を得るため、近年、例えば特
開平2−197897号(以下、従来例1と称す),あ
るいは特開平3−139699号(以下、従来例2と称
す)に示されているような装置が提案されている。
2. Description of the Related Art Conventionally, a synthetic sound produced by a regular speech synthesizer is mechanical and monotonous, which is obviously different from human speech, lacks naturalness, and gives a feeling of strangeness to a listener. In order to obtain a synthetic sound close to natural voice, it has been recently shown in, for example, Japanese Patent Application Laid-Open No. 2-197897 (hereinafter referred to as Conventional Example 1) or Japanese Patent Application Laid-Open No. 3-139996 (hereinafter referred to as Conventional Example 2). Such a device has been proposed.

【0003】すなわち、従来例1には、単語あるいは文
節のアクセント型に応じてピッチ周波数が上昇するモー
ラにおける音素の種類ごとにピッチ周波数の上昇パター
ンを記憶し、また、単語あるいは文節のアクセント型に
応じてピッチ周波数が下降するモーラにおける音素の種
類ごとにピッチ周波数の下降パターンを記憶し、合成す
る単語あるいは文節のアクセント型に応じてピッチ周波
数が上昇するモーラにおける音素の種類に応じて上記記
憶されたピッチ周波数の上昇パターンを読み出し、合成
する単語あるいは文節のアクセント型に応じてピッチ周
波数が下降するモーラにおける音素の種類に応じて上記
記憶されたピッチ周波数の下降パターンを読み出し、読
み出されたピッチ周波数の上昇パターンと読み出された
ピッチ周波数の下降パターンとを接続して単語あるいは
文節全体のピッチパターンを生成するピッチパターン生
成装置が提案されており、この装置では、ピッチ周波数
レベルが変化するモーラにおいて、自然音声のピッチパ
ターンに近いピッチパターンを生成することを意図して
いる。
That is, in the conventional example 1, a pitch frequency increase pattern is stored for each phoneme type in a mora whose pitch frequency increases according to the accent type of a word or a phrase, and the accent pattern of the word or the phrase is stored. The pitch frequency falling pattern is stored for each type of phoneme in the mora whose pitch frequency drops accordingly, and is stored according to the type of phoneme in the mora whose pitch frequency rises according to the accent type of the word or phrase to be synthesized. The pitch frequency rising pattern is read, the pitch frequency falling pattern is read according to the accent type of the word or phrase to be synthesized, and the stored pitch frequency falling pattern is read according to the phoneme type in the mora. Below the rising frequency pattern and the read pitch frequency A pitch pattern generation device has been proposed that connects a pattern to generate a pitch pattern for an entire word or phrase. In this device, a pitch pattern close to that of natural speech is generated in a mora where the pitch frequency level changes. Intended to do.

【0004】また、従来例2には、韻律語を単位として
音声を記憶し、かつピッチパターンが任意に制御できる
音声編集合成器において、各韻律語の記憶時にピッチに
ついてはアクセント成分のみを記憶しておき、文章合成
時にその文章に対応したフレーズ成分を生成するととも
に、該フレーズ成分にアクセント成分を重畳することに
よりピッチパターンを生成する音声編集合成器が提案さ
れており、この音声編集合成器では、文章全体としての
抑揚が自然となるようなピッチパターンを生成すること
を意図している。
Further, in the second conventional example, in a voice editing / synthesizing device in which voices are stored in units of prosodic words and pitch patterns can be arbitrarily controlled, only accent components are stored in pitches when storing each prosodic word. Incidentally, there has been proposed a voice edit synthesizer that generates a pitch component corresponding to the sentence at the time of sentence synthesis and also generates a pitch pattern by superimposing an accent component on the phrase component. , It is intended to generate a pitch pattern in which intonation as a whole sentence becomes natural.

【0005】[0005]

【発明が解決しようとする課題】このように、従来例1
および従来例2に示されているいずれの装置も、自然音
声に近い合成音を得ることを意図している。しかしなが
ら、従来例1のピッチパターン生成装置では、使用する
パターンはアクセント型に応じてピッチが上昇あるいは
下降する部分だけに限られているので、そのほかの部分
の不自然性は解消されない。また、このパターンはピッ
チ周波数が「高」から「低」へ、あるいはその逆のレベ
ルへ変化する位置の音素の種類だけによって分類されて
いるので、同じ音韻で変化する場合にはいつも同じパタ
ーンが使用され単調な音声となり、さらに、周囲の音韻
環境やプロミネンスの有無などが考慮されていないた
め、不自然さが残るという問題があった。
As described above, the conventional example 1
Also, any of the devices shown in Conventional Example 2 is intended to obtain a synthetic sound close to natural speech. However, in the pitch pattern generation device of the first conventional example, the pattern to be used is limited to only the portion where the pitch rises or falls according to the accent type, so the unnaturalness of other portions cannot be eliminated. In addition, since this pattern is classified only by the type of phoneme at the position where the pitch frequency changes from "high" to "low" or vice versa, the same pattern is always used when changing with the same phoneme. There is a problem that unnaturalness remains because it is used as a monotonous voice and the surrounding phonological environment and the presence or absence of prominence are not taken into consideration.

【0006】また、従来例2の装置は、音声編集合成器
に関するものであるので、使用する全ての韻律語に対応
してアクセント成分を記憶している必要があるが、韻律
語は一般に複数の単語や文節の組み合わせからなるた
め、全ての韻律語を網羅して記憶することは現実的に不
可能である。また、文章内の位置,文脈,イントネーシ
ョン,プロミネンス,発話速度などが変化した場合には
そのままでは使用できない。従って、規則合成のような
任意の音声を合成する装置への適用は難かしいという問
題があった。
Further, since the device of the second conventional example relates to the voice edit synthesizer, it is necessary to store the accent components corresponding to all the prosodic words to be used. Since it consists of a combination of words and clauses, it is practically impossible to comprehensively store all prosodic words. In addition, if the position in the sentence, the context, the intonation, the prominence, the speech rate, etc. change, it cannot be used as it is. Therefore, there is a problem that it is difficult to apply it to a device that synthesizes an arbitrary voice such as rule synthesis.

【0007】本発明は、このような問題を解決し、規則
合成のような任意の音声を合成する装置への適用にも適
しており、従来に比べてより自然なピッチパターンを生
成するピッチパターン生成装置を提供することを目的と
している。
The present invention solves such a problem and is also suitable for application to a device for synthesizing an arbitrary voice such as rule synthesizing, and a pitch pattern for generating a more natural pitch pattern than the conventional one. It is intended to provide a generator.

【0008】[0008]

【課題を解決するための手段および作用】上記目的を達
成するために、請求項1記載の発明は、人間の発声のピ
ッチパターンから適当な単位で切り出したユニットパタ
ーンを記憶するパターン記憶手段と、所定の入力属性に
基づき、該入力属性に適合したユニットパターンを検索
するパターン検索手段と、検索により得られたユニット
パターンを時間軸上に配置するパターン配置手段と、時
間軸上に配置されたユニットパターンを変形するパター
ン変形手段とを有している。このように、人間の発声し
たピッチパターンをそのまま使用することによって、規
則による生成では困難な自然な変化やゆらぎ,ニュアン
スなどを表現可能なピッチパターンを生成することがで
きる。
In order to achieve the above-mentioned object, the invention according to claim 1 is a pattern storing means for storing a unit pattern cut out from a pitch pattern of human utterance in appropriate units, A pattern search means for searching a unit pattern matching the input attribute based on a predetermined input attribute, a pattern arranging means for arranging the unit pattern obtained by the search on a time axis, and a unit arranged on the time axis. And a pattern deforming means for deforming the pattern. As described above, by using the pitch pattern uttered by a human as it is, it is possible to generate a pitch pattern capable of expressing a natural change, fluctuation, nuance, etc., which is difficult to generate by the rule.

【0009】また、請求項2記載の発明において、アク
セント句の上昇部と下降部とをそれぞれ1つ含むものを
1つの単位として切り出したものをユニットパターンと
して使用する場合には、ピッチパターンの重要な単位で
あるアクセント句のパターンをほぼ保存したピッチパタ
ーンを生成することができる。また、アクセント句の上
昇部または下降部を1つ含むものをユニットパターンと
して使用する場合には、簡単な接続処理によってピッチ
パターンを生成することができる。また、アクセント句
の平坦部を含むユニットパターンを使用する場合には、
定常部のゆらぎ等を保存でき、自然なピッチパターンを
生成することができる。また、フレーズ末の特徴的ピッ
チ変化をユニットパターンとして使用する場合には、規
則による生成では困難な多彩なイントネーションを表現
することできる。また、特定の範囲のピッチ変化率を示
すパターンをユニットパターンとして使用する場合に
は、変化部分の概形や定常部分のゆらぎ等を保存するこ
とができ、規則による生成では困難であった多彩で自然
なピッチパターンを生成することができる。また、特定
の範囲のピッチ曲率を示すパターンをユニットパターン
として使用する場合には、その他の部分を直線で補間で
きるため、処理量を低減することができる。
In the invention according to claim 2, the pitch pattern is important when a unit pattern including one ascending part and one descending part of an accent phrase is cut out and used as a unit pattern. It is possible to generate a pitch pattern in which patterns of accent phrases, which are various units, are almost preserved. When a unit pattern including one ascending part or one descending part of an accent phrase is used as a unit pattern, a pitch pattern can be generated by a simple connection process. Also, when using a unit pattern that includes the flat part of the accent phrase,
It is possible to save fluctuations in the stationary part and generate a natural pitch pattern. Also, when the characteristic pitch change at the end of the phrase is used as a unit pattern, various intonations that are difficult to generate with rules can be expressed. In addition, when a pattern showing the pitch change rate in a specific range is used as a unit pattern, it is possible to store the outline of the changing part and the fluctuation of the steady part, which is difficult to generate with rules. A natural pitch pattern can be generated. Further, when a pattern showing a pitch curvature in a specific range is used as a unit pattern, the other portion can be interpolated by a straight line, so that the processing amount can be reduced.

【0010】また、請求項3記載の発明において、ベク
トル量子化されたユニットパターンを記憶し、これを使
用するときには、パターン記憶手段の容量を大幅に削減
することができ、装置の低コスト化,小型化,処理の高
速化を図ることができる。
According to the third aspect of the present invention, when the vector quantized unit pattern is stored and used, the capacity of the pattern storage means can be greatly reduced, and the cost of the device can be reduced. It is possible to reduce the size and increase the processing speed.

【0011】また、請求項4記載の発明において、ピッ
チ変化部分近傍の複数モーラにわたる音韻環境からユニ
ットパターンを検索する場合には、音韻環境によるパタ
ーンの局所的変化の再現性が向上し、より緻密なピッチ
パターンを生成することができる。また、プロミネンス
の情報からユニットパターンを検索する場合には、従来
単調になりがちだった合成音声の抑揚にめりはりがつ
き、了解性,自然性を向上させることができる。また、
イントネーションスタイルからユニットパターンを検索
する場合には、規則による生成では表現が困難なイント
ネーションを正確に再現することができる。
Further, in the invention according to claim 4, when a unit pattern is searched from a phonological environment over a plurality of moras in the vicinity of a pitch change portion, the reproducibility of the local change of the pattern due to the phonological environment is improved, and the unit pattern is more precise. It is possible to generate various pitch patterns. Further, when a unit pattern is searched for from prominence information, inflection of synthetic speech, which has been apt to be monotonous in the past, is conspicuous, and intelligibility and naturalness can be improved. Also,
When searching for a unit pattern from an intonation style, it is possible to accurately reproduce an intonation that is difficult to express by rule generation.

【0012】また、請求項5記載の発明は、ニューラル
ネットワークによってユニットパターンを検索するよう
になっており、これにより、学習した人間の発声パター
ンに近いパターンを再現することができ、自然性を向上
させることができる。
Further, according to the invention of claim 5, a unit pattern is searched by a neural network, whereby a pattern close to the learned human utterance pattern can be reproduced and the naturalness is improved. Can be made.

【0013】また、請求項6記載の発明において、パタ
ーン配置手段により、アクセント句境界の位置を用いて
ユニットパターンを配置する場合には、アクセント句の
上昇開始点をほぼ再現でき、了解性を向上させることが
できる。また、アクセント核の位置を用いてユニットパ
ターンを配置する場合には、アクセント句の下降開始点
をほぼ再現でき、了解性を向上させることができる。ま
た、フレーズ末の音韻,音節,モーラなどの境界位置を
用いてユニットパターンを配置する場合には、イントネ
ーションを効果的に表現でき、自然性を向上させること
ができる。また、ピッチ変化部分近傍音韻環境情報を用
いてユニットパターンを配置することにより、ピッチパ
ターンの時間構造をより緻密に再現でき、自然性を向上
させることができる。
In the invention according to claim 6, when the unit pattern is arranged by the position of the accent phrase boundary by the pattern arranging means, the rising start point of the accent phrase can be almost reproduced and the intelligibility is improved. Can be made. Further, when the unit pattern is arranged by using the position of the accent nucleus, the descent start point of the accent phrase can be almost reproduced, and the intelligibility can be improved. Further, when the unit pattern is arranged by using the boundary position such as the phoneme, syllable, or mora at the end of the phrase, the intonation can be effectively expressed and the naturalness can be improved. Further, by arranging the unit patterns using the phonological environment information in the vicinity of the pitch change portion, the time structure of the pitch pattern can be reproduced more precisely and the naturalness can be improved.

【0014】また、請求項7記載の発明では、パタ−ン
変形手段は、アクセント句の平坦部を時間軸方向に伸縮
するようにしており、ピッチ変化部については時間軸方
向に変形しないことにより、ピッチ変化部の時間構造を
保存することができ、安定した自然なピッチパターンを
生成することができる。また、アクセント句の上昇部と
下降部をピッチ軸方向の変形をするようにしており、平
坦部についてはピッチ軸方向に変形しないことにより、
ピッチ定常部部の高さやゆらぎ等を保存することがで
き、プロミネンスなども含めたパターン表現が可能とな
り自然性を向上させることができる。
In the invention according to claim 7, the pattern deforming means is adapted to expand and contract the flat part of the accent phrase in the time axis direction, and the pitch changing part is not deformed in the time axis direction. The time structure of the pitch changing portion can be preserved, and a stable and natural pitch pattern can be generated. Moreover, the rising part and the descending part of the accent phrase are deformed in the pitch axis direction, and the flat part is not deformed in the pitch axis direction.
The height, fluctuation, etc. of the constant pitch portion can be preserved, and the pattern expression including prominence etc. can be realized and the naturalness can be improved.

【0015】また、請求項8,9記載の発明では、パタ
−ン変形手段によって変形されたユニットパターンを接
続して一連のフレーズのパターンを生成するパターン接
続手段がさらに設けられており、パターン接続手段にお
いて、ユニットパターン間を直線で補間する場合には、
処理量を低減できて、高速化や低コスト化を図ることが
でき、また、ユニットパターン間を3次曲線で補間する
場合には、人間のピッチ変化に似た概形を表現でき、自
然なピッチパターンを生成することができる。
Further, in the invention described in claims 8 and 9, pattern connecting means for connecting the unit patterns transformed by the pattern transforming means to generate a series of phrase patterns is further provided. In the method, when interpolating between unit patterns with a straight line,
The amount of processing can be reduced, speeding up and cost reduction can be achieved, and when interpolating between unit patterns with a cubic curve, an approximate shape similar to a human pitch change can be expressed, which is natural. A pitch pattern can be generated.

【0016】また、請求項10乃至16記載の発明で
は、パターン記憶手段に記憶されるユニットパターンと
して、特定の言語的状況において特徴的に現われるピッ
チパターンが用いられることを特徴としている。これに
より、規則音声合成の入力情報である言語情報から、ヒ
ューリスティックにパターンを検索することができ、効
率的で効果的なピッチパターン生成を実現することがで
きる。
The invention according to claims 10 to 16 is characterized in that a pitch pattern characteristically appearing in a specific linguistic situation is used as the unit pattern stored in the pattern storage means. As a result, it is possible to heuristically search for a pattern from linguistic information that is input information for regular speech synthesis, and it is possible to realize efficient and effective pitch pattern generation.

【0017】また、請求項17,請求項18記載の発明
では、パターン記憶手段には、折れ線近似されたユニッ
トパターンが記憶されるようになっており、この際、折
れ線近似されたユニットパターンは、始点のピッチおよ
び各折れ線のそれぞれの区間と折れ線の傾きとの表現デ
ータによって表現されてパターン記憶手段に記憶される
ことにより、ユニットパタ−ンのデ−タ量を減らし、メ
モリ量と処理量を軽減でき、低コスト化,高速化を図る
ことができる。さらに、ユニットパタ−ンのピッチ方向
のシフトは始点ピッチの増減のみで、時間方向の伸縮は
区間長の増減によって、それぞれ簡単に実現可能で、ユ
ニットパタ−ンの変形が簡単な処理によって実現できる
ため、高速化,高機能化を図ることができる。
Further, in the seventeenth and eighteenth aspects of the invention, the unit pattern approximated to the broken line is stored in the pattern storage means. At this time, the unit pattern approximated to the broken line is: The data amount of the unit pattern is reduced by being expressed by the expression data of the pitch of the starting point and each section of each polygonal line and the inclination of the polygonal line and stored in the pattern storage means, thereby reducing the memory amount and the processing amount. It is possible to reduce the cost, reduce the cost, and increase the speed. Furthermore, the unit pattern can be shifted in the pitch direction only by increasing or decreasing the starting point pitch, and the expansion and contraction in the time direction can be easily realized by increasing or decreasing the section length, and the unit pattern can be deformed by a simple process. Therefore, high speed and high functionality can be achieved.

【0018】また、請求項19記載の発明では、上記各
折れ線の傾きは、ピッチ周期が単位長だけ変化するのに
要する時間としてのステップ値によって表現されてお
り、この場合、パターン検索手段は、パターン記憶手段
に記憶されているユニットパターンの表現データを検索
し、該表現データに基づきユニットパターンを再生する
ときに、ステップ値が正の値の場合、ピッチ周期を単位
長増加させ、ステップ値が負の値の場合、ピッチ周期を
単位長減少させる処理を行なうようになっている。これ
により、カウンタ,比較器などによる非常に簡単な構成
で折れ線近似のユニットパタ−ンを再生し、実際のピッ
チパタ−ンを得ることができる。
According to the nineteenth aspect of the invention, the slope of each of the polygonal lines is expressed by a step value as a time required for the pitch period to change by a unit length. In this case, the pattern searching means When the expression data of the unit pattern stored in the pattern storage means is searched and the unit pattern is reproduced based on the expression data, if the step value is a positive value, the pitch period is increased by a unit length and the step value is When the value is negative, the pitch period is reduced by a unit length. As a result, it is possible to reproduce the unit pattern approximated to the broken line and obtain the actual pitch pattern with a very simple structure such as a counter and a comparator.

【0019】また、請求項20記載の発明では、パター
ン変形手段は、各折れ線の傾きを表わすステップ値に一
定のバイアスを加えることによって、ユニットパターン
にピッチ方向の滑らかな変形を施こす。これにより、ユ
ニットパタ−ン間の接続やプロミネンス付与などで必要
となるパタ−ン変形処理が加算器だけの非常に簡単な構
成で実現できる。
According to the twentieth aspect of the invention, the pattern deforming means applies a constant bias to the step value representing the inclination of each polygonal line to smoothly deform the unit pattern in the pitch direction. As a result, the pattern modification processing required for connection between unit patterns and provision of prominence can be realized with a very simple configuration of only the adder.

【0020】また、請求項21記載の発明では、パター
ン変形手段は、ステップ値を“2”の補数表現によって
扱い、バイアスを加えた結果のステップ値の絶対値が最
大値を越えた場合に、これを反対符号の最大絶対値とす
る。これにより、右上がりのパタ−ンから右下がりのパ
タ−ンへ、またはその逆へ、連続的にかつ無理なく、パ
タ−ン変形する処理を簡単に実現することができる。
In the twenty-first aspect of the invention, the pattern transforming means treats the step value by the complement notation of "2", and when the absolute value of the step value as a result of applying the bias exceeds the maximum value, This is the maximum absolute value of the opposite sign. As a result, it is possible to easily and continuously perform the pattern transformation process from the upward-sloping pattern to the downward-sloping pattern, or vice versa.

【0021】また、請求項22記載の発明では、ピッチ
変化量とバイアスとの対応関係が予め求められている場
合に、パターン変形手段は、該対応関係を用いてユニッ
トパターンのピッチ方向の変形を行なう。これにより、
ユニットパタ−ン間の接続やプロミネンス付与などで必
要となるバイアスを、処理量の多い乗除算を必要とする
ことなく、極めて容易に求めることができ、処理の高速
化を図ることができる。
According to the twenty-second aspect of the invention, when the correspondence between the pitch change amount and the bias is obtained in advance, the pattern deforming means uses the correspondence to deform the unit pattern in the pitch direction. To do. This allows
Bias required for connection between unit patterns and provision of prominence can be obtained very easily without requiring multiplication and division with a large amount of processing, and the processing speed can be increased.

【0022】また、請求項23記載の発明では、さら
に、パターン記憶手段に記憶されているユニットパター
ンと対応付けされて、条件を含むルールが記憶されるル
ール記憶手段が設けられており、パターン検索手段は、
モーラなどの入力言語情報単位ごとにルール記憶手段に
記憶されているルールの条件を調べることによって、ル
ールの条件を満たすユニットパターンをパターン記憶手
段から検索するようになっている。ユニットパタ−ン検
索処理をル−ル検索とすることによって、ユニットパタ
−ンの追加,削除,変更などのメンテナンスが容易とな
る。
Further, in the invention of claim 23, there is further provided a rule storage means for storing a rule including a condition in association with a unit pattern stored in the pattern storage means, and pattern search is performed. The means is
By checking the condition of the rule stored in the rule storage means for each input language information unit such as mora, a unit pattern satisfying the rule is retrieved from the pattern storage means. By making the unit pattern search process a rule search, maintenance such as addition, deletion, and change of the unit pattern becomes easy.

【0023】また、請求項24記載の発明では、ルール
の条件には、言語情報単位の特徴を表わす複数の変数の
値の範囲が含まれており、パターン検索手段は、ルール
の条件に含まれる全ての変数について、入力言語情報単
位の値がその範囲内にあるとき当該ルールを採用するこ
とによって、ユニットパターンを検索するようになって
いる。ル−ルの条件に言語情報単位の特徴を表わす複数
の変数の値の範囲を含ませることで、ル−ル検索をル−
チン処理で行なうことができる。また、ル−ルを外部デ
−タ化することが容易となり、ル−ル自体の保守性を高
めることができる。
According to the twenty-fourth aspect of the present invention, the rule condition includes a range of values of a plurality of variables representing the characteristics of the linguistic information unit, and the pattern search means is included in the rule condition. For all variables, when the value of the input linguistic information unit is within the range, the rule is adopted to search the unit pattern. By including the range of the values of a plurality of variables representing the characteristics of the linguistic information unit in the rule condition, the rule search is performed.
It can be done by chin treatment. Further, it becomes easy to convert the rule into external data, and the maintainability of the rule itself can be improved.

【0024】また、請求項25記載の発明では、ルール
の条件に含まれる変数として、当該言語情報単位の句頭
あるいは句末からの位置を用いるか、または、当該言語
情報単位を含む句の隣接句との境界種別を用いるか、ま
たは、当該言語情報単位を含む句のアクセント情報を用
いるか、または、当該言語情報単位の音韻情報を用いる
ようになっており、ル−ルの条件に含まれる変数とし
て、言語情報単位の句頭あるいは句末からの位置を用い
ることによって、句頭から句末へ向かって徐々に下降す
るなど、句内位置によって連続的に変化するピッチパタ
−ンの性質を表現することが可能となる。また、言語情
報単位を含む句の隣接句との境界種別を用いることによ
って、読点位置よりも文末を特に下げることによる文の
終始感の演出や、疑問文等の様々なイントネ−ションス
タイルへの対応など、句境界位置でのピッチパタ−ンの
特徴を表現することが可能となる。また、言語情報単位
を含む句のアクセント情報を用いることによって、頭高
型が中高型よりも左に傾いた山になるなどのアクセント
型による特徴や、プロミネンス,副次アクセント等のア
クセントレベルによる特徴など、ピッチパタ−ンの特徴
を表現することが可能となる。また、言語情報単位の音
韻情報を用いることによって、特定の音韻で見られる局
所的なピッチパタ−ンの特徴や、音韻継続時間長の影響
などを表現することが可能となる。
According to the twenty-fifth aspect of the invention, the position from the beginning or end of the phrase of the linguistic information unit is used as the variable included in the condition of the rule, or the phrase containing the linguistic information unit is adjacent to the phrase. A boundary type with a phrase is used, accent information of a phrase including the linguistic information unit is used, or phonological information of the linguistic information unit is used, which is included in the rule condition. By using the position from the beginning or end of the linguistic information unit as a variable, express the property of the pitch pattern that changes continuously depending on the position within the phrase, such as gradually descending from the beginning to the end of the phrase. It becomes possible to do. In addition, by using the boundary type of the phrase including the linguistic information unit with the adjacent phrase, it is possible to produce a feeling of beginning and end of the sentence by lowering the end of the sentence more than the reading point position, and to various intonation styles such as question sentences. It becomes possible to express the characteristics of the pitch pattern at the phrase boundary position such as correspondence. Also, by using accent information of phrases including linguistic information units, accent type features such as head height becoming a mountain tilted to the left rather than middle height type, and features depending on accent level such as prominence and secondary accent. It becomes possible to express the characteristics of the pitch pattern. Further, by using the phoneme information in units of linguistic information, it is possible to represent the characteristics of the local pitch pattern seen in a specific phoneme, the influence of the phoneme duration, and the like.

【0025】また、請求項26記載の発明では、1つの
ルールに複数のユニットパターンが対応付けされてお
り、ルールの条件を満たすユニットパターンが複数検索
される場合に、ゆれを与えて1つのユニットパターンを
選択するようになっている。これにより、画一的で機械
的なピッチパタ−ンを避けることが可能となり、より自
然なピッチパターンを得ることができる。
According to the twenty-sixth aspect of the present invention, one rule is associated with a plurality of unit patterns, and when a plurality of unit patterns satisfying the rule are searched for, a unit is given a fluctuation. It is designed to select a pattern. As a result, it is possible to avoid a uniform and mechanical pitch pattern and obtain a more natural pitch pattern.

【0026】[0026]

【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明に係るピッチパターン生成装置の一
実施例のブロック図である。本実施例のピッチパターン
生成装置は、自然音声のピッチパターンから所定の単位
で切り出したユニットパターンが記憶されるパターン記
憶部1と、所定の入力属性に基づき、該入力属性に適合
したユニットパターンを検索するパターン検索部2と、
検索により得られたユニットパターンを時間軸上に配置
するパターン配置部3と、時間軸上に配置されたユニッ
トパターンを変形するパターン変形部4と、変形された
ユニットパターンを接続して一連のフレーズのパターン
を生成するパターン接続部5とを有している。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram of an embodiment of a pitch pattern generation device according to the present invention. The pitch pattern generation device according to the present embodiment stores a pattern storage unit 1 in which a unit pattern cut out in a predetermined unit from a pitch pattern of natural voice is stored, and a unit pattern conforming to the input attribute based on a predetermined input attribute. A pattern search unit 2 for searching,
A pattern arranging unit 3 for arranging the unit pattern obtained by the search on the time axis, a pattern deforming unit 4 for deforming the unit pattern arranged on the time axis, and a series of phrases by connecting the deformed unit pattern. And a pattern connection unit 5 for generating the pattern.

【0027】ここで、パターン記憶部1に記憶されるユ
ニットパターンは、自然音声(すなわち人間の発声)の
ピッチパターンから図2,図3,図4または図5に示す
ような仕方で、切り出しがなされる。すなわち、図2で
は、文発声されたピッチパターンPPのアクセント句A
Kの上昇部AUの始点から平坦部AFを経て下降部AD
の終点までを単位DM0としてユニットパターンUNP
の切り出しを行なうようになっている。また、図3で
は、文発声されたピッチパターンPPのアクセント句A
Kの上昇部AUの始点からそれに続く平坦部AFの終点
までと、下降部ADの始点からそれに続く平坦部AFの
終点までとを、それぞれ単位DM1,DM2として、ユニ
ットパターンUNPの切り出しを行なうようになってい
る。また、図4では、平坦部AFだけを単位DM3とし
て、ユニットパターンUNPの切り出しを行なうように
なっている。また、図5では、文末のイントネーション
を表現するような特徴のあるピッチ変化部分を単位DM
4としてユニットパターンUNPの切り出しを行なうよ
うになっている。なお、図2乃至図5において、アクセ
ント句の平坦部AFとは、ピッチの上昇部AUの終点か
ら下降部ADの始点までの山の部分と、その反対の谷の
部分との両方を指している。また、図2乃至図5に示し
たような切り出しは、アクセント核位置などの属性情報
との関連においてなされるが、この他にも、図示しない
が、特定の範囲のピッチ変化率を示すピッチパターン区
間を単位としてユニットパターンを切り出しても良い
し、ある特定の範囲の曲率を示すピッチパターン区間を
単位としてユニットパターンを切り出しても良い。
Here, the unit pattern stored in the pattern storage unit 1 is cut out from a pitch pattern of natural voice (that is, a human voice) in a manner as shown in FIG. 2, FIG. 3, FIG. 4 or FIG. Done. That is, in FIG. 2, the accent phrase A of the pitched pattern PP which is uttered by the sentence
From the starting point of the rising part AU of K, through the flat part AF, to the descending part AD
Unit pattern UNP with the unit DM 0 up to the end point of
It is designed to cut out. In addition, in FIG. 3, the accent phrase A of the pitch pattern PP that is uttered is uttered.
The unit pattern UNP is cut out from the start point of the rising portion AU of K to the end point of the subsequent flat portion AF and from the start point of the falling portion AD to the end point of the following flat portion AF as units DM 1 and DM 2 , respectively. I am supposed to do it. Further, in FIG. 4, the unit pattern UNP is cut out using only the flat portion AF as the unit DM 3 . Further, in FIG. 5, the pitch change portion having a characteristic that expresses the intonation at the end of the sentence is represented by the unit DM.
As 4 , the unit pattern UNP is cut out. 2 to 5, the flat portion AF of the accent phrase refers to both the peak portion from the end point of the pitch rising portion AU to the start point of the falling portion AD and the opposite valley portion. There is. The cutouts shown in FIGS. 2 to 5 are made in relation to attribute information such as the accent nucleus position, but in addition to this, although not shown, a pitch pattern showing a pitch change rate in a specific range. The unit pattern may be cut out in units of sections, or the unit pattern may be cut out in units of pitch pattern sections showing a curvature in a specific range.

【0028】このようにして、パターン記憶部1には、
上記いずれか1つの仕方によって文音声から切り出され
た種々のユニットパターンが記憶されているか、あるい
はこれらのユニットパターンを予め作成したコードブッ
ク等によってベクトル量子化したユニットパターンがデ
ータベース化して記憶されている。
In this way, the pattern storage unit 1 stores
Various unit patterns cut out from sentence speech by any one of the above methods are stored, or unit patterns obtained by vector-quantizing these unit patterns by a codebook created in advance are stored as a database. .

【0029】また、パターン検索部2は、所定の入力属
性に適合したユニットパターンをパターン記憶部1から
検索するが、この検索の仕方としては、パターン記憶部
1内に記憶されている各ユニットパターンに、これを切
り出したときの属性情報を付加しておき、入力属性に最
も類似する属性情報をもつユニットパターンを選ぶとい
う方法が考えられる。さらに、ユニットパターン切り出
しの際に、予め作成したコードブックによってユニット
パターンがベクトル量子化されてパターン記憶部1に記
憶されている場合には、ベクトル量子化されたユニット
パターンのコードを出力としまたそのときの属性を入力
とするような教師データによって学習させたニューラル
ネットワークに、所定の入力属性を入力してユニットパ
ターンを検索する方法も考えられる。
Further, the pattern search unit 2 searches the pattern storage unit 1 for a unit pattern matching a predetermined input attribute. As a method of this search, each unit pattern stored in the pattern storage unit 1 is searched. In addition, it is possible to add the attribute information when this is cut out and select the unit pattern having the attribute information most similar to the input attribute. Further, when the unit pattern is cut out and the unit pattern is vector-quantized by the code book created in advance and stored in the pattern storage unit 1, the code of the vector-quantized unit pattern is output and A method of searching for a unit pattern by inputting a predetermined input attribute to a neural network trained by teacher data in which the attribute of time is input can be considered.

【0030】また、パターン検索部2において用いられ
る所定の入力属性とは、規則合成器に与えられるような
入力情報のうち、ピッチパターンに影響を与えると考え
られる情報であり、代表的なものとしてアクセント型な
どがあるが、この他に本実施例では以下の情報も入力属
性に加える。すなわち、従来から、ピッチが変化する前
後の近傍の音韻の種類がピッチの局所的変化をもたらす
ことが知られており、この情報をパターン検索に用いる
ことが有効と考えられ、これを入力属性に加える。ま
た、従来から、プロミネンスが付加された箇所はアクセ
ントの高さなどに変化を生ずることが知られているた
め、この情報をパターン検索に用いることが有効と考え
られ、これを入力属性に加える。また、図5に示したよ
うなパターンを選択する場合には、フレーズのイントネ
ーションスタイルの情報が必要であり、この情報をパタ
ーン検索に用いることが有効と考えられ、これを入力属
性に加える。
The predetermined input attribute used in the pattern search section 2 is information that is considered to affect the pitch pattern among the input information given to the rule synthesizer, and is a typical one. Although there are accent types and the like, the following information is also added to the input attributes in this embodiment. That is, conventionally, it has been known that the types of phonemes in the vicinity before and after the pitch change causes a local change in pitch, and it is considered effective to use this information for pattern search. Add. Further, conventionally, it has been known that the position where prominence is added changes in the height of accent and the like, so it is considered effective to use this information for pattern retrieval, and this is added to the input attribute. Further, when selecting a pattern as shown in FIG. 5, information on the intonation style of the phrase is necessary, and it is considered effective to use this information for the pattern search, and this is added to the input attribute.

【0031】また、パターン配置部3は、アクセント句
境界の時間軸上の位置を入力情報として、あるいは、ア
クセント核の時間軸上の位置を入力情報として、あるい
は、フレーズ末の音韻,音節,モーラなどの境界の時間
軸上の位置を入力情報として、あるいは、ピッチ変化部
分近傍の音韻環境情報を入力情報としてユニットパター
ン時間軸上の位置を決定するようになっている。
Further, the pattern arranging unit 3 uses the position of the accent phrase boundary on the time axis as input information, or the position of the accent nucleus on the time axis as input information, or the phoneme, syllable, or mora at the end of the phrase. The position on the time axis of the unit pattern is determined by using the position on the time axis of the boundary such as or the like as input information or the phoneme environment information in the vicinity of the pitch change portion as input information.

【0032】また、パターン変形部4は、各ユニットパ
ターンの終点を次のユニットパターンの始点に一致させ
るように、使用されたユニットパターンの種類等に応
じ、アクセント句内の上昇部AU,平坦部AF,下降部
ADのいずれか1つあるいは2つあるいは全てを、時間
軸方向および/またはピッチ軸方向に伸縮するような変
形を行なうようになっている。
Further, the pattern transformation unit 4 matches the end point of each unit pattern with the start point of the next unit pattern, according to the type of the unit pattern used, etc., the rising portion AU and the flat portion in the accent phrase. Any one or two or all of the AF and the descending part AD are deformed so as to expand and contract in the time axis direction and / or the pitch axis direction.

【0033】また、パターン接続部5は、使用されたユ
ニットパターンの種類等に応じ、ユニットパターン間を
直線で、あるいは3次曲線で補間して接続するようにな
っている。
The pattern connecting section 5 is adapted to interpolate and connect the unit patterns by a straight line or a cubic curve according to the type of the unit pattern used.

【0034】次に、このような構成のピッチパターン生
成装置の動作について説明する。先づ、人間の発声から
ユニットパターンを切り出して、これを予めパターン記
憶部1に記憶する。ユニットパターンの切り出しは、前
述したように、例えば図2,図3,図4または図5に示
したような方法によって行なうことができる。
Next, the operation of the pitch pattern generator having such a configuration will be described. First, a unit pattern is cut out from a human voice and stored in the pattern storage unit 1 in advance. The unit pattern can be cut out as described above, for example, by the method shown in FIG. 2, FIG. 3, FIG. 4 or FIG.

【0035】すなわち、図2のような方法が用いられる
場合、アクセント句の上昇部の始点から平坦部を経て下
降部の終点までを単位としてユニットパターンを切り出
すことができる。なお、これに類するものとして、アク
セント句をそのまま単位として切り出すことも考えら
れ、この場合にも図2と同様に、アクセント句のパター
ンをほぼそのまま記憶しておくことができるが、図2に
示した仕方ではこれに比べて、同アクセント型の異なる
モーラ数の句を同列に扱えるという利点がある。
That is, when the method shown in FIG. 2 is used, a unit pattern can be cut out from the starting point of the rising portion of the accent phrase to the ending point of the falling portion through the flat portion as a unit. As a similar type, it is possible to cut out the accent phrase as a unit as it is, and in this case as well, the pattern of the accent phrase can be stored almost as it is, as shown in FIG. Compared to this, the method has the advantage that phrases with different mora numbers with the same accent type can be treated in the same row.

【0036】また、図3のような方法が用いられる場
合、アクセント句の上昇部の始点からそれに続く平坦部
の終点までと、下降部の始点からそれに続く平坦部の終
点までをそれぞれ単位としてユニットパターンを切り出
すことができる。なお、これに類するものとして上昇
部,下降部のみを単位として切り出すことも考えられ、
この場合にもユニットパターンの始点の位置を決定する
だけで、ユニットパターンをほぼ配置することができる
が、図3に示した仕方はこれに比べて、パターン間接続
の際の補間によって生じる自然性劣化を低減できるとい
う利点がある。
When the method as shown in FIG. 3 is used, the unit from the start point of the ascending part of the accent phrase to the end point of the following flat part and from the start point of the descending part to the end point of the following flat part are units. The pattern can be cut out. It is also possible to cut out only the ascending part and the descending part as a unit similar to this,
In this case as well, the unit patterns can be arranged substantially only by deciding the position of the starting point of the unit pattern. However, the method shown in FIG. 3 is more natural than the method shown in FIG. There is an advantage that deterioration can be reduced.

【0037】また、図4のような仕方が用いられる場
合、平坦部だけを単位としてユニットパターンを切り出
すことができる。文献「“基本周期のゆらぎの性質とそ
のモデルに関する検討”,小室修,粕谷英樹,日本音響
学会誌, Vol.47,No.12, pp.928-934, 1991」には、定常
母音部分での遅いゆらぎが自然性に影響を与えると報告
されており、図4の方法によって切り出しを行なえば、
このような聴覚上重要なゆらぎを保存することができ
る。
When the method shown in FIG. 4 is used, the unit pattern can be cut out by using only the flat portion as a unit. In the document "Study on fluctuations of fundamental period and its model", Omuro Omuro, Hideki Kasuya, Journal of Acoustical Society of Japan, Vol.47, No.12, pp.928-934, 1991, it describes a part of stationary vowels. It has been reported that the slow fluctuation of the slab affects the naturalness, and if the method of FIG.
Such perceptually important fluctuations can be preserved.

【0038】また、図5のような仕方が用いられる場
合、文末のイントネーションを表現するような、特徴あ
るピッチ変化部分を単位をしてユニットパターンを切り
出すことができる。なお、図5では、疑問を表わす尻上
がりのパターンの例が示されている。図5の方法によれ
ば文末のイントネーションのパターンをそのまま記憶で
きるため、規則では表現が困難な微妙なニュアンスの違
いも表現が可能になる。
When the method shown in FIG. 5 is used, a unit pattern can be cut out in units of characteristic pitch change portions that represent intonation at the end of a sentence. It should be noted that FIG. 5 shows an example of a rising pattern indicating a question. According to the method of FIG. 5, since the intonation pattern at the end of a sentence can be stored as it is, it is possible to express a subtle difference in nuance that is difficult to express by rules.

【0039】図2乃至図5の例では、アクセント核位置
などの属性情報との関連において切り出されたユニット
パターンを使用することを前提としたが、この他に、特
定の範囲のピッチ変化率や曲率をもつパターンを自動的
に切り出したユニットパターンを使用する方法も考えら
れる。前者はピッチが変化する部分をパターンとして記
憶することによってその外形を保存できることや、定常
部をパターンとして記憶することによってゆらぎを保存
できるという利点がある。また、後者では曲線状の部分
をパターンとして記憶することによって、その他の部分
を直線で補間できるため、処理量を低減することができ
る。図2乃至図5あるいはその他の方法によって切り出
されたユニットパターンは、これをそのままパターン記
憶部1に記憶しても良いし、あるいは、ベクトル量子化
などを行なってコード化してパターン記憶部1に記憶し
ても良い。
In the examples of FIGS. 2 to 5, it is premised that the unit pattern cut out in relation to the attribute information such as the accent nucleus position is used, but in addition to this, the pitch change rate in a specific range or It is also possible to use a unit pattern in which a pattern having a curvature is automatically cut out. The former has the advantage that the contour can be saved by storing the part where the pitch changes as a pattern, and the fluctuation can be saved by storing the stationary part as a pattern. Further, in the latter case, the curved portion is stored as a pattern, and the other portion can be interpolated by a straight line, so that the processing amount can be reduced. The unit pattern cut out by the method shown in FIGS. 2 to 5 or any other method may be stored as it is in the pattern storage unit 1, or may be coded by performing vector quantization or the like and stored in the pattern storage unit 1. You may.

【0040】このようにして、パターン記憶部1にユニ
ットパターンを記憶した後、実際のピッチパターン生成
処理を開始させることができる。このピッチパターン生
成処理では、先づ、パターン検索部2に所定の入力属性
を与え、この入力属性に適するユニットパターンをパタ
ーン記憶部1から検索させる。ここで、本実施例では、
入力属性には、代表的なアクセント型などの他に、ピッ
チが変化する前後の近傍の音韻の種類の情報,プロミネ
ンスの情報,フレーズのイントネーションスタイルの情
報のうちの少なくとも1つの情報が付加されている。こ
のような入力属性の種々の情報のうち、ピッチ変化部分
近傍の複数モーラにわたる音韻環境を用いユニットパタ
ーンを検索する場合には、音韻環境によるパターンの局
所的変化の再現性が向上し、より緻密なパターン生成が
可能になる。また、プロミネンスの情報を用いユニット
パターンを検索する場合には、従来単調になりがちだっ
た合成音声の抑揚にめりはりがつき、了解性,自然性を
向上させることができる。また、イントネーションスタ
イルを用いユニットパターンを検索する場合には、規則
による生成では表現が困難なイントネーションを正確に
再現することが可能となる。また、ニューラルネットワ
ークによってユニットパターンを検索することによっ
て、学習した人間の発声パターンに近いパターンを再現
することができ、自然性を向上させることができる。
In this way, after storing the unit pattern in the pattern storage unit 1, the actual pitch pattern generation process can be started. In this pitch pattern generation processing, a predetermined input attribute is first given to the pattern search unit 2 and a unit pattern suitable for this input attribute is searched from the pattern storage unit 1. Here, in this embodiment,
In addition to a typical accent type, at least one piece of information about the phoneme type information before and after the pitch change, prominence information, and phrase intonation style information is added to the input attribute. There is. When a unit pattern is searched using a phonological environment that spans multiple moras in the vicinity of the pitch change portion among various information of such input attributes, the reproducibility of local changes in the pattern due to the phonological environment is improved, and more detailed It is possible to generate various patterns. Further, when searching for a unit pattern using prominence information, it is possible to improve the intelligibility and naturalness of the synthetic speech, which has tended to be monotonous in the past. Further, when the unit pattern is searched using the intonation style, it is possible to accurately reproduce the intonation, which is difficult to express by the rule-based generation. Further, by searching the unit pattern by the neural network, a pattern close to the learned human utterance pattern can be reproduced, and the naturalness can be improved.

【0041】このようにして、最適なユニットパターン
が検索された後、パターン配置部3では、主にアクセン
ト核やアクセント句境界の時間軸上の位置などから、検
索されたユニットパターンの生成ピッチパターンにおけ
る時間軸上の位置,より詳しくはユニットパターンの始
点の位置を決定し、ユニットパターンを配置する。より
詳しくは、パターン配置部3は、ユニットパターンの始
点の位置を記号レベルでのピッチレベルが変化する音韻
境界位置に、その部分の音韻環境によって変化するずれ
を考慮して決定する。ここで、ピッチレベルが変化する
位置とは、アクセント句に関しては句境界や核位置など
であるが、図5に示したようなユニットパターンに関し
ては、例えば疑問を表わす尻上がりのパターンなどは最
終母音開始点を基準として位置が決まることが文献
「“日本語疑問文の知覚”,三浦一郎,杉藤美代子,日
本音響学会秋季研究発表会講演論文集, 1991,I,2-6-9,p
p255-256」などによって知られているので、フレーズ末
の音韻,音節,モーラなどの境界位置を用いる。図6は
図3に示したようなユニットパタ−ンを用いたときのパ
タ−ン配置処理の様子を示す図であり、図6において、
下部には、音韻境界の位置と記号レベルでのピッチレベ
ルの高低を示し、上部にユニットパターンを配置した様
子を示している。図6において、点線L1は上昇部ある
いは下降部と平坦部との境界を表わしており、この場
合、ユニットパターンの始点の位置は太線L2のように
決定される。
After the optimum unit pattern is searched in this way, the pattern placement section 3 mainly generates the pitch pattern of the searched unit pattern from the positions of the accent kernel and the accent phrase boundary on the time axis. The position on the time axis at, more specifically, the position of the starting point of the unit pattern is determined, and the unit pattern is arranged. More specifically, the pattern arranging unit 3 determines the position of the starting point of the unit pattern at the phoneme boundary position where the pitch level at the symbol level changes, in consideration of the shift that changes depending on the phoneme environment of that part. Here, the position at which the pitch level changes is a phrase boundary or core position for an accent phrase, but for a unit pattern as shown in FIG. The fact that the position is decided based on the point is the document ““ Perception of Japanese Questionable Sentences ”, Ichiro Miura, Miyoko Sugito, Proceedings of Autumn Meeting of ASJ, 1991, I, 2-6-9, p
Since it is known by "p255-256" etc., the boundary position of the phoneme, syllable, mora, etc. at the end of the phrase is used. FIG. 6 is a diagram showing the pattern placement process when the unit pattern shown in FIG. 3 is used.
The lower part shows the position of the phonological boundary and the pitch level at the symbol level, and the unit pattern is arranged at the upper part. In FIG. 6, the dotted line L1 represents the boundary between the ascending portion or the descending portion and the flat portion, and in this case, the position of the starting point of the unit pattern is determined as the thick line L2.

【0042】このようにして、ユニットパターンの時間
軸上の位置を決定した後、パターン変形部4では、生成
ピッチパターンに自然に埋めこまれるように、ユニット
パターンを変形する処理を行なう。すなわち、パターン
変形部4では、先づ、時間軸上の変形を行なう。図7は
図6のように配置のなされたユニットパターンに対して
変形を施す様子を示す図である。すなわち、図6では、
図3に示したようなユニットパターンを使用しているの
で、図7では各ユニットパターンの始点を前のユニット
パターンの終点に一致させるように、時間軸方向の伸縮
を行なう。このとき、時間軸方向の伸縮は平坦部のみで
行なうことが、発声機構の生理的制約からも妥当と考え
られる。なお、ここで、伸縮の具体的方法は特に限定す
るものではなく、また、伸縮には、データの打ち切りや
繰り返し、外挿なども含まれる。
After the position of the unit pattern on the time axis is determined in this way, the pattern transforming section 4 transforms the unit pattern so that it is naturally embedded in the generated pitch pattern. That is, the pattern transformation unit 4 first performs the transformation on the time axis. FIG. 7 is a diagram showing how the unit pattern arranged as shown in FIG. 6 is deformed. That is, in FIG.
Since the unit pattern as shown in FIG. 3 is used, in FIG. 7, the expansion / contraction in the time axis direction is performed so that the start point of each unit pattern coincides with the end point of the previous unit pattern. At this time, it is considered appropriate to expand / contract in the time axis direction only at the flat part, from the physiological constraints of the vocalization mechanism. Here, the specific method of expansion / contraction is not particularly limited, and expansion / contraction also includes data truncation, repetition, and extrapolation.

【0043】このようにして、時間軸方向の伸縮を行な
った後、ピッチ軸上の変形を行なう。図8は図7のよう
に時間軸方向の変形がなされたピッチパターンにピッチ
軸上の変形を施す様子を示す図である。すなわち、この
例では、各ユニットパターンの始点を前のユニットパタ
ーンの終点に一致させるように、ピッチ軸方向の伸縮が
なされる。このとき、上昇部,下降部は前後のつながり
によって変化することは妥当であるので、ピッチ軸方向
の伸縮を、上昇部および下降部のみで行なうのが良く、
これによって、平坦部の概形やゆらぎを保存することが
できる。このような方法によってユニットパターンの平
坦部はその絶対的高さも保存される。このため、プロミ
ネンスの影響やフレーズ中の位置などによる影響も含め
て、ピッチパターンをユニットパターンによって再現す
ることができる。
In this way, after the expansion and contraction in the time axis direction, the deformation on the pitch axis is performed. FIG. 8 is a diagram showing a state in which the pitch pattern deformed in the time axis direction as in FIG. 7 is deformed on the pitch axis. That is, in this example, expansion and contraction in the pitch axis direction are performed so that the start point of each unit pattern coincides with the end point of the previous unit pattern. At this time, since it is appropriate that the ascending part and the descending part change depending on the front-rear connection, it is preferable to perform expansion and contraction in the pitch axis direction only at the ascending part and the descending part.
This makes it possible to preserve the outline and fluctuation of the flat portion. By such a method, the flat portion of the unit pattern also preserves its absolute height. Therefore, the pitch pattern can be reproduced as a unit pattern, including the influence of prominence and the influence of the position in the phrase.

【0044】上述の例では、図3に示したようなユニッ
トパターンを使用したため、パターン間の接続に際して
補間処理は特に必要としなかったが、図3に示したよう
なユニットパターン以外のユニットパターンを使用する
場合には、パターン接続部5において何らかの補間処理
が必要となる。このとき、上昇部と下降部のみをユニッ
トパターンとする場合にはその間を直線によって、ま
た、図4のように平坦部をユニットパターンとする場合
にはその間を3次曲線によって補間することで、より人
間のピッチパターンに近いパターンを生成することがで
きる。
In the above example, since the unit patterns shown in FIG. 3 are used, interpolation processing is not particularly required for connecting the patterns, but unit patterns other than the unit patterns shown in FIG. When used, some kind of interpolation processing is required in the pattern connection unit 5. At this time, when only the ascending part and the descending part are unit patterns, the space between them is linear, and when the flat part is unit pattern as shown in FIG. A pattern closer to a human pitch pattern can be generated.

【0045】ところで、上述したようなユニット接続型
のピッチパターン生成装置において、どのようなユニッ
トパターンをパターン記憶部に記憶するかという問題が
性能を大きく左右する。そこで本発明では、さらに、パ
ターン記憶部に記憶されるユニットパターンとして、特
定の言語的状況において特徴的に現われるピッチパター
ンを用い、これにより、効率的で効果的なピッチパター
ン生成を実現するようにしている。以下、このようなユ
ニットパターンについて詳述する。
By the way, in the unit connection type pitch pattern generating apparatus as described above, the problem of what kind of unit pattern is stored in the pattern storage section greatly affects the performance. Therefore, in the present invention, a pitch pattern characteristically appearing in a specific linguistic situation is used as a unit pattern stored in the pattern storage unit, thereby realizing efficient and effective pitch pattern generation. ing. Hereinafter, such a unit pattern will be described in detail.

【0046】連続音声には呼気段落や文などの複数のフ
レーズがあるが、通常の発声では、フレーズ内位置が末
尾に近づくにつれて低いピッチパターンとなる。従っ
て、フレーズ内位置の異なる複数のパターンを用意する
ことにより、声立て成分の分離・合成などの複雑な処理
をせずに、上記のようなフレーズ感を出すことが可能と
なる。また、文末では文の長さにかかわらず、比較的低
い専用パターンを使用することによって、文の終始感を
出すことができる。このように、ユニットパターンの1
つとして、呼気段落や文など、一連のフレーズにおける
特定の位置において特徴的に現われるピッチパターンを
用いることにより、フレーズ感,文の終始感などを表現
することができる。
The continuous voice has a plurality of phrases such as an exhalation paragraph and a sentence, but in normal utterance, the pitch pattern becomes lower as the position in the phrase approaches the end. Therefore, by preparing a plurality of patterns having different positions in the phrase, it is possible to give the above-mentioned phrase feeling without performing complicated processing such as separation / combination of the vocal components. At the end of a sentence, the feeling of the beginning and end of the sentence can be obtained by using a relatively low dedicated pattern regardless of the length of the sentence. In this way, the unit pattern 1
As an example, by using a pitch pattern characteristically appearing at a specific position in a series of phrases such as a breath paragraph and a sentence, it is possible to express a feeling of phrase, a feeling of beginning and end of a sentence, and the like.

【0047】また、アクセント句のパターン概形は、ア
クセント核の有無,位置などによって異なる。無核のア
クセント句パターンは有核のそれに比べてなだらかであ
り、頭高型のものはやや急峻に上昇してなだらかに下降
する。従って、アクセント型の異なる複数のパターンを
用意し使い分けることで、このような違いを表現でき
る。このように、ユニットパターンの1つとして、頭高
型,平板型など特定のアクセント型において特徴的に現
われるピッチパターンを用いることにより、より自然な
ピッチパターンを生成することができる。
The pattern outline of the accent phrase differs depending on the presence or absence of the accent nucleus, the position, and the like. The nucleus-free accent phrase pattern is gentler than that of the nucleus-free one, and the head-height one rises abruptly and then descends gently. Therefore, such a difference can be expressed by preparing a plurality of patterns with different accent types and using them properly. In this way, a more natural pitch pattern can be generated by using, as one of the unit patterns, a pitch pattern characteristically appearing in a specific accent type such as a head height type or a flat type.

【0048】また、プロミネンスが付与されている部分
は、比較的高い専用パターンを使用することで、フレー
ズ頭でも不自然なピッチ上昇のない自然なプロミネンス
感を出すことができる。また、従来困難であった副次ア
クセントの表現も、アクセントレベルの異なるパターン
を用意することで可能となる。このように、ユニットパ
ターンの1つとして、プロミネンスが付与されている部
分,副次アクセント核が現われる部分などの特定のアク
セントレベルにおいて特徴的に現われるピッチパターン
を用いることにより、プロミネンス,副次アクセントの
表現が可能となり、自然性を向上させることができる。
Further, by using a relatively high dedicated pattern for the portion to which prominence is applied, it is possible to give a natural prominence feeling without unnatural pitch rise even at the beginning of a phrase. In addition, it is possible to express a secondary accent, which has been difficult in the past, by preparing patterns with different accent levels. In this way, as one of the unit patterns, by using the pitch pattern characteristically appearing at a specific accent level such as a part to which prominence is added or a part where a secondary accent nucleus appears, the prominence and the secondary accent It is possible to express and improve the naturalness.

【0049】また、ユニットパターンの1つとして、間
投詞や終助詞,擬声語,擬態語,掛け声などのその語に
独特のピッチパターンで発声される語を用いるか、ある
いはフレーズのピッチパターンをそのまま用いることも
でき、この場合には、その語に独特のピッチパターンで
発声される語を忠実に再現できて、自然性を向上させる
ことができる。
Further, as one of the unit patterns, it is also possible to use a word such as an interjection, a final particle, an onomatopoeia, a mimetic word, a shout, etc. which is uttered with a unique pitch pattern, or the phrase pitch pattern is used as it is. In this case, the word uttered in a pitch pattern unique to the word can be faithfully reproduced, and the naturalness can be improved.

【0050】また、数字を棒読みする場合や和歌などの
韻文を朗読する場合は、一定のピッチパターンが周期的
に現われる。従って、ユニットパターンの1つとして、
数字列,韻文などに周期的に現われる特徴的なピッチパ
ターンを用いることにより、上記のような独特の節回し
の発声にも対応することができる。
Further, when reading a number or reading a poem such as a Japanese poem, a constant pitch pattern appears periodically. Therefore, as one of the unit patterns,
By using a characteristic pitch pattern that appears periodically in a number string, a verse, etc., it is possible to deal with the peculiar utterance utterance as described above.

【0051】また、会話では「えー」や「うん」など、
語そのものにはあまり意味はなく、主に韻律の違いによ
って意図を表現する場合が多々ある。従って、ユニット
パターンの1つとして、語や音韻から独立して主に韻律
によって特定の意図を表わす特徴的ピッチパターンを用
いることにより、効率的に自然な会話出力ができる。
Also, in conversation, "er" and "yeah"
The word itself does not have much meaning, and it is often the case that the intention is expressed mainly by differences in prosody. Therefore, as one of the unit patterns, a characteristic pitch pattern that represents a specific intention mainly by a prosody independently of words or phonemes is used, whereby natural conversation can be efficiently output.

【0052】図9は、入力言語情報からこれらのユニッ
トパターンを検索してピッチパターンを合成する処理の
具体例を示す図である。図9の例では、パターン記憶部
1に、〔P01〕文頭平板型,〔P03〕文末平板型,
〔P41〕プロミネンス,〔P42〕副次アクセント,
〔P51〕ですか?,〔P61〕数字,〔P71〕意
外,の7種類のユニットパターンが予め記憶されている
場合が示されており、入力言語情報として、「え?(意
外)/920917ですか? もう一度/メニュー番号
を(プロミネンス)/入力してください」が入力する
と、パターン検索部2では、パターン記憶部1からこの
入力言語情報に対応したユニットパターン列を検索す
る。この結果、「〔P71〕え?〔P61〕92〔P6
1〕09〔P61〕17〔P51〕ですか?〔P01〕
もう一度〔P41〕メニュー番号を〔P03〕入力して
〔P42〕ください」のユニットパターン列を検索する
ことができる。次いで、このように検索されたユニット
パターン列をパターン配置部3,パターン変形部4,パ
ターン接続部5において、配置,変形,接続することに
よって、図9の下部に示すような自然なピッチパターン
を生成することができる。
FIG. 9 is a diagram showing a specific example of processing for retrieving these unit patterns from input language information and synthesizing pitch patterns. In the example of FIG. 9, in the pattern storage unit 1, [P01] sentence-end flat plate type, [P03] sentence-end flat plate type,
[P41] Prominence, [P42] Secondary accent,
Is it [P51]? , [P61] number, [P71] surprisingly, seven types of unit patterns are stored in advance, and as input language information, "Eh? (Unexpected) / 920917? Again / menu number "(Prominence) / Enter." Is input, the pattern search unit 2 searches the pattern storage unit 1 for a unit pattern string corresponding to the input language information. As a result, "[P71] Eh? [P61] 92 [P6
1] 09 [P61] 17 [P51]? [P01]
It is possible to search for a unit pattern string of "P41", enter [P03] menu number again [P42]. Next, by arranging, deforming, and connecting the unit pattern strings thus searched in the pattern arranging section 3, the pattern deforming section 4, and the pattern connecting section 5, a natural pitch pattern as shown in the lower part of FIG. 9 is obtained. Can be generated.

【0053】このように、パターン記憶部1に記憶され
るユニットパターンとして、特定の言語的状況において
特徴的に現われるピッチパターンを用いることにより、
入力言語情報からヒューリスティックにユニットパター
ンを検索することができ、このユニットパターンを配
置,変形,接続することによって、比較的簡単な処理で
効率的かつ効果的に、自然なピッチパターンを生成する
ことができる。
As described above, by using the pitch pattern characteristically appearing in a specific linguistic situation as the unit pattern stored in the pattern storage unit 1,
A unit pattern can be heuristically searched from the input language information, and by arranging, transforming, and connecting the unit patterns, a natural pitch pattern can be efficiently and effectively generated by a relatively simple process. it can.

【0054】なお、ユニットパタ−ンとして自然音声の
ピッチパタ−ンをそのまま記憶する場合には、生成規則
やモデルパラメ−タとして記憶するよりも大量のデ−タ
が必要となり、メモリ容量の増加や処理量の増加による
リアルタイム処理の困難が予想される。このため、それ
を回避するような何らかの工夫が必要となる。
When the pitch pattern of natural voice is stored as a unit pattern as it is, a larger amount of data is required than when it is stored as a generation rule or model parameter, which increases the memory capacity. It is expected that real-time processing will be difficult due to the increase in processing amount. Therefore, some kind of ingenuity is required to avoid it.

【0055】本願の発明者は、メモリ容量の増加や処理
量の増加によってリアルタイム処理が困難になるのを防
止するため、自然音声のピッチパタ−ンから適当な単位
で切り出したユニットパタ−ンをそのままの形でパタ−
ン記憶部1に記憶するのではなく、ユニットパタ−ンを
折れ線近似してパタ−ン記憶部1に記憶することをさら
に案出した。
The inventor of the present application, in order to prevent real-time processing from becoming difficult due to an increase in memory capacity and an increase in processing amount, a unit pattern cut out from a pitch pattern of natural voice in an appropriate unit as it is. In the form of
It was further devised to store the unit pattern in the pattern storage unit 1 by polygonal line approximation instead of storing it in the pattern storage unit 1.

【0056】図10には、本来曲線的であるユニットパ
タ−ンを折れ線近似した一例が示されている。図10の
例では、1つのユニットパタ−ンが、7つの折れ線に近
似され、各折れ線ごとの区間(セグメント)S1及至S
7に区分されている。ここで、ユニットパタ−ンは、始
点のピッチと、それぞれの区間の区間長(セグメント
長)と、それぞれの区間の折れ線(線分)の傾きを表す
ステップ値とによって表現することができ、ユニットパ
タ−ンをこの表現形式でパタ−ン記憶部1に記憶するこ
とができる。なお、ステップ値とは、ピッチ周期が1サ
ンプル変化するのに要する時間,すなわちピッチ更新周
期であり、折れ線の傾きが図11(a)のように右上が
りのときには正(+)の値をとり、また、図11(b)
のように右下がりのときには負(−)の値をとるものと
する。
FIG. 10 shows an example in which a unit pattern which is originally curved is approximated by a broken line. In the example of FIG. 10, one unit pattern is approximated to seven broken lines, and sections (segments) S1 to S for each broken line.
It is divided into 7. Here, the unit pattern can be expressed by the pitch of the starting point, the section length (segment length) of each section, and the step value indicating the slope of the polygonal line (line segment) of each section. The pattern can be stored in the pattern storage unit 1 in this expression format. The step value is the time required for the pitch cycle to change by one sample, that is, the pitch update cycle, and takes a positive (+) value when the slope of the polygonal line rises to the right as shown in FIG. , FIG. 11 (b)
As shown in, the negative (-) value is assumed.

【0057】このように、本来曲線的であるユニットパ
タ−ンを折れ線で近似し、これを始点のピッチおよびそ
れぞれの区間の区間長とステップ値とにより表現してパ
タ−ン記憶部1に記憶することにより、ユニットパタ−
ンをそのままの形で記憶する場合に比べて、パタ−ン記
憶部1に記憶されるデ−タ量を大幅に減少することがで
きる。さらに、ユニットパタ−ンのピッチ方向のシフト
を始点ピッチの増減のみで行なうことができ、また、時
間軸方向の伸縮を区間長の増減によって行なうことがで
きて、パタ−ンの変形も簡単に行なうことができる。
As described above, the originally curved unit pattern is approximated by a polygonal line, and this is expressed by the pitch of the starting point, the section length of each section and the step value, and stored in the pattern storage unit 1. Unit pattern
The amount of data stored in the pattern storage unit 1 can be greatly reduced as compared with the case where the data is stored as it is. Further, the unit pattern can be shifted in the pitch direction only by increasing / decreasing the starting point pitch, and the expansion / contraction in the time axis direction can be performed by increasing / decreasing the section length, so that the pattern can be easily deformed. Can be done.

【0058】但し、上記のような表現を用いる場合に
は、パタ−ン検索部2において、パタ−ン記憶部1から
所定のユニットパタ−ンの上記表現形式のデ−タを検索
し読む出したときに、これをユニットパタ−ンの形に
(すなわち折れ線の形に)再生(生成)する必要がある
が、このユニットパタ−ン生成処理は、図12に示すよ
うな簡単な構成によって実現できる。すなわち、図12
に示す回路は、ある1つの区間における折れ線を再生
(生成)するのに、その区間のステップ値が入力するよ
うになっており、入力したステップ値の絶対値を求める
(すなわち、ステップ値が負のときに符号を反転させ
る)インバ−タ11と、ステップ値の絶対値が設定さ
れ、所定時間間隔のサンプルクロックを計数し、サンプ
ルクロックの計数値がステップ値の絶対値が一致したと
きに、“1”を出力するステップカウンタ12と、入力
したステップ値の正負を判定するコンパレ−タ13と、
コンパレ−タ13において正(+)と判別され、ステッ
プカウンタ12から“1”が出力されたときに“1”を
出力するAND回路14と、コンパレ−タ13において
負(−)と判別され、ステップカウンタ12から“1”
が出力されたときに“1”を出力するAND回路15
と、AND回路14からの出力“1”を正(+)方向に
カウントし、また、AND回路15からの出力“1”を
負(−)方向にカウントし、そのカウント値をピッチと
して出力するピッチカウンタ16とから構成されてお
り、この回路によって、ステップ値(ピッチ更新周期)
が正の場合、ピッチ周期を単位長増加させ、ステップ値
が負の場合、ピッチ周期を単位長減少させる処理を行な
うことができる。換言すれば、ピッチカウンタ16の初
期値に始点のピッチを設定し、1つの区間において時間
軸方向に区間長(セグメント長)となるまで上記回路の
ピッチカウンタ16からピッチを出力させ、これを各区
間について順次に行なうことにより、折れ線近似のユニ
ットパタ−ンを再生(生成)することができる。このよ
うにして、ユニットパタ−ンを再生することができ、ま
た、実際のピッチパタ−ンを生成することができる。
However, when the above expression is used, the pattern search unit 2 searches the pattern storage unit 1 for the data in the above expression form of a predetermined unit pattern and reads it. When this is done, it is necessary to reproduce (generate) this in the form of a unit pattern (that is, in the form of a polygonal line), but this unit pattern generation processing is realized by a simple configuration as shown in FIG. it can. That is, FIG.
In the circuit shown in (1), the step value of the section is input to reproduce (generate) a polygonal line in a certain section, and the absolute value of the input step value is obtained (that is, the step value is negative). When the absolute value of the step value is set and the sample clock at a predetermined time interval is counted and the count value of the sample clock is equal to the absolute value of the step value, A step counter 12 that outputs "1", a comparator 13 that determines whether the input step value is positive or negative,
The comparator 13 determines positive (+), the AND circuit 14 which outputs "1" when the step counter 12 outputs "1", and the comparator 13 determines negative (-), "1" from the step counter 12
AND circuit 15 that outputs "1" when is output
And the output "1" from the AND circuit 14 is counted in the positive (+) direction, the output "1" from the AND circuit 15 is counted in the negative (-) direction, and the count value is output as the pitch. This circuit is composed of a pitch counter 16 and a step value (pitch update cycle) by this circuit.
When is positive, the pitch period can be increased by the unit length, and when the step value is negative, the pitch period can be decreased by the unit length. In other words, the pitch of the starting point is set to the initial value of the pitch counter 16, and the pitch is output from the pitch counter 16 of the above circuit until the section length (segment length) is reached in the time axis direction in one section. By sequentially performing the sections, it is possible to reproduce (generate) a unit pattern approximated by a polygonal line. In this way, the unit pattern can be reproduced and the actual pitch pattern can be generated.

【0059】また、パタ−ン配置部3では、パタ−ン検
索部2で検索され生成された各ユニットパタ−ンを所定
位置に配置し、パタ−ン変形部4では、自然なピッチパ
タ−ンを得るために、パタ−ン配置部3により配置され
た各ユニットパタ−ンを変形する処理を行なうが、この
ときに、隣接ユニットパタ−ン間の接続やプロミネンス
付与などのために、傾きを調整する必要がある。本発明
では、前述のようなデ−タ表現を採用しているため、こ
の調整処理は、例えば、過渡部(図10を参照)の全区
間のステップ値に一定のバイアスを加算器(図示せず)
により加えることで、容易に実現できる。
In the pattern arranging section 3, each unit pattern searched and generated by the pattern searching section 2 is arranged at a predetermined position, and in the pattern deforming section 4, a natural pitch pattern is arranged. In order to obtain the above, the processing for deforming each unit pattern arranged by the pattern arranging section 3 is performed. At this time, the inclination is changed to connect the adjacent unit patterns or to give prominence. Need to be adjusted. In the present invention, since the data representation as described above is adopted, this adjustment processing is performed by, for example, adding a constant bias to the step value of the entire transition section (see FIG. 10) by an adder (not shown). No)
It can be easily realized by adding.

【0060】図13には、1つのユニットパタ−ンに対
するこのような調整処理例が示されている。図13を参
照すると、1つのユニットパタ−ンの各区間のステップ
値のそれぞれに一定のバイアス値を加えて、ステップ値
を変えることによって(各折れ線の傾きを変えることに
よって)、ユニットパタ−ンにピッチ方向の滑らかな変
形を施すことができる。例えば、図13の例のように、
ユニットパタ−ンの各区間のステップ値(変形前)ST
Aに負のバイアス値BIASを加えてSTBとすることによっ
て、変形前のユニットパタ−ンUNPAをUNPBのよう
に変形することができる。すなわち、終点については変
動させず、始点を所定量(バイアス量)変動させること
ができる。このようにして、ユニットパタ−ン間の接続
やプロミネンス付与などで必要となるパタ−ン変形処理
が加算器だけの非常に簡単な構成で実現できる。
FIG. 13 shows an example of such adjustment processing for one unit pattern. Referring to FIG. 13, by adding a constant bias value to each step value in each section of one unit pattern and changing the step value (by changing the slope of each polygonal line), the unit pattern is changed. Can be smoothly deformed in the pitch direction. For example, as in the example of FIG.
Step value (before transformation) ST of each section of unit pattern
By adding a negative bias value BIAS to A and setting it as ST B , the unit pattern UNP A before deformation can be deformed like UNP B. That is, the start point can be changed by a predetermined amount (bias amount) without changing the end point. In this way, the pattern modification processing required for connection between unit patterns and provision of prominence can be realized with a very simple configuration of only the adder.

【0061】なお、このような仕方で自然な傾きの調整
を行なうには、右上がりの傾きから水平,右下がりの傾
きへと連続的に変化させる必要があるが、これは、ステ
ップ値の最大値(正の最大絶対値)と最小値(負の最大
絶対値)とを連続的に変化させるようにすることで可能
となり、このような処理は、ステップ値(ピッチ更新周
期)を“2”の補数表現によって扱い、バイアスを加え
た結果のステップ値の絶対値が最大値を越えた場合に、
これを反対符号の最大絶対値とすることによって、容易
に実現することができる。
In order to adjust the natural inclination in this way, it is necessary to continuously change from the upward slope to the horizontal and downward slope, which is the maximum step value. This can be achieved by continuously changing the value (positive maximum absolute value) and the minimum value (negative maximum absolute value). Such processing can be performed by setting the step value (pitch update cycle) to "2". When the absolute value of the step value of the result of adding the bias exceeds the maximum value,
This can be easily realized by setting the maximum absolute value of the opposite sign.

【0062】このように、パターン変形部4は、1つの
ユニットパターンの各区間のユニット値に一定のバイア
スを加えることによって、このユニットパターンをピッ
チ方向に滑らかに変形することができるが、パターン変
形部4では、隣接ユニットパターン間の接続やプロミネ
ンス付与などで必要となるバイアスをリアルタイムに計
算しなければならない。この計算には通常乗除算を要す
るために処理が複雑となり、ピッチパターン生成処理全
体をリアルタイムに行なう上でボトルネックとなる場合
がある。この問題を回避するには、ピッチ変化量(例え
ば原パターンと生成パターンの始点ピッチの差、あるい
は生成パターンの始点ピッチそのもの)とバイアスとの
対応関係を予め計算した図14に示すようなバイアステ
ーブルをユニットパターン毎に設け、ある1つのユニッ
トパターンをピッチ方向に所定のピッチ変化量で変形す
るときには、このユニットパターンのバイアステーブル
から上記ピッチ変化量に対応したバイアスを読み出して
用いれば良い。これによって、バイアスをその都度計算
する必要をなくし、リアルタイム処理に支障を生じさせ
ずに済む。具体的には、図15に示すように、各パター
ンの終点についてはこれを変動させず、各パターンの始
点が前のパターンの終点となるように始点のピッチ変化
量を割り出し、これに対応したバイアスを図14に示す
ようなバイアステーブルから読み出して用い、原パター
ンを変形して生成パターンとすることで、前のパターン
との接続を容易に行なうことができる。
As described above, the pattern deforming section 4 can smoothly deform the unit pattern in the pitch direction by applying a constant bias to the unit value of each section of one unit pattern. In the section 4, the bias required for connection between adjacent unit patterns and provision of prominence must be calculated in real time. This calculation usually requires multiplication and division, which complicates the process and may become a bottleneck in performing the entire pitch pattern generation process in real time. To avoid this problem, the bias table as shown in FIG. 14 in which the correspondence between the pitch change amount (for example, the difference between the starting point pitches of the original pattern and the generated pattern or the starting point pitch of the generated pattern itself) and the bias is calculated in advance. Is provided for each unit pattern, and when one unit pattern is deformed in the pitch direction by a predetermined pitch change amount, a bias corresponding to the pitch change amount may be read from the bias table of this unit pattern and used. This eliminates the need to calculate the bias each time and does not hinder the real-time processing. Specifically, as shown in FIG. 15, the end point of each pattern is not changed, and the pitch change amount of the start point is calculated so that the start point of each pattern becomes the end point of the previous pattern, and this is dealt with. By reading the bias from the bias table as shown in FIG. 14 and using the bias to transform the original pattern into a generated pattern, connection with the previous pattern can be easily performed.

【0063】また、本発明の変形例として、パターン検
索部2におけるユニットパターンの追加,削除,変更等
のメンテナンスを容易にするため、図16に示すよう
に、入力言語情報単位ごとにユニットパターンを検索す
るための複数のルールを記憶しているルール記憶部7を
さらに設けることもできる。
As a modified example of the present invention, in order to facilitate maintenance such as addition, deletion, and change of unit patterns in the pattern search unit 2, as shown in FIG. 16, unit patterns are input for each input language information unit. It is also possible to further provide a rule storage unit 7 that stores a plurality of rules for searching.

【0064】この場合、ルール記憶部7に記憶されるル
ールとしては、複数のアイテムとその値の範囲とからな
る条件と、ユニット番号とにより構成されたものを用い
ることができる。ここで、アイテムは、モーラごとの各
種属性であって、具体的には、句頭からの位置,隣接句
との境界種別,アクセント型,アクセントレベル,音韻
などが有効と考えられる。
In this case, as the rule stored in the rule storage unit 7, a rule composed of a condition including a plurality of items and their value ranges and a unit number can be used. Here, the item has various attributes for each mora, and specifically, the position from the beginning of the phrase, the boundary type with the adjacent phrase, the accent type, the accent level, the phoneme, etc. are considered to be effective.

【0065】次に図16に示すような構成のピッチパタ
ーン生成装置におけるパターン検索処理の具体例を図1
7乃至図19を用いて説明する。なお、図17はパター
ン記憶部1に記憶されている各種ユニットパターンを示
す図であり、図17の例では、4種類のユニットパター
ンがユニット番号“1”,“2”,“3”,“4”を付
されて記憶されている。また、図18はルール記憶部7
に記憶されているルールの構成例を示す図であり、図1
8の例では、ルールは、アイテムとして、アクセント句
頭からの位置Pos,声立て句頭からの位置Mora,アクセ
ント型Acc,アクセント核の位置Coreの4つの属性を用
いており、4種類のユニット番号“1”,“2”,
“3”,“4”のそれぞれに、4つの属性の値の範囲が
割り当てられたものとなっている。
Next, a concrete example of the pattern search process in the pitch pattern generating apparatus having the structure shown in FIG. 16 will be described with reference to FIG.
This will be described with reference to FIGS. FIG. 17 is a diagram showing various unit patterns stored in the pattern storage unit 1. In the example of FIG. 17, four types of unit patterns are unit numbers “1”, “2”, “3”, “. 4 ”is stored. Further, FIG. 18 shows the rule storage unit 7.
2 is a diagram showing a configuration example of a rule stored in FIG.
In the example of No. 8, the rule uses four attributes as items: position Pos from accent phrase head, position Mora from accent phrase head, accent type Acc, position of accent nucleus Core, and four types of units. The numbers "1", "2",
A range of four attribute values is assigned to each of "3" and "4".

【0066】図16において、パターン検索部2では、
図18のルール記憶部7を参照して、パターン記憶部1
に記憶されている4種類のユニットパターンから、入力
言語情報に応じたユニットパターンを検索する。具体的
には、入力言語情報単位をモーラとし、処理がモーラ単
位に行なわれるとするとし、図19に示すような入力モ
ーラ列が入力する場合には、先ず、各モーラについて、
すべてのアイテムの値を求める。ある1つのモーラに着
目すると、パターン検索部2は、ルール記憶部7を参照
し、ルールの条件に含まれる全てのアイテムについて、
その範囲に、このモーラの各アイテムの値が入っている
か否かを調べる。そして、ある1つのユニット番号のア
イテムの範囲にこのモーラの各アイテムの値が入ってい
ると判断されたときには、このモーラは、ルールの条件
を満たすものとし、パターン検索部2は、そのルールの
ユニット番号に対応したユニットパターンをパターン記
憶部1から検索することができる。また、条件を満たす
ルールが1つもないときには、そのモーラ位置に配置さ
れるユニットパターンはないものとして、次のモーラに
ついての処理に進む。
In FIG. 16, the pattern search unit 2
Referring to the rule storage unit 7 in FIG. 18, the pattern storage unit 1
The unit pattern corresponding to the input language information is searched from the four types of unit patterns stored in. Specifically, assuming that the input language information unit is a mora and the processing is performed in a mora unit, and when an input mora string as shown in FIG. 19 is input, first, for each mora,
Find the value of all items. Focusing on a certain mora, the pattern search unit 2 refers to the rule storage unit 7, and for all items included in the rule condition,
Check to see if the range contains a value for each item in this mora. When it is determined that the value of each item of this mora is included in the range of the item of a certain unit number, this mora satisfies the condition of the rule, and the pattern search unit 2 determines that the rule The unit pattern corresponding to the unit number can be searched from the pattern storage unit 1. If there is no rule satisfying the condition, it is determined that there is no unit pattern arranged at the mora position, and the process for the next mora is performed.

【0067】例えば、図19の入力モーラ列において、
「メロン」の「ロ」というモーラは、各アイテム値が
“0”,“4”,“1”,“0”であって、ルール記憶
部7に記憶されているルールのうち、ユニット番号
“4”のルールの条件を満たすので、パターン検索部4
は、パターン記憶部1からユニット番号“4”のユニッ
トパターンを検索することができる。
For example, in the input mora sequence of FIG.
The mora "ro" of "melon" has the item values "0", "4", "1", and "0", and the unit number of the rules stored in the rule storage unit 7 is " 4 ”is satisfied, so the pattern search unit 4
Can search the unit pattern of unit number “4” from the pattern storage unit 1.

【0068】このように、ル−ルの条件に言語情報単位
の特徴を表わす複数の変数の値の範囲を含ませること
で、ル−ル検索をル−チン処理で行なうことができる。
また、ル−ルを外部デ−タ化することが容易となり、ル
−ル自体の保守性を高めることができる。
As described above, by including the range of the values of a plurality of variables representing the characteristics of the linguistic information unit in the rule condition, the rule search can be performed by the routine processing.
Further, it becomes easy to convert the rule into external data, and the maintainability of the rule itself can be improved.

【0069】また、ル−ルの条件に含まれる変数とし
て、言語情報単位の句頭あるいは句末からの位置を用い
ることによって、句頭から句末へ向かって徐々に下降す
るなど、句内位置によって連続的に変化するピッチパタ
−ンの性質を表現することが可能となる。また、言語情
報単位を含む句の隣接句との境界種別を用いることによ
って、読点位置よりも文末を特に下げることによる文の
終始感の演出や、疑問文等の様々なイントネ−ションス
タイルへの対応など、句境界位置でのピッチパタ−ンの
特徴を表現することが可能となる。また、言語情報単位
を含む句のアクセント情報を用いることによって、頭高
型が中高型よりも左に傾いた山になるなどのアクセント
型による特徴や、プロミネンス,副次アクセント等のア
クセントレベルによる特徴など、ピッチパタ−ンの特徴
を表現することが可能となる。また、言語情報単位の音
韻情報を用いることによって、特定の音韻で見られる局
所的なピッチパタ−ンの特徴や、音韻継続時間長の影響
などを表現することが可能となる。
Further, by using the position from the beginning or end of the linguistic information unit as a variable included in the rule of the rule, the position in the phrase is gradually lowered from the beginning to the end of the phrase. This makes it possible to express the characteristics of the pitch pattern that changes continuously. In addition, by using the boundary type of the phrase including the linguistic information unit with the adjacent phrase, it is possible to produce a feeling of beginning and end of the sentence by lowering the end of the sentence more than the reading point position, and to various intonation styles such as question sentences. It becomes possible to express the characteristics of the pitch pattern at the phrase boundary position such as correspondence. Also, by using accent information of phrases including linguistic information units, accent type features such as head height becoming a mountain tilted to the left rather than middle height type, and features depending on accent level such as prominence and secondary accent. It becomes possible to express the characteristics of the pitch pattern. Further, by using the phoneme information in units of linguistic information, it is possible to represent the characteristics of the local pitch pattern seen in a specific phoneme, the influence of the phoneme duration, and the like.

【0070】なお、上記例では、ルールとユニットパタ
ーンは1対1対応のものとなっているが、1つのルール
が複数のユニット番号をもつこともある。この場合に
は、その中から何らかの“ゆれ”を与えて1つのユニッ
トパターンを選択することもできる。これによって、同
じ入力からでも全く同じではないピッチパターンを生成
することができ、画一的で機械的なピッチパタ−ンを避
けることが可能となり、より自然なピッチパターンを得
ることができる。
In the above example, the rules and the unit patterns have a one-to-one correspondence, but one rule may have a plurality of unit numbers. In this case, one unit pattern can be selected by giving some "fluctuation" among them. This makes it possible to generate pitch patterns that are not exactly the same even from the same input, avoid a uniform mechanical pitch pattern, and obtain a more natural pitch pattern.

【0071】[0071]

【発明の効果】以上に説明したように、請求項1記載の
発明によれば、人間の発声のピッチパターンから適当な
単位で切り出したユニットパターンをパターン記憶手段
に記憶し、パターン検索手段では、所定の入力属性に基
づき、該入力属性に適合したユニットパターンをパター
ン記憶手段から検索し、パターン配置手段では、検索に
より得られたユニットパターンを時間軸上に配置し、パ
ターン変形手段では、時間軸上に配置されたユニットパ
ターンを変形して、ピッチパターンを生成するようにし
ており、人間の発声したピッチパターンをそのまま使用
しているので、規則による生成では困難な自然な変化や
ゆらぎ,ニュアンスなどを表現可能なピッチパターンを
生成することができる。
As described above, according to the first aspect of the invention, the unit pattern cut out from the pitch pattern of the human utterance in an appropriate unit is stored in the pattern storage means, and the pattern search means, Based on a predetermined input attribute, a unit pattern matching the input attribute is searched from the pattern storage means, the pattern arranging means arranges the unit pattern obtained by the search on the time axis, and the pattern transforming means, the time axis. The unit pattern arranged above is transformed to generate a pitch pattern, and since the pitch pattern uttered by a human being is used as it is, natural changes, fluctuations, nuances, etc. which are difficult to generate by rules are generated. It is possible to generate a pitch pattern capable of expressing

【0072】また、請求項2記載の発明において、アク
セント句の上昇部と下降部とをそれぞれ1つ含むものを
1つの単位として切り出したものをユニットパターンと
して使用する場合には、ピッチパターンの重要な単位で
あるアクセント句のパターンをほぼ保存したピッチパタ
ーンを生成することができる。また、アクセント句の上
昇部または下降部を1つ含むものをユニットパターンと
して使用する場合には、簡単な接続処理によってピッチ
パターンを生成することができる。また、アクセント句
の平坦部を含むユニットパターンを使用する場合には、
定常部のゆらぎ等を保存でき、自然なピッチパターンを
生成することができる。また、フレーズ末の特徴的ピッ
チ変化をユニットパターンとして使用する場合には、規
則による生成では困難な多彩なイントネーションを表現
することできる。また、特定の範囲のピッチ変化率を示
すパターンをユニットパターンとして使用する場合に
は、変化部分の概形や定常部分のゆらぎ等を保存するこ
とができ、規則による生成では困難であった多彩で自然
なピッチパターンを生成することができる。また、特定
の範囲のピッチ曲率を示すパターンをユニットパターン
として使用する場合には、その他の部分を直線で補間で
きるため、処理量を低減することができる。
Further, in the invention of claim 2, when a unit pattern including one ascending part and one descending part of an accent phrase is cut out and used as a unit pattern, the pitch pattern is important. It is possible to generate a pitch pattern in which patterns of accent phrases, which are various units, are almost preserved. When a unit pattern including one ascending part or one descending part of an accent phrase is used as a unit pattern, a pitch pattern can be generated by a simple connection process. Also, when using a unit pattern that includes the flat part of the accent phrase,
It is possible to save fluctuations in the stationary part and generate a natural pitch pattern. Also, when the characteristic pitch change at the end of the phrase is used as a unit pattern, various intonations that are difficult to generate with rules can be expressed. In addition, when a pattern showing the pitch change rate in a specific range is used as a unit pattern, it is possible to store the outline of the changing part and the fluctuation of the steady part, which is difficult to generate with rules. A natural pitch pattern can be generated. Further, when a pattern showing a pitch curvature in a specific range is used as a unit pattern, the other portion can be interpolated by a straight line, so that the processing amount can be reduced.

【0073】また、請求項3記載の発明において、ベク
トル量子化されたユニットパターンをパタ−ン記憶手段
に記憶し、これを使用するときには、パターン記憶手段
の容量を大幅に削減することができ、装置の低コスト
化,小型化,処理の高速化を図ることができる。
According to the third aspect of the present invention, the vector quantized unit pattern is stored in the pattern storage means, and when this is used, the capacity of the pattern storage means can be greatly reduced. The cost of the device can be reduced, the device can be downsized, and the processing speed can be increased.

【0074】また、請求項4記載の発明によれば、ピッ
チ変化部分近傍の複数モーラにわたる音韻環境からユニ
ットパターンを検索することによって、音韻環境による
パターンの局所的変化の再現性が向上し、より緻密なピ
ッチパターンを生成することができる。また、プロミネ
ンスの情報からユニットパターンを検索する場合には、
従来単調になりがちだった合成音声の抑揚にめりはりが
つき、了解性,自然性を向上させることができる。ま
た、イントネーションスタイルからユニットパターンを
検索する場合には、規則による生成では表現が困難なイ
ントネーションを正確に再現することができる。
According to the fourth aspect of the present invention, by retrieving the unit pattern from the phonological environment over a plurality of moras in the vicinity of the pitch change portion, the reproducibility of the local change of the pattern due to the phonological environment is improved, and A fine pitch pattern can be generated. Also, when searching for a unit pattern from information on prominence,
The inflection of synthetic speech, which used to tend to be monotonous in the past, tends to be distracting, and intelligibility and naturalness can be improved. Further, when searching for a unit pattern from an intonation style, it is possible to accurately reproduce an intonation that is difficult to express by the rule-based generation.

【0075】また、請求項5記載の発明によれば、ニュ
ーラルネットワークによってユニットパターンを検索す
ることによって、学習した人間の発声パターンに近いパ
ターンを再現することができ、自然性を向上させること
ができる。
According to the fifth aspect of the present invention, by searching the unit pattern by the neural network, a pattern close to the learned human utterance pattern can be reproduced, and the naturalness can be improved. .

【0076】また、請求項6記載の発明において、アク
セント句境界の位置を用いてユニットパターンを配置す
る場合には、アクセント句の上昇開始点をほぼ再現で
き、了解性を向上させることができる。また、アクセン
ト核の位置を用いてユニットパターンを配置する場合に
は、アクセント句の下降開始点をほぼ再現でき、了解性
を向上させることができる。また、フレーズ末の音韻,
音節,モーラなどの境界位置を用いてユニットパターン
を配置する場合には、イントネーションを効果的に表現
でき、自然性を向上させることができる。また、ピッチ
変化部分近傍音韻環境情報を用いてユニットパターンを
配置することにより、ピッチパターンの時間構造をより
緻密に再現でき、自然性を向上させることができる。
Further, in the invention according to claim 6, when the unit pattern is arranged by using the position of the accent phrase boundary, the rising start point of the accent phrase can be almost reproduced, and the intelligibility can be improved. Further, when the unit pattern is arranged by using the position of the accent nucleus, the descent start point of the accent phrase can be almost reproduced, and the intelligibility can be improved. Also, the phoneme at the end of the phrase,
When the unit patterns are arranged by using the boundary positions such as syllables and mora, intonation can be effectively expressed and the naturalness can be improved. Further, by arranging the unit patterns using the phonological environment information in the vicinity of the pitch change portion, the time structure of the pitch pattern can be reproduced more precisely and the naturalness can be improved.

【0077】また、請求項7記載の発明によれば、アク
セント句の平坦部を時間軸方向に伸縮するようにしてお
り、ピッチ変化部については時間軸方向に変形しないこ
とにより、ピッチ変化部の時間構造を保存することがで
き、生理的制約から外れないパターンが保証されるた
め、安定した自然なピッチパターンを生成することがで
きる。また、アクセント句の上昇部と下降部をピッチ軸
方向の変形をするようにしており平坦部についてはピッ
チ軸方向に変形しないことにより、ピッチ定常部部の高
さやゆらぎ等を保存することができ、プロミネンスなど
も含めたパターン表現が可能となり自然性を向上させる
ことができる。
According to the seventh aspect of the present invention, the flat portion of the accent phrase is expanded and contracted in the time axis direction, and the pitch change portion is not deformed in the time axis direction. Since the temporal structure can be preserved and a pattern that does not deviate from physiological constraints is guaranteed, a stable and natural pitch pattern can be generated. Also, the rising and falling parts of the accent phrase are deformed in the pitch axis direction, and the flat part is not deformed in the pitch axis direction, so that the height and fluctuation of the constant pitch part can be preserved. , It is possible to express patterns including prominence and improve the naturalness.

【0078】また、請求項8,9記載の発明によれば、
ユニットパターン間を直線で補間することによって、処
理量を低減できて、高速化や低コスト化を図ることがで
き、また、ユニットパターン間を3次曲線で補間するこ
とによって、人間のピッチ変化に似た概形を表現でき、
自然なピッチパターンを生成することができる。
According to the inventions of claims 8 and 9,
By interpolating the unit patterns with a straight line, the processing amount can be reduced, and the speed and cost can be reduced. By interpolating the unit patterns with a cubic curve, the human pitch change can be prevented. You can express a similar outline,
A natural pitch pattern can be generated.

【0079】また、請求項10記載の発明によれば、パ
ターン記憶部に記憶されるユニットパターンとして、特
定の言語的状況において特徴的に現われるピッチパター
ンを用いるようになっているので、入力言語情報からヒ
ューリスティックにパターンを検索することができ、効
率的で効果的にピッチパターンを生成することができ
る。
According to the tenth aspect of the invention, since the pitch pattern characteristically appearing in a specific linguistic situation is used as the unit pattern stored in the pattern storage unit, the input language information is used. A heuristic pattern search can be performed from, and a pitch pattern can be efficiently and effectively generated.

【0080】また、請求項11記載の発明によれば、上
記ユニットパターンの1つとして、呼気段落や文など、
一連のフレーズにおける特定の位置において特徴的に現
われるピッチパターンを用いることにより、声立て成分
の分離・合成などの複雑な処理をせずに、フレーズ感、
文の終始感など表現でき、処理の簡略化を図ることがで
きる。
According to the eleventh aspect of the invention, as one of the unit patterns, an exhalation paragraph, a sentence, etc.
By using a pitch pattern that characteristically appears at a specific position in a series of phrases, the feeling of phrase can be achieved without complicated processing such as separation / synthesis of voice components.
It is possible to express the feeling of the beginning and end of a sentence and to simplify the processing.

【0081】また、請求項12記載の発明によれば、上
記ユニットパターンの1つとして、頭高型,平板型など
特定のアクセント型において特徴的に現われるピッチパ
ターンを用いることにより、アクセント核の有無、位置
などによって異なるアクセント句のパターン概形を、ア
クセント型の異なる複数のパターンを用意し使い分ける
ことで表現でき、自然性を向上させることができる。
According to the twelfth aspect of the present invention, as one of the unit patterns, by using a pitch pattern characteristically appearing in a specific accent type such as a head height type or a flat type, presence or absence of an accent nucleus is detected. The pattern outline of the accent phrase that differs depending on the position, etc. can be expressed by preparing a plurality of patterns with different accent types and using them properly, thereby improving the naturalness.

【0082】また、請求項13記載の発明によれば、上
記ユニットパターンの1つとして、プロミネンスが付与
されている部分,副次アクセント核が現われる部分など
の特定のアクセントレベルにおいて特徴的に現われるピ
ッチパターンを用いることにより、プロミネンス、副次
アクセントの表現も可能となり、自然性を向上させるこ
とができる。
According to the thirteenth aspect of the present invention, as one of the unit patterns, the pitch characteristically appearing at a specific accent level such as a portion to which prominence is added and a portion where a secondary accent nucleus appears. By using a pattern, prominence and secondary accents can be expressed, and the naturalness can be improved.

【0083】また、請求項14記載の発明によれば、上
記ユニットパターンの1つとして、間投詞や終助詞,擬
声語,擬態語,掛け声などのその語に独特のピッチパタ
ーンで発声される語を用いるか、あるいはフレーズのピ
ッチパターンをそのまま用いることにより、その語に独
特のピッチパターンで発声される語を忠実に再現でき
て、自然性を向上させることができる。
According to the fourteenth aspect of the present invention, as one of the unit patterns, a word such as an interjection, a final particle, an onomatopoeic word, a mimetic word, or a shout, which is uttered in a pitch pattern peculiar to the word, is used? Alternatively, by using the pitch pattern of the phrase as it is, it is possible to faithfully reproduce a word uttered in a pitch pattern unique to the word, and improve the naturalness.

【0084】また、請求項15記載の発明によれば、上
記ユニットパターンの1つとして、数字列,韻文などに
周期的に現われる特徴的ピッチパターンを用いることに
より、数字を棒読みする場合や韻文を朗読する場合など
の独特の節回しの発声にも対応することができ、装置の
汎用性を高めることができる。
According to the fifteenth aspect of the present invention, as one of the unit patterns, a characteristic pitch pattern that appears periodically in a number string, a verse, etc. is used to read a number or a verse. It is possible to deal with peculiar turning voices such as when reading aloud, and the versatility of the device can be enhanced.

【0085】また、請求項16記載の発明によれば、上
記ユニットパターンの1つとして、語や音韻から独立し
て主に韻律によって特定の意図を表わす特徴的ピッチパ
ターンを用いることにより、会話独特の「えー」や「う
ん」など、主に韻律の違いによって意図を表現する場合
にも、効率的に自然な会話出力が可能となる。
According to the sixteenth aspect of the present invention, as one of the unit patterns, a characteristic pitch pattern that expresses a specific intention mainly by prosody independently of words and phonemes is used, thereby making it unique to conversation. It is possible to efficiently and naturally output a conversation even when the intention is mainly expressed by a difference in prosody such as "er" and "yeah".

【0086】また、請求項17,請求項18記載の発明
によれば、パターン記憶手段には、折れ線近似されたユ
ニットパターンが記憶されるようになっており、この
際、折れ線近似されたユニットパターンは、始点のピッ
チおよび各折れ線のそれぞれの区間と折れ線の傾きとの
表現データによって表現されてパターン記憶手段に記憶
されることにより、ユニットパタ−ンのデ−タ量を減ら
し、メモリ量と処理量を軽減でき、低コスト化,高速化
を図ることができる。さらに、ユニットパタ−ンのピッ
チ方向のシフトは始点ピッチの増減のみで、時間方向の
伸縮は区間長の増減によって、それぞれ簡単に実現可能
で、ユニットパタ−ンの変形が簡単な処理によって実現
できるため、高速化,高機能化を図ることができる。
According to the seventeenth and eighteenth aspects of the present invention, the unit pattern approximated to the broken line is stored in the pattern storage means. At this time, the unit pattern approximated to the broken line is stored. Is expressed by expression data of the pitch of the starting point and each section of each polygonal line and the inclination of the polygonal line, and is stored in the pattern storage means, thereby reducing the data amount of the unit pattern, and reducing the memory amount and processing. The amount can be reduced, and the cost and speed can be reduced. Furthermore, the unit pattern can be shifted in the pitch direction only by increasing or decreasing the starting point pitch, and the expansion and contraction in the time direction can be easily realized by increasing or decreasing the section length, and the unit pattern can be deformed by a simple process. Therefore, high speed and high functionality can be achieved.

【0087】また、請求項19記載の発明によれば、上
記各折れ線の傾きは、ピッチ周期が単位長だけ変化する
のに要する時間としてのステップ値によって表現されて
おり、この場合、パターン検索手段は、パターン記憶手
段に記憶されているユニットパターンの表現データを検
索し、該表現データに基づきユニットパターンを再生す
るときに、ステップ値が正の値の場合、ピッチ周期を単
位長増加させ、ステップ値が負の値の場合、ピッチ周期
を単位長減少させる処理を行なうようになっているの
で、カウンタ,比較器などによる非常に簡単な構成で折
れ線近似のユニットパタ−ンを再生し、実際のピッチパ
タ−ンを得ることができる。
According to the nineteenth aspect of the present invention, the inclination of each of the polygonal lines is expressed by a step value as a time required for the pitch period to change by a unit length. In this case, the pattern search means. Searches the expression data of the unit pattern stored in the pattern storage means, and when the unit pattern is reproduced based on the expression data, if the step value is a positive value, the pitch period is increased by the unit length, and the step If the value is negative, the pitch period is reduced by the unit length.Therefore, the unit pattern of the polygonal line approximation is reproduced by a very simple structure such as a counter and a comparator, and the actual A pitch pattern can be obtained.

【0088】また、請求項20記載の発明によれば、パ
ターン変形手段は、各折れ線の傾きを表わすステップ値
に一定のバイアスを加えることによって、ユニットパタ
ーンにピッチ方向の滑らかな変形を施こすので、ユニッ
トパタ−ン間の接続やプロミネンス付与などで必要とな
るパタ−ン変形処理が加算器だけの非常に簡単な構成で
実現できる。
According to the twentieth aspect of the invention, the pattern deforming means applies a constant bias to the step value representing the inclination of each polygonal line, so that the unit pattern is smoothly deformed in the pitch direction. , The pattern modification processing required for connection between unit patterns and the addition of prominence can be realized with a very simple configuration of only the adder.

【0089】また、請求項21記載の発明によれば、パ
ターン変形手段は、ステップ値を“2”の補数表現によ
って扱い、バイアスを加えた結果のステップ値の絶対値
が最大値を越えた場合に、これを反対符号の最大絶対値
とするので、右上がりのパタ−ンから右下がりのパタ−
ンへ、またはその逆へ、連続的にかつ無理なく、パタ−
ン変形する処理を簡単に実現することができる。
According to the twenty-first aspect of the invention, the pattern transforming means treats the step value by the complement notation of "2", and when the absolute value of the step value as a result of applying the bias exceeds the maximum value. Since this is the maximum absolute value of the opposite sign, the pattern rising to the right to the pattern descending to the right.
Pattern continuously and comfortably,
It is possible to easily realize the process of transforming the image.

【0090】また、請求項22記載の発明によれば、ピ
ッチ変化量とバイアスとの対応関係が予め求められてい
る場合に、パターン変形手段は、該対応関係を用いてユ
ニットパターンのピッチ方向の変形を行なうので、ユニ
ットパタ−ン間の接続やプロミネンス付与などで必要と
なるバイアスを、処理量の多い乗除算を必要とすること
なく、極めて容易に求めることができ、処理の高速化を
図ることができる。
According to the twenty-second aspect of the present invention, when the correspondence between the pitch change amount and the bias is obtained in advance, the pattern deforming means uses the correspondence in the pitch direction of the unit pattern. Since the transformation is performed, the bias required for connection between unit patterns and the addition of prominence can be calculated very easily without the need for multiplication and division, which requires a large amount of processing, and the processing speed can be increased. be able to.

【0091】また、請求項23記載の発明によれば、さ
らに、パターン記憶手段に記憶されているユニットパタ
ーンと対応付けされて、条件を含むルールが記憶される
ルール記憶手段が設けられており、パターン検索手段
は、モーラなどの入力言語情報単位ごとにルール記憶手
段に記憶されているルールの条件を調べることによっ
て、ルールの条件を満たすユニットパターンをパターン
記憶手段から検索するようになっており、ユニットパタ
−ン検索処理をル−ル検索とすることによって、ユニッ
トパタ−ンの追加,削除,変更などのメンテナンスが容
易となる。
Further, according to the invention of claim 23, there is further provided a rule storage means for storing a rule including a condition in association with the unit pattern stored in the pattern storage means, The pattern search means is configured to search the unit condition satisfying the rule from the pattern storage means by checking the condition of the rule stored in the rule storage means for each input language information unit such as mora, By making the unit pattern search process a rule search, maintenance such as addition, deletion, and change of the unit pattern becomes easy.

【0092】また、請求項24記載の発明によれば、ル
ールの条件には、言語情報単位の特徴を表わす複数の変
数の値の範囲が含まれており、パターン検索手段は、ル
ールの条件に含まれる全ての変数について、入力言語情
報単位の値がその範囲内にあるとき当該ルールを採用す
ることによって、ユニットパターンを検索するようにな
っており、ル−ルの条件に言語情報単位の特徴を表わす
複数の変数の値の範囲を含ませることで、ル−ル検索を
ル−チン処理で行なうことができる。また、ル−ルを外
部デ−タ化することが容易となり、ル−ル自体の保守性
を高めることができる。
According to the twenty-fourth aspect of the present invention, the rule condition includes the range of the values of a plurality of variables representing the characteristics of the linguistic information unit, and the pattern search means sets the rule condition in the rule condition. For all variables included, when the value of the input linguistic information unit is within the range, the unit pattern is searched by adopting the rule, and the characteristics of the linguistic information unit are specified in the rule condition. By including the range of the values of a plurality of variables that represent, the rule search can be performed by the routine processing. Further, it becomes easy to convert the rule into external data, and the maintainability of the rule itself can be improved.

【0093】また、請求項25記載の発明によれば、ル
ールの条件に含まれる変数として、当該言語情報単位の
句頭あるいは句末からの位置を用いるか、または、当該
言語情報単位を含む句の隣接句との境界種別を用いる
か、または、当該言語情報単位を含む句のアクセント情
報を用いるか、または、当該言語情報単位の音韻情報を
用いるようになっており、ル−ルの条件に含まれる変数
として、言語情報単位の句頭あるいは句末からの位置を
用いることによって、句頭から句末へ向かって徐々に下
降するなど、句内位置によって連続的に変化するピッチ
パタ−ンの性質を表現することが可能となる。また、言
語情報単位を含む句の隣接句との境界種別を用いること
によって、読点位置よりも文末を特に下げることによる
文の終始感の演出や、疑問文等の様々なイントネ−ショ
ンスタイルへの対応など、句境界位置でのピッチパタ−
ンの特徴を表現することが可能となる。また、言語情報
単位を含む句のアクセント情報を用いることによって、
頭高型が中高型よりも左に傾いた山になるなどのアクセ
ント型による特徴や、プロミネンス,副次アクセント等
のアクセントレベルによる特徴など、ピッチパタ−ンの
特徴を表現することが可能となる。また、言語情報単位
の音韻情報を用いることによって、特定の音韻で見られ
る局所的なピッチパタ−ンの特徴や、音韻継続時間長の
影響などを表現することが可能となる。
According to the twenty-fifth aspect of the invention, as the variable included in the condition of the rule, the position from the beginning or the end of the phrase of the language information unit is used, or the phrase including the language information unit is used. The boundary type of the adjacent phrase is used, or the accent information of the phrase including the linguistic information unit is used, or the phoneme information of the linguistic information unit is used. By using the position from the beginning or end of the linguistic information unit as a variable to be included, the pitch pattern changes gradually depending on the position within the phrase, such as a gradual decrease from the beginning to the end of the phrase. Can be expressed. In addition, by using the boundary type of the phrase including the linguistic information unit with the adjacent phrase, it is possible to produce a feeling of beginning and end of the sentence by lowering the end of the sentence more than the reading point position, and to various intonation styles such as question sentences. Pitch pattern at phrase boundaries, such as correspondence
It is possible to express the characteristics of the computer. Moreover, by using the accent information of the phrase including the linguistic information unit,
It is possible to express the characteristics of pitch patterns such as accent type features such as a head-height type that is tilted to the left rather than the middle-high type and accent level features such as prominence and secondary accents. Further, by using the phoneme information in units of linguistic information, it is possible to represent the characteristics of the local pitch pattern seen in a specific phoneme, the influence of the phoneme duration, and the like.

【0094】また、請求項26記載の発明によれば、1
つのルールに複数のユニットパターンが対応付けされて
おり、ルールの条件を満たすユニットパターンが複数検
索される場合に、ゆれを与えて1つのユニットパターン
を選択するので、画一的で機械的なピッチパタ−ンを避
けることが可能となり、より自然なピッチパターンを得
ることができる。
According to the invention of claim 26, 1
When a plurality of unit patterns are associated with one rule and a plurality of unit patterns satisfying the rule are searched for, one unit pattern is given with fluctuation, so that a uniform mechanical pitch pattern is selected. Therefore, it is possible to avoid the noise and obtain a more natural pitch pattern.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係るピッチパターン生成装置の一実施
例のブロックである。
FIG. 1 is a block diagram of an embodiment of a pitch pattern generation device according to the present invention.

【図2】ユニットパターンの切り出しの一例を説明する
ための図である。
FIG. 2 is a diagram for explaining an example of cutting out a unit pattern.

【図3】ユニットパターンの切り出しの一例を説明する
ための図である。
FIG. 3 is a diagram for explaining an example of cutting out a unit pattern.

【図4】ユニットパターンの切り出しの一例を説明する
ための図である。
FIG. 4 is a diagram for explaining an example of cutting out a unit pattern.

【図5】ユニットパターンの切り出しの一例を説明する
ための図である。
FIG. 5 is a diagram for explaining an example of cutting out a unit pattern.

【図6】ユニットパターンの時間軸上の位置を決定する
様子を説明するための図である。
FIG. 6 is a diagram for explaining how to determine the position of the unit pattern on the time axis.

【図7】ユニットパターンの時間軸上の変形の様子を説
明するための図である。
FIG. 7 is a diagram for explaining how the unit pattern is deformed on the time axis.

【図8】ユニットパターンのピッチ軸上の変形の様子を
説明するための図である。
FIG. 8 is a diagram for explaining how the unit pattern is deformed on the pitch axis.

【図9】入力言語情報からユニットパターンを検索して
ピッチパターンを合成する処理の具体例を示す図であ
る。
FIG. 9 is a diagram showing a specific example of a process of retrieving a unit pattern from input language information and synthesizing a pitch pattern.

【図10】ユニットパターンを折れ線近似した一例を示
す図である。
FIG. 10 is a diagram showing an example of polygonal line approximation of a unit pattern.

【図11】(a),(b)はステップ値を説明するため
の図である。
11A and 11B are diagrams for explaining a step value.

【図12】ユニットパターン生成回路の一例を示す図で
ある。
FIG. 12 is a diagram showing an example of a unit pattern generation circuit.

【図13】ユニットパターンの傾きを調整する処理を説
明するための図である。
FIG. 13 is a diagram for explaining processing for adjusting the inclination of the unit pattern.

【図14】バイアステ−ブルの一例を示す図である。FIG. 14 is a diagram showing an example of a bias table.

【図15】パターンの変形処理を説明するための図であ
る。
FIG. 15 is a diagram for explaining pattern modification processing.

【図16】図1に示すピッチパタ−ン生成装置の変形例
を示す図である。
16 is a diagram showing a modification of the pitch pattern generation device shown in FIG.

【図17】パタ−ン記憶部に記憶されている各種のユニ
ットパタ−ンを示す図である。
FIG. 17 is a diagram showing various unit patterns stored in a pattern storage unit.

【図18】ル−ル記憶部に記憶されているル−ルの構成
例を示す図である。
FIG. 18 is a diagram showing a configuration example of rules stored in a rule storage unit.

【図19】入力モ−ラ列の一例を示す図である。FIG. 19 is a diagram showing an example of an input mirror sequence.

【符号の説明】[Explanation of symbols]

1 パターン記憶部 2 パターン検索部 3 パターン配置部 4 パターン変形部 5 パターン接続部 7 ル−ル記憶部 1 pattern storage unit 2 pattern search unit 3 pattern arrangement unit 4 pattern transformation unit 5 pattern connection unit 7 rule storage unit

Claims (26)

【特許請求の範囲】[Claims] 【請求項1】 人間の発声のピッチパターンから適当な
単位で切り出したユニットパターンを記憶するパターン
記憶手段と、所定の入力属性または入力言語情報に基づ
き、該入力属性または入力言語情報に適合したユニット
パターンを検索するパターン検索手段と、検索により得
られたユニットパターンを時間軸上に配置するパターン
配置手段と、時間軸上に配置されたユニットパターンを
変形するパターン変形手段とを有していることを特徴と
するピッチパターン生成装置。
1. A pattern storage means for storing a unit pattern cut out from a human utterance pitch pattern in appropriate units, and a unit adapted to the input attribute or input language information based on a predetermined input attribute or input language information. It has pattern search means for searching a pattern, pattern arrangement means for arranging the unit pattern obtained by the search on the time axis, and pattern deforming means for deforming the unit pattern arranged on the time axis. A pitch pattern generation device characterized by:
【請求項2】 請求項1記載のピッチパターン生成装置
において、前記ユニットパターンとしては、アクセント
句の上昇部と下降部とをそれぞれ1つ含むものを1つの
単位として切り出したパタ−ン、アクセント句の上昇部
または下降部を1つ含むものを1つの単位として切り出
したパタ−ン、アクセント句の平坦部を含むピッチパタ
ーン区間を1つの単位として切り出したパタ−ン、フレ
ーズ末の特徴的ピッチ変化を示す部分を1つの単位とし
て切り出したパタ−ン、特定の範囲の変化率を示すピッ
チパターン区間を1つの単位として切り出したパタ−
ン、特定の範囲の曲率を示すピッチパターン区間を1つ
の単位として切り出したパタ−ンのうちの、少なくとも
1つが用いられることを特徴とするピッチパターン生成
装置。
2. The pitch pattern generating device according to claim 1, wherein the unit pattern includes a pattern including an ascending part and an descending part of an accent phrase as one unit and an accent phrase. A pattern that is cut out as one unit that includes one ascending part or a descending part, a pattern that is cut out as a unit a pitch pattern section that includes a flat part of an accent phrase, and a characteristic pitch change at the end of a phrase. , A pattern cut out as a unit, and a pattern cut out as a unit of a pitch pattern section showing a rate of change in a specific range.
A pitch pattern generation device characterized in that at least one of patterns obtained by cutting out a pitch pattern section showing a curvature of a specific range as one unit is used.
【請求項3】 請求項1記載のピッチパターン生成装置
において、前記パターン記憶手段には、切り出されたユ
ニットパターンが記憶されるか、あるいは切り出された
ユニットパターンをベクトル量子化したものが記憶され
るようになっていることを特徴とするピッチパターン生
成装置。
3. The pitch pattern generation device according to claim 1, wherein the pattern storage means stores a cut-out unit pattern or a vector-quantized version of the cut-out unit pattern. A pitch pattern generation device characterized by the above.
【請求項4】 請求項1記載のピッチパターン生成装置
において、前記パターン検索手段は、入力属性として、
ピッチ変化部分近傍の複数モーラにわたる音韻環境情
報、ユニットパターン内あるいはその近傍におけるプロ
ミネンスに関する情報、ユニットパターンが含まれるフ
レーズのイントネーションスタイルの情報のうちの少な
くとも1つの情報を使用するようになっていることを特
徴とするピッチパターン生成装置。
4. The pitch pattern generation device according to claim 1, wherein the pattern search means has an input attribute,
At least one of phonological environment information over a plurality of moras near the pitch change portion, prominence information in or near the unit pattern, and intonation style information of the phrase including the unit pattern is used. A pitch pattern generation device characterized by:
【請求項5】 請求項1記載のピッチパターン生成装置
において、前記パターン検索手段は、入力属性からニュ
ーラルネットワークによって最適なユニットパターンを
決定するようになっていることを特徴とするピッチパタ
ーン生成装置。
5. The pitch pattern generating device according to claim 1, wherein the pattern searching means is adapted to determine an optimum unit pattern by a neural network from an input attribute.
【請求項6】 請求項1記載のピッチパターン生成装置
において、前記パターン配置手段は、アクセント句境界
の時間軸上の位置、アクセント核の時間軸上の位置、フ
レーズ末の音韻,音節,モーラなどの境界の時間軸上の
位置、ピッチ変化部分近傍の音韻環境情報のうちの少な
くとも1つを入力情報としてユニットパターンの時間軸
上の位置を決定するようになっていることを特徴とする
ピッチパターン生成装置。
6. The pitch pattern generating device according to claim 1, wherein the pattern arranging means arranges the position of the accent phrase boundary on the time axis, the position of the accent kernel on the time axis, the phoneme at the end of the phrase, the syllable, the mora, etc. The position of the unit pattern on the time axis is determined by using at least one of the position of the boundary of the time axis on the time axis and the phoneme environment information near the pitch change portion as input information. Generator.
【請求項7】 請求項1記載のピッチパターン生成装置
において、前記パターン変形手段は、ユニットパターン
がアクセント句内の平坦部境界情報を持つ場合には、平
坦部を時間軸方向に伸縮するような変形を施し、ユニッ
トパターンがアクセント句内の上昇部と下降部の境界情
報を持つ場合には、上昇部と下降部をピッチ軸方向に伸
縮するような変形を施すようになっていることを特徴と
するピッチパターン生成装置。
7. The pitch pattern generating device according to claim 1, wherein the pattern modifying means expands or contracts the flat portion in the time axis direction when the unit pattern has flat portion boundary information in the accent phrase. When the unit pattern is modified and the unit pattern has boundary information of the rising part and the descending part in the accent phrase, the rising part and the descending part are expanded and contracted in the pitch axis direction. Pitch pattern generator.
【請求項8】 請求項1記載のピッチパターン生成装置
において、前記パタ−ン変形手段によって変形されたユ
ニットパターンを接続して一連のフレーズのパターンを
生成するパターン接続手段がさらに設けられていること
を特徴とするピッチパターン生成装置。
8. The pitch pattern generating device according to claim 1, further comprising pattern connecting means for connecting the unit patterns deformed by the pattern deforming means to generate a series of phrase patterns. A pitch pattern generation device characterized by:
【請求項9】 請求項8記載のピッチパターン生成装置
において、前記パターン接続手段は、ユニットパターン
間を直線で補間して接続するか、あるいは、ユニットパ
ターン間を3次曲線で補間して接続するようになってい
ることを特徴とするピッチパターン生成装置。
9. The pitch pattern generation device according to claim 8, wherein the pattern connection means connects by interpolating unit patterns with a straight line or connecting by interpolating unit patterns with a cubic curve. A pitch pattern generation device characterized by the above.
【請求項10】 請求項1記載のピッチパターン生成装
置において、前記パターン記憶手段に記憶されるユニッ
トパターンとしては、特定の言語的状況において特徴的
に現われるピッチパターンが用いられることを特徴とす
るピッチパターン生成装置。
10. The pitch pattern generating device according to claim 1, wherein the unit pattern stored in the pattern storage means is a pitch pattern characteristically appearing in a specific linguistic situation. Pattern generator.
【請求項11】 請求項10記載のピッチパターン生成
装置において、前記ユニットパターンの1つとして、呼
気段落や文などの、一連のフレーズにおける特定の位置
において特徴的に現われるピッチパターンが用いられる
ことを特徴とするピッチパターン生成装置。
11. The pitch pattern generation device according to claim 10, wherein a pitch pattern characteristically appearing at a specific position in a series of phrases, such as an exhalation paragraph or a sentence, is used as one of the unit patterns. Characteristic pitch pattern generator.
【請求項12】 請求項10記載のピッチパターン生成
装置において、前記ユニットパターンの1つとして、頭
高型,平板型などの特定のアクセント型において特徴的
に現われるピッチパターンが用いられることを特徴とす
るピッチパターン生成装置。
12. The pitch pattern generating device according to claim 10, wherein a pitch pattern characteristically appearing in a particular accent type such as a head height type or a flat plate type is used as one of the unit patterns. Pitch pattern generator.
【請求項13】 請求項10記載のピッチパターン生成
装置において、前記ユニットパターンの1つとして、プ
ロミネンスが付与されている部分,副次アクセント核が
現われる部分などの特定のアクセントレベルにおいて特
徴的に現われるピッチパターンが用いられることを特徴
とするピッチパターン生成装置。
13. The pitch pattern generation device according to claim 10, wherein as one of the unit patterns, a characteristic pattern appears at a specific accent level such as a part to which prominence is added and a part where a secondary accent nucleus appears. A pitch pattern generation device characterized in that a pitch pattern is used.
【請求項14】 請求項10記載のピッチパターン生成
装置において、前記ユニットパターンの1つとして、間
投詞や終助詞,擬声語,擬態語,掛け声などのその語に
特有のピッチパターンで発声される語が用いられるか、
あるいはフレーズのピッチパターンがそのまま用いられ
ることを特徴とするピッチパターン生成装置。
14. The pitch pattern generation device according to claim 10, wherein a word uttered in a pitch pattern peculiar to the word is used as one of the unit patterns, such as interjections, final particles, onomatopoeia, mimetic words, and shouts. Or
Alternatively, the pitch pattern generation device is characterized in that the pitch pattern of the phrase is used as it is.
【請求項15】 請求項10記載のピッチパターン生成
装置において、前記ユニットパターンの1つとして、数
字列,韻文などに周期的に現われる特徴的ピッチパター
ンが用いられることを特徴とするピッチパターン生成装
置。
15. The pitch pattern generation device according to claim 10, wherein a characteristic pitch pattern periodically appearing in a number string, a verse, or the like is used as one of the unit patterns. .
【請求項16】 請求項10記載のピッチパターン生成
装置において、前記ユニットパターンの1つとして、語
や音韻から独立して主に韻律によって特定の意図を表わ
す特徴的ピッチパターンが用いられることを特徴とする
ピッチパターン生成装置。
16. The pitch pattern generation device according to claim 10, wherein a characteristic pitch pattern that represents a specific intention mainly by prosody independently of words or phonemes is used as one of the unit patterns. Pitch pattern generator.
【請求項17】 請求項1記載のピッチパターン生成装
置において、前記パターン記憶手段には、折れ線近似さ
れたユニットパターンが記憶されることを特徴とするピ
ッチパターン生成装置。
17. The pitch pattern generation device according to claim 1, wherein the pattern storage means stores a unit pattern approximated to a broken line.
【請求項18】 請求項17記載のピッチパターン生成
装置において、前記折れ線近似されたユニットパターン
は、始点のピッチおよび各折れ線のそれぞれの区間と折
れ線の傾きとの表現データによって表現されて前記パタ
ーン記憶手段に記憶されることを特徴とするピッチパタ
ーン生成装置。
18. The pitch pattern generation device according to claim 17, wherein the polygonal line approximated unit pattern is expressed by expression data of a pitch of a start point, each section of each polygonal line, and an inclination of the polygonal line, and the pattern storage. A pitch pattern generation device characterized by being stored in a means.
【請求項19】 請求項18記載のピッチパターン生成
装置において、各折れ線の傾きは、ピッチ周期が単位長
だけ変化するのに要する時間としてのステップ値によっ
て表現されており、この場合、前記パターン検索手段
は、パターン記憶手段に記憶されているユニットパター
ンの表現データを検索し、該表現データに基づきユニッ
トパターンを再生するときに、ステップ値が正の値の場
合、ピッチ周期を単位長増加させ、ステップ値が負の値
の場合、ピッチ周期を単位長減少させる処理を行なうよ
うになっていることを特徴とするピッチパターン生成装
置。
19. The pitch pattern generation device according to claim 18, wherein the inclination of each polygonal line is represented by a step value as a time required for the pitch period to change by a unit length, and in this case, the pattern search. The means searches the expression data of the unit pattern stored in the pattern storage means, and when reproducing the unit pattern based on the expression data, if the step value is a positive value, increases the pitch period by a unit length, A pitch pattern generation device, wherein when the step value is a negative value, processing for reducing the pitch period by a unit length is performed.
【請求項20】 請求項19記載のピッチパターン生成
装置において、前記パターン変形手段は、各折れ線の傾
きを表わすステップ値に一定のバイアスを加えることに
よって、前記ユニットパターンにピッチ方向の滑らかな
変形を施こすことを特徴とするピッチパターン生成装
置。
20. The pitch pattern generating device according to claim 19, wherein the pattern deforming means applies a constant bias to a step value representing the inclination of each polygonal line to smoothly deform the unit pattern in the pitch direction. A pitch pattern generating device characterized by being applied.
【請求項21】 請求項20記載のピッチパターン生成
装置において、前記パターン変形手段は、ピッチ更新周
期を“2”の補数表現によって扱い、バイアスを加えた
結果のステップ値の絶対値が最大値を越えた場合に、こ
れを反対符号の最大絶対値とすることを特徴とするピッ
チパターン生成装置。
21. The pitch pattern generation device according to claim 20, wherein the pattern transformation means treats the pitch update period by a complement notation of "2", and the absolute value of the step value as a result of applying the bias has a maximum value. A pitch pattern generation device characterized in that when it exceeds, it is set to the maximum absolute value of the opposite sign.
【請求項22】 請求項20または請求項21記載のピ
ッチパターン生成装置において、ピッチ変化量とバイア
スとの対応関係が予め求められている場合に、前記パタ
ーン変形手段は、該対応関係を用いてユニットパターン
のピッチ方向の変形を行なうことを特徴とするピッチパ
ターン生成装置。
22. In the pitch pattern generation device according to claim 20 or 21, when the correspondence between the pitch change amount and the bias is obtained in advance, the pattern deforming means uses the correspondence. A pitch pattern generation device characterized in that a unit pattern is deformed in the pitch direction.
【請求項23】 請求項1記載のピッチパターン生成装
置において、さらに、前記パターン記憶手段に記憶され
ているユニットパターンと対応付けされて、条件を含む
ルールが記憶されるルール記憶手段が設けられており、
前記パターン検索手段は、モーラなどの入力言語情報単
位ごとに前記ルール記憶手段に記憶されているルールの
条件を調べることによって、ルールの条件を満たすユニ
ットパターンを前記パターン記憶手段から検索するよう
になっていることを特徴とするピッチパターン生成装
置。
23. The pitch pattern generation device according to claim 1, further comprising rule storage means for storing a rule including a condition in association with a unit pattern stored in the pattern storage means. Cage,
The pattern search means searches the pattern storage means for a unit pattern satisfying the rule by checking the condition of the rule stored in the rule storage means for each input language information unit such as a mora. A pitch pattern generation device characterized in that.
【請求項24】 請求項23記載のピッチパターン生成
装置において、前記ルールの条件には、言語情報単位の
特徴を表わす複数の変数の値の範囲が含まれており、前
記パターン検索手段は、ルールの条件に含まれる全ての
変数について、入力言語情報単位の値がその範囲内にあ
るとき当該ルールを採用することによって、ユニットパ
ターンを検索するようになっていることを特徴とするピ
ッチパターン生成装置。
24. The pitch pattern generation device according to claim 23, wherein the condition of the rule includes a range of values of a plurality of variables that represent characteristics of a linguistic information unit, and the pattern search means is a rule. A pitch pattern generation device characterized in that a unit pattern is searched for by adopting the rule when the value of the input linguistic information unit is within the range for all variables included in the condition .
【請求項25】 請求項24記載のピッチパターン生成
装置において、ルールの条件に含まれる変数として、当
該言語情報単位の句頭あるいは句末からの位置を用いる
か、または、当該言語情報単位を含む句の隣接句との境
界種別を用いるか、または、当該言語情報単位を含む句
のアクセント情報を用いるか、または、当該言語情報単
位の音韻情報を用いることを特徴とするピッチパターン
生成装置。
25. The pitch pattern generation device according to claim 24, wherein a position from the beginning or end of the linguistic information unit is used as a variable included in the rule condition, or the linguistic information unit is included. A pitch pattern generation device characterized by using a boundary type of a phrase with an adjacent phrase, using accent information of a phrase including the linguistic information unit, or using phonological information of the linguistic information unit.
【請求項26】 請求項23記載のピッチパターン生成
装置において、1つのルールに複数のユニットパターン
が対応付けされており、ルールの条件を満たすユニット
パターンが複数検索される場合に、ゆれを与えて1つの
ユニットパターンを選択することを特徴とするピッチパ
ターン生成装置。
26. In the pitch pattern generation device according to claim 23, when one rule is associated with a plurality of unit patterns and a plurality of unit patterns satisfying the rule are retrieved, a fluctuation is given. A pitch pattern generation device characterized by selecting one unit pattern.
JP18005693A 1992-07-30 1993-06-24 Pitch pattern generator Expired - Fee Related JP3425996B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18005693A JP3425996B2 (en) 1992-07-30 1993-06-24 Pitch pattern generator

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP22347492 1992-07-30
JP4-223474 1992-07-30
JP4-354513 1992-12-16
JP35451392 1992-12-16
JP18005693A JP3425996B2 (en) 1992-07-30 1993-06-24 Pitch pattern generator

Publications (2)

Publication Number Publication Date
JPH06236197A true JPH06236197A (en) 1994-08-23
JP3425996B2 JP3425996B2 (en) 2003-07-14

Family

ID=27324794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18005693A Expired - Fee Related JP3425996B2 (en) 1992-07-30 1993-06-24 Pitch pattern generator

Country Status (1)

Country Link
JP (1) JP3425996B2 (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149180A (en) * 2000-11-16 2002-05-24 Matsushita Electric Ind Co Ltd Device and method for synthesizing voice
WO2002073595A1 (en) * 2001-03-08 2002-09-19 Matsushita Electric Industrial Co., Ltd. Prosody generating device, prosody generarging method, and program
WO2002086861A1 (en) * 2001-04-20 2002-10-31 Sony Corporation Language processor
JP2004226505A (en) * 2003-01-20 2004-08-12 Toshiba Corp Pitch pattern generating method, and method, system, and program for speech synthesis
US7092878B1 (en) 1999-08-03 2006-08-15 Canon Kabushiki Kaisha Speech synthesis using multi-mode coding with a speech segment dictionary
JP2006308998A (en) * 2005-04-28 2006-11-09 Brother Ind Ltd Speech synthesis device and speech synthesis program
US7155390B2 (en) 2000-03-31 2006-12-26 Canon Kabushiki Kaisha Speech information processing method and apparatus and storage medium using a segment pitch pattern model
US7487093B2 (en) 2002-04-02 2009-02-03 Canon Kabushiki Kaisha Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092878B1 (en) 1999-08-03 2006-08-15 Canon Kabushiki Kaisha Speech synthesis using multi-mode coding with a speech segment dictionary
US7155390B2 (en) 2000-03-31 2006-12-26 Canon Kabushiki Kaisha Speech information processing method and apparatus and storage medium using a segment pitch pattern model
JP2002149180A (en) * 2000-11-16 2002-05-24 Matsushita Electric Ind Co Ltd Device and method for synthesizing voice
WO2002073595A1 (en) * 2001-03-08 2002-09-19 Matsushita Electric Industrial Co., Ltd. Prosody generating device, prosody generarging method, and program
US7200558B2 (en) 2001-03-08 2007-04-03 Matsushita Electric Industrial Co., Ltd. Prosody generating device, prosody generating method, and program
US8738381B2 (en) 2001-03-08 2014-05-27 Panasonic Corporation Prosody generating devise, prosody generating method, and program
WO2002086861A1 (en) * 2001-04-20 2002-10-31 Sony Corporation Language processor
US7487093B2 (en) 2002-04-02 2009-02-03 Canon Kabushiki Kaisha Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof
JP2004226505A (en) * 2003-01-20 2004-08-12 Toshiba Corp Pitch pattern generating method, and method, system, and program for speech synthesis
JP2006308998A (en) * 2005-04-28 2006-11-09 Brother Ind Ltd Speech synthesis device and speech synthesis program
JP4736524B2 (en) * 2005-04-28 2011-07-27 ブラザー工業株式会社 Speech synthesis apparatus and speech synthesis program

Also Published As

Publication number Publication date
JP3425996B2 (en) 2003-07-14

Similar Documents

Publication Publication Date Title
US9218803B2 (en) Method and system for enhancing a speech database
US6499014B1 (en) Speech synthesis apparatus
EP1221693B1 (en) Prosody template matching for text-to-speech systems
Wouters et al. Control of spectral dynamics in concatenative speech synthesis
JP2000305582A (en) Speech synthesizing device
JP2006330200A (en) Pitch pattern generation method and its system
US7912718B1 (en) Method and system for enhancing a speech database
US6424937B1 (en) Fundamental frequency pattern generator, method and program
JP3425996B2 (en) Pitch pattern generator
JP2761552B2 (en) Voice synthesis method
JP5874639B2 (en) Speech synthesis apparatus, speech synthesis method, and speech synthesis program
JP2010224418A (en) Voice synthesizer, method, and program
JPH0580791A (en) Device and method for speech rule synthesis
JP2001034284A (en) Voice synthesizing method and voice synthesizer and recording medium recorded with text voice converting program
JP3742206B2 (en) Speech synthesis method and apparatus
JPH11249676A (en) Voice synthesizer
JP2003330482A (en) Method, device, and program for generating fundamental frequency pattern and method, device and program for synthesizing voice
JP2011191528A (en) Rhythm creation device and rhythm creation method
JP2001100777A (en) Method and device for voice synthesis
JP3314116B2 (en) Voice rule synthesizer
JP3515268B2 (en) Speech synthesizer
JP2004206144A (en) Fundamental frequency pattern generating method and program recording medium
JPH09292897A (en) Voice synthesizing device
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
JPH11352997A (en) Voice synthesizing device and control method thereof

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080509

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090509

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100509

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees