JPS59192293A - Pitch frequency generator for uttered language - Google Patents

Pitch frequency generator for uttered language

Info

Publication number
JPS59192293A
JPS59192293A JP58065595A JP6559583A JPS59192293A JP S59192293 A JPS59192293 A JP S59192293A JP 58065595 A JP58065595 A JP 58065595A JP 6559583 A JP6559583 A JP 6559583A JP S59192293 A JPS59192293 A JP S59192293A
Authority
JP
Japan
Prior art keywords
pitch
mora
change rate
accent
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58065595A
Other languages
Japanese (ja)
Inventor
義注 太田
古谷 哲夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58065595A priority Critical patent/JPS59192293A/en
Publication of JPS59192293A publication Critical patent/JPS59192293A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、法則による音声合成装置において用いるピッ
チ周波数生成装置に係り、特に簡略な処理、少ない記憶
容量で自然性の高いピッチ周波数を生成することのでき
るビ1.チ周波数生成装置に関する。
[Detailed Description of the Invention] [Field of Application of the Invention] The present invention relates to a pitch frequency generation device used in a law-based speech synthesis device, and particularly to generate a highly natural pitch frequency with simple processing and small storage capacity. Bi1. The present invention relates to a frequency generation device.

〔契1階〕 従来、音声合成のための駆動音源パルスの繰り返し周波
数、すなわちピッチ周波数(以下単にピッチと呼ぶ)を
得る方法として、実際に発声された音声から抽出する方
法が知られている。
[First Floor] Conventionally, as a method of obtaining the repetition frequency of a driving sound source pulse for speech synthesis, that is, the pitch frequency (hereinafter simply referred to as pitch), a method of extracting it from the actually uttered speech is known.

この方法は少数の限られた単語の音声合成には最適な方
法であって広く用いられている。しかし近年、端末装置
の音声応答やワードプロセッサの読み合せ機能に代表さ
れるように、無限の語いを音声合成によシ発声させる試
みがなされている。このためには合成パラメータを法則
(規則)により作成した士で音声をこのバラメークで合
成する必要がある。この方法は一般に法則合成法と言わ
れている。
This method is the most suitable method for speech synthesis of a limited number of words and is widely used. However, in recent years, attempts have been made to utter an infinite number of words using speech synthesis, as typified by the voice response function of terminal devices and the read-aloud function of word processors. To do this, it is necessary to create synthesis parameters according to rules and synthesize the voices using this variation. This method is generally called the law synthesis method.

法則合成で発声させる場合、合成音声の自然性特にアク
セント感を出すためには測用に自然音声と類似j〜たピ
ッチの時間変化(以下ピッチパターンと呼ぶ)を簡略な
法則で得るかが鍵となる。
When producing speech using lawful synthesis, the key to creating a natural, especially accented sound in the synthesized speech is to use simple rules to obtain temporal changes in pitch (hereinafter referred to as pitch patterns) that are similar to natural speech. becomes.

単語単位のピッチパターンを得る方法としては (1)  ビ・チの生成機構を、臨界制動2次線形系の
ステップ応答で近(LJ、 L、発音の初めと途中のア
クセント時刻に該線形系にパルス信号を挿入し、その応
答を演算しピッチパターンとする方法(日本音響学会誌
27巻9号1971 )(2)  単語または文音声の
各モーラの母音のエネルギー重心点近傍の一膚のピッチ
(以下点ピッチと呼ぶ)をパターンとして記憶しておき
(たとえば3モーラの単語は6声の点ピッチパターンで
表現する)、こねら璋ピッチ間を直線寸たは余弦関数、
高次代数間Vて補間して全体のビ、7チパターンを作成
する方法(%許公報昭55−1598 ) などが考えら力、ていた。
The method of obtaining the pitch pattern for each word is as follows: (1) The generation mechanism of bi-chi is expressed as a step response of a critical damped quadratic linear system (LJ, L, at the accent time at the beginning and middle of pronunciation). A method of inserting a pulse signal and calculating the response to create a pitch pattern (Journal of the Acoustical Society of Japan Vol. 27, No. 9, 1971) (hereinafter referred to as point pitch) is memorized as a pattern (for example, a 3-mora word is expressed as a 6-tone point pitch pattern), and the distance between the pitches is determined by a straight line or a cosine function.
A method of interpolating V between higher-order algebras to create an overall B-7 pattern was considered.

上記(1)の方法はステップ応答を演算する処理量が犬
きく、寸たパルス信号を入れてがら実際のビ1.チパタ
ーンを得る寸でにある程度の遅れが生じ、その遅りはパ
ルス信号値の大きさで異なる。したがってパルス化−@
iを入力する時刻を定めるのが困難であった。
The above method (1) requires a large amount of processing to calculate the step response, and it is difficult to calculate the actual Bi1. A certain amount of delay occurs when the pattern is obtained, and the delay differs depending on the magnitude of the pulse signal value. Therefore, pulsing −@
It was difficult to determine the time to input i.

(2)の方法は、点ピッチ間を補間する方法は直線であ
れば非常に簡略化されるが、点ピッチパターンを記憶す
るのに大きな容量を必要とする。
In the method (2), the method of interpolating between point pitches is greatly simplified if it is a straight line, but it requires a large capacity to store the point pitch pattern.

たとえば日本語単語ではルモーラ単語に対してはφかn
型までのアクセント型があり、1モ一ラ単語から10モ
一ラ単語までを考えても、点ピッチを8ビ1.トで表明
すると の容量のピッチパターンを必要とする。
For example, in Japanese words, φ or n for rumora words.
There are accent types up to 8 bi1. Requires a pitch pattern of the capacity to be asserted at the start.

〔発明の目的〕[Purpose of the invention]

本発明の目的は、上記従来技術の欠点を除き、簡略な処
理と少ない記憶容量で、音声合成に必要なピッチ周波数
を生成する装置を提供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide an apparatus that eliminates the drawbacks of the prior art described above and generates pitch frequencies necessary for speech synthesis with simple processing and small storage capacity.

〔発明の概要〕[Summary of the invention]

この目的を達成するために1本発明は、日本語の単語の
ピッチパターンが、モーラ数とアクセント型でほぼ決定
され、モーラ内でのピッチ変化率がほぼ一定であること
を利用し、少々くとも4種以上のピッチ変化高とこの変
化率を符号化したデータで異なるモーラ数、アクセント
型のピッチパターンをモーラ単位で表現した辞書を用意
し、この辞書とピッチ変化率から簡単な処理でピッチ周
波数を生成するものである。
In order to achieve this objective, the present invention takes advantage of the fact that the pitch pattern of Japanese words is almost determined by the number of moras and the accent type, and that the rate of pitch change within a mora is almost constant. We prepare a dictionary that expresses different mora numbers and accent-type pitch patterns in units of mora using encoded data of four or more types of pitch change heights and their rate of change, and use this dictionary and pitch change rate to easily calculate the pitch. It generates frequencies.

〔発明の実施例〕[Embodiments of the invention]

以下、本発明の実施例を図面について説明する。 Embodiments of the present invention will be described below with reference to the drawings.

甘ず、日本語の単語におけるモーラ毅、アクセント型に
対するピッチパターンの関係について説明する、 標準日本語の単語アクセントの特徴は第1モーラから第
2モーラにかけて必ず顕著なピッチの上昇又は下降があ
り、かっ−単胎内での顕著な下降は一ケ所に限られるこ
とである。このことからn個のモーラで構成される単語
には(n+1)種類のアクセント型があることになる。
Amazumi explains the relationship between pitch patterns and accent types in Japanese words. Standard Japanese word accents are characterized by the fact that there is always a noticeable rise or fall in pitch from the first to the second mora. - The significant decline within a single fetus is limited to one location. This means that a word composed of n moras has (n+1) types of accent types.

第1図にたとえば4,5モ一ラ単語のアクセント型を図
式的に示す。図中のΦ印は各モーラのピンチを・印は後
続の助詞のビ、7チを表わしている。
FIG. 1 diagrammatically shows, for example, the accent type of a 4- or 5-mole word. The Φ marks in the figure represent the pinch of each mora, and the marks represent the bi and 7 chi of the following particles.

第Lモーラとi(L+1)モーラの間でビ、、チが顕著
に下降するものを第り型アクセントと貯−び、顕著な下
降をしないものを第G型アクセントと呼ぶ。
An accent in which B,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ki, , and ji and fall significantly between the Lth mora and the i(L+1) mora is called a‐type accent, and an accent that does not fall significantly is called a G‐type accent.

藤崎等(日本音響学会誌27巻9号(1971年))は
、アクセント型に固有なビ・チパターンを見いたすため
に男女各6名の単語発声を歓迎1し、発声者の個人差全
除去すれば同一の単語アクセント型の対砂ピ1.チパタ
ーンが話者に固有な一定値を除けば本質的に相似である
ことを見い出した。
Fujisaki et al. (Journal of the Acoustical Society of Japan, Vol. 27, No. 9 (1971)) welcomed word pronunciations from six men and six women in order to identify bi-chi patterns unique to each accent type, and eliminated all individual differences among the speakers. Then, the same word accent type vs. sand pi 1. We found that the chip patterns were essentially similar except for certain values specific to the speakers.

第2図に5モーラで構成されたO型から5型までのピッ
チパターンを示す。これは発声速度の個人差を除去する
ために、発声ザンブルから1モーラの平均持続時間(1
20msec)を求め、実測されたピッチパターンの持
続時間がすべてこの値の整慰倍となるように時間軸を正
規化したものである。またピッチ周波Vの個人差を々〈
すために、ピッチを対紗値に変換し、各ピッチパターン
の平均ピッチが110EZになるように移動してプロッ
トしたものである。
FIG. 2 shows pitch patterns from type O to type 5, which are composed of 5 moras. This is the average duration of 1 mora (1
20 msec), and the time axis is normalized so that the durations of the actually measured pitch patterns are all multiplied by this value. We also investigated individual differences in pitch frequency V.
In order to do this, the pitch was converted to a gauze value, moved and plotted so that the average pitch of each pitch pattern was 110EZ.

第2図の各ビ、、チパターンは大まかに、(1)語頭で
急激に上昇する2つの上昇成分(1型アクセントにみら
れる第1モーラの終点に向って急勾配で上昇する成分と
1型アクセント以外にみられる第2モーラ終点に向って
先のものより小さな勾配で上昇する成分)と、(2)各
アクセント型を示すモーラの終点からやや急激に下降す
る成分と、(3)ゆるやかjて下降する成分に分割でき
、これらのみで近Ofできることがわかる。
The patterns in Figure 2 are roughly divided into (1) two rising components that rise rapidly at the beginning of a word (the component that rises steeply toward the end of the first mora seen in type 1 accents, and the component that rises steeply toward the end of the first mora seen in type 1 accents; (2) a component that descends somewhat sharply from the end of the mora indicating each accent type; It can be seen that it can be divided into descending components, and that it is possible to obtain near Of using only these components.

第3図は前述の成分で第2図を近似してプロットしたピ
ッチパターンである。このようにピッチパターンは4つ
の勾配をもつ直線で粗く近似できる(図中a、b、c、
clで示す直線)。
FIG. 3 is a pitch pattern plotted by approximating FIG. 2 using the aforementioned components. In this way, the pitch pattern can be roughly approximated by straight lines with four slopes (a, b, c,
straight line indicated by cl).

またモーラ内での勾配は一定とみなしてよいことがわか
る。
It can also be seen that the gradient within the mora can be regarded as constant.

本発明は以上のピッチパターンにみられる性質を用い、
簡略な処理で自然なビ1.チパターンを生成するもので
ある。
The present invention utilizes the properties found in the above pitch patterns,
Natural visuals with simple processing 1. It generates a pattern.

第4図は本発明の一実施例を示すプロ5・り図である。FIG. 4 is a diagram showing one embodiment of the present invention.

第4図において1はピッチ変化惠記憶ROM、2はモー
ラ数別アクセン)Qピッチ変化宅パターン記憶ROM、
3はビ、ソチ変化率レジスタ、4は加減算器、5はピッ
チレジスタ、6は初期値レジスタ、7は変換テーブル、
8はスイッチ回路、9は制御回路、10は単位時間カウ
ンタ、11はモーラカウンタ、12はデコード回路(A
In FIG. 4, 1 is a pitch change memory ROM, 2 is a pitch change pattern memory ROM (accent by mora number),
3 is Bi, Sochi change rate register, 4 is adder/subtractor, 5 is pitch register, 6 is initial value register, 7 is conversion table,
8 is a switch circuit, 9 is a control circuit, 10 is a unit time counter, 11 is a mora counter, 12 is a decoding circuit (A
.

16はデコード回路(Bl、14はモーラ数入力端子。16 is a decoding circuit (Bl), 14 is a mora number input terminal.

15はアクセント型入力端子、16は出力端子である。15 is an accent type input terminal, and 16 is an output terminal.

以下図面を用いて本発明の一実施例の概略動作を説明す
る。説明では4つのピンチ変化率で5モ一ラ単語、1型
アクセントのピッチパターンを生成する場合を例にとる
A schematic operation of an embodiment of the present invention will be described below with reference to the drawings. In the explanation, we will take as an example a case where a five-mole word, type 1 accent pitch pattern is generated using four pinch change rates.

第5図にピッチ変化率記憶RUM 1の内容を示す。ピ
ッチ変化率記憶RUM 1には4つの単位時間当りの対
数上のピッチ変化率(+△fα)、(十△fh)。
FIG. 5 shows the contents of the pitch change rate memory RUM1. Pitch change rate memory RUM 1 contains four logarithmic pitch change rates per unit time (+△fα) and (10△fh).

(−thfc )、 (−tuft )が正負符号を含
めてアドレスA。
(-thfc) and (-tuft) are address A including the plus and minus signs.

〜A、に順次記憶されている。第6図にモーラ数別アク
セント型ピッチ変化車パターン記憶ROM2の内容を示
す。図に示すようにモーラ数別アクセント型ビ、Jチ変
化率パターンは、単語モーラ数で大分類され、さらにア
クセント型で分類され(換言すれはモーラ数、アクセン
ト型で上位アドレスを決定している。)、アクセント型
内ではモーラ位置をアドレス単位として順次アドレスB
O・°°°・B、 B、+1.L・にピッチ変化率が符
号化したコードとして記憶されている。すなわち記憶内
容は先のピッチ変化率記憶RUM 1の4つのピッチ変
化率(杖J。)、(柁J、)、(−△f、)、 (−△
fd)を2ビツトでα=(00)、 b=(01)、 
C=(10)、 d=(11)と符号化したコードであ
る。(第3図での直線の添字α、b、c、dおよび第5
図でのカッコ内文字a、h、c、clに相当する。)第
7図にモーラ数5.アクセント型1を入力した時の概略
タイミングを示す。第7図は単位時間カウンタ10の1
カウンタ値を基準単位に、単位時間カウンタ値、モーラ
カウンタ値、モーラ数別アクセント型ピッチ変化率パタ
ーン記憶ROMのアドレス値、ビ・チ変化率記憶R(−
)Mのアドレス値、ピッチ変化率レジスタの値、ピッチ
レジスタの値を同時に示している。
~A, are stored sequentially. FIG. 6 shows the contents of the accent type pitch change car pattern storage ROM 2 for each mora number. As shown in the figure, the accent type B and J chi change rate patterns by number of moras are broadly classified by the number of word moras, and further classified by accent type (in other words, the upper address is determined by the number of moras and accent type. ), within the accent type, the mora position is used as the address unit and address B is
O・°°°・B, B, +1. The pitch change rate is stored as an encoded code in L. In other words, the memory contents are the four pitch change rates of the previous pitch change rate memory RUM 1 (Cane J.), (柁J,), (-△f,), (-△
fd) in 2 bits, α=(00), b=(01),
This is a code encoded as C=(10) and d=(11). (The subscripts α, b, c, d of the straight line in Figure 3 and the fifth
They correspond to the characters a, h, c, and cl in parentheses in the figure. ) Figure 7 shows the number of moras 5. The approximate timing when accent type 1 is input is shown. FIG. 7 shows unit time counter 10.
Using the counter value as a reference unit, unit time counter value, mora counter value, address value of accent type pitch change rate pattern storage ROM for each mora number, bi-chi change rate storage R(-
)M address value, pitch change rate register value, and pitch register value are shown simultaneously.

モーラ数入力端子14.アクセント型入力端子15から
モーラU、アクセント型が入力されるとデコード回路、
412でデコードされ、モーラ数別アクセント型ビ、ノ
チ変化車パターン記憶ROM 2の上位アドレスが入力
モーラV、アクセント型で決められる。同時にモーラ数
は制御回路9にも入力され、制御回路9は本発明の初期
設定を行なう。初期設定は単位時間カウンタ10.モー
ラカウンタ11のリセット、ピッチ変化率レジスタ3の
クリア、スイッチ回路8の初期値レジスタ6の選択を行
なう。モーラ数別アクセント型ピッチ変化高パターン記
憶RUM 2は先の入力モーラ数、アクセント型で決め
られた上位アドレス値とモーラ数カウンタ11のカウン
タ値とでアドレッシングされる。今、モーラv=5.ア
クセント型=1が入力され初期設定が行なわれたとする
と、アドレスは第6図のB7に設定され。
Mora number input terminal 14. Mora U from the accent type input terminal 15, when the accent type is input, the decoding circuit,
412, and the upper address of the ROM 2 for storing the accent type bi and nochi change car patterns according to the number of moras is determined by the input mora V and accent type. At the same time, the mora number is also input to the control circuit 9, and the control circuit 9 performs initial settings of the present invention. The initial setting is unit time counter 10. The mora counter 11 is reset, the pitch change rate register 3 is cleared, and the initial value register 6 of the switch circuit 8 is selected. The accent type pitch change height pattern storage RUM 2 by mora number is addressed by the upper address value determined by the previously input mora number and accent type and the counter value of the mora number counter 11. Now, mora v=5. If accent type=1 is input and initial setting is performed, the address is set to B7 in FIG.

モーラ計則アクセント型ピッチ変化率パターン9チ変化
率αが出力状態となる。符号化ピッチ変化率αはデコー
ド回路B1sに入力され、符号化ピッチ変化率αはピッ
チ変化率記憶RoM1の第5図に示すアドレス値A0に
変換さね−、ピッチ変化車記憶RUM 1をアドレッシ
ングし、ピッチ変化率記憶ROM 1はアドレスA。の
内容であるピッチ変化率(上句1゜)が出力状態になる
Mora's law accent type pitch change rate pattern 9th change rate α is in the output state. The encoded pitch change rate α is input to the decoding circuit B1s, and the encoded pitch change rate α is converted into the address value A0 shown in FIG. , pitch change rate storage ROM 1 is at address A. The pitch change rate (1° in the above phrase), which is the content of , is output.

次に制御回路9はピッチレジスタ5に取込み信号を送り
、ピッチレジスタ5にはクリアされたピッチ変化率レジ
スタ3の内容零と初期値レジスタ6の内容f。がスイッ
チ回路8で選択され、加減算器4で加算された値f。が
取り込まれる。
Next, the control circuit 9 sends an acquisition signal to the pitch register 5, and the pitch register 5 receives the cleared content zero of the pitch change rate register 3 and the content f of the initial value register 6. is selected by the switch circuit 8, and the value f is added by the adder/subtractor 4. is taken in.

次に制御回路9はピッチ変化率レジスタ3に取り込み信
号を送り、ピッチ変化率レジスタ3はピッチ変化率記憶
RUM 1の出力(+tsf 、)  を取り込む。同
時に制御回路9はスイッチ回路8に信号を送シビヅチレ
ジスタ5を選択し力ロ減算器4に接続する。
Next, the control circuit 9 sends a capture signal to the pitch change rate register 3, and the pitch change rate register 3 captures the output (+tsf, ) of the pitch change rate memory RUM1. At the same time, the control circuit 9 sends a signal to the switch circuit 8 to select the bias register 5 and connect it to the power subtracter 4.

次にピッチレジスタ5の現内容f。とヒ、ソチ変化高し
ジスタ乙の現内容(+thf 、 )が加減算器4で加
算された(fo+tsf−)  の値は、ピッチレジス
タ5に制御回路9からの取り込み信号で取り込まれる。
Next, the current content f of the pitch register 5. The value (fo+tsf-), which is obtained by adding the current contents (+thf, ) of the tohi and sochi change high registers in the adder/subtractor 4, is taken into the pitch register 5 by the take-in signal from the control circuit 9.

つま恰この時点でピッチレジスタ5の内容は更新される
。同時に制御回路9は単位時間カウンタ10にインクリ
メント信号を送りカウントアツプを行う。同様に次はピ
ッチレジスタ5の現内容(fo+1d−)  とピッチ
変化毘レジスタ3の現内容(匈、)が加減。算器4で加
算されCfn+2△f、)、!:なりビ1.チレジスタ
5にとり込まれると同時に単位時間カウンタ10もカウ
ントア、ブされる。以下同様な動作を繰り返すとピッチ
レジスタ5の内容は(fo+6△fa)、 (fo +
4△f6)。
At this point, the contents of the pitch register 5 are updated. At the same time, the control circuit 9 sends an increment signal to the unit time counter 10 to count up. Similarly, next, add or subtract the current contents of pitch register 5 (fo+1d-) and the current contents of pitch change register 3 (匈,). Added by calculator 4, Cfn+2△f,),! : Naribi 1. At the same time, the unit time counter 10 is also counted. After repeating the same operation, the contents of pitch register 5 become (fo+6△fa), (fo+
4△f6).

(fo+5fa)と直線的に増加する。It increases linearly as (fo+5fa).

制御回路9は単位時間カウンタ10のカウンタ値を監視
し、カウンタ値が5になりピッチレジスタ5に(jo+
5△f、)の値を取り込んだ時点で単位時間カウンタ1
0をリセ、ノドするとともにモーラカウンタ11にイン
クリメント信号を送りモーラカウンタ11をカウントア
ツプする。モーラ数別アクセント型ピッチ変化率ノくタ
ーン記憶RUM2のアドレスは上位がモーラ数とアクセ
ント型で、下位はモーラカウンタ11で決まるため、こ
の時点でアドレスが第6図のBnからBn+1に変化す
る。したがってモーラ数別アクセント型ピッチ変化高パ
ターン記憶RUM 2はアドレスB7+1の内容である
符号化ビ9チ変化率Cが出力状態となる。符号化ピッチ
変化率Cはデコード回路B13に入力され、ピッチ変化
率記憶RUM 1をアドレ・・シングし、ピッチ変化率
記憶RUM 1はアドレスA、の内容であるピッチ変化
率(−X(、)  が出力状態になる。
The control circuit 9 monitors the counter value of the unit time counter 10, and when the counter value reaches 5, the pitch register 5 (jo+
When the value of 5△f, ) is taken in, the unit time counter 1
At the same time, an increment signal is sent to the mora counter 11 to count up the mora counter 11. The address of the turn storage RUM2 for accent type pitch change rate by mora number has the mora number and accent type in the upper part, and the lower part is determined by the mora counter 11, so at this point the address changes from Bn to Bn+1 in FIG. 6. Therefore, the accent type pitch change height pattern storage RUM2 by mora number outputs the coded pitch change rate C, which is the content of the address B7+1. The encoded pitch change rate C is input to the decoding circuit B13 and addresses the pitch change rate memory RUM 1, which is the pitch change rate (-X(,)) which is the content of the address A. becomes the output state.

次に制御回路9はピッチ変化率レジスタ6に取り込み信
号を送り、ピッチ変化率レジスタ3はピッチ変化率(−
1,f 、)  を取り込む。
Next, the control circuit 9 sends a capture signal to the pitch change rate register 6, and the pitch change rate register 3 receives the pitch change rate (-
1,f,).

以下モーラカウンタ値零の時と同じ動作が繰り返えされ
るとピッチレジスタ5の内容はげ。
If the same operation as when the mora counter value is zero is repeated, the contents of the pitch register 5 will be lost.

+5△f6吃fハ、Cfn+5△f4−2幻1゜)、・
・・・・・と減少してゆく。
+5△f6 吃fha, Cfn+5△f4-2 phantom 1°),・
It continues to decrease.

最後に制御回路9は単位時間カウンタ10.モ−ラカウ
ンタ11のカウンタ値が各々5と4(モーラV入力5か
ら1引いた値)となった時点で動作を停止させ、次のモ
ーラ数、アクセント型の入力持ち状態となる。
Finally, the control circuit 9 has a unit time counter 10. When the counter values of the mora counter 11 reach 5 and 4 (the value obtained by subtracting 1 from the mora V input 5), the operation is stopped, and the next mora number and accent type input state is entered.

ピッチレジスタ5の内容は変換テーブル7で逆対数をと
られ、通常のピッチとなり出力端子16に出力される。
The contents of the pitch register 5 are inversely logarithmized by a conversion table 7 to become a normal pitch and output to an output terminal 16.

ビ、Vチの値をたとえば8ピツトで表現するとすればピ
ッチ変化率(すなわちビ、・チの差分値に相当)はピッ
チが急激な変化をしないためこれよりも少ないピット数
で表現すればよいのは明らかである。たとえば我々の検
討では3ピット程度で十分であった。
For example, if the values of Bi and Vchi are expressed by 8 pits, the pitch change rate (that is, equivalent to the difference value of Bi and ·chi) can be expressed by a smaller number of pits since the pitch does not change suddenly. It is clear that For example, in our study, about three pits were sufficient.

ここで必要なピッチ変化鹿記憶RUM 1とモーラ数別
アクセント型ピーチ変化率パターン記憶ROM 2 (
1モーラから10モ一ラ単語を仮定)の容量は各々、ピ
ッチ変化率記憶ROM = 3ピツト×4=12ビツト モーラ数別アクセント型ビヴチ変化史パターンであり、
計876ピツトでよいことになる。
Here, we need pitch change deer memory RUM 1 and accent type peach change rate pattern memory ROM 2 for each mora number (
(assuming 1 to 10 mora words), the pitch change rate memory ROM = 3 pitches x 4 = 12 bits Accent-type bibuti change history pattern by number of moras,
A total of 876 pits would be sufficient.

先の点ピッチパターンを記憶する方法に比べ容量は約1
/4でよいことがわかる。
Compared to the previous method of memorizing point pitch patterns, the capacity is approximately 1
It turns out that /4 is sufficient.

点ピッチ法では点ピッチ間を直線補間するためには点ピ
ッチ間の引き算で差をとり、さらにその差を点ビ、ソチ
間の時間差で割り算し本発明のピッチ変化率に相当する
ものを算出する必要があるが1本発明では初めからピッ
チ変化率を記憶しているためこの引き算、わり算は不要
である。
In the point pitch method, in order to linearly interpolate between point pitches, subtract the difference between the point pitches, and then divide that difference by the time difference between Point Bi and Sochi to calculate the pitch change rate of the present invention. However, in the present invention, since the pitch change rate is stored from the beginning, such subtraction and division are not necessary.

さらに本発明では初期値レジスタ6の内容を変化させれ
ば出力のピッチパターンを全体に上下することは簡単に
できるが5点ピッチ法では出力のピッチパターンを全体
に上下するためには相似の点ピッチパターンを複数個用
意する必要がある。
Furthermore, in the present invention, it is easy to raise or lower the entire output pitch pattern by changing the contents of the initial value register 6, but in the 5-point pitch method, in order to raise or lower the entire output pitch pattern, it is necessary to raise or lower the output pitch pattern as a whole. It is necessary to prepare multiple pitch patterns.

また変換テーブル7は精度のよいテーブルでなくてもよ
〈簡単な折れ線近似のテーブルでよい。さらに変換テー
ブル7を削除しても合成音質に大きな影響はなく、低価
格の装置では変換テーブル7は削除してもかまわない。
Furthermore, the conversion table 7 does not need to be a highly accurate table; it may be a simple polygonal line approximation table. Furthermore, even if the conversion table 7 is deleted, there is no significant effect on the synthesized sound quality, and the conversion table 7 can be deleted in low-cost devices.

第4図に示すような一実施例のハード構成はマイクロコ
ンピュータのソフトウェア処理で十分に行なえることも
明らかである。
It is also clear that the hardware configuration of the embodiment shown in FIG. 4 can be sufficiently implemented by software processing of a microcomputer.

本発明の一実施例の説明では第2図のピッチパターンを
4種の直線で近似したが、近似の精度をあげるためには
4種以上たとえば8種の直線で近似すればよい。この場
合でもモーラ内で傾きすなわちピッチ変化部が変化しな
いとすれば第4図の構成はほとんど変更する必要がなく
唯、ピッチ変化率記憶RUM 1とモーラ敷料アクセン
ト型ピッチ変化率パターン記憶ROM 2の容量が増加
し、デコード回路B13を変更するのみですむ。たとえ
ば8種の場合はビリチ変化率記憶RUM 1は12ビツ
トから3ビツトX 8 =24ビットに増加し、モーラ
数別アクセント型ピッチ変化パターン記憶RUM 2は
864ピツトからy(3が:1 ピット×ルX (?L+1) ) :1296ビツトに
増加する。
In the description of the embodiment of the present invention, the pitch pattern shown in FIG. 2 is approximated by four types of straight lines, but in order to improve the accuracy of the approximation, it may be approximated by four or more types, for example, eight types of straight lines. Even in this case, if the inclination, that is, the pitch change part within the mora does not change, there is almost no need to change the configuration shown in FIG. The capacity increases and only the decoding circuit B13 needs to be changed. For example, in the case of 8 types, the birich change rate memory RUM 1 increases from 12 bits to 3 bits x 8 = 24 bits, and the accent type pitch change pattern memory RUM 2 by number of moras increases from 864 pits to y (3 is: 1 pit x (?L+1)): Increases to 1296 bits.

デコード回路B13は2人力4出力を3人力8出力に変
更すればよい。
The decoding circuit B13 can be changed from 2-man power and 4 outputs to 3-man power and 8 outputs.

8種の直線で近似し、モーラ内で傾きが変化し各々の傾
きの時間が等しい場合には、モーラ数別アクセント型ピ
1.チ変化率パターン記憶ROM 2を1アドレス1モ
ーラ対応からA(t’:)−1の整数)アドレス1モー
ラ対応の記憶形式に変更する(1モーラ内を2個に細分
化)。そしてモーラカウンタ11ヲモーラカウンタA、
モーラカウンタBと2つに分割し、モーラカウンタAは
1アドレスを、モーラカウンタBはt個アドレス単位を
制御させ制御の目安であるカウンタを単位時間カウンタ
→モーラカウンタA→モーラカウンタBの階層とし、モ
ーラ数別アクセント型ヒリチ変化率記憶ROM 2のア
ドレスをモーラ毅、アクセント型、モーラカウンタA、
モーラカウンタBで決定するようにすればよい。
Approximate with 8 types of straight lines, and if the slope changes within the mora and the time of each slope is equal, the accent type P1 by number of moras. The change rate pattern storage ROM 2 is changed from a storage format corresponding to one address and one mora to a storage format corresponding to one mora of an address (an integer of A(t':)-1) (one mora is subdivided into two). and mora counter 11, mora counter A,
The mora counter A is divided into two parts, and the mora counter A controls one address, and the mora counter B controls t addresses in units.The counter, which is a reference for control, is arranged in a hierarchy of unit time counter → mora counter A → mora counter B. , set the address of accent type Hirichi change rate storage ROM 2 by mora number to Mora Tsuyoshi, accent type, mora counter A,
The determination may be made using the mora counter B.

以上は近似する直線の時間長(1モ一ラ時間長あるいは
Lモーラ内の分割時間長)がすべて同一として説明した
が、時間長が異々る場合にも制御が複雑になる欠点はあ
るがモーラ敷料アクセント型ピッチ変化率パターン記憶
RUM K 時間長の情報をもたせ、制御回路9がこの
情報をもとに本発明の動作を制御するようにければよい
のけ明らかである。
The above explanation has been made assuming that the time lengths of the approximated straight lines (one-molar time length or divided time length within L mora) are all the same, but there is a drawback that control becomes complicated even when the time lengths are different. It is obvious that it is only necessary to provide information on the time length of the mora bedding accent type pitch change rate pattern memory RUM K and to have the control circuit 9 control the operation of the present invention based on this information.

〔発明の効果〕〔Effect of the invention〕

本発明によれば少ない記憶容量と簡略な処理で自然なピ
、ノチパターンfI:iることかできる。
According to the present invention, a natural pitch pattern fI:i can be created with a small storage capacity and simple processing.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は4,5モ一ラ単語のアクセント型の図式を示し
た説明図、第2図は5モ一ラ単語のピッチパターンを示
す波形図、第3図は第2図に示したピッチパターンの直
線近φを示す波形図、第4図は本発明の一実施例を示す
ブロック図、第5図はピッチ変化率記憶ROMの内容と
アドレスを示す説明図、第6図はモーラ敷料アクセント
型ピッチ変化率パターン記憶ROMの内容とアドレスを
示す説明図、第7図は本発明の一実施例におけるピッチ
パターンの概略タイミングを示す駅間図、である。 1・・・ピッチ変化率記憶ROM 2・・モーラ敷料アクセント型ビ1.チ変化率パターン
記憶ROM ろ・・ピッチ変化率レジスタ 4・・・加減算器     5・・ピッチレジスタ6・
・・初期(tfEレジスタ  7・・・変換テーブル4
1図 用2図 つ 正夫克イと、Lj:βテルト4うつ 沁づ図 正六見イ乙ぎれたθ奇問(わ゛) 44図 45図 千6閃
Figure 1 is an explanatory diagram showing the accent type diagram of 4- and 5-molar words, Figure 2 is a waveform diagram showing the pitch pattern of 5-molar words, and Figure 3 is the pitch shown in Figure 2. A waveform diagram showing the linear approximation φ of the pattern, FIG. 4 is a block diagram showing an embodiment of the present invention, FIG. 5 is an explanatory diagram showing the contents and addresses of the pitch change rate memory ROM, and FIG. 6 is a mora bedding accent. FIG. 7 is an explanatory diagram showing the contents and addresses of the pitch change rate pattern storage ROM, and FIG. 7 is a station diagram showing the approximate timing of pitch patterns in one embodiment of the present invention. 1...Pitch change rate memory ROM 2...Mora bedding accent type bi1. CH change rate pattern memory ROM B... Pitch change rate register 4... Addition/subtraction unit 5... Pitch register 6...
...Initial (tfE register 7...Conversion table 4
1 figure, 2 figures, Masao Katsui, and Lj: β Telt 4 Utsumizu figure, Masao Rokumi, Otsugareta θ strange question (wa) 44 figure, 45 figure, 16 flashes

Claims (1)

【特許請求の範囲】 り 発声すべき言語を構成するモーラ数とそのアクセン
ト型に従って分類された複数の時間的ピッチ変化tパタ
ーンを、各単位時間長の範囲内では、ピーチ周波数の変
化宅を、所定の複数の値の中から選択された成る一つの
一定値とした折れ線グラフ状のテークとして記憶するメ
モリと、指定されたモーラ数とアクセント型に従って前
記複数のパターンのうちから一つを選択し、該パターン
におけるビ。 チ変化兎データを単位時間長ごとに時系列的に読み出す
手段と、読み出されたピッチ変化土データを初期値とし
、てのピッチ周波数に個別して出力する手段と、を有し
て成ることを特徴とする発声言語のビヴチ周波数生成装
置。 2、特許請求の範囲第1項に記載のビウチ周波数生成装
置において、前記初期値としてのビ噌チ周波数を複数種
用意しておき、その中の一つを選択的に用いるようにし
たことを特徴とするピッチ周波数生成装置。 3)特許請求の範囲第1゛頂または第2項に記載  ′
のピッチ周波数生成装置において、前記単位時間長がモ
ーラ時間長に等しいか、またはその整数分の−に等しい
ことを特徴とするピッチ周波数生成装置。 4)特許請求の範囲第3項に記載のピッチ周波数生成装
置において、前記モーラ時間、長カ、言語を構成する全
モーラについて同一であることを特徴とするピッチ周波
数生成装置。
[Claims] A plurality of temporal pitch change t-patterns classified according to the number of moras constituting the language to be uttered and their accent types, and within the range of each unit time length, a change in pitch frequency, A memory for storing a take in the form of a line graph with one constant value selected from a plurality of predetermined values, and a memory for selecting one of the plurality of patterns according to the specified number of moras and accent type. , Bi in the pattern. The present invention comprises means for reading out the pitch change data in chronological order for each unit time length, and means for outputting the read pitch change data as an initial value and individually for each pitch frequency. A bivchi frequency generation device for spoken language characterized by. 2. In the bias frequency generation device according to claim 1, a plurality of bias frequencies are prepared as the initial value, and one of them is selectively used. Characteristic pitch frequency generation device. 3) Statement in claim 1 or 2.'
2. A pitch frequency generating device characterized in that the unit time length is equal to a mora time length or equal to an integer of the mora time length. 4) The pitch frequency generation device according to claim 3, wherein the mora time, length, and language are the same for all moras constituting the language.
JP58065595A 1983-04-15 1983-04-15 Pitch frequency generator for uttered language Pending JPS59192293A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58065595A JPS59192293A (en) 1983-04-15 1983-04-15 Pitch frequency generator for uttered language

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58065595A JPS59192293A (en) 1983-04-15 1983-04-15 Pitch frequency generator for uttered language

Publications (1)

Publication Number Publication Date
JPS59192293A true JPS59192293A (en) 1984-10-31

Family

ID=13291525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58065595A Pending JPS59192293A (en) 1983-04-15 1983-04-15 Pitch frequency generator for uttered language

Country Status (1)

Country Link
JP (1) JPS59192293A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02239294A (en) * 1989-03-13 1990-09-21 A T R Jido Honyaku Denwa Kenkyusho:Kk Fundamental frequency pattern estimating device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02239294A (en) * 1989-03-13 1990-09-21 A T R Jido Honyaku Denwa Kenkyusho:Kk Fundamental frequency pattern estimating device

Similar Documents

Publication Publication Date Title
US4709390A (en) Speech message code modifying arrangement
US4384169A (en) Method and apparatus for speech synthesizing
US4912768A (en) Speech encoding process combining written and spoken message codes
KR960002387B1 (en) Voice processing system and method
US5305421A (en) Low bit rate speech coding system and compression
EP0714089B1 (en) Code-excited linear predictive coder and decoder, and method thereof
US5220629A (en) Speech synthesis apparatus and method
US4278838A (en) Method of and device for synthesis of speech from printed text
US4393272A (en) Sound synthesizer
EP0030390A1 (en) Sound synthesizer
US3995116A (en) Emphasis controlled speech synthesizer
JPS61501474A (en) Improved multi-pulse linear predictive coding speech processing device
US4791670A (en) Method of and device for speech signal coding and decoding by vector quantization techniques
CA1326912C (en) Speech coding system
US3909533A (en) Method and apparatus for the analysis and synthesis of speech signals
US4458110A (en) Storage element for speech synthesizer
US5321794A (en) Voice synthesizing apparatus and method and apparatus and method used as part of a voice synthesizing apparatus and method
US4384170A (en) Method and apparatus for speech synthesizing
US4700393A (en) Speech synthesizer with variable speed of speech
US3236947A (en) Word code generator
JPS59192293A (en) Pitch frequency generator for uttered language
US4601052A (en) Voice analysis composing method
US4075424A (en) Speech synthesizing apparatus
JPH02153397A (en) Voice recording device
SU1683063A1 (en) Method of compilatory speech synthesis and device thereof