JPH02195397A - Speech synthesizing device - Google Patents

Speech synthesizing device

Info

Publication number
JPH02195397A
JPH02195397A JP1013097A JP1309789A JPH02195397A JP H02195397 A JPH02195397 A JP H02195397A JP 1013097 A JP1013097 A JP 1013097A JP 1309789 A JP1309789 A JP 1309789A JP H02195397 A JPH02195397 A JP H02195397A
Authority
JP
Japan
Prior art keywords
speed
speech
text
rate
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1013097A
Other languages
Japanese (ja)
Inventor
Atsushi Sakurai
櫻井 穆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1013097A priority Critical patent/JPH02195397A/en
Publication of JPH02195397A publication Critical patent/JPH02195397A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To vary the voicing speed of a speech uniformly by providing a voicing speed standard value and setting the standard value with a command described in a text or an external switch. CONSTITUTION:This speech synthesizing device is equipped with a speed control means which controls the speed relatively to the preset standard speed. Namely, the number of one set of samples per voice parameter corresponding to the voicing speed standard value is determined and sent out to a synthesizer 8 to control the voicing speed. Then the text which contains command information specifying the voicing speed is inputted and analyzed by using a rule file 4, and then a voice pattern is generated by using a specific rule according to the analysis result. Then the voice pattern is outputted at the voicing speed relative to the preset standard speed. Consequently, the voicing speed of the synthesized voice is varied uniformly.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、入力テキストを解析し、所定規則により音声
を生成する音声合成装置に関し、特に、入力テキスト中
に記載されたコマンド情報により生成音声の発声速度を
変化させる方式の音声合成装置に関するものである。
Detailed Description of the Invention [Field of Industrial Application] The present invention relates to a speech synthesis device that analyzes input text and generates speech according to predetermined rules, and particularly relates to a speech synthesis device that analyzes input text and generates speech according to predetermined rules. The present invention relates to a speech synthesis device that changes the speaking speed of the voice.

[従来の技術] 従来、入力テキストを解析し、所定規則により音声を生
成する音声合成装置では、入力テキスト中に記載された
コマンドによって、生成する音声の発声速度を制御する
ことが試みられている。
[Prior Art] Conventionally, in a speech synthesis device that analyzes input text and generates speech according to predetermined rules, attempts have been made to control the speech rate of the generated speech using commands written in the input text. .

例えば、第2図(a)で示す(S3)は発声速度“3”
を指定し、この速度で音声「ナマムギ」を生成させるコ
マンドである。同様に(S5)は発声速度“5”を、(
S7)は発声速度“7”を指定し、この速度でそれぞれ
音声「ナマゴメ」、「ナマタマゴ」を生成させるコマン
ドである。
For example, (S3) shown in FIG. 2(a) is a speech rate of "3".
This is a command that specifies , and generates the sound ``Namamugi'' at this speed. Similarly, (S5) sets the speaking rate “5” to (
S7) is a command that specifies a speaking speed of "7" and generates the voices "namagome" and "namatamago", respectively, at this speed.

[発明が解決しようとする課題] しかしながら、上記従来例では、各コマンドで指定でき
る発声速度が固定されているため、次のような欠点があ
る。
[Problems to be Solved by the Invention] However, in the conventional example described above, since the speaking speed that can be specified with each command is fixed, there are the following drawbacks.

(1)テキスト全体の発声速度を一様に増減したい時、
即ち、全体をもっと速くしゃべらせたり、あるいは、も
つと遅くしゃべらせたりする必要が生じた時、テキスト
中の速度制御コマンドを全て書き換えなければならない
(1) When you want to uniformly increase or decrease the speaking speed of the entire text,
That is, when it becomes necessary to make the entire text speak faster or slower, all speed control commands in the text must be rewritten.

(2)速度制御コマンドと固定速度との対応関係が線型
でない場合には、テキスト全体の発達速度を一様に増減
させることができない。
(2) If the correspondence between the speed control command and the fixed speed is not linear, the development speed of the entire text cannot be uniformly increased or decreased.

これらの欠点を第2図の例で説明する。第2図(a)の
テキストを、全体に速く発声させようとした場合、第2
図(b)で示すように、コマンド(S3)を(S4)G
、:、また(S5)を(S6)に、さらに、(S7)を
(S8)にそれぞれ書き換えなければならない。同様に
、第2図(a)のテキストを、全体に遅く発声させよう
とすると、第2図(C)で示すように、それぞれ書き換
えなければならない。また、この場合、コマンド(S3
) 、(S4)、(S5) 、(S6)に対応する発声
速度が、それぞれ3.3.4.O,,5,0,5,8(
モー97秒)であれば、コマンド〔S3)に対するコマ
ンド(S5)の相対速度は5.0/3.3 =1.52
となり、コマンド(S4)に対するコマンド(S6)の
相対速度は5.8/4.0 =1.45となる。
These drawbacks will be explained using the example shown in FIG. If you try to have the text in Figure 2 (a) uttered quickly as a whole, the second
As shown in figure (b), command (S3) is changed to (S4)G
, :, Also, (S5) must be rewritten as (S6), and (S7) must be rewritten as (S8). Similarly, if the text in FIG. 2(a) is to be uttered slowly throughout, each text must be rewritten as shown in FIG. 2(C). Also, in this case, the command (S3
), (S4), (S5), and (S6) are respectively 3.3.4. O,,5,0,5,8(
97 seconds), the relative speed of command (S5) to command [S3) is 5.0/3.3 = 1.52
Therefore, the relative speed of command (S6) with respect to command (S4) is 5.8/4.0 = 1.45.

従って、第2図(a)のテキストを音声化した際の音声
「ナマムギ」と音声「ナマゴメ」との相対速度と、第2
図(b)のテキストを音声化した際の音声「ナマムギ」
と音声「ナマゴメ」との相対速度とは、異なってしまい
、テキスト全体を一様に速く発声させることができない
Therefore, when the text in Fig. 2 (a) is transcribed into speech, the relative speed between the sounds "Namamugi" and the sounds "Namagome" and the second
The sound “Namamugi” when the text in Figure (b) is transcribed into voice
The relative speed of the text and the voice ``namagome'' differs, and the entire text cannot be uttered uniformly and quickly.

本発明は、上記課題を解決するために成されたもので、
合成音声の発声速度を一様に増減できる音声合成装置を
提供することを目的とする。
The present invention was made to solve the above problems, and
It is an object of the present invention to provide a speech synthesis device that can uniformly increase or decrease the speaking speed of synthesized speech.

[課題を解決するための手段] 上記目的を達成するために、本発明の音声合成装置は、
以下の構成を備える。即ち、 発声速度を指定するコマンド情報を含むテキストを入力
する入力手段と、該入力テキストを解析する解析手段と
、該解析手段での解析結果に対し所定規則を用いて音声
パターンを生成する生成手段と、該生成手段での音声パ
ターンを前記発声速度に応じ出力する出力手段とを有す
る音声合成装置であって、前記発声速度をあらかじめ設
定された標準速度に対する相対値として速度制御する速
度制御手段とを備える。
[Means for Solving the Problem] In order to achieve the above object, the speech synthesis device of the present invention has the following features:
It has the following configuration. That is, an input means for inputting a text including command information specifying a speech rate, an analysis means for analyzing the input text, and a generation means for generating a speech pattern using a predetermined rule based on the analysis result of the analysis means. and output means for outputting the speech pattern produced by the generation means according to the speech rate, the speech synthesis device comprising speed control means for controlling the speech rate as a relative value to a preset standard speed. Equipped with

また好ましくは、前記速度制御手段での標準速度を前記
入力テキスト中に記載されたコマンド情報により設定す
ることを特徴とする。
Preferably, the standard speed of the speed control means is set by command information written in the input text.

さらに好ましくは、前記速度制御手段での標準速度をス
イッチにより設定することを特徴とする。
More preferably, the standard speed of the speed control means is set by a switch.

さらにまた好ましくは、前記速度制御手段での標準速度
を前記コマンド情報又はスイッチにより設定し、且つ、
その一方を優先的に使用することを特徴とする。
Still preferably, the standard speed of the speed control means is set by the command information or switch, and
It is characterized by preferentially using one of them.

[作用コ 以上の構成において、発声速度を指定するコマンド情報
を含むテキストを入力し、そのテキストを解析後、解析
結果に対し所定規則を用いて音声パターンを生成する。
[Operation] In the above configuration, a text including command information specifying a speech rate is input, and after analyzing the text, a voice pattern is generated using a predetermined rule based on the analysis result.

そして、その音声パターンを、あらかじめ設定された標
準速度に対する相対値とした発声速度に応じて、出力す
るように動作する。
Then, it operates to output the voice pattern in accordance with a speaking speed that is a relative value to a preset standard speed.

[実施例] 以下、添付図面を参照して本発明に係る好適な第1の実
施例を詳細に説明する。
[Embodiment] Hereinafter, a first preferred embodiment of the present invention will be described in detail with reference to the accompanying drawings.

く構成の説明 (第1図)〉 第1図は、第1の実施例における音声合成装置の構成を
示すブロック図である0図において、lはテキストを入
力する入力端子、2は装置全体の制御を司どる中央制御
部であり、後述するCPUの処理手順を格納するROM
及び作業領域として使用するRAMを含む。3は単位音
声ファイルであり、合成のための単位音声を音声パラメ
ータの形で収納する。4は規則ファイルであり、入力テ
キストを解析し音声パラメータの時系列を生成するため
の規則を収納する。5は補助記憶であり、標準速度等の
システムパラメータや変数を収納する。6は入力バッフ
ァであり、入力テキストを収納する。7は出力バッファ
であり、生成された音声パラメータ時系列を収納する。
Explanation of the structure (Fig. 1)> Fig. 1 is a block diagram showing the structure of the speech synthesis device in the first embodiment. A ROM that is a central control unit that takes charge of control and stores the processing procedures of the CPU, which will be described later.
It also includes a RAM used as a work area. 3 is a unit audio file, which stores unit audio for synthesis in the form of audio parameters. A rule file 4 stores rules for analyzing input text and generating a time series of audio parameters. 5 is an auxiliary memory, which stores system parameters and variables such as standard speed. 6 is an input buffer that stores input text. 7 is an output buffer that stores the generated audio parameter time series.

8は合成器であり、中央制御部2により送られて来る音
声パラメータを用い音声の合成を行う。9はD/A変換
器であり、合成器8により合成された音声をアナログ信
号に変換する。そして、9はアナログ音声信号を出力す
る出力端子である。
A synthesizer 8 synthesizes speech using the speech parameters sent from the central control section 2. A D/A converter 9 converts the audio synthesized by the synthesizer 8 into an analog signal. Further, 9 is an output terminal for outputting an analog audio signal.

く動作概要の説明〉 以上の構成において、入力端子1からテキストが入力さ
れると、これを中央制御部2が制御して入力バッファ6
に収納する6次に、中央制御部2は入力バッファ6に収
納したテキストを先頭から1文字ずつ取り出し、それら
が文章の一部であれば、規則ファイル4に収納されてい
る解析規則と解析辞書とを用いてテキスト解析を行う。
Explanation of operation outline> In the above configuration, when text is input from the input terminal 1, the central control unit 2 controls it and sends it to the input buffer 6.
6 Next, the central control unit 2 extracts the text stored in the input buffer 6 one character at a time from the beginning, and if they are part of a sentence, the central control unit 2 extracts the text stored in the input buffer 6 one character at a time, and if they are part of a sentence, reads the analysis rules and analysis dictionary stored in the rule file 4. Perform text analysis using

また、同じく規則ファイル4に収納されている合成規則
により、単位音声ファイルに収納されている単位音声の
適当なものを選んで補間接続を行い、入力テキストに対
応する音声パラメータ時系列を生成する。次に、この生
成した音声パラメータ時系列を一旦出力バツファ7に収
納し、合成器8からのパラメータ転送要求に応じて一組
ずつ、音声パラメータを出力バッファ7より取り出して
合成器8に送出する。そして、合成器8は、中央制御部
2より送出された音声パラメータからデジタル音声信号
を生成し、D/A変換器9に出力する。この信号を入力
したD/A変換器9は、アナログ信号に変−換し、出力
端子10より順次出力する。
Furthermore, according to the synthesis rules also stored in the rule file 4, appropriate unit voices stored in the unit voice files are selected and interpolated and connected to generate a voice parameter time series corresponding to the input text. Next, the generated audio parameter time series is temporarily stored in the output buffer 7, and audio parameters are extracted one set at a time from the output buffer 7 and sent to the synthesizer 8 in response to a parameter transfer request from the synthesizer 8. Then, the synthesizer 8 generates a digital audio signal from the audio parameters sent from the central control unit 2 and outputs it to the D/A converter 9. The D/A converter 9 receives this signal, converts it into an analog signal, and sequentially outputs it from the output terminal 10.

一方、入力バッファ6より取り出した文字列がコマンド
であれば、そのコマンドを解析し、解析結果を補助記憶
5に収納する。なお、本実施例におけるコマンドは“(
)”記号で囲まれた英字と数字から成る文字列であり、
制御コマンド及びシステムコマンドの2種類が定義され
ている。
On the other hand, if the character string taken out from the input buffer 6 is a command, the command is analyzed and the analysis result is stored in the auxiliary memory 5. Note that the command in this example is “(
)” is a string of letters and numbers surrounded by symbols,
Two types of commands are defined: control commands and system commands.

(1)制御コマンド まず、制御コマンドは、英大文字1字と数字とにから成
る文字列であり、発声速度、音量、アクセントの強さ等
を指定する。例えば、(S5)は発声速度“5”を指定
し、(A4)はアクセントの強さ“4”を指定するコマ
ンドである。
(1) Control Command First, the control command is a character string consisting of one uppercase English letter and a number, and specifies the speaking speed, volume, strength of accent, etc. For example, (S5) is a command that specifies a speaking rate of "5", and (A4) is a command that specifies an accent strength of "4".

(2)システムコマンド 次に、システムコマンドは、英小文字4字と数字とから
成る文字列であり、音声合成システムの持つ各種標準値
の設定を行う0例えば、(sspe80)は発声速度の
標準値を80サンプルに設定する。
(2) System command Next, the system command is a character string consisting of four lowercase letters and a number, and is used to set various standard values of the speech synthesis system.For example, (sspe80) is the standard value for the speaking speed. is set to 80 samples.

く発声速度の説明 (第3図)〉 上述のコマンドの中で本実施例に関わるのは、発声速度
指定コマンド(S)と発声速度標準値設定コマンド(s
 s e p)である。そして、これら2つのコマンド
によりIrlフレームj当りの音声サンプル数が制御さ
れる。以下では音声サンプル数と発声速度との関係につ
いて説明する。
Explanation of speaking speed (Figure 3) Among the commands mentioned above, the ones that are relevant to this embodiment are the speaking speed designation command (S) and the speaking speed standard value setting command (s).
s e p). These two commands control the number of audio samples per Irl frame j. The relationship between the number of audio samples and the speaking speed will be explained below.

本実施例の単位音声ファイル3に収納されている音声パ
ラメータは、人間の発声した単位音声を標本化周波数1
0KHzで標本化し、第3図(a)で示すように、フレ
ームシフト幅10m5で分析を行い、音声パラメータ化
したものである。また、合成器8に出力する一組の音声
パラメータは、継続時間10m5の発声波形の特徴を表
現し、この10m5の音声区間には、 10000X (10/1000)=100個の音声サ
ンプルが含まれている。そこで、合成器8がこの一組の
音声パラメータを用い、100個の音声サンプルを生成
すると、その出力される音声は、原音声と同じ継続時間
長となり、結果的に原音声と同じ発声速度を持つことに
なる。
The audio parameters stored in the unit audio file 3 of this embodiment are the unit audio uttered by a human being at a sampling frequency of 1.
The data was sampled at 0 KHz, analyzed with a frame shift width of 10 m5, and converted into audio parameters, as shown in FIG. 3(a). Also, a set of audio parameters output to the synthesizer 8 expresses the characteristics of a vocal waveform with a duration of 10 m5, and this 10 m5 audio section includes 10000X (10/1000) = 100 audio samples. ing. Therefore, when the synthesizer 8 uses this set of audio parameters and generates 100 audio samples, the output audio will have the same duration as the original audio and, as a result, will have the same speaking rate as the original audio. I will have it.

これに対し、第3図(b)で示すように、合成器8が中
央制御部2より送出される一組の音声パラメータを用い
て、80個の音声サンプルを生成した場合では、生成さ
れる音声の継続時間長は0.8倍となり、発声速度は1
.25倍になる。
On the other hand, as shown in FIG. 3(b), when the synthesizer 8 generates 80 audio samples using a set of audio parameters sent from the central control unit 2, the generated The duration of the voice will be 0.8 times longer, and the speaking speed will be 1
.. It becomes 25 times.

また、第3図(C)で示すように、120個の音声サン
プルを生成した場合には、生成される音声の継続時間長
は1.2倍となり、発声速度は0.83倍になる。
Furthermore, as shown in FIG. 3(C), when 120 voice samples are generated, the duration length of the generated voice is 1.2 times greater, and the speaking speed is 0.83 times greater.

即ち、本実施例では、発声速度指定コマンドに応じて、
発声速度標準値に対する一組の音声パラメータ当りのサ
ンプル数を決定し、これを合成器8に送出することによ
り、発声速度の制御を行っている。そして、合成器8で
は、このサンプル数を記憶し、中央制御部2より送出さ
れた一組の音声パラメータを用い、このサンプル数だけ
音声サンプルを生成する。その後、所定数の音声サンプ
ルの生成が終了すると、次の音声パラメータの転送を中
央制御部2に要求する。
That is, in this embodiment, in response to the speaking rate designation command,
The speech rate is controlled by determining the number of samples per set of voice parameters for a standard speech rate value and sending this to the synthesizer 8. Then, the synthesizer 8 stores this number of samples, and uses the set of audio parameters sent from the central control unit 2 to generate audio samples for this number of samples. Thereafter, when the generation of a predetermined number of audio samples is completed, a request is made to the central control unit 2 to transfer the next audio parameter.

以上の処理を繰り返すことにより、発声速度指定コマン
ドに対応した発声速度を持つ合成音声が生成される。
By repeating the above process, synthesized speech having a speaking rate corresponding to the speaking rate designation command is generated.

また、本実施例における音声速度指定コマンド(S)は
、“1”から“9”までの1桁の数字n″に対し、式(
1)を用いてIrlフレームj当りの音声サンプル数p
 (n)を決定する。
In addition, the voice speed designation command (S) in this embodiment is based on the formula (
1), the number of audio samples p per Irl frame j
(n) is determined.

p (n)=kXa (n)     = (1)但し
、a (n)は次の条件により決定される。
p (n) = kXa (n) = (1) However, a (n) is determined by the following conditions.

2.25−0.25n (1≦n≦5)1.75−0.
15n (6≦n≦9)ここで、kはサンプル単位で表
現された発声速度の標準値で、システムコマンド(ss
pe)によって設定される。
2.25-0.25n (1≦n≦5) 1.75-0.
15n (6≦n≦9) Here, k is the standard value of the speaking rate expressed in units of samples, and the system command (ss
pe).

〈処理手順の説明 (第4図〜第6図)〉次に、入力端
子1より第4図(a)で示すテキストが入力された際の
処理を第5図で示すフローチャートに従って、以下に説
明する。
<Explanation of processing procedure (Figs. 4 to 6)> Next, the process when the text shown in Fig. 4 (a) is input from the input terminal 1 will be explained below according to the flowchart shown in Fig. 5. do.

まず、ステップSlにおいて、テキストが入力されると
、そのテキストを入力バッファ6に収納し、ステップS
2で入力したテキストの解析処理を行う。次に、ステッ
プS3で解析した文字列が上述したコマンドかどうかを
判断する。そして、コマンドであれば、処理をステップ
S4に進め、発声速度標準値設定コマンドかを判別する
First, in step Sl, when text is input, the text is stored in the input buffer 6, and step S
Analyze the input text in step 2. Next, it is determined whether the character string analyzed in step S3 is the above-mentioned command. If it is a command, the process advances to step S4, and it is determined whether it is a command to set a standard value of speaking rate.

なお、本実施例では、入力テキストの文字列が“(ss
peloo)”であり、発声速度標準値設定コマンドを
示しているために、ステップS5に処理を進め、続く数
字列“100”を処理し、ステップS6で発声速度の標
準値として、その数値100を補助記憶5に収納する。
Note that in this embodiment, the character string of the input text is “(ss
peloo)" and indicates the standard speaking rate setting command, the process advances to step S5, processes the following number string "100", and sets the numerical value 100 as the standard speaking speed in step S6. It is stored in the auxiliary memory 5.

次に、ステップSllにおいて、文字列の区切りを調べ
、区切りでなければ処理をステップS2に戻・す。そし
て、ステップS2で文字列(S3)を処理し、Sが発声
速度指定コマンドであることから、ステップS7に処理
を進める。ステップS7において、式(1)に従って、
rlフレームj当たりの音声サンプル数p (n)を求
める。
Next, in step Sll, the delimiter of the character string is checked, and if it is not a delimiter, the process returns to step S2. Then, in step S2, the character string (S3) is processed, and since S is a speech rate designation command, the process advances to step S7. In step S7, according to equation (1),
Find the number of audio samples p (n) per rl frame j.

この場合、n=3であるから、p (n)は、2.25
−0.25X3で1.5、そして、k=1ooであるか
ら、p (n)=150 (サンプル)となる、そこで
、ステップS8において、発声速度として数値150を
設定し、補助記憶5に収納する。また、ステップSll
では、第4図(a)で示すように、まだ文字列が続くた
めに、処理をステップS2に戻す。そして、続く文字列
“生麦”を同様に処理し、ステップS9で音声「ナマム
ギ」に対応する音声パラメータ時系列を生成する。そし
て、ステップSIOで先頭に音声速度情報を付加して出
力バッファ7に収納する。
In this case, since n=3, p (n) is 2.25
-0.25X3 = 1.5, and since k = 1oo, p (n) = 150 (samples).Therefore, in step S8, a numerical value of 150 is set as the speaking rate and stored in the auxiliary memory 5. do. Also, step Sll
Now, as shown in FIG. 4(a), since the character string continues, the process returns to step S2. Then, the following character string "namamugi" is processed in the same way, and in step S9, a speech parameter time series corresponding to the speech "namamugi" is generated. Then, in step SIO, audio speed information is added to the beginning and stored in the output buffer 7.

この時、補助記憶5に収納されている発声速度は“15
0”であるから数値150が、音声パラメータ時系列の
先頭に付加される。
At this time, the speaking speed stored in the auxiliary memory 5 is “15
0'', the numerical value 150 is added to the beginning of the audio parameter time series.

その後、合成器8から最初に設定された発声速度標準値
のサンプル数間隔で、中央制御部2に対して音声パラメ
ータの出力要求が出される。この合成器8からの出力要
求に対し、ステップS12において、出力バッファ7に
収納されている音声パラメータを一組取り出して出力す
る。しかし、発声速度情報が付加されている場合には、
必ず発声速度情報を合成器8に送出し、引き続いて音声
パラメータを一組送出する0合成器8では、中央制御部
2より送出された情報が発声速度であればそれを記憶し
、引き続き送出される音声パラメータを受は取り、これ
らを使用して、記憶している発声速度情報の示すサンプ
ル数だけ音声サンプルを生成する。
Thereafter, the synthesizer 8 requests the central control unit 2 to output voice parameters at intervals of the number of samples of the speech rate standard value set initially. In response to this output request from the synthesizer 8, in step S12, a set of audio parameters stored in the output buffer 7 is extracted and output. However, when speech rate information is added,
The synthesizer 8, which always sends the speech rate information to the synthesizer 8 and subsequently sends out a set of voice parameters, stores the information sent from the central control unit 2 if it is the speech rate, and continues to send it. The voice parameters are received and used to generate voice samples as many as the number of samples indicated by the stored speech rate information.

こうして文字列”生麦”に対し、音声「ナマムギ」が[
1’lフレームJ当り150サンプルの速さで生成され
る。同様にして、文字列“(S5)”が処理され、発声
速度として、数値100が設定され、文字列“生麦”に
対し、音声「ナマゴメ」がrlフレームj当り100サ
ンプルの速さで生成される。そして、文字列“(S7)
生卵”が処理されると、音声「ナマタマゴ」が11フレ
ームj当り70サンプルの速さで生成される。
In this way, for the character string "Namamugi", the sound "Namamugi" is [
It is generated at a rate of 150 samples per 1'l frame J. In the same way, the character string "(S5)" is processed, a value of 100 is set as the speech rate, and the voice "namagome" is generated for the character string "namamugi" at a rate of 100 samples per rl frame j. Ru. Then, the string “(S7)
When "raw egg" is processed, the audio "raw egg" is generated at a rate of 70 samples per 11 frames j.

以上の処理により、第4図に示す入力テキスト(a)、
(b)、(c)をそれぞれ処理した結果を第6図に示す
、コマンド処理の結果設定される発声速度標準値は(a
)では100、(b)では80、(C)では120サン
プルと、それぞれ異なるが、コマンド(S3)を処理し
た結果生成されるサンプル数と、コマンド(S5)を処
理した結果生成されるサンプル数との比はいずれの場合
も1.5である。
Through the above processing, the input text (a) shown in FIG.
The results of processing (b) and (c) are shown in Figure 6. The standard speaking rate set as a result of command processing is (a
) is 100 samples, (b) is 80 samples, and (C) is 120 samples, which are different, but the number of samples generated as a result of processing the command (S3) and the number of samples generated as a result of processing the command (S5) are different. The ratio is 1.5 in both cases.

同様にコマンド(S7)とコマンド(S5)との比較で
もその比は常に一定で0.7である。
Similarly, when comparing the command (S7) and the command (S5), the ratio is always constant and is 0.7.

従って、本実施例によれば、テキスト中の発声速度標準
値設定コマンドを変更するだけで、同一テキストにより
生成される音声の発声速度を一様に増減でき、発声速度
設定コマンドと実際の発声速度との対応関係が、線型で
あるか否かの影響を受けることもない。
Therefore, according to this embodiment, by simply changing the standard speaking rate setting command in the text, the speaking speed of voices generated by the same text can be uniformly increased or decreased. The correspondence relationship with is not affected by whether or not it is linear.

[他の実施例] 次に、本発明に係る第2の実施例を図面を参照して詳細
に説明する。
[Other Embodiments] Next, a second embodiment of the present invention will be described in detail with reference to the drawings.

〈構成の説明 (第7図〜第9図)〉 第7図の構成図で示すように、第1の実施例の構成にス
イッチ回路11を付加し、音声合成装置の使用者が目的
に応じてスイッチにより発声速度を制御できるようにし
たものである。
<Description of the configuration (Figures 7 to 9)> As shown in the configuration diagram of Figure 7, a switch circuit 11 is added to the configuration of the first embodiment, allowing the user of the speech synthesis device to The speed of speech can be controlled using a switch.

スイッチ回路11のスイッチ部分は、第8図で示す外観
を持ち、目盛り「1」から目盛り「5」までは発声速度
を増加させ、目盛り「−1」から目盛り「−5」までは
音声速度を減少させる。
The switch part of the switch circuit 11 has the appearance shown in FIG. 8, and increases the speech rate from the scale "1" to the scale "5", and decreases the voice speed from the scale "-1" to the scale "-5". reduce

また、スイッチ回路11は、第9図で示すようにロータ
リスイッチ111とエンコーダ112とから構成される
。そして、ロータリスイッチ111の位置情報がエンコ
ーダ112によりコード化され、中央制御部2に送られ
る。ここで、スイッチの目盛りの位置をm、エンコーダ
の出力をiとすると、両者の関係は式(2)で示される
Further, the switch circuit 11 includes a rotary switch 111 and an encoder 112, as shown in FIG. Then, the position information of the rotary switch 111 is encoded by the encoder 112 and sent to the central control section 2. Here, if the position of the scale of the switch is m and the output of the encoder is i, the relationship between the two is shown by equation (2).

i=m+5           ・・・(2)但し、
m=−5,−4,・・・−1,O,l=  5である。
i=m+5...(2) However,
m=-5,-4,...-1, O, l=5.

従って、エンコーダの出力iは、“0“から“10”ま
での整数値である。
Therefore, the output i of the encoder is an integer value from "0" to "10".

く動作の説明 (第10図、第11図)〉以上の構成に
おいて、入力端子1よりテキストが入力されると、これ
を−旦入カバッファ6に収納する0次に、補助記憶5に
発声速度標準値として初期値“0”を、また、音声速度
制御情報として初期値“5”をそれぞれ収納する。そし
て、入力バッファ6に収納した入力テキストを、その先
頭から1文字ずつ処理し、その内容が文章の一部である
か、あるいは、コマンドであるかにより以下に述べるよ
うな、それぞれの処理を行う。
(Figures 10 and 11) In the above configuration, when text is input from the input terminal 1, it is first stored in the input buffer 6. Next, the utterance rate is stored in the auxiliary memory 5. The initial value "0" is stored as the standard value, and the initial value "5" is stored as the voice speed control information. Then, the input text stored in the input buffer 6 is processed character by character from the beginning, and the following processing is performed depending on whether the content is part of a sentence or a command. .

まず、入力バッファ6から取り出したテキストの内容が
コマンドであれば、その数字部分を数値化して、補助記
憶5の対応する場所に収納する。
First, if the content of the text taken out from the input buffer 6 is a command, its numerical part is digitized and stored in the corresponding location in the auxiliary memory 5.

例えば、文字列が(S3)であれば、補助記憶5内の変
数領域nに数値3を収納し、また、文字列が(sspe
120)であれば、補助記憶5内の変数領域kに数値1
20を収納する。
For example, if the character string is (S3), the numerical value 3 is stored in the variable area n in the auxiliary memory 5, and the character string is (sspe
120), the value 1 is stored in the variable area k in the auxiliary memory 5.
Stores 20.

一方、入力バッファ6から取り出したテキストの内容が
文章の一部であれば、第1の実施例と同様な処理を行う
。この処理は、単位音声ファイル3及び規則ファイル4
を用い、音声パラメータ時系列を生成し、出力バッファ
7に収納する。この際、補助記憶5内の変数領域kを調
べ、その内界が“O”以外の値であれば、この値と補助
記憶5内の変数領域nの値とから、第1の実施例で説明
した式(1)を用いてflフレームJ当りの音声サンプ
ル数b (n)を求める。そして、この値を生成した音
声パラメータ時系列の先頭に付加し、さらに、kの内容
が“0”であれば、補助記憶5内の変数領域nの値に負
符号を付加する。この処理は、入力テキスト中の文章を
解析し、音声パラメータ時系列を生成する際、すでに音
声速度標準値kに“0”以外の数値が設定されていれば
、発声速度制御情報nより生成した音声パラメータ時系
列の「1フレーム」当りの音声サンプル数を直ちに決定
することができる。しかし、音声速度標準値にの内容が
“O”であれば、発声速度制御情報nだけを速度情報と
して、生成した音声パラメータ時系列に付加することを
意味している。例えば、補助記憶5内の変数領域が第1
0図(a)の状態であれば、「1フレーム」当りの音声
サンプル数p (n)として“180”が計算され、生
成された音声パラメータ時系列の先頭に付加される。ま
た、第10図(b)の状態であれば、発声速度制御情報
nの内容に負符号を付加した値−3″が先頭に付加され
る。
On the other hand, if the content of the text taken out from the input buffer 6 is part of a sentence, the same processing as in the first embodiment is performed. This process includes unit audio file 3 and rule file 4.
is used to generate an audio parameter time series and store it in the output buffer 7. At this time, the variable area k in the auxiliary memory 5 is checked, and if its inner bound is a value other than "O", from this value and the value of the variable area n in the auxiliary memory 5, the first embodiment The number of audio samples b (n) per fl frame J is determined using the explained equation (1). Then, this value is added to the beginning of the generated audio parameter time series, and if the content of k is "0", a negative sign is added to the value of the variable area n in the auxiliary memory 5. This process analyzes the sentences in the input text and generates the speech parameter time series, and if the speech rate standard value k has already been set to a value other than "0", the speech rate control information n is used to generate the speech parameter time series. The number of audio samples per "frame" of the audio parameter time series can be immediately determined. However, if the content of the voice rate standard value is "O", it means that only the voice rate control information n is added as rate information to the generated voice parameter time series. For example, the variable area in the auxiliary memory 5 is
In the state shown in FIG. 0 (a), "180" is calculated as the number of audio samples p (n) per "one frame" and added to the beginning of the generated audio parameter time series. In addition, in the state shown in FIG. 10(b), a value -3'', which is the content of the speech rate control information n with a negative sign, is added to the beginning.

次に、出力バッファ7に収納した音声パラメータ時系列
を、合成器8からのパラメータ転送要求に応じて一組ず
つ転送する時に、先頭に付加した発声速度情報の符号に
よって、次のような処理を行う。
Next, when the audio parameter time series stored in the output buffer 7 is transferred one set at a time in response to a parameter transfer request from the synthesizer 8, the following processing is performed depending on the code of the speech rate information added to the beginning. conduct.

発声速度情報が正の値であれば、上述のようにrlフレ
ームj当りの音声サンプル数を示しているから直ちに合
成器8に転送し、以降の音声は、このサンプル数、即ち
、発声速度で生成される。
If the speaking rate information is a positive value, it indicates the number of audio samples per rl frame j as described above, so it is immediately transferred to the synthesizer 8, and subsequent audio is processed at this number of samples, that is, at the speaking rate. generated.

また、発声速度情報が負の値であれば、解析処理の時点
で発声速度標準値が“O”であった事を意味するので、
スイッチ回路11からの出力iを用いて発声速度標準値
を計算し、flフレームj当りの音声サンプル数p (
i、n)を式(3)により決定する。
Additionally, if the speaking rate information is a negative value, it means that the standard speaking rate was "O" at the time of the analysis process.
A standard speech rate value is calculated using the output i from the switch circuit 11, and the number of voice samples p (
i, n) are determined by equation (3).

但し、nは音声パラメータ時系列の先頭に付加されてい
た発声速度情報から負符号を取り除いた値であり、発声
速度制御コマンドの数字部分の値を示す。
However, n is a value obtained by removing the negative sign from the speaking rate information added to the beginning of the voice parameter time series, and indicates the value of the numerical part of the speaking rate control command.

p  (L、n)=k  (i)Xa  (n)   
=  (3)ここで、a (n) = 2.25−0. 25n  (1≦n≦5)1.75−
0. 15n  (6≦n≦9)また、k(i)= 20X  (10−i)  (0≦i≦5)10X  
(15−i)  (6≦i≦10)例えば、音声パラメ
ータ時系列の先頭情報が「−3」の時、発声速度設定ス
イッチの目盛り位置mが「4」であれば、式(2)より
i=9、またn=3、従って、式(3)よりp (i、
n)=90となり、lフレーム当りの音声サンプル数と
して数値90が合成器8に送出され、以降生成される音
声はこの発声速度を持つ。
p(L,n)=k(i)Xa(n)
= (3) where a (n) = 2.25-0. 25n (1≦n≦5)1.75-
0. 15n (6≦n≦9) Also, k(i) = 20X (10-i) (0≦i≦5) 10X
(15-i) (6≦i≦10) For example, if the starting information of the audio parameter time series is “-3” and the scale position m of the speaking rate setting switch is “4”, then from equation (2) i=9 and n=3, so from equation (3) p (i,
n) = 90, the numerical value 90 is sent to the synthesizer 8 as the number of audio samples per l frame, and the audio generated thereafter has this speaking rate.

即ち、テキスト内に発声速度標準値設定コマンドを持た
ない入力テキストは、ロークリスイッチ111によって
、その発声速度標準値を設定できるが、テキスト内に発
声速度標準値設定コマンドがあれば、テキスト内のそれ
以降の文章はロータリスイッチ111の位置によらず、
コマンドで設定された標準値により音声が生成される。
That is, for an input text that does not have a standard speaking rate setting command in the text, the standard speaking rate can be set using the low reswitch 111, but if there is a standard speaking rate setting command in the text, the standard speaking rate setting command in the text can be set. The text after that does not depend on the position of the rotary switch 111,
Audio is generated according to the standard values set by the command.

以上の処理を第11図に示す入力テキストの例を用いて
説明する。
The above processing will be explained using an example of input text shown in FIG.

第11図(a)に示すテキストが入力端子1より入力さ
れると、入力バッファ6に収納された後、中央制御部2
により、まず、文字列“(S3)”が発声速度制御コマ
ンドとして処理され、数値3が補助記憶装置5内の変数
領域nに収納される。次いで、文字列“生麦”が解析処
理され、音声パラメータ時系列が生成され、出力バッフ
ァ7に収納され、この際、先頭に発声速度情報が付加さ
れる。補助記憶装置S内の変数領域には初期値の“O”
を持っているので、この時の発声速度情報は変数領域n
に収納されている発声速度制御情報に負符号を付加した
値“−3゛である。合成器8からのパラメータ転送要求
に対し、中央制御部2は、出力バッファ8より音声パラ
メータを一組ずつ取り出して合成器8に転送する。この
際、先頭に付加されている発声速度情報が処理されるが
、この場合には負の値を持つのでスイッチ回路11の出
力iを調べる。
When the text shown in FIG. 11(a) is input from the input terminal 1, it is stored in the input buffer 6 and then sent to the central control unit
First, the character string "(S3)" is processed as a speech rate control command, and the numerical value 3 is stored in the variable area n in the auxiliary storage device 5. Next, the character string "Namamugi" is analyzed, a speech parameter time series is generated, and stored in the output buffer 7, with speech rate information added to the beginning. The variable area in the auxiliary storage device S has an initial value of “O”.
Therefore, the speech rate information at this time is in the variable area n
The value is "-3", which is the value obtained by adding a negative sign to the speech rate control information stored in It is taken out and transferred to the synthesizer 8. At this time, the speech rate information added at the beginning is processed, but in this case, since it has a negative value, the output i of the switch circuit 11 is checked.

その結果、例えば、ロークリスイッチ111が第8図(
b)で示す状態であれば、位置情報m=5、また、n=
3であるから式(2)(3)%式% rlフレーム1当りの音声サンプル数として、数値75
が合成器8に転送され、以降、生成される音声は、この
発声速度を持つ。
As a result, for example, the low reswitch 111 is
In the state shown in b), position information m=5, and n=
3, so the number of audio samples per rl frame is 75.
is transferred to the synthesizer 8, and the speech generated thereafter has this speaking rate.

即ち、音声「ナマムギ」がflフレームj当り75サン
プルの速さで生成される。同様にして、文字列“(S5
)生麦”が処理され音声「ナマゴメ」がIrlフレーム
j当り50サンプルの速さで生成され、文字列“(S7
)生卵”が処理され音声「ナマタマゴ」がflフレーム
1当り25サンプルの速さで生成される。
That is, the voice "Namamugi" is generated at a rate of 75 samples per fl frame j. Similarly, the character string “(S5
) Namamugi” is processed and the voice “Namagome” is generated at a rate of 50 samples per Irl frame j, and the character string “(S7
) is processed and the voice ``raw egg'' is generated at a rate of 25 samples per fl frame.

即ち、通常の速さに対し1.5倍の速さでテキストの内
容が音声化され出力される。
That is, the text content is converted into audio and output at a speed 1.5 times faster than the normal speed.

次に、第11図(b)に示すテキストが入力端子1から
入力されると、入力バッファ6に収納された後、中央制
御部2により、まず、文字列(sspeloo)“がコ
マンドとして処理され、数値“100”が補助記憶装置
5内の変数領域kに収納される。
Next, when the text shown in FIG. 11(b) is input from the input terminal 1, it is stored in the input buffer 6, and then the central control unit 2 first processes the character string (sspeloo) as a command. , the numerical value “100” is stored in the variable area k in the auxiliary storage device 5.

次いで、文字列“(S3)”がコマンドとじて処理され
、数値“3”が補助記憶装置5内の変数領域nに収納さ
れる。引き続き文字列“生麦”が文章の一部として解析
処理され、音声パラメータ時系列が生成され、出力バッ
ファ7に収納される。この際、先頭に発声速度情報が付
加されるが、この場合、補助記憶装置5内の変数領域に
の値は”100“で“O”ではないので、変数領域nの
値を共に用いて式(1)により、rlフレームj当りの
音声サンプル数P (n)を直ちに計算し、その結果を
発声速度情報として付加する。
Next, the character string "(S3)" is processed as a command, and the numerical value "3" is stored in the variable area n in the auxiliary storage device 5. Subsequently, the character string "Namamugi" is analyzed as part of the sentence, and a time series of audio parameters is generated and stored in the output buffer 7. At this time, speaking rate information is added to the beginning, but in this case, the value in the variable area in the auxiliary storage device 5 is "100" and not "O", so the value in the variable area n is used together with the expression According to (1), the number of audio samples P (n) per rl frame j is immediately calculated, and the result is added as speech rate information.

即ち、式(1)においてに=100.n=3であるから
P (n)=150となり、発声速度情報として数値1
50が先頭に付加される。
That is, in equation (1), =100. Since n = 3, P (n) = 150, and the value 1 is used as speech rate information.
50 is added to the beginning.

次に、合成器8からのパラメータ転送要求を受けると、
出力バッファ7から音声パラメータを一組ずつ取り出し
合成器8に出力する。この際、先頭に付加されている発
声速度情報が処理されるが、この場合には、正の値“1
50”を持つのでそのまま「lフレーム」当りの音声サ
ンプル数として合成器8に出力する。以降、生成される
音声は、このサンプル数に従うので音声「ナマムギ」が
rlフレームj当り150サンプルの速さで生成される
Next, upon receiving a parameter transfer request from the synthesizer 8,
The audio parameters are extracted one set at a time from the output buffer 7 and output to the synthesizer 8. At this time, the speech rate information added at the beginning is processed, but in this case, the positive value "1" is used.
50'', it is directly output to the synthesizer 8 as the number of audio samples per ``1 frame''. Thereafter, the generated speech follows this number of samples, so the speech "Namamugi" is generated at a rate of 150 samples per rl frame j.

同様に、文字列“(S5)生米”が処理され、音声「ナ
マゴメ」がrlフレーム1当り100サンプルの速さで
生成される。また文字列“(S7)生卵”が処理され、
音声「ナマタマゴ」がIrlフレームj当り5oサンプ
ルの速さで生成される。
Similarly, the character string "(S5) Raw rice" is processed, and the speech "Namagome" is generated at a rate of 100 samples per rl frame. Also, the character string “(S7) raw egg” is processed,
The voice "Namatamago" is generated at a rate of 5o samples per Irl frame j.

即ち、スイッチ回路11の出力に関わりなく、テキスト
に記述した通りの速さで音声が生成出力される。
That is, regardless of the output of the switch circuit 11, the voice is generated and output at the speed described in the text.

以上説明したように上述した実施例によれば、次に述べ
る効果がある。
As explained above, according to the above-mentioned embodiment, the following effects can be obtained.

(1)発声速度設定スイッチにより、合成装置の使用者
が、自分の好む゛速さで合成出力される音声を聞くこと
が出来る。
(1) The voice speed setting switch allows the user of the synthesizer to listen to the voice synthesized and output at his/her preferred speed.

(2)発声速度設定スイッチによる速度の増減は、テキ
スト全体に対して一様に行われるので、入力テキスト内
でコマンドにより行われている速度制御を忠実に再現す
る。
(2) Since the speed is increased/decreased by the voice speed setting switch uniformly for the entire text, the speed control performed by commands within the input text is faithfully reproduced.

(3)入力テキスト内に発声速度標準値設定コマンドを
挿入し、発声速度の標準値として“0”以外の値を設定
すれば、発声速度設定スイッチの位置のいかんに関わら
ず、常にテキストに記述した通りの速さで音声が生成出
力されるので、重要なメツセージを確実に伝達すること
が出来る。
(3) If you insert the speaking rate standard value setting command into the input text and set a value other than "0" as the standard speaking rate, it will always be written in the text regardless of the position of the speaking rate setting switch. Since the voice is generated and output at exactly the same speed, important messages can be reliably conveyed.

[発明の効果] 以上説明したように本発明によれば、発声速度標準値を
設け、この標準値をテキスト内に記述されたコマンドや
、外部スイッチにより設定できるようにしたことにより
、音声の発声速度を一様に増減することができる効果が
ある。
[Effects of the Invention] As explained above, according to the present invention, a standard value for speech rate is provided, and this standard value can be set by a command written in the text or by an external switch. This has the effect of uniformly increasing or decreasing the speed.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明に係る第1の実施例を示す構成図、 第2図は従来の技術例を説明する入力テキストを示す図
、 第3図(a)〜(C)は音声パターンのサンプルを示す
図、 第4図は第1の実施例での入力テキストを示す図、 第5図は第1の実施例の処理を示すフローチャ第6図は
第1の実施例の処理結果を示す図、第7図は本発明に係
る第2の実施例を示す構成図、 第8図(a)、(b)はロータリスイッチの外観図、 第9図はスイッチ回路の構成図、 第10図(a)、(b)は補助記憶の内部状態を示す図
、 第11図は第2の実施例の処理例を示す図である。 図中、1・・・入力端子、2・・・中央制御部、3・・
・単位音声ファイル、4・・・規則ファイル、5・・・
補助記憶、6・・・入力バッファ、7・・・出力バッフ
ァ、8・・・合成器、9・・・D/A変換器、10・・
・出力端子、11・・・スイッチ回路である。 −ト、 漫 3図 第4図 第11図 止斥 第8因(0) g8図 (b) 第9図 (b) 第10図
Fig. 1 is a block diagram showing a first embodiment of the present invention, Fig. 2 is a diagram showing input text explaining a conventional technical example, and Figs. 3 (a) to (C) are samples of voice patterns. FIG. 4 is a diagram showing input text in the first embodiment. FIG. 5 is a flowchart showing processing in the first embodiment. FIG. 6 is a diagram showing processing results in the first embodiment. , FIG. 7 is a configuration diagram showing a second embodiment of the present invention, FIGS. 8(a) and (b) are external views of a rotary switch, FIG. 9 is a configuration diagram of a switch circuit, and FIG. 10 ( a) and (b) are diagrams showing the internal state of the auxiliary memory, and FIG. 11 is a diagram showing a processing example of the second embodiment. In the figure, 1... input terminal, 2... central control unit, 3...
・Unit audio file, 4... Rule file, 5...
Auxiliary memory, 6... Input buffer, 7... Output buffer, 8... Synthesizer, 9... D/A converter, 10...
- Output terminal, 11... Switch circuit. -G, Man Figure 3 Figure 4 Figure 11 Cause of rejection 8th (0) Figure 8 (b) Figure 9 (b) Figure 10

Claims (4)

【特許請求の範囲】[Claims] (1)発声速度を指定するコマンド情報を含むテキスト
を入力する入力手段と、該入力テキストを解析する解析
手段と、該解析手段での解析結果に対し所定規則を用い
て音声パターンを生成する生成手段と、該生成手段での
音声パターンを前記発声速度に応じ出力する出力手段と
を有する音声合成装置であつて、 前記発声速度をあらかじめ設定された標準速度に対する
相対値として速度制御する速度制御手段とを備えること
を特徴とした音声合成装置。
(1) An input means for inputting text including command information specifying the speaking speed, an analysis means for analyzing the input text, and a generation method for generating a speech pattern using a predetermined rule based on the analysis result of the analysis means. and output means for outputting the speech pattern produced by the generating means according to the speech rate, the speech synthesis device comprising: a speed control means for controlling the speech rate as a relative value to a preset standard speed; A speech synthesis device characterized by comprising:
(2)前記速度制御手段での標準速度を前記入力テキス
ト中に記載されたコマンド情報により設定することを特
徴とする請求項第1項に記載の音声合成装置。
(2) The speech synthesis device according to claim 1, wherein the standard speed of the speed control means is set by command information written in the input text.
(3)前記速度制御手段での標準速度をスイッチにより
設定することを特徴とする請求項第1項に記載の音声合
成装置。
(3) The speech synthesis device according to claim 1, wherein the standard speed of the speed control means is set by a switch.
(4)前記速度制御手段での標準速度を前記コマンド情
報又はスイッチにより設定し、且つ、その一方を優先的
に使用することを特徴とする請求項第1項に記載の音声
合成装置。
(4) The speech synthesis device according to claim 1, wherein the standard speed of the speed control means is set by the command information or a switch, and one of them is used preferentially.
JP1013097A 1989-01-24 1989-01-24 Speech synthesizing device Pending JPH02195397A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1013097A JPH02195397A (en) 1989-01-24 1989-01-24 Speech synthesizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1013097A JPH02195397A (en) 1989-01-24 1989-01-24 Speech synthesizing device

Publications (1)

Publication Number Publication Date
JPH02195397A true JPH02195397A (en) 1990-08-01

Family

ID=11823649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1013097A Pending JPH02195397A (en) 1989-01-24 1989-01-24 Speech synthesizing device

Country Status (1)

Country Link
JP (1) JPH02195397A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003005775A (en) * 2001-06-26 2003-01-08 Oki Electric Ind Co Ltd Method for controlling quick reading out in text-voice conversion device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003005775A (en) * 2001-06-26 2003-01-08 Oki Electric Ind Co Ltd Method for controlling quick reading out in text-voice conversion device
JP4680429B2 (en) * 2001-06-26 2011-05-11 Okiセミコンダクタ株式会社 High speed reading control method in text-to-speech converter

Similar Documents

Publication Publication Date Title
US4685135A (en) Text-to-speech synthesis system
JP3083640B2 (en) Voice synthesis method and apparatus
EP0059880A2 (en) Text-to-speech synthesis system
US20040073427A1 (en) Speech synthesis apparatus and method
JP2005043666A (en) Voice recognition device
MXPA06003431A (en) Method for synthesizing speech.
US8103505B1 (en) Method and apparatus for speech synthesis using paralinguistic variation
JPH0632020B2 (en) Speech synthesis method and apparatus
JP3518898B2 (en) Speech synthesizer
JP2001242882A (en) Method and device for voice synthesis
JP2003186489A (en) Voice information database generation system, device and method for sound-recorded document creation, device and method for sound recording management, and device and method for labeling
CA2343071A1 (en) Device and method for digital voice processing
JPH02195397A (en) Speech synthesizing device
JPH05224688A (en) Text speech synthesizing device
JPH05281984A (en) Method and device for synthesizing speech
JPH09179576A (en) Voice synthesizing method
KR0134707B1 (en) Voice synthesizer
JP3113101B2 (en) Speech synthesizer
Ebihara et al. Speech synthesis software with a variable speaking rate and its implementation on a 32-bit microprocessor
JPH02293900A (en) Voice synthesizer
JP3292218B2 (en) Voice message composer
JP2003005774A (en) Speech synthesizer
JP3862300B2 (en) Information processing method and apparatus for use in speech synthesis
JPH01321496A (en) Speech synthesizing device
JP2573586B2 (en) Rule-based speech synthesizer