JPH03225400A - Pause length determining system - Google Patents

Pause length determining system

Info

Publication number
JPH03225400A
JPH03225400A JP2020768A JP2076890A JPH03225400A JP H03225400 A JPH03225400 A JP H03225400A JP 2020768 A JP2020768 A JP 2020768A JP 2076890 A JP2076890 A JP 2076890A JP H03225400 A JPH03225400 A JP H03225400A
Authority
JP
Japan
Prior art keywords
pause
length
word
speech
boundary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020768A
Other languages
Japanese (ja)
Inventor
Kazuhiko Iwata
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2020768A priority Critical patent/JPH03225400A/en
Publication of JPH03225400A publication Critical patent/JPH03225400A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To finely control pause length corresponding to the structure of a sentence to be converted into a voice by using pause length right after a word corresponding to the part of speech of a word right before a boundary where a pause is inserted. CONSTITUTION:A character string including plural words is inputted from a character string input terminal 1. The character string which is inputted is sent to a pause insertion position determination part 12 and a morpheme analyzing part 13. The determination part 21 determines the boundary where a pause is to be inserted. Information on the determined boundary is sent to a pause length determination part 15. The analyzing part 13 divides the sentence into word strings to determine the parts of speech of the respective words. The word strings accompanied by the part-of-speech information are sent to a determination part 15. The determination part 15 reads pause length out of a pause length storage part 14 inserted behind the word of the part of speech corresponding to the part of speech of the word right before the pause insertion boundary determined by the determination part 12 to determine the pause length and outputs the result from a pause length output terminal 16. Consequently, the proper pause length can be determined.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字列を音声に変換する規則音声合成等にお
いて、複数の単語を含む入力文字列に基づき生成される
音声中の単語境界に挿入されるポーズの長さを決定する
ポーズ長決定方式に関する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention is applicable to word boundaries in speech generated based on an input string containing multiple words in regular speech synthesis, etc. that converts a string of characters into speech. The present invention relates to a pause length determination method for determining the length of a pause to be inserted.

(従来の技術) 任意の文章を音声に変換する規則音声合成においては、
文中の適切な位置に適切な長さのポーズを挿入すること
が必要であり、合成される音声の自然性を向上させる上
で重要である。発声者は、聞き手に意味の切れ目を伝え
るために、意味の上で結びつきの弱い適当な文節あるい
は単語の境界(以下、単に境界とあるのは、文節あるい
は単語の境界を指すものとする)にポーズを置く。また
、人間には一息で発声できる長さに限界かあるため、息
継ぎが必要となる。ポーズは、このような生理的な要求
による現象でもある。したがって、合成音声を生成する
際にも、適度な長さのポーズが合成音声中に挿入されて
いないと、合成音声は人間らしさを欠き、聞き手は該合
成音声に対して不自然さを感じる。
(Prior art) In regular speech synthesis that converts arbitrary sentences into speech,
It is necessary to insert a pause of an appropriate length at an appropriate position in a sentence, and this is important in improving the naturalness of synthesized speech. In order to convey the break in meaning to the listener, the speaker uses appropriate boundaries between clauses or words that have weak connections in terms of meaning (hereinafter, the term "boundary" simply refers to the boundaries between clauses or words). put a pose. Additionally, there is a limit to how long a human can vocalize in one breath, so breath breaks are necessary. Pause is also a phenomenon caused by such physiological demands. Therefore, when generating synthesized speech, if a pause of an appropriate length is not inserted into the synthesized speech, the synthesized speech will lack human-likeness, and the listener will feel that the synthesized speech is unnatural.

従来、ポーズ長の決定には、隣接する文節間の意味の上
での結びつきの強さか用いられていた。
Conventionally, the strength of the semantic connection between adjacent clauses was used to determine the pause length.

ます、境界における結びつきの強さを、先行文節から受
けの文節に至るまでの文節数で表現し、この尺度を分離
度と呼ぶ。分離度の値か大きいということは、ある文節
がより遠くにある文節と結びついており、隣接する文節
との結びつきは弱いということを表している。したがっ
て、分離度の大きい境界はどポーズが挿入され易く、挿
入されるポーズ長は長くなる傾向にあると言える。また
、人間には一息で発声できる長さに限界がある。このた
め、境界の前後の呼気段落(ポーズに挾まれた一息で発
声するまとまり)の長さが長いほど、挿入されるポーズ
が長くなる傾向がある。以上のことから、挿入するポー
ズ長を決定するための評価尺度として、分離度と境界の
前後の呼気段落の総モーラ数との積の値を用いる。この
積の値に対して、いくつかの閾値を設け、各閾値に対応
したポーズ長を予め定めておく、そして、算出された積
の値がどの閾値の範囲にあるかによってポーズ長を決定
する。
The strength of the bond at the boundary is expressed by the number of clauses from the preceding clause to the receiving clause, and this measure is called the degree of separation. A large value of the degree of separation indicates that a certain phrase is connected to a phrase that is further away, and that the connection with adjacent phrases is weak. Therefore, it can be said that a pose is likely to be inserted at a boundary with a high degree of separation, and the length of the inserted pose tends to be long. Furthermore, there is a limit to the length of speech that humans can make in one breath. Therefore, the longer the length of the exhalation paragraph (a group of breaths uttered between pauses) before and after the boundary, the longer the inserted pause tends to be. From the above, the value of the product of the degree of separation and the total number of moras of exhalation paragraphs before and after the boundary is used as an evaluation measure for determining the pause length to be inserted. Several thresholds are set for this product value, a pause length corresponding to each threshold is determined in advance, and the pause length is determined based on which threshold range the calculated product value falls within. .

このようなポーズ長の決定方法については、日本音響学
会音声研究会資料378−07 (1978−4)r文
音声の音調規則の検討」に詳述されている。
A method for determining such a pause length is described in detail in the Acoustical Society of Japan's Speech Study Group Material 378-07 (1978-4) "Study of intonation rules for r-sentence speech".

(発明か解決しようとする課題) 従来の方法では、分離度を算出するために文章を構成す
る文節同士の係り受は関係を正確に解析する必要があっ
た。しかし、ながら、この係り受は関係を常に正確に解
析することは困難であるから、適切なポーズ長を決定し
難く、合成音声が不自然になることがあるという問題点
があった。また、予め定められた少数のポーズ長の中か
ら境界に挿入されるポーズの長さを選択するから、文章
の構造に応じた細かなポーズ長の制御をすることができ
なかった。
(Problems to be Solved by the Invention) In the conventional method, in order to calculate the degree of separation, it was necessary to accurately analyze the dependencies between clauses that make up a sentence. However, since it is difficult to always accurately analyze the relationship of this modification, it is difficult to determine an appropriate pause length, which poses a problem in that the synthesized speech may become unnatural. Furthermore, since the length of the pause to be inserted at the boundary is selected from a small number of predetermined pause lengths, it is not possible to perform detailed control of the pause length according to the structure of the sentence.

これに対して本発明は、文章の係り受は解析を必要とせ
ず、文章の構造に応じた細かなポーズ長の制御を行うこ
とが可能なポーズ長決定方式を提供することを目的とし
ている。
In contrast, an object of the present invention is to provide a pause length determination method that does not require analysis of text dependencies and can perform detailed pause length control according to the structure of the text.

(課題を解決するための手段) 第1の本発明は、複数の単語を含む入力文字列に基づき
生成される音声中の単語境界に挿入されるポーズの長さ
を決定するポーズ長決定方式において、複数の単語に対
し、その品詞ごとに単語の直後に挿入されるポーズの長
さを予め記憶しておき、前記単語境界の直前に位置する
単語の品詞に対応する前記記憶されている単語の直後に
挿入されるポーズの長さに基づき前記単語境界に挿入さ
れるポーズの長さを決定することを特徴とする。
(Means for Solving the Problems) A first aspect of the present invention provides a pause length determination method for determining the length of a pause to be inserted at a word boundary in speech generated based on an input character string including a plurality of words. , for a plurality of words, store in advance the length of the pause to be inserted immediately after the word for each part of speech, and select the length of the pause to be inserted immediately after the word that is located immediately before the word boundary. The present invention is characterized in that the length of the pause inserted at the word boundary is determined based on the length of the pause inserted immediately after.

第2の本発明は、複数の単語を含む入力文字列に基づき
生成される音声中の単語境界に挿入されるポーズの長さ
を決定するポーズ長決定方式において、複数の単語に対
し、その品詞ごとに単語の直前に挿入されるポーズの長
さを予め記憶しておき、前記単語境界の直後に位置する
単語の品詞に対応する前記記憶されている単語の直前に
挿入されるポーズの長さに基づき前記単語境界に挿入さ
れるポーズの長さを決定することを特徴とする。
The second aspect of the present invention provides a pause length determination method that determines the length of a pause to be inserted at a word boundary in speech generated based on an input character string including a plurality of words. The length of the pause inserted immediately before each word is stored in advance, and the length of the pause inserted immediately before the stored word corresponding to the part of speech of the word located immediately after the word boundary is stored in advance. The length of the pause to be inserted at the word boundary is determined based on the word boundary.

第3の本発明は、複数の単語を含む入力文字列に基づき
生成される音声中の単語境界に挿入されるポーズの長さ
を決定するポーズ長決定方式において、複数の単語に対
し、その品詞ごとに単語の直後に挿入されるポーズの長
さおよび単語の直前に挿入されるポーズの長さをそれぞ
れ予め記憶しておき、前記単語境界の直前に位置する単
語の品詞に対応する前記記憶されている単語の直後に挿
入されるポーズの長さと、前記単語境界の直後に位置す
る単語の品詞に対応する前記記憶されている単語の直前
に挿入されるポーズの長さとに基づき前記単語境界に挿
入されるポーズの長さを決定することを特徴とする。
The third aspect of the present invention provides a pause length determination method that determines the length of a pause to be inserted at a word boundary in speech generated based on an input character string including a plurality of words. The length of the pause inserted immediately after the word and the length of the pause inserted immediately before the word are respectively stored in advance for each word, and the length of the pause inserted immediately before the word is stored in advance. at the word boundary based on the length of the pause inserted immediately after the word that is located, and the length of the pause inserted immediately before the stored word that corresponds to the part of speech of the word located immediately after the word boundary. It is characterized by determining the length of the inserted pose.

第4の本発明は、複数の単語を含む入力文字列に基づき
生成される音声中の単語境界に挿入されるポーズの長さ
を決定するポーズ長決定方式において、互いに連なる2
つの単語からなる単語列に対し、該単語の一方の品詞お
よび他方の品詞の組み合わせごとに前記単語列の単語の
一方と他方との間に挿入されるポーズの長さを予め記憶
しておき、前記単語境界の前後に位置する単語の品詞の
組み合わせに対応する前記記憶されている単語列のポー
ズの長さに基づき前記単語境界に挿入されるポーズの長
さを決定することを特徴とする。
The fourth aspect of the present invention provides a pause length determination method for determining the length of a pause to be inserted at a word boundary in speech generated based on an input character string including a plurality of words.
For a word string consisting of two words, the length of a pause to be inserted between one and the other word of the word string is stored in advance for each combination of one part of speech and the other part of speech of the word, The length of the pause to be inserted at the word boundary is determined based on the length of the pause of the stored word string corresponding to a combination of parts of speech of words located before and after the word boundary.

(作用) ポーズは、文節あるいは単語の境界において、その境界
の前後にある単語の、意味の上での結び付きが弱い境界
に挿入され易く、また挿入されるポーズの長さは長くな
る傾向がある。従来方式は、この結び付きの強弱を文章
の係り受は構造から算出していた。一方で、ポーズが挿
入される境界の前後にある単語の品詞を調べてみると、
ポーズが挿入され易い、すなわち結び付きが弱い品詞と
、挿入されにくい、すなわち結び付きが強い品詞とがあ
ることがわかる。そこで、品詞の持つこのような性質を
利用すれば、文章の係り受は構造を用いなくても、自然
なポーズ長を決定することが可能であると考えられる。
(Effect) Pauses tend to be inserted at boundaries between clauses or words, where the words before and after the boundary have a weak connection in terms of meaning, and the length of the inserted pauses tends to be long. . In the conventional method, the strength of this connection was calculated from the structure of the text's dependencies. On the other hand, if you examine the parts of speech of the words before and after the boundary where the pause is inserted,
It can be seen that there are parts of speech in which pauses are easily inserted, that is, the connections are weak, and parts of speech that are difficult to insert, that is, the connections are strong. Therefore, it is thought that by utilizing these properties of parts of speech, it is possible to determine natural pause lengths for sentence dependencies without using structure.

そこで、予め、人間がいくつかの文章を読み上げたとき
の音声(以下、「文章音声データベース」と称する。)
から、ポーズが挿入されている境界の直前、あるいは直
後にある単語の品詞を調べ、品詞ごとに、その単語の直
前あるいは直後に挿入されているポーズの長さを調べる
。ポーズ長としては、例えは、文章音声データベースに
おいて、ある品詞がポーズを伴っている全ての出現にお
けるポーズ長の平均値などを用いることが考えられる。
Therefore, in advance, we have prepared the sounds of some sentences read out loud by humans (hereinafter referred to as the "sentence speech database").
Then, the part of speech of the word immediately before or after the boundary where the pause is inserted is checked, and for each part of speech, the length of the pause inserted immediately before or after that word is checked. As the pause length, it is possible to use, for example, the average value of the pause lengths of all occurrences of a certain part of speech accompanied by a pause in a text speech database.

ここで説明のため、ある品詞PSの単語の直後に挿入さ
れるポーズ長の平均値をLf (PS)、直前に挿入さ
れるポーズ長の平均値をLp (PS)とする。また、
品詞PSpの先行単語と品詞Psfの後続単語との境界
に挿入されるポーズ長の平均値をL (PSp、PSf
)とする。これらのポーズ長平均値Lf (PS)、L
p (PS)を品詞psごとに、またL (PSp、P
Sf )を品詞PSpとPSfとの組み合わせごとに求
める。このときの品詞の種類としては、名詞、動詞、副
詞といった分類の方法がある。さらに、動詞や形容詞、
助動詞などのように活用する品詞については、未然形、
連用形、連体形などの活用形ごとに分類することも考え
られる。
For the sake of explanation, let Lf (PS) be the average value of the pause lengths inserted immediately after a word of a certain part of speech PS, and Lp (PS) be the average value of the pause lengths inserted immediately before. Also,
Let L (PSp, PSf
). These pose length average values Lf (PS), L
p (PS) for each part of speech ps, and L (PSp, P
Sf) is obtained for each combination of parts of speech PSp and PSf. At this time, the types of parts of speech can be classified into nouns, verbs, and adverbs. In addition, verbs and adjectives
For parts of speech that are conjugated, such as auxiliary verbs, the unnatural form,
It is also possible to classify them by conjugated form, such as continuous form and adnominal form.

第1の本発明では、音声に変換する文章において、ポー
ズが挿入される境界の直前にある単語の品詞PSpに応
じた、単語の直後のポーズ長平均値Lf (PSp)を
用いる。また、(従来の技術)の項で述べたように、ポ
ーズ長は、ポーズの前後の呼気段落の長さの影響も受け
る。そこで、Lf(PSp)をポーズの前後の呼気段落
の長さ(例えばモーラ数)ごとに求める方法などによっ
てポーズの前後の呼気段落の長さの影響に対応すること
ができる。
In the first aspect of the present invention, in a sentence to be converted into speech, an average pause length Lf (PSp) immediately after a word is used, which corresponds to the part of speech PSp of the word immediately before the boundary where a pause is inserted. Furthermore, as described in the (Prior Art) section, the pause length is also affected by the length of the exhalation paragraphs before and after the pause. Therefore, it is possible to deal with the influence of the length of the exhalation paragraphs before and after the pause by calculating Lf(PSp) for each length of the expiration paragraphs before and after the pause (for example, the number of moras).

第2の本発明では、ポーズが挿入される境界の直後にあ
る単語の品詞PSfに応じた、単語の直前のポーズ長平
均値Lp(PSf)を用いる。ポーズの前後の呼気段落
の長さの影響を実現する方法としては、第1の本発明の
項で説明した方法と同じものが考えられる。
In the second aspect of the present invention, the average pause length Lp (PSf) immediately before a word is used, which corresponds to the part of speech PSf of the word immediately after the boundary where a pause is inserted. The same method as described in the first aspect of the present invention can be considered as a method for realizing the influence of the length of the exhalation paragraphs before and after a pause.

第3の本発明では、ポーズが挿入される境界の直前にあ
る単語の品詞PSpに応じな、単語の直後ポーズ長平均
値Lf (PSp)と、当該境界の直後にある単語の品
詞PSfに応じた、単語の直前のポーズ長平均値Lp(
PSf)とを用いる。
In the third aspect of the present invention, the pause length average value Lf (PSp) immediately after a word is determined according to the part of speech PSp of the word immediately before the boundary where a pause is inserted, and the part of speech PSf of the word immediately after the boundary is determined. In addition, the average pause length immediately before the word Lp(
PSf) is used.

両者を用いてポーズ長を決定する方法としては、例えば
、Lf(PSp)とLp (PSf )との相加平均を
とるなどが考えられる。ポーズの前後の呼気段落の長さ
の影響を実現する方法としては、第1の本発明の項で説
明した方法と同じものが考えられる。
A possible method for determining the pause length using both is, for example, taking the arithmetic average of Lf (PSp) and Lp (PSf). The same method as described in the first aspect of the present invention can be considered as a method for realizing the influence of the length of the exhalation paragraphs before and after a pause.

第4の本発明では、ポーズが挿入される境界の直前にあ
る単語の品詞PSp、直後にある単語の品詞PSfの組
み合わせに応じたポーズ長の平均値L (PSp、PS
、f )を用いる。ポーズの前後の呼気段落の長さの影
響を実現する方法としては、第1の本発明の項で説明し
た方法と同じものが考えられる。
In the fourth aspect of the present invention, the average value L of pause lengths corresponds to the combination of the part of speech PSp of the word immediately before the boundary where the pause is inserted and the part of speech PSf of the word immediately after.
, f) is used. The same method as described in the first aspect of the present invention can be considered as a method for realizing the influence of the length of the exhalation paragraphs before and after a pause.

第1、及び第2の本発明においては、ポーズが挿入され
る境界の前後どちらか一方の単語の品詞を考慮してポー
ズ長を決定している。
In the first and second aspects of the present invention, the pause length is determined by considering the parts of speech of words either before or after the boundary where the pause is inserted.

これに対し、第3の本発明では、前後それぞれの単語の
品詞がポーズ長に及ぼす影響を独立に考慮し、それぞれ
から決定されるポーズ長の相加平均をとるなどすること
により、前後の品詞の影響を考慮してポーズ長を決定し
ている。これにより、挿入されるポーズ長か、第1、第
2の本発明に比べ、より当該境界に適したものになるこ
とか期待できる。
On the other hand, in the third aspect of the present invention, the influence of the parts of speech of the preceding and following words on the pause length is independently considered, and by taking the arithmetic average of the pause lengths determined from each word, the parts of speech of the preceding and following words are The pause length is determined by considering the influence of As a result, it can be expected that the inserted pause length will be more suitable for the boundary than in the first and second aspects of the present invention.

ただし、前後それぞれの単語の品詞に応じて決定される
ポーズ長の相加平均をとることによって得られるポーズ
長が必ずしも適した値とはならないことも考えられる。
However, it is conceivable that the pause length obtained by taking the arithmetic average of the pause lengths determined according to the parts of speech of the preceding and following words will not necessarily be an appropriate value.

また、前後どちらかに重みをおく必要がある場合もある
と考えられる。さらに、その重み付けの方法も前後の品
詞の組み合わせによって異なるとも考えられる。そこで
、第4の本発明では、このような問題を解決するために
、前後の品詞の組み合わせごとに挿入されるポーズ長を
求めておく。そして、ポーズが挿入される境界の前後の
単語の単語品詞の組み合わせにしたがって、予め求めて
おいたポーズ長を用いる。このような方法によって、第
3の本発明よりもさらに適したポーズ長を決定すること
が可能となる。
It is also considered that there may be cases where it is necessary to put more weight on either the front or the rear. Furthermore, the weighting method may also differ depending on the combination of the preceding and following parts of speech. Therefore, in the fourth aspect of the present invention, in order to solve this problem, the length of the pause to be inserted is determined for each combination of the preceding and succeeding parts of speech. Then, a predetermined pause length is used according to the combination of word parts of words before and after the boundary where the pause is inserted. Such a method makes it possible to determine a more suitable pause length than the third invention.

以上のような手法を用いることにより、音声に変換する
文章の係り受は構造を用いる代わりに、単語の品詞を用
いるたけで、自然なポーズ長を決定することができる9
、tな、品詞ごとに制御を行うことによって、文章の構
造に応じた細かなポーズ長の制御が可能となる。
By using the above method, it is possible to determine a natural pause length by simply using the part of speech of the word instead of using the structure of the dependency of the sentence to be converted into speech9.
By controlling each part of speech, it becomes possible to finely control the pause length according to the structure of the sentence.

(実施例) 第1図は、第1の本発明のポーズ長決定方式の一実施例
を示すブロック図である。
(Embodiment) FIG. 1 is a block diagram showing an embodiment of the pose length determination method of the first invention.

まず、複数の単語を含む文字列を、文字列入力端子11
から入力する。入力された前記文字列はポーズ挿入位置
決定部12、及び形態素解析部13に送られる。ポーズ
挿入位置決定部12は、周知の方法を用いてポーズを挿
入する境界を決定する。ポーズ挿入位置として決定され
た境界の情報はポーズ長決定部15に送られる。形態素
解析部13は、入力文字列で表される文章を単語列に分
割し、各単語の品詞を決定する。品詞情報を伴った単語
列は、ポーズ長決定部15に送られる。ポーズ長記憶部
14には、品詞PSpの単語の後ろに挿入されるポーズ
長Lf (PSp)か、品詞PSPごとに予め蓄えられ
ている。ポーズ長決定部15は、ポーズ挿入位置決定部
12で決定されたポーズ挿入境界の直前にある単語の品
詞PSpに応じて、前記ポーズ長記憶部14に蓄えられ
ているポーズ長Lf (PSp)を読み出し、(作用)
の項で説明したような手法によって挿入するポーズ長を
決定し、結果をポーズ長出力端子16から出力する。
First, input a character string containing multiple words to the character string input terminal 11.
Enter from. The input character string is sent to the pause insertion position determination section 12 and the morphological analysis section 13. The pose insertion position determining unit 12 determines a boundary for inserting a pose using a well-known method. Information on the boundary determined as the pose insertion position is sent to the pause length determining section 15. The morphological analysis unit 13 divides the sentence represented by the input character string into word strings, and determines the part of speech of each word. The word string with the part of speech information is sent to the pause length determining section 15. The pause length storage unit 14 stores in advance the pause length Lf (PSp) to be inserted after the word of the part of speech PSp, or for each part of speech PSP. The pause length determination unit 15 determines the pause length Lf (PSp) stored in the pause length storage unit 14 according to the part of speech PSp of the word immediately before the pose insertion boundary determined by the pause insertion position determination unit 12. readout, (action)
The pause length to be inserted is determined by the method described in the above section, and the result is output from the pause length output terminal 16.

第2の本発明を実現するためには、第1図におけるポー
ズ長記憶部14に、品詞PSfの単語の直前に挿入され
るポーズ長Lp (PSf)を品詞PSfごとに蓄えて
おく。ポーズ長決定部15では、ポーズ挿入位置決定部
12で決定されたポーズ挿入境界の直後にある単語の品
詞に応じて、前記ポーズ長記憶部14に蓄えられている
単語の直前に挿入されるポーズ長Lp (PSf )を
読み出し、(作用)の項で説明したような手法によって
挿入するポーズ長を決定すれはよい。
In order to realize the second aspect of the present invention, the pause length storage unit 14 in FIG. 1 stores a pause length Lp (PSf) to be inserted immediately before the word of the part of speech PSf for each part of speech PSf. The pause length determination unit 15 determines the pose to be inserted immediately before the word stored in the pause length storage unit 14, depending on the part of speech of the word immediately after the pose insertion boundary determined by the pause insertion position determination unit 12. It is sufficient to read the length Lp (PSf) and determine the pause length to be inserted using the method described in the (effect) section.

第3の本発明を実現するためには、第1図におけるポー
ズ長記憶部14に、品詞PSpの単語の直後に挿入され
るポーズ長Lf (PSp)と品詞PSfの単語の直前
に挿入されるポーズ長LP(PSf)とを、品詞PSp
、PSfことにそれぞれ蓄えておく。ポーズ長決定部1
5では、ポーズ挿入位置決定部12で決定されたポーズ
挿入境界の直前にある単語の品詞Pspに応じて、前記
ポーズ長記憶部14に蓄えられている単語の直後に挿入
されるポーズ長Lf(PSp)を読み出す。
In order to realize the third aspect of the present invention, the pause length Lf (PSp) inserted immediately after the word of the part of speech PSp and the pause length Lf (PSp) inserted immediately before the word of the part of speech PSf are stored in the pause length storage unit 14 in FIG. Pose length LP (PSf) and part of speech PSp
, PSf respectively. Pose length determination section 1
5, the pause length Lf( PSp).

また、挿入境界の直後にある単語の品詞PSfに応じて
、前記ポーズ長記憶部14に蓄えられている単語の直前
に挿入されるポーズ長1.p (PSf)を読み出す。
Also, depending on the part of speech PSf of the word immediately after the insertion boundary, the pause length 1. Read p (PSf).

これら2つのポーズ長Lf (PSp)、Lp(PSf
)を用いて、(作用)の項で説明したような手法によっ
て挿入するポーズ長を決定すればよい。
These two pose lengths Lf (PSp), Lp (PSf
) to determine the length of the pause to be inserted using the method described in the (effect) section.

また、第4の本発明を実現するためには、第1図におけ
るポーズ長記憶部14に、境界に挿入されるポーズ長L
 (PSp、PSf )を境界の前後の単語の品詞PS
p、PSfの組み合わせごとに蓄える。ポーズ長決定部
15では、ポーズ挿入位置決定部12で決定されたポー
ズ挿入境界の前後にある単語の品詞の組み合わせ(PS
p、PSf)に応じて、前記ポーズ長記憶部14に蓄え
られているポーズ長L (PSp、PSf )を読み出
し、(作用)の項で説明したような手法によって挿入す
るポーズ長を決定すればよい。
In addition, in order to realize the fourth aspect of the present invention, it is necessary to store the pose length L inserted at the boundary in the pose length storage unit 14 in FIG.
(PSp, PSf) is the part of speech PS of the words before and after the boundary
It is stored for each combination of p and PSf. The pause length determination unit 15 determines the combination of parts of speech (PS) of words before and after the pause insertion boundary determined by the pause insertion position determination unit 12.
p, PSf), the pause length L (PSp, PSf) stored in the pause length storage section 14 is read out, and the pause length to be inserted is determined by the method described in the (effect) section. good.

(発明の効果) 以上述べてきたように、本発明によれば、正しく解析す
ることが囲器な係り受は解析の結果を用いることなしに
、ポーズ長が決定され、単語の品詞を用いて文章の構造
に応じた細かなポーズ長の制御が行なわれるから、従来
方式よりも適切なポーズ長を決定することができる。し
たがって、本発明は、文字列で与えられた任意の文章を
音声に変換する音声合成装置等におけるポーズ長決定方
式として有効である。
(Effects of the Invention) As described above, according to the present invention, the pause length of a dependency that requires accurate analysis is determined without using the analysis result, and the part of speech of the word is used to determine the pause length. Since the pause length is finely controlled according to the structure of the sentence, it is possible to determine a more appropriate pause length than in the conventional method. Therefore, the present invention is effective as a pause length determination method in a speech synthesis device or the like that converts an arbitrary sentence given as a character string into speech.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は第1の本発明ポーズ長決定方式の一実施例を示
すブロック図である。 11・・・文字列入力端子、12・・・ポーズ挿入位置
決定部、13・・・形態素解析部、14・・・ポーズ長
記憶部、15・・・ポーズ長決定部、16・・・ポーズ
長出力端子。
FIG. 1 is a block diagram showing an embodiment of the first pose length determination method of the present invention. DESCRIPTION OF SYMBOLS 11... Character string input terminal, 12... Pause insertion position determination section, 13... Morphological analysis section, 14... Pose length storage section, 15... Pose length determination section, 16... Pause Long output terminal.

Claims (4)

【特許請求の範囲】[Claims] (1)複数の単語を含む入力文字列に基づき生成される
音声中の単語境界に挿入されるポーズの長さを決定する
ポーズ長決定方式において、複数の単語に対し、その品
詞ごとに単語の直後に挿入されるポーズの長さを予め記
憶しておき、前記単語境界の直前に位置する単語の品詞
に対応する前記記憶されている単語の直後に挿入される
ポーズの長さに基づき前記単語境界に挿入されるポーズ
の長さを決定することを特徴とするポーズ長決定方式。
(1) In a pause length determination method that determines the length of a pause to be inserted at a word boundary in speech generated based on an input character string containing multiple words, The length of the pause to be inserted immediately after is stored in advance, and the word is selected based on the length of the pause to be inserted immediately after the stored word that corresponds to the part of speech of the word located immediately before the word boundary. A pose length determination method characterized by determining the length of a pose inserted at a boundary.
(2)複数の単語を含む入力文字列に基づき生成される
音声中の単語境界に挿入されるポーズの長さを決定する
ポーズ長決定方式において、複数の単語に対し、その品
詞ごとに単語の直前に挿入されるポーズの長さを予め記
憶しておき、前記単語境界の直後に位置する単語の品詞
に対応する前記記憶されている単語の直前に挿入される
ポーズの長さに基づき前記単語境界に挿入されるポーズ
の長さを決定することを特徴とするポーズ長決定方式。
(2) In a pause length determination method that determines the length of a pause to be inserted at a word boundary in speech generated based on an input string containing multiple words, the pause length determination method determines the length of a pause inserted at a word boundary in speech generated based on an input string containing multiple words. The length of the pause to be inserted immediately before is stored in advance, and the word is selected based on the length of the pause to be inserted immediately before the stored word that corresponds to the part of speech of the word located immediately after the word boundary. A pose length determination method characterized by determining the length of a pose inserted at a boundary.
(3)複数の単語を含む入力文字列に基づき生成される
音声中の単語境界に挿入されるポーズの長さを決定する
ポーズ長決定方式において、複数の単語に対し、その品
詞ごとに単語の直後に挿入されるポーズの長さおよび単
語の直前に挿入されるポーズの長さをそれぞれ予め記憶
しておき、前記単語境界の直前に位置する単語の品詞に
対応する前記記憶されている単語の直後に挿入されるポ
ーズの長さと、前記単語境界の直後に位置する単語の品
詞に対応する前記記憶されている単語の直前に挿入され
るポーズの長さとに基づき前記単語境界に挿入されるポ
ーズの長さを決定することを特徴とするポーズ長決定方
式。
(3) In a pause length determination method that determines the length of a pause to be inserted at a word boundary in speech generated based on an input string containing multiple words, the pause length determination method The length of the pause inserted immediately after the word and the length of the pause inserted immediately before the word are stored in advance, respectively, and the length of the pause inserted immediately before the word is stored in advance, and the length of the pause inserted immediately before the word is stored in advance. a pause inserted at the word boundary based on the length of the pause inserted immediately after and the length of the pause inserted immediately before the stored word corresponding to the part of speech of the word located immediately after the word boundary; A pose length determination method characterized by determining the length of.
(4)複数の単語を含む入力文字列に基づき生成される
音声中の単語境界に挿入されるポーズの長さを決定する
ポーズ長決定方式において、互いに連なる2つの単語か
らなる単語列に対し、該単語の一方の品詞および他方の
品詞の組み合わせごとに前記単語列の単語の一方と他方
との間に挿入されるポーズの長さを予め記憶しておき、
前記単語境界の前後に位置する単語の品詞の組み合わせ
に対応する前記記憶されている単語列のポーズの長さに
基づき前記単語境界に挿入されるポーズの長さを決定す
ることを特徴とするポーズ長決定方式。
(4) In a pause length determination method that determines the length of a pause to be inserted at a word boundary in speech generated based on an input character string containing multiple words, for a word string consisting of two consecutive words, storing in advance the length of a pause to be inserted between one and the other of the words in the word string for each combination of one part of speech and the other part of speech of the word;
A pause characterized in that the length of the pause to be inserted at the word boundary is determined based on the length of the pause of the stored word string corresponding to a combination of parts of speech of words located before and after the word boundary. Long decision method.
JP2020768A 1990-01-31 1990-01-31 Pause length determining system Pending JPH03225400A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020768A JPH03225400A (en) 1990-01-31 1990-01-31 Pause length determining system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020768A JPH03225400A (en) 1990-01-31 1990-01-31 Pause length determining system

Publications (1)

Publication Number Publication Date
JPH03225400A true JPH03225400A (en) 1991-10-04

Family

ID=12036353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020768A Pending JPH03225400A (en) 1990-01-31 1990-01-31 Pause length determining system

Country Status (1)

Country Link
JP (1) JPH03225400A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007114507A (en) * 2005-10-20 2007-05-10 Toshiba Corp Prosodic control rule generating method, speech synthesizing method, prosodic control rule generating device, speech synthesizer, prosodic control rule generating program, and speech synthesizing program
WO2013008385A1 (en) * 2011-07-11 2013-01-17 日本電気株式会社 Speech synthesis device, speech synthesis method, and speech synthesis program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007114507A (en) * 2005-10-20 2007-05-10 Toshiba Corp Prosodic control rule generating method, speech synthesizing method, prosodic control rule generating device, speech synthesizer, prosodic control rule generating program, and speech synthesizing program
JP4559950B2 (en) * 2005-10-20 2010-10-13 株式会社東芝 Prosody control rule generation method, speech synthesis method, prosody control rule generation device, speech synthesis device, prosody control rule generation program, and speech synthesis program
WO2013008385A1 (en) * 2011-07-11 2013-01-17 日本電気株式会社 Speech synthesis device, speech synthesis method, and speech synthesis program
JPWO2013008385A1 (en) * 2011-07-11 2015-02-23 日本電気株式会社 Speech synthesis apparatus, speech synthesis method, and speech synthesis program

Similar Documents

Publication Publication Date Title
EP0942410B1 (en) Phoneme based speech synthesis
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US7260519B2 (en) Systems and methods for dynamically determining the attitude of a natural language speaker
JPH11507740A (en) Language synthesis
JP2007114507A (en) Prosodic control rule generating method, speech synthesizing method, prosodic control rule generating device, speech synthesizer, prosodic control rule generating program, and speech synthesizing program
US8892435B2 (en) Text data processing apparatus, text data processing method, and recording medium storing text data processing program
WO2004066271A1 (en) Speech synthesizing apparatus, speech synthesizing method, and speech synthesizing system
Carlson et al. Voice source rules for text-to-speech synthesis
De Mareüil et al. Liaisons in French: a corpus-based study using morpho-syntactic information
Rahmani An evidence-based new analysis of Persian word prosody
JP4532862B2 (en) Speech synthesis method, speech synthesizer, and speech synthesis program
JPH03225400A (en) Pause length determining system
KR100499116B1 (en) Method and apparatus for prosodic phrasing for speech synthesis
KR100202292B1 (en) Text analyzer
JP4218075B2 (en) Speech synthesizer and text analysis method thereof
JP3006240B2 (en) Voice synthesis method and apparatus
JP3001210B2 (en) Pose insertion position determination device
JP3142160B2 (en) Phonetic symbol generator
JP2748445B2 (en) Pause insertion position determination method
JPH0962286A (en) Voice synthesizer and the method thereof
JPH0358097A (en) Determination system for pause insertion position
Finch et al. Phonetics and Phonology
JP3519852B2 (en) Sentence speech conversion method and breath position determination method in sentence speech conversion device
JPH04270394A (en) Pause length determining system
Vanderweide Cue-based learning and the acquisition of pre-vocalic clusters