JP2513266B2 - Phoneme duration determination device - Google Patents

Phoneme duration determination device

Info

Publication number
JP2513266B2
JP2513266B2 JP63029475A JP2947588A JP2513266B2 JP 2513266 B2 JP2513266 B2 JP 2513266B2 JP 63029475 A JP63029475 A JP 63029475A JP 2947588 A JP2947588 A JP 2947588A JP 2513266 B2 JP2513266 B2 JP 2513266B2
Authority
JP
Japan
Prior art keywords
duration
phoneme
sentence
word
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63029475A
Other languages
Japanese (ja)
Other versions
JPH01202797A (en
Inventor
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63029475A priority Critical patent/JP2513266B2/en
Publication of JPH01202797A publication Critical patent/JPH01202797A/en
Application granted granted Critical
Publication of JP2513266B2 publication Critical patent/JP2513266B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明の音韻継続時間長決定装置は、特に、ピッチ周
波数や音韻継続時間長を規則によって制御する規則音声
合成装置における音韻継続時間長決定装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The phoneme duration determination device of the present invention is particularly applicable to a phoneme duration determination device in a rule speech synthesizer that controls pitch frequency and phoneme duration according to rules. Regarding

〔従来の技術〕[Conventional technology]

従来のこの種の装置は、発声速度の異なる音声を合成
する場合には、標準的な発声速度における継続時間長を
一定の割合で伸縮して、発声速度の制御を行っていた。
このような従来技術については、日本音響学界音声研究
会資料S85−31(1985−07)「ホルマント、CV−VC型規
則合成」等で詳述されている。
When synthesizing voices having different utterance speeds, this type of conventional device controls the utterance speed by expanding and contracting the duration of the standard utterance speed at a fixed rate.
Such a conventional technique is described in detail in "Formant, CV-VC type rule composition" etc. of Material S85-31 (1985-07) of the Acoustical Society of Japan Material.

第2図は、このような従来技術を説明するための図で
あり、音声速度を変化させるために、文章の構造や単語
の品詞等を考慮せず、発話全体に対して一定の伸縮率α
で音韻継続時間長を伸縮している。
FIG. 2 is a diagram for explaining such a conventional technique. In order to change the voice speed, a constant expansion / contraction rate α for the entire utterance is taken into consideration without considering the structure of a sentence or the part of speech of a word.
The phoneme duration is expanded and contracted with.

〔発明が解決しようとする課題〕[Problems to be Solved by the Invention]

しかしながら、上述の従来装置のように、発話全体を
一律に変化させたのでは、発声速度が変わった場合、文
章の意味や話者の意志などが必ずしもうまく聞き手に伝
わるとは限らない。
However, if the entire utterance is uniformly changed as in the above-described conventional apparatus, when the utterance speed changes, the meaning of the sentence, the will of the speaker, and the like are not always transmitted to the listener well.

これに対して本発明は、発声速度を変化させた場合で
も、聞き手に文章の意味や内容が的確に伝わるような音
韻継続時間長を持った合成音声を生成することを可能に
する音韻継続時間長決定装置を提供することを目的とし
ている。
On the other hand, the present invention provides a phonological duration that makes it possible to generate a synthesized voice having a phonological duration that allows the listener to accurately convey the meaning and content of a sentence even when the utterance speed is changed. It is intended to provide a length determining device.

〔課題を解決するための手段〕[Means for solving the problem]

本発明の音韻継続時間長決定装置は、音声に変換され
る文章を入力する手段と、音声に変換される文章を構成
する単語の品詞情報を入力する手段と、発声速度を入力
する手段と、入力された発声速度と入力された品詞情報
に応じて入力された文章を構成する単語あるいは文節単
位に継続時間長を決定する手段と、決定された単語ある
いは文節単位の継続時間長からその単語あるいは文節を
構成する個々の音韻の継続時間長を決定する手段とを有
することを特徴とする。
The phoneme duration determination device of the present invention is a unit for inputting a sentence to be converted into speech, a unit for inputting part-of-speech information of words constituting the sentence to be converted into speech, and a unit for inputting a speaking rate. A means for determining the duration length for each word or phrase unit that composes an input sentence according to the input speaking rate and the input part-of-speech information, and the word or phrase from the determined duration time for each word or phrase unit. And a means for determining the duration of each phoneme composing the phrase.

〔作用〕[Action]

人間がある文章を朗読したり、聞き手に情報を伝えた
りする場合、文章の構造や話者の意志によって文章を構
成する各単語あるいは文節が持つ重要性が変わってく
る。また1つの文章の中で、重要な情報を持っている単
語あるいは文節は、他の単語あるいは文節と区別するた
めに、はっきり発声される傾向がある。発声速度が変わ
った場合にも、この傾向は保たれる。したがって、発声
速度を変化させた場合、単語の品詞すなわちその文章に
おける単語の役割によって継続時間長の伸縮率が変わる
と考えられる。そこで、次に述べるような2段階の方法
を用いて音韻継続時間長を決定する。
When a human reads a certain sentence or conveys information to a listener, the importance of each word or phrase constituting the sentence changes depending on the structure of the sentence and the will of the speaker. Also, words or phrases having important information in one sentence tend to be pronounced clearly to distinguish them from other words or phrases. This tendency is maintained even when the utterance speed changes. Therefore, when the utterance speed is changed, it is considered that the expansion / contraction rate of the duration varies depending on the part of speech of the word, that is, the role of the word in the sentence. Therefore, the phoneme duration is determined using a two-stage method as described below.

まず、文章全体の発声速度、及びその文章を構成する
単語の品詞情報を入力する。この品詞情報としては、名
詞、動詞、形容詞等、あるいは名詞句、動詞句、形容詞
句等といったものが考えられる。この品詞情報と発声速
度とから、単語あるいは文節単位に伸縮率を算出し、単
語あるいは文節ごとに発声速度あるいは継続時間長を決
定する。
First, the speaking rate of the entire sentence and the part-of-speech information of the words that compose the sentence are input. As the part-of-speech information, nouns, verbs, adjectives, etc., or noun phrases, verb phrases, adjective phrases, etc. can be considered. The expansion / contraction rate is calculated for each word or phrase from this part-of-speech information and the utterance speed, and the utterance speed or duration time is determined for each word or phrase.

次に、この単語あるいは文節の継続時間長に基づい
て、その単語あるいは文節を構成している各音韻の継続
時間長を決定する。これは例えば、単語あるいは文節の
継続時間長と一致するように各音韻の継続時間長を決定
する方法等が考えられる。このとき各音韻の継続時間長
を決定する要因としては、前後の音韻の種類、アクセン
ト核の有無、呼気段落と呼ばれる一息で発声する単位内
での位置等がある。
Next, based on the duration of this word or phrase, the duration of each phoneme that constitutes the word or phrase is determined. For example, a method of determining the duration of each phoneme so as to match the duration of a word or a phrase can be considered. At this time, the factors that determine the duration of each phoneme include the type of phoneme before and after, the presence or absence of an accent nucleus, and the position within a unit called a breath stage called a breath.

このような音韻継続時間長の決定方法を用いることに
よって、発声速度を変えた場合でも、自然な音韻継続時
間長を生成することが可能となる。
By using such a phoneme duration determination method, it is possible to generate a natural phoneme duration even when the utterance speed is changed.

〔実施例〕〔Example〕

第1図は、本発明による音韻継続時間長決定装置の一
実施例を示すブロック図である。
FIG. 1 is a block diagram showing one embodiment of a phoneme duration determining apparatus according to the present invention.

音声に変換される文章を表す文字列等及び文章を構成
する単語の品詞情報を文字列入力端子11及び品詞情報入
力端子12からそれぞれ入力する。また、文章全体の発声
速度を、発声速度入力端子13から入力する。発声速度の
入力は、単位時間当りのモーラ数等の速度の単位で指定
する、予め決めておいた何段階かの発声速度の中から選
択する等の方法によって行うことができる。
A character string representing a sentence to be converted into voice and part-of-speech information of words constituting the sentence are input from a character string input terminal 11 and a part-of-speech information input terminal 12, respectively. Further, the speaking speed of the entire sentence is input from the speaking speed input terminal 13. The input of the utterance speed can be performed by a method such as designating in units of speed such as the number of mora per unit time or selecting from several predetermined utterance speeds.

文節継続時間長決定部14では、入力された発声速度と
入力された品詞情報とから、単語あるいは文節の単位で
それらの継続時間長を決定する。この決定方法として
は、例えば、標準的な発声速度における継続時間長に対
する伸縮率αによって所望の発声速度における継続時間
長を求める方法等が考えられる。
The phrase duration determining unit 14 determines the duration of each word or phrase based on the input utterance speed and the input part-of-speech information. As a method of this determination, for example, a method of obtaining a duration time at a desired utterance speed based on a scaling factor α with respect to the duration time at a standard utterance speed, or the like can be considered.

品詞がPS(名詞、動詞、形容詞等)である単語Wの発
声速度SRにおける音韻継続時間長を求める場合、標準的
な発声速度における音韻継続時間長に対する伸縮率をα
とするとαは品詞PSと発声速度SRとの関数fによっ
て求められる。すなわち、 α=f(PS、SR) 音韻継続時間長決定部15では、入力された文字列及び
文節継続時間長決定部14で決定された単語あるいは文節
単位の継続時間長を基に、その単語あるいは文節を構成
している個々の音韻の継続時間長を決定する。決定され
た個々の音韻の継続時間長は、音韻継続時間長出力端子
16から出力されている。
When obtaining the phoneme duration of the word W whose part of speech is PS (noun, verb, adjective, etc.) at the utterance rate SR, the expansion / contraction rate for the phoneme duration at the standard utterance rate is α
Letting W be α W, it is obtained by a function f of the part of speech PS and the speaking rate SR. That is, α W = f (PS, SR) In the phoneme duration determination unit 15, based on the input character string and the duration length of the word or the phrase unit determined by the phrase duration determination unit 14, Determine the duration of the individual phonemes that make up a word or phrase. The determined phoneme duration is the phoneme duration output terminal.
It is output from 16.

〔発明の効果〕〔The invention's effect〕

以上述べてきたように、本発明によれば、発声速度を
変化させた場合でも自然な音韻継続時間長を生成するこ
とが可能であり、様々な発声速度の合成音声を出力する
必要がある音声応答装置等に用いる音韻継続時間長決定
装置を実現するのに有効である。
As described above, according to the present invention, it is possible to generate a natural phoneme duration even when the utterance speed is changed, and it is necessary to output synthetic speech with various utterance speeds. This is effective in realizing a phoneme duration determination device used in a response device or the like.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明による音韻継続時間長決定装置の一実施
例を示すブロック図、第2図は従来技術を説明するため
の図である。 図において、11は文字列入力端子、12は品詞情報入力端
子、13は発声速度入力端子、14は文節継続時間長決定
部、15は音韻継続時間長決定部、16は音韻継続時間長出
力端子である。
FIG. 1 is a block diagram showing an embodiment of a phoneme duration determining device according to the present invention, and FIG. 2 is a diagram for explaining a conventional technique. In the figure, 11 is a character string input terminal, 12 is a part-of-speech information input terminal, 13 is a speech rate input terminal, 14 is a phrase duration determining unit, 15 is a phoneme duration determining unit, and 16 is a phoneme duration output terminal. Is.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】様々な発声速度の音声を合成する際の音韻
継続時間長決定装置において、音声に変換される文章を
入力する手段と、前記音声に変換される文章を構成する
単語の品詞情報を入力する手段と、発声速度を入力する
手段と、前記入力された発声速度と前記入力された品詞
情報に応じて前記入力された文章を構成する単語あるい
は文節単位に継続時間長を決定する手段と、前記決定さ
れた単語あるいは文節単位の継続時間長からその単語あ
るいは文節を構成する個々の音韻の継続時間長を決定す
る手段とを有することを特徴とする音韻継続時間長決定
装置。
1. A device for determining a phoneme duration for synthesizing voices of various utterance speeds, means for inputting a sentence to be converted into voice, and part-of-speech information of words constituting the sentence to be converted into voice. Means for inputting a speech speed, means for inputting a speech rate, and means for determining a duration length in units of words or phrases constituting the input sentence according to the input speech rate and the input part-of-speech information. And a means for determining the duration of each phoneme that composes the word or phrase from the determined duration of the word or phrase unit.
JP63029475A 1988-02-09 1988-02-09 Phoneme duration determination device Expired - Lifetime JP2513266B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63029475A JP2513266B2 (en) 1988-02-09 1988-02-09 Phoneme duration determination device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63029475A JP2513266B2 (en) 1988-02-09 1988-02-09 Phoneme duration determination device

Publications (2)

Publication Number Publication Date
JPH01202797A JPH01202797A (en) 1989-08-15
JP2513266B2 true JP2513266B2 (en) 1996-07-03

Family

ID=12277115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63029475A Expired - Lifetime JP2513266B2 (en) 1988-02-09 1988-02-09 Phoneme duration determination device

Country Status (1)

Country Link
JP (1) JP2513266B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373299B2 (en) 2002-12-27 2008-05-13 Kabushiki Kaisha Toshiba Variable voice rate apparatus and variable voice rate method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373299B2 (en) 2002-12-27 2008-05-13 Kabushiki Kaisha Toshiba Variable voice rate apparatus and variable voice rate method
US7742920B2 (en) 2002-12-27 2010-06-22 Kabushiki Kaisha Toshiba Variable voice rate apparatus and variable voice rate method

Also Published As

Publication number Publication date
JPH01202797A (en) 1989-08-15

Similar Documents

Publication Publication Date Title
JPH08512150A (en) Method and apparatus for converting text into audible signals using neural networks
JPH05165486A (en) Text voice transforming device
JP2513266B2 (en) Phoneme duration determination device
JP2581130B2 (en) Phoneme duration determination device
JP3094622B2 (en) Text-to-speech synthesizer
JP3113101B2 (en) Speech synthesizer
JPH0580791A (en) Device and method for speech rule synthesis
JPS5972494A (en) Rule snthesization system
JP3031691B2 (en) Voice rule synthesizer
JP3357796B2 (en) Speech synthesis apparatus and method for generating prosodic information in the apparatus
JP3088211B2 (en) Basic frequency pattern generator
JPH01321496A (en) Speech synthesizing device
JP3297221B2 (en) Phoneme duration control method
JP2910587B2 (en) Speech synthesizer
JPH02247696A (en) Text voice synthesizer
JPH04149500A (en) Text voice synthesizer
JPH0667685A (en) Speech synthesizing device
JP2643408B2 (en) Pitch pattern generator
JPH056191A (en) Voice synthesizing device
JPH08328578A (en) Text voice synthesizer
JPH04270394A (en) Pause length determining system
JPH01216399A (en) Voice synthesizing device
JPH05333892A (en) Pitch pattern generating device
JPH03196199A (en) Speech synthesizer
JPH03203800A (en) Voice synthesis system

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term