JPH07140995A - Method and device for deciding word accent - Google Patents

Method and device for deciding word accent

Info

Publication number
JPH07140995A
JPH07140995A JP5286328A JP28632893A JPH07140995A JP H07140995 A JPH07140995 A JP H07140995A JP 5286328 A JP5286328 A JP 5286328A JP 28632893 A JP28632893 A JP 28632893A JP H07140995 A JPH07140995 A JP H07140995A
Authority
JP
Japan
Prior art keywords
accent
type
word
verb
adjective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5286328A
Other languages
Japanese (ja)
Other versions
JP3092770B2 (en
Inventor
Koji Matsuoka
浩司 松岡
Hisashi Obara
永 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP05286328A priority Critical patent/JP3092770B2/en
Publication of JPH07140995A publication Critical patent/JPH07140995A/en
Application granted granted Critical
Publication of JP3092770B2 publication Critical patent/JP3092770B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To provide a word accent deciding method and a device executing the method in which an accent is correctly set while reducing the accent type dictionary recording in a practical use. CONSTITUTION:The word accent deciding method and the device decide an accent type of each word, which constitute an input sentence, during the process in which a synthesized voice is generated from the input sentence. In the method and the device, continuous type and termination type accents are recorded for verbs and adjectives. For adjective verb, accent types of the stem of words are recorded. For other parts of speech, accent types of words are recorded and these accent types recorded in a dictionary section 105 are outputted.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、単語アクセント決定
方法およびこの方法を実施する装置に関し、特に、入力
された文から合成音声を生成する過程において入力文を
構成する各単語のアクセント型を決定する単語アクセン
ト決定方法およびこの方法を実施する装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a word accent determination method and an apparatus for implementing this method, and more particularly, to determine the accent type of each word constituting an input sentence in the process of generating synthetic speech from an input sentence. A method for determining a word accent and a device for implementing the method.

【0002】[0002]

【従来の技術】漢字かな混じり文を入力し、アクセント
情報およびポーズ情報を付与した読み列に変換した後、
この入力された文を合成音声として出力する合成音声出
力装置は既に実用化されている。そして、この様な合成
音声出力装置を使用して電子メール、新聞記事その他の
文の内容を電話その他の音声伝送装置を介して伝送し、
音声により出力することができるサービスも既に実現さ
れている。しかし、現在の技術レベルにおいては、人間
の発話音声と合成音声とを比較した場合、読み、アクセ
ント、ポーズの何れについても誤り、不自然さが残存し
ている。これが原因となって、このサービスの適用範囲
は限定され、利用者数の伸びは低迷することとなる。
2. Description of the Related Art After inputting a kanji / kana mixed sentence and converting it into a reading string with accent information and pause information,
A synthetic speech output device that outputs the input sentence as synthetic speech has already been put into practical use. Then, by using such a synthetic voice output device, the contents of an electronic mail, newspaper article or other sentence are transmitted via a telephone or other voice transmission device,
Services that can be output by voice have already been realized. However, at the current technical level, when comparing a human uttered voice with a synthetic voice, errors and unnaturalness remain in any of reading, accent, and pose. Due to this, the scope of application of this service is limited, and the growth of the number of users will be sluggish.

【0003】日本語の漢字かな混じり文を入力して合成
音声を出力するには、合成音声出力装置の内部におい
て、入力された文に含まれる漢字に対して読みを付与す
ることは最少限必要とされる。このために、合成音声出
力装置による処理手順としては、先ず、入力された文に
対して自然言語処理の一技術である形態素解析処理を施
し、これを単語単位に分割して個々の単語の読みを決定
する。
In order to input a mixed sentence of Japanese kanji and kana and output a synthesized voice, it is necessary to add a reading to the kanji contained in the input sentence in the synthesized voice output device as a minimum. It is said that Therefore, the processing procedure by the synthetic speech output device is as follows.First, morphological analysis processing, which is a technique of natural language processing, is applied to the input sentence, and this is divided into word units to read individual words. To decide.

【0004】更に、単なる棒読みになることを防止する
ために、各単語についてアクセント型を決定する。ここ
で、アクセント型とは、分割された単語の読みのどこに
アクセントを付与すればよいかを示す情報であり、語頭
からアクセント核(ピッチ周波数のピーク部分)がある
モーラ(かな文字一文字に対応する発声単位)までのモ
ーラの個数(ただし、拗音、濁音、半濁音は数えない)
により表現する。例えば、動詞終止形「食べる」のアク
セントは「タベ¬ル」と表される。ここで、記号¬は、
その直前のモーラにアクセント核があることを表す。こ
の例は、第二モーラ「ベ」にアクセント核があるので、
アクセント型は2型である。
Furthermore, the accent type is determined for each word in order to prevent it from becoming a simple stick reading. Here, the accent type is information indicating where to add an accent to the reading of the divided words, and corresponds to a mora (one kana character) from the beginning of the word to the accent nucleus (peak portion of the pitch frequency). The number of moras up to the vocalization unit (however, the number of jumbles, voiced sounds, and semi-voiced sounds is not counted)
Express by. For example, the accent of the verb ending "eat" is expressed as "tabele". Where the symbol ¬ is
It indicates that the mora immediately before that has an accent nucleus. In this example, there is an accent nucleus in the second mora "Be", so
The accent type is type 2.

【0005】以上の単語のアクセント型を組み合わせた
だけでは、文全体として自然なアクセントを付与したこ
とにはならない。単語が連接して文節を作る場合、単語
固有のアクセントが変化し、アクセント核が移動し、消
失し、新たなアクセント核が生起するからである。以上
のことから、複数の単語をアクセント句にまとめてアク
セント句を生成し、アクセント句に対してアクセント型
を決定する。ここで、アクセント句とは、自然に喋った
ときに1個のまとまりとして発声される単位であってア
クセント核を1個有する単位として定義され、一般的に
は複数の単語により構成される。
The combination of the above accent types of words does not give a natural accent to the entire sentence. This is because when words are connected to form a phrase, the accent peculiar to the word changes, the accent nucleus moves and disappears, and a new accent nucleus occurs. From the above, a plurality of words are combined into an accent phrase to generate an accent phrase, and the accent type is determined for the accent phrase. Here, an accent phrase is a unit that is uttered as one unit when naturally speaking and is defined as a unit having one accent nucleus, and is generally composed of a plurality of words.

【0006】次に、アクセント句を構成する単語の性質
に基づいてアクセント句に1つのアクセント型を生成す
る。即ち、アクセント句のアクセント型を決定する(匂
坂、佐藤:「日本語単語連鎖のアクセント規則」電子情
報学会論文誌Vol.J66−D,No7,pp.84
9−856]参照)。アクセント句、例えば「食べるよ
うだ」のアクセント型は、次の様にして求められる。動
詞「食べる」のアクセント型=2型である。助動詞「よ
うだ」のアクセント結合様式=不完全支配型である。こ
こで、不完全支配型とは、アクセント核を有しない自立
語に対してのみ付属語のアクセント核(この単語は第1
モーラ「ヨ」にアクセント核が存在)が現れる結合型で
ある。従って、アクセント核を有する自立語である動詞
「食べる」に対して不完全支配型助動詞「ようだ」にア
クセント核は現れず、アクセント核を有する自立語であ
る動詞「食べる」のアクセント型がそのままこのアクセ
ント句のアクセント型となる。即ち、 タベ¬ル + ヨ¬ウダ → タベ¬ルヨウダ となる。
Next, one accent type is generated for the accent phrase based on the nature of the words that compose the accent phrase. That is, the accent type of the accent phrase is determined (Osaka, Sato: "Japanese Word Chain Accent Rule", IEICE Transactions, Vol. J66-D, No7, pp.84.
9-856]). The accent phrase, for example, the accent type of "it seems to eat", is obtained as follows. The verb "eat" has accent type = type 2. The accent conjugation style of the auxiliary verb "Yoda" = incomplete dominance type. Here, the incomplete dominance type is the accent nucleus of the adjunct word only for independent words that do not have the accent nucleus (this word is the first
Mora "yo" has an accent nucleus). Therefore, no accent nucleus appears in the incomplete dominant auxiliary verb "Yoda" with respect to the verb "eat" which is an independent word having an accent nucleus, and the accent type of the verb "eat" which is an independent word having an accent nucleus remains unchanged. This is the accent type of this accent phrase. In other words, tabular + horizontal → tabular iodine.

【0007】以上の例に示される如く、アクセント句の
アクセント型は単語固有のアクセント型に基づいて求め
ることができる。単語固有のアクセント型を正しく求め
ることにより、入力文に正しいアクセントを付与するこ
とができる。従って、入力文に正しいアクセントを付与
するには、単語のアクセント型を辞書に予め登録するこ
とが必要となる。この場合、非活用語(名詞、副詞その
他の活用しない単語)或は不規則な活用をする活用語
(例えば助動詞)は、個々の単語のアクセント型そのも
のを辞書に収録すればよい。しかし、規則的な活用をす
る活用語(例えば動詞、形容詞、形容動詞)は、基本と
する活用形(基本形)のアクセント型を収録しておき、
これに基づいて他の活用形のアクセント型を生成する様
にすれば辞書の記憶容量を削減することができる。
As shown in the above example, the accent type of the accent phrase can be obtained based on the accent type unique to the word. By correctly obtaining the accent type peculiar to a word, the correct accent can be added to the input sentence. Therefore, in order to give the correct accent to the input sentence, it is necessary to register the word accent type in the dictionary in advance. In this case, as for non-conjugated words (nouns, adverbs and other non-utilized words) or irregularly utilized conjugation words (for example, auxiliary verbs), the accent type of each word itself may be recorded in the dictionary. However, inflection words that are used regularly (for example, verbs, adjectives, adjective verbs), the accented form of the basic inflectional form (basic form) is recorded,
If the accent type of another inflection type is generated based on this, the storage capacity of the dictionary can be reduced.

【0008】上述の参照文献には、動詞の基本形として
は終止形を採用することができるものと記載されてい
る。ここで、一段活用の未然形および連用形のアクセン
ト型はアクセント核が左へ1つ(−1)移動する。即
ち、動詞アクセント型導出規則として以下の導出規則が
示されている。ここで、終止形のアクセント型をm型と
する。 [動詞アクセント型導出規則] (1)活用形=未然形、連用形の場合 (1−1)動詞が一段活用である場合 アクセント型=m−1型 (1−2)その他の活用である場合 アクセント型=m型 (2)活用形=その他の活用形(終止形、仮定形、命令
形)の場合 アクセント型=m型
The above-mentioned references describe that a final form can be adopted as a basic form of a verb. Here, in the accent type of the pre-use type and the continuous type that are further utilized, the accent nucleus moves one (-1) to the left. That is, the following derivation rules are shown as the verb accent derivation rules. Here, the final accent type is m type. [Verb accent type derivation rule] (1) Inflectional form = pre-existing form, continuous form (1-1) When verb is one stage inflection Accent type = m-1 type (1-2) In other forms of use Accent Type = m type (2) Inflectional type = other inflectional types (end type, hypothetical type, imperative type) Accent type = m type

【0009】[0009]

【発明が解決しようとする課題】以上の動詞アクセント
型導出規則により導出されたアクセント型に誤りを生じ
る場合があった。以下にその具体例を示す。 サ変活用動詞の連用形 漢語からなる語幹と動詞「する」とを複合したサ変活用
動詞が上述の動詞アクセント形導出規則に適合しないこ
とがある。
The accent type derived by the above verb accent type derivation rules may be erroneous. Specific examples are shown below. Conjunctive forms of Sa-inflectional verbs Sa-inflectional verbs that combine the stem of a Chinese language and the verb "suru" may not conform to the above-mentioned verb accent form derivation rules.

【0010】(例1) 対する 終止形は「タイス¬ル」(アクセント型=3型)であ
る。サ変活用動詞であるので(1−2)が適用され、連
用形は3型が導出される。正しくは「タ¬イシ」(アク
セント型=1型)である。 一段活用動詞の連用形 アクセント型=1型の一段活用動詞の連用形が上述の動
詞アクセント型導出規則に適合しない。
(Example 1) The final type is "Tysle" (accent type = 3 type). (1-2) is applied because it is a syllable inflection verb, and the continuous form is 3 type. Correctly, it is “Taishi” (accent type = 1 type). Conjunctive forms of single-verb verbs Accent type = 1 The continuous forms of single-verb verbs do not meet the above verb accent-type derivation rules.

【0011】(例2) 見る 終止形「ミ¬ル」(アクセント型=1型)である。一段
活用動詞であるので、(1−1)が適用され、連用形は
0型が導出される。正しくは「ミ¬(テ)」(アクセン
ト型=1型)である。 一段活用動詞の未然形 一段活用動詞の未然形が上述の動詞アクセント型導出規
則に適合しない。
(Example 2) It is a termination type "mill" (accent type = 1 type) to be seen. Since it is a one-stage conjugation verb, (1-1) is applied, and the continuous form 0 type is derived. Correctly, it is "mi" (accent type = 1 type). Antecedent of a singular conjugation verb The antecedent of a singular conjugation verb does not conform to the above verb accent type derivation rules.

【0012】(例3) 起きる 終止形「オキ¬ル」(アクセント型=2型)である。一
段活用動詞であるので(1−1)が適用され未然形は1
型が導出される。正しくは「オキ¬(ナイ)」(アクセ
ント型=2型)である。(例1)および(例2)は、動
詞において終止形のアクセント型のみを基本形としてこ
れに基づいて他の活用形のアクセント型を導出しようと
する点に無理があり、終止形と連用形とを共に基本形と
して辞書に登録する必要があることを示している。(例
3)は、未然形のアクセント型を終止形のアクセント型
と同一とすべきことを示している。
(Example 3) It is an end type "okiru" (accent type = 2 type) that occurs. Since it is a one-stage conjugation verb, (1-1) is applied and the preform is 1
The type is derived. Correctly, it is "Oki (n)" (accent type = 2 type). In (Example 1) and (Example 2), it is unreasonable to try to derive an accent type of another inflectional form based on only the final accent type as a basic form in the verb. Both indicate that the basic form must be registered in the dictionary. (Example 3) shows that the preformed accent type should be the same as the final accent type.

【0013】なお、形容詞、形容動詞については、基本
形から活用形のアクセント型を導出する方法は明らかに
されていない。以上の通り、従来の技術に依っては単語
固有のアクセント型を正確に求めることはできない。こ
こで、活用形を単語として個別に登録してアクセント型
を収録することとすると、辞書の記憶容量を膨大なもの
にしなければならない。
Regarding the adjectives and adjective verbs, a method for deriving the accent type of the inflectional form from the basic form has not been clarified. As described above, it is impossible to accurately obtain the accent type peculiar to a word by the conventional technique. Here, if the inflectional form is individually registered as a word and the accent type is recorded, the storage capacity of the dictionary must be enormous.

【0014】この発明は、上述の通りの問題を解消し、
アクセントを正しく設定して自然な合成音声を出力する
と共に、辞書に収録する活用形のアクセント型の数を削
減することができる単語アクセント決定方法を提供する
ものである。
The present invention solves the above problems,
(EN) A word accent determination method capable of correctly setting accents and outputting a natural synthesized voice and reducing the number of inflectional accent types recorded in a dictionary.

【0015】[0015]

【課題を解決するための手段】入力文から合成音声を生
成する過程において、入力文を構成する各単語のアクセ
ント型を決定する単語アクセント決定方法において、動
詞および形容詞については連用形および終止形のアクセ
ント型を収録し、形容動詞については語幹のアクセント
型を収録し、その他の品詞の単語については当該単語の
アクセント型を収録し、これら収録されたアクセント型
を出力する単語アクセント決定方法を構成した。
In the process of generating a synthetic speech from an input sentence, in a word accent determination method for determining the accent type of each word constituting the input sentence, in the case of verbs and adjectives, continuous and final accents are used. A type is recorded, the accent type of the stem is recorded for the adjective verb, the accent type of the word is recorded for the other part-of-speech words, and the word accent determination method that outputs these recorded accent types is constructed.

【0016】そして、入力文から合成音声を生成する過
程において、入力文を構成する各単語のアクセント型を
決定する単語アクセント決定装置において、動詞につい
ては連用形および終止形のアクセント型を収録し、形容
詞については連用形および終止形のアクセント型を収録
し、形容動詞については語幹のアクセント型を収録し、
その他の品詞の単語については当該単語のアクセント型
を収録し、これら収録されたアクセント型を出力する辞
書部105を具備し、動詞については連用形であるか或
はその他の活用形であるかに対応して、辞書部105に
収録される連用形のアクセント型或は終止形のアクセン
ト型を出力する動詞アクセント決定部102を具備し、
形容詞については連用形であるか或はその他の活用形で
あるかに対応して、辞書部105に収録される連用形の
アクセント型或は終止形のアクセント型を出力する形容
詞アクセント決定部103を具備し、形容動詞について
は辞書部に収録される形容動詞語幹のアクセント型を出
力する形容動詞アクセント決定部104を具備し、入力
文を構成する各単語の品詞が動詞であるか、形容詞であ
るか、形容動詞であるか、或はその他の品詞であるかに
対応して、動詞アクセント決定部102、形容詞アクセ
ント決定部103、形容動詞アクセント決定部104、
辞書部105を選択してアクセント型を出力させる品詞
選択部101を具備する単語アクセント決定装置、を構
成した。
Then, in the process of generating a synthetic voice from an input sentence, in a word accent determination device that determines the accent type of each word that constitutes the input sentence, the verb is recorded as a continuous form and an end form, and the adjective is recorded. Includes continuous and final accent types, and includes adjective accent types for adjective verbs.
For words of other parts of speech, the accent types of the words are recorded, and a dictionary unit 105 for outputting the recorded accent types is provided. Corresponding to whether the verb is a continuous form or another inflection form. In addition, the verb accent determination unit 102 for outputting a continuous accent type or an end type accent type stored in the dictionary unit 105 is provided.
The adjective accent determination unit 103 is provided for outputting the adjective accent type or the ending accent type stored in the dictionary unit 105, depending on whether the adjective is a continuation form or another inflection form. As for the adjective verb, the adjective verb accent determination unit 104 that outputs the accent type of the adjective verb stem included in the dictionary unit is provided, and the part of speech of each word forming the input sentence is a verb or an adjective, Depending on whether it is an adjective verb or another part-of-speech, the verb accent determiner 102, the adjective accent determiner 103, the adjective verb accent determiner 104,
A word accent determination device including a part-of-speech selecting unit 101 that selects the dictionary unit 105 and outputs the accent type is configured.

【0017】[0017]

【実施例】この発明の実施例を図を参照して説明する。
図1はこの発明の主要部を説明するブロック図であり、
図2はこの発明を適用する合成音声出力装置のブロック
図である。漢字かな混じり文100は、形態素解析処理
部200に入力され、ここにおいて単語単位に分割され
ると共に文法情報付き分かち書き単語列201とされ
る。読み付与処理部202は、文法情報付き分かち書き
単語列201に読みを付与するところである。アクセン
ト付与処理部203は、文法情報付き分かち書き単語列
201に適切なアクセントを付与したアクセント情報付
きカナ列を出力するところである。このアクセント付与
処理部203は、単語アクセント決定処理部2031
アクセント句抽出処理部2032 、アクセント結合処理
部2033 の各処理部により構成される。ポーズ付与処
理部205は、文法上、或は意味上の切れ目に該当する
アクセント句の末尾にポーズを設定するところである。
合成音声出力処理部206は、入力された文の意味内容
に対応する合成音声を出力するところである。
Embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram for explaining the main part of the present invention.
FIG. 2 is a block diagram of a synthetic voice output device to which the present invention is applied. The kanji / kana mixed sentence 100 is input to the morphological analysis processing unit 200, and is divided into word units at this time and is also formed as a punctuation word string 201 with grammatical information. The reading addition processing unit 202 is to add reading to the word-spacing word string 201 with grammar information. The accent imparting processing unit 203 outputs a Kana sequence with accent information in which a proper accent is given to the word-spacing word segment 201 with grammatical information. The accent imparting processing unit 203 includes a word accent determining processing unit 203 1 ,
The accent phrase extraction processing unit 203 2 and the accent combination processing unit 203 3 are included. The pose giving processing unit 205 is about to set a pose at the end of an accent phrase corresponding to a grammatical or semantic break.
The synthetic speech output processing unit 206 is a place where synthetic speech corresponding to the meaning and content of the input sentence is output.

【0018】図3は形態素解析処理部200による処理
を説明するフローチャートである。漢字かな混じり文1
00が入力され(ステップ:S1)、これに形態素解析
処理を施し(ステップ:S2)、分割された各単語に品
詞が付与された文法情報付き分かち書き単語列201を
生成してこれを出力する(ステップ:S3)。なお、形
態素解析処理は既存技術であり、実用に耐え得る技術と
して確立されている。この形態素解析処理は、文頭から
順に1文字づつずらしながら辞書検索を行い、各文字を
先頭とする単語候補を抽出する。これらの単語候補に対
して、(1)位置的接続条件(先行単語の末尾の文字と
後続単語の先頭の文字が隣接するか)、(2)文法的接
続条件(先行単語と後続単語が品詞的に接続することが
できるか)を満足する単語連鎖を選択する。この時、各
単語の品詞と活用形を決定することができる。(吉村、
日高、吉田:「文節数最小法を用いたべた書き日本語文
の形態素解析」、情報処理学会論文誌、Vol.24,
No.1,pp.40−46,参照) 図4は読み付与処理部202とアクセント付与処理部2
03による処理を説明するフローチャートである。読み
付与処理部202には形態素解析処理部200において
生成された文法情報付き分かち書き単語列201が入力
され(ステップ:S4)、次いで読み付与処理部20
2においてこれに読みを付与する(ステップ:S5)。
単語アクセント決定処理部2031 は、この読みを付与
された単語列について、この発明の単語アクセント決定
方法により単語のアクセントを決定し(ステップ:S
6)、アクセント句抽出処理部2032 において複数の
単語をアクセント句にまとめ(ステップ:S7)、アク
セント結合処理部2033 はアクセント結合規則を適用
してアクセント句についてアクセント型を決定し(ステ
ップ:S8)、アクセント情報付きカナ列204を出力
する(ステップ:S9)。なお、図4のアクセント情報
付きカナ列のカナ列アクセントにおいて、”/”はアク
セント句の境界を表す。
FIG. 3 is a flow chart for explaining the processing by the morphological analysis processing unit 200. Kanji mixed kana sentence 1
00 is input (step: S1), morpheme analysis processing is performed on this (step: S2), and a grammatical information-added separated word string 201 in which a part of speech is added to each divided word is generated and output ( Step: S3). The morphological analysis process is an existing technique and is established as a technique that can be put to practical use. In this morphological analysis process, a dictionary search is performed while shifting one character at a time from the beginning of a sentence, and word candidates starting with each character are extracted. For these word candidates, (1) positional connection condition (whether the last character of the preceding word is adjacent to the first character of the succeeding word), (2) grammatical connection condition (the preceding word and the succeeding word are parts of speech) Select a word chain that satisfies the above conditions. At this time, the part-of-speech and inflection of each word can be determined. (Yoshimura,
Hidaka and Yoshida: “Morpheme analysis of solid Japanese sentences using the minimum number of clauses”, Journal of Information Processing Society of Japan, Vol. 24,
No. 1, pp. 40-46). FIG. 4 shows the reading imparting processing unit 202 and the accent imparting processing unit 2.
It is a flowchart explaining the process by 03. The segmentation word string 201 with grammatical information generated in the morphological analysis processing unit 200 is input to the reading addition processing unit 202 (step: S4), and then the reading addition processing unit 20.
In step 2, reading is added to this (step: S5).
Word accent determination processing unit 203 1, this read word sequence has been granted, the word accent determined by word accent determination method of the present invention (step: S
6), the accent phrase extraction processing unit 203 2 collects a plurality of words into an accent phrase (step: S7), and the accent combination processing unit 203 3 applies the accent combination rule to determine the accent type of the accent phrase (step: S7). S8), and the kana string 204 with accent information is output (step: S9). In the Kana string accent of the Kana string with accent information shown in FIG. 4, "/" represents the boundary of the accent phrase.

【0019】ここで、説明の簡単化のために、形態素解
析処理200により活用語の語幹と語尾とを分離するこ
とを前提として、この発明の単語アクセント決定方法を
説明する。語幹は、その品詞による動詞アクセント決定
部102、形容詞アクセント決定部103、形容動詞ア
クセント決定部104の選択、および辞書部105の検
索キーとして使用する。そして、語尾はその活用形によ
るアクセント型の選択に使用する。他の方法として、活
用語を変化部分と非変化部分に分離する場合、活用語を
語幹と語尾に分離しないで一語として収録する場合の決
定方法も、この実施例から容易に類推することができ
る。
Here, for the sake of simplification of explanation, the word accent determination method of the present invention will be described on the premise that the morpheme analysis processing 200 separates the stem and the ending of the inflection word. The word stem is used as a search key of the verb accent determining unit 102, the adjective accent determining unit 103, the adjective verb accent determining unit 104, and the dictionary unit 105 according to the part of speech. The ending is used to select the accent type based on the inflection. As another method, when the inflectional word is separated into the changed part and the non-invariant part, the determination method in which the inflectional word is recorded as one word without being separated into the stem and the ending can be easily analogized from this example. it can.

【0020】図5は、この発明の品詞選択部101のフ
ローチャートである。文法情報付き分かち書き単語列2
01に基づいて、先ず、単語が動詞語幹であるか否かを
判定する(ステップ:S11)。動詞語幹である場合、
語幹とこれに後続する語尾とを動詞アクセント決定部1
02に送る(ステップ:S12)。動詞語幹ではない場
合、単語が形容詞語幹であるか否かを判定する(ステッ
プ:S13)。形容詞語幹である場合、語幹とこれに後
続する語尾とを形容詞アクセント決定部103に送る
(ステップ:S14)。形容詞語幹ではない場合、単語
が形容動詞語幹であるか否かを判定する(ステップ:S
15)。形容動詞語幹である場合、語幹を形容動詞アク
セント決定部104に送る(ステップ:S16)。形容
動詞語幹ではない場合、単語を検索キーとして辞書部1
05を検索して当該単語のアクセント型を得る(ステッ
プ:S17)。
FIG. 5 is a flowchart of the part-of-speech selecting unit 101 of the present invention. Separated word string 2 with grammatical information
Based on 01, it is first determined whether or not the word is a verb stem (step: S11). If it is a verb stem,
The verb accent determination unit 1 for the stem and the trailing end of the stem.
02 (step: S12). If the word is not a verb stem, it is determined whether the word is an adjective stem (step: S13). If it is an adjective stem, it sends the stem and its trailing end to the adjective accent determination unit 103 (step: S14). If the word is not an adjective stem, it is determined whether the word is an adjective stem (step: S
15). If the stem is an adjective verb stem, the stem is sent to the adjective verb accent determination unit 104 (step: S16). If it is not an adjective verb stem, the word is used as a search key in the dictionary section 1
05 is obtained to obtain the accent type of the word (step: S17).

【0021】図6は、この発明の動詞アクセント決定部
102と形容詞アクセント決定部103のフローチャー
トである。ここで、動詞アクセント決定部102と形容
詞アクセント決定部103は同一のフローチャートで記
述される。品詞選択部101から送出された語幹と語尾
とから語幹と語尾とを結合して構成される単語である動
詞或は形容詞のアクセント型を決定する。語幹を検索キ
ーとして辞書部105を検索し、連用形と終止形のアク
セント型を得る(ステップ:S21)。語尾の活用形が
連用形であるか否か判定し(ステップ:S22)、連用
形の場合は単語のアクセント型を連用形のアクセント型
とし(ステップ:S23)、その他の場合は単語のアク
セント型を終止形のアクセント型とする(ステップ:S
24)。
FIG. 6 is a flow chart of the verb accent determination unit 102 and the adjective accent determination unit 103 according to the present invention. Here, the verb accent determination unit 102 and the adjective accent determination unit 103 are described in the same flowchart. The accent type of a verb or adjective, which is a word formed by combining the stem and the ending of the stem sent from the part-of-speech selecting unit 101, is determined. The dictionary unit 105 is searched using the word stem as a search key to obtain the accent type of continuous type and final type (step: S21). It is determined whether or not the inflectional form of the ending is the combined form (step: S22). If the combined form is the combined form, the word accent type is set as the combined form accent type (step: S23). In other cases, the word accent form is the end form. Accent type (step: S
24).

【0022】図7はこの発明の形容動詞アクセント決定
部104のフローチャートである。品詞選択部101か
ら送出された形容動詞の語幹から、語幹と語尾とを結合
して構成される単語である形容動詞のアクセント型を決
定する。語幹を検索キーとして辞書部105を検索して
語幹のアクセント型を検索し(ステップ:S31)、単
語のアクセント型を語幹のアクセント型とする(ステッ
プ:S32)。
FIG. 7 is a flowchart of the adjective verb accent determination unit 104 of the present invention. From the stem of the adjective verb sent from the part-of-speech selecting unit 101, the accent type of the adjective verb, which is a word configured by combining the stem and the ending, is determined. The dictionary unit 105 is searched using the word stem as a search key to search the accent type of the word stem (step: S31), and the accent type of the word is set as the accent type of the word stem (step: S32).

【0023】図8は、この発明において使用される辞書
部105の実施例を示す図である。単語の品詞が動詞で
あるか、形容詞であるか、形容動詞であるか、或は他の
品詞であるかに応じて、これらの単語をそれぞれ動詞の
辞書情報301、形容詞の辞書情報302、形容動詞の
辞書情報303、他の品詞の辞書情報304の何れかに
収録する。動詞の辞書情報301は語幹を検索キーとし
て連用形と終止形のアクセント型を検索して出力する。
同様に、形容詞の辞書情報302は語幹を検索キーとし
て連用形と終止形のアクセント型を検索して出力する。
形容動詞の辞書情報303は、語幹を検索キーとして語
幹のアクセント型を検索して出力する。他の品詞の辞書
情報304は、単語を検索キーとして当該単語のアクセ
ント型を検索して出力する。
FIG. 8 is a diagram showing an embodiment of the dictionary unit 105 used in the present invention. Depending on whether the part of speech of a word is a verb, an adjective, an adjective, or another part of speech, these words are respectively verb dictionary information 301, adjective dictionary information 302, and an adjective. It is recorded in either the verb dictionary information 303 or the other POS dictionary information 304. The verb dictionary information 301 searches for and outputs the accented forms of the continuous form and the final form using the stem as the search key.
Similarly, the adjective dictionary information 302 searches for and outputs the accented forms of the continuous form and the final form using the stem as the search key.
The adjective verb dictionary information 303 retrieves and outputs the accent type of the stem using the stem as a search key. Other part-of-speech dictionary information 304 searches for and outputs the accent type of the word using the word as a search key.

【0024】次に、図4に示される文法情報付きかな列
の具体例を参照してこの発明の動作を説明する。動詞
「対し」について、その動詞語幹「対」と動詞語尾
「し」は動詞アクセント決定部102に送出され、辞書
部105において動詞語幹「対」を検索キーとして連用
形のアクセント型=1型と終止形のアクセント型=3型
を得る。動詞語尾「し」の活用形=連用形であるので、
動詞「対し」のアクセント型=1型と決定する。
Next, the operation of the present invention will be described with reference to a concrete example of a kana string with grammar information shown in FIG. Regarding the verb "toshi", the verb stem "pair" and the verb ending "shi" are sent to the verb accent determination unit 102, and the dictionary unit 105 uses the verb stem "pair" as a search key to form the accent type = 1 type and the end type. Get accent type = 3 type of shape. Because the inflectional form of the verb ending "shi" is the continuous form,
It is determined that the accent type of the verb "toshi" is 1 type.

【0025】形容動詞語幹「明らか」は、形容動詞アク
セント決定部102に送出され、辞書部105において
形容動詞語幹「明らか」を検索キーとして語幹のアクセ
ント型=2型を得るので、形容動詞「明らか」のアクセ
ント型=2型と決定する。以上の通りのこの発明の単語
アクセント決定方法は、動詞についてはその連用形と終
止形を基本形としてアクセント型を辞書に収録してお
り、これにより上述した通りの規則の不備のために生じ
るアクセント型の誤りを回避することができる。例え
ば、発明が解決しようとする課題の項の(例1)におい
ては、動詞「対する」について連用形のアクセント型=
1型と辞書収録し、(例2)においては動詞「見る」に
ついて連用形のアクセント型=1型と辞書収録すること
により、連用形に対して正しいアクセント型を設定する
ことができる。(例3)においては動詞「起きる」につ
いて終止形のアクセント型=2型と辞書収録し、未然形
のアクセントとして終止形のアクセント型を使用するこ
とにより、正しいアクセント型を設定することができ
る。基本形ではない活用形、即ち、未然形、仮定形、命
令形は、上述された文献に記載されるアクセント規則に
より正しいアクセント型を導出することができる。以上
の通り、基本形から他の活用形のアクセント型を導出す
ることにより、それだけ辞書の記憶容量を削減すること
ができる。
The adjective verb stem "clear" is sent to the adjective verb accent determination unit 102, and the dictionary unit 105 obtains the accent type = 2 of the stem with the adjective verb stem "clear" as a search key. It is decided that the accent type = ”type 2. As described above, the word accent determination method of the present invention stores the accent type in the dictionary for the verb as the basic form of the conjunctive form and the ending form, which causes the accent type generated due to the deficiency of the rule as described above. You can avoid mistakes. For example, in (Example 1) in the section of the problem to be solved by the invention, the accent type of the conjunctive form =
The correct accent type can be set for the continuous form by recording the type 1 and the dictionary, and in (Example 2), recording the dictionary as the continuous form accent type = 1 for the verb “see”. In (Example 3), the correct accent type can be set by recording the dictionary with the ending type accent type = 2 type for the verb “wake up”, and using the ending type accent type as the accent of the preformed type. For the inflectional forms that are not the basic forms, that is, the preformed forms, the hypothetical forms, and the imperative forms, the correct accent type can be derived by the accent rules described in the above-mentioned documents. As described above, the storage capacity of the dictionary can be reduced correspondingly by deriving the accent type of another inflection type from the basic type.

【0026】形容詞については、終止形のアクセント型
から連用形のアクセント型を完全に導出する規則は存在
しないので、両活用形を基本形とする。例えば、形容詞
の終止形「赤い」、「冷たい」は、共にアクセント型=
0型であるが、連用形のアクセント型「赤く(て)」と
「冷たく(て)」はそれぞれ2型、3型となり、一致し
ない。従って、動詞と同様に、連用形と終止形を基本形
として、これらのアクセント型を辞書に収録することに
より、連用形に対して正しいアクセント型を設定するこ
とができる。基本形ではない活用形、即ち、未然形、仮
定形は、上述された文献のアクセント規則により正しい
アクセント型を導出することができる。以上の通り、他
の活用形のアクセント型として終止形のアクセント型を
活用することにより、それだけ辞書の記憶容量を削減す
ることができる。
With respect to adjectives, there is no rule for completely deriving a continuous accent type from a final accent type, so both inflected forms are used as basic forms. For example, the adjective ending forms "red" and "cold" are both accent types =
Although it is type 0, the accent type "red (te)" and "cold (te)" of continuous type are type 2 and type 3, respectively, and do not match. Therefore, like the verb, by using the continuous form and the final form as basic forms and storing these accent types in the dictionary, the correct accent type can be set for the continuous form. For the inflectional forms that are not the basic forms, that is, the preformed forms and the hypothetical forms, the correct accent type can be derived by the accent rules of the above-mentioned documents. As described above, by utilizing the final accent type as the other accent type, the storage capacity of the dictionary can be reduced accordingly.

【0027】形容動詞については、全ての活用形のアク
セント型を語幹アクセント型とすることにより、それだ
け辞書の記憶容量を削減することができると共に、導出
されるアクセント型も正しい。
As for the adjective verb, by using all the accent types of the inflectional forms as the stem accent type, the storage capacity of the dictionary can be reduced and the derived accent type is correct.

【0028】[0028]

【発明の効果】以上の通りであって、この発明は、動詞
および形容詞のアクセント型を連用形と終止形から導出
し、形容動詞の活用形のアクセント型を語幹から導出す
るものであって、この様にすることにより、活用形のア
クセント型の辞書収録を削減するものでありながら、ア
クセント型を正しく設定することができるという効果を
奏するものである。
As described above, according to the present invention, the accent types of verbs and adjectives are derived from the continuous forms and the final forms, and the inflectional forms of adjective verbs are derived from the word stem. By doing so, the effect of being able to correctly set the accent type is achieved while reducing the use of the accent type dictionary in the inflection type.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の構成を説明する図。FIG. 1 is a diagram illustrating a configuration of the present invention.

【図2】この発明を適用する合成音声出力装置のブロッ
ク図。
FIG. 2 is a block diagram of a synthetic voice output device to which the present invention is applied.

【図3】形態素解析部の処理のフローチャート。FIG. 3 is a flowchart of processing of a morpheme analysis unit.

【図4】読み付与処理部とアクセント付与処理部の処理
のフローチャート。
FIG. 4 is a flowchart of processing of a reading imparting processing unit and an accent imparting processing unit.

【図5】品詞選択部の処理のフローチャート。FIG. 5 is a flowchart of processing of a part of speech selection unit.

【図6】動詞アクセント決定部と形容動詞アクセント決
定部の処理のフローチャート。
FIG. 6 is a flowchart of processing of a verb accent determination unit and an adjective verb accent determination unit.

【図7】形容動詞アクセント決定部の処理のフローチャ
ート。
FIG. 7 is a flowchart of processing of an adjective verb accent determination unit.

【図8】辞書部を説明する図。FIG. 8 is a diagram illustrating a dictionary unit.

【符号の説明】[Explanation of symbols]

100 漢字かな混じり文 101 品詞選択部 102 動詞アクセント決定部 103 形容詞アクセント決定部 104 形容動詞アクセント決定部 105 辞書部 106 単語のアクセント型 200 形態素解析処理部 201 文法情報付き分かち書き単語列 202 読み付与処理部 203 アクセント付与処理部 2031 単語アクセント決定処理部 2032 アクセント句抽出処理部 2033 アクセント結合処理部 204 アクセント情報付きかな列 205 ポーズ付与処理部 206 合成音声出力処理部 S1〜S9、S11〜S17、S21〜S24、S31
〜S32 ステップ 301 動詞の辞書情報 302 形容詞の辞書情報 303 形容動詞の辞書情報 304 他の品詞の辞書情報
100 Kana / Kana mixed sentence 101 Part-of-speech selection unit 102 Verb accent determination unit 103 Adjective accent determination unit 104 Adjective verb accent determination unit 105 Dictionary unit 106 Word accent type 200 Morphological analysis processing unit 201 Grammar-spacing word string 202 Reading addition processing unit 203 Accent imparting processing unit 203 1 Word accent determination processing unit 203 2 Accent phrase extraction processing unit 203 3 Accent combining processing unit 204 Accent information added kana string 205 Pause imparting processing unit 206 Synthetic speech output processing unit S1 to S9, S11 to S17, S21 to S24, S31
~ S32 Step 301 Verb dictionary information 302 Adjective dictionary information 303 Adjective dictionary information 304 Dictionary information of other parts of speech

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 入力文から合成音声を生成する過程にお
いて、入力文を構成する各単語のアクセント型を決定す
る単語アクセント決定方法において、 動詞および形容詞については連用形および終止形のアク
セント型を収録し、形容動詞については語幹のアクセン
ト型を収録し、その他の品詞の単語については当該単語
のアクセント型を収録し、これら収録されたアクセント
型を出力する、 ことを特徴とする単語アクセント決定方法。
1. A word accent determination method for determining the accent type of each word constituting an input sentence in the process of generating a synthetic speech from an input sentence, wherein a verb and an adjective are recorded as a continuous form and an end form. The word accent determination method is characterized in that the accent type of the stem is recorded for the adjective verb, the accent type of the word is recorded for the words of other parts of speech, and these recorded accent types are output.
【請求項2】 入力文から合成音声を生成する過程にお
いて、入力文を構成する各単語のアクセント型を決定す
る単語アクセント決定装置において、 動詞については連用形および終止形のアクセント型を収
録し、形容詞については連用形および終止形のアクセン
ト型を収録し、形容動詞については語幹のアクセント型
を収録し、その他の品詞の単語については当該単語のア
クセント型を収録し、これら収録されたアクセント型を
出力する辞書部を具備し、 動詞については連用形であるか或はその他の活用形であ
るかに対応して、辞書部に収録される連用形のアクセン
ト型或は終止形のアクセント型を出力する動詞アクセン
ト決定部を具備し、 形容詞については連用形であるか或はその他の活用形で
あるかに対応して、辞書部に収録される連用形のアクセ
ント型或は終止形のアクセント型を出力する形容詞アク
セント決定部を具備し、 形容動詞については辞書部に収録される形容動詞語幹の
アクセント型を出力する形容動詞アクセント決定部を具
備し、 入力文を構成する各単語の品詞が動詞であるか、形容詞
であるか、形容動詞であるか、或はその他の品詞である
かに対応して、動詞アクセント決定部、形容詞アクセン
ト決定部、形容動詞アクセント決定部、辞書部を選択し
てアクセント型を出力させる品詞選択部を具備する、 ことを特徴とする単語アクセント決定装置。
2. A word accent determination device for determining the accent type of each word constituting an input sentence in the process of generating a synthetic speech from an input sentence, wherein the verb includes a continuation form and an ending form, and an adjective. Is recorded as an accent type of a continuation form and an end form, the accent type of a stem is recorded for an adjective verb, the accent type of the word is recorded for a word of other part of speech, and these recorded accent types are output. Verb accent determination that has a dictionary part and outputs the continuous-use accent type or the ending-type accent type recorded in the dictionary part depending on whether the verb is a continuous form or another inflectional form Depending on whether the adjective is a continuous form or another inflectional form, the continuous use recorded in the dictionary part An adjective accent determiner for outputting an accent type or an end accent type, and for an adjective verb, an adjective accent determiner for outputting an accent type of an adjective stem included in a dictionary, Depending on whether the part of speech of each word constituting the input sentence is a verb, an adjective, an adjective verb, or another part of speech, the verb accent determiner, the adjective accent determiner, and the adjective A word accent determination device comprising: a verb accent determination unit; and a part-of-speech selection unit that selects a dictionary unit and outputs an accent type.
JP05286328A 1993-11-16 1993-11-16 Word accent determination method and apparatus for implementing the method Expired - Lifetime JP3092770B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05286328A JP3092770B2 (en) 1993-11-16 1993-11-16 Word accent determination method and apparatus for implementing the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05286328A JP3092770B2 (en) 1993-11-16 1993-11-16 Word accent determination method and apparatus for implementing the method

Publications (2)

Publication Number Publication Date
JPH07140995A true JPH07140995A (en) 1995-06-02
JP3092770B2 JP3092770B2 (en) 2000-09-25

Family

ID=17702972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05286328A Expired - Lifetime JP3092770B2 (en) 1993-11-16 1993-11-16 Word accent determination method and apparatus for implementing the method

Country Status (1)

Country Link
JP (1) JP3092770B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110187778A (en) * 2019-04-22 2019-08-30 张基文 A kind of differentiation Chinese Pinyin syllables scheme

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110187778A (en) * 2019-04-22 2019-08-30 张基文 A kind of differentiation Chinese Pinyin syllables scheme

Also Published As

Publication number Publication date
JP3092770B2 (en) 2000-09-25

Similar Documents

Publication Publication Date Title
JP3161942B2 (en) Translation machine translation device
Anderwald Negation in non-standard British English: Gaps, regularizations and asymmetries
JP3277123B2 (en) System and method for processing Chinese text
EP0262938A1 (en) Language translation system
JPH10326275A (en) Method and device for morpheme analysis and method and device for japanese morpheme analysis
JP4758758B2 (en) Dictionary creation device and dictionary creation program
JP2000298667A (en) Kanji converting device by syntax information
Liang et al. A Taiwanese text-to-speech system with applications to language learning
JPH07140995A (en) Method and device for deciding word accent
JPH06282290A (en) Natural language processing device and method thereof
JP3366253B2 (en) Speech synthesizer
JP3141912B2 (en) Prosody information determination method for speech synthesis
Shirbahadurkar et al. Marathi language speech synthesizer using concatenative synthesis strategy (spoken in Maharashtra, India)
Hong et al. An approach to constructing prosodic grammar for Mandarin read speech
JPH08185197A (en) Japanese analyzing device and japanese text speech synthesizing device
CN113515952B (en) Combined modeling method, system and equipment for Mongolian dialogue model
JPH11338863A (en) Automatic collection and qualification device for unknown noun and flickering katakana word and storage medium recording processing procedure of the device
Romsdorfer Polyglot text-to-speech synthesis: Text analysis & prosody control
JP3573889B2 (en) Audio output device
JP2996978B2 (en) Text-to-speech synthesizer
JP3084864B2 (en) Text input device
Vittorelli Linguistic analysis of the European languages
JPH04295962A (en) Morpheme analyzing device
Sündermann A Language Resources Generation Toolbox for Speech Synthesis
JPH06161485A (en) Synthesized speech pause setting system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130728

Year of fee payment: 13

EXPY Cancellation because of completion of term