JPH11344998A - Method, device for setting reading and metrical information and storage medium in which reading and metrical information setting program is stored - Google Patents

Method, device for setting reading and metrical information and storage medium in which reading and metrical information setting program is stored

Info

Publication number
JPH11344998A
JPH11344998A JP10154605A JP15460598A JPH11344998A JP H11344998 A JPH11344998 A JP H11344998A JP 10154605 A JP10154605 A JP 10154605A JP 15460598 A JP15460598 A JP 15460598A JP H11344998 A JPH11344998 A JP H11344998A
Authority
JP
Japan
Prior art keywords
word
accent
reading
pose
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10154605A
Other languages
Japanese (ja)
Other versions
JP3518340B2 (en
Inventor
Hisako Asano
久子 浅野
Koji Matsuoka
浩司 松岡
Shinichiro Takagi
伸一郎 高木
Hisashi Obara
永 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP15460598A priority Critical patent/JP3518340B2/en
Publication of JPH11344998A publication Critical patent/JPH11344998A/en
Application granted granted Critical
Publication of JP3518340B2 publication Critical patent/JP3518340B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To perform voice synthesis which is natural and easily listened to by improving accuracy of reading and metrical information. SOLUTION: A word dictionary to authorize a word by the length in morpheme analysis S1 and to generate no degradation in impartation S2 of reading and meter is held and utilized based on the Miyazaki system. Rules of impartation of an accent like connection of accent phrases between segmentations, etc., are added in impartation S3 of the accent. A multi-stage setting method to stepwise impart a pause is introduced in impartation S4 of the pause.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、読み韻律情報設定
方法及び装置及び読み韻律情報設定プログラムを格納し
た記憶媒体に係り、特に、日本語テキストに対して高精
度に読み韻律情報を付与し、自然で聞きやすい合成音声
を出力させるための読み韻律情報設定方法及び装置及び
読み韻律情報設定プログラムを格納した記憶媒体に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for setting prosody information and a storage medium storing a program for setting prosody information, and more particularly to providing reading prosody information to a Japanese text with high accuracy. The present invention relates to a reading prosody information setting method and apparatus for outputting a natural and easy-to-hear synthesized speech, and a storage medium storing a reading prosody information setting program.

【0002】[0002]

【従来の技術】日本語テキスト音声合成は、漢字とかな
混じりの日本語テキストに対して、読み、アクセント
(韻律上の基本単位であるアクセント句の設定とそのア
クセント型付与)、ポーズ等の読み韻律情報を設定し、
これらを元に音声波形を生成して合成音声を出力する。
自然で聞きやすい合成音声を出力するためには、この読
み韻律情報を正しく設定する必要がある。
2. Description of the Related Art Japanese text-to-speech synthesis is used for reading, accenting (setting accent phrases that are basic units in prosody and assigning accent types), and pauses for Japanese text mixed with kanji and kana. Set the prosody information,
Based on these, a speech waveform is generated and a synthesized speech is output.
In order to output natural and easy-to-hear synthesized speech, it is necessary to correctly set the reading prosody information.

【0003】読みは、形態素解析により認定された単語
の読みにより得られるため、形態素解析の精度が読みの
精度に直結する。但し、数量表現の読み(11本→ジュ
ーイッポン)と連濁化(子供+部屋→コドモベヤ)につ
いては、全てを単語として登録するのは困難であるた
め、規則により読みを付与する。数量表現の読みについ
ては、『宮崎:「日本文音声変換のための数値読み規
則」情報処理学会論文誌、Vol25, No.6 』、連濁化につ
いては、『佐藤:「複合語におけるアクセント規則と連
濁規則」,宮地他編、講座日本語と日本語教育2、日本
語の音声・音韻、明治書院等』等により、その手法がほ
ぼ確立されている。
[0003] Since the reading is obtained by reading a word recognized by morphological analysis, the accuracy of the morphological analysis is directly linked to the accuracy of the reading. However, it is difficult to register all of the readings of the numerical expression (11 books → juyippon) and rendaku (child + room → kodomobeya) as words, so readings are given according to rules. For information on reading numerical expressions, see "Miyazaki:" Numerical Reading Rules for Japanese Text-to-Speech Conversion, "IPSJ Transactions, Vol. 25, No.6. For rendaku, see" Sato: " The rendaku rules, Miyaji et al., Lecture Japanese and Japanese Language Education 2, Japanese Voice / Phonology, Meiji Shoin, etc.] have almost established the method.

【0004】アクセント句のアクセント型設定について
は、『匂坂、佐藤:「日本語単語連鎖のアクセント規
則」、電子通信学会論文誌、Vol.J66-D,No.7の付属語ア
クセント結合規則、複合単語(自立語)のアクセント結
合規則、文節間アクセント結合規則』により、その手法
が確立されている。アクセント句境界とポーズの設定に
ついては、従来から多くの手法が提案されている。
[0004] Regarding the setting of the accent type of an accent phrase, see "Sakazaka, Sato:" Accent Rules for Japanese Word Chains ", IEEJ Transactions, Vol.J66-D, No.7 attached word accent binding rules, compound The method is established by the word (independent word) accent combination rule and inter-phrase accent combination rule. Many methods have been proposed for setting accent phrase boundaries and poses.

【0005】ヒューリスティックスベースの手法として
は、係り受けの構造を利用する『箱田、佐藤:「文音声
合成における音調規則」、電子通信学会論文誌、Vol.J6
3-D,No.9』、右枝分かれ境界等の統語情報を用いる
『河井、広瀬、藤崎:「日本語文章音声の合成のための
韻律規則」日本音響学会誌、No.50, Vol.6』等がある。
また、統計的手法によるポーズの設定としては、係り受
け情報を利用した手法である『海木、匂坂:「局所的な
句構造によるポーズ挿入規則化の検討」電子情報通信学
会論文誌、Vol.J79-D-II,No.9 』が提案されている。
[0005] As a heuristics-based method, Hakota and Sato: "Tone rules in sentence speech synthesis" using the structure of dependency, IEICE Transactions, Vol.
3-D, No. 9, "Kai, Hirose, Fujisaki:" Prosodic Rules for Synthesis of Japanese Sentence Speech ", Using Syntactic Information such as Right Branching Boundaries, Journal of the Acoustical Society of Japan, No. 50, Vol. ].
In addition, the method of setting poses by a statistical method is a method using dependency information, "Miki, Sakazaka:" Study of Pose Insertion Rule Using Local Phrase Structure, "IEICE Transactions, Vol. J79-D-II, No. 9] has been proposed.

【0006】また、『鈴木、斉藤:「日本語テキスト音
声合成のためのN文節構造解析とそれに基づく韻律制
御」電子情報学会論文誌、Vol.J78 D II, No.2』では、
N文節の品詞情報を用いて局所的な係り受け構造を推定
し、また、『藤尾、匂坂、樋口:「確率文脈自由文法を
用いた韻律句境界とポーズ位置の予測」電子情報通信学
会論文誌、Vol.J80D II, No.1 』では、品詞列を入力と
して確率文脈自由文法を用いて係り受けを学習し、アク
セント句境界とポーズの設定を行う。
Also, "Suzuki, Saito:" N-Phrase Structure Analysis for Japanese Text-to-Speech Synthesis and Prosody Control Based on It "," Transactions of the Institute of Electronics, Information and Communication Engineers, Vol.J78 D II, No.2 "
Estimating local dependency structure using part-of-speech information of N clauses, and "Fujio, Sagisaka, Higuchi:" Prediction of prosodic phrase boundaries and pose positions using stochastic context-free grammar ", IEICE Transactions on Information and Communication , Vol.J80D II, No. 1], learns dependency using stochastic context-free grammar with a part-of-speech sequence as input, and sets accent phrase boundaries and poses.

【0007】また、多段解析法により形態素解析をベー
スとした『宮崎、大山:「日本文音声出力のための言語
処理方式」情報処理学会論文誌、Vol.27,NO.11』(これ
及び先に参照した宮崎の論文の方式をまとめて、以後、
宮崎方式と呼ぶ)が提案されている。ここで、多段解析
法による形態素解析は、文字種の違いに着目して、仮に
設定した範囲内(仮文節)であらゆる単語の組み合わせ
を検定する局所総当たり法をベースとし、構文や意味の
情報が有効となる複合語解析や、同型語判別等には、部
分的に深く解析する。特に複合語においては、複合語を
構成する単語間の意味的結合関係を係り受けによって解
析を行う。この複合語内の意味的係り受け解析では、数
詞、固有名詞、接辞、用言性名詞、非用言性名詞など1
4種類の係り受け規則を用いる(宮崎:「係り受け解析
を用いた複合語の自動分割法」、情報処理学会論文誌、
Vol.25,No.6 )。
Also, based on a morphological analysis based on a multi-stage analysis method, "Miyazaki and Oyama:" Language processing method for Japanese sentence speech output "Transactions of Information Processing Society of Japan, Vol. 27, NO. After summarizing the method of Miyazaki's paper referred to in
Miyazaki method) has been proposed. Here, the morphological analysis by the multi-stage analysis method is based on the local brute force method that tests all combinations of words within a tentatively set range (provisional clause) by focusing on differences in character types, For effective compound word analysis, homomorphic word discrimination, etc., the analysis is partially deep. In particular, in the case of a compound word, the semantic connection between the words constituting the compound word is analyzed by dependency. In the semantic dependency analysis in this compound word, the number, proper noun, affix, verbal noun, non-verbal noun, etc.
Using four types of dependency rules (Miyazaki: "Automatic compound word segmentation using dependency analysis", IPSJ Transactions,
Vol.25, No.6).

【0008】この方式は、複合語内意味的係り受け関係
を用いて、文節内のアクセント、ポーズを高精度に設定
できる。
According to this method, accents and pauses in a phrase can be set with high precision by using semantic dependency relations in a compound word.

【0009】[0009]

【発明が解決しようとする課題】しかしながら、上記従
来のアクセント句境界とポーズの設定方式では、係り受
けなどの言語的情報が既知であることを前提としてお
り、これらの言語表現情報の取得方法については述べら
れていない。また、上記従来の『鈴木、斉藤:「日本語
テキスト音声合成のためのN文節構造解析とそれに基づ
く韻律制御」電子情報学会論文誌、Vol.J80D,II, No.1
』では、文節内の処理については言及しておらず、ま
た、藤尾、匂坂、樋口による方式では、文節内での設定
において、文節内構造の予測誤りによる精度の低下が問
題点として挙げられる。
However, the above-described conventional method of setting the boundaries of accent phrases and poses assumes that linguistic information such as dependency is known. Is not mentioned. In addition, the above-mentioned conventional "Suzuki, Saito:" N-phrase structure analysis for Japanese text-to-speech synthesis and prosodic control based on it ", IEICE Transactions, Vol.J80D, II, No.1
Does not refer to the processing within a clause, and the method by Fujio, Sagisaka, and Higuchi raises a problem in that the accuracy of the setting within the clause due to an incorrect prediction of the structure within the clause is a problem.

【0010】また、上記従来の多段解析法をベースとし
た『宮崎:「係り受け解析を用いた複合語の自動分割
法」』では、格助詞相当語(について)等に対する認定
精度の低さが問題点として挙げられており、また、形態
素解析の単語認定単位は用言の活用語幹、語尾がそれぞ
れ1語として扱われる等、短単位での認定が行われてい
るため、特に、ポーズ付与を誤るという問題がある。例
えば、ポーズの付与において、アクセント句境界の前後
単語の品詞の情報が重要となるが、 「グランドで/運動する」 (/=アクセント句境
界) のアクセント句境界の直後は、 「運動:サ変名詞」+「する:サ変動詞活用形」 となり、本来、動詞である「運動する」が名詞の運動と
して扱われ、誤ってポーズを付与してしまう。
[0010] Also, in "Miyazaki:" Automatic division of compound words using dependency analysis "" based on the conventional multi-stage analysis method described above, the recognition accuracy for case particle equivalents is low. It is mentioned as a problem, and the word recognition unit of morphological analysis is recognized in short units, such as using the stem and the ending of the verb as one word, so the pause is given especially. There is a problem of making mistakes. For example, when giving a pose, the part-of-speech information of the word before and after the accent phrase boundary is important, but immediately after the accent phrase boundary of “exercise on the ground” (/ = accent phrase boundary), “motion: sa-variant noun” "+" To "do: sa variable verb conjugation form", and the verb "exercise" is originally treated as a noun movement, and a pose is given by mistake.

【0011】上記のように、形態素解析精度の向上は、
読み韻律情報の精度の向上に直結し、通常、長単位で単
語認定を行うことにより、形態素解析の精度は向上す
る。しかし、単に、長単位単語を認定するだけでは、そ
の長単位単語内でアクセント句境界が生じる場合等に対
応できない。また、従来、読み韻律情報を設定する多く
の方法において、現状では認定精度が十分ではなく、コ
ストのかかる文節間の係り受け解析を用いていたが、係
り受け解析の誤りに起因する誤りや、文節内のアクセン
ト、ポーズ付与に対する誤りが生じている。
As described above, the improvement of the morphological analysis accuracy is as follows.
The accuracy of morphological analysis is improved by directly performing word recognition in units of length, which is directly linked to improvement in accuracy of reading prosody information. However, simply identifying a long unit word cannot cope with a case where an accent phrase boundary occurs in the long unit word. In addition, conventionally, in many methods for setting prosodic information, at present, the accuracy of recognition is not sufficient and costly dependency analysis is used between phrases. However, errors caused by errors in dependency analysis, There is an error in the accent and pause assignment in the phrase.

【0012】また、宮崎方式では、ポーズの付与精度が
低く、また、文節間のアクセント結合を行っていない、
複合語において、独立性の高い品詞(時詞等)は常に独
立で扱う等によるアクセント誤りが生じている。本発明
は、上記の点に鑑みなされたもので、宮崎方式をベース
として、形態素解析において、長単位で認定し、かつ、
読み韻律付与において、ディグレードを生じさせないた
めの単語辞書情報を保持し、それを利用すること、文節
間アクセント句結合等、アクセント付与のルールを追加
すること、ポーズ付与において、段階的にポーズを付与
する多段設定法を導入することにより、読み韻律情報の
精度を向上させ、自然で聞きやすい音声合成を行うこと
が可能な読み韻律情報設定方法及び装置及び読み韻律情
報設定プログラムを格納した記憶媒体を提供することを
目的とする。
Also, in the Miyazaki method, the accuracy of giving a pose is low, and no accent connection between phrases is performed.
In compound words, parts of speech with a high degree of independence (such as part-of-speech) are always treated as independent words, resulting in an accent error. The present invention has been made in view of the above points, and based on the Miyazaki method, in morphological analysis, certified in units of long, and
In reading prosody assignment, hold word dictionary information to prevent degrading, use it, add rules for adding accents such as interphrase accent phrase joining, etc. A reading prosody information setting method and apparatus capable of improving the accuracy of reading prosody information and performing natural and easy-to-hear speech synthesis by introducing a multistage setting method to be provided, and a storage medium storing a reading prosody information setting program The purpose is to provide.

【0013】[0013]

【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明(請求項1)は、漢字
かな混じりの日本語テキストを入力して、読み韻律情報
を付与するテキスト解析を行い、読み韻律情報に基づい
て合成音声を生成する音声生成を行って、合成音声を出
力する音声合成方法におけるテキスト解析における読み
韻律情報設定方法において、単語認定及び読み韻律情報
を設定するための単語辞書を用いて多段解析法に基づく
形態素解析を行い(ステップ1)、形態素解析で単語認
定するための情報に加え、単語辞書を用いて、該形態素
解析の結果を利用して読み付与(ステップ2)、アクセ
ント付与(ステップ3)、ポーズ付与を行う(ステップ
4)。
FIG. 1 is a diagram for explaining the principle of the present invention. The present invention (Claim 1) is to input a Japanese text mixed with kanji and kana, perform text analysis for adding reading prosody information, and perform speech generation for generating a synthesized speech based on the reading prosody information. In the reading prosody information setting method for text analysis in a speech synthesis method for outputting speech, a morphological analysis based on a multistage analysis method is performed using a word dictionary for setting word recognition and reading prosody information (step 1), and the morphological analysis is performed. In addition to the information for word recognition in step (1), using a word dictionary and using the result of the morphological analysis, reading (step 2), accenting (step 3), and pose are performed (step 4).

【0014】本発明(請求項2)は、多段解析法に基づ
く形態素解析を行う際に、1語で登録された複合語内で
アクセント句境界が存在する場合に対応する、複数のア
クセント句に関する情報を格納できるアクセント句情
報、1語で登録され、付属語を含み、その内部にアクセ
ント句境界が存在する場合に対応する短単位の単語に展
開するための構成単語情報、1語で登録された複合語で
内部にアクセント句境界は存在しないが、長単位語であ
ることを表すための語数を有する単語辞書を用いて、該
単語辞書では別々に登録されている用言の語幹語尾を1
語化し、格助詞相当語を連語として1まとまりに認定す
る。
The present invention (claim 2) relates to a plurality of accent phrases corresponding to a case where an accent phrase boundary exists in a compound word registered with one word when performing morphological analysis based on a multistage analysis method. Accent phrase information that can store information, registered as one word, constituent word information for expanding into short words corresponding to the case where an accent phrase boundary exists inside and including an adjunct word, registered as one word Although there is no accent phrase boundary inside the compound word, a word dictionary having the number of words to indicate that it is a long unit word is used, and in the word dictionary, the stem endings of the separately registered words are set to 1
It is recognized as a unitized word as a case particle equivalent.

【0015】本発明(請求項3)は、アクセント付与を
行う際に、結びつきの強い文節間のアクセント結合を行
う。本発明(請求項4)は、ポーズ付与を行う際に、記
号に基づくポーズ付与、日時表現・数量表現のポーズ付
与、特定単語の組み合わせによるポーズ付与、結合力に
基づくポーズ付与、ポーズ付与の補正からなる多段階設
定法によりポーズを付与する。
According to the present invention (claim 3), when giving an accent, accent connection between phrases having strong connection is performed. According to the present invention (claim 4), when performing a pose assignment, a pose assignment based on a symbol, a pose assignment based on a date and time expression / quantity expression, a pose assignment based on a combination of specific words, a pose assignment based on a binding force, and a correction of the pose assignment. Are given by a multi-step setting method consisting of

【0016】図2は、本発明の原理構成図である。本発
明(請求項5)は、漢字かな混じりの日本語テキストが
入力されると、読み韻律情報を付与するテキスト解析手
段と、読み韻律情報に基づいて合成音声を生成する音声
生成を行う音声合成手段とを有する音声合成システムに
おけるテキスト解析における読み韻律情報設定装置であ
って、テキスト解析手段10は、多段解析法に基づく形
態素解析を行う形態素解析手段11と、形態素解析手段
で単語認定するための情報に加え、読み韻律情報を設定
するための情報を持つ単語辞書15と、形態素解析手段
11の結果を利用して、読みを付与する読み付与手段1
2と、アクセントを付与するアクセント付与手段13
と、ポーズを付与するポーズ付与手段14とを有する。
FIG. 2 is a diagram showing the principle of the present invention. According to the present invention (claim 5), when a Japanese text mixed with kanji and kana is input, text analysis means for providing reading prosody information, and speech synthesis for generating a synthesized speech based on the reading prosody information. Means for setting prosody information in text analysis in a speech synthesis system having means, a text analysis means 10 for performing morphological analysis based on a multistage analysis method, and a morphological analysis means for identifying words. A word dictionary 15 having information for setting reading prosody information in addition to the information, and a reading giving means 1 for giving a reading by using a result of the morphological analysis means 11.
2 and accent giving means 13 for giving an accent
And a pose giving means 14 for giving a pose.

【0017】本発明(請求項6)は、単語辞書15は、
該単語辞書の情報として、1語で登録された複合語内で
アクセント句境界が存在する場合に対応する、複数のア
クセント句に関する情報を格納できるアクセント句情
報、1語で登録され、付属語を含み、その内部にアクセ
ント句境界が存在する場合に対応する短単位の単語に展
開するための構成単語情報、1語で登録された複合語で
内部にアクセント句境界は存在しないが、長単位語であ
ることを表すための語数を有し、形態素解析手段11に
おいて、単語辞書15では別々に登録されている用言の
語幹語尾を1語化し、格助詞相当語を連語として1まと
まりに認定する手段を有する。
According to the present invention (claim 6), the word dictionary 15
As information of the word dictionary, accent phrase information that can store information on a plurality of accent phrases corresponding to a case where an accent phrase boundary exists in a compound word registered with one word, registered with one word, Constituent word information for expanding into short unit words corresponding to the case where an accent phrase boundary exists within it, a compound word registered with one word without an accent phrase boundary inside, but a long unit word In the morphological analysis means 11, the morphological analysis means 11 converts the stem endings of the separately registered words into one word, and recognizes the case particle equivalent word as a collocation as one unit. Having means.

【0018】本発明(請求項7)は、アクセント付与手
段13において、結びつきの強い文節間のアクセント結
合を行う手段を含む。本発明(請求項8)は、ポーズ付
与手段14において、記号に基づくポーズ付与、日時表
現・数量表現のポーズ付与、特定単語の組み合わせによ
るポーズ付与、結合力に基づくポーズ付与、ポーズ付与
の補正からなる多段階設定法によりポーズを付与する手
段を含む。
According to the present invention (claim 7), the accent imparting means 13 includes a means for performing an accent connection between strongly connected phrases. In the present invention (claim 8), the pose assigning means 14 performs the assignment of a pose based on a symbol, the assignment of a date and time expression / quantity expression, the assignment of a pose by a combination of specific words, the assignment of a pose based on a binding force, and the correction of the assignment of a pose. Means for giving a pose by a multi-stage setting method.

【0019】本発明(請求項9)は、漢字かな混じりの
日本語テキストが入力されると、読み韻律情報を付与す
るテキスト解析プロセスと、読み韻律情報に基づいて合
成音声を生成する音声生成を行う音声合成プロセスとを
有する音声合成プログラムおけるテキスト解析における
読み韻律情報設定プログラムを格納した記憶媒体であっ
て、テキスト解析プロセスは、単語認定及び読み韻律情
報を設定するための単語辞書を用いて多段解析法に基づ
く形態素解析を行う形態素解析プロセスと、形態素解析
で単語認定するための情報に加え、単語辞書を用いて、
形態素解析プロセスの結果を利用して読みを付与する読
み付与プロセスと、単語辞書を用いてアクセントを付与
するアクセント付与プロセスと、ポーズを付与するポー
ズ付与プロセスとを有する。
According to the present invention (claim 9), when a Japanese text mixed with kanji or kana is input, a text analysis process for providing reading prosody information and a speech generation for generating a synthesized speech based on the reading prosody information are provided. A storage medium storing a reading prosody information setting program in text analysis in a speech synthesis program having a speech synthesis process to be performed, wherein the text analysis process uses a word dictionary for setting word recognition and reading prosody information. In addition to the morphological analysis process that performs morphological analysis based on the analysis method and information for certifying words by morphological analysis, using a word dictionary,
It has a reading giving process for giving a reading using the result of the morphological analysis process, an accent giving process for giving an accent using a word dictionary, and a pause giving process for giving a pose.

【0020】本発明(請求項10)は、形態素解析プロ
セスにおいて、1語で登録された複合語内でアクセント
句境界が存在する場合に対応する、複数のアクセント句
に関する情報を格納できるアクセント句情報、1語で登
録され、付属語を含み、その内部にアクセント句境界が
存在する場合に対応する短単位の単語に展開するための
構成単語情報、1語で登録された複合語で内部にアクセ
ント句境界は存在しないが、長単位語であることを表す
ための語数を有する単語辞書を用いて、該単語辞書では
別々に登録されている用言の語幹語尾を1語化し、格助
詞相当語を連語として1まとまりに認定するプロセスを
有する。
According to the present invention (claim 10), in the morphological analysis process, accent phrase information capable of storing information on a plurality of accent phrases corresponding to a case where an accent phrase boundary exists in a compound word registered with one word. , Word information that is registered in one word, contains adjuncts, and expands into short words corresponding to the presence of accent phrase boundaries inside the compound word, and accents inside compound words registered in one word There is no phrase boundary, but using a word dictionary having the number of words to indicate that it is a long unit word, the word dictionary separates the stem endings of the separately registered words into one word, Has a process to certify as a set of collocations.

【0021】本発明(請求項11)は、アクセント付与
プロセスにおいて、結びつきの強い文節間のアクセント
結合を行うプロセスを含む。本発明(請求項12)は、
ポーズ付与プロセスにおいて、記号に基づくポーズ付
与、日時表現・数量表現のポーズ付与、特定単語の組み
合わせによるポーズ付与、結合力に基づくポーズ付与、
ポーズ付与の補正からなる多段階設定法によりポーズを
付与するプロセスを含む。
The present invention (claim 11) includes, in the accent giving process, a process of performing accent connection between strongly connected phrases. The present invention (claim 12)
In the pose assignment process, a symbol-based pose assignment, a date / time expression / quantity expression pose assignment, a combination of specific words, a pose assignment based on a binding force,
The method includes a process of giving a pose by a multi-step setting method including a correction of a pose.

【0022】本発明は、前述の宮崎方式をベースとし
て、形態素解析において、長単位で認定し、かつ、読み
韻律付与において、ディグレードを生じさせないための
単語辞書情報を保持し、それを利用すること、文節間ア
クセント句結合等、アクセント付与のルールを追加する
こと、ポーズ付与において、段階的にポーズを付与する
多段設定法を導入することにより、読み韻律情報の精度
を向上させ、自然で聞きやすい音声合成を行うことが可
能となる。つまり、テキスト解析において、多段解析法
を導入することにより、複合語の構造を反映した適切な
ポーズの設定が可能となる。
According to the present invention, based on the above-mentioned Miyazaki system, word dictionary information for preventing grading in morphological analysis and for avoiding degradation in grammar analysis is stored and used. The accuracy of reading prosody information is improved by adding rules for adding accents, such as accenting phrases between phrases, etc. It is possible to perform easy speech synthesis. That is, by introducing a multi-stage analysis method in text analysis, it becomes possible to set an appropriate pause reflecting the structure of a compound word.

【0023】これにより、日本語テキストに対して、高
精度に読み韻律情報を付与し、自然で聞きやすい合成音
声を出力させることが可能となる。
Thus, it is possible to add reading prosody information to a Japanese text with high accuracy and to output a natural and easy-to-hear synthesized speech.

【0024】[0024]

【発明の実施の形態】図3は、本発明の読み韻律情報設
定装置の構成を示す。同図に示す読み韻律情報設定装置
は、日本語テキストが入力されると、読み韻律情報に基
づいて形態素解析を行い、形態素解析で単語認定するた
めの情報に加え、読み韻律情報を設定するための情報を
もつ単語辞書を保持し、形態素解析結果を利用して読み
付与、アクセント付与及びポーズ付与を行うテキスト解
析部10及び音声生成部20より構成される。
FIG. 3 shows the configuration of a reading prosody information setting device according to the present invention. The reading prosody information setting device shown in the figure performs a morphological analysis based on the reading prosody information when a Japanese text is input, and sets the reading prosody information in addition to information for word recognition in the morphological analysis. A text dictionary 10 and a speech generator 20 that hold a word dictionary having the information of, and perform reading, accenting, and posing using the result of the morphological analysis.

【0025】テキスト解析部10は、形態素解析部1
1、読み付与部12、アクセント付与部13、ポーズ付
与部14及び単語辞書15から構成される。形態素解析
部11は、日本語テキストが入力されると、単語辞書1
5を参照して多段解析法に基づく形態素解析を行い、そ
の結果を読み付与部12に転送する。
The text analysis unit 10 includes the morphological analysis unit 1
1, a reading section 12, an accent section 13, a pose section 14, and a word dictionary 15. When a Japanese text is input, the morphological analyzer 11 reads the word dictionary 1
5, the morphological analysis based on the multi-stage analysis method is performed, and the result is transferred to the reading giving unit 12.

【0026】当該形態素解析部11は、単語辞書15で
は別々に登録されている用言の語幹語尾を1語化し、
「〜について」などの格助詞相当語等を連語として1ま
とまりに認定する。単語辞書15は、形態素解析部11
で用いる単語認定のための各構成単語の見出し長、品
詞、良い長を持つ構成単語情報に加えて、1語で登録さ
れた複合語内でアクセント句境界が存在する場合に対応
する、複数のアクセント句に関する情報を格納できるア
クセント句情報、1語で登録され、付属語を含み、その
内部にアクセント句境界が存在する場合に対応する、短
単位の単語に展開するための構成単語情報、1語で登録
された複合語で内部には、アクセント句境界は存在しな
いが、長単位語であることを表すための語数を有する。
The morphological analysis unit 11 converts the stem endings of the idioms registered separately in the word dictionary 15 into one word,
A case particle such as "about" is recognized as a group of collocations. The word dictionary 15 includes the morphological analyzer 11
In addition to the constituent word information having the head length, part of speech, and good length of each constituent word for word recognition used in the word recognition, a plurality of words corresponding to a case where an accent phrase boundary exists in a compound word registered with one word are provided. Accent phrase information that can store information on accent phrases, registered word, composed word information for expanding to short words corresponding to the case where an accent phrase boundary exists inside, and 1 Although there is no accent phrase boundary inside a compound word registered as a word, it has the number of words to indicate that it is a long unit word.

【0027】読み付与部12は、前述の宮崎方式を用い
て読みを付与する。アクセント付与部13は、複合語内
意味的係り受け情報及び単語辞書15を用いて宮崎方式
をベースとして、アクセント句境界及びアクセント型の
設定を行う。また、アクセント付与時に、結びつきの強
い文節間のアクセント結合を行う。ポーズ付与部14で
は、アクセント句境界及びアクセント型が設定されたも
のに複合語内等から段階的にポーズを設定していく多段
階設定法を導入してポーズ情報を付与する。当該多段階
設定法は、ポーズ付与において、記号に基づくポーズ付
与、日時表現、数量表現のポーズ付与、特定単語の組み
合わせによるポーズ付与、結合力に基づくポーズ付与、
ポーズ付与の補正からなる。
The reading giving section 12 gives readings using the above-mentioned Miyazaki method. The accent imparting unit 13 sets the accent phrase boundary and the accent type based on the Miyazaki method using the semantic dependency information in the compound word and the word dictionary 15. In addition, at the time of adding an accent, accent connection between phrases having strong connection is performed. The pause assigning unit 14 assigns pose information by introducing a multi-step setting method in which a pause is set step by step from within a compound word or the like to an accent phrase boundary and an accent type. The multi-stage setting method includes, in pose assignment, a pose assignment based on a symbol, a date assignment, a pose assignment in a numerical expression, a pose assignment based on a combination of specific words, a pose assignment based on a binding force,
It consists of the correction of the pose.

【0028】ポーズ情報としては、ポーズなし、小ポー
ズ、中ポーズ、大ポーズの4段階のポーズ情報を設定す
るものとする。音声生成部20は、テキスト解析部10
のポーズ付与部14から出力された、読み、アクセン
ト、及びポーズ情報が付与された読み韻律情報を取得
し、音声合成することにより合成音声を出力する。
As the pose information, four-stage pose information of no pose, small pose, medium pose, and large pose is set. The voice generation unit 20 includes the text analysis unit 10
The reading prosody information added with the reading, accent, and pose information output from the pause giving unit 14 is obtained, and the synthesized speech is output by performing speech synthesis.

【0029】以下に、上記の構成の処理について、詳細
に説明する。図4は、本発明の読み韻律情報設定方法を
説明するための図である。テキスト解析処理(ステップ
100)における、形態素解析(ステップ110)で
は、単語辞書15を用いて、宮崎方式の多段解析法に基
づく形態素解析を行う。但し、読み韻律付与処理(ステ
ップ120)に対応した長単位認定として、形態素解析
部11、単語辞書15に対して、次の4項目の拡張を行
った。
Hereinafter, the processing of the above configuration will be described in detail. FIG. 4 is a diagram for explaining the reading prosody information setting method of the present invention. In the morphological analysis (step 110) in the text analysis process (step 100), the morphological analysis is performed using the word dictionary 15 based on the Miyazaki method of multi-stage analysis. However, the following four items were extended to the morphological analysis unit 11 and the word dictionary 15 as long unit recognition corresponding to the reading prosody provision process (step 120).

【0030】第1は、用言語幹尾の一語化である。単語
辞書15には、規則的な活用を行う用言は、不変化部分
(例:似)と変化部分(例:る、れ、ろ)に分離し、そ
れぞれ1単語として登録している。また、サ変名詞(運
動)が、サ変動詞(運動する)の一部を構成する場合が
あるが、単語辞書15上は、サ変動詞型名詞(運動)と
サ変動詞活用形(する)のみを登録し、語幹語尾をまと
めた単語(運動する)としては、登録していない。しか
し、ポーズ付与部13においては、アクセント句境界前
後の品詞情報が重要となるため、単語認定後、「用言不
変化部分+変化部分」、「用言性名詞+活用語尾」をま
とめて一語に統合する。これにより、例えば、「運動す
る」を一語のサ変動詞、「大幅に」を一語の形容動詞と
して扱う。この語幹語尾の1語化は、アクセント、ポー
ズ付与に悪影響を与えないため、読み韻律付与用の特別
な情報は、保持しない。
The first is the unification of the language stem. In the word dictionary 15, words used regularly are separated into an invariant part (eg, similar) and a changing part (eg, ru, re, ro) and registered as one word each. In addition, there is a case where the sa-variable noun (exercise) forms a part of the sa-variable verb (moving), but only the sa-varin type noun (exercise) and the sa-varun inflected form (do) are registered on the word dictionary 15. However, it is not registered as a word (exercise) that summarizes the stem ending. However, since the part-of-speech information before and after the accent phrase boundary is important in the pause assigning unit 13, after the word recognition, the "verbal invariant part + variable part" and the "verbal noun + conjugative ending" are combined into one. Integrate into words. Thus, for example, "exercise" is treated as a one-word adjective and "substantially" is treated as a one-word adjective. Since the stem ending does not adversely affect the addition of accents and poses, it does not hold special information for giving prosody.

【0031】第2は、固有名詞等、内部にアクセント句
境界を持つ複合語における読み韻律付与への対処であ
る。単語辞書15に登録する単語の単位は、原則的には
語基や接辞などの短単位語であり、複合語などの長単位
語は、短単位語組み合わせとみなす。但し、短単位語か
ら長単位語の意味を読みなどを合成できない複合語や一
部の固有名詞など、例外的に長単位で登録しているもの
も存在する。ここで、長単位の複合語においては、その
内部の特定の位置にアクセント句境界が設定される場合
がある。
The second is to deal with the addition of prosody to compound words such as proper nouns that have accent phrase boundaries inside. The unit of the word registered in the word dictionary 15 is, in principle, a short unit word such as a base or an affix, and a long unit word such as a compound word is regarded as a short unit word combination. However, there are some exceptions that are registered in long units, such as compound words and some proper nouns, which cannot synthesize the meaning of long unit words from short unit words. Here, in a compound word of a long unit, an accent phrase boundary may be set at a specific position inside the compound word.

【0032】(例)勲一等瑞宝章 → 勲/一等/瑞宝
章 (/:アクセント句境界) しかし、「勲一等瑞宝章」が1単語として設定される
と、その内部にアクセント句境界を設定できない。そこ
で、単語辞書情報の一つであるアクセント句情報を最大
3アクセント句分保持する。アクセント句情報は、各ア
クセントに対するモーラ数、読み長(読みの表記上の長
さ)、アクセント型の情報をもつ。例えば、短単位語の
「日本」のアクセント句情報は、 第1アクセント句:モーラ数=3、読み長=3、アクセ
ント型=2 第2、3アクセント句:なし となり、長単位語の「君一等瑞宝章」(3アクセント
句)は、 第1アクセント句:モーラ数=2、読み長=2、アクセ
ント型=1(勲) 第2アクセント句:モーラ数=4、読み長=4、アクセ
ント型=0(一等) 第3アクセント句:モーラ数=6、読み長=7、アクセ
ント型=3(瑞宝章) となる。この情報により、「勲/一等/瑞宝章」と正し
くアクセント句境界が設定できる。
(Example) First prize meditation → med / first prize / treasure emblem (/: accent phrase boundary) However, if “first meditation first treasure emblem” is set as one word, an accent phrase boundary cannot be set inside the word. Therefore, accent phrase information, which is one of the word dictionary information, is stored for a maximum of three accent phrases. The accent phrase information includes the number of mora for each accent, the reading length (the length in reading notation), and accent type information. For example, the accent phrase information of the short unit word “Japan” is as follows: the first accent phrase: the number of mora = 3, the reading length = 3, the accent type = 2, the second and third accent phrases: none, and the long unit word “kun” The first accent phrase: (3 accent phrases) is the first accent phrase: the number of mora = 2, reading length = 2, accent type = 1 (Isao) The second accent phrase: the number of mora = 4, reading length = 4, accent type = 0 (first class) Third accent phrase: Mora number = 6, reading length = 7, accent type = 3 (Zuihosho). With this information, the accent phrase boundary can be correctly set as “Issue / First class / Ruihosho”.

【0033】第3は連語の認定である。宮崎方式の多段
解析法による形態素解析において、比較的認定精度の低
かった格助詞相当語(彼について)や補助用言(話して
いる)の認定精度を向上させるために、「助詞+補助用
言」(て+いる)や格助詞相当語(に+つい+て)を連
語として登録して認定を行う。但し、これらの連語内で
アクセント句が分割される場合等があるため、(カ’レ
ニ/ツ’イテ/:アクセント句境界、’:アクセント位
置)、アクセント、ポーズ付与時に、連語を1単語とし
て扱うのは問題がある。ここで、長単位で、内部にアク
セント句境界を生じる複合語に対してはアクセント句情
報を最大3アクセント句分保持することで対応したが、
連語を構成する単語は殆どの場合付属語を含むので、ア
クセント句情報では対応できない。これは、匂坂、佐藤
「日本語単語連鎖のアクセント規則」で述べられている
ように、付属語は、前方の自立語の品詞別に異なるアク
セント結合様式を持ち、この結合様式を用いて巡回的に
アクセント型が決定するためである。このため、単語辞
書15に各構成単語の見出し長、品詞、読み長を持つ構
成単語情報を保持し、形態素解析で1語と認定された単
語を、構成単語情報に基づいて、辞書検索を行い、アク
セント、ポーズ付与時には、短単位に展開しておく。こ
のように、アクセント、ポーズ付与時に、短単位に展開
した情報を用いるため、正しくアクセント句境界、アク
セント型が設定できる。
The third is recognition of collocations. In morphological analysis using the Miyazaki method of multi-stage analysis, in order to improve the recognition accuracy of case particle equivalents (about him) and auxiliary verbs (speaking), which were relatively low in recognition accuracy, "particle + auxiliary words" (T + I) and case particle equivalents (N + T + T) are registered as collocations for recognition. However, since the accent phrase may be divided in these collocations, the collocation is regarded as one word at the time of (ka'reni / tsuiite /: accent phrase boundary, ': accent position), accent, and pause. There is a problem to deal with. Here, for a compound word that has an accent phrase boundary inside in units of length, it was handled by storing accent phrase information for up to three accent phrases.
Words that make up collocations almost always include adjuncts, and therefore cannot be handled with accent phrase information. This is because, as described in Sakazaka and Sato "Japanese Word Chain Accent Rules", adjuncts have different accent combination styles for each part of speech of the independent word in front, and use this combination style to cyclically This is because the accent type is determined. For this reason, constituent word information having the heading length, part of speech, and reading length of each constituent word is stored in the word dictionary 15, and a word that is recognized as one word by morphological analysis is subjected to a dictionary search based on the constituent word information. , Accents, and poses are expanded in short units. As described above, when the accent and the pose are given, the information expanded in short units is used, so that the accent phrase boundary and the accent type can be correctly set.

【0034】(例)連語:ていまし(て+い+まし) て:見出し長=1、品詞=接続助詞、読み長=1 い:見出し長=1、品詞=一段動詞語幹、読み長=1 まし:見出し長=1、品詞=助動詞連用形(断定)、読
み長=1 第4は、内部にアクセント句境界を持たない複合語にお
ける読み韻律付与への対処である。内部にアクセント句
境界を持たない複合語は、その複合語が単独で出てきた
場合には問題はないが、他の語と連接して複合語を形成
している場合に、短単位語と同様に扱うアクセント句境
界の設定を誤る。
(Example) Collocation: Teshima (te + i + masi) Te: Headline length = 1, part of speech = connected particle, reading length = 1 i: Headline length = 1, part of speech = one-stage verb stem, reading length = 1 Masashi: Headline length = 1, Part of speech = Conjunctive verb form (assertion), Reading length = 1 The fourth is to deal with reading prosody in compound words that do not have accent phrase boundaries inside. A compound word without an accent phrase boundary inside is not a problem if the compound word appears alone, but if it is concatenated with other words to form a compound word, Wrong setting of accent phrase boundaries to be handled in the same way.

【0035】(例)「為替相場」が1語(長単位登録)
の場合 形態素解析結果:為替相場+速報+サービス(3単語扱
い、実際は4単語)→×「為替相場速報サービス」とア
クセント句境界が設定されない。 (○為替相場/速報サービス) そこで、単語辞書情報として、登録単語を構成する単語
数を表す語数をもつ。例えば、「為替相場(2)+速報
(1)+サービス(1)」(かっこ内の数字が語数を表
す)では、形態素解析の認定単語数は3語であるが、語
数により4語からなる複合語であることがわかり、「為
替相場/速報サービス」と正しくアクセント句境界が設
定できる。
(Example) "Exchange rate" is one word (long unit registration)
In the case of morphological analysis result: exchange rate + flash report + service (3 words, actually 4 words) → × “exchange rate report service” and no accent phrase boundary are set. (○ exchange rate / flash report service) Therefore, the word dictionary information has the number of words representing the number of words constituting the registered word. For example, in "Exchange rate (2) + flash report (1) + service (1)" (the number in parentheses indicates the number of words), the number of authorized words in the morphological analysis is three, but the number of words is four depending on the number of words. It can be seen that the word is a compound word, and the accent phrase boundary can be set correctly as “Exchange rate / breaking service”.

【0036】上記で述べた単語辞書情報以外にも、単語
辞書15では、単語認定に用いる情報の他に、読み韻律
情報を設定するための多くの情報を保持している。図5
は、本発明の読み韻律情報設定用単語辞書情報の例を示
す。同図における種類で、共通情報は、読み韻律情報設
定のための全処理で利用する共通情報、読み付与用情報
は、数量表現の読みの補正、連濁化のための情報を持
つ。アクセント句境界設定用情報は、複合語の内部構造
を表すための各種フラグ、及び韻律的な特徴を表すフラ
グ、アクセント型設定用情報は、アクセント的特徴を示
す各種フラグ、ポーズ設定用情報は、助詞を構文的に分
類した助詞ポーズ属性を持つ。
In addition to the word dictionary information described above, the word dictionary 15 holds a lot of information for setting reading prosody information in addition to the information used for word recognition. FIG.
Shows an example of the word dictionary information for reading prosody information of the present invention. In the type shown in the drawing, the common information includes common information used in all processes for setting prosody information, and the reading provision information includes information for correcting the reading of the numerical expression and for forming rendaku. The information for accent phrase boundary setting is various flags for representing the internal structure of a compound word, and the flag for prosodic features. The information for accent type setting is various flags for accent features, and the information for pause setting is It has a particle pose attribute that classifies particles syntactically.

【0037】ステップ120の読み付与処理では、宮崎
方式をそのまま利用する。ステップ130のアクセント
付与処理では、複合語内意味的係り受け情報及び図5の
単語辞書情報を用いて、宮崎方式をベースとして、アク
セント句境界及びアクセント型の設定を行う。ここで、
宮崎方式では、文節間のアクセント結合を行っていない
(文節境界をすべてアクセント句境界としている)。こ
れは、文節間のアクセント結合を行わなくても、その2
つのアクセント句を強く結び付ける(ポーズを入れず、
後続アクセント句を抑圧する=強結合)ことで、実用上
十分と判断しているからである。しかし、次に示す、結
びつきの強い文節間においては、強結合としても不自然
に感じるという実験結果が得られたため、アクセント結
合を行う。 ・指示副詞+用言: 例:そう(指示副詞)+思う(動詞)→アクセント句:
そう思う ・連体詞+名詞(≠複合語): 例:この(連体詞)+会議(名詞)→アクセント句:こ
の会議 cf. この(連体詞)+国際(名詞)+会議(名詞)
→アクセント句:この/国際会議 また、複合語内のアクセント句境界設定において、宮崎
方式では、独立性の高い時詞は、常に独立のアクセント
句としていたが、特願平7−115925「合成音声出
力方法及び装置」に示す方法に基づいて、時詞のアクセ
ント句境界を設定する。
In the reading providing process in step 120, the Miyazaki method is used as it is. In the accent giving process of step 130, the accent phrase boundary and the accent type are set based on the Miyazaki system using the semantic dependency information in the compound word and the word dictionary information of FIG. here,
In the Miyazaki method, accent connection between phrases is not performed (all phrase boundaries are accent phrase boundaries). This means that even if accents between phrases are not
Strong accent phrases (no pauses,
This is because it is determined that suppressing the subsequent accent phrase = strong coupling) is practically sufficient. However, between the following strongly connected phrases, an accentual connection is performed because an experimental result was obtained in which unnaturalness was felt even as a strong connection.・ Instructive adverb + verb: Ex: so (instructive adverb) + think (verb) → accent phrase:
I think so ・ Adverb + noun (≠ compound): Example: This (adjective) + meeting (noun) → accent phrase: this meeting cf. This (adjective) + international (noun) + conference (noun)
→ Accent phrase: This / international conference In setting accent phrase boundaries in compound words, in the Miyazaki method, highly independent time phrases were always independent accent phrases, but Japanese Patent Application No. 7-115925 “Synthetic speech” Based on the method described in "Output Method and Apparatus", the accent phrase boundary of the time particle is set.

【0038】例: 正月(時詞)+番組(一般名詞)+で(格助詞)→アク
セント句:正月番組で 今日(時詞)+番組(一般名詞)+で(格助詞)→アク
セント句:今日/番組で さらに、自立語アクセント結合において、付属語アクセ
ント結合における副次アクセントと同様の現象が存在す
る。例えば、 神奈川等:カナ’ガワ/ト’ー 大阪等:オーサカト’ー のように、先行語が「神奈川」のようにアクセントをも
つ語の場合には、副次アクセントを持つ。そこで、自立
語でも付属語と同様に、副次アクセント属性をもつ語を
設定し、副次アクセントに対応する。
Example: New Year (time particle) + program (general noun) + (case particle) → accent phrase: New Year program today (time particle) + program (general noun) + (case particle) → accent phrase: In today / program In addition, there is a similar phenomenon in independent word accent combining as in secondary accent in adjunct accent combining. For example, if the preceding word has an accent such as "Kanagawa", such as Kanagawa etc .: Kana 'gawa / to' Osaka etc .: Osaka, then it has a secondary accent. Therefore, in the independent word, a word having a secondary accent attribute is set as in the case of the accessory word, and the secondary accent is set.

【0039】ステップ140のポーズ付与では、複合語
内等から段階的にポーズを設定していく多段階設定法を
導入する。多段階設定法では、はじめに、時間・数量表
現や固有名詞複合語など、独立に扱うことができ、その
構造が複合語内意味的係り受け情報より得られる局所構
造内のアクセント句境界、及び句読点の直後など、必ず
ポーズが入る(入らない)アクセント句境界に対してポ
ーズの有無を設定する。ここで、すべてのアクセント句
境界にポーズの有無が設定されるが、あるモーラ長以上
連続してポーズが設定されていない連続アクセント句例
(ポーズ未設定区間)に対しては、結合力を用いてポー
ズ付与のための補正を行う。結合力の値は、1〜10の
10段階(値が大きいほど結合力が強い)であり、アク
セント句境界の前後アクセント句の係り受けがあり得な
い場合(例:用言連用形<アクセント句境界>名詞)で
は、極端に値を小さく、逆に係り受けが生じる可能性が
高い場合(例:用言連体形<アクセント句境界>名詞)
では大きく設定している。
In the step 140 of giving a pause, a multi-step setting method for setting a pause step by step from within a compound word or the like is introduced. In the multi-stage setting method, first, time / quantity expressions, proper noun compounds, etc. can be handled independently, and the structure is accent phrase boundaries and punctuation marks in local structures obtained from semantic dependency information in compounds. Set the presence or absence of a pause at an accent phrase boundary where a pause always enters (does not enter), such as immediately after. Here, the presence or absence of a pause is set at all accent phrase boundaries, but for continuous accent phrase examples in which a pause is not set continuously for a certain mora length or longer (pause unset section), the binding force is used. To make a pose. The value of the binding power is 10 steps from 1 to 10 (the larger the value, the stronger the binding power), and it is impossible to depend on the accent phrase before and after the accent phrase boundary (eg, colloquial form <accent phrase boundary) > Noun), the value is extremely small, and conversely there is a high possibility of dependency (eg: verb adjunct form <accent phrase boundary> noun)
So we set it large.

【0040】この多段階設定法を導入することにより、
従来手法では精度の低かった複数アクセント句からなる
複合語内の設定においても、その内部構造を反映した適
切なポーズの設定が可能となり、また、文節間の係り受
け解析を用いなくても、結合力により近似的に係り受け
構造を推定し、結合力の強さとポーズ未設定区間のモー
ラ数に応じて段階的にポーズを付与していくので、実用
上十分な精度でポーズを設定できる。この多段階解析法
は、図6に示す5つのステップにより構成される。ここ
では、ポーズなし、小ポーズ、中ポーズ、大ポーズの4
段階のポーズ情報を設定するとする。
By introducing this multi-step setting method,
Even in a compound word composed of multiple accent phrases, which was inaccurate in the conventional method, it is possible to set an appropriate pause reflecting the internal structure, and it is possible to combine without using dependency analysis between phrases Since the dependency structure is approximately estimated by the force, and the pose is given stepwise according to the strength of the coupling force and the number of mora in the section where the pose is not set, the pose can be set with sufficient accuracy for practical use. This multi-stage analysis method includes five steps shown in FIG. Here, there are 4 poses: no pose, small pose, medium pose, and large pose.
Suppose that you want to set stage pose information.

【0041】図6は、本発明の多段階設定法に基づくポ
ーズ付与のフローチャートである。 ステップ141) 記号に基づくポーズ付与では、アク
セント句末尾が句読点等の記号の場合、その直後アクセ
ント句境界に対して、ポーズを設定する。句点、感嘆
符、疑問符の場合は、大ポーズ、読点、開きかっこには
中ポーズ、その他の中点以外の記号には小ポーズを設定
する。
FIG. 6 is a flow chart of the pose assignment based on the multi-step setting method of the present invention. Step 141) In the pose assignment based on the symbol, if the end of the accent phrase is a symbol such as a punctuation mark, a pause is set immediately after the accent phrase boundary. In the case of a period, an exclamation point, or a question mark, set a large pose, a reading mark, a medium pose for open parentheses, and a small pose for other symbols other than the middle point.

【0042】ステップ142) 日時表現・数量表現の
ポーズ付与では、日時表現、数量表現に対してポーズ付
与を行う。日時表現は、その表現を年要素、月要素、日
要素に分類し、この出現パターンによりポーズの有無を
付与する。 例: [小ポーズ]年要素[小ポーズ]月要素[ポーズなし]
日要素:→会議は[小ポーズ]平成10年[小ポーズ]
6月[ポーズなし]1日から[小ポーズ]月要素[ポー
ズなし]日要素: →会議は[小ポーズ]6月[ポーズなし]1日から数量
表現は、宮崎方式において、 (前置助数詞)+(符号)+数詞+(助数詞)+(接
辞) 但し、()は省略可を表す。と、定義された表現であ
る。この数量表現のパターンやその前後アクセント句の
品詞に応じて、数量表現内及び、その前後のポーズ有無
を設定する。
Step 142) In the pause assignment of the date / time expression / quantity expression, a pause is assigned to the date / time expression and the quantity expression. The date and time expression classifies the expression into a year element, a month element, and a day element, and the presence / absence of a pause is given by the appearance pattern. Example: [Small pose] Year element [Small pose] Month element [No pose]
Day element: → Meeting is [small pose] 1998 [small pose]
From June [no pause] 1st to [small pose] month element [no pause] day element: → Meeting is [small pose] June 1st [no pause] 1st day. ) + (Sign) + numeral + (numerical number) + (affix) where () indicates omission possible. Is a defined expression. In accordance with the pattern of this numerical expression and the part of speech of the accent phrase before and after the numerical expression, the presence or absence of the pause in the numerical expression and before and after it is set.

【0043】例: [小ポーズ]前置助数詞[小ポーズ]2つ以上の数詞
(+助数詞)アクセント句→[小ポーズ]第[小ポー
ズ]百/二十/三回 [小ポーズ]前置助数詞[ポーズなし]1つの数詞(+
助数詞)アクセント句→[小ポーズ]第[ポーズなし]
三回 ステップ143) 特定単語の組み合わせによるポーズ
付与では、連続する2または、3アクセント句の品詞等
の単語情報を参照し、常にポーズを付与すべき(付与す
べきでない)境界にポーズの有無を設定する。
Example: [Small pose] Prefix classifier [Small pose] Accent phrase of two or more numbers (+ classifier) → [Small pose] No. [Small pose] 100/20/3 times [Small pose] Prefix Classifier [No pause] One number (+
Classifier) Accent phrase → [Small pose] No. [No pause]
Three times Step 143) In the pause assignment using a combination of specific words, word information such as the part of speech of two or three consecutive accent phrases is referred to, and the presence or absence of a pause at the boundary where the pause should be (or should not) be given at all times is determined. Set.

【0044】例: 役職[小ポーズ]人名→社長[小ポーズ]山田/太郎氏 など(副助詞)[小ポーズ]用言以外の単語→証人喚問
など[小ポーズ]事実審理が/始まります。 ステップ144) 結合力に基づくポーズ付与では、ス
テップ141〜143でポーズ有無が設定されなかった
アクセント句境界に対し、アクセント句境界前後の単語
の品詞等により得られる結合力を用いてポーズの有無を
設定する。
Example: Position [Small Pose] Name → President [Small Pose] Yamada / Taro, etc. (Auxiliary particle) [Small Pose] Words other than diacritics → [Small Pose] Trial hearing, etc. starts. Step 144) In the pose assignment based on the bonding strength, the presence or absence of a pause is determined for the accent phrase boundary for which the presence or absence of the pause is not set in steps 141 to 143 by using the bonding power obtained by the parts of speech of the words before and after the accent phrase boundary. Set.

【0045】結合力を設定するために、品詞によりアク
セント句境界の直前単語を図7に示す分類P1〜P11
の11種類、直後単語を図8に示す分類N1〜N7の7
種類に分類する。これらは、品詞の構文的性質(例:P
3=連体修飾をする用言)、及び独立性という2つの観
点により分類を行ったものである。このため、直前単語
の分類においては、助詞を単語辞書情報の助詞ポーズ属
性(構文的性質と独立性により助詞を分類)により5種
類に細分類する。
To set the binding strength, words immediately before the accent phrase boundaries are classified by parts of speech as shown in classifications P1 to P11 shown in FIG.
11 and the immediately following words are classified into 7 of the classifications N1 to N7 shown in FIG.
Classify by type. These are the syntactic properties of parts of speech (eg, P
3 = a word for modifying the union) and independence. For this reason, in the classification of the immediately preceding word, the particles are subdivided into five types according to the particle pose attribute of the word dictionary information (the particles are classified according to their syntactic properties and independence).

【0046】結合力は、Pi×Nj(i=1〜11、j
=1〜7)の組み合わせマトリックスにより決定する
(但し、連語から分類された単語の境界には、無条件に
結合力最大値(10)を与える)。この組み合わせマト
リックスの各値は、PiとNjの構文的な性質(係り受
けがあり得る、あり得ない)、及び、それぞれの独立
性、さらに、係り受けがあり得る組み合わせにおいて
は、その韻律的特徴(アクセント句のモーラ長や複合語
の複数アクセント句化など)を考慮して経験的に設定し
ている。ここでは、Pi×N7の組み合わせマトリック
スのみを図9に示して具体的に説明する。
The bonding force is Pi × Nj (i = 1 to 11, j
= 1 to 7) (however, the maximum value of the binding force (10) is unconditionally given to the boundaries of words classified from collocations). The values of this combination matrix are the syntactic properties of Pi and Nj (possible or impossible), their independence, and, for possible combinations, their prosodic features. (Emphasis on the mora length of accent phrases and multiple accent phrases in compound words). Here, only the combination matrix of Pi × N7 will be specifically described with reference to FIG.

【0047】アクセント句境界直前単語がP2,P3,
P11の場合は、このアクセント句境界の直前文節が直
後文節にかかる連体修飾関係となる可能性が高いため、
図10に示すように、直後アクセント句等の条件に応じ
て結合力を変える。図9の項番1は、直後が複数アクセ
ント句からなる複合語である場合を表しており、この場
合は、連体修飾関係が成立しても、アクセント句単位の
構造としては、右枝分かれの構造となる場合が殆どであ
るため、結合力を最小とする。例えば、「昨年/成立し
た/(A)/男女/雇用機会/均等法」(/:アクセン
ト句境界)では、文節単位の構造としては、「成立し
た」→「男女雇用機会均等法」と係り受けが成立する
が、アクセント句単位の構造としては、「成立した」→
「均等法」となり、(A)は右枝分かれ境界となる。
The words immediately before the accent phrase boundary are P2, P3,
In the case of P11, the phrase immediately before the boundary of the accent phrase is likely to have a continuous modification relationship with the immediately following phrase.
As shown in FIG. 10, the binding power is changed according to conditions such as the accent phrase immediately after. Item No. 1 in FIG. 9 shows a case in which the immediately succeeding word is a compound word composed of a plurality of accent phrases. In this case, even if the adnominal modification relationship is established, the structure of the accent phrase unit is a right-branched structure. Therefore, the bonding force is minimized. For example, "last year / enacted / (A) / man and woman / employment opportunity / equal law" (/: accent phrase boundary) indicates that the phrase unit structure is "enacted" → "man and woman employment opportunity law". However, the structure of the accent phrase unit is
"Equal method", and (A) is a right branching boundary.

【0048】この結合力は、ステップ145のポーズ付
与の補正でも利用するため、ステップ141〜ステップ
143で既に「ポーズなし」を設定しているアクセント
句境界に対しても求めておく(但し、ポーズ有無の設定
は行わない)。但し、これらのアクセント句境界に対し
ては、得られた結合力に10を加算する。これは、ステ
ップ141〜ステップ143で設定されるポーズ有無を
ステップ144で設定されるポーズ有無より信頼性が高
いと考えるためである。
Since this bonding force is also used in the correction of the pose addition in step 145, it is also obtained for the accent phrase boundaries for which “no pause” has already been set in steps 141 to 143 (however, the pause is not required). Do not set the presence or absence). However, for these accent phrase boundaries, 10 is added to the obtained binding power. This is because the presence / absence of the pause set in steps 141 to 143 is considered to be more reliable than the presence / absence of the pause set in step 144.

【0049】ポーズ有無未設定のアクセント句境界に対
しては、結合力=1となるアクセント句境界に小ポー
ズ、それ以外のアクセント句境界には、ポーズなしを付
与する。 ステップ145) ポーズ付与の補正では、あるモーラ
以上ポーズが設定されていない場合(このポーズが設定
されていない区間をポーズ未設定区間と呼ぶ)に、結合
力を用いてポーズを設定する。ここでは、ポーズ未設定
区間の長さと、ステップ144で設定した結合力の強さ
により、図11に示すフローチャートのように、段階的
にポーズを付与する。
For an accent phrase boundary for which no pause is set, a small pause is given to the accent phrase boundary where the binding strength = 1, and no pause is given to the other accent phrase boundaries. Step 145) In the correction of the provision of a pose, when a pose is not set to a certain mora or more (a section in which this pose is not set is referred to as a section in which a pose is not set), a pose is set using the binding force. Here, the pause is given stepwise as shown in the flowchart of FIG. 11 according to the length of the section in which the pause is not set and the strength of the coupling force set in step 144.

【0050】以下図11のフローチャートを説明する。 ステップ1451) ポーズ未設定区間長が20モーラ
より長いか判断する。長い場合にはステップ1452に
移行する。20モーラ以下の場合には処理を終了する
(ポーズ付与の補正を行わない)。 ステップ1452) ポーズ未設定区間長が30モーラ
以下かを判定する。30モーラ以下の場合には、ステッ
プ1455に移行し、それ以外の場合にはステップ14
53に移行する。
Hereinafter, the flowchart of FIG. 11 will be described. Step 1451) It is determined whether or not the pause-unset section length is longer than 20 moras. If it is longer, the flow shifts to step 1452. If the number is less than 20 mora, the process is terminated (the correction of the pose is not performed). Step 1452) It is determined whether the pause-unset section length is 30 mora or less. If it is less than 30 mora, the process proceeds to step 1455;
Go to 53.

【0051】ステップ1453) ポーズ未設定区間の
先頭から第5モーラ目から末尾から5モーラ目の間で、
結合力6以下のアクセント句境界があるか判定する。条
件を満たす場合には、ステップ1456に移行し、それ
以外の場合にはステップ1454に移行する。 ステップ1454) ポーズ未設定区間の先頭から第2
モーラ目から末尾から2モーラ目の間で結合力が最小と
なるアクセント句境界に小ポーズを設定し、処理を終了
する。
Step 1453) From the fifth to the fifth mora from the head of the pause unset section to the fifth mora from the end,
It is determined whether there is an accent phrase boundary having a binding power of 6 or less. If the condition is satisfied, the flow shifts to step 1456; otherwise, the flow shifts to step 1454. Step 1454) Second from beginning of pause unset section
A small pose is set at the accent phrase boundary where the bonding strength is minimum between the last mora and the second mora from the end, and the process ends.

【0052】ステップ1455) ポーズ未設定区間の
先頭から第5モーラ目から末尾から5モーラ目の間で、
結合力3以下のアクセント句境界があるか判定する。条
件を満たす場合にはステップ1456に移行し、それ以
外の場合には処理を終了する。 ステップ1456) ポーズ未設定区間の先頭から第5
モーラ目から末尾から5モーラ目の間で結合力最小のア
クセント句境界に小ポーズを設定し、処理を終了する。
Step 1455) Between the 5th mora from the head of the pause-unset section and the 5th mora from the end,
It is determined whether there is an accent phrase boundary having a binding strength of 3 or less. If the condition is satisfied, the flow shifts to step 1456; otherwise, the process ends. Step 1456) Fifth from beginning of pause unset section
A small pose is set at the boundary of the accent phrase with the smallest binding strength between the last five moora from the last moora, and the process ends.

【0053】この、ポーズ付与の補正を行った後のポー
ズ未設定区間に対しても、ポーズ付与が行われなくなる
まで、再帰的に図11の処理を行う。図11のフローチ
ャートにより、ポーズ未設定区間長が20モーラ以上3
0モーラ未満と、ポーズが挿入されなくてもあまり不自
然でない長さの場合には、結合力が弱い(3以下)アク
セント句境界が存在した場合にのみポーズを付与し、ポ
ーズ未設定区間長が30モーラ以上と、ポーズがなけれ
ば不自然となる長さを越えた場合には、必ずポーズを設
定するという2段階のポーズ付与の補正を行うものであ
る。
The process shown in FIG. 11 is performed recursively even in the pause-unset section after the correction of the pose is performed, until the pause is no longer provided. According to the flowchart of FIG. 11, the pause-unset section length is 20 mora or more and 3
If the length is less than 0 mora and the length is not unnatural even if no pause is inserted, a pause is given only when there is an accent phrase boundary with a weak binding force (3 or less), and the pause unset section length Is more than 30 mora, and if the length exceeds an unnatural length without a pose, a pose is always set and a two-stage correction of giving a pose is performed.

【0054】[0054]

【実施例】以下、図面と共に本発明の実施例を具体的な
例を示して説明する。図12は、本発明の一実施例の読
み韻律情報設定の具体例を示す。まず、ステップ110
の形態素解析により、文が単語に分割される。ここで、
「放射性」は一単語として認定されているが、その単語
辞書情報の語数=2であり、2語からなる語であること
が分かる。また、「について」も一単語として認定され
ているが、その単語辞書情報の構成単語情報により、
「に/つい/て」と3単語に展開される。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below with reference to the drawings. FIG. 12 shows a specific example of reading prosody information setting according to an embodiment of the present invention. First, step 110
Is divided into words. here,
Although “radioactivity” is recognized as one word, the number of words in the word dictionary information = 2, which indicates that the word is composed of two words. In addition, "about" is also recognized as one word, but according to the constituent word information of the word dictionary information,
It is expanded into three words, "ni / about / te".

【0055】次に、ステップ120の読み付与により、
()で示す読みが付与される(図12ではひらがな部分
は()を省略したが、同様に読みが付与される)。ここ
で、数量表現である「三十日」は宮崎方式に示される数
値の読み付与規則により、その他の読みは、単語辞書情
報の読みにより、読みが付与される。次に、ステップ1
30のアクセント付与により、アクセント句境界とアク
セント句のアクセント型が設定される。
Next, by giving the reading in step 120,
A reading shown in parentheses is given (in FIG. 12, hiragana portions are omitted in parentheses, but readings are similarly given). Here, “30 days”, which is a numerical expression, is given a reading according to a reading provision rule of a numerical value shown in the Miyazaki system, and other readings are given by reading word dictionary information. Next, step 1
By giving 30 accents, the accent phrase boundary and the accent type of the accent phrase are set.

【0056】ここで、副次アクセント的性質をもつ
「等」が3型アクセントをもつ「対応策」に後続してい
るため、「対応策/等」と2つのアクセント句に分かれ
ている。また、「放射性」の語数=2という情報を利用
して、「放射性/廃棄物」と、正しくアクセント句境界
が設定されている。次に、ステップ140のポーズ付与
により、ポーズが付与される。
Here, since "equal" having a secondary accent characteristic follows "measures" having a three-type accent, it is divided into two accent phrases "measures / equals". Also, using the information that the number of words of “radioactive” = 2, the accent phrase boundary is correctly set to “radioactive / waste”. Next, a pose is given by the pose assignment in step 140.

【0057】まず、ステップ141により、記号に基づ
くポーズ付与により、[A]の位置に中ポーズが付与さ
れる。次に、ステップ142により、日時表現・数量表
現のポーズ付与において、「先月/三十日に」が月要素
+日要素となるため、[小ポーズ]先月[ポーズなし]
三十日にと設定される。
First, in step 141, a middle pose is given to the position [A] by giving a pose based on the symbol. Next, in step 142, “last month / thirty days” is a month element + day element in the pose assignment of date / time expression / quantity expression, so [small pose] last month [no pause]
Set to thirty days.

【0058】ステップ143により、特定単語の組み合
わせによるポーズ付与は、本例では存在しないので、説
明を省略する。そして、ステップ144により、結合力
に基づくポーズ付与により、結合力=1である[C]の
位置に小ポーズを、それ以外のポーズ有無未設定のアク
セント句境界に、ポーズなしを付与する。
In step 143, there is no pause assignment based on a combination of specific words in this example, so that the description is omitted. Then, in step 144, a small pose is given to the position [C] where the binding force is 1 and no pause is given to the other accent phrase boundaries for which the presence or absence of the pose is not set, by giving a pose based on the binding force.

【0059】さらに、ステップ145のポーズ付与の補
正により、ポーズ未設定区間「日本海などでの共同調査
の方法や今後の対応策等について協議が行われまし
た。」(50モーラ)において、図11のステップ14
51→ステップ1452→ステップ1453→ステップ
1456と移行し、ステップ1456において、最小結
合力3を持つ[D]に小ポーズが付与される。
Further, by the correction of the pose addition in step 145, the section in which the pose is not set, "The method of joint investigation in the Sea of Japan and the like and the future countermeasures were discussed." Step 14 of 11
The process proceeds from 51 → step 1452 → step 1453 → step 1456, and in step 1456, a small pose is given to [D] having the minimum binding force 3.

【0060】[D]にポーズが設定された後のポーズ未
設定区間、「日本海などでの共同調査の方法や」、「今
後の対応策等について協議が行われました。」は共に2
0モーラ以上30モーラ未満であるが、結合力3以下の
アクセント句境界は存在しないので、これ以上ポーズを
付与しない。同様に、ポーズ未設定区間「放射性廃棄物
の海洋投棄に関する」(23モーラ)は、図11のステ
ップ1451→ステップ1452→ステップ1455と
移行し、結合力3以下のアクセント句境界が存在しない
ので、ポーズを付与しない。
In the section where no pause has been set after the pause has been set in [D], “Methods of joint investigation in the Sea of Japan etc.” and “Consultations on future countermeasures, etc.” are both 2
Although there is no accent phrase boundary between 0 mora and less than 30 mora, but no binding force of 3 or less, no more poses are given. Similarly, in the pause unset section “related to radioactive waste dumping in the ocean” (23 mora), the flow shifts from step 1451 to step 1452 to step 1455 in FIG. 11 and there is no accent phrase boundary having a binding force of 3 or less. Do not give a pose.

【0061】また、上記の実施例で用いた図4、図6、
図11に示す動作及び、図3に示す装置構成をプログラ
ムとして構築し、読み韻律情報設定装置として利用され
るコンピュータに接続されるディスク装置、フロッピー
ディスクやCD−ROM等の可搬記憶媒体に格納してお
き、本発明を実施する際にインストールすることにより
容易に本発明を実現できる。
4 and 6 used in the above embodiment.
The operation shown in FIG. 11 and the device configuration shown in FIG. 3 are constructed as a program and stored in a disk device connected to a computer used as a reading prosody information setting device, a portable storage medium such as a floppy disk or a CD-ROM. In addition, the present invention can be easily realized by installing the present invention when implementing the present invention.

【0062】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
The present invention is not limited to the above embodiment, but can be variously modified and applied within the scope of the claims.

【0063】[0063]

【発明の効果】上述のように、本発明によれば、文節間
の係り受け解析を行わなくても、多段解析法に基づく形
態素解析結果を用いて、高精度で読み韻律情報を設定で
きるようになる。
As described above, according to the present invention, it is possible to set reading prosody information with high accuracy using a morphological analysis result based on a multistage analysis method without performing dependency analysis between phrases. become.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理を説明するための図である。FIG. 1 is a diagram for explaining the principle of the present invention.

【図2】本発明の原理構成図である。FIG. 2 is a principle configuration diagram of the present invention.

【図3】本発明の読み韻律情報設定装置の構成図であ
る。
FIG. 3 is a configuration diagram of a reading prosody information setting device of the present invention.

【図4】本発明の読み韻律情報設定方法を説明するため
の図である。
FIG. 4 is a diagram for explaining a reading prosody information setting method of the present invention.

【図5】本発明の読み韻律情報設定用単語辞書情報の一
例である。
FIG. 5 is an example of word dictionary information for reading prosody information of the present invention.

【図6】本発明の多段階設定法に基づくポーズ付与のフ
ローチャートである。
FIG. 6 is a flowchart of pose assignment based on the multi-stage setting method of the present invention.

【図7】本発明の直前単語の品詞分類を示す図である。FIG. 7 is a diagram showing a part of speech classification of the immediately preceding word according to the present invention.

【図8】本発明の直後単語の品詞分類を示す図である。FIG. 8 is a diagram showing a part of speech classification of a word immediately after the present invention.

【図9】本発明のPi×N7の組み合わせマトリックス
である。
FIG. 9 is a Pi × N7 combination matrix of the present invention.

【図10】本発明のP2,P3,P11×N7の結合力
を示す図である。
FIG. 10 is a view showing a bonding force of P2, P3, and P11 × N7 of the present invention.

【図11】本発明のポーズ付与の補正のフローチャート
である。
FIG. 11 is a flowchart of a process of correcting pose assignment according to the present invention.

【図12】本発明の一実施例の読み韻律情報設定の具体
例である。
FIG. 12 is a specific example of reading prosody information setting according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

10 テキスト解析手段、テキスト解析部 11 形態素解析手段、形態素解析部 12 読み付与手段、読み付与部 13 アクセント付与手段、アクセント付与部 14 ポーズ付与手段、ポーズ付与部 15 単語辞書 20 音声生成部 DESCRIPTION OF SYMBOLS 10 Text analysis means, text analysis part 11 Morphological analysis means, morphological analysis part 12 Reading provision means, reading provision part 13 Accent provision means, Accent provision part 14 Pose provision means, Pose provision part 15 Word dictionary 20 Voice generation part

───────────────────────────────────────────────────── フロントページの続き (72)発明者 小原 永 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 ──────────────────────────────────────────────────の Continued on the front page (72) Inventor Eiji Ohara 3-19-2 Nishishinjuku, Shinjuku-ku, Tokyo Nippon Telegraph and Telephone Corporation

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 漢字かな混じりの日本語テキストを入力
して、読み韻律情報を付与するテキスト解析を行い、読
み韻律情報に基づいて合成音声を生成する音声生成を行
って、合成音声を出力する音声合成方法におけるテキス
ト解析における読み韻律情報設定方法において、 単語認定及び読み韻律情報を設定するための単語辞書を
用いて多段解析法に基づく形態素解析を行い、 前記形態素解析で単語認定するための情報に加え、前記
単語辞書を用いて、該形態素解析の結果を利用して読み
付与、アクセント付与、ポーズ付与を行うことを特徴と
する読み韻律情報設定方法。
1. A method of inputting Japanese text mixed with kanji and kana, performing text analysis for adding reading prosody information, performing speech generation for generating synthesized speech based on the reading prosody information, and outputting synthesized speech. In a method for setting prosody information in text analysis in a speech synthesis method, a morphological analysis based on a multi-stage analysis method is performed using a word dictionary for setting word recognition and reading prosody information, and information for word recognition in the morphological analysis. A reading prosody information setting method, wherein reading, accenting, and pausing are performed using the result of the morphological analysis using the word dictionary.
【請求項2】 前記多段解析法に基づく形態素解析を行
う際に、 1語で登録された複合語内でアクセント句境界が存在す
る場合に対応する、複数のアクセント句に関する情報を
格納できるアクセント句情報、1語で登録され、付属語
を含み、その内部にアクセント句境界が存在する場合に
対応する短単位の単語に展開するための構成単語情報、
1語で登録された複合語で内部にアクセント句境界は存
在しないが、長単位語であることを表すための語数を有
する前記単語辞書を用いて、該単語辞書では別々に登録
されている用言の語幹語尾を1語化し、格助詞相当語を
連語として1まとまりに認定する請求項1記載の読み韻
律情報設定方法。
2. A morphological analysis based on the multi-stage analysis method, wherein an accent phrase capable of storing information on a plurality of accent phrases corresponding to a case where an accent phrase boundary exists in a compound word registered with one word. Information, which is registered in one word, includes an accessory word, and constituent word information for expanding into a short unit word corresponding to the case where an accent phrase boundary exists therein,
Although there is no accent phrase boundary inside a compound word registered as one word, the word dictionary having the number of words to indicate that it is a long unit word is used, and the word dictionary is registered separately in the word dictionary. 2. The reading prosody information setting method according to claim 1, wherein the stem ending of the word is made into one word, and the case particle equivalent is recognized as a unit as a collocation.
【請求項3】 前記アクセント付与を行う際に、 結びつきの強い文節間のアクセント結合を行う請求項1
記載の読み韻律情報設定方法。
3. The method according to claim 1, wherein, when the accent is given, accent connection between phrases having strong connection is performed.
How to set the reading prosody information.
【請求項4】 前記ポーズ付与を行う際に、 記号に基づくポーズ付与、日時表現・数量表現のポーズ
付与、特定単語の組み合わせによるポーズ付与、結合力
に基づくポーズ付与、ポーズ付与の補正からなる多段階
設定法によりポーズを付与する請求項1記載の読み韻律
情報設定方法。
4. The method according to claim 1, further comprising the steps of: providing a pose based on a symbol; providing a pose based on a date and time expression / quantity expression; providing a pose based on a combination of specific words; 2. The reading prosody information setting method according to claim 1, wherein a pause is assigned by a step setting method.
【請求項5】 漢字かな混じりの日本語テキストが入力
されると、読み韻律情報を付与するテキスト解析手段
と、読み韻律情報に基づいて合成音声を生成する音声生
成を行う音声合成手段とを有する音声合成システムにお
けるテキスト解析における読み韻律情報設定装置であっ
て、 前記テキスト解析手段は、 多段解析法に基づく形態素解析を行う形態素解析手段
と、 前記形態素解析手段で単語認定するための情報に加え、
読み韻律情報を設定するための情報を持つ単語辞書と、 前記形態素解析手段の結果を利用して、読みを付与する
読み付与手段と、 アクセントを付与するアクセント付与手段と、 ポーズを付与するポーズ付与手段とを有することを特徴
とする読み韻律情報設定装置。
5. When a Japanese text mixed with kanji or kana is input, the system includes a text analysis unit for providing reading prosody information and a speech synthesis unit for generating a speech based on the reading prosody information. A reading prosody information setting device for text analysis in a speech synthesis system, wherein the text analysis unit includes a morphological analysis unit that performs a morphological analysis based on a multistage analysis method, and information for certifying a word by the morphological analysis unit.
A word dictionary having information for setting reading prosody information; a reading giving means for giving a reading by using a result of the morphological analysis means; an accent giving means for giving an accent; and a pose giving for giving a pose. Reading prosody information setting device.
【請求項6】 前記単語辞書は、 該単語辞書の情報として、1語で登録された複合語内で
アクセント句境界が存在する場合に対応する、複数のア
クセント句に関する情報を格納できるアクセント句情
報、1語で登録され、付属語を含み、その内部にアクセ
ント句境界が存在する場合に対応する短単位の単語に展
開するための構成単語情報、1語で登録された複合語で
内部にアクセント句境界は存在しないが、長単位語であ
ることを表すための語数を有し、 前記形態素解析手段は、 前記単語辞書では別々に登録されている用言の語幹語尾
を1語化し、格助詞相当語を連語として1まとまりに認
定する手段を有する請求項5記載の読み韻律情報設定装
置。
6. The word dictionary according to claim 1, wherein said word dictionary stores information on a plurality of accent phrases corresponding to a case where an accent phrase boundary exists in a compound word registered with one word. , Word information that is registered in one word, contains adjuncts, and expands into short words corresponding to the presence of accent phrase boundaries inside the compound word, and accents inside compound words registered in one word Although there is no phrase boundary, it has a number of words to indicate that it is a long unit word, and the morphological analysis unit converts the stem endings of the vocabulary words registered separately in the word dictionary into one word, 6. The reading prosody information setting device according to claim 5, further comprising a unit that recognizes the equivalent word as a collocation unit.
【請求項7】 前記アクセント付与手段は、 結びつきの強い文節間のアクセント結合を行う手段を含
む請求項5記載の読み韻律情報設定装置。
7. The reading prosody information setting device according to claim 5, wherein said accent providing means includes means for performing accent connection between phrases having strong connection.
【請求項8】 前記ポーズ付与手段は、 記号に基づくポーズ付与、日時表現・数量表現のポーズ
付与、特定単語の組み合わせによるポーズ付与、結合力
に基づくポーズ付与、ポーズ付与の補正からなる多段階
設定法によりポーズを付与する手段を含む請求項5記載
の読み韻律情報設定装置。
8. A multi-stage setting comprising: a pose assignment based on a symbol, a pose assignment based on a date / time expression and a quantity expression, a pose assignment based on a combination of specific words, a pose assignment based on a joint force, and a correction of the pose assignment. 6. The reading prosody information setting device according to claim 5, further comprising means for giving a pause by a method.
【請求項9】 漢字かな混じりの日本語テキストが入力
されると、読み韻律情報を付与するテキスト解析プロセ
スと、読み韻律情報に基づいて合成音声を生成する音声
生成を行う音声合成プロセスとを有する音声合成プログ
ラムおけるテキスト解析における読み韻律情報設定プロ
グラムを格納した記憶媒体であって、 前記テキスト解析プロセスは、 単語認定及び読み韻律情報を設定するための単語辞書を
用いて多段解析法に基づく形態素解析を行う形態素解析
プロセスと、 前記形態素解析で単語認定するための情報に加え、前記
単語辞書を用いて、前記形態素解析プロセスの結果を利
用して読みを付与する読み付与プロセスと、 前記単語辞書を用いてアクセントを付与するアクセント
付与プロセスと、 ポーズを付与するポーズ付与プロセスとを有することを
特徴とする読み韻律情報設定プログラムを格納した記憶
媒体。
9. A text analysis process for providing reading prosody information when a Japanese text mixed with kanji and kana is input, and a speech synthesis process for generating a speech based on the reading prosody information. A storage medium storing a reading prosody information setting program in text analysis in a speech synthesis program, wherein the text analysis process uses a word dictionary for setting word recognition and reading prosody information based on a multi-stage analysis method. A morphological analysis process of performing the following, in addition to the information for word recognition in the morphological analysis, using the word dictionary, a reading giving process of giving a reading using the result of the morphological analysis process, Accenting process of giving an accent using a pose, and Pose giving process of giving a pose Storage medium storing read prosodic information setting program characterized in that it comprises a.
【請求項10】 前記形態素解析プロセスは、 1語で登録された複合語内でアクセント句境界が存在す
る場合に対応する、複数のアクセント句に関する情報を
格納できるアクセント句情報、1語で登録され、付属語
を含み、その内部にアクセント句境界が存在する場合に
対応する短単位の単語に展開するための構成単語情報、
1語で登録された複合語で内部にアクセント句境界は存
在しないが、長単位語であることを表すための語数を有
する前記単語辞書を用いて、該単語辞書では別々に登録
されている用言の語幹語尾を1語化し、格助詞相当語を
連語として1まとまりに認定するプロセスを有する請求
項9記載の読み韻律情報設定プログラムを格納した記憶
媒体。
10. The morphological analysis process includes: accent phrase information that can store information on a plurality of accent phrases corresponding to a case where an accent phrase boundary exists in a compound word registered with one word. , Component word information for expanding into short words corresponding to the case where an accent phrase boundary exists, including adjuncts,
Although there is no accent phrase boundary inside a compound word registered as one word, the word dictionary having the number of words to indicate that it is a long unit word is used, and the word dictionary is registered separately in the word dictionary. 10. The storage medium storing the prosodic information setting program according to claim 9, comprising a process of converting the stem ending of the word into one word, and certifying the case particle equivalent word as a group of collocations.
【請求項11】 前記アクセント付与プロセスは、 結びつきの強い文節間のアクセント結合を行うプロセス
を含む請求項9記載の読み韻律情報設定プログラムを格
納した記憶媒体。
11. The storage medium storing the prosody information setting program according to claim 9, wherein said accent providing process includes a process of performing accent connection between phrases having strong connection.
【請求項12】 前記ポーズ付与プロセスは、 記号に基づくポーズ付与、日時表現・数量表現のポーズ
付与、特定単語の組み合わせによるポーズ付与、結合力
に基づくポーズ付与、ポーズ付与の補正からなる多段階
設定法によりポーズを付与するプロセスを含む請求項9
記載の読み韻律情報設定プログラムを格納した記憶媒
体。
12. The multi-stage setting includes a pause assignment process based on a symbol, a pause assignment based on a date / time expression and a numerical expression, a pose assignment based on a combination of specific words, a pose assignment based on a joint force, and a pose assignment correction. 10. The method of claim 9, further comprising the step of:
A storage medium storing the described prosody information setting program.
JP15460598A 1998-06-03 1998-06-03 Reading prosody information setting method and apparatus, and storage medium storing reading prosody information setting program Expired - Lifetime JP3518340B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15460598A JP3518340B2 (en) 1998-06-03 1998-06-03 Reading prosody information setting method and apparatus, and storage medium storing reading prosody information setting program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15460598A JP3518340B2 (en) 1998-06-03 1998-06-03 Reading prosody information setting method and apparatus, and storage medium storing reading prosody information setting program

Publications (2)

Publication Number Publication Date
JPH11344998A true JPH11344998A (en) 1999-12-14
JP3518340B2 JP3518340B2 (en) 2004-04-12

Family

ID=15587843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15460598A Expired - Lifetime JP3518340B2 (en) 1998-06-03 1998-06-03 Reading prosody information setting method and apparatus, and storage medium storing reading prosody information setting program

Country Status (1)

Country Link
JP (1) JP3518340B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007114507A (en) * 2005-10-20 2007-05-10 Toshiba Corp Prosodic control rule generating method, speech synthesizing method, prosodic control rule generating device, speech synthesizer, prosodic control rule generating program, and speech synthesizing program
WO2013008385A1 (en) * 2011-07-11 2013-01-17 日本電気株式会社 Speech synthesis device, speech synthesis method, and speech synthesis program
WO2022091422A1 (en) * 2020-11-02 2022-05-05 日本電信電話株式会社 Inference device, inference method, and inference program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8606583B2 (en) 2008-08-13 2013-12-10 Nec Corporation Speech synthesis system for generating speech information obtained by converting text into speech
US8620663B2 (en) 2008-08-13 2013-12-31 Nec Corporation Speech synthesis system for generating speech information obtained by converting text into speech

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007114507A (en) * 2005-10-20 2007-05-10 Toshiba Corp Prosodic control rule generating method, speech synthesizing method, prosodic control rule generating device, speech synthesizer, prosodic control rule generating program, and speech synthesizing program
JP4559950B2 (en) * 2005-10-20 2010-10-13 株式会社東芝 Prosody control rule generation method, speech synthesis method, prosody control rule generation device, speech synthesis device, prosody control rule generation program, and speech synthesis program
WO2013008385A1 (en) * 2011-07-11 2013-01-17 日本電気株式会社 Speech synthesis device, speech synthesis method, and speech synthesis program
JPWO2013008385A1 (en) * 2011-07-11 2015-02-23 日本電気株式会社 Speech synthesis apparatus, speech synthesis method, and speech synthesis program
WO2022091422A1 (en) * 2020-11-02 2022-05-05 日本電信電話株式会社 Inference device, inference method, and inference program

Also Published As

Publication number Publication date
JP3518340B2 (en) 2004-04-12

Similar Documents

Publication Publication Date Title
Lita et al. Truecasing
US7263488B2 (en) Method and apparatus for identifying prosodic word boundaries
US8392191B2 (en) Chinese prosodic words forming method and apparatus
US6098042A (en) Homograph filter for speech synthesis system
US20040024585A1 (en) Linguistic segmentation of speech
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
Narasimhan et al. Schwa-deletion in Hindi text-to-speech synthesis
Lee Reading machine: From text to speech
JP3518340B2 (en) Reading prosody information setting method and apparatus, and storage medium storing reading prosody information setting program
El-Imam et al. Rules and algorithms for phonetic transcription of standard Malay
Zhou et al. Statistical natural language generation for speech-to-speech machine translation
JP3589972B2 (en) Speech synthesizer
Meng et al. CU VOCAL: corpus-based syllable concatenation for Chinese speech synthesis across domains and dialects.
Oflazer Morphological processing for Turkish
JP3201329B2 (en) Speech synthesizer
Xydas et al. Text normalization for the pronunciation of non-standard words in an inflected language
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
Gibbon et al. Spoken Language Characterization
JP3029403B2 (en) Sentence data speech conversion system
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JPH05134691A (en) Method and apparatus for speech synthesis
Arısoy et al. Turkish dictation system for broadcast news applications
JP3638000B2 (en) Audio output device, audio output method, and recording medium therefor
Burkhardt et al. A Taxonomy of Specific Problem Classes in Text-to-Speech Synthesis: Comparing Commercial and Open Source Performance
KR20230155156A (en) Voice recognition system by using a single tokenizer and method of tokenization in the voice recognition system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080206

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090206

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090206

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100206

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110206

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110206

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term