JP3518340B2 - 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体 - Google Patents
読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体Info
- Publication number
- JP3518340B2 JP3518340B2 JP15460598A JP15460598A JP3518340B2 JP 3518340 B2 JP3518340 B2 JP 3518340B2 JP 15460598 A JP15460598 A JP 15460598A JP 15460598 A JP15460598 A JP 15460598A JP 3518340 B2 JP3518340 B2 JP 3518340B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- accent
- reading
- words
- pose
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
方法及び装置及び読み韻律情報設定プログラムを格納し
た記憶媒体に係り、特に、日本語テキストに対して高精
度に読み韻律情報を付与し、自然で聞きやすい合成音声
を出力させるための読み韻律情報設定方法及び装置及び
読み韻律情報設定プログラムを格納した記憶媒体に関す
る。
混じりの日本語テキストに対して、読み、アクセント
(韻律上の基本単位であるアクセント句の設定とそのア
クセント型付与)、ポーズ等の読み韻律情報を設定し、
これらを元に音声波形を生成して合成音声を出力する。
自然で聞きやすい合成音声を出力するためには、この読
み韻律情報を正しく設定する必要がある。
の読みにより得られるため、形態素解析の精度が読みの
精度に直結する。但し、数量表現の読み(11本→ジュ
ーイッポン)と連濁化(子供+部屋→コドモベヤ)につ
いては、全てを単語として登録するのは困難であるた
め、規則により読みを付与する。数量表現の読みについ
ては、『宮崎:「日本文音声変換のための数値読み規
則」情報処理学会論文誌、Vol25, No.6 』、連濁化につ
いては、『佐藤:「複合語におけるアクセント規則と連
濁規則」,宮地他編、講座日本語と日本語教育2、日本
語の音声・音韻、明治書院等』等により、その手法がほ
ぼ確立されている。
は、『匂坂、佐藤:「日本語単語連鎖のアクセント規
則」、電子通信学会論文誌、Vol.J66-D,No.7の付属語ア
クセント結合規則、複合単語(自立語)のアクセント結
合規則、文節間アクセント結合規則』により、その手法
が確立されている。アクセント句境界とポーズの設定に
ついては、従来から多くの手法が提案されている。
は、係り受けの構造を利用する『箱田、佐藤:「文音声
合成における音調規則」、電子通信学会論文誌、Vol.J6
3-D,No.9』、右枝分かれ境界等の統語情報を用いる
『河井、広瀬、藤崎:「日本語文章音声の合成のための
韻律規則」日本音響学会誌、No.50, Vol.6』等がある。
また、統計的手法によるポーズの設定としては、係り受
け情報を利用した手法である『海木、匂坂:「局所的な
句構造によるポーズ挿入規則化の検討」電子情報通信学
会論文誌、Vol.J79-D-II,No.9 』が提案されている。
声合成のためのN文節構造解析とそれに基づく韻律制
御」電子情報学会論文誌、Vol.J78 D II, No.2』では、
N文節の品詞情報を用いて局所的な係り受け構造を推定
し、また、『藤尾、匂坂、樋口:「確率文脈自由文法を
用いた韻律句境界とポーズ位置の予測」電子情報通信学
会論文誌、Vol.J80D II, No.1 』では、品詞列を入力と
して確率文脈自由文法を用いて係り受けを学習し、アク
セント句境界とポーズの設定を行う。
スとした『宮崎、大山:「日本文音声出力のための言語
処理方式」情報処理学会論文誌、Vol.27,NO.11』(これ
及び先に参照した宮崎の論文の方式をまとめて、以後、
宮崎方式と呼ぶ)が提案されている。ここで、多段解析
法による形態素解析は、文字種の違いに着目して、仮に
設定した範囲内(仮文節)であらゆる単語の組み合わせ
を検定する局所総当たり法をベースとし、構文や意味の
情報が有効となる複合語解析や、同型語判別等には、部
分的に深く解析する。特に複合語においては、複合語を
構成する単語間の意味的結合関係を係り受けによって解
析を行う。この複合語内の意味的係り受け解析では、数
詞、固有名詞、接辞、用言性名詞、非用言性名詞など1
4種類の係り受け規則を用いる(宮崎:「係り受け解析
を用いた複合語の自動分割法」、情報処理学会論文誌、
Vol.25,No.6 )。
を用いて、文節内のアクセント、ポーズを高精度に設定
できる。
来のアクセント句境界とポーズの設定方式では、係り受
けなどの言語的情報が既知であることを前提としてお
り、これらの言語表現情報の取得方法については述べら
れていない。また、上記従来の『鈴木、斉藤:「日本語
テキスト音声合成のためのN文節構造解析とそれに基づ
く韻律制御」電子情報学会論文誌、Vol.J80D,II, No.1
』では、文節内の処理については言及しておらず、ま
た、藤尾、匂坂、樋口による方式では、文節内での設定
において、文節内構造の予測誤りによる精度の低下が問
題点として挙げられる。
た『宮崎:「係り受け解析を用いた複合語の自動分割
法」』では、格助詞相当語(について)等に対する認定
精度の低さが問題点として挙げられており、また、形態
素解析の単語認定単位は用言の活用語幹、語尾がそれぞ
れ1語として扱われる等、短単位での認定が行われてい
るため、特に、ポーズ付与を誤るという問題がある。例
えば、ポーズの付与において、アクセント句境界の前後
単語の品詞の情報が重要となるが、 「グランドで/運動する」 (/=アクセント句境
界) のアクセント句境界の直後は、 「運動:サ変名詞」+「する:サ変動詞活用形」 となり、本来、動詞である「運動する」が名詞の運動と
して扱われ、誤ってポーズを付与してしまう。
読み韻律情報の精度の向上に直結し、通常、長単位で単
語認定を行うことにより、形態素解析の精度は向上す
る。しかし、単に、長単位単語を認定するだけでは、そ
の長単位単語内でアクセント句境界が生じる場合等に対
応できない。また、従来、読み韻律情報を設定する多く
の方法において、現状では認定精度が十分ではなく、コ
ストのかかる文節間の係り受け解析を用いていたが、係
り受け解析の誤りに起因する誤りや、文節内のアクセン
ト、ポーズ付与に対する誤りが生じている。
低く、また、文節間のアクセント結合を行っていない、
複合語において、独立性の高い品詞(時詞等)は常に独
立で扱う等によるアクセント誤りが生じている。本発明
は、上記の点に鑑みなされたもので、宮崎方式をベース
として、形態素解析において、長単位で認定し、かつ、
読み韻律付与において、ディグレードを生じさせないた
めの単語辞書情報を保持し、それを利用すること、文節
間アクセント句結合等、アクセント付与のルールを追加
すること、ポーズ付与において、段階的にポーズを付与
する多段設定法を導入することにより、読み韻律情報の
精度を向上させ、自然で聞きやすい音声合成を行うこと
が可能な読み韻律情報設定方法及び装置及び読み韻律情
報設定プログラムを格納した記憶媒体を提供することを
目的とする。
説明するための図である。本発明は、漢字かな混じりの
日本語テキストを入力して、読み韻律情報を付与するテ
キスト解析を行い、読み韻律情報に基づいて合成音声を
生成する音声生成を行って、合成音声を出力する音声合
成方法におけるテキスト解析における読み韻律情報設定
方法において、テキスト解析手段が、1語で登録された
複合語内でアクセント句境界が存在する場合に対応す
る、複数のアクセント句に関する情報を格納できるアク
セント句情報、1語で登録され、付属語を含み、その内
部にアクセント句境界が存在する場合に対応する短単位
の単語に展開するための構成単語情報、1語で登録され
た複合語で内部にアクセント句境界は存在しないが、長
単位語であることを表すための語数を有する単語辞書を
用いて、該単語辞書では別々に登録されている用言の語
幹語尾を1語化し、格助詞相当語を連語として1まとま
りに認定する形態素解析を行い(ステップ1)、形態素
解析で単語認定するための情報に加え、単語辞書を用い
て、該形態素解析の結果を利用して読み付与(ステップ
2)、アクセント付与(ステップ3)、ポーズ付与を行
う(ステップ4)。
明は、漢字かな混じりの日本語テキストが入力される
と、読み韻律情報を付与するテキスト解析手段10と、
読み韻律情報に基づいて合成音声を生成する音声生成を
行う音声合成手段20とを有する音声合成システムにお
けるテキスト解析における読み韻律情報設定装置であっ
て、 テキスト解析手段10は、 1語で登録された複合語
ないでアクセント句境界が存在する場合に対応する、複
数のアクセント句に関する情報を格納できるアクセント
句情報、1語で登録され、付属語を含み、その内部にア
クセント句境界が存在する場合に対応する短単位の単語
に展開するための構成単語情報、1語で登録された複合
語で内部にアクセント句境界は存在しないが、長単位語
であることを表すための語数を有する単語辞書15と、
単語辞書15では別々に登録されている用言の語幹語尾
を1語化し、格助詞相当語を連語として1まとまりに認
定する形態素解析手段11と、単語辞書15を用いて形
態素解析手段11の結果を利用して、読みを付与する読
み付与手段12と、 単語辞書15を用いてアクセントを
付与するアクセント付与手段13と、 ポーズを付与する
ポーズ付与手段14と、を有する。
トが入力されると、読み韻律情報を付与するテキスト解
析ステップと、読み韻律情報に基づいて合成音声を生成
する音声生成を行う音声合成ステップとを有する音声合
成プログラムにおけるテキスト解析における読み韻律情
報設定プログラムを格納した記憶媒体であって、テキス
ト解析ステップは、1語で登録された複合語ないでアク
セント句境界が存在する場合に対応する、複数のアクセ
ント句に関する情報を格納できるアクセント句情報、1
語で登録され、付属語を含み、その内部にアクセント句
境界が存在する場合に対応する短単位の単語に展開する
ための構成単語情報、1語で登録された複合語で内部に
アクセント句境界は存在しないが、長単位語であること
を表すための語数を有する単語辞書では別々に登録され
ている用言の語幹語尾を1語化し、格助詞相当語を連語
として1まとまりに認定する形態素解析ステップと、形
態素解析で単語認定するための情報に加え、単語辞書を
用いて、形態素解析ステップの結果を利用して、読みを
付与する読み付与ステップと、単語辞書を用いてアクセ
ントを付与するアクセント付与ステップと、ポーズを付
与するポーズ付与ステップと、を有する。
て、形態素解析において、長単位で認定し、かつ、読み
韻律付与において、ディグレードを生じさせないための
単語辞書情報を保持し、それを利用すること、文節間ア
クセント句結合等、アクセント付与のルールを追加する
こと、ポーズ付与において、段階的にポーズを付与する
多段設定法を導入することにより、読み韻律情報の精度
を向上させ、自然で聞きやすい音声合成を行うことが可
能となる。つまり、テキスト解析において、多段解析法
を導入することにより、複合語の構造を反映した適切な
ポーズの設定が可能となる。
精度に読み韻律情報を付与し、自然で聞きやすい合成音
声を出力させることが可能となる。
定装置の構成を示す。同図に示す読み韻律情報設定装置
は、日本語テキストが入力されると、読み韻律情報に基
づいて形態素解析を行い、形態素解析で単語認定するた
めの情報に加え、読み韻律情報を設定するための情報を
もつ単語辞書を保持し、形態素解析結果を利用して読み
付与、アクセント付与及びポーズ付与を行うテキスト解
析部10及び音声生成部20より構成される。
1、読み付与部12、アクセント付与部13、ポーズ付
与部14及び単語辞書15から構成される。形態素解析
部11は、日本語テキストが入力されると、単語辞書1
5を参照して多段解析法に基づく形態素解析を行い、そ
の結果を読み付与部12に転送する。
は別々に登録されている用言の語幹語尾を1語化し、
「〜について」などの格助詞相当語等を連語として1ま
とまりに認定する。単語辞書15は、形態素解析部11
で用いる単語認定のための各構成単語の見出し長、品
詞、良い長を持つ構成単語情報に加えて、1語で登録さ
れた複合語内でアクセント句境界が存在する場合に対応
する、複数のアクセント句に関する情報を格納できるア
クセント句情報、1語で登録され、付属語を含み、その
内部にアクセント句境界が存在する場合に対応する、短
単位の単語に展開するための構成単語情報、1語で登録
された複合語で内部には、アクセント句境界は存在しな
いが、長単位語であることを表すための語数を有する。
て読みを付与する。アクセント付与部13は、複合語内
意味的係り受け情報及び単語辞書15を用いて宮崎方式
をベースとして、アクセント句境界及びアクセント型の
設定を行う。また、アクセント付与時に、結びつきの強
い文節間のアクセント結合を行う。ポーズ付与部14で
は、アクセント句境界及びアクセント型が設定されたも
のに複合語内等から段階的にポーズを設定していく多段
階設定法を導入してポーズ情報を付与する。当該多段階
設定法は、ポーズ付与において、記号に基づくポーズ付
与、日時表現、数量表現のポーズ付与、特定単語の組み
合わせによるポーズ付与、結合力に基づくポーズ付与、
ポーズ付与の補正からなる。
ズ、中ポーズ、大ポーズの4段階のポーズ情報を設定す
るものとする。音声生成部20は、テキスト解析部10
のポーズ付与部14から出力された、読み、アクセン
ト、及びポーズ情報が付与された読み韻律情報を取得
し、音声合成することにより合成音声を出力する。
に説明する。図4は、本発明の読み韻律情報設定方法を
説明するための図である。テキスト解析処理(ステップ
100)における、形態素解析(ステップ110)で
は、単語辞書15を用いて、宮崎方式の多段解析法に基
づく形態素解析を行う。但し、読み韻律付与処理(ステ
ップ120)に対応した長単位認定として、形態素解析
部11、単語辞書15に対して、次の4項目の拡張を行
った。
辞書15には、規則的な活用を行う用言は、不変化部分
(例:似)と変化部分(例:る、れ、ろ)に分離し、そ
れぞれ1単語として登録している。また、サ変名詞(運
動)が、サ変動詞(運動する)の一部を構成する場合が
あるが、単語辞書15上は、サ変動詞型名詞(運動)と
サ変動詞活用形(する)のみを登録し、語幹語尾をまと
めた単語(運動する)としては、登録していない。しか
し、ポーズ付与部13においては、アクセント句境界前
後の品詞情報が重要となるため、単語認定後、「用言不
変化部分+変化部分」、「用言性名詞+活用語尾」をま
とめて一語に統合する。これにより、例えば、「運動す
る」を一語のサ変動詞、「大幅に」を一語の形容動詞と
して扱う。この語幹語尾の1語化は、アクセント、ポー
ズ付与に悪影響を与えないため、読み韻律付与用の特別
な情報は、保持しない。
境界を持つ複合語における読み韻律付与への対処であ
る。単語辞書15に登録する単語の単位は、原則的には
語基や接辞などの短単位語であり、複合語などの長単位
語は、短単位語組み合わせとみなす。但し、短単位語か
ら長単位語の意味を読みなどを合成できない複合語や一
部の固有名詞など、例外的に長単位で登録しているもの
も存在する。ここで、長単位の複合語においては、その
内部の特定の位置にアクセント句境界が設定される場合
がある。
章 (/:アクセント句境界) しかし、「勲一等瑞宝章」が1単語として設定される
と、その内部にアクセント句境界を設定できない。そこ
で、単語辞書情報の一つであるアクセント句情報を最大
3アクセント句分保持する。アクセント句情報は、各ア
クセントに対するモーラ数、読み長(読みの表記上の長
さ)、アクセント型の情報をもつ。例えば、短単位語の
「日本」のアクセント句情報は、 第1アクセント句:モーラ数=3、読み長=3、アクセ
ント型=2 第2、3アクセント句:なし となり、長単位語の「君一等瑞宝章」(3アクセント
句)は、 第1アクセント句:モーラ数=2、読み長=2、アクセ
ント型=1(勲) 第2アクセント句:モーラ数=4、読み長=4、アクセ
ント型=0(一等) 第3アクセント句:モーラ数=6、読み長=7、アクセ
ント型=3(瑞宝章) となる。この情報により、「勲/一等/瑞宝章」と正し
くアクセント句境界が設定できる。
解析法による形態素解析において、比較的認定精度の低
かった格助詞相当語(彼について)や補助用言(話して
いる)の認定精度を向上させるために、「助詞+補助用
言」(て+いる)や格助詞相当語(に+つい+て)を連
語として登録して認定を行う。但し、これらの連語内で
アクセント句が分割される場合等があるため、(カ’レ
ニ/ツ’イテ/:アクセント句境界、’:アクセント位
置)、アクセント、ポーズ付与時に、連語を1単語とし
て扱うのは問題がある。ここで、長単位で、内部にアク
セント句境界を生じる複合語に対してはアクセント句情
報を最大3アクセント句分保持することで対応したが、
連語を構成する単語は殆どの場合付属語を含むので、ア
クセント句情報では対応できない。これは、匂坂、佐藤
「日本語単語連鎖のアクセント規則」で述べられている
ように、付属語は、前方の自立語の品詞別に異なるアク
セント結合様式を持ち、この結合様式を用いて巡回的に
アクセント型が決定するためである。このため、単語辞
書15に各構成単語の見出し長、品詞、読み長を持つ構
成単語情報を保持し、形態素解析で1語と認定された単
語を、構成単語情報に基づいて、辞書検索を行い、アク
セント、ポーズ付与時には、短単位に展開しておく。こ
のように、アクセント、ポーズ付与時に、短単位に展開
した情報を用いるため、正しくアクセント句境界、アク
セント型が設定できる。
み長=1 第4は、内部にアクセント句境界を持たない複合語にお
ける読み韻律付与への対処である。内部にアクセント句
境界を持たない複合語は、その複合語が単独で出てきた
場合には問題はないが、他の語と連接して複合語を形成
している場合に、短単位語と同様に扱うアクセント句境
界の設定を誤る。
の場合 形態素解析結果:為替相場+速報+サービス(3単語扱
い、実際は4単語)→×「為替相場速報サービス」とア
クセント句境界が設定されない。 (○為替相場/速報サービス) そこで、単語辞書情報として、登録単語を構成する単語
数を表す語数をもつ。例えば、「為替相場(2)+速報
(1)+サービス(1)」(かっこ内の数字が語数を表
す)では、形態素解析の認定単語数は3語であるが、語
数により4語からなる複合語であることがわかり、「為
替相場/速報サービス」と正しくアクセント句境界が設
定できる。
辞書15では、単語認定に用いる情報の他に、読み韻律
情報を設定するための多くの情報を保持している。図5
は、本発明の読み韻律情報設定用単語辞書情報の例を示
す。同図における種類で、共通情報は、読み韻律情報設
定のための全処理で利用する共通情報、読み付与用情報
は、数量表現の読みの補正、連濁化のための情報を持
つ。アクセント句境界設定用情報は、複合語の内部構造
を表すための各種フラグ、及び韻律的な特徴を表すフラ
グ、アクセント型設定用情報は、アクセント的特徴を示
す各種フラグ、ポーズ設定用情報は、助詞を構文的に分
類した助詞ポーズ属性を持つ。
方式をそのまま利用する。ステップ130のアクセント
付与処理では、複合語内意味的係り受け情報及び図5の
単語辞書情報を用いて、宮崎方式をベースとして、アク
セント句境界及びアクセント型の設定を行う。ここで、
宮崎方式では、文節間のアクセント結合を行っていない
(文節境界をすべてアクセント句境界としている)。こ
れは、文節間のアクセント結合を行わなくても、その2
つのアクセント句を強く結び付ける(ポーズを入れず、
後続アクセント句を抑圧する=強結合)ことで、実用上
十分と判断しているからである。しかし、次に示す、結
びつきの強い文節間においては、強結合としても不自然
に感じるという実験結果が得られたため、アクセント結
合を行う。 ・指示副詞+用言: 例:そう(指示副詞)+思う(動詞)→アクセント句:
そう思う ・連体詞+名詞(≠複合語): 例:この(連体詞)+会議(名詞)→アクセント句:こ
の会議 cf. この(連体詞)+国際(名詞)+会議(名詞)
→アクセント句:この/国際会議 また、複合語内のアクセント句境界設定において、宮崎
方式では、独立性の高い時詞は、常に独立のアクセント
句としていたが、特願平7−115925「合成音声出
力方法及び装置」に示す方法に基づいて、時詞のアクセ
ント句境界を設定する。
セント句:正月番組で 今日(時詞)+番組(一般名詞)+で(格助詞)→アク
セント句:今日/番組で さらに、自立語アクセント結合において、付属語アクセ
ント結合における副次アクセントと同様の現象が存在す
る。例えば、 神奈川等:カナ’ガワ/ト’ー 大阪等:オーサカト’ー のように、先行語が「神奈川」のようにアクセントをも
つ語の場合には、副次アクセントを持つ。そこで、自立
語でも付属語と同様に、副次アクセント属性をもつ語を
設定し、副次アクセントに対応する。
内等から段階的にポーズを設定していく多段階設定法を
導入する。多段階設定法では、はじめに、時間・数量表
現や固有名詞複合語など、独立に扱うことができ、その
構造が複合語内意味的係り受け情報より得られる局所構
造内のアクセント句境界、及び句読点の直後など、必ず
ポーズが入る(入らない)アクセント句境界に対してポ
ーズの有無を設定する。ここで、すべてのアクセント句
境界にポーズの有無が設定されるが、あるモーラ長以上
連続してポーズが設定されていない連続アクセント句例
(ポーズ未設定区間)に対しては、結合力を用いてポー
ズ付与のための補正を行う。結合力の値は、1〜10の
10段階(値が大きいほど結合力が強い)であり、アク
セント句境界の前後アクセント句の係り受けがあり得な
い場合(例:用言連用形<アクセント句境界>名詞)で
は、極端に値を小さく、逆に係り受けが生じる可能性が
高い場合(例:用言連体形<アクセント句境界>名詞)
では大きく設定している。
従来手法では精度の低かった複数アクセント句からなる
複合語内の設定においても、その内部構造を反映した適
切なポーズの設定が可能となり、また、文節間の係り受
け解析を用いなくても、結合力により近似的に係り受け
構造を推定し、結合力の強さとポーズ未設定区間のモー
ラ数に応じて段階的にポーズを付与していくので、実用
上十分な精度でポーズを設定できる。この多段階解析法
は、図6に示す5つのステップにより構成される。ここ
では、ポーズなし、小ポーズ、中ポーズ、大ポーズの4
段階のポーズ情報を設定するとする。
ーズ付与のフローチャートである。 ステップ141) 記号に基づくポーズ付与では、アク
セント句末尾が句読点等の記号の場合、その直後アクセ
ント句境界に対して、ポーズを設定する。句点、感嘆
符、疑問符の場合は、大ポーズ、読点、開きかっこには
中ポーズ、その他の中点以外の記号には小ポーズを設定
する。
ポーズ付与では、日時表現、数量表現に対してポーズ付
与を行う。日時表現は、その表現を年要素、月要素、日
要素に分類し、この出現パターンによりポーズの有無を
付与する。 例: [小ポーズ]年要素[小ポーズ]月要素[ポーズなし]
日要素:→会議は[小ポーズ]平成10年[小ポーズ]
6月[ポーズなし]1日から[小ポーズ]月要素[ポー
ズなし]日要素: →会議は[小ポーズ]6月[ポーズなし]1日から数量
表現は、宮崎方式において、 (前置助数詞)+(符号)+数詞+(助数詞)+(接
辞) 但し、()は省略可を表す。と、定義された表現であ
る。この数量表現のパターンやその前後アクセント句の
品詞に応じて、数量表現内及び、その前後のポーズ有無
を設定する。
(+助数詞)アクセント句→[小ポーズ]第[小ポー
ズ]百/二十/三回 [小ポーズ]前置助数詞[ポーズなし]1つの数詞(+
助数詞)アクセント句→[小ポーズ]第[ポーズなし]
三回 ステップ143) 特定単語の組み合わせによるポーズ
付与では、連続する2または、3アクセント句の品詞等
の単語情報を参照し、常にポーズを付与すべき(付与す
べきでない)境界にポーズの有無を設定する。
など[小ポーズ]事実審理が/始まります。 ステップ144) 結合力に基づくポーズ付与では、ス
テップ141〜143でポーズ有無が設定されなかった
アクセント句境界に対し、アクセント句境界前後の単語
の品詞等により得られる結合力を用いてポーズの有無を
設定する。
セント句境界の直前単語を図7に示す分類P1〜P11
の11種類、直後単語を図8に示す分類N1〜N7の7
種類に分類する。これらは、品詞の構文的性質(例:P
3=連体修飾をする用言)、及び独立性という2つの観
点により分類を行ったものである。このため、直前単語
の分類においては、助詞を単語辞書情報の助詞ポーズ属
性(構文的性質と独立性により助詞を分類)により5種
類に細分類する。
=1〜7)の組み合わせマトリックスにより決定する
(但し、連語から分類された単語の境界には、無条件に
結合力最大値(10)を与える)。この組み合わせマト
リックスの各値は、PiとNjの構文的な性質(係り受
けがあり得る、あり得ない)、及び、それぞれの独立
性、さらに、係り受けがあり得る組み合わせにおいて
は、その韻律的特徴(アクセント句のモーラ長や複合語
の複数アクセント句化など)を考慮して経験的に設定し
ている。ここでは、Pi×N7の組み合わせマトリック
スのみを図9に示して具体的に説明する。
P11の場合は、このアクセント句境界の直前文節が直
後文節にかかる連体修飾関係となる可能性が高いため、
図10に示すように、直後アクセント句等の条件に応じ
て結合力を変える。図9の項番1は、直後が複数アクセ
ント句からなる複合語である場合を表しており、この場
合は、連体修飾関係が成立しても、アクセント句単位の
構造としては、右枝分かれの構造となる場合が殆どであ
るため、結合力を最小とする。例えば、「昨年/成立し
た/(A)/男女/雇用機会/均等法」(/:アクセン
ト句境界)では、文節単位の構造としては、「成立し
た」→「男女雇用機会均等法」と係り受けが成立する
が、アクセント句単位の構造としては、「成立した」→
「均等法」となり、(A)は右枝分かれ境界となる。
与の補正でも利用するため、ステップ141〜ステップ
143で既に「ポーズなし」を設定しているアクセント
句境界に対しても求めておく(但し、ポーズ有無の設定
は行わない)。但し、これらのアクセント句境界に対し
ては、得られた結合力に10を加算する。これは、ステ
ップ141〜ステップ143で設定されるポーズ有無を
ステップ144で設定されるポーズ有無より信頼性が高
いと考えるためである。
しては、結合力=1となるアクセント句境界に小ポー
ズ、それ以外のアクセント句境界には、ポーズなしを付
与する。 ステップ145) ポーズ付与の補正では、あるモーラ
以上ポーズが設定されていない場合(このポーズが設定
されていない区間をポーズ未設定区間と呼ぶ)に、結合
力を用いてポーズを設定する。ここでは、ポーズ未設定
区間の長さと、ステップ144で設定した結合力の強さ
により、図11に示すフローチャートのように、段階的
にポーズを付与する。
より長いか判断する。長い場合にはステップ1452に
移行する。20モーラ以下の場合には処理を終了する
(ポーズ付与の補正を行わない)。 ステップ1452) ポーズ未設定区間長が30モーラ
以下かを判定する。30モーラ以下の場合には、ステッ
プ1455に移行し、それ以外の場合にはステップ14
53に移行する。
先頭から第5モーラ目から末尾から5モーラ目の間で、
結合力6以下のアクセント句境界があるか判定する。条
件を満たす場合には、ステップ1456に移行し、それ
以外の場合にはステップ1454に移行する。 ステップ1454) ポーズ未設定区間の先頭から第2
モーラ目から末尾から2モーラ目の間で結合力が最小と
なるアクセント句境界に小ポーズを設定し、処理を終了
する。
先頭から第5モーラ目から末尾から5モーラ目の間で、
結合力3以下のアクセント句境界があるか判定する。条
件を満たす場合にはステップ1456に移行し、それ以
外の場合には処理を終了する。 ステップ1456) ポーズ未設定区間の先頭から第5
モーラ目から末尾から5モーラ目の間で結合力最小のア
クセント句境界に小ポーズを設定し、処理を終了する。
ズ未設定区間に対しても、ポーズ付与が行われなくなる
まで、再帰的に図11の処理を行う。図11のフローチ
ャートにより、ポーズ未設定区間長が20モーラ以上3
0モーラ未満と、ポーズが挿入されなくてもあまり不自
然でない長さの場合には、結合力が弱い(3以下)アク
セント句境界が存在した場合にのみポーズを付与し、ポ
ーズ未設定区間長が30モーラ以上と、ポーズがなけれ
ば不自然となる長さを越えた場合には、必ずポーズを設
定するという2段階のポーズ付与の補正を行うものであ
る。
例を示して説明する。図12は、本発明の一実施例の読
み韻律情報設定の具体例を示す。まず、ステップ110
の形態素解析により、文が単語に分割される。ここで、
「放射性」は一単語として認定されているが、その単語
辞書情報の語数=2であり、2語からなる語であること
が分かる。また、「について」も一単語として認定され
ているが、その単語辞書情報の構成単語情報により、
「に/つい/て」と3単語に展開される。
()で示す読みが付与される(図12ではひらがな部分
は()を省略したが、同様に読みが付与される)。ここ
で、数量表現である「三十日」は宮崎方式に示される数
値の読み付与規則により、その他の読みは、単語辞書情
報の読みにより、読みが付与される。次に、ステップ1
30のアクセント付与により、アクセント句境界とアク
セント句のアクセント型が設定される。
「等」が3型アクセントをもつ「対応策」に後続してい
るため、「対応策/等」と2つのアクセント句に分かれ
ている。また、「放射性」の語数=2という情報を利用
して、「放射性/廃棄物」と、正しくアクセント句境界
が設定されている。次に、ステップ140のポーズ付与
により、ポーズが付与される。
くポーズ付与により、[A]の位置に中ポーズが付与さ
れる。次に、ステップ142により、日時表現・数量表
現のポーズ付与において、「先月/三十日に」が月要素
+日要素となるため、[小ポーズ]先月[ポーズなし]
三十日にと設定される。
わせによるポーズ付与は、本例では存在しないので、説
明を省略する。そして、ステップ144により、結合力
に基づくポーズ付与により、結合力=1である[C]の
位置に小ポーズを、それ以外のポーズ有無未設定のアク
セント句境界に、ポーズなしを付与する。
正により、ポーズ未設定区間「日本海などでの共同調査
の方法や今後の対応策等について協議が行われまし
た。」(50モーラ)において、図11のステップ14
51→ステップ1452→ステップ1453→ステップ
1456と移行し、ステップ1456において、最小結
合力3を持つ[D]に小ポーズが付与される。
設定区間、「日本海などでの共同調査の方法や」、「今
後の対応策等について協議が行われました。」は共に2
0モーラ以上30モーラ未満であるが、結合力3以下の
アクセント句境界は存在しないので、これ以上ポーズを
付与しない。同様に、ポーズ未設定区間「放射性廃棄物
の海洋投棄に関する」(23モーラ)は、図11のステ
ップ1451→ステップ1452→ステップ1455と
移行し、結合力3以下のアクセント句境界が存在しない
ので、ポーズを付与しない。
図11に示す動作及び、図3に示す装置構成をプログラ
ムとして構築し、読み韻律情報設定装置として利用され
るコンピュータに接続されるディスク装置、フロッピー
ディスクやCD−ROM等の可搬記憶媒体に格納してお
き、本発明を実施する際にインストールすることにより
容易に本発明を実現できる。
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
の係り受け解析を行わなくても、多段解析法に基づく形
態素解析結果を用いて、高精度で読み韻律情報を設定で
きるようになる。
る。
の図である。
例である。
ローチャートである。
である。
を示す図である。
である。
例である。
Claims (3)
- 【請求項1】 漢字かな混じりの日本語テキストを入力
して、読み韻律情報を付与するテキスト解析を行い、読
み韻律情報に基づいて合成音声を生成する音声生成を行
って、合成音声を出力する音声合成方法におけるテキス
ト解析における読み韻律情報設定方法において、テキスト解析手段が、1語で登録された複合語内でアク
セント句境界が存在する場合に対応する、複数のアクセ
ント句に関する情報を格納できるアクセント句情報、1
語で登録され、付属語を含み、その内部にアクセント句
境界が存在する場合に対応する短単位の単語に展開する
ための構成単語情報、1語で登録された複合語で内部に
アクセント句境界は存在しないが、長単位語であること
を表すための語数を有する単語辞書を用いて、該単語辞
書では別々に登録されている用言の語幹語尾を1語化
し、格助詞相当語を連語として1まとまりに認定する 形
態素解析を行い、 前記形態素解析で単語認定するための情報に加え、前記
単語辞書を用いて、該形態素解析の結果を利用して読み
付与、アクセント付与、ポーズ付与を行うことを特徴と
する読み韻律情報設定方法。 - 【請求項2】 漢字かな混じりの日本語テキストが入力
されると、読み韻律情報を付与するテキスト解析手段
と、読み韻律情報に基づいて合成音声を生成する音声生
成を行う音声合成手段とを有する音声合成システムにお
けるテキスト解析における読み韻律情報設定装置であっ
て、 前記テキスト解析手段は、 1語で登録された複合語ないでアクセント句境界が存在
する場合に対応する、複数のアクセント句に関する情報
を格納できるアクセント句情報、1語で登録され、付属
語を含み、その内部にアクセント句境界が存在する場合
に対応する短単位の単語に展開するための構成単語情
報、1語で登録された複合語で内部にアクセント句境界
は存在しないが、長単位語であることを表すための語数
を有する単語辞書と、 前記単語辞書では別々に登録されている用言の語幹語尾
を1語化し、格助詞相当語を連語として1まとまりに認
定する形態素解析手段と、 前記単語辞書を用いて前記形態素解析手段の結果を利用
して、読みを付与する読み付与手段と、 前記単語辞書を用いてアクセントを付与するアクセント
付与手段と、 ポーズを付与するポーズ付与手段と、を有することを特
徴とする 読み韻律情報設定装置。 - 【請求項3】 漢字かな混じりの日本語テキストが入力
されると、読み韻律情報を付与するテキスト解析ステッ
プと、読み韻律情報に基づいて合成音声を生成する音声
生成を行う音声合成ステップとを有する音声合成プログ
ラムにおけるテキスト解析における読み韻律情報設定プ
ログラムを格納した記憶媒体であって、 前記テキスト解析ステップは、 1語で登録された複合語ないでアクセント句境界が存在
する場合に対応する、複数のアクセント句に関する情報
を格納できるアクセント句情報、1語で登録され、付属
語を含み、その内部にアクセント句境界が存在する場合
に対応する短単位の単語に展開するための構成単語情
報、1語で登録された複合語で内部にアクセント句境界
は存在しないが、長単位語であることを表すための語数
を有する単語辞書では別々に登録されている用言の語幹
語尾を1語化し、格助詞相当語を連語として1まとまり
に認定する形態素解析ステップと、 前記形態素解析で単語認定するための情報に加え、前記
単語辞書を用いて、前記形態素解析ステップの結果を利
用して、読みを付与する読み付与ステップと、 前記単語辞書を用いてアクセントを付与するアクセント
付与ステップと、 ポーズを付与するポーズ付与ステップと、を有すること
を特徴とする読み韻律情報設定プログラムを格納した記
憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15460598A JP3518340B2 (ja) | 1998-06-03 | 1998-06-03 | 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15460598A JP3518340B2 (ja) | 1998-06-03 | 1998-06-03 | 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11344998A JPH11344998A (ja) | 1999-12-14 |
JP3518340B2 true JP3518340B2 (ja) | 2004-04-12 |
Family
ID=15587843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15460598A Expired - Lifetime JP3518340B2 (ja) | 1998-06-03 | 1998-06-03 | 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3518340B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8606583B2 (en) | 2008-08-13 | 2013-12-10 | Nec Corporation | Speech synthesis system for generating speech information obtained by converting text into speech |
US8620663B2 (en) | 2008-08-13 | 2013-12-31 | Nec Corporation | Speech synthesis system for generating speech information obtained by converting text into speech |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4559950B2 (ja) * | 2005-10-20 | 2010-10-13 | 株式会社東芝 | 韻律制御規則生成方法、音声合成方法、韻律制御規則生成装置、音声合成装置、韻律制御規則生成プログラム及び音声合成プログラム |
JP5975033B2 (ja) * | 2011-07-11 | 2016-08-23 | 日本電気株式会社 | 音声合成装置、音声合成方法および音声合成プログラム |
JP7494935B2 (ja) * | 2020-11-02 | 2024-06-04 | 日本電信電話株式会社 | 推定装置、推定方法、および、推定プログラム |
-
1998
- 1998-06-03 JP JP15460598A patent/JP3518340B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8606583B2 (en) | 2008-08-13 | 2013-12-10 | Nec Corporation | Speech synthesis system for generating speech information obtained by converting text into speech |
US8620663B2 (en) | 2008-08-13 | 2013-12-31 | Nec Corporation | Speech synthesis system for generating speech information obtained by converting text into speech |
Also Published As
Publication number | Publication date |
---|---|
JPH11344998A (ja) | 1999-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dutoit | High-quality text-to-speech synthesis: An overview | |
US7263488B2 (en) | Method and apparatus for identifying prosodic word boundaries | |
US20040167771A1 (en) | Method and system for reducing lexical ambiguity | |
US8392191B2 (en) | Chinese prosodic words forming method and apparatus | |
CN108470024B (zh) | 一种融合句法语义语用信息的汉语韵律结构预测方法 | |
JP2007265458A (ja) | 複数の圧縮オプションを生成する方法およびコンピュータ | |
US6477495B1 (en) | Speech synthesis system and prosodic control method in the speech synthesis system | |
Oo et al. | Burmese speech corpus, finite-state text normalization and pronunciation grammars with an application to text-to-speech | |
Arısoy et al. | A unified language model for large vocabulary continuous speech recognition of Turkish | |
Palmer et al. | Information extraction from broadcast news speech data | |
JP3518340B2 (ja) | 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体 | |
JP3071804B2 (ja) | 音声合成装置 | |
JP3441400B2 (ja) | 言語変換規則作成装置、及びプログラム記録媒体 | |
JP3009636B2 (ja) | 音声言語解析装置 | |
El-Imam et al. | Rules and algorithms for phonetic transcription of standard Malay | |
Meng et al. | CU VOCAL: corpus-based syllable concatenation for Chinese speech synthesis across domains and dialects. | |
Akinwonmi | Development of a prosodic read speech syllabic corpus of the Yoruba language | |
Anberbir et al. | Grapheme-to-phoneme conversion for Amharic text-to-speech system | |
Xydas et al. | Text normalization for the pronunciation of non-standard words in an inflected language | |
Arısoy et al. | Turkish dictation system for broadcast news applications | |
Gros et al. | SI-PRON pronunciation lexicon: a new language resource for Slovenian | |
KR20230155156A (ko) | 통합 토크나이저를 갖는 음성 이해 시스템 및 상기 음성 이해 시스템에서의 통합 토큰화 방법 | |
JP3029403B2 (ja) | 文章データ音声変換システム | |
JP3638000B2 (ja) | 音声出力装置及び音声出力方法並びにその記録媒体 | |
JPH05134691A (ja) | 音声合成方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090206 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090206 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100206 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110206 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110206 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 9 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |