JP3248552B2

JP3248552B2 - テキスト音声合成方法およびこの方法を実施する装置

Info

Publication number: JP3248552B2
Application number: JP03452994A
Authority: JP
Inventors: 久子阿部; 永小原
Original assignee: Nippon Telegraph and Telephone Corp; NTT Inc USA
Current assignee: NTT Inc; NTT Inc USA
Priority date: 1994-03-04
Filing date: 1994-03-04
Publication date: 2002-01-21
Anticipated expiration: 2017-01-21
Also published as: JPH07244495A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、テキスト音声合成方
法およびこの方法を実施する装置に関し、特に、漢字か
な混じりの日本語文章の内の特にニュースにおいて読み
上げる原稿であるニュース文を合成音声により読み上げ
るに好適なテキスト音声合成方法およびこの方法を実施
する装置に関する。

【０００２】

【従来の技術】新聞記事、電子メールその他の漢字かな
混じりの日本語文章をテキスト音声合成装置により電子
化して合成音声により読み上げるには、漢字かな混じり
文に読みをふり、アクセント句、ポーズその他の韻律情
報を設定する必要がある。現在、この様なテキスト音声
合成装置は実用化されているが、この合成音声には実際
の人間の発話音声と比較して不自然さが残る。この不自
然さは韻律情報の設定精度の問題である。

【０００３】ここで、韻律情報には、アクセント句情
報、ポーズ情報、アクセント句接続情報その他の情報が
あり、以下これらの特徴について説明する。アクセント
句とは、自然に話をした場合に一つのまとまりとして発
声する単位であり、ピッチパタン（基本周波数Ｆ₀ の時
間パタン、文全体の自然下降を表す話調成分とアクセン
ト句に関係するアクセント句成分の重畳）上に表現され
る。日本語東京方言においてはアクセント核（基本周波
数が急激に下がり始めるモーラ）を最大１個有する単位
と定義され、一般には複数の単語（２〜３単語）から成
る。また、１語が複数のアクセント句に分割される場合
もある。複数の単語によりアクセント句が構成される場
合は、各単語のアクセント型の消失、移動その他の音韻
情報の変移が生起するので、アクセント句としてのアク
セント型の設定をしなければならない。アクセント句情
報は、各アクセント句の範囲と、アクセント型の情報を
有する。

【０００４】ポーズとは、統語・意味的影響および発声
上の制約である息継ぎに基づいてアクセント句とアクセ
ント句との間に設定される適度な間隔と長さの時間であ
る。ポーズ情報は、各アクセント句間に対してポーズの
有無、ポーズ有の場合はポーズ長に関する情報を有す
る。アクセント句接続とは、隣接するアクセント句を相
対的にどの様に接続するかを表すものである。ここで、
或るアクセント句Ａ_iのアクセント成分最大値が直前の
アクセント句Ａ_i-1 と比較して小さい場合、Ａ_iを「抑
圧（アクセント句）」といい、大きい場合を「非抑圧
（アクセント句）」という。そして、Ａ_iが「抑圧」な
らば、Ａ_i-1 とＡ_iは「抑圧接続」、Ａ_iが「非抑圧」
ならば、Ａ_i-1とＡ_iは「非抑圧接続」であるという。
アクセント句接続情報は、各アクセント句間に対して、
直前と直後のアクセント句が「抑圧接続」であるか「非
抑圧接続」であるかという情報を有する。

【０００５】アクセント句接続は、統語構造の影響を大
きく受けることが指摘されている。一般に、或る文節Ｂ
_iが直後の文節Ｂ_i+1 に係る左枝分かれ構造の場合は文
節境界前後のアクセント句は「抑圧接続」、文節Ｂ_iが
文節Ｂ_i+1 に係らない右枝分かれ構造の場合は「非抑圧
接続」になる。このために、従来の音声合成装置におい
ては、アクセント句接続情報設の設定に、形態素解析に
より出力される単語情報（例えば品詞、モーラ数、アク
セント型）、および係り受け解析により出力される文節
間の係り受け情報（例えば文節間の係り受けの距離、係
り受け関係）という様な統語情報を利用している。例え
ば、文献「箱田他文章音声の音調結合型導出規則の検
討音声研究会ＳＰ８９−５」においては、係り受け
の距離（分離度）、句読点、係り受け関係、文節長、文
節位置を利用してポーズ情報、アクセント句接続情報
（ここにおいては、ポーズ情報とアクセント句接続情報
とをまとめて音調結合型という）を設定している。

【０００６】しかし、ポーズ、アクセント句接続は、意
味構造、談話構造の影響を受けることが指摘されてい
る。例えば、文献「郡、プロソディーの自律性言語Ｖ
ｏｌ．２１，Ｎｏ．９，１９９２」においては、修飾・
被修飾の関係にある隣接する２文節において、修飾部が
被修飾部を限定している場合は「抑圧接続」、修飾語が
被修飾語を限定していない場合は「非抑圧接続」になる
ことを示している。以下にその例を示す。

【０００７】（１）京都の＜抑圧接続＞陶器をじ
っくり見ました。（２）京都の＜非抑圧接続＞東寺をじっくり見
ました。（１）は、「京都の」は「陶器」を限定しているので
「抑圧接続」となる。（２）は、「京都の」は「東寺」
を限定しておらず、単に付加的な情報に過ぎないので
「非抑圧接続」となる。

【０００８】しかし、ここにおいて、修飾・被修飾関係
にある隣接する２文節において、修飾部が被修飾部を限
定している場合（これを限定修飾関係とする）および、
修飾部が被修飾部を限定していない場合（これを非限定
修飾関係とする）について、これら両者の定義が定まっ
ておらず、判別の仕方の説明はなされていない。ところ
で、当該出願の発明者が先に出願した特願平５−３０２
５０２号明細書には、「ＡのＢ」という表現に限った非
限定修飾関係の抽出方法が開示されている。ここにおい
ては、従来、判然とされてはいなかった限定関係および
非限定関係について、次の如く定義して話を進めた。即
ち、Ｂを含む集合の中からＢがＡにより特定される修飾
関係にある関係、を限定関係にあると定義し、これに対
して、Ｂを含む集合にはＢしか存在せず、Ａがなくても
Ｂを特定することができ、ＡはＢに何らかの情報を付加
的に説明する修飾関係にある関係、を非限定関係にある
と定義した。しかし、その他の修飾表現についての抽出
方法は説明されていない。

【０００９】

【発明が解決しようとする課題】従来のアクセント句接
続情報の設定においては、言語情報として主として枝分
かれ構造が利用されている。そして「ＡのＢ」という修
飾・被修飾表現に関しては非限定修飾関係も利用されて
いるが、その他の修飾表現は利用されていない。以上の
様な事情から、従来のアクセント句接続情報の設定技術
においては、以下の（ａ−１）および（ａ−２）の場合
は正しくアクセント句接続情報の設定をすることができ
るが、（ｂ−１）および（ｂ−２）の場合は正しくアク
セント句接続情報の設定をすることができない。

【００１０】（ａ−１）アメリカの＜抑圧接続＞
大統領（ａ−２）アメリカの＜非抑圧接続＞ロサンゼル
ス空港（ｂ−１）食器などの原料となる＜抑圧接続＞メ
ラミン（本来は非抑圧接続）（ｂ−２）９２年に行われた＜抑圧接続＞バルセ
ロナオリンピック（本来は非抑圧接続）（ａ−１）は、「アメリカの」が直後の「大統領」に係
り（左枝分かれ構造）、これを限定しているので抑圧接
続となる。（ａ−２）は、「アメリカの」が直後の「ロ
サンゼルス空港」に係り（左枝分かれ構造）、これを限
定していない「ＡのＢ」表現であるので非抑圧接続とな
る。

【００１１】これに対して、（ｂ−１）、（ｂ−２）は
共に修飾部が被修飾部を限定しない非限定修飾関係であ
るが、「ＡのＢ」という表現ではないので「非抑圧接
続」であるにも係わらずその旨の設定をすることができ
ない。限定・非限定修飾関係を区別するには、本来、深
い意味解析、文脈解析をすることが必要とされる。しか
し、これらの解析は負担が大きく、精度も現状において
は必ずしも高いとはいえない。

【００１２】ここで、この発明は、音声合成の対象とす
る文章をニュースの文章に特定し、その文節が連体修飾
関係が限定修飾関係であるか非限定修飾関係であるかを
ニュース文章の表現特徴により判定する構成を具備し
て、上述の（ｂ−１）および（ｂ−２）の様な連体非限
定修飾関係にある２文節間にアクセント句境界がある場
合のアクセント句接続の自然性を向上させるテキスト音
声合成方法およびこの方法を実施する装置を提供するも
のである。

【００１３】

【課題を解決するための手段】入力される漢字かな混じ
り文の隣接する文節間の連体修飾関係が限定修飾関係で
あるか或は非限定修飾関係であるかを判定して連体非限
定修飾関係にある２文節間にアクセント句境界がある場
合のアクセント句接続の自然性を向上させるテキスト音
声合成方法を構成した。

【００１４】そして、上述したテキスト音声合成方法に
おいて、隣接する２文節が連体修飾・被修飾表現である
か否かを判定して、隣接する２文節が連体修飾・被修飾
表現ではない場合は統語情報のみを使用してアクセント
句接続情報設定処理を行うと共に、隣接する２文節が連
体修飾・被修飾表現である場合はその修飾・被修飾表現
が限定修飾関係であるか非限定修飾関係であるかを判定
してアクセント句接続情報設定処理を行うテキスト音声
合成方法を構成した。

【００１５】また、上述のテキスト音声合成方法におい
て、入力される漢字かな混じり文をニュース文とするテ
キスト音声合成方法を構成した。更に、入力される漢字
かな混じり文（１）について単語を認定すると共に各単
語の単語情報を求める形態素解析処理部（２−１）およ
び文節を認定すると共に文節間の係り受け情報を求める
係り受け解析処理部（２−２）より成る言語解析処理部
（２）を具備し、言語解析処理結果の出力である単語情
報・係り受け情報付き分かち書き単語列（３）について
文の読みを表すカナ列を生成する読み付与処理部（４−
１）と、カナ列をアクセント句単位に分割しアクセント
句のアクセント型を設定するアクセント句情報設定処理
部（４−２）と、各アクセント句間にアクセント句接続
情報を設定するアクセント句接続情報設定処理部（４−
３）と、各アクセント句間にポーズ情報を設定するポー
ズ情報設定処理部（４−４）とより成る読み・韻律情報
設定処理部（４）を具備し、アクセント句接続情報設定
処理部（４−３）は、隣接する２文節が連体修飾・被修
飾表現であるか否かを判定する連体修飾表現判定処理部
［７］と、隣接する２文節が連体修飾・被修飾表現では
ない場合は統語情報のみを使用したアクセント句接続情
報設定処理を行う統語情報によるアクセント句接続情報
設定処理部と、隣接する２文節が連体修飾・被修飾表現
である場合はその修飾・被修飾表現が限定修飾関係であ
るか非限定修飾関係であるかを判定＜１１＞してアクセ
ント句接続情報設定処理を行う限定・非限定修飾関係に
よるアクセント句接続情報設定処理部とより成り、読み
・韻律情報設定処理部（４）の出力である韻律情報付き
カナ列（５）を合成音声出力処理部（６）により合成音
声（７）に変換するテキスト音声合成装置を構成した。

【００１６】また、上述のテキスト音声合成装置におい
て、入力される漢字かな混じり文はニュース文であるテ
キスト音声合成装置をも構成した。

【００１７】

【実施例】この発明の実施例を図を参照して説明する。
先ず、連体修飾が限定修飾関係であるか非限定修飾関係
であるかを判別するために、表現「ＡのＢ」における上
述した限定・非限定修飾関係を拡張して、連体修飾の限
定・非限定修飾関係を次の様に規定する。ここで、修飾
部（節または句）をＰ、Ｐが修飾する名詞または名詞句
をＮとして説明する。

【００１８】［限定修飾関係］ＰとＮにより規定される
概念集合Ｘ（Ｘ＝｛ｎ₁,ｎ₂,ｎ₃ ・・・｝，｜Ｘ｜≧
２）の中から、或る要素を取り出す役割、換言すればｎ
＝ｎ_Xを特定する特徴づけをする役割を有する修飾関
係。（例）・数学の本：本の種類（「数字の本」、「国語の本」、
「英語の本」、・・・）という概念集合の中から「数学
の本」を特定する。

【００１９】［非限定修飾関係］ＰとＮにより規定され
る概念集合Ｘの要素はただ一つであり（｜Ｘ｜＝１）、
ＰがなくてもＮを特定することができる修飾関係。また
は、Ｐにより規定されるＸの部分集合Ｙに、Ｎのすべて
が含まれる修飾関係。（例）・１９０４年の日露戦争：日露戦争の時期という概念集
合は「１９０４年」のみであり、「日露戦争」は「１９
０４年」によって特定されない。

【００２０】・食器などの原料となるメラミン：メラミ
ンの用途という概念集合における「食器などの原料とな
る」という部分集合にはすべてのメラミンが含まれる。
ところで、文献「寺村日本語のシンタクスと意味II
くろしお出版」においては、連体修飾関係をその修飾の
仕方により「純粋な装定」と「述定を兼ねた装定」の２
種類に分類している。

【００２１】［純粋な装定］ＰがＮを他のものと区別す
る特徴づけをする。（例）小さい病院：「大きい病院」、「立派な病院」な
ど、いろいろな種類の病院と対比して区別している。［述定を兼ねた装定］ＰがＮ自身の異なるあり方のいろ
いろの中から１つを取り出して他のあり方と区別する特
徴づけをする。

【００２２】（例）小さかった太郎：「現在の太郎」、
「幼い時の太郎」など、いろいろな時の太郎の中から１
つを取り出している。修飾の仕方が異なると非限定修飾
の特徴も異なるため、上述の「純粋な装定／述定を兼ね
た装定」の分類とＰとＮの種類に基づいて、非限定修飾
関係を図７の様に４つに分類する。

【００２３】特願平５−３０２５０２号の発明において
は「純粋な装定／述定を兼ねた装定」を限定修飾関係の
分類として取り扱ったが、ここにおいては、「純粋な装
定／述定を兼ねた装定」の特殊な場合が非限定修飾関係
であるとして取り扱うことにする。そして、図７の非限
定修飾関係の分類別に非限定修飾関係の抽出を行う。こ
の際、深い意味解析、文脈解析を利用しても非限定修飾
関係の抽出をすることができるが、これらの解析は負担
が大きく、また精度も必ずしも充分であるとはいえな
い。そこで、この発明は、ニュース文の表現特徴を利用
して非限定修飾関係の抽出を行う。

【００２４】非限定ＡはＰがＮの概念全体を説明してい
る場合であるので、非限定Ａの抽出処理は、Ｐがニュー
ス文で説明表現になりやすい表現である場合に行う。非
限定Ｂ、Ｃ、Ｄは何れもＰとＮにより規定される集合に
要素が唯一存在する場合であるので、Ｎは主に単独に存
在するもの、即ち固有名詞相当の表現であると考え、非
限定Ｂ、Ｃ、Ｄの抽出処理はＮが固有名詞である場合に
行う。

【００２５】ところで、固有名詞にも様々の種類があ
る。非限定Ｂは「純粋な装定」において“他のもの”が
存在しない場合であるので、Ｐからみて単一存在である
か、非限定Ｃ、Ｄは「述定を兼ねた装定」において“異
なるあり方”が存在しない場合であるので、一時的存在
であるか否かを判定しなければならない。そこで、単数
ｏｒ複数存在、一時的ｏｒ継続的存在という２つの観点
に基づいて固有名詞を分類する。また、この固有名詞の
分類を単独性が高いと考えられる非限定優先固有名詞グ
ループと、単独性が低いと考えられる限定固有名詞グル
ープに分割する。分類例とグループ分割例を図８に示
す。

【００２６】図１はこの発明を実施する音声合成装置の
１例を示すブロック図である。この音声合成装置による
処理は１文単位に行われる。図１において、（１）は合
成音声出力されるべき主としてニュース文である漢字か
な混じり文である。（２）は言語解析処理部であり、漢
字かな混じり文（１）を入力して、単語情報・係り受け
情報付き分かち書き単語列（３）を出力する処理を行う
ところである。この言語解析処理部（２）は形態素解析
処理部（２−１）と係り受け解析処理部（２−２）より
成る。

【００２７】言語解析処理部（２）における解析処理の
例は図１３に示される。図１３において、漢字かな混じ
り文（１）を入力として、形態素解析処理部（２−１）
により単語の認定を行い、各単語毎に品詞、読み、モー
ラ数、その他の単語情報を得る。次に、係り受け解析処
理部（２−２）において、下線により表示される文節を
認定し、矢印により表示される文節の係り先と矢印直下
の（）により表示される係り受け関係とより成る係り受
け情報を得る。そして、言語解析処理部（２）は、形態
素解析処理部（２−１）と係り受け解析処理部（２−
２）の処理結果である単語情報・係り受け情報付き分か
ち書き単語列（３）を出力する。

【００２８】読み・韻律情報設定処理部（４）は、単語
情報・係り受け情報付き分かち書き単語列（３）を入力
して韻律情報付きカナ列（５）を出力する。ここで、カ
ナ列は合成音声出力されるべき文の読み情報を表す。読
み・韻律情報設定処理部（４）は、読み付与処理部（４
−１）、アクセント句情報設定処理部（４−２）、この
発明の主要部を構成するアクセント句接続情報設定処理
部（４−３）、およびポーズ情報設定処理部（４−４）
により構成される。

【００２９】読み・韻律情報設定処理部（４）の処理例
は図１４に示される。図１における読み付与処理部（４
−１）により、１文の読みを示すカナ列「ケイキノゲン
ジョーオシメスイッチシスーガサイテーノスイジュンニ
ナリマシタ」が得られる。次に、アクセント句情報設定
処理部（４−２）により、カナ列を‘／’により境界を
表示されるアクセント句に分割し、アクセント句単位の
アクセント型を設定する。アクセント位置は‘＾’によ
り表示される。次に、この発明の主要部を構成するアク
セント句接続情報設定処理部（４−３）により、各アク
セント句間にアクセント句接続情報を設定する。最後
に、各アクセント句間にポーズ情報を設定する。そし
て、読み・韻律情報設定処理部（４）は読み付与処理部
（４−１）、アクセント句情報設定処理部（４−２）、
アクセント句接続情報設定処理部（４−３）、およびポ
ーズ情報設定処理部（４−４）の処理結果である韻律情
報付きカナ列（５）を出力する。

【００３０】韻律情報付きカナ列（５）は、合成音声出
力処理部（６）に入力され、漢字かな混じり文（１）を
合成音声（７）として出力される。次に、図２を参照し
て図１におけるアクセント句接続情報設定処理部（４−
３）の処理フローを説明する。［１］文節カウンタのｉに初期値１を入力する。

【００３１】［２］文節のＢｉを第ｉ番目の文節と
する。［３］文節Ｂｉの内部にアクセント句境界があれ
ば、その境界のアクセント句接続を抑圧接続とする。［４］文節Ｂｉの直後がアクセント句境界であるか
否かを判定する。アクセント句境界である場合は［５］
へ移行する。アクセント句境界ではない場合は［１１］
へ移行する。

【００３２】［５］文節Ｂｉが文節Ｂｉ＋１に係る
か否かを判定する。係り受けが成立する場合は［６］へ
移行する。係り受けが成立しない場合は［１０］へ移行
する。［６］文節Ｂｉ＋１が複数アクセント句により構成
されているか否かを判定する。複数アクセント句の場合
は［１０］へ移行する。複数アクセント句ではない場合
は［７］へ移行する。

【００３３】［７］文節Ｂｉが文節Ｂｉ＋１を連体
修飾しているか否かを判定する。連体修飾している場合
は［８］へ移行する。連体修飾していない場合は［９］
へ移行する。ただし、例えば「東京、大阪、名古屋で
は」における“東京”と“大阪”は並列の連体修飾とな
るが、この様な場合は［９］へ移行する。［８］限定・非限定修飾関係によるアクセント句接
続情報設定処理を行う。この処理の詳細は図３に示す。

【００３４】［９］文節Ｂｉ、Ｂｉ＋１間のアクセ
ント句接続を抑圧接続とする。［１０］文節Ｂｉ、Ｂｉ＋１間のアクセント句接続を
非抑圧接続とする。［１１］文節カウンタｉが総文節数−１と等しいか否
かを判定する。等しい場合は［１３］へ移行する。等し
くない場合は［１２］へ移行する。［１２］文節カウンタｉに１を加算する。

【００３５】［１３］文節Ｂｉ＋１内にアクセント句
境界があれば、その境界のアクセント句接続を抑圧接続
とする。図３は限定・非限定修飾関係によるアクセント句接続情
報設定処理フローを示し、図２の［８］を詳細に示すも
のである。以下、図３に示される処理について説明す
る。

【００３６】＜１＞Ｂｉに最も近い右枝分かれ文節
境界或は文頭直後の文節からＢｉまでをＰｉとする。こ
こで、右枝分かれ文節境界とは、その文節境界直前の文
節が直後の文節に係らない文節境界をいう。＜２＞Ｂｉ＋１の自立語部をＮｉ＋１とする。＜３＞Ｐｉが説明表現候補であるか否かを判定す
る。説明表現候補である場合は＜８＞へ移行する。説明
表現候補でない場合は＜４＞へ移行する。ここで、説明
表現候補とは、以下に例示される表現の様に、ニュース
文によく現われる説明表現になり易い表現をいう。

【００３７】（説明表現候補例）〜を示す、〜を表す、
〜となる、〜である、〜といわれる、〜と呼ばれる、〜
などの＜４＞Ｎｉ＋１が複合語をも含む固有名詞であるか
否かを判定する。固有名詞である場合は＜５＞へ移行す
る。固有名詞でない場合は＜９＞へ移行する。

【００３８】＜５＞Ｐｉが限定確定修飾表現である
か否かを判定する。限定確定修飾表現である場合は＜９
＞へ移行する。限定確定修飾表現ではない場合には＜６
＞へ移行する。ここで、限定確定修飾表現とは、図９に
示される表現パターンの様に、常に限定修飾になると考
えられる修飾表現をいう。＜６＞Ｐｉがニュース文時間表現或はニュース文状
態表現であるかを判定する。条件を満足する場合は＜７
＞へ移行する。条件を満足しない場合は＜１０＞へ移行
する。

【００３９】ここで、ニュース文時間表現とは、図９に
示される表現パターンの様に、ニュース文によく現われ
やすい時間表現をいう。また、ニュース文状態表現と
は、図９に示される表現パターンの様に、ニュース文に
よく現われやすい状態表現をいう。＜７＞非限定Ｃ、Ｄ抽出処理を行う。この処理の詳
細は図６に示す。

【００４０】＜８＞非限定Ａ抽出処理を行う。この
処理の詳細は図４に示す。＜９＞文節Ｂｉ、Ｂｉ＋１の修飾関係を限定修飾関
係とする。＜１０＞非限定Ｂ抽出処理を行う。この処理の詳細は
図５に示す。＜１１＞文節Ｂｉ、Ｂｉ＋１の修飾関係を限定修飾関
係であるか否かを判定する。限定修飾関係である場合は
＜１２＞へ移行する。限定修飾関係ではない場合には＜
１３＞へ移行する。

【００４１】＜１２＞文節Ｂｉ、Ｂｉ＋１間のアクセ
ント句接続を抑圧接続とする。＜１３＞文節Ｂｉ、Ｂｉ＋１間のアクセント句接続を
非抑圧接続とする。図４は非限定Ａ抽出処理フローを示
し、図３の＜８＞を詳細に説明するものである。以下、
図４に示す処理を説明する。＜８−１＞Ｐ＝Ｐｉ、Ｎ＝Ｎｉ＋１として、非限定Ａ
抽出条件をすべて満足するか否かを判定する。すべて満
足する場合は＜８−２＞へ移行する。そうではない場合
は＜８−３＞へ移行する。

【００４２】ここで、非限定Ａ抽出条件とは以下の３条
件を表す。［非限定Ａ抽出条件］条件１：Ｐが説明表現候補である。条件２：Ｎが「外の関係」^(*1)の「底（被修飾部）
の名詞」にはなり得ない^(*2)。

【００４３】条件３：Ｎの構成単語数が１かつ
字種が英字またはカタカナ、またはＮの構成単語数が２
以上（複合語）。（注）（＊１）外の関係：ＮがＰの格要素にはならない修飾
関係。ここで、ＰはＮの内容を表し、またはその内容に
かかわる（内容補充的修飾）という意味的特徴を有す
る。（文献「寺村寺村秀夫論文集Ｉくろしお出版」
より引用）（＊２）外の関係の底の名詞になり得るのは、以下の
４種類の名詞に限られる。（同じく、文献「寺村寺村
秀夫論文集Ｉくろしお出版」より引用）・発話、思考の名詞：言葉、申し出、依頼その他・「コト」を表す名詞：事実、話、結果その他・感覚の名詞：姿、形・絵その他・「相対性」の名詞：上、下、前日、朝その他＜８−２＞文節Ｂｉ、Ｂｉ＋１の修飾関係を非限定修
飾関係とする。

【００４４】＜８−３＞文節Ｂｉ、Ｂｉ＋１の修飾関
係を限定修飾関係とする。図５は非限定Ｂ抽出処理フローを示し、図３の＜１０＞
を詳細に説明するものである。以下、図５に示される処
理を説明する。＜１０−１＞Ｎｉ＋１が非限定固有名詞優先グループ
（図８参照）であるか否かを判定する。非限定固有名詞
優先グループである場合は＜１０−２＞へ移行する。非
限定固有名詞優先グループではない場合は＜１０−３＞
へ移行する。

【００４５】＜１０−２＞Ｐ＝Ｐｉ、Ｎ＝Ｎｉ＋１と
して、純粋な装定・限定修飾パターンに該当するか否か
を判定する。該当する場合は、＜１０−５＞へ移行す
る。該当しない場合は＜１０−４＞へ移行する。純粋な
装定・限定修飾パターンとは、図１０に示される様に、
純粋な装定の限定修飾関係となるＰとＮの組み合わせパ
ターンをいう。

【００４６】＜１０−３＞Ｐ＝Ｐｉ、Ｎ＝Ｎｉ＋１と
して、非限定Ｂパターンに該当するか否かを判定する。
該当する場合は＜１０−４＞へ移行する。該当しない場
合は＜１０−５＞へ移行する。非限定Ｂパターンとは、
図１１に示される様に、限定優先固有名詞グループが非
限定Ｂの被修飾部となるＰとＮの組み合わせパターンを
いう。

【００４７】＜１０−４＞文節Ｂｉ、Ｂｉ＋１の修飾
関係を限定修飾関係とする。＜１０−５＞文節Ｂｉ、Ｂｉ＋１の修飾関係を非限定
修飾関係とする。図６は非限定Ｃ、Ｄ抽出処理フローを
示し、図３の＜７＞を詳細に説明するものである。以
下、図６に示される処理を説明する。＜７−１＞Ｐ＝Ｐｉ、Ｎ＝Ｎｉ＋１として、非限定
Ｃ、Ｄパターンに該当するか否かを判定する。該当する
場合は＜７−２＞へ移行する。該当しない場合は＜７−３＞へ移行する。非限定Ｃ、Ｄパターンとは、図
１２に示される様に、非限定ＣまたはＤとなるＰとＮの
組み合わせパターンをいう。

【００４８】＜７−２＞文節Ｂｉ、Ｂｉ＋１の修飾関
係を非限定修飾関係とする。＜７−３＞文節Ｂｉ、Ｂｉ＋１の修飾関係を限定修飾
関係とする。次に、図３の限定・非限定修飾関係によるアクセント句
接続情報設定処理を図１４の文節Ｂｉ＝“示す”の場合
を使用して説明する。図３＜１＞において、Ｐｉ＝“景
気の現状を示す”が設定される。＜２＞において、Ｎｉ
＋１＝“一致指数”が設定される。＜３＞においてＰｉ
が説明表現候補であるので＜８＞に移行する。

【００４９】次に、図４＜８−１＞において、Ｐｉ＝説
明表現候補、Ｎｉ＋１≠外の関係の底の名詞、Ｎｉ＋１
の構成単語数＝２（“一致”と“指数”）であるため
に、非限定Ａ抽出条件をすべて満足するので＜８−２＞
に移行する。この結果、Ｂｉ、Ｂｉ＋１は非限定修飾関
係となる。次に、図３＜１１＞において、Ｂｉ、Ｂｉ＋
１は非限定修飾関係であるので、＜１２＞に移行する。
そして＜１２＞において、Ｂｉ、Ｂｉ＋１間のアクセン
ト句接続に「抑圧接続」が設定される。

【００５０】

【発明の効果】以上の通りであって、この発明によれ
ば、アクセント句接続情報設定処理において、従来の枝
分かれ構造に加えて、連体修飾の限定・非限定修飾関係
の影響に着目し、形態素・係り受け解析と入力される主
として漢字かな混じりのニュース文の表現特徴を利用し
て限定・非限定修飾関係の判定を行い、より高精度にア
クセント句接続情報を設定することができる。これによ
り、特にニュース文をより自然で聞き易い合成音声によ
り読み上げることができる。

【図面の簡単な説明】

【図１】この発明を実施する音声合成装置を示すブロッ
ク図

【図２】この発明のアクセント句接続情報設定処理フロ
ー図。

【図３】限定・非限定修飾関係によるアクセント句接続
情報設定処理のフロー図。

【図４】非限定Ａ抽出処理フロー図。

【図５】非限定Ｂ抽出処理フロー図。

【図６】非限定Ｃ、Ｄ抽出処理フロー図。

【図７】非限定修飾関係の分類を示す図。

【図８】固有名詞の分類例を示す図。

【図９】非限定Ｂ、Ｃ、Ｄを抽出するためのＰの分類例
を示す図。

【図１０】純粋な装定・限定修飾パターンの例を示す
図。

【図１１】非限定Ｂパターンの例を示す図。

【図１２】非限定Ｃ、Ｄパターンの例を示す図。

【図１３】図１の言語解析処理部の例を示す図。

【図１４】読み・韻律情報設定処理部の例を示す図。

【符号の説明】

（１）漢字かな混じり文（２）言語解析処理部（２−１）形態素解析処理部（２−２）係り受け解析処理部（３）単語情報・係り受け情報付き分かち書き単
語列（４）読み・韻律情報設定処理部（４−１）読み付与処理部（４−２）アクセント句情報設定処理部（４−３）アクセント句接続情報設定処理部（４−４）ポーズ情報設定処理部（５）韻律情報付きカナ列（６）合成音声出力処理部（７）合成音声［７］修飾表現判定処理部［８］限定・非限定修飾関係によるアクセント句
接続情報設定処理部

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平７−160283（ＪＰ，Ａ) 特開平５−134692（ＪＰ，Ａ) 特開平５−134691（ＪＰ，Ａ) 特開平５−224687（ＪＰ，Ａ) 阿部久子、小原永，限定・非限定修飾関係に着目したアクセント句情報設定方法，人工知能学会、言語・音声理解と対話処理研究会資料，日本，ＶＯＬ８，31 −38 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 13/08

Claims

(57)【特許請求の範囲】

【請求項１】入力される漢字かな混じり文の隣接する
文節間の連体修飾関係が限定修飾関係であるか或は非限
定修飾関係であるかを判定して連体非限定修飾関係にあ
る２文節間にアクセント句境界がある場合のアクセント
句接続の自然性を向上させることを特徴とするテキスト
音声合成方法。
【請求項２】漢字かな混じり文を入力して単語を認定
し、各単語に形態素解析処理を施して単語情報を求め、
単語情報に基づいて文節を認定し、文節に係り受け解析
処理を施して単語情報・係り受け情報付き分かち書き単
語列を求め、次いで、文の読みを表すカナ列を生成する
読み付与処理、カナ列をアクセント句単位に分割しアク
セント句のアクセント型を設定するアクセント句情報設
定処理を施し、ここにおいて隣接する２文節が連体修飾
・被修飾表現であるか否かを判定して、隣接する２文節
が連体修飾・被修飾表現ではない場合は統語情報のみを
使用してアクセント句接続情報設定処理を行うと共に、
隣接する２文節が連体修飾・被修飾表現である場合はそ
の修飾・被修飾表現が限定修飾関係であるか非限定修飾
関係であるかを判定してアクセント句接続情報設定処理
を施し、各アクセント句間にポーズ情報を設定するポー
ズ情報設定処理を施して韻律情報付きカナ列を求め、合
成音声を出力することを特徴とするテキスト音声合成方
法。
【請求項３】請求項１および請求項２の何れかに記載
されるテキスト音声合成方法において、入力される漢字
かな混じり文をニュース文とすることを特徴とするテキ
スト音声合成方法。
【請求項４】入力される漢字かな混じり文について単
語を認定すると共に各単語の単語情報を求める形態素解
析処理部および文節を認定すると共に文節間の係り受け
情報を求める係り受け解析処理部より成る言語解析処理
部を具備し、言語解析処理結果の出力である単語情報・
係り受け情報付き分かち書き単語列について文の読みを
表すカナ列を生成する読み付与処理部と、カナ列をアク
セント句単位に分割しアクセント句のアクセント型を設
定するアクセント句情報設定処理部と、各アクセント句
間にアクセント句接続情報を設定するアクセント句接続
情報設定処理部と、各アクセント句間にポーズ情報を設
定するポーズ情報設定処理部とより成る読み・韻律情報
設定処理部を具備し、アクセント句接続情報設定処理部は、隣接する２文節が
連体修飾・被修飾表現であるか否かを判定する連体修飾
表現判定処理部と、隣接する２文節が連体修飾・被修飾
表現ではない場合は統語情報のみを使用したアクセント
句接続情報設定処理を行う統語情報によるアクセント句
接続情報設定処理部と、隣接する２文節が連体修飾・被
修飾表現である場合はその修飾・被修飾表現が限定修飾
関係であるか非限定修飾関係であるかを判定してアクセ
ント句接続情報設定処理を行う限定・非限定修飾関係に
よるアクセント句接続情報設定処理部とより成り、読み
・韻律情報設定処理部の出力である韻律情報付きカナ列
を合成音声出力処理部により合成音声に変換することを
特徴とするテキスト音声合成装置。
【請求項５】請求項４に記載されるテキスト音声合成
装置において、入力される漢字かな混じり文はニュース
文であることを特徴とするテキスト音声合成装置。