JP3248552B2 - テキスト音声合成方法およびこの方法を実施する装置 - Google Patents
テキスト音声合成方法およびこの方法を実施する装置Info
- Publication number
- JP3248552B2 JP3248552B2 JP03452994A JP3452994A JP3248552B2 JP 3248552 B2 JP3248552 B2 JP 3248552B2 JP 03452994 A JP03452994 A JP 03452994A JP 3452994 A JP3452994 A JP 3452994A JP 3248552 B2 JP3248552 B2 JP 3248552B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- accent phrase
- accent
- processing unit
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】
【産業上の利用分野】この発明は、テキスト音声合成方
法およびこの方法を実施する装置に関し、特に、漢字か
な混じりの日本語文章の内の特にニュースにおいて読み
上げる原稿であるニュース文を合成音声により読み上げ
るに好適なテキスト音声合成方法およびこの方法を実施
する装置に関する。
法およびこの方法を実施する装置に関し、特に、漢字か
な混じりの日本語文章の内の特にニュースにおいて読み
上げる原稿であるニュース文を合成音声により読み上げ
るに好適なテキスト音声合成方法およびこの方法を実施
する装置に関する。
【0002】
【従来の技術】新聞記事、電子メールその他の漢字かな
混じりの日本語文章をテキスト音声合成装置により電子
化して合成音声により読み上げるには、漢字かな混じり
文に読みをふり、アクセント句、ポーズその他の韻律情
報を設定する必要がある。現在、この様なテキスト音声
合成装置は実用化されているが、この合成音声には実際
の人間の発話音声と比較して不自然さが残る。この不自
然さは韻律情報の設定精度の問題である。
混じりの日本語文章をテキスト音声合成装置により電子
化して合成音声により読み上げるには、漢字かな混じり
文に読みをふり、アクセント句、ポーズその他の韻律情
報を設定する必要がある。現在、この様なテキスト音声
合成装置は実用化されているが、この合成音声には実際
の人間の発話音声と比較して不自然さが残る。この不自
然さは韻律情報の設定精度の問題である。
【0003】ここで、韻律情報には、アクセント句情
報、ポーズ情報、アクセント句接続情報その他の情報が
あり、以下これらの特徴について説明する。アクセント
句とは、自然に話をした場合に一つのまとまりとして発
声する単位であり、ピッチパタン(基本周波数F0 の時
間パタン、文全体の自然下降を表す話調成分とアクセン
ト句に関係するアクセント句成分の重畳)上に表現され
る。日本語東京方言においてはアクセント核(基本周波
数が急激に下がり始めるモーラ)を最大1個有する単位
と定義され、一般には複数の単語(2〜3単語)から成
る。また、1語が複数のアクセント句に分割される場合
もある。複数の単語によりアクセント句が構成される場
合は、各単語のアクセント型の消失、移動その他の音韻
情報の変移が生起するので、アクセント句としてのアク
セント型の設定をしなければならない。アクセント句情
報は、各アクセント句の範囲と、アクセント型の情報を
有する。
報、ポーズ情報、アクセント句接続情報その他の情報が
あり、以下これらの特徴について説明する。アクセント
句とは、自然に話をした場合に一つのまとまりとして発
声する単位であり、ピッチパタン(基本周波数F0 の時
間パタン、文全体の自然下降を表す話調成分とアクセン
ト句に関係するアクセント句成分の重畳)上に表現され
る。日本語東京方言においてはアクセント核(基本周波
数が急激に下がり始めるモーラ)を最大1個有する単位
と定義され、一般には複数の単語(2〜3単語)から成
る。また、1語が複数のアクセント句に分割される場合
もある。複数の単語によりアクセント句が構成される場
合は、各単語のアクセント型の消失、移動その他の音韻
情報の変移が生起するので、アクセント句としてのアク
セント型の設定をしなければならない。アクセント句情
報は、各アクセント句の範囲と、アクセント型の情報を
有する。
【0004】ポーズとは、統語・意味的影響および発声
上の制約である息継ぎに基づいてアクセント句とアクセ
ント句との間に設定される適度な間隔と長さの時間であ
る。ポーズ情報は、各アクセント句間に対してポーズの
有無、ポーズ有の場合はポーズ長に関する情報を有す
る。アクセント句接続とは、隣接するアクセント句を相
対的にどの様に接続するかを表すものである。ここで、
或るアクセント句Ai のアクセント成分最大値が直前の
アクセント句Ai-1 と比較して小さい場合、Ai を「抑
圧(アクセント句)」といい、大きい場合を「非抑圧
(アクセント句)」という。そして、Ai が「抑圧」な
らば、Ai-1 とAi は「抑圧接続」、Ai が「非抑圧」
ならば、Ai-1とAi は「非抑圧接続」であるという。
アクセント句接続情報は、各アクセント句間に対して、
直前と直後のアクセント句が「抑圧接続」であるか「非
抑圧接続」であるかという情報を有する。
上の制約である息継ぎに基づいてアクセント句とアクセ
ント句との間に設定される適度な間隔と長さの時間であ
る。ポーズ情報は、各アクセント句間に対してポーズの
有無、ポーズ有の場合はポーズ長に関する情報を有す
る。アクセント句接続とは、隣接するアクセント句を相
対的にどの様に接続するかを表すものである。ここで、
或るアクセント句Ai のアクセント成分最大値が直前の
アクセント句Ai-1 と比較して小さい場合、Ai を「抑
圧(アクセント句)」といい、大きい場合を「非抑圧
(アクセント句)」という。そして、Ai が「抑圧」な
らば、Ai-1 とAi は「抑圧接続」、Ai が「非抑圧」
ならば、Ai-1とAi は「非抑圧接続」であるという。
アクセント句接続情報は、各アクセント句間に対して、
直前と直後のアクセント句が「抑圧接続」であるか「非
抑圧接続」であるかという情報を有する。
【0005】アクセント句接続は、統語構造の影響を大
きく受けることが指摘されている。一般に、或る文節B
i が直後の文節Bi+1 に係る左枝分かれ構造の場合は文
節境界前後のアクセント句は「抑圧接続」、文節Bi が
文節Bi+1 に係らない右枝分かれ構造の場合は「非抑圧
接続」になる。このために、従来の音声合成装置におい
ては、アクセント句接続情報設の設定に、形態素解析に
より出力される単語情報(例えば品詞、モーラ数、アク
セント型)、および係り受け解析により出力される文節
間の係り受け情報(例えば文節間の係り受けの距離、係
り受け関係)という様な統語情報を利用している。例え
ば、文献「箱田他 文章音声の音調結合型導出規則の検
討 音声研究会 SP89−5」においては、係り受け
の距離(分離度)、句読点、係り受け関係、文節長、文
節位置を利用してポーズ情報、アクセント句接続情報
(ここにおいては、ポーズ情報とアクセント句接続情報
とをまとめて音調結合型という)を設定している。
きく受けることが指摘されている。一般に、或る文節B
i が直後の文節Bi+1 に係る左枝分かれ構造の場合は文
節境界前後のアクセント句は「抑圧接続」、文節Bi が
文節Bi+1 に係らない右枝分かれ構造の場合は「非抑圧
接続」になる。このために、従来の音声合成装置におい
ては、アクセント句接続情報設の設定に、形態素解析に
より出力される単語情報(例えば品詞、モーラ数、アク
セント型)、および係り受け解析により出力される文節
間の係り受け情報(例えば文節間の係り受けの距離、係
り受け関係)という様な統語情報を利用している。例え
ば、文献「箱田他 文章音声の音調結合型導出規則の検
討 音声研究会 SP89−5」においては、係り受け
の距離(分離度)、句読点、係り受け関係、文節長、文
節位置を利用してポーズ情報、アクセント句接続情報
(ここにおいては、ポーズ情報とアクセント句接続情報
とをまとめて音調結合型という)を設定している。
【0006】しかし、ポーズ、アクセント句接続は、意
味構造、談話構造の影響を受けることが指摘されてい
る。例えば、文献「郡、プロソディーの自律性 言語V
ol.21,No.9,1992」においては、修飾・
被修飾の関係にある隣接する2文節において、修飾部が
被修飾部を限定している場合は「抑圧接続」、修飾語が
被修飾語を限定していない場合は「非抑圧接続」になる
ことを示している。以下にその例を示す。
味構造、談話構造の影響を受けることが指摘されてい
る。例えば、文献「郡、プロソディーの自律性 言語V
ol.21,No.9,1992」においては、修飾・
被修飾の関係にある隣接する2文節において、修飾部が
被修飾部を限定している場合は「抑圧接続」、修飾語が
被修飾語を限定していない場合は「非抑圧接続」になる
ことを示している。以下にその例を示す。
【0007】(1)京都の <抑圧接続> 陶器を じ
っくり 見ました。 (2)京都の <非抑圧接続> 東寺を じっくり 見
ました。 (1)は、「京都の」は「陶器」を限定しているので
「抑圧接続」となる。(2)は、「京都の」は「東寺」
を限定しておらず、単に付加的な情報に過ぎないので
「非抑圧接続」となる。
っくり 見ました。 (2)京都の <非抑圧接続> 東寺を じっくり 見
ました。 (1)は、「京都の」は「陶器」を限定しているので
「抑圧接続」となる。(2)は、「京都の」は「東寺」
を限定しておらず、単に付加的な情報に過ぎないので
「非抑圧接続」となる。
【0008】しかし、ここにおいて、修飾・被修飾関係
にある隣接する2文節において、修飾部が被修飾部を限
定している場合(これを限定修飾関係とする)および、
修飾部が被修飾部を限定していない場合(これを非限定
修飾関係とする)について、これら両者の定義が定まっ
ておらず、判別の仕方の説明はなされていない。ところ
で、当該出願の発明者が先に出願した特願平5−302
502号明細書には、「AのB」という表現に限った非
限定修飾関係の抽出方法が開示されている。ここにおい
ては、従来、判然とされてはいなかった限定関係および
非限定関係について、次の如く定義して話を進めた。即
ち、Bを含む集合の中からBがAにより特定される修飾
関係にある関係、を限定関係にあると定義し、これに対
して、Bを含む集合にはBしか存在せず、Aがなくても
Bを特定することができ、AはBに何らかの情報を付加
的に説明する修飾関係にある関係、を非限定関係にある
と定義した。しかし、その他の修飾表現についての抽出
方法は説明されていない。
にある隣接する2文節において、修飾部が被修飾部を限
定している場合(これを限定修飾関係とする)および、
修飾部が被修飾部を限定していない場合(これを非限定
修飾関係とする)について、これら両者の定義が定まっ
ておらず、判別の仕方の説明はなされていない。ところ
で、当該出願の発明者が先に出願した特願平5−302
502号明細書には、「AのB」という表現に限った非
限定修飾関係の抽出方法が開示されている。ここにおい
ては、従来、判然とされてはいなかった限定関係および
非限定関係について、次の如く定義して話を進めた。即
ち、Bを含む集合の中からBがAにより特定される修飾
関係にある関係、を限定関係にあると定義し、これに対
して、Bを含む集合にはBしか存在せず、Aがなくても
Bを特定することができ、AはBに何らかの情報を付加
的に説明する修飾関係にある関係、を非限定関係にある
と定義した。しかし、その他の修飾表現についての抽出
方法は説明されていない。
【0009】
【発明が解決しようとする課題】従来のアクセント句接
続情報の設定においては、言語情報として主として枝分
かれ構造が利用されている。そして「AのB」という修
飾・被修飾表現に関しては非限定修飾関係も利用されて
いるが、その他の修飾表現は利用されていない。以上の
様な事情から、従来のアクセント句接続情報の設定技術
においては、以下の(a−1)および(a−2)の場合
は正しくアクセント句接続情報の設定をすることができ
るが、(b−1)および(b−2)の場合は正しくアク
セント句接続情報の設定をすることができない。
続情報の設定においては、言語情報として主として枝分
かれ構造が利用されている。そして「AのB」という修
飾・被修飾表現に関しては非限定修飾関係も利用されて
いるが、その他の修飾表現は利用されていない。以上の
様な事情から、従来のアクセント句接続情報の設定技術
においては、以下の(a−1)および(a−2)の場合
は正しくアクセント句接続情報の設定をすることができ
るが、(b−1)および(b−2)の場合は正しくアク
セント句接続情報の設定をすることができない。
【0010】(a−1) アメリカの <抑圧接続>
大統領 (a−2) アメリカの <非抑圧接続> ロサンゼル
ス空港 (b−1) 食器などの原料となる <抑圧接続> メ
ラミン(本来は非抑圧接続) (b−2) 92年に行われた <抑圧接続> バルセ
ロナオリンピック(本来は非抑圧接続) (a−1)は、「アメリカの」が直後の「大統領」に係
り(左枝分かれ構造)、これを限定しているので抑圧接
続となる。(a−2)は、「アメリカの」が直後の「ロ
サンゼルス空港」に係り(左枝分かれ構造)、これを限
定していない「AのB」表現であるので非抑圧接続とな
る。
大統領 (a−2) アメリカの <非抑圧接続> ロサンゼル
ス空港 (b−1) 食器などの原料となる <抑圧接続> メ
ラミン(本来は非抑圧接続) (b−2) 92年に行われた <抑圧接続> バルセ
ロナオリンピック(本来は非抑圧接続) (a−1)は、「アメリカの」が直後の「大統領」に係
り(左枝分かれ構造)、これを限定しているので抑圧接
続となる。(a−2)は、「アメリカの」が直後の「ロ
サンゼルス空港」に係り(左枝分かれ構造)、これを限
定していない「AのB」表現であるので非抑圧接続とな
る。
【0011】これに対して、(b−1)、(b−2)は
共に修飾部が被修飾部を限定しない非限定修飾関係であ
るが、「AのB」という表現ではないので「非抑圧接
続」であるにも係わらずその旨の設定をすることができ
ない。限定・非限定修飾関係を区別するには、本来、深
い意味解析、文脈解析をすることが必要とされる。しか
し、これらの解析は負担が大きく、精度も現状において
は必ずしも高いとはいえない。
共に修飾部が被修飾部を限定しない非限定修飾関係であ
るが、「AのB」という表現ではないので「非抑圧接
続」であるにも係わらずその旨の設定をすることができ
ない。限定・非限定修飾関係を区別するには、本来、深
い意味解析、文脈解析をすることが必要とされる。しか
し、これらの解析は負担が大きく、精度も現状において
は必ずしも高いとはいえない。
【0012】ここで、この発明は、音声合成の対象とす
る文章をニュースの文章に特定し、その文節が連体修飾
関係が限定修飾関係であるか非限定修飾関係であるかを
ニュース文章の表現特徴により判定する構成を具備し
て、上述の(b−1)および(b−2)の様な連体非限
定修飾関係にある2文節間にアクセント句境界がある場
合のアクセント句接続の自然性を向上させるテキスト音
声合成方法およびこの方法を実施する装置を提供するも
のである。
る文章をニュースの文章に特定し、その文節が連体修飾
関係が限定修飾関係であるか非限定修飾関係であるかを
ニュース文章の表現特徴により判定する構成を具備し
て、上述の(b−1)および(b−2)の様な連体非限
定修飾関係にある2文節間にアクセント句境界がある場
合のアクセント句接続の自然性を向上させるテキスト音
声合成方法およびこの方法を実施する装置を提供するも
のである。
【0013】
【課題を解決するための手段】入力される漢字かな混じ
り文の隣接する文節間の連体修飾関係が限定修飾関係で
あるか或は非限定修飾関係であるかを判定して連体非限
定修飾関係にある2文節間にアクセント句境界がある場
合のアクセント句接続の自然性を向上させるテキスト音
声合成方法を構成した。
り文の隣接する文節間の連体修飾関係が限定修飾関係で
あるか或は非限定修飾関係であるかを判定して連体非限
定修飾関係にある2文節間にアクセント句境界がある場
合のアクセント句接続の自然性を向上させるテキスト音
声合成方法を構成した。
【0014】そして、上述したテキスト音声合成方法に
おいて、隣接する2文節が連体修飾・被修飾表現である
か否かを判定して、隣接する2文節が連体修飾・被修飾
表現ではない場合は統語情報のみを使用してアクセント
句接続情報設定処理を行うと共に、隣接する2文節が連
体修飾・被修飾表現である場合はその修飾・被修飾表現
が限定修飾関係であるか非限定修飾関係であるかを判定
してアクセント句接続情報設定処理を行うテキスト音声
合成方法を構成した。
おいて、隣接する2文節が連体修飾・被修飾表現である
か否かを判定して、隣接する2文節が連体修飾・被修飾
表現ではない場合は統語情報のみを使用してアクセント
句接続情報設定処理を行うと共に、隣接する2文節が連
体修飾・被修飾表現である場合はその修飾・被修飾表現
が限定修飾関係であるか非限定修飾関係であるかを判定
してアクセント句接続情報設定処理を行うテキスト音声
合成方法を構成した。
【0015】また、上述のテキスト音声合成方法におい
て、入力される漢字かな混じり文をニュース文とするテ
キスト音声合成方法を構成した。更に、入力される漢字
かな混じり文(1)について単語を認定すると共に各単
語の単語情報を求める形態素解析処理部(2−1)およ
び文節を認定すると共に文節間の係り受け情報を求める
係り受け解析処理部(2−2)より成る言語解析処理部
(2)を具備し、言語解析処理結果の出力である単語情
報・係り受け情報付き分かち書き単語列(3)について
文の読みを表すカナ列を生成する読み付与処理部(4−
1)と、カナ列をアクセント句単位に分割しアクセント
句のアクセント型を設定するアクセント句情報設定処理
部(4−2)と、各アクセント句間にアクセント句接続
情報を設定するアクセント句接続情報設定処理部(4−
3)と、各アクセント句間にポーズ情報を設定するポー
ズ情報設定処理部(4−4)とより成る読み・韻律情報
設定処理部(4)を具備し、アクセント句接続情報設定
処理部(4−3)は、隣接する2文節が連体修飾・被修
飾表現であるか否かを判定する連体修飾表現判定処理部
[7]と、隣接する2文節が連体修飾・被修飾表現では
ない場合は統語情報のみを使用したアクセント句接続情
報設定処理を行う統語情報によるアクセント句接続情報
設定処理部と、隣接する2文節が連体修飾・被修飾表現
である場合はその修飾・被修飾表現が限定修飾関係であ
るか非限定修飾関係であるかを判定<11>してアクセ
ント句接続情報設定処理を行う限定・非限定修飾関係に
よるアクセント句接続情報設定処理部とより成り、読み
・韻律情報設定処理部(4)の出力である韻律情報付き
カナ列(5)を合成音声出力処理部(6)により合成音
声(7)に変換するテキスト音声合成装置を構成した。
て、入力される漢字かな混じり文をニュース文とするテ
キスト音声合成方法を構成した。更に、入力される漢字
かな混じり文(1)について単語を認定すると共に各単
語の単語情報を求める形態素解析処理部(2−1)およ
び文節を認定すると共に文節間の係り受け情報を求める
係り受け解析処理部(2−2)より成る言語解析処理部
(2)を具備し、言語解析処理結果の出力である単語情
報・係り受け情報付き分かち書き単語列(3)について
文の読みを表すカナ列を生成する読み付与処理部(4−
1)と、カナ列をアクセント句単位に分割しアクセント
句のアクセント型を設定するアクセント句情報設定処理
部(4−2)と、各アクセント句間にアクセント句接続
情報を設定するアクセント句接続情報設定処理部(4−
3)と、各アクセント句間にポーズ情報を設定するポー
ズ情報設定処理部(4−4)とより成る読み・韻律情報
設定処理部(4)を具備し、アクセント句接続情報設定
処理部(4−3)は、隣接する2文節が連体修飾・被修
飾表現であるか否かを判定する連体修飾表現判定処理部
[7]と、隣接する2文節が連体修飾・被修飾表現では
ない場合は統語情報のみを使用したアクセント句接続情
報設定処理を行う統語情報によるアクセント句接続情報
設定処理部と、隣接する2文節が連体修飾・被修飾表現
である場合はその修飾・被修飾表現が限定修飾関係であ
るか非限定修飾関係であるかを判定<11>してアクセ
ント句接続情報設定処理を行う限定・非限定修飾関係に
よるアクセント句接続情報設定処理部とより成り、読み
・韻律情報設定処理部(4)の出力である韻律情報付き
カナ列(5)を合成音声出力処理部(6)により合成音
声(7)に変換するテキスト音声合成装置を構成した。
【0016】また、上述のテキスト音声合成装置におい
て、入力される漢字かな混じり文はニュース文であるテ
キスト音声合成装置をも構成した。
て、入力される漢字かな混じり文はニュース文であるテ
キスト音声合成装置をも構成した。
【0017】
【実施例】この発明の実施例を図を参照して説明する。
先ず、連体修飾が限定修飾関係であるか非限定修飾関係
であるかを判別するために、表現「AのB」における上
述した限定・非限定修飾関係を拡張して、連体修飾の限
定・非限定修飾関係を次の様に規定する。ここで、修飾
部(節または句)をP、Pが修飾する名詞または名詞句
をNとして説明する。
先ず、連体修飾が限定修飾関係であるか非限定修飾関係
であるかを判別するために、表現「AのB」における上
述した限定・非限定修飾関係を拡張して、連体修飾の限
定・非限定修飾関係を次の様に規定する。ここで、修飾
部(節または句)をP、Pが修飾する名詞または名詞句
をNとして説明する。
【0018】[限定修飾関係]PとNにより規定される
概念集合X(X={n1,n2,n3 ・・・},|X|≧
2)の中から、或る要素を取り出す役割、換言すればn
=nX を特定する特徴づけをする役割を有する修飾関
係。 (例) ・数学の本:本の種類(「数字の本」、「国語の本」、
「英語の本」、・・・)という概念集合の中から「数学
の本」を特定する。
概念集合X(X={n1,n2,n3 ・・・},|X|≧
2)の中から、或る要素を取り出す役割、換言すればn
=nX を特定する特徴づけをする役割を有する修飾関
係。 (例) ・数学の本:本の種類(「数字の本」、「国語の本」、
「英語の本」、・・・)という概念集合の中から「数学
の本」を特定する。
【0019】[非限定修飾関係]PとNにより規定され
る概念集合Xの要素はただ一つであり(|X|=1)、
PがなくてもNを特定することができる修飾関係。また
は、Pにより規定されるXの部分集合Yに、Nのすべて
が含まれる修飾関係。 (例) ・1904年の日露戦争:日露戦争の時期という概念集
合は「1904年」のみであり、「日露戦争」は「19
04年」によって特定されない。
る概念集合Xの要素はただ一つであり(|X|=1)、
PがなくてもNを特定することができる修飾関係。また
は、Pにより規定されるXの部分集合Yに、Nのすべて
が含まれる修飾関係。 (例) ・1904年の日露戦争:日露戦争の時期という概念集
合は「1904年」のみであり、「日露戦争」は「19
04年」によって特定されない。
【0020】・食器などの原料となるメラミン:メラミ
ンの用途という概念集合における「食器などの原料とな
る」という部分集合にはすべてのメラミンが含まれる。
ところで、文献「寺村 日本語のシンタクスと意味II
くろしお出版」においては、連体修飾関係をその修飾の
仕方により「純粋な装定」と「述定を兼ねた装定」の2
種類に分類している。
ンの用途という概念集合における「食器などの原料とな
る」という部分集合にはすべてのメラミンが含まれる。
ところで、文献「寺村 日本語のシンタクスと意味II
くろしお出版」においては、連体修飾関係をその修飾の
仕方により「純粋な装定」と「述定を兼ねた装定」の2
種類に分類している。
【0021】[純粋な装定]PがNを他のものと区別す
る特徴づけをする。 (例)小さい病院:「大きい病院」、「立派な病院」な
ど、いろいろな種類の病院と対比して区別している。 [述定を兼ねた装定]PがN自身の異なるあり方のいろ
いろの中から1つを取り出して他のあり方と区別する特
徴づけをする。
る特徴づけをする。 (例)小さい病院:「大きい病院」、「立派な病院」な
ど、いろいろな種類の病院と対比して区別している。 [述定を兼ねた装定]PがN自身の異なるあり方のいろ
いろの中から1つを取り出して他のあり方と区別する特
徴づけをする。
【0022】(例)小さかった太郎:「現在の太郎」、
「幼い時の太郎」など、いろいろな時の太郎の中から1
つを取り出している。修飾の仕方が異なると非限定修飾
の特徴も異なるため、上述の「純粋な装定/述定を兼ね
た装定」の分類とPとNの種類に基づいて、非限定修飾
関係を図7の様に4つに分類する。
「幼い時の太郎」など、いろいろな時の太郎の中から1
つを取り出している。修飾の仕方が異なると非限定修飾
の特徴も異なるため、上述の「純粋な装定/述定を兼ね
た装定」の分類とPとNの種類に基づいて、非限定修飾
関係を図7の様に4つに分類する。
【0023】特願平5−302502号の発明において
は「純粋な装定/述定を兼ねた装定」を限定修飾関係の
分類として取り扱ったが、ここにおいては、「純粋な装
定/述定を兼ねた装定」の特殊な場合が非限定修飾関係
であるとして取り扱うことにする。そして、図7の非限
定修飾関係の分類別に非限定修飾関係の抽出を行う。こ
の際、深い意味解析、文脈解析を利用しても非限定修飾
関係の抽出をすることができるが、これらの解析は負担
が大きく、また精度も必ずしも充分であるとはいえな
い。そこで、この発明は、ニュース文の表現特徴を利用
して非限定修飾関係の抽出を行う。
は「純粋な装定/述定を兼ねた装定」を限定修飾関係の
分類として取り扱ったが、ここにおいては、「純粋な装
定/述定を兼ねた装定」の特殊な場合が非限定修飾関係
であるとして取り扱うことにする。そして、図7の非限
定修飾関係の分類別に非限定修飾関係の抽出を行う。こ
の際、深い意味解析、文脈解析を利用しても非限定修飾
関係の抽出をすることができるが、これらの解析は負担
が大きく、また精度も必ずしも充分であるとはいえな
い。そこで、この発明は、ニュース文の表現特徴を利用
して非限定修飾関係の抽出を行う。
【0024】非限定AはPがNの概念全体を説明してい
る場合であるので、非限定Aの抽出処理は、Pがニュー
ス文で説明表現になりやすい表現である場合に行う。非
限定B、C、Dは何れもPとNにより規定される集合に
要素が唯一存在する場合であるので、Nは主に単独に存
在するもの、即ち固有名詞相当の表現であると考え、非
限定B、C、Dの抽出処理はNが固有名詞である場合に
行う。
る場合であるので、非限定Aの抽出処理は、Pがニュー
ス文で説明表現になりやすい表現である場合に行う。非
限定B、C、Dは何れもPとNにより規定される集合に
要素が唯一存在する場合であるので、Nは主に単独に存
在するもの、即ち固有名詞相当の表現であると考え、非
限定B、C、Dの抽出処理はNが固有名詞である場合に
行う。
【0025】ところで、固有名詞にも様々の種類があ
る。非限定Bは「純粋な装定」において“他のもの”が
存在しない場合であるので、Pからみて単一存在である
か、非限定C、Dは「述定を兼ねた装定」において“異
なるあり方”が存在しない場合であるので、一時的存在
であるか否かを判定しなければならない。そこで、単数
or複数存在、一時的or継続的存在という2つの観点
に基づいて固有名詞を分類する。また、この固有名詞の
分類を単独性が高いと考えられる非限定優先固有名詞グ
ループと、単独性が低いと考えられる限定固有名詞グル
ープに分割する。分類例とグループ分割例を図8に示
す。
る。非限定Bは「純粋な装定」において“他のもの”が
存在しない場合であるので、Pからみて単一存在である
か、非限定C、Dは「述定を兼ねた装定」において“異
なるあり方”が存在しない場合であるので、一時的存在
であるか否かを判定しなければならない。そこで、単数
or複数存在、一時的or継続的存在という2つの観点
に基づいて固有名詞を分類する。また、この固有名詞の
分類を単独性が高いと考えられる非限定優先固有名詞グ
ループと、単独性が低いと考えられる限定固有名詞グル
ープに分割する。分類例とグループ分割例を図8に示
す。
【0026】図1はこの発明を実施する音声合成装置の
1例を示すブロック図である。この音声合成装置による
処理は1文単位に行われる。図1において、(1)は合
成音声出力されるべき主としてニュース文である漢字か
な混じり文である。(2)は言語解析処理部であり、漢
字かな混じり文(1)を入力して、単語情報・係り受け
情報付き分かち書き単語列(3)を出力する処理を行う
ところである。この言語解析処理部(2)は形態素解析
処理部(2−1)と係り受け解析処理部(2−2)より
成る。
1例を示すブロック図である。この音声合成装置による
処理は1文単位に行われる。図1において、(1)は合
成音声出力されるべき主としてニュース文である漢字か
な混じり文である。(2)は言語解析処理部であり、漢
字かな混じり文(1)を入力して、単語情報・係り受け
情報付き分かち書き単語列(3)を出力する処理を行う
ところである。この言語解析処理部(2)は形態素解析
処理部(2−1)と係り受け解析処理部(2−2)より
成る。
【0027】言語解析処理部(2)における解析処理の
例は図13に示される。図13において、漢字かな混じ
り文(1)を入力として、形態素解析処理部(2−1)
により単語の認定を行い、各単語毎に品詞、読み、モー
ラ数、その他の単語情報を得る。次に、係り受け解析処
理部(2−2)において、下線により表示される文節を
認定し、矢印により表示される文節の係り先と矢印直下
の()により表示される係り受け関係とより成る係り受
け情報を得る。そして、言語解析処理部(2)は、形態
素解析処理部(2−1)と係り受け解析処理部(2−
2)の処理結果である単語情報・係り受け情報付き分か
ち書き単語列(3)を出力する。
例は図13に示される。図13において、漢字かな混じ
り文(1)を入力として、形態素解析処理部(2−1)
により単語の認定を行い、各単語毎に品詞、読み、モー
ラ数、その他の単語情報を得る。次に、係り受け解析処
理部(2−2)において、下線により表示される文節を
認定し、矢印により表示される文節の係り先と矢印直下
の()により表示される係り受け関係とより成る係り受
け情報を得る。そして、言語解析処理部(2)は、形態
素解析処理部(2−1)と係り受け解析処理部(2−
2)の処理結果である単語情報・係り受け情報付き分か
ち書き単語列(3)を出力する。
【0028】読み・韻律情報設定処理部(4)は、単語
情報・係り受け情報付き分かち書き単語列(3)を入力
して韻律情報付きカナ列(5)を出力する。ここで、カ
ナ列は合成音声出力されるべき文の読み情報を表す。読
み・韻律情報設定処理部(4)は、読み付与処理部(4
−1)、アクセント句情報設定処理部(4−2)、この
発明の主要部を構成するアクセント句接続情報設定処理
部(4−3)、およびポーズ情報設定処理部(4−4)
により構成される。
情報・係り受け情報付き分かち書き単語列(3)を入力
して韻律情報付きカナ列(5)を出力する。ここで、カ
ナ列は合成音声出力されるべき文の読み情報を表す。読
み・韻律情報設定処理部(4)は、読み付与処理部(4
−1)、アクセント句情報設定処理部(4−2)、この
発明の主要部を構成するアクセント句接続情報設定処理
部(4−3)、およびポーズ情報設定処理部(4−4)
により構成される。
【0029】読み・韻律情報設定処理部(4)の処理例
は図14に示される。図1における読み付与処理部(4
−1)により、1文の読みを示すカナ列「ケイキノゲン
ジョーオシメスイッチシスーガサイテーノスイジュンニ
ナリマシタ」が得られる。次に、アクセント句情報設定
処理部(4−2)により、カナ列を‘/’により境界を
表示されるアクセント句に分割し、アクセント句単位の
アクセント型を設定する。アクセント位置は‘^’によ
り表示される。次に、この発明の主要部を構成するアク
セント句接続情報設定処理部(4−3)により、各アク
セント句間にアクセント句接続情報を設定する。最後
に、各アクセント句間にポーズ情報を設定する。そし
て、読み・韻律情報設定処理部(4)は読み付与処理部
(4−1)、アクセント句情報設定処理部(4−2)、
アクセント句接続情報設定処理部(4−3)、およびポ
ーズ情報設定処理部(4−4)の処理結果である韻律情
報付きカナ列(5)を出力する。
は図14に示される。図1における読み付与処理部(4
−1)により、1文の読みを示すカナ列「ケイキノゲン
ジョーオシメスイッチシスーガサイテーノスイジュンニ
ナリマシタ」が得られる。次に、アクセント句情報設定
処理部(4−2)により、カナ列を‘/’により境界を
表示されるアクセント句に分割し、アクセント句単位の
アクセント型を設定する。アクセント位置は‘^’によ
り表示される。次に、この発明の主要部を構成するアク
セント句接続情報設定処理部(4−3)により、各アク
セント句間にアクセント句接続情報を設定する。最後
に、各アクセント句間にポーズ情報を設定する。そし
て、読み・韻律情報設定処理部(4)は読み付与処理部
(4−1)、アクセント句情報設定処理部(4−2)、
アクセント句接続情報設定処理部(4−3)、およびポ
ーズ情報設定処理部(4−4)の処理結果である韻律情
報付きカナ列(5)を出力する。
【0030】韻律情報付きカナ列(5)は、合成音声出
力処理部(6)に入力され、漢字かな混じり文(1)を
合成音声(7)として出力される。次に、図2を参照し
て図1におけるアクセント句接続情報設定処理部(4−
3)の処理フローを説明する。 [1] 文節カウンタのiに初期値1を入力する。
力処理部(6)に入力され、漢字かな混じり文(1)を
合成音声(7)として出力される。次に、図2を参照し
て図1におけるアクセント句接続情報設定処理部(4−
3)の処理フローを説明する。 [1] 文節カウンタのiに初期値1を入力する。
【0031】[2] 文節のBiを第i番目の文節と
する。 [3] 文節Biの内部にアクセント句境界があれ
ば、その境界のアクセント句接続を抑圧接続とする。 [4] 文節Biの直後がアクセント句境界であるか
否かを判定する。アクセント句境界である場合は[5]
へ移行する。アクセント句境界ではない場合は[11]
へ移行する。
する。 [3] 文節Biの内部にアクセント句境界があれ
ば、その境界のアクセント句接続を抑圧接続とする。 [4] 文節Biの直後がアクセント句境界であるか
否かを判定する。アクセント句境界である場合は[5]
へ移行する。アクセント句境界ではない場合は[11]
へ移行する。
【0032】[5] 文節Biが文節Bi+1に係る
か否かを判定する。係り受けが成立する場合は[6]へ
移行する。係り受けが成立しない場合は[10]へ移行
する。 [6] 文節Bi+1が複数アクセント句により構成
されているか否かを判定する。複数アクセント句の場合
は[10]へ移行する。複数アクセント句ではない場合
は[7]へ移行する。
か否かを判定する。係り受けが成立する場合は[6]へ
移行する。係り受けが成立しない場合は[10]へ移行
する。 [6] 文節Bi+1が複数アクセント句により構成
されているか否かを判定する。複数アクセント句の場合
は[10]へ移行する。複数アクセント句ではない場合
は[7]へ移行する。
【0033】[7] 文節Biが文節Bi+1を連体
修飾しているか否かを判定する。連体修飾している場合
は[8]へ移行する。連体修飾していない場合は[9]
へ移行する。ただし、例えば「東京、大阪、名古屋で
は」における“東京”と“大阪”は並列の連体修飾とな
るが、この様な場合は[9]へ移行する。 [8] 限定・非限定修飾関係によるアクセント句接
続情報設定処理を行う。この処理の詳細は図3に示す。
修飾しているか否かを判定する。連体修飾している場合
は[8]へ移行する。連体修飾していない場合は[9]
へ移行する。ただし、例えば「東京、大阪、名古屋で
は」における“東京”と“大阪”は並列の連体修飾とな
るが、この様な場合は[9]へ移行する。 [8] 限定・非限定修飾関係によるアクセント句接
続情報設定処理を行う。この処理の詳細は図3に示す。
【0034】[9] 文節Bi、Bi+1間のアクセ
ント句接続を抑圧接続とする。 [10] 文節Bi、Bi+1間のアクセント句接続を
非抑圧接続とする。 [11] 文節カウンタiが総文節数−1と等しいか否
かを判定する。等しい場合は[13]へ移行する。等し
くない場合は[12]へ移行する。 [12] 文節カウンタiに1を加算する。
ント句接続を抑圧接続とする。 [10] 文節Bi、Bi+1間のアクセント句接続を
非抑圧接続とする。 [11] 文節カウンタiが総文節数−1と等しいか否
かを判定する。等しい場合は[13]へ移行する。等し
くない場合は[12]へ移行する。 [12] 文節カウンタiに1を加算する。
【0035】[13] 文節Bi+1内にアクセント句
境界があれば、その境界のアクセント句接続を抑圧接続
とする。 図3は限定・非限定修飾関係によるアクセント句接続情
報設定処理フローを示し、図2の[8]を詳細に示すも
のである。以下、図3に示される処理について説明す
る。
境界があれば、その境界のアクセント句接続を抑圧接続
とする。 図3は限定・非限定修飾関係によるアクセント句接続情
報設定処理フローを示し、図2の[8]を詳細に示すも
のである。以下、図3に示される処理について説明す
る。
【0036】<1> Biに最も近い右枝分かれ文節
境界或は文頭直後の文節からBiまでをPiとする。こ
こで、右枝分かれ文節境界とは、その文節境界直前の文
節が直後の文節に係らない文節境界をいう。 <2> Bi+1の自立語部をNi+1とする。 <3> Piが説明表現候補であるか否かを判定す
る。説明表現候補である場合は<8>へ移行する。説明
表現候補でない場合は<4>へ移行する。ここで、説明
表現候補とは、以下に例示される表現の様に、ニュース
文によく現われる説明表現になり易い表現をいう。
境界或は文頭直後の文節からBiまでをPiとする。こ
こで、右枝分かれ文節境界とは、その文節境界直前の文
節が直後の文節に係らない文節境界をいう。 <2> Bi+1の自立語部をNi+1とする。 <3> Piが説明表現候補であるか否かを判定す
る。説明表現候補である場合は<8>へ移行する。説明
表現候補でない場合は<4>へ移行する。ここで、説明
表現候補とは、以下に例示される表現の様に、ニュース
文によく現われる説明表現になり易い表現をいう。
【0037】(説明表現候補例)〜を示す、〜を表す、
〜となる、〜である、〜といわれる、〜と呼ばれる、〜
などの <4> Ni+1が複合語をも含む固有名詞であるか
否かを判定する。固有名詞である場合は<5>へ移行す
る。固有名詞でない場合は<9>へ移行する。
〜となる、〜である、〜といわれる、〜と呼ばれる、〜
などの <4> Ni+1が複合語をも含む固有名詞であるか
否かを判定する。固有名詞である場合は<5>へ移行す
る。固有名詞でない場合は<9>へ移行する。
【0038】<5> Piが限定確定修飾表現である
か否かを判定する。限定確定修飾表現である場合は<9
>へ移行する。限定確定修飾表現ではない場合には<6
>へ移行する。ここで、限定確定修飾表現とは、図9に
示される表現パターンの様に、常に限定修飾になると考
えられる修飾表現をいう。 <6> Piがニュース文時間表現或はニュース文状
態表現であるかを判定する。条件を満足する場合は<7
>へ移行する。条件を満足しない場合は<10>へ移行
する。
か否かを判定する。限定確定修飾表現である場合は<9
>へ移行する。限定確定修飾表現ではない場合には<6
>へ移行する。ここで、限定確定修飾表現とは、図9に
示される表現パターンの様に、常に限定修飾になると考
えられる修飾表現をいう。 <6> Piがニュース文時間表現或はニュース文状
態表現であるかを判定する。条件を満足する場合は<7
>へ移行する。条件を満足しない場合は<10>へ移行
する。
【0039】ここで、ニュース文時間表現とは、図9に
示される表現パターンの様に、ニュース文によく現われ
やすい時間表現をいう。また、ニュース文状態表現と
は、図9に示される表現パターンの様に、ニュース文に
よく現われやすい状態表現をいう。 <7> 非限定C、D抽出処理を行う。この処理の詳
細は図6に示す。
示される表現パターンの様に、ニュース文によく現われ
やすい時間表現をいう。また、ニュース文状態表現と
は、図9に示される表現パターンの様に、ニュース文に
よく現われやすい状態表現をいう。 <7> 非限定C、D抽出処理を行う。この処理の詳
細は図6に示す。
【0040】<8> 非限定A抽出処理を行う。この
処理の詳細は図4に示す。 <9> 文節Bi、Bi+1の修飾関係を限定修飾関
係とする。 <10> 非限定B抽出処理を行う。この処理の詳細は
図5に示す。 <11> 文節Bi、Bi+1の修飾関係を限定修飾関
係であるか否かを判定する。限定修飾関係である場合は
<12>へ移行する。限定修飾関係ではない場合には<
13>へ移行する。
処理の詳細は図4に示す。 <9> 文節Bi、Bi+1の修飾関係を限定修飾関
係とする。 <10> 非限定B抽出処理を行う。この処理の詳細は
図5に示す。 <11> 文節Bi、Bi+1の修飾関係を限定修飾関
係であるか否かを判定する。限定修飾関係である場合は
<12>へ移行する。限定修飾関係ではない場合には<
13>へ移行する。
【0041】<12> 文節Bi、Bi+1間のアクセ
ント句接続を抑圧接続とする。 <13> 文節Bi、Bi+1間のアクセント句接続を
非抑圧接続とする。図4は非限定A抽出処理フローを示
し、図3の<8>を詳細に説明するものである。以下、
図4に示す処理を説明する。 <8−1> P=Pi、N=Ni+1として、非限定A
抽出条件をすべて満足するか否かを判定する。すべて満
足する場合は<8−2>へ移行する。そうではない場合
は<8−3>へ移行する。
ント句接続を抑圧接続とする。 <13> 文節Bi、Bi+1間のアクセント句接続を
非抑圧接続とする。図4は非限定A抽出処理フローを示
し、図3の<8>を詳細に説明するものである。以下、
図4に示す処理を説明する。 <8−1> P=Pi、N=Ni+1として、非限定A
抽出条件をすべて満足するか否かを判定する。すべて満
足する場合は<8−2>へ移行する。そうではない場合
は<8−3>へ移行する。
【0042】ここで、非限定A抽出条件とは以下の3条
件を表す。 [非限定A抽出条件] 条件1 : Pが説明表現候補である。 条件2 : Nが「外の関係」(*1)の「底(被修飾部)
の名詞」にはなり得ない(*2)。
件を表す。 [非限定A抽出条件] 条件1 : Pが説明表現候補である。 条件2 : Nが「外の関係」(*1)の「底(被修飾部)
の名詞」にはなり得ない(*2)。
【0043】条件3 : Nの構成単語数が1 かつ
字種が英字またはカタカナ、またはNの構成単語数が2
以上(複合語)。 (注) (*1) 外の関係:NがPの格要素にはならない修飾
関係。ここで、PはNの内容を表し、またはその内容に
かかわる(内容補充的修飾)という意味的特徴を有す
る。(文献「寺村 寺村秀夫論文集I くろしお出版」
より引用) (*2) 外の関係の底の名詞になり得るのは、以下の
4種類の名詞に限られる。(同じく、文献「寺村 寺村
秀夫論文集I くろしお出版」より引用) ・発話、思考の名詞:言葉、申し出、依頼その他 ・「コト」を表す名詞:事実、話、結果その他 ・感覚の名詞:姿、形・絵その他 ・「相対性」の名詞:上、下、前日、朝その他 <8−2> 文節Bi、Bi+1の修飾関係を非限定修
飾関係とする。
字種が英字またはカタカナ、またはNの構成単語数が2
以上(複合語)。 (注) (*1) 外の関係:NがPの格要素にはならない修飾
関係。ここで、PはNの内容を表し、またはその内容に
かかわる(内容補充的修飾)という意味的特徴を有す
る。(文献「寺村 寺村秀夫論文集I くろしお出版」
より引用) (*2) 外の関係の底の名詞になり得るのは、以下の
4種類の名詞に限られる。(同じく、文献「寺村 寺村
秀夫論文集I くろしお出版」より引用) ・発話、思考の名詞:言葉、申し出、依頼その他 ・「コト」を表す名詞:事実、話、結果その他 ・感覚の名詞:姿、形・絵その他 ・「相対性」の名詞:上、下、前日、朝その他 <8−2> 文節Bi、Bi+1の修飾関係を非限定修
飾関係とする。
【0044】<8−3> 文節Bi、Bi+1の修飾関
係を限定修飾関係とする。 図5は非限定B抽出処理フローを示し、図3の<10>
を詳細に説明するものである。以下、図5に示される処
理を説明する。 <10−1> Ni+1が非限定固有名詞優先グループ
(図8参照)であるか否かを判定する。非限定固有名詞
優先グループである場合は<10−2>へ移行する。非
限定固有名詞優先グループではない場合は<10−3>
へ移行する。
係を限定修飾関係とする。 図5は非限定B抽出処理フローを示し、図3の<10>
を詳細に説明するものである。以下、図5に示される処
理を説明する。 <10−1> Ni+1が非限定固有名詞優先グループ
(図8参照)であるか否かを判定する。非限定固有名詞
優先グループである場合は<10−2>へ移行する。非
限定固有名詞優先グループではない場合は<10−3>
へ移行する。
【0045】<10−2> P=Pi、N=Ni+1と
して、純粋な装定・限定修飾パターンに該当するか否か
を判定する。該当する場合は、<10−5>へ移行す
る。該当しない場合は<10−4>へ移行する。純粋な
装定・限定修飾パターンとは、図10に示される様に、
純粋な装定の限定修飾関係となるPとNの組み合わせパ
ターンをいう。
して、純粋な装定・限定修飾パターンに該当するか否か
を判定する。該当する場合は、<10−5>へ移行す
る。該当しない場合は<10−4>へ移行する。純粋な
装定・限定修飾パターンとは、図10に示される様に、
純粋な装定の限定修飾関係となるPとNの組み合わせパ
ターンをいう。
【0046】<10−3> P=Pi、N=Ni+1と
して、非限定Bパターンに該当するか否かを判定する。
該当する場合は<10−4>へ移行する。該当しない場
合は<10−5>へ移行する。非限定Bパターンとは、
図11に示される様に、限定優先固有名詞グループが非
限定Bの被修飾部となるPとNの組み合わせパターンを
いう。
して、非限定Bパターンに該当するか否かを判定する。
該当する場合は<10−4>へ移行する。該当しない場
合は<10−5>へ移行する。非限定Bパターンとは、
図11に示される様に、限定優先固有名詞グループが非
限定Bの被修飾部となるPとNの組み合わせパターンを
いう。
【0047】<10−4> 文節Bi、Bi+1の修飾
関係を限定修飾関係とする。 <10−5> 文節Bi、Bi+1の修飾関係を非限定
修飾関係とする。図6は非限定C、D抽出処理フローを
示し、図3の<7>を詳細に説明するものである。以
下、図6に示される処理を説明する。 <7−1> P=Pi、N=Ni+1として、非限定
C、Dパターンに該当するか否かを判定する。該当する
場合は<7−2>へ移行する。該当しない場合は <7−3>へ移行する。非限定C、Dパターンとは、図
12に示される様に、非限定CまたはDとなるPとNの
組み合わせパターンをいう。
関係を限定修飾関係とする。 <10−5> 文節Bi、Bi+1の修飾関係を非限定
修飾関係とする。図6は非限定C、D抽出処理フローを
示し、図3の<7>を詳細に説明するものである。以
下、図6に示される処理を説明する。 <7−1> P=Pi、N=Ni+1として、非限定
C、Dパターンに該当するか否かを判定する。該当する
場合は<7−2>へ移行する。該当しない場合は <7−3>へ移行する。非限定C、Dパターンとは、図
12に示される様に、非限定CまたはDとなるPとNの
組み合わせパターンをいう。
【0048】<7−2> 文節Bi、Bi+1の修飾関
係を非限定修飾関係とする。 <7−3> 文節Bi、Bi+1の修飾関係を限定修飾
関係とする。 次に、図3の限定・非限定修飾関係によるアクセント句
接続情報設定処理を図14の文節Bi=“示す”の場合
を使用して説明する。図3<1>において、Pi=“景
気の現状を示す”が設定される。<2>において、Ni
+1=“一致指数”が設定される。<3>においてPi
が説明表現候補であるので<8>に移行する。
係を非限定修飾関係とする。 <7−3> 文節Bi、Bi+1の修飾関係を限定修飾
関係とする。 次に、図3の限定・非限定修飾関係によるアクセント句
接続情報設定処理を図14の文節Bi=“示す”の場合
を使用して説明する。図3<1>において、Pi=“景
気の現状を示す”が設定される。<2>において、Ni
+1=“一致指数”が設定される。<3>においてPi
が説明表現候補であるので<8>に移行する。
【0049】次に、図4<8−1>において、Pi=説
明表現候補、Ni+1≠外の関係の底の名詞、Ni+1
の構成単語数=2(“一致”と“指数”)であるため
に、非限定A抽出条件をすべて満足するので<8−2>
に移行する。この結果、Bi、Bi+1は非限定修飾関
係となる。次に、図3<11>において、Bi、Bi+
1は非限定修飾関係であるので、<12>に移行する。
そして<12>において、Bi、Bi+1間のアクセン
ト句接続に「抑圧接続」が設定される。
明表現候補、Ni+1≠外の関係の底の名詞、Ni+1
の構成単語数=2(“一致”と“指数”)であるため
に、非限定A抽出条件をすべて満足するので<8−2>
に移行する。この結果、Bi、Bi+1は非限定修飾関
係となる。次に、図3<11>において、Bi、Bi+
1は非限定修飾関係であるので、<12>に移行する。
そして<12>において、Bi、Bi+1間のアクセン
ト句接続に「抑圧接続」が設定される。
【0050】
【発明の効果】以上の通りであって、この発明によれ
ば、アクセント句接続情報設定処理において、従来の枝
分かれ構造に加えて、連体修飾の限定・非限定修飾関係
の影響に着目し、形態素・係り受け解析と入力される主
として漢字かな混じりのニュース文の表現特徴を利用し
て限定・非限定修飾関係の判定を行い、より高精度にア
クセント句接続情報を設定することができる。これによ
り、特にニュース文をより自然で聞き易い合成音声によ
り読み上げることができる。
ば、アクセント句接続情報設定処理において、従来の枝
分かれ構造に加えて、連体修飾の限定・非限定修飾関係
の影響に着目し、形態素・係り受け解析と入力される主
として漢字かな混じりのニュース文の表現特徴を利用し
て限定・非限定修飾関係の判定を行い、より高精度にア
クセント句接続情報を設定することができる。これによ
り、特にニュース文をより自然で聞き易い合成音声によ
り読み上げることができる。
【図1】この発明を実施する音声合成装置を示すブロッ
ク図
ク図
【図2】この発明のアクセント句接続情報設定処理フロ
ー図。
ー図。
【図3】限定・非限定修飾関係によるアクセント句接続
情報設定処理のフロー図。
情報設定処理のフロー図。
【図4】非限定A抽出処理フロー図。
【図5】非限定B抽出処理フロー図。
【図6】非限定C、D抽出処理フロー図。
【図7】非限定修飾関係の分類を示す図。
【図8】固有名詞の分類例を示す図。
【図9】非限定B、C、Dを抽出するためのPの分類例
を示す図。
を示す図。
【図10】純粋な装定・限定修飾パターンの例を示す
図。
図。
【図11】非限定Bパターンの例を示す図。
【図12】非限定C、Dパターンの例を示す図。
【図13】図1の言語解析処理部の例を示す図。
【図14】読み・韻律情報設定処理部の例を示す図。
(1) 漢字かな混じり文 (2) 言語解析処理部 (2−1) 形態素解析処理部 (2−2) 係り受け解析処理部 (3) 単語情報・係り受け情報付き分かち書き単
語列 (4) 読み・韻律情報設定処理部 (4−1) 読み付与処理部 (4−2) アクセント句情報設定処理部 (4−3) アクセント句接続情報設定処理部 (4−4) ポーズ情報設定処理部 (5) 韻律情報付きカナ列 (6) 合成音声出力処理部 (7) 合成音声 [7] 修飾表現判定処理部 [8] 限定・非限定修飾関係によるアクセント句
接続情報設定処理部
語列 (4) 読み・韻律情報設定処理部 (4−1) 読み付与処理部 (4−2) アクセント句情報設定処理部 (4−3) アクセント句接続情報設定処理部 (4−4) ポーズ情報設定処理部 (5) 韻律情報付きカナ列 (6) 合成音声出力処理部 (7) 合成音声 [7] 修飾表現判定処理部 [8] 限定・非限定修飾関係によるアクセント句
接続情報設定処理部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−160283(JP,A) 特開 平5−134692(JP,A) 特開 平5−134691(JP,A) 特開 平5−224687(JP,A) 阿部久子、小原永,限定・非限定修飾 関係に着目したアクセント句情報設定方 法,人工知能学会、言語・音声理解と対 話処理研究会資料,日本,VOL8,31 −38 (58)調査した分野(Int.Cl.7,DB名) G10L 13/08
Claims (5)
- 【請求項1】 入力される漢字かな混じり文の隣接する
文節間の連体修飾関係が限定修飾関係であるか或は非限
定修飾関係であるかを判定して連体非限定修飾関係にあ
る2文節間にアクセント句境界がある場合のアクセント
句接続の自然性を向上させることを特徴とするテキスト
音声合成方法。 - 【請求項2】 漢字かな混じり文を入力して単語を認定
し、各単語に形態素解析処理を施して単語情報を求め、
単語情報に基づいて文節を認定し、文節に係り受け解析
処理を施して単語情報・係り受け情報付き分かち書き単
語列を求め、次いで、文の読みを表すカナ列を生成する
読み付与処理、カナ列をアクセント句単位に分割しアク
セント句のアクセント型を設定するアクセント句情報設
定処理を施し、ここにおいて隣接する2文節が連体修飾
・被修飾表現であるか否かを判定して、隣接する2文節
が連体修飾・被修飾表現ではない場合は統語情報のみを
使用してアクセント句接続情報設定処理を行うと共に、
隣接する2文節が連体修飾・被修飾表現である場合はそ
の修飾・被修飾表現が限定修飾関係であるか非限定修飾
関係であるかを判定してアクセント句接続情報設定処理
を施し、各アクセント句間にポーズ情報を設定するポー
ズ情報設定処理を施して韻律情報付きカナ列を求め、合
成音声を出力することを特徴とするテキスト音声合成方
法。 - 【請求項3】 請求項1および請求項2の何れかに記載
されるテキスト音声合成方法において、入力される漢字
かな混じり文をニュース文とすることを特徴とするテキ
スト音声合成方法。 - 【請求項4】 入力される漢字かな混じり文について単
語を認定すると共に各単語の単語情報を求める形態素解
析処理部および文節を認定すると共に文節間の係り受け
情報を求める係り受け解析処理部より成る言語解析処理
部を具備し、言語解析処理結果の出力である単語情報・
係り受け情報付き分かち書き単語列について文の読みを
表すカナ列を生成する読み付与処理部と、カナ列をアク
セント句単位に分割しアクセント句のアクセント型を設
定するアクセント句情報設定処理部と、各アクセント句
間にアクセント句接続情報を設定するアクセント句接続
情報設定処理部と、各アクセント句間にポーズ情報を設
定するポーズ情報設定処理部とより成る読み・韻律情報
設定処理部を具備し、 アクセント句接続情報設定処理部は、隣接する2文節が
連体修飾・被修飾表現であるか否かを判定する連体修飾
表現判定処理部と、隣接する2文節が連体修飾・被修飾
表現ではない場合は統語情報のみを使用したアクセント
句接続情報設定処理を行う統語情報によるアクセント句
接続情報設定処理部と、隣接する2文節が連体修飾・被
修飾表現である場合はその修飾・被修飾表現が限定修飾
関係であるか非限定修飾関係であるかを判定してアクセ
ント句接続情報設定処理を行う限定・非限定修飾関係に
よるアクセント句接続情報設定処理部とより成り、読み
・韻律情報設定処理部の出力である韻律情報付きカナ列
を合成音声出力処理部により合成音声に変換することを
特徴とするテキスト音声合成装置。 - 【請求項5】 請求項4に記載されるテキスト音声合成
装置において、入力される漢字かな混じり文はニュース
文であることを特徴とするテキスト音声合成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03452994A JP3248552B2 (ja) | 1994-03-04 | 1994-03-04 | テキスト音声合成方法およびこの方法を実施する装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03452994A JP3248552B2 (ja) | 1994-03-04 | 1994-03-04 | テキスト音声合成方法およびこの方法を実施する装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH07244495A JPH07244495A (ja) | 1995-09-19 |
| JP3248552B2 true JP3248552B2 (ja) | 2002-01-21 |
Family
ID=12416809
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP03452994A Expired - Fee Related JP3248552B2 (ja) | 1994-03-04 | 1994-03-04 | テキスト音声合成方法およびこの方法を実施する装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3248552B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4636673B2 (ja) * | 2000-11-16 | 2011-02-23 | パナソニック株式会社 | 音声合成装置および音声合成方法 |
-
1994
- 1994-03-04 JP JP03452994A patent/JP3248552B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
| Title |
|---|
| 阿部久子、小原永,限定・非限定修飾関係に着目したアクセント句情報設定方法,人工知能学会、言語・音声理解と対話処理研究会資料,日本,VOL8,31−38 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH07244495A (ja) | 1995-09-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Divay et al. | Algorithms for grapheme-phoneme translation for English and French: Applications for database searches and speech synthesis | |
| Yoo et al. | The performance evaluation of continuous speech recognition based on Korean phonological rules of cloud-based speech recognition open API | |
| Carlson et al. | Linguistic processing in the KTH multi-lingual text-to-speech system | |
| JP3248552B2 (ja) | テキスト音声合成方法およびこの方法を実施する装置 | |
| Chala et al. | Design and development of a text-to-speech synthesizer for Afan Oromo | |
| El-Imam et al. | Rules and algorithms for phonetic transcription of standard Malay | |
| Oflazer | Morphological processing for Turkish | |
| Umeda et al. | The parsing program for automatic text-to-speech synthesis developed at the Electrotechnical Laboratory in 1968 | |
| Akmuradov et al. | Developing a database of Uzbek language concatenative speech synthesizer | |
| Ghani et al. | Jawi-Malay Transliteration | |
| Fitt et al. | Representing the environments for phonological processes in an accent-independent lexicon for synthesis of English | |
| Külekçi et al. | An infrastructure for Turkish prosody generation in text-to-speech synthesis | |
| JP2892031B2 (ja) | テキスト音声合成装置 | |
| JP3364820B2 (ja) | 合成音声出力方法及び装置 | |
| JP3248548B2 (ja) | テキスト音声合成方法およびこれを実施する装置 | |
| Romsdorfer | Polyglot text-to-speech synthesis: Text analysis & prosody control | |
| Rosenhouse | Features of intonation in bedouin arabic narratives of the galilée (northern israel) | |
| Alkhairy et al. | An integrated, bidirectional pronunciation, morphology, and diacritics finite-state system | |
| JP2996978B2 (ja) | テキスト音声合成装置 | |
| Hoge et al. | Syllable-based acoustic-phonetic decoding and wordhypotheses generation in fluently spoken speech | |
| Gorman et al. | Morphological analysis and generation | |
| Ferri et al. | A complete linguistic analysis for an Italian text-to-speech system | |
| Boas | Classification of American Indian languages | |
| JP2721018B2 (ja) | 音声規則合成装置 | |
| Hagos et al. | Shared Syllables for Amharic Tigrigna Text to Speech Synthesis |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |