JP4083400B2

JP4083400B2 - アクセント句境界決定装置、音声合成装置及び方法並びにプログラム

Info

Publication number: JP4083400B2
Application number: JP2001230188A
Authority: JP
Inventors: 洋一藤井; 泰石川
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2001-07-30
Filing date: 2001-07-30
Publication date: 2008-04-30
Anticipated expiration: 2021-07-30
Also published as: JP2003044073A

Description

【０００１】
【発明の属する技術分野】
この発明はテキスト内容を音声として合成する音声合成装置に係り、特にアクセント句境界が既知であるデータを基にして学習した学習データを利用して合成対象のテキストにおける最も尤もらしいアクセント句境界位置を決定するアクセント句境界決定装置、これを用いた音声合成装置、アクセント句境界決定方法、音声合成方法、及びアクセント句境界決定プログラム並びに音声合成プログラムに関するものである。
【０００２】
【従来の技術】
複数の単語から構成される複合語は、通常、いくつかの短い単位に区切って発音される。この区切り、即ち、アクセントの切れ目の挿入を適当に行わなければ、複合語の意味が曖昧に伝わってしまう。
このような複合語のアクセント決定に関する技術として、例えば特開平２−９３４９９号公報に開示される「複合語のアクセント句境界付与方式」がある。この方式は、複合語の構成単語を用言性単語に分類した情報と、その用言性単語に隣接する単語の品詞情報とに基づいて、複合語のアクセント句境界を設定するものである。
【０００３】
以下で、上記従来方式を採用する音声合成装置について説明する。
図１６は特開平２−９３４９９号公報に開示された従来の音声合成装置の構成を概略的に示すブロック図である。図において、１０１はテキストを形態素に分割するテキスト解析手段で、解析辞書１１１を利用して合成対象であるテキストを形態素に分割する。１０２はテキスト解析手段１０１で分割した形態素に対して名詞連続中の名詞か否かを判定する名詞連続判定手段であって、名詞連続と判定した場合と名詞連続でないと判定した場合で処理を分けるとともに、名詞連続中の名詞であると判定すると、該名詞の細分類先を決定する。例えば、名詞単語のうち用言系単語（事物の動作・作用・存在・性質・状態について叙述する語）を動詞用法、ヲ格用法、ニ格用法、主体用法若しくは名詞用法に分類し、非用言系単語を体言系単語、相言系単語若しくは副言系単語に分類する。１０３は名詞連続アクセント句決定手段で、名詞連続判定手段１０２で判定した名詞連続中の形態素情報及び細分類情報とアクセント判定基準１１２に記述された基準とを照合し、名詞連続のアクセント句境界を決定する。１０４は音響処理手段であって、名詞連続判定手段１０２で名詞連続でないと判定された形態素と名詞連続アクセント句決定手段１０３で決定された名詞連続のアクセント情報とに基づいて合成音を生成する。
【０００４】
１１１は合成対象のテキストを解析する際にテキスト解析手段１０１に利用される解析辞書であって、例えば単語の表記、品詞コード、読み、及び品詞コードにアクセント情報などの付加情報を付与した単語データをテーブルとして格納している。１１２は名詞の細分類とその前後の接続品詞によってアクセントをどこに設けるかを決定する際に利用されるアクセント判定基準で、名詞連続判定手段１０２によって付与した細分類の連接情報の優先度と２つ以上の細分類の連続とがアクセント句としてどう振る舞うかが記述されている。例えば、アクセント判定基準としては、優先度が最大な組み合わせとして「ヲ格用法系単語」−「体言系単語」、次の優先度を有する組み合わせとして「ニ格用法系単語」−「体言系単語」があり、最も優先度が低い組み合わせとして「体言系単語」−「ニ格用法系単語」−「体言系単語」を定めておく。また、アクセント判定基準には、各名詞句の構成に応じて予め定められた位置にアクセント句の境界を付与するための名詞句構造データとして、｛（体言系名詞、ヲ格用法）→複合する｝、｛（体言系名詞、体言系名詞）→複合する｝、｛（体言系名詞、動詞用法）→複合しない｝などの情報が格納される
【０００５】
次に動作について説明する。
先ず、合成対象テキストとして、例えば「ビル管理会社設立」を該音声合成装置に入力させた場合を考える。このとき、テキスト解析手段１０１は、解析辞書１１１内の上記テーブルを参照して、「ビル管理会社設立」を「ビル（名詞）」、「管理（サ変）」、「会社（名詞）」、「設立（サ変）」なる形態素に分割する。
【０００６】
次に、これらの形態素は、名詞連続判定手段１０２によって「ビル（名詞）：体言系単語」、「管理（サ変）：ヲ格用法」、「会社（名詞）：体言系単語」、「設立（サ変）：動詞用法」というように用法が設定される。ここで、例えば「管理」は、上記「ヲ格用法」の他に「動詞用法」も考えられ、これに伴った組み合わせが存在する。
【０００７】
続いて、名詞連続アクセント句決定手段１０３では、名詞連続判定手段１０２で設定した用法に対して、「ビル」と「管理」との複合語について優先度の高い「体言系単語」−「ヲ格用法系単語」を選択して、「ビル管理」を名詞句とする。また、「ビル管理」と「会社」とについては、これらが共に非用言系単語であることから「ビル管理会社」を１つの名詞句とする。さらに、名詞句「ビル管理会社」と用言系単語「設立」との間では、優先度の高い「体言系単語」−「動詞用法」なる組み合わせが選択される。
【０００８】
このあと、名詞連続アクセント句決定手段１０３は、上記のようにして設定した名詞句や用言系単語の組み合わせに対して、アクセント判定基準１１２に記述される｛（体言系名詞、ヲ格用法）→結合｝、｛（体言系名詞、体言系名詞）→結合｝、｛（体言系名詞、動詞用法）→結合せず｝の情報を、テキストの先頭、即ち、左の形態素から適用する。これによって、「ビル管理会社」と「設立」との間にアクセント句の境界が設けられる。
【０００９】
【発明が解決しようとする課題】
従来のアクセント句境界位置の決定は以上のようになされているので、アクセント句の境界決定に品詞及び単語が有する「用法」に関する情報が解析辞書１１１に漏れなく記載されている必要があり、新語への対応が容易でなくメンテナンスに労力や費用がかかるという課題があった。
【００１０】
具体的に説明すると、従来では、テキスト解析の結果として得られる形態素列中の名詞連続に対して、アクセント判定基準１１２のような予め得られた知見をルール化した基準を用いてアクセント句境界を決定する。即ち、品詞及び単語が有する「用法」を予め辞書に記入しておき、その用法を利用して１つの塊としてのアクセント句として成立するか否かを判断する。しかしながら、実世界では日々新語が生まれており、新語の発生の度に辞書１１１をメンテナンスする必要が生じる。
【００１１】
また、単語に対して用法を付与するためには高度な知識が必要であり、簡単に単語を追加して正しい合成音声を得ることができないという課題があった。
【００１２】
この発明は上記のような課題を解決するためになされたもので、アクセント句境界が既知であるデータを基にして学習した学習データを利用して合成対象のテキスト中における最も尤もらしいアクセント句境界位置を決定することで、辞書中の単語に用法を記述しなくても正しい合成音声を得ることができるとともに、未知語が存在した解析結果に対しても尤らしい品詞を推定して処理することで、正しい合成音声を得ることができるアクセント句境界決定装置、これを用いた音声合成装置、アクセント句境界決定方法、音声合成方法、及びアクセント句境界決定プログラム並びに音声合成プログラムを得ることを目的とする。
【００１３】
【課題を解決するための手段】
この発明に係るアクセント句境界決定装置は、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストを格納する学習用テキスト記憶手段と、入力したテキストの形態素列を生成するテキスト解析手段と、該テキスト解析手段が生成した形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出する名詞連続抽出手段と、名詞連続列を構成する各形態素に形態素属性を付与し、該名詞連続列に関する形態素属性列を生成する形態素属性付与手段と、学習用テキストの名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習手段と、処理対象のテキストの名詞連続列に関する形態素属性列とアクセント句境界学習データとに基づいて、該テキストの名詞連続列におけるアクセント句の境界位置を決定するアクセント句境界決定手段とを備えるものである。
【００１４】
この発明に係るアクセント句境界決定装置は、アクセント句境界学習手段が学習用テキストからアクセント句境界学習データを生成するにあたり、該テキストの名詞連続列における固有名詞の形態素を抽出するとともに、該形態素に隣接する固有名詞以外の形態素の頻度を集計して所定値以上となる形態素を形態素属性として登録する形態素属性作成手段を備えるものである。
【００１５】
この発明に係るアクセント句境界決定装置は、アクセント句境界学習手段が形態素属性列の生起確率としてＮ−ｇｒａｍ統計による条件付き確率を用いるものである。
【００１６】
この発明に係るアクセント句境界決定装置は、テキスト解析手段が、入力テキスト内に仮名表記の未知語が存在する場合、読み情報が一致する形態素の情報を付与するものである。
【００１７】
この発明に係るアクセント句境界決定装置は、入力テキスト内に仮名表記以外の未知語が存在する場合、該未知語自身を名詞として扱うとともに、これに隣接する形態素の形態素属性を含んでなる形態素属性列の生起確率が最も高くなる形態素属性とするものである。
【００１８】
この発明に係るアクセント句境界決定装置は、アクセント句境界学習手段が、アクセント句の境界位置から形態素の先頭位置までのモーラ数を関連付けたアクセント句境界学習データを生成するものである。
【００１９】
この発明に係るアクセント句境界決定装置は、アクセント句境界学習手段がアクセント句の境界位置から形態素の先頭位置までのモーラ数と所定の規定値との大小関係によって決定される２値情報を形態素の先頭位置を特定する情報として用いるものである。
【００２０】
この発明に係る音声合成装置は、上記アクセント句境界決定装置と、処理対象のテキストの名詞連続列以外の形態素列とアクセント句境界決定装置がアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を生成する韻律情報生成手段と、該韻律情報に基づいて処理対象テキストに関する合成音声を生成する音声合成処理手段とを備えるものである。
【００２１】
この発明に係るアクセント句境界決定方法は、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップとを備えるものである。
【００２２】
この発明に係る音声合成方法は、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと、処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて処理対象テキストに関する合成音声を生成する音声合成処理ステップとを備えるものである。
【００２３】
この発明に係るアクセント句境界決定プログラムは、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップとをコンピュータに実行させるものである。
【００２４】
この発明に係る音声合成プログラムは、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと、処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて処理対象テキストに関する合成音声を生成する音声合成処理ステップとをコンピュータに実行させるものである。
【００２５】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態１．
図１はこの発明の実施の形態１による音声合成装置の構成を示すブロック図である。図において、１は解析辞書８を用いて入力したテキストの形態素列を生成するテキスト解析手段で、アクセント情報付きテキストコーパス９に格納されたアクセント情報付きテキスト（学習用テキスト）や実際の合成対象テキスト（処理対象テキスト）を入力して、それぞれの形態素列を生成する。このテキスト解析手段１による形態素列の生成には、最長一致、文節数最小法、及びコスト最小法などの既知の形態素解析アルゴリズムを用いる。例えば、首藤公昭、吉村賢治「日本語の構造とその解析」、情報処理Ｖｏｌ．２７，Ｎｏ．８，ｐｐ．９４７〜９５４，１９８６に開示される形態素解析アルゴリズムを使用しても良い。２はテキスト解析手段１にて切り出したテキスト中の形態素列から名詞として認識すべき形態素が連続する形態素列（名詞連続列）を特定し、抽出する名詞連続抽出手段である。名詞として認識すべき形態素としては、その品詞が普通名詞、固有名詞、サ変名詞以外にも、特定の品詞の単語に接続して１つの意味をなす接頭語、接尾語や、動詞連用形が名詞として転成した形態素などを含むものとする。名詞連続抽出手段２は、アクセント情報付きテキストコーパス９からのテキストに対しては名詞連続列のみを次の処理を行う形態素属性付与手段３に出力し、合成対象テキストに対しては名詞連続列を形態素属性付与手段３に、名詞連続列以外の形態素列を韻律情報生成手段６に出力する。
【００２６】
３は形態素に形態素属性を付与する形態素属性付与手段であって、名詞連続抽出手段２がアクセント情報付きテキストコーパス９のテキストの形態素列及び合成対象テキストの形態素列から抽出した名詞連続列に対して、形態素・属性対応テーブル１０に基づいて形態素属性を付与する。４は形態素属性付与手段３が生成した形態素属性列に基づいてアクセント句の境界位置を決定するためのデータを学習するアクセント句境界学習手段で、アクセント句の境界位置を特定するアドレス情報を有する形態素属性列の頻度を集計し、アクセント句境界位置の情報を含む形態素属性列が生起する確率を計算し、アクセント句境界学習データ１１に格納する。５は形態素列におけるアクセント句の境界位置を決定するアクセント句境界決定手段であって、予め学習しておいたアクセント句境界学習データ１１を利用して、合成対象テキスト中の名詞連続列に関する形態素属性列に対して最も尤度が高いアクセント句の境界位置を決定する。６はアクセント句境界決定手段５でアクセント句の境界位置を決定した名詞連続列、及び該名詞連続以外の形態素列を１つの形態素列に戻し、アクセント核決定ルール１２に基づいて形態素列におけるアクセント核位置をはじめとする合成のための韻律情報を生成する韻律情報生成手段である。７は韻律情報生成手段６で決定されたアクセント句やアクセント核の位置などの韻律情報に基づいて、音響辞書１３に格納しておいた音素を組み合わせて合成音声を生成する音響処理手段（音声合成処理手段）である。
【００２７】
８はテキストを解析して形態素列を生成する際にテキスト解析手段１によって参照される解析辞書で、形態素となる単語の見だし、読み、品詞に加え、モーラ数やアクセント型などの情報が登録されている。９はアクセント句の境界位置やアクセント核位置を特定するアクセント情報が付与された大量のアクセント情報付きテキスト（学習用テキスト）を格納するアクセント情報付きテキストコーパス（学習用テキスト記憶手段）で、名詞連続列におけるアクセント句の境界位置の学習データを獲得するために利用する。また、アクセント情報付きテキストコーパス９に格納するアクセント情報付きテキストとしては、名詞連続列を含んでいるものであればよく、必ずしも主語・述語を持った形の文でなくても良い。１０は名詞連続列中の各形態素に対して属性を付与する際に使用する形態素・属性対応テーブルで、形態素に付与すべき属性名を該形態素の見だしや品詞に対応付けた情報が格納されている。１１は名詞連続列のアクセント句の境界位置を決定する際に使用するアクセント句境界学習データであって、アクセント情報付きテキストの名詞連続列に関する形態素属性列に対して、アクセント句境界の位置を特定するアクセント情報を含む形態素属性列が生起する確率を計算した情報を格納する。１２はアクセント句に区切られた形態素列に対してアクセント核を決定する際に使用するアクセント核決定ルールで、連続する形態素に対するアクセント核の移動を示すルールが格納されている。１３は合成音声を生成する際に使用する音響辞書であって、合成音声の基となる音素片を格納する。
【００２８】
ここで、テキスト解析手段１、名詞連続抽出手段２、形態素属性付与手段３、アクセント句境界学習手段４、アクセント句境界決定手段５、韻律情報生成手段６及び音響処理手段７の一部の機能は、コンピュータ装置のプロセッサ（ＣＰＵ）に実行させるプログラムによって実現することができる。また、解析辞書８、アクセント情報付きテキストコーパス９、形態素・属性対応テーブル１０、アクセント句境界学習データ１１、アクセント核決定テーブル１２や音響辞書１３の機能は、上記プロセッサによって適宜データの読み出し・書き込みが可能なコンピュータ装置が具備する記憶装置を利用することで実現することができる。
【００２９】
次に動作について説明する。
図１に示すように、この実施の形態１による音声合成装置の処理は大きく２つに分けることができる。１つはアクセント情報付きテキストコーパス９からアクセント句境界学習データ１１を作成するアクセント句境界学習処理で、もう１つは合成対象テキストから合成音を生成するテキスト音声合成処理である。
【００３０】
最初に、アクセント句境界学習処理について説明する。
図２は図１中の音声合成装置によるアクセント句境界学習処理の概要を示すフロー図であり、図３は図２中のアクセント句境界学習処理における具体的な動作を示すフロー図である。ここで、図３中のステップＳＴ１−Ａが図２中のテキスト解析処理を示すステップＳＴ１Ａに対応し、図３中のステップＳＴ２−Ａが名詞連続抽出処理を示す図２中のステップＳＴ２Ａに対応し、図３中のステップＳＴ３−Ａが形態素属性付与処理を示すステップＳＴ３Ａに対応し、図３中のステップＳＴ４−ＡからステップＳＴ５−Ａまでがアクセント句境界学習処理を示す図２中のステップＳＴ４Ａに対応する。
【００３１】
また、図４は図３中の各処理におけるデータ例を示す図である。図において、１４はアクセント情報付きテキストコーパス９に格納されたアクセント情報付きテキスト（学習用テキスト）で、図示の例では２文挙げられている。また、「／／」はアクセント句境界の位置であることを示している。１５はテキスト１４をそれぞれ形態素ごとに分割してなる形態素列で、ここでは学習文形態素列と称することにする。学習文形態素列１５における「／」は、形態素区切りを示しており、また、括弧「（）」内に形態素の品詞を示している。１６は学習文形態素列１５を構成する各形態素と形態素属性との対応関係であって、ここでは形態素・属性対応関係と称することにする。１７は形態素・属性対応関係１６における形態素属性を学習文形態素列１５の各形態素の順序に並べてなる形態素属性列であって、ここでは学習文形態素属性列と称することにする。１８はＮ−ｇｒａｍ統計におけるｔｒｉｇｒａｍ、ｂｉｇｒａｍの頻度集計単位で、学習文形態素属性列１７を構成する各形態素属性列のパターンを列挙したものである。また、φは名詞連続列の開始位置、終了位置に挿入する特殊な記号である。
これら図２、３、４に沿ってアクセント句境界学習処理を説明する。
【００３２】
先ず、テキスト解析手段１がアクセント情報付きテキストコーパス９に格納されたテキスト１４を１つずつ取り出し、テキスト解析を行う（ステップＳＴ１Ａ、ステップＳＴ１−Ａ）。具体的に説明すると、先ず、テキスト解析手段１が入力したテキスト１４を解析辞書１１に登録した形態素となる単語の見だし、読み、品詞などの情報と照合して形態素列候補を求める。続いて、テキスト解析手段１は、これら形態素列候補のうちから文法的に接続可能な組み合わせを求め、図４に示すような学習文形態素列１５として名詞連続抽出手段２に出力する。
【００３３】
名詞連続抽出手段２は、名詞として認識すべき形態素が連続する形態素列である名詞連続形態素列を学習文形態素列１５から取り出す（ステップＳＴ２Ａ、ステップＳＴ２−Ａ）。ここで、図４に示した学習文形態素列１５は既に名詞連続列となっているので、名詞連続抽出手段２は、そのままの形で学習文形態素列１５を形態素属性付与手段３に出力する。
【００３４】
名詞連続列である学習文形態素列１５を受けると、形態素属性付与手段３は、形態素・属性対応テーブル１０に従って形態素属性を付与し、学習文形態素属性列１７に変換する（ステップＳＴ３Ａ、ステップＳＴ３−Ａ）。
図５は図１中の形態素・属性テーブルの構成例を示す図である。図において、１９は形態素と形態素属性との対応関係の一例であって、「会社」という形態素に後方一致する普通名詞に対して「＜組織修飾＞」という形態素属性を付与することを示している。また、２０は形態素と形態素属性との対応関係の他例であって、「店」という「接尾語」形態素に対して「店」という見出しをそのまま形態素属性として付与することを示している。この形態素・属性対応テーブル１０は、解析辞書１１に格納されている見だし、品詞に対して付与する形態素属性を記述したもので、「＊」はワイルドカード、「−」は見だしそのものを形態素属性にする指示である。
【００３５】
形態素属性付与手段３は、形態素・属性対応テーブル１０における対応条件を１つずつ順番にチェックし、最初に一致した条件の形態素属性を付与する。
図４に示す形態素・属性対応関係１６は、学習形態素列例１５中の形態素と形態素属性との対応を、図５に示す形態素・属性対応テーブル１０に従って付与したものである。ここで、形態素・属性対応テーブル１０を用いて形態素属性を決定する場合、アクセント句境界位置を示す「／／」を無視して対応をとって形態素属性を決定する。続いて、形態素属性付与手段３は、形態素属性に対して「／／」をそのまま付与して、形態素属性とアクセント句境界情報とが関連付けられた図４に示す学習文形態素属性列１７のようなデータを生成する。この学習文形態素属性列１７は、学習文形態素列１５の各形態素を形態素・属性対応関係１６における形態素属性で置き換えたものである。
このあと、形態素属性付与手段３は、上述のようにして生成した学習文形態素属性列１７をアクセント句境界学習手段４に出力する。
【００３６】
アクセント句境界学習手段４は、Ｎ−ｇｒａｍ統計として学習文形態素属性列１７中で連続するＮ−１，Ｎ個の形態素属性列に分割し、Ｎ−ｇｒａｍデータとして各形態素属性列の頻度を集計する（ステップＳＴ４Ａ、ステップＳＴ４−Ａ）。この頻度集計結果は、アクセント句境界学習データ１１に保存される。以下、この実施の形態１では、例えばＮ＝３として処理を説明する。即ち、学習文形態素属性列１７である「＜地名＞／建設／／＜地名＞／店」に対して、アクセント句境界学習手段４は、「φ ＜地名＞建設／／」、「＜地名＞建設／／＜地名＞」、「建設／／＜地名＞店」、「＜地名＞店 φ」、「φ ＜地名＞」、「＜地名＞建設／／」、「建設／／＜地名＞」、「＜地名＞店」、及び「店 φ」を抽出する。続いて、アクセント句境界学習手段４は、アクセント情報付きテキストコーパス９に格納された全てのテキスト１４に関して求めた形態素属性列群のうちで上記各形態素属性列に該当するものをそれぞれ抽出すると共に、その頻度をカウントしてゆく。図４に示す頻度集計単位１８では、学習文形態素属性列１７からｂｉｇｒａｍ，ｔｒｉｇｒａｍのデータを取り出した結果を示している。
【００３７】
次に、アクセント句境界学習手段４は、上述のようにして集計してアクセント句境界学習データ１１に記憶したＮ−ｇｒａｍの頻度集計結果から各形態素属性列の条件付き確率を求める（ステップＳＴ４Ａ、ステップＳＴ５−Ａ）。ここで、Ｎ−ｇｒａｍの条件付き確率は下記式（１）で求められる。
【数１】

即ち、Ｎ＝３の場合は、形態素属性列（ａ１，ａ２，ａ３）の頻度を、（ａ１，ａ２）の頻度で割ったものが、条件付き確率ｐ（ａ３｜ａ１，ａ２）となる。図６はアクセント句境界学習データの一例を示す図であり、図４に示す頻度集計単位１８の頻度を集計して条件付き確率を求めたものである。図において、２１は形態素属性列とその条件付き確率との対応関係の一例であって、形態素属性列（φ、＜地名＞、建設／／）の条件付き確率が０．００７であることを示している。
図６に示すアクセント句境界学習データは、アクセント句境界学習手段４が頻度集計単位１８を含むアクセント情報付きテキストコーパス９の全てのテキストに上記処理を行って条件付き確率を求めた例である。
【００３８】
アクセント句境界学習手段４は、上述のようにしてアクセント情報を有する形態素属性列の条件付き確率を求めると、これをアクセント句境界学習データ１１として所定の記憶装置に記憶させる（ステップＳＴ４Ａ、ステップＳＴ６−Ａ）。ここまでの動作がアクセント句境界学習ステップに相当する。
【００３９】
次に合成対象テキストから合成音を作成する音声合成処理について説明する。図７は図１中の音声合成装置によるテキスト音声合成処理の概要を示すフロー図であり、図８は図７中のテキスト音声合成処理における具体的な動作を示すフロー図である。ここで、図８中のステップＳＴ１−ａがテキスト解析処理を示す図７中のステップＳＴ１ａに対応し、図８中のステップＳＴ２−ａが名詞連続抽出処理を示す図７中のステップＳＴ２ａに対応し、図８中のステップＳＴ３−ａが形態素属性付与処理を示す図７中のステップＳＴ３ａに対応し、図８中のステップＳＴ４−ａがアクセント句境界決定処理を示す図７中のステップＳＴ４ａに対応し、図８中のステップＳＴ５−ａが韻律情報生成処理を示す図７中のステップＳＴ５ａ及び音響処理を示すステップＳＴ６ａに対応する。
【００４０】
また、図９は図８中の各処理におけるデータ例を示す図である。図において、２２は実施の形態１による音声合成装置が合成音声を生成する対象として入力した合成対象テキスト（処理対象テキスト）を示している。２３は合成対象テキスト２２を形態素解析して得た形態素列で、ここでは合成対象テキスト形態素列と称することにする。また、合成対象テキスト形態素列２３中の括弧内に形態素の品詞を示している。２４は合成対象テキスト形態素列２３から抽出した名詞連続列であって、ここでは合成対象テキスト名詞連続列と称することにする。２５は合成対象テキスト名詞連続列２４を構成する各形態素と形態素属性との対応関係であって、ここでは形態素・属性対応関係と称することにする。２６は合成対象テキスト名詞連続列２４の形態素を形態素・属性対応関係２５における形態素属性で置き換えてなる形態素属性列で、ここでは合成対象テキスト形態素属性列と称することにする。２７はアクセント句境界学習データ１１に格納された条件付き確率を用いて合成対象テキスト形態素属性列２６から作成した形態素属性列における最も尤度が高いアクセント句境界位置を決定する最尤Ｎ−ｇｒａｍパス計算例である。この最尤Ｎ−ｇｒａｍパス計算例２７については、後述する図１０に詳細に説明している。２８は最尤Ｎ−ｇｒａｍパス計算例２７の結果に基づいて決定された最尤アクセント句境界決定結果である。２９は最尤アクセント句境界決定結果２８と名詞連続以外の形態素列とを合わせた結果を示すアクセント句境界付き形態素解析結果である。３０はアクセント句境界付き形態素解析結果２９に対してアクセント核決定ルール１２を適用して、アクセント核位置を決定したアクセント核決定結果である。
これら図７、８、９に沿ってテキスト音声合成処理を説明する。
【００４１】
先ず、アクセント句境界学習処理時と同様にして、テキスト解析手段１が解析辞書８を用いて、不図示の入力手段を介して入力された合成対象のテキスト２２を形態素ごとに分解し、合成対象テキスト形態素列２３を生成する（ステップＳＴ１ａ、ステップＳＴ１−ａ）。このあと、テキスト解析手段１は、合成対象テキスト形態素列２３を名詞連続抽出手段２に出力する。図９において、合成対象テキスト２２として２つのテキストを示したが、本来は別々に処理されるものであり、ここでは対比のために並べて示している。また、合成対象テキスト形態素列２３は学習文形態素列２５と同様の書式であるが、合成対象テキスト２２にはアクセント句境界位置が未決定である。このため、上述した「／／」記号は出現しない。
【００４２】
名詞連続抽出手段２は、合成対象テキスト形態素列２３から合成対象テキスト名詞連続列２４を抽出する（ステップＳＴ２ａ、ステップＳＴ２−ａ）。このとき、合成対象テキスト名詞連続列２４は形態素属性付与手段３に出力され、合成対象テキスト名詞連続列２４以外の形態素列は韻律情報生成手段６に出力される。図９の例では、合成対象テキスト形態素列２３である「東京（地名）／建設（サ変）／協会（普通名詞）／四谷（地名）／事務所（普通名詞）／で（格助詞）／は（係助詞）」のうち、合成対象テキスト名詞連続列２４である「東京（地名）／建設（サ変）／協会（普通名詞）／四谷（地名）／事務所（普通名詞）」が形態素属性付与手段３に出力され、それ以外の「で（格助詞）／は（係助詞）」は韻律情報生成手段６に出力される。
【００４３】
合成対象テキスト名詞連続列２４を入力すると、形態素属性付与手段３は、図５に示した形態素・属性対応テーブル１０に登録した対応関係に従って、各形態素に付与すべき形態素属性を決定し、合成対象テキスト形態素属性列２６を生成する（ステップＳＴ３ａ、ステップＳＴ３−ａ）。具体的には、合成対象テキスト名詞連続列２４に対して、形態素・属性対応テーブル１０を用いて図９に示す形態素・属性対応関係２５を求め、合成対象テキスト形態素属性列２６を生成する。この合成対象テキスト形態素属性列２６は、アクセント句境界決定手段５に出力される。
【００４４】
アクセント句境界決定手段５では、アクセント句境界学習データ１１を用いて合成対象テキスト形態素属性列２６における全ての形態素属性列（Ｎ個）の条件付き確率を求めるとともに、下記式（２）に定める値が最大となるアクセント情報付きの形態素属性列を求めてアクセント句の境界位置を決定する（ステップＳＴ４ａ、ステップＳＴ４−ａ、アクセント句境界決定ステップ）。
【数２】

【００４５】
上記処理を具体的に説明すると、アクセント句境界決定手段５は、例えば図９に示した合成対象形態素属性列２６のうちの「＜地名＞／建設／協会／＜地名＞／事務所」に対して、「φ／＜地名＞／建設」、「＜地名＞／建設／協会」、「建設／協会／＜地名＞」、「協会／＜地名＞／事務所」、及び「＜地名＞／事務所／φ」のＮ＝３に対応する各形態素属性列を生成する。
続いて、アクセント句境界決定手段５は、図６に示したアクセント句境界学習データ１１から、上述のようにして求めた各形態素属性列に対応する形態素属性列（アクセント句境界情報「／／」の有無を問わない）の条件付き確率を取り出し、上記式（２）に従って条件付き確率の積を計算する（この計算過程が、最尤Ｎ−ｇｒａｍパス計算例２７である）。
【００４６】
図１０は図９中の最尤Ｎ−ｇｒａｍパス計算例の詳細を示す図である。図１０に示すように、アクセント句境界決定手段５は、例えば「φ／＜地名＞／建設」なる形態素属性列に対応する条件付き確率として、アクセント句境界学習データ１１からｐ（建設｜φ，＜地名＞）＝０．００２、ｐ（建設｜φ，＜地名＞／／）＝０．００１、ｐ（建設／／｜φ，＜地名＞）＝０．００７などを抽出する。さらに、「＜地名＞／建設／協会」に対して、ｐ（協会｜＜地名＞／／，建設）＝０．００１、ｐ（協会｜＜地名＞／／，建設／／）＝０．００１、ｐ（協会／／｜＜地名＞／／，建設）＝０．００５などを抽出する。
【００４７】
これに続いて、図１０に示すように、アクセント句境界決定手段５は、アクセント句境界「／／」を含めて一致する形態素属性列を構成するパスに対して、上記式（２）に従って条件付き確率の積を求める。具体的に説明すると、形態素属性列「＜地名＞／建設／協会／＜地名＞／事務所」に対して、図１０中の太線のパスｐ（建設｜φ，＜地名＞／／）→ｐ（協会／／｜＜地名＞／／，建設）→ｐ（＜地名＞｜建設，協会／／）→ｐ（事務所｜協会／／，＜地名＞）→ｐ（φ｜＜地名＞，事務所）による条件付き確率積であるＰ（φ，＜地名＞／／，建設，協会／／，＜地名＞，事務所，φ）は、０．１４７×１０^−６となる。
この他に、例えばｐ（建設｜φ，＜地名＞／／）→ｐ（協会／／｜＜地名＞／／，建設）→ｐ（＜地名＞／／｜建設，協会／／）→ｐ（事務所｜協会／／，＜地名＞／／）→ｐ（φ｜＜地名＞，事務所）なるパスによる条件付き確率積Ｐ（φ，＜地名＞／／，建設，協会／／，＜地名＞／／，＜地名＞，事務所，φ）は、０．４６０×１０^−１１となる。
このようにして、形態素属性列「＜地名＞／建設／協会／＜地名＞／事務所」に対する条件付き確率積を求めた結果、図１０の例では太線のパスによるものが最も大きな値（０．１４７×１０^−６）となり、最も尤もらしいアクセント句境界位置「＜地名＞／／，建設，協会／／，＜地名＞，事務所」が指定される。
【００４８】
同様に、形態素属性列「＜地名＞／建設／総務／部」に対しては、図１０中の太線で示したｐ（建設／／｜φ，＜地名＞）→ｐ（総務｜＜地名＞，建設／／）→ｐ（部｜建設／／，総務）→ｐ（φ｜総務，部）なるパスによる条件付き確率積Ｐ（φ，＜地名＞，建設／／総務，部，φ）が０．６１６×１０^−７で最大となる。これにより、「＜地名＞，建設／／，総務，部」が最も尤もらしいアクセント句境界位置として指定される。
【００４９】
このあと、アクセント句境界決定手段５は、条件付き確率積Ｐ（）の値が最大となった形態素属性列のアクセント句境界位置を、合成対象テキスト形態素属性列２６の形態素列におけるアクセント句境界位置と決定して、図９に示すようなアクセント句境界情報付き形態素列である最尤アクセント句境界決定結果２８を生成する。この最尤アクセント句境界決定結果２８は、韻律情報生成手段６に出力される。
【００５０】
次に、韻律情報生成手段６は、アクセント句境界決定手段５から入力した最尤アクセント句境界決定結果２８と、名詞連続抽出手段２によって分割された合成対象テキスト形態素列２３の名詞連続列以外の形態素列とを元の順番に戻して、当初の合成対象テキスト２２に関する形態素列に対応するアクセント句境界付き形態素解析結果２９を生成する。このアクセント句境界付き解析結果２９の最尤アクセント句境界決定結果２８の部分には、アクセント句境界位置を示す記号「／／」がセット（即ち、アクセント句境界位置を示す情報がリンクされている）された形態素列となっている。
【００５１】
このあと、韻律情報生成手段６は、アクセント核決定ルール１５に基づいて、アクセント句境界付き形態素解析結果２９における各アクセント句のアクセント核位置を決定する。なお、名詞連続列以外の部分については、助詞、助動詞などの付属語に自立語が後接する位置でアクセント句境界を挿入した上で、アクセント核を決定する。即ち、「・・・事務所／で／は／夜間／の・・・」と続く場合には、「・・・事務所／で／は／／夜間／の・・・」のようにアクセント句境界を挿入した上で、アクセント核位置を決定する。
韻律情報生成手段６は、アクセント核決定ルール１５に基づいて助詞接続についてのアクセント核の移動処理を行い、これらの情報を含む韻律情報を生成して、音響処理手段７に出力する（ステップＳＴ５ａ、ステップＳＴ５−ａ、音声合成処理ステップ）。具体的には、アクセント核決定ルール１５として、例えばＮＨＫ日本語発音アクセント辞典などにあるような既知の処理ルールを適用し、接辞接続によるアクセント核決定、１アクセント句内の名詞連続のアクセント核決定、及び助詞接続によるアクセント核決定を行う。
この韻律情報生成手段６が生成する韻律情報のうち、形態素の読みとアクセントに関する情報とを表現したものが図９に示すアクセント核決定結果３０であり、アクセント句境界「／／」とアクセント核位置（下線部のモーラ）との情報が決定されている。
【００５２】
音響処理手段７は、韻律情報生成手段６から入力したアクセント句やアクセント核の位置などの韻律情報に基づいて、音響辞書１３に格納しておいた音素を組み合わせて、合成対象のテキスト２２に関する合成音声を生成する（ステップＳＴ６ａ、ステップＳＴ５−ａ、音声合成処理ステップ）。例えば、図９に示すアクセント核決定結果３０では、合成対象テキスト２２として列挙した２つの「東京／建設」の部分をより自然に読み分けることが可能となっている。
【００５３】
以上のように、この実施の形態１によれば、アクセント句の境界位置が既知であるテキストから学習データを生成し、この学習データを利用して合成対象のテキスト中の名詞連続列に対して最も尤もらしいアクセント句境界位置を決定するので、解析辞書８中の単語に用法を記述しなくてもアクセント句境界位置を決定することができるとともに、正しい合成音声を得ることができる。
【００５４】
なお、上記実施の形態１では、Ｎ−ｇｒａｍ統計のＮを３として処理を進めたが、Ｎは３以外の値で学習してもよい。
【００５５】
また、テキスト解析の際に解析辞書８に登録されていない未知語が存在した場合、この未知語が仮名表記の形態素であるならば、テキスト解析手段１が、尤もらしい品詞の推定処理として解析辞書８中の読み情報が一致する辞書見出しとその品詞とに置き換える。これにより、仮名表記の未知語が含まれていても処理が可能となる。
【００５６】
さらに、仮名表記以外の未知語が存在した場合、未知語自身を名詞と仮定して処理を進め、この名詞と仮定した未知語の前後の形態素の形態素属性を含む形態素属性列に関するアクセント句境界学習データ１１に格納された条件付き確率が最大となる形態素属性とし、記実施例の処理を同様に進めることで、仮名表記以外の未知語が含まれる場合の処理が可能である。
【００５７】
実施の形態２．
図１１はこの発明の実施の形態２による音声合成装置の構成を示すブロック図である。図において、３１は形態素属性作成手段であって、名詞連続抽出手段２の出力を受けて形態素・属性対応テーブル１０を作成する。なお、図１と同一構成要素には同一符号を付して重複する説明を省略する。
【００５８】
次に動作について説明する。
図１２は図１１中の音声合成装置によるアクセント句境界学習処理の概要を示すフロー図であり、図１３は図１２中のアクセント句境界学習処理における具体的な動作を示すフロー図である。ここで、図１３中のステップＳＴ１−Ｂが図１２中のテキスト解析処理を示すステップＳＴ１Ｂに対応し、図１３中のステップＳＴ２−Ｂが名詞連続抽出処理を示す図１２中のステップＳＴ２Ｂに対応し、図１３中のステップＳＴ３−Ｂが形態素属性付与処理を示すステップＳＴ３Ｂに対応し、図１３中のステップＳＴ４−ＢからステップＳＴ６−Ｂまでがアクセント句境界学習処理を示す図１２中のステップＳＴ４Ｂに対応し、図１３中のステップＳＴ７−ＢからステップＳＴ９−Ｂまでが形態素属性作成処理を示す図１２中のステップＳＴ５Ｂに対応する。
【００５９】
また、図１４は図１２中の形態素属性作成処理で得た形態素属性を登録した形態素・属性対応テーブルを示す図であり、形態素・属性対応テーブル１０に形態素属性を形態素そのもので定義して格納した例を示している。図において、３２は固有名詞の直後に出現した形態素を集計し、高頻度のものを登録した直後形態素データで、３３は固有名詞の直前に出現した形態素を集計し、高頻度の形態素を登録した直前形態素データである。
【００６０】
次に動作について説明する。
先ず、上記実施の形態１と同様にして、テキスト解析手段１がアクセント情報付きテキストコーパス９に格納されたテキスト１４を１つずつ取り出し、テキスト解析を行って学習文形態素列１５を生成する（ステップＳＴ１Ｂ、ステップＳＴ１−Ｂ）。続いて、テキスト解析手段１は、学習文形態素列１５を名詞連続抽出手段２に出力する。
【００６１】
名詞連続抽出手段２は、名詞として認識すべき形態素が連続する形態素列である名詞連続形態素列を学習文形態素列１５から取り出す（ステップＳＴ２Ｂ、ステップＳＴ２−Ｂ）。このとき、形態素属性作成手段３１は、学習文形態素列１５の中から固有名詞の形態素を抽出するとともに、この固有名詞形態素の直前の形態素を収集して頻度集計する（ステップＳＴ５Ｂ、ステップＳＴ７−Ｂ）。さらに、同様な手順で、形態素属性作成手段３１は、固有名詞形態素の直後の形態素を収集して頻度集計する（ステップＳＴ５Ｂ、ステップＳＴ８−Ｂ）。ここで、形態素属性作成手段３１は、固有名詞形態素の直前・直後の形態素が固有名詞である場合、収集・頻度集計を行わない。
【００６２】
このあと、形態素属性作成手段３１は、集計した形態素のうち頻度が所定のＭ個以上の形態素データを形態素・属性対応テーブル１０に登録する（ステップＳＴ５Ｂ、ステップＳＴ９−Ｂ）。直後形態素データ３２はステップＳＴ７−Ｂにて収集された形態素からの登録データを示し、直前形態素データ３３はステップＳＴ８−Ｂにて収集された形態素からの登録データを示している。
ここで、直後形態素データ３２及び直前形態素データ３３の前後に、予め用意したデフォルトルールを記述するようにしてもよい。これにより、形態素属性作成手段３１は、ステップＳＴ７−Ｂにて直前形態素データ３３として業種などを示す可能性が高い形態素を収集することができ、ステップＳＴ８−Ｂにて直後形態素データ３２として名詞に関する組織性を示す形態素を収集することが可能となる。
【００６３】
一方、名詞連続抽出手段２から名詞連続列を受けた形態素属性付与手段３は、形態素属性作成手段３１が新規に登録した形態素属性を含む形態素・属性対応テーブル１０に従って形態素属性を付与し、学習文形態素属性列１７に変換する（ステップＳＴ３Ｂ、ステップＳＴ３−Ｂ）。
【００６４】
アクセント句境界学習手段４は、Ｎ−ｇｒａｍ統計として学習文形態素属性列１７中で連続するＮ−１，Ｎ個の形態素属性列に分割し、Ｎ−ｇｒａｍデータとして各形態素属性列の頻度を集計する（ステップＳＴ４Ｂ、ステップＳＴ４−Ｂ）。次に、アクセント句境界学習手段４は、上述のようにして集計してアクセント句境界学習データ１１に記憶したＮ−ｇｒａｍの頻度集計結果から各形態素属性列の条件付き確率を求める（ステップＳＴ４Ｂ、ステップＳＴ５−Ｂ）。アクセント句境界学習手段４は、上述のようなアクセント情報を有する形態素属性列の条件付き確率を求めると、これをアクセント句境界学習データ１１として所定の記憶装置に記憶させる（ステップＳＴ４Ｂ、ステップＳＴ６−Ｂ）。
これらの動作は、上記実施の形態１と同様である。
【００６５】
以上のように、この実施の形態２によれば、アクセント句境界学習データ１１を生成するにあたり、名詞連続列から固有名詞の形態素を抽出するとともに、該形態素に隣接する固有名詞以外の形態素の頻度を集計して所定値以上となる形態素を形態素属性として登録するので、アクセント句境界学習データ１１の学習に要する形態素属性を適宜更新することができる。
【００６６】
なお、上記実施の形態１，２では、形態素・属性対応テーブル１０として、形態素の見だしや品詞を条件として形態素属性を付与したが、形態素の読みも条件に追加することも可能である。
【００６７】
また、上記実施の形態１，２では、アクセント句境界学習データ１１を形態素属性とアクセント句境界の情報とを組み合わせた形のシンボルとして処理したが、直前のアクセント句境界位置から形態素開始位置までのモーラ数情報を追加した形や、モーラ数情報をある特定の閾値以上または以下で２値にマッピングした値を追加した形や、読みを追加した形のシンボルとして処理しても良い。
図１５は形態素属性にモーラ数を付け加えたアクセント句境界学習データの一例を示す図である。図において、３４は各形態素のモーラ数を記述したアクセント情報付きテキストを示し、３５はアクセント句境界位置から形態素の開始位置までのモーラ数を記述した形態素属性列を用いて生成した頻度集計単位を示しており、３６はアクセント句境界位置から形態素の開始位置までのモーラ数が４以下か、４より大きいかで０、又は１を付加した形態素属性列を用いて生成した頻度集計単位を示している。
このようにすることで、アクセント句の境界位置をさらに正確に決定することができるアクセント句境界学習データを得ることができる。また、０、又は１の２値データを付加した形態素属性列を用いることで、アクセント情報として格納しておくべき情報量を低減することができる。
【００６８】
【発明の効果】
以上のように、この発明によれば、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習処理を行い、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するので、テキスト解析に単語の用法を要することなく、最も尤もらしいアクセント句境界位置を決定することができるという効果がある。
【００６９】
この発明によれば、学習用テキストからアクセント句境界学習データを生成するにあたり、該テキストの名詞連続列における固有名詞の形態素を抽出するとともに、該形態素に隣接する固有名詞以外の形態素の頻度を集計して所定値以上となる形態素を形態素属性として登録するので、アクセント句境界学習データの学習に要する形態素属性を適宜更新することができるという効果がある。
【００７０】
この発明によれば、形態素属性列の生起確率としてＮ−ｇｒａｍ統計による条件付き確率を用いるので、最も尤もらしいアクセント句境界位置を決定するアクセント句境界学習データを提供することができるという効果がある。
【００７１】
この発明によれば、入力テキスト内に仮名表記の未知語が存在する場合、読み情報が一致する形態素の情報を付与するので、仮名表記の未知語が存在したテキスト解析結果に対してもアクセント句境界位置の決定処理を行うことができるという効果がある。
【００７２】
この発明によれば、入力テキスト内に仮名表記以外の未知語が存在する場合、該未知語自身を名詞として扱うとともに、これに隣接する形態素の形態素属性を含んでなる形態素属性列の生起確率が最も高くなる形態素属性とするので、仮名表記以外の未知語が存在したテキスト解析結果に対してもアクセント句境界位置の決定処理を行うことができるという効果がある。
【００７３】
この発明によれば、アクセント句の境界位置から形態素の先頭位置までのモーラ数を関連付けたアクセント句境界学習データを生成するので、アクセント句の境界位置をさらに正確に決定することができるアクセント句境界学習データを得ることができるという効果がある。
【００７４】
この発明によれば、アクセント句の境界位置から形態素の先頭位置までのモーラ数と所定の規定値との大小関係によって決定される２値情報を、形態素の先頭位置を特定する情報として用いるので、アクセント情報として記憶すべき情報量を低減させることができるという効果がある。
【００７５】
この発明によれば、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習処理を行い、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定し、処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて処理対象テキストに関する合成音声を生成するので、テキスト解析に単語の用法を要することなく、正しい合成音声を得ることができるという効果がある。
【図面の簡単な説明】
【図１】この発明の実施の形態１による音声合成装置の構成を示すブロック図である。
【図２】図１中の音声合成装置によるアクセント句境界学習処理の概要を示すフロー図である。
【図３】図２中のアクセント句境界学習処理における具体的な動作を示すフロー図である。
【図４】図３中の各処理におけるデータ例を示す図である。
【図５】図１中の形態素・属性テーブルの構成例を示す図である。
【図６】アクセント句境界学習データの一例を示す図である。
【図７】図１中の音声合成装置によるテキスト音声合成処理の概要を示すフロー図である。
【図８】図７中のテキスト音声合成処理における具体的な動作を示すフロー図である。
【図９】図８中の各処理におけるデータ例を示す図である。
【図１０】図９中の最尤Ｎ−ｇｒａｍパス計算例の詳細を示す図である。
【図１１】この発明の実施の形態２による音声合成装置の構成を示すブロック図である。
【図１２】図１１中の音声合成装置によるアクセント句境界学習処理の概要を示すフロー図である。
【図１３】図１２中のアクセント句境界学習処理における具体的な動作を示すフロー図である。
【図１４】図１２中の形態素属性作成処理で得た形態素属性を登録した形態素・属性対応テーブルを示す図である。
【図１５】形態素属性にモーラ数を付け加えたアクセント句境界学習データの一例を示す図である。
【図１６】従来の音声合成装置の構成を概略的に示すブロック図である。
【符号の説明】
１テキスト解析手段、２名詞連続抽出手段、３形態素属性付与手段、４アクセント句境界学習手段、５アクセント句境界決定手段、６韻律情報生成手段、７音響処理手段（音声合成処理手段）、８解析辞書、９アクセント情報付きテキストコーパス（学習用テキスト記憶手段）、１０形態素・属性対応テーブル、１１アクセント句境界学習データ、１２アクセント核決定ルール、１３音響辞書、１４，３４アクセント情報付きテキスト（学習用テキスト）、１５学習文形態素列（形態素列）、１６，２５形態素・属性対応関係、１７学習文形態素属性列（形態素属性列）、１８，３５，３６頻度集計単位、１９，２０形態素と形態素属性との対応関係、２１形態素属性列と条件付き確率との対応関係、２３合成対象テキスト形態素列（形態素列）、２４合成対象テキスト名詞連続列（名詞連続列）、２６合成対象テキスト形態素属性列（形態素属性列）、２７最尤Ｎ−ｇｒａｍパス計算例、２８最尤アクセント句境界決定結果、２９アクセント句境界付き形態素解析結果、３０アクセント核決定結果、３１形態素属性作成手段、３２直後形態素データ、３３直前形態素データ。

Claims

アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストを格納する学習用テキスト記憶手段と、
入力したテキストの形態素列を生成するテキスト解析手段と、
該テキスト解析手段が生成した形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出する名詞連続抽出手段と、
上記名詞連続列を構成する各形態素に形態素属性を付与し、該名詞連続列に関する形態素属性列を生成する形態素属性付与手段と、
上記学習用テキストの名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習手段と、
処理対象のテキストの名詞連続列に関する形態素属性列と上記アクセント句境界学習データとに基づいて、該テキストの名詞連続列におけるアクセント句の境界位置を決定するアクセント句境界決定手段と
を備えたアクセント句境界決定装置。
アクセント句境界学習手段が学習用テキストからアクセント句境界学習データを生成するにあたり、該テキストの名詞連続列における固有名詞の形態素を抽出するとともに、該形態素に隣接する固有名詞以外の形態素の頻度を集計して所定値以上となる形態素を形態素属性として登録する形態素属性作成手段を備えたことを特徴とする請求項１記載のアクセント句境界決定装置。
アクセント句境界学習手段は、形態素属性列の生起確率としてＮ−ｇｒａｍ統計による条件付き確率を用いることを特徴とする請求項１又は請求項２記載のアクセント句境界決定装置。
テキスト解析手段は、入力テキスト内に仮名表記の未知語が存在する場合、読み情報が一致する形態素の情報を付与することを特徴とする請求項１から請求項３のうちのいずれか１項記載のアクセント句境界決定装置。
入力テキスト内に仮名表記以外の未知語が存在する場合、該未知語自身を名詞として扱うとともに、これに隣接する形態素の形態素属性を含んでなる形態素属性列の生起確率が最も高くなる形態素属性とすることを特徴とする請求項１から請求項４のうちのいずれか１項記載のアクセント句境界決定装置。
アクセント句境界学習手段は、アクセント句の境界位置から形態素の先頭位置までのモーラ数を関連付けたアクセント句境界学習データを生成することを特徴とする請求項１から請求項５のうちのいずれか１項記載のアクセント句境界決定装置。
アクセント句境界学習手段は、アクセント句の境界位置から形態素の先頭位置までのモーラ数と所定の規定値との大小関係によって決定される２値情報を、上記形態素の先頭位置を特定する情報として用いることを特徴とする請求項６記載のアクセント句境界決定装置。
請求項１から請求項７のうちのいずれか１項記載のアクセント句境界決定装置と、
処理対象のテキストの名詞連続列以外の形態素列と上記アクセント句境界決定装置がアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を生成する韻律情報生成手段と、
該韻律情報に基づいて上記処理対象テキストに関する合成音声を生成する音声合成処理手段と
を備えた音声合成装置。
アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、
処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列と上記アクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと
を備えたアクセント句境界決定方法。
アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、
処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列と上記アクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと、
上記処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した上記名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて上記処理対象テキストに関する合成音声を生成する音声合成処理ステップと
を備えた音声合成方法。
アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、
処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列と上記アクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと
をコンピュータに実行させるアクセント句境界決定プログラム。
アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、
処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列と上記アクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと、
上記処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した上記名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて上記処理対象テキストに関する合成音声を生成する音声合成処理ステップと
をコンピュータに実行させる音声合成プログラム。