JP4083400B2 - アクセント句境界決定装置、音声合成装置及び方法並びにプログラム - Google Patents

アクセント句境界決定装置、音声合成装置及び方法並びにプログラム Download PDF

Info

Publication number
JP4083400B2
JP4083400B2 JP2001230188A JP2001230188A JP4083400B2 JP 4083400 B2 JP4083400 B2 JP 4083400B2 JP 2001230188 A JP2001230188 A JP 2001230188A JP 2001230188 A JP2001230188 A JP 2001230188A JP 4083400 B2 JP4083400 B2 JP 4083400B2
Authority
JP
Japan
Prior art keywords
morpheme
accent phrase
accent
phrase boundary
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001230188A
Other languages
English (en)
Other versions
JP2003044073A (ja
Inventor
洋一 藤井
泰 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001230188A priority Critical patent/JP4083400B2/ja
Publication of JP2003044073A publication Critical patent/JP2003044073A/ja
Application granted granted Critical
Publication of JP4083400B2 publication Critical patent/JP4083400B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
この発明はテキスト内容を音声として合成する音声合成装置に係り、特にアクセント句境界が既知であるデータを基にして学習した学習データを利用して合成対象のテキストにおける最も尤もらしいアクセント句境界位置を決定するアクセント句境界決定装置、これを用いた音声合成装置、アクセント句境界決定方法、音声合成方法、及びアクセント句境界決定プログラム並びに音声合成プログラムに関するものである。
【0002】
【従来の技術】
複数の単語から構成される複合語は、通常、いくつかの短い単位に区切って発音される。この区切り、即ち、アクセントの切れ目の挿入を適当に行わなければ、複合語の意味が曖昧に伝わってしまう。
このような複合語のアクセント決定に関する技術として、例えば特開平2−93499号公報に開示される「複合語のアクセント句境界付与方式」がある。この方式は、複合語の構成単語を用言性単語に分類した情報と、その用言性単語に隣接する単語の品詞情報とに基づいて、複合語のアクセント句境界を設定するものである。
【0003】
以下で、上記従来方式を採用する音声合成装置について説明する。
図16は特開平2−93499号公報に開示された従来の音声合成装置の構成を概略的に示すブロック図である。図において、101はテキストを形態素に分割するテキスト解析手段で、解析辞書111を利用して合成対象であるテキストを形態素に分割する。102はテキスト解析手段101で分割した形態素に対して名詞連続中の名詞か否かを判定する名詞連続判定手段であって、名詞連続と判定した場合と名詞連続でないと判定した場合で処理を分けるとともに、名詞連続中の名詞であると判定すると、該名詞の細分類先を決定する。例えば、名詞単語のうち用言系単語(事物の動作・作用・存在・性質・状態について叙述する語)を動詞用法、ヲ格用法、ニ格用法、主体用法若しくは名詞用法に分類し、非用言系単語を体言系単語、相言系単語若しくは副言系単語に分類する。103は名詞連続アクセント句決定手段で、名詞連続判定手段102で判定した名詞連続中の形態素情報及び細分類情報とアクセント判定基準112に記述された基準とを照合し、名詞連続のアクセント句境界を決定する。104は音響処理手段であって、名詞連続判定手段102で名詞連続でないと判定された形態素と名詞連続アクセント句決定手段103で決定された名詞連続のアクセント情報とに基づいて合成音を生成する。
【0004】
111は合成対象のテキストを解析する際にテキスト解析手段101に利用される解析辞書であって、例えば単語の表記、品詞コード、読み、及び品詞コードにアクセント情報などの付加情報を付与した単語データをテーブルとして格納している。112は名詞の細分類とその前後の接続品詞によってアクセントをどこに設けるかを決定する際に利用されるアクセント判定基準で、名詞連続判定手段102によって付与した細分類の連接情報の優先度と2つ以上の細分類の連続とがアクセント句としてどう振る舞うかが記述されている。例えば、アクセント判定基準としては、優先度が最大な組み合わせとして「ヲ格用法系単語」−「体言系単語」、次の優先度を有する組み合わせとして「ニ格用法系単語」−「体言系単語」があり、最も優先度が低い組み合わせとして「体言系単語」−「ニ格用法系単語」−「体言系単語」を定めておく。また、アクセント判定基準には、各名詞句の構成に応じて予め定められた位置にアクセント句の境界を付与するための名詞句構造データとして、{(体言系名詞、ヲ格用法)→複合する}、{(体言系名詞、体言系名詞)→複合する}、{(体言系名詞、動詞用法)→複合しない}などの情報が格納される
【0005】
次に動作について説明する。
先ず、合成対象テキストとして、例えば「ビル管理会社設立」を該音声合成装置に入力させた場合を考える。このとき、テキスト解析手段101は、解析辞書111内の上記テーブルを参照して、「ビル管理会社設立」を「ビル(名詞)」、「管理(サ変)」、「会社(名詞)」、「設立(サ変)」なる形態素に分割する。
【0006】
次に、これらの形態素は、名詞連続判定手段102によって「ビル(名詞):体言系単語」、「管理(サ変):ヲ格用法」、「会社(名詞):体言系単語」、「設立(サ変):動詞用法」というように用法が設定される。ここで、例えば「管理」は、上記「ヲ格用法」の他に「動詞用法」も考えられ、これに伴った組み合わせが存在する。
【0007】
続いて、名詞連続アクセント句決定手段103では、名詞連続判定手段102で設定した用法に対して、「ビル」と「管理」との複合語について優先度の高い「体言系単語」−「ヲ格用法系単語」を選択して、「ビル管理」を名詞句とする。また、「ビル管理」と「会社」とについては、これらが共に非用言系単語であることから「ビル管理会社」を1つの名詞句とする。さらに、名詞句「ビル管理会社」と用言系単語「設立」との間では、優先度の高い「体言系単語」−「動詞用法」なる組み合わせが選択される。
【0008】
このあと、名詞連続アクセント句決定手段103は、上記のようにして設定した名詞句や用言系単語の組み合わせに対して、アクセント判定基準112に記述される{(体言系名詞、ヲ格用法)→結合}、{(体言系名詞、体言系名詞)→結合}、{(体言系名詞、動詞用法)→結合せず}の情報を、テキストの先頭、即ち、左の形態素から適用する。これによって、「ビル管理会社」と「設立」との間にアクセント句の境界が設けられる。
【0009】
【発明が解決しようとする課題】
従来のアクセント句境界位置の決定は以上のようになされているので、アクセント句の境界決定に品詞及び単語が有する「用法」に関する情報が解析辞書111に漏れなく記載されている必要があり、新語への対応が容易でなくメンテナンスに労力や費用がかかるという課題があった。
【0010】
具体的に説明すると、従来では、テキスト解析の結果として得られる形態素列中の名詞連続に対して、アクセント判定基準112のような予め得られた知見をルール化した基準を用いてアクセント句境界を決定する。即ち、品詞及び単語が有する「用法」を予め辞書に記入しておき、その用法を利用して1つの塊としてのアクセント句として成立するか否かを判断する。しかしながら、実世界では日々新語が生まれており、新語の発生の度に辞書111をメンテナンスする必要が生じる。
【0011】
また、単語に対して用法を付与するためには高度な知識が必要であり、簡単に単語を追加して正しい合成音声を得ることができないという課題があった。
【0012】
この発明は上記のような課題を解決するためになされたもので、アクセント句境界が既知であるデータを基にして学習した学習データを利用して合成対象のテキスト中における最も尤もらしいアクセント句境界位置を決定することで、辞書中の単語に用法を記述しなくても正しい合成音声を得ることができるとともに、未知語が存在した解析結果に対しても尤らしい品詞を推定して処理することで、正しい合成音声を得ることができるアクセント句境界決定装置、これを用いた音声合成装置、アクセント句境界決定方法、音声合成方法、及びアクセント句境界決定プログラム並びに音声合成プログラムを得ることを目的とする。
【0013】
【課題を解決するための手段】
この発明に係るアクセント句境界決定装置は、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストを格納する学習用テキスト記憶手段と、入力したテキストの形態素列を生成するテキスト解析手段と、該テキスト解析手段が生成した形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出する名詞連続抽出手段と、名詞連続列を構成する各形態素に形態素属性を付与し、該名詞連続列に関する形態素属性列を生成する形態素属性付与手段と、学習用テキストの名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習手段と、処理対象のテキストの名詞連続列に関する形態素属性列とアクセント句境界学習データとに基づいて、該テキストの名詞連続列におけるアクセント句の境界位置を決定するアクセント句境界決定手段とを備えるものである。
【0014】
この発明に係るアクセント句境界決定装置は、アクセント句境界学習手段が学習用テキストからアクセント句境界学習データを生成するにあたり、該テキストの名詞連続列における固有名詞の形態素を抽出するとともに、該形態素に隣接する固有名詞以外の形態素の頻度を集計して所定値以上となる形態素を形態素属性として登録する形態素属性作成手段を備えるものである。
【0015】
この発明に係るアクセント句境界決定装置は、アクセント句境界学習手段が形態素属性列の生起確率としてN−gram統計による条件付き確率を用いるものである。
【0016】
この発明に係るアクセント句境界決定装置は、テキスト解析手段が、入力テキスト内に仮名表記の未知語が存在する場合、読み情報が一致する形態素の情報を付与するものである。
【0017】
この発明に係るアクセント句境界決定装置は、入力テキスト内に仮名表記以外の未知語が存在する場合、該未知語自身を名詞として扱うとともに、これに隣接する形態素の形態素属性を含んでなる形態素属性列の生起確率が最も高くなる形態素属性とするものである。
【0018】
この発明に係るアクセント句境界決定装置は、アクセント句境界学習手段が、アクセント句の境界位置から形態素の先頭位置までのモーラ数を関連付けたアクセント句境界学習データを生成するものである。
【0019】
この発明に係るアクセント句境界決定装置は、アクセント句境界学習手段がアクセント句の境界位置から形態素の先頭位置までのモーラ数と所定の規定値との大小関係によって決定される2値情報を形態素の先頭位置を特定する情報として用いるものである。
【0020】
この発明に係る音声合成装置は、上記アクセント句境界決定装置と、処理対象のテキストの名詞連続列以外の形態素列とアクセント句境界決定装置がアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を生成する韻律情報生成手段と、該韻律情報に基づいて処理対象テキストに関する合成音声を生成する音声合成処理手段とを備えるものである。
【0021】
この発明に係るアクセント句境界決定方法は、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップとを備えるものである。
【0022】
この発明に係る音声合成方法は、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと、処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて処理対象テキストに関する合成音声を生成する音声合成処理ステップとを備えるものである。
【0023】
この発明に係るアクセント句境界決定プログラムは、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップとをコンピュータに実行させるものである。
【0024】
この発明に係る音声合成プログラムは、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと、処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて処理対象テキストに関する合成音声を生成する音声合成処理ステップとをコンピュータに実行させるものである。
【0025】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による音声合成装置の構成を示すブロック図である。図において、1は解析辞書8を用いて入力したテキストの形態素列を生成するテキスト解析手段で、アクセント情報付きテキストコーパス9に格納されたアクセント情報付きテキスト(学習用テキスト)や実際の合成対象テキスト(処理対象テキスト)を入力して、それぞれの形態素列を生成する。このテキスト解析手段1による形態素列の生成には、最長一致、文節数最小法、及びコスト最小法などの既知の形態素解析アルゴリズムを用いる。例えば、首藤公昭、吉村賢治「日本語の構造とその解析」、情報処理Vol.27,No.8,pp.947〜954,1986に開示される形態素解析アルゴリズムを使用しても良い。2はテキスト解析手段1にて切り出したテキスト中の形態素列から名詞として認識すべき形態素が連続する形態素列(名詞連続列)を特定し、抽出する名詞連続抽出手段である。名詞として認識すべき形態素としては、その品詞が普通名詞、固有名詞、サ変名詞以外にも、特定の品詞の単語に接続して1つの意味をなす接頭語、接尾語や、動詞連用形が名詞として転成した形態素などを含むものとする。名詞連続抽出手段2は、アクセント情報付きテキストコーパス9からのテキストに対しては名詞連続列のみを次の処理を行う形態素属性付与手段3に出力し、合成対象テキストに対しては名詞連続列を形態素属性付与手段3に、名詞連続列以外の形態素列を韻律情報生成手段6に出力する。
【0026】
3は形態素に形態素属性を付与する形態素属性付与手段であって、名詞連続抽出手段2がアクセント情報付きテキストコーパス9のテキストの形態素列及び合成対象テキストの形態素列から抽出した名詞連続列に対して、形態素・属性対応テーブル10に基づいて形態素属性を付与する。4は形態素属性付与手段3が生成した形態素属性列に基づいてアクセント句の境界位置を決定するためのデータを学習するアクセント句境界学習手段で、アクセント句の境界位置を特定するアドレス情報を有する形態素属性列の頻度を集計し、アクセント句境界位置の情報を含む形態素属性列が生起する確率を計算し、アクセント句境界学習データ11に格納する。5は形態素列におけるアクセント句の境界位置を決定するアクセント句境界決定手段であって、予め学習しておいたアクセント句境界学習データ11を利用して、合成対象テキスト中の名詞連続列に関する形態素属性列に対して最も尤度が高いアクセント句の境界位置を決定する。6はアクセント句境界決定手段5でアクセント句の境界位置を決定した名詞連続列、及び該名詞連続以外の形態素列を1つの形態素列に戻し、アクセント核決定ルール12に基づいて形態素列におけるアクセント核位置をはじめとする合成のための韻律情報を生成する韻律情報生成手段である。7は韻律情報生成手段6で決定されたアクセント句やアクセント核の位置などの韻律情報に基づいて、音響辞書13に格納しておいた音素を組み合わせて合成音声を生成する音響処理手段(音声合成処理手段)である。
【0027】
8はテキストを解析して形態素列を生成する際にテキスト解析手段1によって参照される解析辞書で、形態素となる単語の見だし、読み、品詞に加え、モーラ数やアクセント型などの情報が登録されている。9はアクセント句の境界位置やアクセント核位置を特定するアクセント情報が付与された大量のアクセント情報付きテキスト(学習用テキスト)を格納するアクセント情報付きテキストコーパス(学習用テキスト記憶手段)で、名詞連続列におけるアクセント句の境界位置の学習データを獲得するために利用する。また、アクセント情報付きテキストコーパス9に格納するアクセント情報付きテキストとしては、名詞連続列を含んでいるものであればよく、必ずしも主語・述語を持った形の文でなくても良い。10は名詞連続列中の各形態素に対して属性を付与する際に使用する形態素・属性対応テーブルで、形態素に付与すべき属性名を該形態素の見だしや品詞に対応付けた情報が格納されている。11は名詞連続列のアクセント句の境界位置を決定する際に使用するアクセント句境界学習データであって、アクセント情報付きテキストの名詞連続列に関する形態素属性列に対して、アクセント句境界の位置を特定するアクセント情報を含む形態素属性列が生起する確率を計算した情報を格納する。12はアクセント句に区切られた形態素列に対してアクセント核を決定する際に使用するアクセント核決定ルールで、連続する形態素に対するアクセント核の移動を示すルールが格納されている。13は合成音声を生成する際に使用する音響辞書であって、合成音声の基となる音素片を格納する。
【0028】
ここで、テキスト解析手段1、名詞連続抽出手段2、形態素属性付与手段3、アクセント句境界学習手段4、アクセント句境界決定手段5、韻律情報生成手段6及び音響処理手段7の一部の機能は、コンピュータ装置のプロセッサ(CPU)に実行させるプログラムによって実現することができる。また、解析辞書8、アクセント情報付きテキストコーパス9、形態素・属性対応テーブル10、アクセント句境界学習データ11、アクセント核決定テーブル12や音響辞書13の機能は、上記プロセッサによって適宜データの読み出し・書き込みが可能なコンピュータ装置が具備する記憶装置を利用することで実現することができる。
【0029】
次に動作について説明する。
図1に示すように、この実施の形態1による音声合成装置の処理は大きく2つに分けることができる。1つはアクセント情報付きテキストコーパス9からアクセント句境界学習データ11を作成するアクセント句境界学習処理で、もう1つは合成対象テキストから合成音を生成するテキスト音声合成処理である。
【0030】
最初に、アクセント句境界学習処理について説明する。
図2は図1中の音声合成装置によるアクセント句境界学習処理の概要を示すフロー図であり、図3は図2中のアクセント句境界学習処理における具体的な動作を示すフロー図である。ここで、図3中のステップST1−Aが図2中のテキスト解析処理を示すステップST1Aに対応し、図3中のステップST2−Aが名詞連続抽出処理を示す図2中のステップST2Aに対応し、図3中のステップST3−Aが形態素属性付与処理を示すステップST3Aに対応し、図3中のステップST4−AからステップST5−Aまでがアクセント句境界学習処理を示す図2中のステップST4Aに対応する。
【0031】
また、図4は図3中の各処理におけるデータ例を示す図である。図において、14はアクセント情報付きテキストコーパス9に格納されたアクセント情報付きテキスト(学習用テキスト)で、図示の例では2文挙げられている。また、「//」はアクセント句境界の位置であることを示している。15はテキスト14をそれぞれ形態素ごとに分割してなる形態素列で、ここでは学習文形態素列と称することにする。学習文形態素列15における「/」は、形態素区切りを示しており、また、括弧「()」内に形態素の品詞を示している。16は学習文形態素列15を構成する各形態素と形態素属性との対応関係であって、ここでは形態素・属性対応関係と称することにする。17は形態素・属性対応関係16における形態素属性を学習文形態素列15の各形態素の順序に並べてなる形態素属性列であって、ここでは学習文形態素属性列と称することにする。18はN−gram統計におけるtrigram、bigramの頻度集計単位で、学習文形態素属性列17を構成する各形態素属性列のパターンを列挙したものである。また、φは名詞連続列の開始位置、終了位置に挿入する特殊な記号である。
これら図2、3、4に沿ってアクセント句境界学習処理を説明する。
【0032】
先ず、テキスト解析手段1がアクセント情報付きテキストコーパス9に格納されたテキスト14を1つずつ取り出し、テキスト解析を行う(ステップST1A、ステップST1−A)。具体的に説明すると、先ず、テキスト解析手段1が入力したテキスト14を解析辞書11に登録した形態素となる単語の見だし、読み、品詞などの情報と照合して形態素列候補を求める。続いて、テキスト解析手段1は、これら形態素列候補のうちから文法的に接続可能な組み合わせを求め、図4に示すような学習文形態素列15として名詞連続抽出手段2に出力する。
【0033】
名詞連続抽出手段2は、名詞として認識すべき形態素が連続する形態素列である名詞連続形態素列を学習文形態素列15から取り出す(ステップST2A、ステップST2−A)。ここで、図4に示した学習文形態素列15は既に名詞連続列となっているので、名詞連続抽出手段2は、そのままの形で学習文形態素列15を形態素属性付与手段3に出力する。
【0034】
名詞連続列である学習文形態素列15を受けると、形態素属性付与手段3は、形態素・属性対応テーブル10に従って形態素属性を付与し、学習文形態素属性列17に変換する(ステップST3A、ステップST3−A)。
図5は図1中の形態素・属性テーブルの構成例を示す図である。図において、19は形態素と形態素属性との対応関係の一例であって、「会社」という形態素に後方一致する普通名詞に対して「<組織修飾>」という形態素属性を付与することを示している。また、20は形態素と形態素属性との対応関係の他例であって、「店」という「接尾語」形態素に対して「店」という見出しをそのまま形態素属性として付与することを示している。この形態素・属性対応テーブル10は、解析辞書11に格納されている見だし、品詞に対して付与する形態素属性を記述したもので、「*」はワイルドカード、「−」は見だしそのものを形態素属性にする指示である。
【0035】
形態素属性付与手段3は、形態素・属性対応テーブル10における対応条件を1つずつ順番にチェックし、最初に一致した条件の形態素属性を付与する。
図4に示す形態素・属性対応関係16は、学習形態素列例15中の形態素と形態素属性との対応を、図5に示す形態素・属性対応テーブル10に従って付与したものである。ここで、形態素・属性対応テーブル10を用いて形態素属性を決定する場合、アクセント句境界位置を示す「//」を無視して対応をとって形態素属性を決定する。続いて、形態素属性付与手段3は、形態素属性に対して「//」をそのまま付与して、形態素属性とアクセント句境界情報とが関連付けられた図4に示す学習文形態素属性列17のようなデータを生成する。この学習文形態素属性列17は、学習文形態素列15の各形態素を形態素・属性対応関係16における形態素属性で置き換えたものである。
このあと、形態素属性付与手段3は、上述のようにして生成した学習文形態素属性列17をアクセント句境界学習手段4に出力する。
【0036】
アクセント句境界学習手段4は、N−gram統計として学習文形態素属性列17中で連続するN−1,N個の形態素属性列に分割し、N−gramデータとして各形態素属性列の頻度を集計する(ステップST4A、ステップST4−A)。この頻度集計結果は、アクセント句境界学習データ11に保存される。以下、この実施の形態1では、例えばN=3として処理を説明する。即ち、学習文形態素属性列17である「<地名>/建設//<地名>/店」に対して、アクセント句境界学習手段4は、「φ <地名> 建設//」、「<地名> 建設// <地名>」、「建設// <地名> 店」、「<地名> 店 φ」、「φ <地名>」、「<地名> 建設//」、「建設// <地名>」、「<地名> 店」、及び「店 φ」を抽出する。続いて、アクセント句境界学習手段4は、アクセント情報付きテキストコーパス9に格納された全てのテキスト14に関して求めた形態素属性列群のうちで上記各形態素属性列に該当するものをそれぞれ抽出すると共に、その頻度をカウントしてゆく。図4に示す頻度集計単位18では、学習文形態素属性列17からbigram,trigramのデータを取り出した結果を示している。
【0037】
次に、アクセント句境界学習手段4は、上述のようにして集計してアクセント句境界学習データ11に記憶したN−gramの頻度集計結果から各形態素属性列の条件付き確率を求める(ステップST4A、ステップST5−A)。ここで、N−gramの条件付き確率は下記式(1)で求められる。
【数1】
Figure 0004083400
即ち、N=3の場合は、形態素属性列(a1,a2,a3)の頻度を、(a1,a2)の頻度で割ったものが、条件付き確率p(a3|a1,a2)となる。図6はアクセント句境界学習データの一例を示す図であり、図4に示す頻度集計単位18の頻度を集計して条件付き確率を求めたものである。図において、21は形態素属性列とその条件付き確率との対応関係の一例であって、形態素属性列(φ、<地名>、建設//)の条件付き確率が0.007であることを示している。
図6に示すアクセント句境界学習データは、アクセント句境界学習手段4が頻度集計単位18を含むアクセント情報付きテキストコーパス9の全てのテキストに上記処理を行って条件付き確率を求めた例である。
【0038】
アクセント句境界学習手段4は、上述のようにしてアクセント情報を有する形態素属性列の条件付き確率を求めると、これをアクセント句境界学習データ11として所定の記憶装置に記憶させる(ステップST4A、ステップST6−A)。ここまでの動作がアクセント句境界学習ステップに相当する。
【0039】
次に合成対象テキストから合成音を作成する音声合成処理について説明する。図7は図1中の音声合成装置によるテキスト音声合成処理の概要を示すフロー図であり、図8は図7中のテキスト音声合成処理における具体的な動作を示すフロー図である。ここで、図8中のステップST1−aがテキスト解析処理を示す図7中のステップST1aに対応し、図8中のステップST2−aが名詞連続抽出処理を示す図7中のステップST2aに対応し、図8中のステップST3−aが形態素属性付与処理を示す図7中のステップST3aに対応し、図8中のステップST4−aがアクセント句境界決定処理を示す図7中のステップST4aに対応し、図8中のステップST5−aが韻律情報生成処理を示す図7中のステップST5a及び音響処理を示すステップST6aに対応する。
【0040】
また、図9は図8中の各処理におけるデータ例を示す図である。図において、22は実施の形態1による音声合成装置が合成音声を生成する対象として入力した合成対象テキスト(処理対象テキスト)を示している。23は合成対象テキスト22を形態素解析して得た形態素列で、ここでは合成対象テキスト形態素列と称することにする。また、合成対象テキスト形態素列23中の括弧内に形態素の品詞を示している。24は合成対象テキスト形態素列23から抽出した名詞連続列であって、ここでは合成対象テキスト名詞連続列と称することにする。25は合成対象テキスト名詞連続列24を構成する各形態素と形態素属性との対応関係であって、ここでは形態素・属性対応関係と称することにする。26は合成対象テキスト名詞連続列24の形態素を形態素・属性対応関係25における形態素属性で置き換えてなる形態素属性列で、ここでは合成対象テキスト形態素属性列と称することにする。27はアクセント句境界学習データ11に格納された条件付き確率を用いて合成対象テキスト形態素属性列26から作成した形態素属性列における最も尤度が高いアクセント句境界位置を決定する最尤N−gramパス計算例である。この最尤N−gramパス計算例27については、後述する図10に詳細に説明している。28は最尤N−gramパス計算例27の結果に基づいて決定された最尤アクセント句境界決定結果である。29は最尤アクセント句境界決定結果28と名詞連続以外の形態素列とを合わせた結果を示すアクセント句境界付き形態素解析結果である。30はアクセント句境界付き形態素解析結果29に対してアクセント核決定ルール12を適用して、アクセント核位置を決定したアクセント核決定結果である。
これら図7、8、9に沿ってテキスト音声合成処理を説明する。
【0041】
先ず、アクセント句境界学習処理時と同様にして、テキスト解析手段1が解析辞書8を用いて、不図示の入力手段を介して入力された合成対象のテキスト22を形態素ごとに分解し、合成対象テキスト形態素列23を生成する(ステップST1a、ステップST1−a)。このあと、テキスト解析手段1は、合成対象テキスト形態素列23を名詞連続抽出手段2に出力する。図9において、合成対象テキスト22として2つのテキストを示したが、本来は別々に処理されるものであり、ここでは対比のために並べて示している。また、合成対象テキスト形態素列23は学習文形態素列25と同様の書式であるが、合成対象テキスト22にはアクセント句境界位置が未決定である。このため、上述した「//」記号は出現しない。
【0042】
名詞連続抽出手段2は、合成対象テキスト形態素列23から合成対象テキスト名詞連続列24を抽出する(ステップST2a、ステップST2−a)。このとき、合成対象テキスト名詞連続列24は形態素属性付与手段3に出力され、合成対象テキスト名詞連続列24以外の形態素列は韻律情報生成手段6に出力される。図9の例では、合成対象テキスト形態素列23である「東京(地名)/建設(サ変)/協会(普通名詞)/四谷(地名)/事務所(普通名詞)/で(格助詞)/は(係助詞)」のうち、合成対象テキスト名詞連続列24である「東京(地名)/建設(サ変)/協会(普通名詞)/四谷(地名)/事務所(普通名詞)」が形態素属性付与手段3に出力され、それ以外の「で(格助詞)/は(係助詞)」は韻律情報生成手段6に出力される。
【0043】
合成対象テキスト名詞連続列24を入力すると、形態素属性付与手段3は、図5に示した形態素・属性対応テーブル10に登録した対応関係に従って、各形態素に付与すべき形態素属性を決定し、合成対象テキスト形態素属性列26を生成する(ステップST3a、ステップST3−a)。具体的には、合成対象テキスト名詞連続列24に対して、形態素・属性対応テーブル10を用いて図9に示す形態素・属性対応関係25を求め、合成対象テキスト形態素属性列26を生成する。この合成対象テキスト形態素属性列26は、アクセント句境界決定手段5に出力される。
【0044】
アクセント句境界決定手段5では、アクセント句境界学習データ11を用いて合成対象テキスト形態素属性列26における全ての形態素属性列(N個)の条件付き確率を求めるとともに、下記式(2)に定める値が最大となるアクセント情報付きの形態素属性列を求めてアクセント句の境界位置を決定する(ステップST4a、ステップST4−a、アクセント句境界決定ステップ)。
【数2】
Figure 0004083400
【0045】
上記処理を具体的に説明すると、アクセント句境界決定手段5は、例えば図9に示した合成対象形態素属性列26のうちの「<地名>/建設/協会/<地名>/事務所」に対して、「φ/<地名>/建設」、「<地名>/建設/協会」、「建設/協会/<地名>」、「協会/<地名>/事務所」、及び「<地名>/事務所/φ」のN=3に対応する各形態素属性列を生成する。
続いて、アクセント句境界決定手段5は、図6に示したアクセント句境界学習データ11から、上述のようにして求めた各形態素属性列に対応する形態素属性列(アクセント句境界情報「//」の有無を問わない)の条件付き確率を取り出し、上記式(2)に従って条件付き確率の積を計算する(この計算過程が、最尤N−gramパス計算例27である)。
【0046】
図10は図9中の最尤N−gramパス計算例の詳細を示す図である。図10に示すように、アクセント句境界決定手段5は、例えば「φ/<地名>/建設」なる形態素属性列に対応する条件付き確率として、アクセント句境界学習データ11からp(建設|φ,<地名>)=0.002、p(建設|φ,<地名>//)=0.001、p(建設//|φ,<地名>)=0.007などを抽出する。さらに、「<地名>/建設/協会」に対して、p(協会|<地名>//,建設)=0.001、p(協会|<地名>//,建設//)=0.001、p(協会//|<地名>//,建設)=0.005などを抽出する。
【0047】
これに続いて、図10に示すように、アクセント句境界決定手段5は、アクセント句境界「//」を含めて一致する形態素属性列を構成するパスに対して、上記式(2)に従って条件付き確率の積を求める。具体的に説明すると、形態素属性列「<地名>/建設/協会/<地名>/事務所」に対して、図10中の太線のパスp(建設|φ,<地名>//)→p(協会//|<地名>//,建設)→p(<地名>|建設,協会//)→p(事務所|協会//,<地名>)→p(φ|<地名>,事務所)による条件付き確率積であるP(φ,<地名>//,建設,協会//,<地名>,事務所,φ)は、0.147×10−6となる。
この他に、例えばp(建設|φ,<地名>//)→p(協会//|<地名>//,建設)→p(<地名>//|建設,協会//)→p(事務所|協会//,<地名>//)→p(φ|<地名>,事務所)なるパスによる条件付き確率積P(φ,<地名>//,建設,協会//,<地名>//,<地名>,事務所,φ)は、0.460×10−11となる。
このようにして、形態素属性列「<地名>/建設/協会/<地名>/事務所」に対する条件付き確率積を求めた結果、図10の例では太線のパスによるものが最も大きな値(0.147×10−6)となり、最も尤もらしいアクセント句境界位置「<地名>//,建設,協会//,<地名>,事務所」が指定される。
【0048】
同様に、形態素属性列「<地名>/建設/総務/部」に対しては、図10中の太線で示したp(建設//|φ,<地名>)→p(総務|<地名>,建設//)→p(部|建設//,総務)→p(φ|総務,部)なるパスによる条件付き確率積P(φ,<地名>,建設//総務,部,φ)が0.616×10−7で最大となる。これにより、「<地名>,建設//,総務,部」が最も尤もらしいアクセント句境界位置として指定される。
【0049】
このあと、アクセント句境界決定手段5は、条件付き確率積P()の値が最大となった形態素属性列のアクセント句境界位置を、合成対象テキスト形態素属性列26の形態素列におけるアクセント句境界位置と決定して、図9に示すようなアクセント句境界情報付き形態素列である最尤アクセント句境界決定結果28を生成する。この最尤アクセント句境界決定結果28は、韻律情報生成手段6に出力される。
【0050】
次に、韻律情報生成手段6は、アクセント句境界決定手段5から入力した最尤アクセント句境界決定結果28と、名詞連続抽出手段2によって分割された合成対象テキスト形態素列23の名詞連続列以外の形態素列とを元の順番に戻して、当初の合成対象テキスト22に関する形態素列に対応するアクセント句境界付き形態素解析結果29を生成する。このアクセント句境界付き解析結果29の最尤アクセント句境界決定結果28の部分には、アクセント句境界位置を示す記号「//」がセット(即ち、アクセント句境界位置を示す情報がリンクされている)された形態素列となっている。
【0051】
このあと、韻律情報生成手段6は、アクセント核決定ルール15に基づいて、アクセント句境界付き形態素解析結果29における各アクセント句のアクセント核位置を決定する。なお、名詞連続列以外の部分については、助詞、助動詞などの付属語に自立語が後接する位置でアクセント句境界を挿入した上で、アクセント核を決定する。即ち、「・・・事務所/で/は/夜間/の・・・」と続く場合には、「・・・事務所/で/は//夜間/の・・・」のようにアクセント句境界を挿入した上で、アクセント核位置を決定する。
韻律情報生成手段6は、アクセント核決定ルール15に基づいて助詞接続についてのアクセント核の移動処理を行い、これらの情報を含む韻律情報を生成して、音響処理手段7に出力する(ステップST5a、ステップST5−a、音声合成処理ステップ)。具体的には、アクセント核決定ルール15として、例えばNHK日本語発音アクセント辞典などにあるような既知の処理ルールを適用し、接辞接続によるアクセント核決定、1アクセント句内の名詞連続のアクセント核決定、及び助詞接続によるアクセント核決定を行う。
この韻律情報生成手段6が生成する韻律情報のうち、形態素の読みとアクセントに関する情報とを表現したものが図9に示すアクセント核決定結果30であり、アクセント句境界「//」とアクセント核位置(下線部のモーラ)との情報が決定されている。
【0052】
音響処理手段7は、韻律情報生成手段6から入力したアクセント句やアクセント核の位置などの韻律情報に基づいて、音響辞書13に格納しておいた音素を組み合わせて、合成対象のテキスト22に関する合成音声を生成する(ステップST6a、ステップST5−a、音声合成処理ステップ)。例えば、図9に示すアクセント核決定結果30では、合成対象テキスト22として列挙した2つの「東京/建設」の部分をより自然に読み分けることが可能となっている。
【0053】
以上のように、この実施の形態1によれば、アクセント句の境界位置が既知であるテキストから学習データを生成し、この学習データを利用して合成対象のテキスト中の名詞連続列に対して最も尤もらしいアクセント句境界位置を決定するので、解析辞書8中の単語に用法を記述しなくてもアクセント句境界位置を決定することができるとともに、正しい合成音声を得ることができる。
【0054】
なお、上記実施の形態1では、N−gram統計のNを3として処理を進めたが、Nは3以外の値で学習してもよい。
【0055】
また、テキスト解析の際に解析辞書8に登録されていない未知語が存在した場合、この未知語が仮名表記の形態素であるならば、テキスト解析手段1が、尤もらしい品詞の推定処理として解析辞書8中の読み情報が一致する辞書見出しとその品詞とに置き換える。これにより、仮名表記の未知語が含まれていても処理が可能となる。
【0056】
さらに、仮名表記以外の未知語が存在した場合、未知語自身を名詞と仮定して処理を進め、この名詞と仮定した未知語の前後の形態素の形態素属性を含む形態素属性列に関するアクセント句境界学習データ11に格納された条件付き確率が最大となる形態素属性とし、記実施例の処理を同様に進めることで、仮名表記以外の未知語が含まれる場合の処理が可能である。
【0057】
実施の形態2.
図11はこの発明の実施の形態2による音声合成装置の構成を示すブロック図である。図において、31は形態素属性作成手段であって、名詞連続抽出手段2の出力を受けて形態素・属性対応テーブル10を作成する。なお、図1と同一構成要素には同一符号を付して重複する説明を省略する。
【0058】
次に動作について説明する。
図12は図11中の音声合成装置によるアクセント句境界学習処理の概要を示すフロー図であり、図13は図12中のアクセント句境界学習処理における具体的な動作を示すフロー図である。ここで、図13中のステップST1−Bが図12中のテキスト解析処理を示すステップST1Bに対応し、図13中のステップST2−Bが名詞連続抽出処理を示す図12中のステップST2Bに対応し、図13中のステップST3−Bが形態素属性付与処理を示すステップST3Bに対応し、図13中のステップST4−BからステップST6−Bまでがアクセント句境界学習処理を示す図12中のステップST4Bに対応し、図13中のステップST7−BからステップST9−Bまでが形態素属性作成処理を示す図12中のステップST5Bに対応する。
【0059】
また、図14は図12中の形態素属性作成処理で得た形態素属性を登録した形態素・属性対応テーブルを示す図であり、形態素・属性対応テーブル10に形態素属性を形態素そのもので定義して格納した例を示している。図において、32は固有名詞の直後に出現した形態素を集計し、高頻度のものを登録した直後形態素データで、33は固有名詞の直前に出現した形態素を集計し、高頻度の形態素を登録した直前形態素データである。
【0060】
次に動作について説明する。
先ず、上記実施の形態1と同様にして、テキスト解析手段1がアクセント情報付きテキストコーパス9に格納されたテキスト14を1つずつ取り出し、テキスト解析を行って学習文形態素列15を生成する(ステップST1B、ステップST1−B)。続いて、テキスト解析手段1は、学習文形態素列15を名詞連続抽出手段2に出力する。
【0061】
名詞連続抽出手段2は、名詞として認識すべき形態素が連続する形態素列である名詞連続形態素列を学習文形態素列15から取り出す(ステップST2B、ステップST2−B)。このとき、形態素属性作成手段31は、学習文形態素列15の中から固有名詞の形態素を抽出するとともに、この固有名詞形態素の直前の形態素を収集して頻度集計する(ステップST5B、ステップST7−B)。さらに、同様な手順で、形態素属性作成手段31は、固有名詞形態素の直後の形態素を収集して頻度集計する(ステップST5B、ステップST8−B)。ここで、形態素属性作成手段31は、固有名詞形態素の直前・直後の形態素が固有名詞である場合、収集・頻度集計を行わない。
【0062】
このあと、形態素属性作成手段31は、集計した形態素のうち頻度が所定のM個以上の形態素データを形態素・属性対応テーブル10に登録する(ステップST5B、ステップST9−B)。直後形態素データ32はステップST7−Bにて収集された形態素からの登録データを示し、直前形態素データ33はステップST8−Bにて収集された形態素からの登録データを示している。
ここで、直後形態素データ32及び直前形態素データ33の前後に、予め用意したデフォルトルールを記述するようにしてもよい。これにより、形態素属性作成手段31は、ステップST7−Bにて直前形態素データ33として業種などを示す可能性が高い形態素を収集することができ、ステップST8−Bにて直後形態素データ32として名詞に関する組織性を示す形態素を収集することが可能となる。
【0063】
一方、名詞連続抽出手段2から名詞連続列を受けた形態素属性付与手段3は、形態素属性作成手段31が新規に登録した形態素属性を含む形態素・属性対応テーブル10に従って形態素属性を付与し、学習文形態素属性列17に変換する(ステップST3B、ステップST3−B)。
【0064】
アクセント句境界学習手段4は、N−gram統計として学習文形態素属性列17中で連続するN−1,N個の形態素属性列に分割し、N−gramデータとして各形態素属性列の頻度を集計する(ステップST4B、ステップST4−B)。次に、アクセント句境界学習手段4は、上述のようにして集計してアクセント句境界学習データ11に記憶したN−gramの頻度集計結果から各形態素属性列の条件付き確率を求める(ステップST4B、ステップST5−B)。アクセント句境界学習手段4は、上述のようなアクセント情報を有する形態素属性列の条件付き確率を求めると、これをアクセント句境界学習データ11として所定の記憶装置に記憶させる(ステップST4B、ステップST6−B)。
これらの動作は、上記実施の形態1と同様である。
【0065】
以上のように、この実施の形態2によれば、アクセント句境界学習データ11を生成するにあたり、名詞連続列から固有名詞の形態素を抽出するとともに、該形態素に隣接する固有名詞以外の形態素の頻度を集計して所定値以上となる形態素を形態素属性として登録するので、アクセント句境界学習データ11の学習に要する形態素属性を適宜更新することができる。
【0066】
なお、上記実施の形態1,2では、形態素・属性対応テーブル10として、形態素の見だしや品詞を条件として形態素属性を付与したが、形態素の読みも条件に追加することも可能である。
【0067】
また、上記実施の形態1,2では、アクセント句境界学習データ11を形態素属性とアクセント句境界の情報とを組み合わせた形のシンボルとして処理したが、直前のアクセント句境界位置から形態素開始位置までのモーラ数情報を追加した形や、モーラ数情報をある特定の閾値以上または以下で2値にマッピングした値を追加した形や、読みを追加した形のシンボルとして処理しても良い。
図15は形態素属性にモーラ数を付け加えたアクセント句境界学習データの一例を示す図である。図において、34は各形態素のモーラ数を記述したアクセント情報付きテキストを示し、35はアクセント句境界位置から形態素の開始位置までのモーラ数を記述した形態素属性列を用いて生成した頻度集計単位を示しており、36はアクセント句境界位置から形態素の開始位置までのモーラ数が4以下か、4より大きいかで0、又は1を付加した形態素属性列を用いて生成した頻度集計単位を示している。
このようにすることで、アクセント句の境界位置をさらに正確に決定することができるアクセント句境界学習データを得ることができる。また、0、又は1の2値データを付加した形態素属性列を用いることで、アクセント情報として格納しておくべき情報量を低減することができる。
【0068】
【発明の効果】
以上のように、この発明によれば、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習処理を行い、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定するので、テキスト解析に単語の用法を要することなく、最も尤もらしいアクセント句境界位置を決定することができるという効果がある。
【0069】
この発明によれば、学習用テキストからアクセント句境界学習データを生成するにあたり、該テキストの名詞連続列における固有名詞の形態素を抽出するとともに、該形態素に隣接する固有名詞以外の形態素の頻度を集計して所定値以上となる形態素を形態素属性として登録するので、アクセント句境界学習データの学習に要する形態素属性を適宜更新することができるという効果がある。
【0070】
この発明によれば、形態素属性列の生起確率としてN−gram統計による条件付き確率を用いるので、最も尤もらしいアクセント句境界位置を決定するアクセント句境界学習データを提供することができるという効果がある。
【0071】
この発明によれば、入力テキスト内に仮名表記の未知語が存在する場合、読み情報が一致する形態素の情報を付与するので、仮名表記の未知語が存在したテキスト解析結果に対してもアクセント句境界位置の決定処理を行うことができるという効果がある。
【0072】
この発明によれば、入力テキスト内に仮名表記以外の未知語が存在する場合、該未知語自身を名詞として扱うとともに、これに隣接する形態素の形態素属性を含んでなる形態素属性列の生起確率が最も高くなる形態素属性とするので、仮名表記以外の未知語が存在したテキスト解析結果に対してもアクセント句境界位置の決定処理を行うことができるという効果がある。
【0073】
この発明によれば、アクセント句の境界位置から形態素の先頭位置までのモーラ数を関連付けたアクセント句境界学習データを生成するので、アクセント句の境界位置をさらに正確に決定することができるアクセント句境界学習データを得ることができるという効果がある。
【0074】
この発明によれば、アクセント句の境界位置から形態素の先頭位置までのモーラ数と所定の規定値との大小関係によって決定される2値情報を、形態素の先頭位置を特定する情報として用いるので、アクセント情報として記憶すべき情報量を低減させることができるという効果がある。
【0075】
この発明によれば、アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習処理を行い、処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列とアクセント句境界学習データとに基づいてアクセント句の境界位置を決定し、処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて処理対象テキストに関する合成音声を生成するので、テキスト解析に単語の用法を要することなく、正しい合成音声を得ることができるという効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による音声合成装置の構成を示すブロック図である。
【図2】 図1中の音声合成装置によるアクセント句境界学習処理の概要を示すフロー図である。
【図3】 図2中のアクセント句境界学習処理における具体的な動作を示すフロー図である。
【図4】 図3中の各処理におけるデータ例を示す図である。
【図5】 図1中の形態素・属性テーブルの構成例を示す図である。
【図6】 アクセント句境界学習データの一例を示す図である。
【図7】 図1中の音声合成装置によるテキスト音声合成処理の概要を示すフロー図である。
【図8】 図7中のテキスト音声合成処理における具体的な動作を示すフロー図である。
【図9】 図8中の各処理におけるデータ例を示す図である。
【図10】 図9中の最尤N−gramパス計算例の詳細を示す図である。
【図11】 この発明の実施の形態2による音声合成装置の構成を示すブロック図である。
【図12】 図11中の音声合成装置によるアクセント句境界学習処理の概要を示すフロー図である。
【図13】 図12中のアクセント句境界学習処理における具体的な動作を示すフロー図である。
【図14】 図12中の形態素属性作成処理で得た形態素属性を登録した形態素・属性対応テーブルを示す図である。
【図15】 形態素属性にモーラ数を付け加えたアクセント句境界学習データの一例を示す図である。
【図16】 従来の音声合成装置の構成を概略的に示すブロック図である。
【符号の説明】
1 テキスト解析手段、2 名詞連続抽出手段、3 形態素属性付与手段、4アクセント句境界学習手段、5 アクセント句境界決定手段、6 韻律情報生成手段、7 音響処理手段(音声合成処理手段)、8 解析辞書、9 アクセント情報付きテキストコーパス(学習用テキスト記憶手段)、10 形態素・属性対応テーブル、11 アクセント句境界学習データ、12 アクセント核決定ルール、13 音響辞書、14,34 アクセント情報付きテキスト(学習用テキスト)、15 学習文形態素列(形態素列)、16,25 形態素・属性対応関係、17 学習文形態素属性列(形態素属性列)、18,35,36 頻度集計単位、19,20 形態素と形態素属性との対応関係、21 形態素属性列と条件付き確率との対応関係、23 合成対象テキスト形態素列(形態素列)、24合成対象テキスト名詞連続列(名詞連続列)、26 合成対象テキスト形態素属性列(形態素属性列)、27 最尤N−gramパス計算例、28 最尤アクセント句境界決定結果、29 アクセント句境界付き形態素解析結果、30 アクセント核決定結果、31 形態素属性作成手段、32 直後形態素データ、33 直前形態素データ。

Claims (12)

  1. アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストを格納する学習用テキスト記憶手段と、
    入力したテキストの形態素列を生成するテキスト解析手段と、
    該テキスト解析手段が生成した形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出する名詞連続抽出手段と、
    上記名詞連続列を構成する各形態素に形態素属性を付与し、該名詞連続列に関する形態素属性列を生成する形態素属性付与手段と、
    上記学習用テキストの名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習手段と、
    処理対象のテキストの名詞連続列に関する形態素属性列と上記アクセント句境界学習データとに基づいて、該テキストの名詞連続列におけるアクセント句の境界位置を決定するアクセント句境界決定手段と
    を備えたアクセント句境界決定装置。
  2. アクセント句境界学習手段が学習用テキストからアクセント句境界学習データを生成するにあたり、該テキストの名詞連続列における固有名詞の形態素を抽出するとともに、該形態素に隣接する固有名詞以外の形態素の頻度を集計して所定値以上となる形態素を形態素属性として登録する形態素属性作成手段を備えたことを特徴とする請求項1記載のアクセント句境界決定装置。
  3. アクセント句境界学習手段は、形態素属性列の生起確率としてN−gram統計による条件付き確率を用いることを特徴とする請求項1又は請求項2記載のアクセント句境界決定装置。
  4. テキスト解析手段は、入力テキスト内に仮名表記の未知語が存在する場合、読み情報が一致する形態素の情報を付与することを特徴とする請求項1から請求項3のうちのいずれか1項記載のアクセント句境界決定装置。
  5. 入力テキスト内に仮名表記以外の未知語が存在する場合、該未知語自身を名詞として扱うとともに、これに隣接する形態素の形態素属性を含んでなる形態素属性列の生起確率が最も高くなる形態素属性とすることを特徴とする請求項1から請求項4のうちのいずれか1項記載のアクセント句境界決定装置。
  6. アクセント句境界学習手段は、アクセント句の境界位置から形態素の先頭位置までのモーラ数を関連付けたアクセント句境界学習データを生成することを特徴とする請求項1から請求項5のうちのいずれか1項記載のアクセント句境界決定装置。
  7. アクセント句境界学習手段は、アクセント句の境界位置から形態素の先頭位置までのモーラ数と所定の規定値との大小関係によって決定される2値情報を、上記形態素の先頭位置を特定する情報として用いることを特徴とする請求項6記載のアクセント句境界決定装置。
  8. 請求項1から請求項7のうちのいずれか1項記載のアクセント句境界決定装置と、
    処理対象のテキストの名詞連続列以外の形態素列と上記アクセント句境界決定装置がアクセント句境界位置を決定した名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を生成する韻律情報生成手段と、
    該韻律情報に基づいて上記処理対象テキストに関する合成音声を生成する音声合成処理手段と
    を備えた音声合成装置。
  9. アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、
    処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列と上記アクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと
    を備えたアクセント句境界決定方法。
  10. アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、
    処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列と上記アクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと、
    上記処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した上記名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて上記処理対象テキストに関する合成音声を生成する音声合成処理ステップと
    を備えた音声合成方法。
  11. アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、
    処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列と上記アクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと
    をコンピュータに実行させるアクセント句境界決定プログラム。
  12. アクセント句の境界位置を特定するアクセント情報を付与した学習用テキストに対して、その形態素列から名詞として認識すべき形態素が連続する名詞連続列を抽出し、該名詞連続列に付与された形態素属性の頻度を集計するとともに、該頻度を用いて各形態素属性を含む形態素属性列が生起する確率を算出し、該生起確率を有する形態素属性列とアクセント情報とを関連付けたアクセント句境界学習データを生成して保持するアクセント句境界学習ステップと、
    処理対象のテキストに対して、その形態素列から抽出した名詞連続列を構成する各形態素に形態素属性を付与して形態素属性列を生成するとともに、該形態素属性列と上記アクセント句境界学習データとに基づいてアクセント句の境界位置を決定するアクセント句境界決定ステップと、
    上記処理対象テキストの名詞連続列以外の形態素列とアクセント句境界位置を決定した上記名詞連続列とからアクセント情報を含む形態素列を求め、所定の基準に従って該形態素列におけるアクセント核位置を含む韻律情報を決定し、該韻律情報に基づいて上記処理対象テキストに関する合成音声を生成する音声合成処理ステップと
    をコンピュータに実行させる音声合成プログラム。
JP2001230188A 2001-07-30 2001-07-30 アクセント句境界決定装置、音声合成装置及び方法並びにプログラム Expired - Fee Related JP4083400B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001230188A JP4083400B2 (ja) 2001-07-30 2001-07-30 アクセント句境界決定装置、音声合成装置及び方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001230188A JP4083400B2 (ja) 2001-07-30 2001-07-30 アクセント句境界決定装置、音声合成装置及び方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2003044073A JP2003044073A (ja) 2003-02-14
JP4083400B2 true JP4083400B2 (ja) 2008-04-30

Family

ID=19062432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001230188A Expired - Fee Related JP4083400B2 (ja) 2001-07-30 2001-07-30 アクセント句境界決定装置、音声合成装置及び方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP4083400B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0824445A (ja) * 1994-07-18 1996-01-30 Asics Corp 防黴性を有するプールコース用フロート

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4129989B2 (ja) 2006-08-21 2008-08-06 インターナショナル・ビジネス・マシーンズ・コーポレーション テキスト音声合成を支援するシステム
JP2009122807A (ja) * 2007-11-13 2009-06-04 Nomura Securities Co Ltd 連想検索システム
JP6753401B2 (ja) 2015-07-24 2020-09-09 富士通株式会社 符号化プログラム、符号化装置、及び符号化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0824445A (ja) * 1994-07-18 1996-01-30 Asics Corp 防黴性を有するプールコース用フロート

Also Published As

Publication number Publication date
JP2003044073A (ja) 2003-02-14

Similar Documents

Publication Publication Date Title
US5930746A (en) Parsing and translating natural language sentences automatically
JP4559950B2 (ja) 韻律制御規則生成方法、音声合成方法、韻律制御規則生成装置、音声合成装置、韻律制御規則生成プログラム及び音声合成プログラム
JP5162697B2 (ja) 情報検索手法による統一化されたタスク依存の言語モデルの生成
US8392191B2 (en) Chinese prosodic words forming method and apparatus
US20020095289A1 (en) Method and apparatus for identifying prosodic word boundaries
US20040243409A1 (en) Morphological analyzer, morphological analysis method, and morphological analysis program
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP2004362584A (ja) テキストおよび音声の分類のための言語モデルの判別トレーニング
EP1623412B1 (en) Method for statistical language modeling in speech recognition
CN112818089B (zh) 文本注音方法、电子设备及存储介质
JP5625827B2 (ja) 形態素解析装置、音声合成装置、形態素解析方法及び形態素解析プログラム
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
US7103533B2 (en) Method for preserving contextual accuracy in an extendible speech recognition language model
JP4083400B2 (ja) アクセント句境界決定装置、音声合成装置及び方法並びにプログラム
JP5189413B2 (ja) 音声データ検索システム
JP2005339347A (ja) 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
JP2008146019A (ja) 音声合成用辞書作成システム、半導体集積回路装置及び半導体集積回路装置の製造方法
JP2004151527A (ja) 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体
JP2006243976A (ja) 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置
JP3029403B2 (ja) 文章データ音声変換システム
JPH11259088A (ja) 音声認識方法及び音声認識装置並びに記録媒体
JP4941495B2 (ja) ユーザ辞書作成システム、方法、及び、プログラム
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071101

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071101

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071101

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080213

R150 Certificate of patent or registration of utility model

Ref document number: 4083400

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140222

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees