JP2002258884A - 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2002258884A
JP2002258884A JP2001052792A JP2001052792A JP2002258884A JP 2002258884 A JP2002258884 A JP 2002258884A JP 2001052792 A JP2001052792 A JP 2001052792A JP 2001052792 A JP2001052792 A JP 2001052792A JP 2002258884 A JP2002258884 A JP 2002258884A
Authority
JP
Japan
Prior art keywords
compound word
word
information
text
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2001052792A
Other languages
English (en)
Inventor
Yoichi Fujii
洋一 藤井
Yasushi Ishikawa
泰 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001052792A priority Critical patent/JP2002258884A/ja
Publication of JP2002258884A publication Critical patent/JP2002258884A/ja
Abandoned legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 アクセント句決定ルールを適用する順を適切
にして、より自然な合成音声を生成することを可能とす
る。 【解決手段】 テキストコーパス中のテキストを解析
し、形態素列に分割するテキスト解析手段1と、形態素
列の中から複合語を抽出する複合語抽出手段2と、複合
語中の形態素組の頻度を集計し、その統計情報を学習デ
ータとして保持する統計情報学習手段3と、合成対象テ
キストから抽出した複合語に対して、学習データ13中
の統計情報に基づいて複合語中の構成単語間の結合度を
計算し、その結合度に基づきアクセント句決定ルールの
適用を行ない、複合語のアクセント句を決定する複合語
アクセント句決定手段4と、この決定した複合語のアク
セント情報、複合語と認定されなかった形態素列に対す
るアクセント情報および各アクセント句の韻律情報に基
づいて合成音声を生成する音響処理手段5とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、日本語テキスト
の内容を音声として合成する音声合成方法および装置並
びにプログラムを記録したコンピュータ読み取り可能な
記録媒体に関し、特に、音声合成装置のアクセント句決
定に関するものである。
【0002】
【従来の技術】従来の音声合成装置における複合語アク
セント決定処理として、例えば「複合語のアクセント句
境界付与方式」(特開平2−93499号公報)では、
複合語の構成単語を用言性単語を分類した情報と、それ
に隣接した単語の品詞情報を元に、アクセント句境界を
設定する方法が開示されている。
【0003】図14は、上述の従来方式の音声合成装置
を概略的に示す構成図である。図において、111は合
成対象のテキストを解析するための解析用辞書であっ
て、見出し、品詞、読み、見出し単独でのアクセントを
格納している。101は合成したいテキストを形態素に
分割するためのテキスト解析手段であって、解析用辞書
111を利用して合成対象テキストを形態素に分割す
る。102はテキスト解析手段101で分割した形態素
に対して、複合語中の名詞かどうかを判定する複合語判
定手段であって、複合語と判断した場合と複合語でない
とした場合で処理を分けるとともに、複合語中の名詞と
判定した場合は、名詞の細分類先を決定する。例えば、
細分類として、用言系名詞を動詞用法、ヲ格用法、ニ格
用法、主体用法、名詞用法に、非用言系名詞を体言系単
語、相言系単語、副言系単語に分類する。
【0004】112は名詞の細分類とその前後の接続品
詞によってアクセントをどのように決定するかを決定す
るアクセント判定基準である。アクセント判定基準11
2には、複合語判定手段102によって付与した細分類
の連接情報の優先度と、2つ以上の細分類の連続が、ア
クセント句としてどう振る舞うかが記述される。103
は複合語判定手段102で判定した複合語中の形態素情
報及び細分類情報とアクセント判定基準112に記述さ
れた基準とを照合し、複合語のアクセント句を決定する
複合語アクセント句決定手段である。さらに、104は
複合語判定手段102で複合語でないと判定された形態
素と、複合語アクセント句決定手段103で決定された
複合語のアクセント情報を元に合成音を生成する音響処
理手段である。
【0005】次に、処理の流れを説明する。合成対象テ
キストとして「ビル管理会社設立」が入力された場合、
テキスト解析手段101によって「ビル(名詞)」、
「管理(サ変)」、「会社(名詞)」、「設立(サ
変)」と解析される。次に、複合語判定手段102によ
って、「ビル(名詞):体言系単語」、「管理(サ
変):ヲ格用法」、「会社(名詞):体言系単語」、
「設立(サ変):動詞用法」と用法をセットする。複合
語アクセント句決定手段103では、複合語判定手段1
02で設定した用法の連続をアクセント判断基準112
に記述された{(体言系名詞、ヲ格用法)→結合}、
{(体言系名詞、体言系名詞)→結合}、{(体言系名
詞、動詞用法)→結合せず}の情報をテキストの先頭、
すなわち左の形態素から適用して、「ビル管理会社/設
立」というアクセント句の区切りを生成する。
【0006】
【発明が解決しようとする課題】以上のように、従来装
置では、テキスト解析結果後の形態素列中の複合語のア
クセント句決定に、あらかじめ得られた知見をルール化
したものを用いてアクセント句を決定していた。すなわ
ち、品詞および単語が持つ「用法」をあらかじめ辞書に
記入しておき、その用法を利用して、1つの塊としての
アクセント句として成立するかどうかを判断していた。
しかし、本来複合語は、複合語中の各単語がどういう関
係でどの単語に修飾するかを考慮した上で、アクセント
句を決定しなくては不自然なアクセントになる場合があ
る。従って、従来装置では、左の単語がすぐ隣の単語に
係らないようなものに対してはアクセント句を間違って
決定し、自然な合成音を生成できないという問題点があ
った。
【0007】この発明は、上述のような従来の問題点を
解決するためになされたものであり、複合語を構成する
単語のアクセントが単語個々の結合のしやすさ、単語間
の概念的関係などから決定されるということに基づき、
あらかじめ用意したテキストコーパス中の複合語中の単
語列の頻度を集計してその結合度を計算しておき、その
結合度を元に、アクセント句を決定する音声合成方法お
よび装置並びにプログラムを記録したコンピュータ読み
取り可能な記録媒体を提供することを目的とするもので
ある。
【0008】
【課題を解決するための手段】請求項1の発明に係る音
声合成方法は、あらかじめ用意されたテキストコーパス
中のテキストに含まれる形態素列の複合語の頻度情報に
基づいて学習データを作成する学習データ作成処理ステ
ップと、該学習データ作成処理ステップで作成された学
習データに基づいて合成対象テキストからの複合語に対
するアクセント情報を決定し、合成音声を生成するテキ
スト音声合成処理ステップとを備えたものである。
【0009】請求項2の発明に係る音声合成方法は、請
求項1の発明において、上記学習データ作成処理ステッ
プは、あらかじめ用意されたテキストコーパス中のテキ
ストを解析し、形態素列に分割するテキスト解析ステッ
プと、該テキスト解析ステップで分割された形態素列の
中から複合語を抽出する複合語抽出ステップと、該複合
語抽出ステップで抽出した複合語中の形態素組の頻度を
集計し、その統計情報を学習データとして保持する統計
情報学習ステップとを有し、上記テキスト音声合成処理
ステップは、合成対象テキストから上記テキスト解析ス
テップおよび上記複合語抽出ステップを介して抽出した
複合語に対して、上記学習データ中の統計情報に基づい
て複合語中の構成単語間の結合度を計算し、該結合度に
基づきアクセント句決定ルールの適用を行ない、複合語
のアクセント句を決定する複合語アクセント句決定ステ
ップと、該複合語アクセント句決定ステップで決定した
複合語のアクセント情報、上記複合語抽出ステップで複
合語と認定されなかった形態素列に対するアクセント情
報および各アクセント句の韻律情報に基づいて合成音声
を生成する音響処理ステップとを有するものである。
【0010】請求項3の発明に係る音声合成方法は、請
求項2の発明において、上記統計情報学習ステップにお
ける学習データとして、複合語を構成する連続単語の単
語対相互情報量を保持し、上記複合語アクセント句決定
ステップにおける結合度計算に上記単語相互情報量を用
いるものである。
【0011】請求項4の発明に係る音声合成方法は、請
求項2の発明において、上記統計情報学習ステップにお
ける学習データとして、複合語を構成する連続単語の概
念対相互情報量を保持し、上記複合語アクセント句決定
ステップにおける結合度計算に上記概念相互情報量を用
いるものである。
【0012】請求項5の発明に係る音声合成方法は、請
求項2の発明において、上記統計情報学習ステップの学
習データとして、複合語を構成する連続単語の品詞対相
互情報量を保持し、複合語アクセント句決定ステップに
おける結合度計算に上記品詞相互情報量を用いるもので
ある。
【0013】請求項6の発明に係る音声合成方法は、請
求項2の発明において、上記統計情報学習ステップの学
習データとして、複合語を構成する連続単語の単語対、
概念対、および品詞対の3種類の相互情報量を保持し、
上記複合語アクセント句決定ステップにおける結合度計
算に上記3種類の相互情報量の重みつき加算を用いるも
のである。
【0014】請求項7の発明に係る音声合成方法は、請
求項2〜6のいずれかの発明において、上記統計情報学
習ステップにおける学習データを、テキストコーパス中
の2形態素からなる複合語に限定して抽出し、学習する
ものである。
【0015】請求項8の発明に係る音声合成方法は、請
求項2〜7のいずれかの発明において、上記複合語アク
セント句決定ステップは、アクセント句決定ルールを適
用する時に、アクセント句を決定しようとする左右の形
態素の上位概念が一致する場合は、アクセントの結合を
行なわず、アクセント区切りとするものである。
【0016】請求項9の発明に係る音声合成方法は、請
求項6の発明において、上記複合語アクセント句決定ス
テップは、上記単語対相互情報量の単語対として出現し
なかった形態素に対して、同義語での単語対がある場合
は、同義語の単語対相互情報量を出現しなかった単語の
単語対情報量に置き換えて2形態素間の結合度の計算を
行うものである。
【0017】請求項10の発明に係る音声合成方法は、
請求項2〜9のいずれかの発明において、上記複合語ア
クセント句決定ステップは、上記複合語中の構成単語間
の結合度の計算に、2単語が連続して出現する可能性を
統計的に評価するモデルを用いるものである。
【0018】請求項11の発明に係る音声合成装置は、
あらかじめ用意されたテキストコーパス中のテキストに
含まれる形態素列の複合語の頻度情報に基づいて学習デ
ータを作成する学習データ作成処理手段と、該学習デー
タ作成処理手段で作成された学習データに基づいて合成
対象テキストからの複合語に対するアクセント情報を決
定し、合成音声を生成するテキスト音声合成処理手段と
を備えたものである。
【0019】請求項12の発明に係る音声合成装置は、
請求項11の発明において、上記学習データ作成処理手
段は、あらかじめ用意されたテキストコーパス中のテキ
ストを解析し、形態素列に分割するテキスト解析手段
と、該テキスト解析手段で分割された形態素列の中から
複合語を抽出する複合語抽出手段と、該複合語抽出手段
で抽出した複合語中の形態素組の頻度を集計し、その統
計情報を学習データとして保持する統計情報学習手段と
を有し、上記テキスト音声合成処理手段は、合成対象テ
キストから上記テキスト解析手段および上記複合語抽出
手段を介して抽出した複合語に対して、上記学習データ
中の統計情報に基づいて複合語中の構成単語間の結合度
を計算し、該結合度に基づきアクセント句決定ルールの
適用を行ない、複合語のアクセント句を決定する複合語
アクセント句決定手段と、該複合語アクセント句決定手
段で決定した複合語のアクセント情報、上記複合語抽出
手段で複合語と認定されなかった形態素列に対するアク
セント情報および各アクセント句の韻律情報に基づいて
合成音声を生成する音響処理手段とを有するものであ
る。
【0020】請求項13の発明に係る音声合成装置は、
請求項12の発明において、上記統計情報学習手段の学
習データとして、複合語を構成する連続単語の単語対相
互情報量を保持し、上記複合語アクセント句決定手段に
おける結合度計算に上記単語相互情報量を用いるもので
ある。
【0021】請求項14の発明に係る音声合成装置は、
請求項12の発明において、上記統計情報学習手段の学
習データとして、複合語を構成する連続単語の概念対相
互情報量を保持し、上記複合語アクセント句決定手段に
おける結合度計算に上記概念相互情報量を用いるもので
ある。
【0022】請求項15の発明に係る音声合成装置は、
請求項12の発明において、上記統計情報学習手段の学
習データとして、複合語を構成する連続単語の品詞対相
互情報量を保持し、複合語アクセント句決定手段におけ
る結合度計算に上記品詞相互情報量を用いるものであ
る。
【0023】請求項16の発明に係る音声合成装置は、
請求項12の発明において、上記統計情報学習手段の学
習データとして、複合語を構成する連続単語の単語対、
概念対、および品詞対の3種類の相互情報量を保持し、
上記複合語アクセント句決定手段における結合度計算に
上記3種類の相互情報量の重みつき加算を用いるもので
ある。
【0024】請求項17の発明に係る音声合成装置は、
請求項12〜16のいずれかの発明において、上記統計
情報学習手段における学習データを、テキストコーパス
中の2形態素からなる複合語に限定して抽出し、学習す
るものである。
【0025】請求項18の発明に係る音声合成装置は、
請求項12〜17のいずれかの発明において、上記複合
語アクセント句決定手段は、アクセント句決定ルールを
適用する時に、アクセント句を決定しようとする左右の
形態素の上位概念が一致する場合は、アクセントの結合
を行なわず、アクセント区切りとするものである。
【0026】請求項19の発明に係る音声合成装置は、
請求項16の発明において、上記複合語アクセント句決
定手段は、上記単語対相互情報量の単語対として出現し
なかった形態素に対して、同義語での単語対がある場合
は、同義語の単語対相互情報量を出現しなかった単語の
単語対情報量に置き換えて2形態素間の結合度の計算を
行うものである。
【0027】請求項20の発明に係る音声合成装置は、
請求項12〜19のいずれかの発明において、上記複合
語アクセント句決定手段は、上記複合語中の構成単語間
の結合度の計算に、2単語が連続して出現する可能性を
統計的に評価するモデルを用いるものである。
【0028】請求項21の発明に係るプログラムを記録
したコンピュータ読み取り可能な記録媒体は、あらかじ
め用意されたテキストコーパス中のテキストを解析し、
形態素列に分割するテキスト解析処理と、該テキスト解
析処理で分割された形態素列の中から複合語を抽出する
複合語抽出処理と、該複合語抽出処理で抽出した複合語
中の形態素組の頻度を集計し、その統計情報を学習デー
タとして保持する統計情報学習処理と、合成対象テキス
トから上記テキスト解析処理および上記複合語抽出処理
を通して抽出した複合語に対して、上記学習データ中の
統計情報に基づいて複合語中の構成単語間の結合度を計
算し、該結合度に基づきアクセント句決定ルールの適用
を行ない、複合語のアクセント句を決定する複合語アク
セント句決定処理と、該複合語アクセント句決定処理で
決定した複合語のアクセント情報、上記複合語抽出処理
で複合語と認定されなかった形態素列に対するアクセン
ト情報および各アクセント句の韻律情報に基づいて合成
音声を生成する音響処理とを有することを特徴とする音
声合成処理をコンピュータに実行させるものである。
【0029】
【発明の実施の形態】以下、この発明の一実施の形態
を、図について説明する。 実施の形態1.図1は、この発明の実施の形態1を示す
構成図である。図において、11はテキストを解析する
ための解析用辞書であって、単語の見だし、品詞、モー
ラ数、アクセント型および上位概念が付与されている。
12は大量のテキストコーパスであって、複合語の統計
情報を獲得するために用いる。13は複合語の統計情報
を格納するための学習データであって、複合語を構成す
る単語対に対して、単語対、概念対、および品詞対での
統計情報を格納する。
【0030】1はテキストコーパス12に格納されたテ
キスト、および実際の合成対象テキストを、解析用辞書
11を用いて解析し、形態素列を作成するテキスト解析
手段である。テキスト解析手段1としては、最長一致、
文節数最小法、およびコスト最小法などの既知の形態素
解析アルゴリズムを用いて処理するものである(たとえ
ば、首藤公昭,吉村賢治「日本語の構造とその解析」、
情報処理 Vol.27, No.8, pp.947〜954, 1986)。2はテ
キスト解析手段1にて切り出したテキスト中の形態素列
から複合語構成要素となる形態素列を特定する、つまり
テキスト中の形態素列から複合語を抽出する複合語抽出
手段である。3はテキストコーパス12のテキストに対
して、テキスト解析手段1で解析し、複合語抽出手段2
で抽出した複合語に対して、頻度情報を学習し、さら
に、テキストコーパス12のテキスト全体の頻度を学習
した結果に基づき、統計量を計算し、学習データ13に
格納する統計情報学習手段である。
【0031】一方、4は合成対象テキストをテキスト解
析手段1で解析し、複合語抽出手段2で抽出した複合語
形態素列に対して学習データ13を用い、アクセント句
決定ルール14を適用して複合語のアクセント句を決定
する複合語アクセント句決定手段である。5は複合語ア
クセント句決定手段4で決定した複合語のアクセント情
報と、複合語抽出手段2で複合語と認定されなかった形
態素列に対するアクセント情報および各アクセント句の
韻律情報などから合成音声を生成する音響処理手段であ
る。なお、テキスト解析手段1、複合語抽出手段2およ
び統計情報学習手段3は実質的に学習データ作成処理手
段を構成し、複合語アクセント句決定手段4および音響
処理手段5は実質的にテキスト解析手段1、複合語抽出
手段2と共にテキスト音声合成処理手段を構成する。
【0032】図2は、本実施の形態における、学習デー
タ13を作成するためのフロー図である。図において、
各ステップは、図1の学習データ作成処理を行うための
各手段に実質的に対応する。即ち、図1のテキスト解析
手段1、複合語抽出手段2および統計情報学習手段3
が、それぞれテキスト解析ステップS1、複合語抽出ス
テップS2および統計情報学習ステップS3に対応す
る。
【0033】図3は、本実施の形態における、テキスト
音声合成処理の流れを示すフロー図である。各ステップ
は、図1のテキスト音声合成処理を行うための各手段に
実質的に対応する。即ち、図1のテキスト解析手段1、
複合語抽出手段2、複合語アクセント句決定手段4およ
び音響処理手段5が、それぞれテキスト解析ステップS
1、複合語抽出ステップS2、複合語アクセント句決定
ステップS4および音響処理ステップS5に対応する。
【0034】図4は、テキストコーパス12から学習デ
ータ13を作るまでのテキスト解析ステップS1、複合
名詞抽出ステップS2および統計情報学習ステップS3
の具体的な処理フローである。その詳細説明について
は、後述する。
【0035】図5は、合成対象テキストが入力として渡
された場合に合成音を作成するまでのテキスト解析ステ
ップS1、複合名詞抽出ステップS2、複合語アクセン
ト句決定ステップS4および音響処理ステップS5の具
体的な処理フローである。この場合も、その詳細説明に
ついては、後述する。
【0036】図6は、テキストコーパス12に格納され
たテキストから複合語連続(形態素列)を取り出し、2
単語連続(形態素組)の頻度情報を集計するためのデー
タを作成の例を示した図である。図において、21はテ
キストコーパス12中の文例であり、22は文例21を
形態素に分割した形態素分割例である。23は形態素分
割例22から複合語だけを取り出した複合語形態素列例
であり、24は複合語形態素列例23から取り出した頻
度集計単位例である。
【0037】図7は、単語対の相互情報量として学習デ
ータ13に格納された単語対学習データ31の例であ
る。複合語中に出現する連続形態素の左形態素、右形態
素、単語対相互情報量の順に並んでいる。
【0038】図8は、概念対の相互情報量として学習デ
ータ13に格納された概念対学習データ32の例であ
る。図7と同様に、左形態素概念、右形態素概念、概念
対相互情報量の順に並んでいる。ここで<>で囲まれた
ものは概念を表すものとする。
【0039】図9は、品詞対の相互情報量として学習デ
ータ13に格納された品詞対学習データ33の例であ
る。図7と同様に、左形態素品詞、右形態素品詞、品詞
対相互情報量の順に並んでいる。
【0040】図10は、単語間結合度に基づき左右の複
合語に対して適用するアクセント句決定ルール40の例
である。ルール番号、左形態素列の品詞、右形態素列の
品詞、アクセント句ルールの順に記述されている。ここ
で、アクセント句ルールは、左形態素列lと右形態素列
rとが結合するかどうかと、結合する場合にどの形態素
が結合するかを記述したものになっている。実際のルー
ル適用の順番は、複合語中の結合度が大きい2形態素列
の順にアクセント句決定ルールを順次適用する。アクセ
ント句決定ルールは優先度があり、上位のルールから適
用を試みる。
【0041】図11は、合成対象テキストが形態素に分
割され、複合語構成形態素列が抽出され、その複合語構
成形態素列の結合度が計算されて、結合度の高い順にア
クセント句決定ルールが適用されて、複合語部分のアク
セント句が決定される例を示した図である。図におい
て、51は合成対象テキストの例、52は合成対象テキ
スト51を解析したテキスト解析結果の例、53はテキ
スト解析結果から複合語構成形態素列を抽出した結果の
例、54は複合語構成形態素列53に対して結合度を求
めた結果の例、55は計算した結合度54に基づき、ア
クセント句決定ルールを適用する順と、適応するルール
番号が決定された例である。56はルール実行順と、ル
ール番号からアクセント句を決定し、アクセント型を決
定した例である。
【0042】次に、動作について説明する。処理は、大
きく2つに分けることができ、1つはテキストコーパス
12から学習データ13を作成する学習データ作成処理
で、もう1つは、合成対象テキストから合成音を生成す
るテキスト音声合成処理である。まず、テキストコーパ
ス12から学習データ13を作成する学習データ作成処
理の動作について、図4を参照しながら説明する。
【0043】最初に、テキストコーパス12に格納され
たテキストはステップS21にて未処理の文があるかど
うかが判定し、すべての文が処理されるまでステップS
22によってテキストを1文づつ取り出す。ステップS
22で取り出した文は、ステップS23で解析用辞書1
1を使いながら形態素に解析し、解析結果である形態素
列をステップS24に渡す。
【0044】図6の21はテキストコーパスに格納され
た文の例であり、22は21の文を形態素解析した結果
の例である。次に、ステップS24では、形態素列の中
から、複数の「名詞相当形態素」が連続するもの、つま
り「名詞相当形態素列」を抽出する。ここで、名詞相当
形態素とは、たとえば、「一般名詞」、「固有名詞」、
「サ変名詞語幹」、「形容動詞語幹」、「接頭辞」、
「接尾辞」および「未知語」とする。従って、形態素解
析例22からは「地下」、「軍事」、「施設」という複
合語形態素列例23を抽出する。この時、「接頭辞」お
よび「接尾辞」を伴う場合は、それぞれ、次の形態素、
前の形態素に接続し、新しい形態素に置き換える。
【0045】次に、ステップS25では、抽出された複
合語形態素列例23に対して、単語見出しの連接する形
態素組を抽出し、その単語対の頻度を左単語頻度、右単
語頻度、単語対頻度として加算する。具体的には、複合
語形態素列例23から切り出した24の単語対をすべて
頻度カウントする。
【0046】さらに、ステップS26では、複合語形態
素列例23から同様に概念対を抽出し、同様に頻度カウ
ントする。また、ステップS26での処理が終わると、
ステップS27で複合語形態素列例23から同様に品詞
対を抽出し、頻度カウントする。テキストコーパス中の
すべてのテキストに対して、ステップS22からS27
までを繰り返すと、ステップS21にて未処理の文が無
くなり、ステップS28に処理を移す。
【0047】ステップS28では、ステップS25で計
算した単語対頻度情報に基づき、下記の式(1)の相互
情報量Iを求め、学習データ13に格納する。
【0048】
【数1】
【0049】ここで、x,yはステップS28では単語
を表す。以下、単語対の相互情報量をIwとする。さら
に、ステップS29では、ステップS26で計算した概
念対頻度情報に基づき、上記式(1)のx,yを概念と
して相互情報量Iを求め、学習データ13に格納する。
以下、概念対の相互情報量をIcとする。
【0050】また、ステップS30では、ステップS2
7で計算した品詞対頻度情報に基づき、上記式(1)の
x,yを品詞として相互情報量Iを求め、学習データ1
3に格納する。以下、品詞対の相互情報量をIpとす
る。
【0051】図7の31は24の単語対に対して相互情
報量Iw(普通名詞,普通名詞)、Iw(普通名詞,サ
変名詞)を計算した結果を示している。さらに、図8の
32は24の単語対に対して相互情報量Ic(<内外
>,<活動の分野>)、Ic(<活動の分野>,<機能
具体物>)を計算した結果を示している。
【0052】次に、合成対象テキストから合成音を作成
するテキスト音声合成処理の動作について、図5を参照
しながら説明する。まず、ステップS23において、図
11の文51が合成対象テキストとして渡されたとす
る。ステップS23では学習データ作成処理時と同様に
処理対象のテキストを形態素列に解析する。従って、文
51を解析し形態素に分割した結果は形態素列52にな
る。
【0053】次に、ステップS24では、形態素列から
複合語形態素列を取り出して複合語形態素列部分はステ
ップS41に、複合語形態素列以外の部分はステップS
43に直接渡される。形態素列52の例では、「国連/
平和/維持/活動」がステップS41に渡され、それ以
外の「日本/は」、および「に/参加する」は直接ステ
ップS43に渡される。ステップS41では、複合語形
態素列に対して、連接する単語間の単語対結合度を計算
する。単語対結合度は下記の式(2)に基づき計算す
る。
【0054】
【数2】
【0055】たとえば、複合語形態素列53を渡した場
合、例としてα=0.5、β=0.3、γ=0.2とす
ると、図7、図8、および図9の相互情報量から結合度
は、結合度54のように、それぞれC(国連,平和)=
1.1371、C(平和,維持)=1.2998、C
(維持,活動)=1.1679と計算できる。結合度が
求まるとそれに基づき、ステップS42では結合度の高
い順にアクセント句決定ルールを選択し、アクセント句
ルールを順次適用する。55の例で示すようにまず、
(平和、維持)に対して図10のルール番号8が適用さ
れ1つのアクセント句となる。次に、((平和、維
持)、活動)に対してルール番号2が適用され、さらに
1つのアクセント句となる。最後に(国連、((平和、
維持)、活動))に対してルール番号6が適用され、
(国連、平和維持活動)の2つのアクセント句を作成す
る。
【0056】但し、上記ルールを適用しない例外的なも
のとして、概念が共通する左形態素列と右形態素列に対
して処理する場合はルールを適用せず、アクセント句の
切れ目とする。このとき、左形態素列と右形態素列が1
形態素でなく複数の形態素からなる場合は、もっとも右
の形態素の概念を全体の概念とみなす。
【0057】最後に、ステップS43で、助詞接続のア
クセント移動の処理が行なわれ、韻律情報を生成し、合
成音声を生成する。なお、上記処理における、接辞接続
によるアクセント型変化、1アクセント内の複合語のア
クセント型変化、および助詞接続によるアクセント型の
変化は、たとえば、「NHK日本語発音アクセント辞
典」などにあるような既知の処理ルールを適用してアク
セント型を決定する。
【0058】なお、統計情報学習手段3の処理として、
複合語抽出手段2で抽出したすべての複合名詞でなく、
2形態素からのみなる複合名詞に限定して学習すること
も可能である。
【0059】このように、本実施の形態では、単語連続
の結合度を利用して形態素の結合順を決定したうえで、
アクセント句決定ルールを適用し、アクセント句を決定
するので従来品詞情報のみでルールを適用した場合と比
べ、アクセント句決定ルールを適用する順が適切にな
り、従って、より自然な合成音声を生成することが可能
となる。
【0060】実施の形態2.図12は、この発明の実施
の形態2における単語に対して概念を取り出すための概
念体系の例を示す図である。図において、61はあらか
じめ辞書に登録する概念のレベルの例であり、62は単
語を表す概念を共有する単語を同義語として扱う例であ
る。
【0061】上記実施の形態1では、複合語アクセント
句決定手段4で、2形態素間の結合度を単語対相互情報
量、品詞対相互情報量、および概念対相互情報量の3つ
の相互情報量の重み付き加算(式2)によって求めた
が、単語対相互情報量の単語対として出現しなかった形
態素に対して、図12で示したような同義語62での単
語対がある場合は、たとえば、テキスト中で「地中」が
出現し、かつ単語対相互情報量が存在しなかった場合
に、同義語である「地下」の相互情報量を利用するとい
った、同義語による置き換えを行って結合度を計算して
もよい。
【0062】また、上述の結合度を計算するのに、上記
実施の形態1では、連続単語の相互情報量を用いたが、
単語が連続して出現する確率など、2単語が連続して出
現する可能性を統計的に評価するモデルを適用すること
も可能である。
【0063】実施の形態3.図13は、この発明の実施
の形態3におけるアクセント区切り挿入位置決定の例を
示す図である。図において、71は上記実施の形態1と
同様に、複合語形態素列53の各形態素間の結合度を表
した例である。72は結合度71の相互情報量に基づ
き、アクセント句決定ルールを適用する前にアクセント
区切りが挿入された例であり、73はアクセント区切り
の位置を示す。74はアクセント区切り例72にアクセ
ント句決定ルールを適用した結果である。
【0064】上記実施の形態1および2では、複合語ア
クセント句決定手段4で、相互情報量が大きい順番に単
純にアクセント句決定ルールの適用を行なったが、複合
語アクセント句決定手段4でのアクセント句決定ルール
適用処理の前に、相互情報量に基づき隣接する形態素と
の相互情報量がそれ以外の単語との相互情報量の最大値
よりも小さい場合に、隣接する形態素との間にアクセン
ト区切りを設定し、各アクセント句の塊に対して、上記
実施の形態1のアクセント句決定ルールを適用してもよ
い。
【0065】すなわち、複合語形態素列53の結合度7
1に対して、まず、「国連」に着目する。C(国連、平
和)=1.1371、C(国連、維持)=0.876
1、C(国連、活動)=1.2352の比較を行なう。
隣接しないC(国連、維持)、C(国連、活動)の最大値
1.2352と、隣接するC(国連、平和)では、C(国
連、平和)<C(国連、活動)となるため、72のアク
セント区切りを「国連」と「平和」の間に設定する。次
に、「平和」に着目を移す。C(平和、維持)>C(平
和、活動)のため「平和」と「維持」の間にアクセント
区切りを設定しない。この様に処理した、アクセント区
切り例72に対して、上記実施の形態1と同様ルール番
号8、2を適用する。なお、本実施の形態の場合には、
「国連」と「平和」の間にはアクセント区切りが既に設
定されているため、ルール番号6は適用しない。
【0066】
【発明の効果】以上のように、請求項1の発明によれ
ば、あらかじめ用意されたテキストコーパス中のテキス
トに含まれる形態素列の複合語の頻度情報に基づいて学
習データを作成する学習データ作成処理ステップと、該
学習データ作成処理ステップで作成された学習データに
基づいて合成対象テキストからの複合語に対するアクセ
ント情報を決定し、合成音声を生成するテキスト音声合
成処理ステップとを備えたので、従来例に比し、より自
然な合成音声を生成することが可能になるという効果が
ある。
【0067】また、請求項2の発明によれば、上記学習
データ作成処理ステップは、あらかじめ用意されたテキ
ストコーパス中のテキストを解析し、形態素列に分割す
るテキスト解析ステップと、該テキスト解析ステップで
分割された形態素列の中から複合語を抽出する複合語抽
出ステップと、該複合語抽出ステップで抽出した複合語
中の形態素組の頻度を集計し、その統計情報を学習デー
タとして保持する統計情報学習ステップとを有し、上記
テキスト音声合成処理ステップは、合成対象テキストか
ら上記テキスト解析ステップおよび上記複合語抽出ステ
ップを介して抽出した複合語に対して、上記学習データ
中の統計情報に基づいて複合語中の構成単語間の結合度
を計算し、該結合度に基づきアクセント句決定ルールの
適用を行ない、複合語のアクセント句を決定する複合語
アクセント句決定ステップと、該複合語アクセント句決
定ステップで決定した複合語のアクセント情報、上記複
合語抽出ステップで複合語と認定されなかった形態素列
に対するアクセント情報および各アクセント句の韻律情
報に基づいて合成音声を生成する音響処理ステップとを
有するので、従来品詞情報のみでルールを適用した場合
と比べ、アクセントルールを適用する順が適切になり、
以て、より自然な合成音声を生成することが可能になる
という効果がある。
【0068】また、請求項3の発明によれば、上記統計
情報学習ステップにおける学習データとして、複合語を
構成する連続単語の単語対相互情報量を保持し、上記複
合語アクセント句決定ステップにおける結合度計算に上
記単語相互情報量を用いるので、より自然な合成音声の
生成に寄与できるという効果がある。
【0069】また、請求項4の発明によれば、上記統計
情報学習ステップにおける学習データとして、複合語を
構成する連続単語の概念対相互情報量を保持し、上記複
合語アクセント句決定ステップにおける結合度計算に上
記概念相互情報量を用いるので、より自然な合成音声の
生成に寄与できるという効果がある。
【0070】また、請求項5の発明によれば、上記統計
情報学習ステップの学習データとして、複合語を構成す
る連続単語の品詞対相互情報量を保持し、複合語アクセ
ント句決定ステップにおける結合度計算に上記品詞相互
情報量を用いるので、より自然な合成音声の生成に寄与
できるという効果がある。
【0071】また、請求項6の発明によれば、上記統計
情報学習ステップの学習データとして、複合語を構成す
る連続単語の単語対、概念対、および品詞対の3種類の
相互情報量を保持し、上記複合語アクセント句決定ステ
ップにおける結合度計算に上記3種類の相互情報量の重
みつき加算を用いるので、さらに、より自然な合成音声
の生成に寄与できるという効果がある。
【0072】また、請求項7の発明によれば、上記統計
情報学習ステップにおける学習データを、テキストコー
パス中の2形態素からなる複合語に限定して抽出し、学
習するので、効率よく学習データを得ることができると
いう効果がある。
【0073】また、請求項8の発明によれば、上記複合
語アクセント句決定ステップは、アクセント句決定ルー
ルを適用する時に、アクセント句を決定しようとする左
右の形態素の上位概念が一致する場合は、アクセントの
結合を行なわず、アクセント区切りとするので、確実に
アクセント句を決定できるという効果がある。
【0074】また、請求項9の発明によれば、上記複合
語アクセント句決定ステップは、上記単語対相互情報量
の単語対として出現しなかった形態素に対して、同義語
での単語対がある場合は、同義語の単語対相互情報量を
出現しなかった単語の単語対情報量に置き換えて2形態
素間の結合度の計算を行うので、効率よく結合度を算出
できるという効果がある。
【0075】また、請求項10の発明によれば、上記複
合語アクセント句決定ステップは、上記複合語中の構成
単語間の結合度の計算に、2単語が連続して出現する可
能性を統計的に評価するモデルを用いるので、効率よ
く、確実にアクセント句を決定するのに寄与できるとい
う効果がある。
【0076】また、請求項11の発明によれば、あらか
じめ用意されたテキストコーパス中のテキストに含まれ
る形態素列の複合語の頻度情報に基づいて学習データを
作成する学習データ作成処理手段と、該学習データ作成
処理手段で作成された学習データに基づいて合成対象テ
キストからの複合語に対するアクセント情報を決定し、
合成音声を生成するテキスト音声合成処理手段とを備え
たので、従来例に比し、より自然な合成音声を生成する
ことが可能になるという効果がある。
【0077】また、請求項12の発明によれば、上記学
習データ作成処理手段は、あらかじめ用意されたテキス
トコーパス中のテキストを解析し、形態素列に分割する
テキスト解析手段と、該テキスト解析手段で分割された
形態素列の中から複合語を抽出する複合語抽出手段と、
該複合語抽出手段で抽出した複合語中の形態素組の頻度
を集計し、その統計情報を学習データとして保持する統
計情報学習手段とを有し、上記テキスト音声合成処理手
段は、合成対象テキストから上記テキスト解析手段およ
び上記複合語抽出手段を介して抽出した複合語に対し
て、上記学習データ中の統計情報に基づいて複合語中の
構成単語間の結合度を計算し、該結合度に基づきアクセ
ント句決定ルールの適用を行ない、複合語のアクセント
句を決定する複合語アクセント句決定手段と、該複合語
アクセント句決定手段で決定した複合語のアクセント情
報、上記複合語抽出手段で複合語と認定されなかった形
態素列に対するアクセント情報および各アクセント句の
韻律情報に基づいて合成音声を生成する音響処理手段と
を有するので、従来品詞情報のみでルールを適用した場
合と比べ、アクセントルールを適用する順が適切にな
り、以て、より自然な合成音声を生成することが可能に
なるという効果がある。
【0078】また、請求項13の発明によれば、上記統
計情報学習手段の学習データとして、複合語を構成する
連続単語の単語対相互情報量を保持し、上記複合語アク
セント句決定手段における結合度計算に上記単語相互情
報量を用いるので、より自然な合成音声の生成に寄与で
きるという効果がある。
【0079】また、請求項14の発明によれば、上記統
計情報学習手段の学習データとして、複合語を構成する
連続単語の概念対相互情報量を保持し、上記複合語アク
セント句決定手段における結合度計算に上記概念相互情
報量を用いるので、より自然な合成音声の生成に寄与で
きるという効果がある。
【0080】また、請求項15の発明によれば、上記統
計情報学習手段の学習データとして、複合語を構成する
連続単語の品詞対相互情報量を保持し、複合語アクセン
ト句決定手段における結合度計算に上記品詞相互情報量
を用いるので、より自然な合成音声の生成に寄与できる
という効果がある。
【0081】また、請求項16の発明によれば、上記統
計情報学習手段の学習データとして、複合語を構成する
連続単語の単語対、概念対、および品詞対の3種類の相
互情報量を保持し、上記複合語アクセント句決定手段に
おける結合度計算に上記3種類の相互情報量の重みつき
加算を用いるので、さらに、より自然な合成音声の生成
に寄与できるという効果がある。
【0082】また、請求項17の発明によれば、上記統
計情報学習手段における学習データを、テキストコーパ
ス中の2形態素からなる複合語に限定して抽出し、学習
するので、効率よく学習データを得ることができるとい
う効果がある。
【0083】また、請求項18の発明によれば、上記複
合語アクセント句決定手段は、アクセント句決定ルール
を適用する時に、アクセント句を決定しようとする左右
の形態素の上位概念が一致する場合は、アクセントの結
合を行なわず、アクセント区切りとするので、確実にア
クセント句を決定できるという効果がある。
【0084】また、請求項19の発明によれば、上記複
合語アクセント句決定手段は、上記単語対相互情報量の
単語対として出現しなかった形態素に対して、同義語で
の単語対がある場合は、同義語の単語対相互情報量を出
現しなかった単語の単語対情報量に置き換えて2形態素
間の結合度の計算を行うので、効率よく結合度を算出で
きるという効果がある。
【0085】また、請求項20の発明によれば、上記複
合語アクセント句決定手段は、上記複合語中の構成単語
間の結合度の計算に、2単語が連続して出現する可能性
を統計的に評価するモデルを用いるので、効率よく、確
実にアクセント句を決定するのに寄与できるという効果
がある。
【0086】さらに、請求項21の発明によれば、あら
かじめ用意されたテキストコーパス中のテキストを解析
し、形態素列に分割するテキスト解析処理と、該テキス
ト解析処理で分割された形態素列の中から複合語を抽出
する複合語抽出処理と、該複合語抽出処理で抽出した複
合語中の形態素組の頻度を集計し、その統計情報を学習
データとして保持する統計情報学習処理と、合成対象テ
キストから上記テキスト解析処理および上記複合語抽出
処理を通して抽出した複合語に対して、上記学習データ
中の統計情報に基づいて複合語中の構成単語間の結合度
を計算し、該結合度に基づきアクセント句決定ルールの
適用を行ない、複合語のアクセント句を決定する複合語
アクセント句決定処理と、該複合語アクセント句決定処
理で決定した複合語のアクセント情報、上記複合語抽出
処理で複合語と認定されなかった形態素列に対するアク
セント情報および各アクセント句の韻律情報に基づいて
合成音声を生成する音響処理とを有することを特徴とす
る音声合成処理をコンピュータに実行させるので、より
自然な合成音声を生成することが可能な記録媒体が得ら
れるという効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1を示す構成図であ
る。
【図2】 この発明の実施の形態1における学習デー
タ作成処理を示す図である。
【図3】 この発明の実施の形態1における合成音声
作成処理を示す図である。
【図4】 この発明の実施の形態1における学習デー
タ作成処理のフローチャートである。
【図5】 この発明の実施の形態1における合成音声
作成処理のフローチャートである。
【図6】 この発明の実施の形態1における学習デー
タ作成時の複合語処理のデータの例を示す図である。
【図7】 この発明の実施の形態1における単語対学
習データの例を示す図である。
【図8】 この発明の実施の形態1における概念対学
習データの例を示す図である。
【図9】 この発明の実施の形態1における品詞対学
習データの例を示す図である。
【図10】 この発明の実施の形態1におけるアクセ
ント句決定ルールの例を示す図である。
【図11】 この発明の実施の形態1における複合語
アクセント句決定の例を示す図である。
【図12】 この発明の実施の形態2における同義
語、概念体系の例を示す図である。
【図13】 この発明の実施の形態3におけるアクセ
ント区切り挿入位置の例を示す図である。
【図14】 従来の音声合成装置を示す構成図であ
る。
【符号の説明】
1 テキスト解析手段、2 複合語抽出手段、3 統計
情報学習手段、4 複合語アクセント句決定手段、5
音響処理手段、11 テキストコーパス、12解析用辞
書、13 学習データ、14 アクセント句決定ルー
ル。

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 あらかじめ用意されたテキストコーパス
    中のテキストに含まれる形態素列の複合語の頻度情報に
    基づいて学習データを作成する学習データ作成処理ステ
    ップと、 該学習データ作成処理ステップで作成された学習データ
    に基づいて合成対象テキストからの複合語に対するアク
    セント情報を決定し、合成音声を生成するテキスト音声
    合成処理ステップとを備えたことを特徴とする音声合成
    方法。
  2. 【請求項2】 上記学習データ作成処理ステップは、あ
    らかじめ用意されたテキストコーパス中のテキストを解
    析し、形態素列に分割するテキスト解析ステップと、該
    テキスト解析ステップで分割された形態素列の中から複
    合語を抽出する複合語抽出ステップと、該複合語抽出ス
    テップで抽出した複合語中の形態素組の頻度を集計し、
    その統計情報を学習データとして保持する統計情報学習
    ステップとを有し、上記テキスト音声合成処理ステップ
    は、合成対象テキストから上記テキスト解析ステップお
    よび上記複合語抽出ステップを介して抽出した複合語に
    対して、上記学習データ中の統計情報に基づいて複合語
    中の構成単語間の結合度を計算し、該結合度に基づきア
    クセント句決定ルールの適用を行ない、複合語のアクセ
    ント句を決定する複合語アクセント句決定ステップと、
    該複合語アクセント句決定ステップで決定した複合語の
    アクセント情報、上記複合語抽出ステップで複合語と認
    定されなかった形態素列に対するアクセント情報および
    各アクセント句の韻律情報に基づいて合成音声を生成す
    る音響処理ステップとを有することを特徴とする請求項
    1記載の音声合成方法。
  3. 【請求項3】 上記統計情報学習ステップにおける学習
    データとして、複合語を構成する連続単語の単語対相互
    情報量を保持し、上記複合語アクセント句決定ステップ
    における結合度計算に上記単語相互情報量を用いること
    を特徴とする請求項2記載の音声合成方法。
  4. 【請求項4】 上記統計情報学習ステップにおける学習
    データとして、複合語を構成する連続単語の概念対相互
    情報量を保持し、上記複合語アクセント句決定ステップ
    における結合度計算に上記概念相互情報量を用いること
    を特徴とする請求項2記載の音声合成方法。
  5. 【請求項5】 上記統計情報学習ステップの学習データ
    として、複合語を構成する連続単語の品詞対相互情報量
    を保持し、複合語アクセント句決定ステップにおける結
    合度計算に上記品詞相互情報量を用いることを特徴とす
    る請求項2記載の音声合成方法。
  6. 【請求項6】 上記統計情報学習ステップの学習データ
    として、複合語を構成する連続単語の単語対、概念対、
    および品詞対の3種類の相互情報量を保持し、上記複合
    語アクセント句決定ステップにおける結合度計算に上記
    3種類の相互情報量の重みつき加算を用いることを特徴
    とする請求項2記載の音声合成方法。
  7. 【請求項7】 上記統計情報学習ステップにおける学習
    データを、テキストコーパス中の2形態素からなる複合
    語に限定して抽出し、学習することを特徴とする請求項
    2〜6のいずれかに記載の音声合成方法。
  8. 【請求項8】 上記複合語アクセント句決定ステップ
    は、アクセント句決定ルールを適用する時に、アクセン
    ト句を決定しようとする左右の形態素の上位概念が一致
    する場合は、アクセントの結合を行なわず、アクセント
    区切りとすることを請求項2〜7のいずれかに記載の特
    徴とする音声合成方法。
  9. 【請求項9】 上記複合語アクセント句決定ステップ
    は、上記単語対相互情報量の単語対として出現しなかっ
    た形態素に対して、同義語での単語対がある場合は、同
    義語の単語対相互情報量を出現しなかった単語の単語対
    情報量に置き換えて2形態素間の結合度の計算を行うこ
    とを特徴とする請求項6記載の音声合成方法。
  10. 【請求項10】 上記複合語アクセント句決定ステップ
    は、上記複合語中の構成単語間の結合度の計算に、2単
    語が連続して出現する可能性を統計的に評価するモデル
    を用いることを特徴とする請求項2〜9のいずれかに記
    載の音声合成方法。
  11. 【請求項11】 あらかじめ用意されたテキストコーパ
    ス中のテキストに含まれる形態素列の複合語の頻度情報
    に基づいて学習データを作成する学習データ作成処理手
    段と、 該学習データ作成処理手段で作成された学習データに基
    づいて合成対象テキストからの複合語に対するアクセン
    ト情報を決定し、合成音声を生成するテキスト音声合成
    処理手段とを備えたことを特徴とする音声合成装置。
  12. 【請求項12】 上記学習データ作成処理手段は、あら
    かじめ用意されたテキストコーパス中のテキストを解析
    し、形態素列に分割するテキスト解析手段と、該テキス
    ト解析手段で分割された形態素列の中から複合語を抽出
    する複合語抽出手段と、該複合語抽出手段で抽出した複
    合語中の形態素組の頻度を集計し、その統計情報を学習
    データとして保持する統計情報学習手段とを有し、上記
    テキスト音声合成処理手段は、合成対象テキストから上
    記テキスト解析手段および上記複合語抽出手段を介して
    抽出した複合語に対して、上記学習データ中の統計情報
    に基づいて複合語中の構成単語間の結合度を計算し、該
    結合度に基づきアクセント句決定ルールの適用を行な
    い、複合語のアクセント句を決定する複合語アクセント
    句決定手段と、該複合語アクセント句決定手段で決定し
    た複合語のアクセント情報、上記複合語抽出手段で複合
    語と認定されなかった形態素列に対するアクセント情報
    および各アクセント句の韻律情報に基づいて合成音声を
    生成する音響処理手段とを有することを特徴とする請求
    項11記載の音声合成装置。
  13. 【請求項13】 上記統計情報学習手段の学習データと
    して、複合語を構成する連続単語の単語対相互情報量を
    保持し、上記複合語アクセント句決定手段における結合
    度計算に上記単語相互情報量を用いることを特徴とする
    請求項12記載の音声合成装置。
  14. 【請求項14】 上記統計情報学習手段の学習データと
    して、複合語を構成する連続単語の概念対相互情報量を
    保持し、上記複合語アクセント句決定手段における結合
    度計算に上記概念相互情報量を用いることを特徴とする
    請求項12記載の音声合成装置。
  15. 【請求項15】 上記統計情報学習手段の学習データと
    して、複合語を構成する連続単語の品詞対相互情報量を
    保持し、複合語アクセント句決定手段における結合度計
    算に上記品詞相互情報量を用いることを特徴とする請求
    項12記載の音声合成装置。
  16. 【請求項16】 上記統計情報学習手段の学習データと
    して、複合語を構成する連続単語の単語対、概念対、お
    よび品詞対の3種類の相互情報量を保持し、上記複合語
    アクセント句決定手段における結合度計算に上記3種類
    の相互情報量の重みつき加算を用いることを特徴とする
    請求項12記載の音声合成装置。
  17. 【請求項17】 上記統計情報学習手段における学習デ
    ータを、テキストコーパス中の2形態素からなる複合語
    に限定して抽出し、学習することを特徴とする請求項1
    2〜16のいずれかに記載の音声合成装置。
  18. 【請求項18】 上記複合語アクセント句決定手段は、
    アクセント句決定ルールを適用する時に、アクセント句
    を決定しようとする左右の形態素の上位概念が一致する
    場合は、アクセントの結合を行なわず、アクセント区切
    りとすることを請求項12〜17のいずれかに記載の特
    徴とする音声合成装置。
  19. 【請求項19】 上記複合語アクセント句決定手段は、
    上記単語対相互情報量の単語対として出現しなかった形
    態素に対して、同義語での単語対がある場合は、同義語
    の単語対相互情報量を出現しなかった単語の単語対情報
    量に置き換えて2形態素間の結合度の計算を行うことを
    特徴とする請求項16記載の音声合成装置。
  20. 【請求項20】 上記複合語アクセント句決定手段は、
    上記複合語中の構成単語間の結合度の計算に、2単語が
    連続して出現する可能性を統計的に評価するモデルを用
    いることを特徴とする請求項12〜19のいずれかに記
    載の音声合成装置。
  21. 【請求項21】 あらかじめ用意されたテキストコーパ
    ス中のテキストを解析し、形態素列に分割するテキスト
    解析処理と、 該テキスト解析処理で分割された形態素列の中から複合
    語を抽出する複合語抽出処理と、 該複合語抽出処理で抽出した複合語中の形態素組の頻度
    を集計し、その統計情報を学習データとして保持する統
    計情報学習処理と、 合成対象テキストから上記テキスト解析処理および上記
    複合語抽出処理を通して抽出した複合語に対して、上記
    学習データ中の統計情報に基づいて複合語中の構成単語
    間の結合度を計算し、該結合度に基づきアクセント句決
    定ルールの適用を行ない、複合語のアクセント句を決定
    する複合語アクセント句決定処理と、 該複合語アクセント句決定処理で決定した複合語のアク
    セント情報、上記複合語抽出処理で複合語と認定されな
    かった形態素列に対するアクセント情報および各アクセ
    ント句の韻律情報に基づいて合成音声を生成する音響処
    理とを有することを特徴とする音声合成処理をコンピュ
    ータに実行させるプログラムを記録したコンピュータ読
    み取り可能な記録媒体。
JP2001052792A 2001-02-27 2001-02-27 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 Abandoned JP2002258884A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001052792A JP2002258884A (ja) 2001-02-27 2001-02-27 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001052792A JP2002258884A (ja) 2001-02-27 2001-02-27 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2002258884A true JP2002258884A (ja) 2002-09-11

Family

ID=18913367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001052792A Abandoned JP2002258884A (ja) 2001-02-27 2001-02-27 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2002258884A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287406A (ja) * 2007-05-16 2008-11-27 Sony Corp 情報処理装置および情報処理方法、プログラム、並びに、記録媒体
JP2018169434A (ja) * 2017-03-29 2018-11-01 富士通株式会社 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム
WO2020095655A1 (ja) * 2018-11-05 2020-05-14 日本電信電話株式会社 選定装置および選定方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287406A (ja) * 2007-05-16 2008-11-27 Sony Corp 情報処理装置および情報処理方法、プログラム、並びに、記録媒体
US8494839B2 (en) 2007-05-16 2013-07-23 Sony Corporation Apparatus, method, and recording medium for morphological analysis and registering a new compound word
JP2018169434A (ja) * 2017-03-29 2018-11-01 富士通株式会社 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム
WO2020095655A1 (ja) * 2018-11-05 2020-05-14 日本電信電話株式会社 選定装置および選定方法
JP2020077054A (ja) * 2018-11-05 2020-05-21 日本電信電話株式会社 選定装置および選定方法
US11971918B2 (en) 2018-11-05 2024-04-30 Nippon Telegraph And Telephone Corporation Selectively tagging words based on positional relationship

Similar Documents

Publication Publication Date Title
JP4559950B2 (ja) 韻律制御規則生成方法、音声合成方法、韻律制御規則生成装置、音声合成装置、韻律制御規則生成プログラム及び音声合成プログラム
US7356468B2 (en) Lexical stress prediction
JP5921716B2 (ja) 意図推定装置および意図推定方法
JP4968036B2 (ja) 韻律語グルーピング方法及び装置
JP5625827B2 (ja) 形態素解析装置、音声合成装置、形態素解析方法及び形態素解析プログラム
JP4811557B2 (ja) 音声再生装置及び発話支援装置
WO2009107441A1 (ja) 音声合成装置、テキスト生成装置およびその方法並びにプログラム
Guo et al. Automatic song translation for tonal languages
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP4829605B2 (ja) 音声合成装置および音声合成プログラム
JP4004376B2 (ja) 音声合成装置、音声合成プログラム
JP2002258884A (ja) 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体
JP6276516B2 (ja) 辞書作成装置、及び辞書作成プログラム
JP2004151527A (ja) 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム
JP4083400B2 (ja) アクセント句境界決定装置、音声合成装置及び方法並びにプログラム
JP5137588B2 (ja) 言語モデル生成装置及び音声認識装置
JP4173404B2 (ja) 文セット自動生成装置、文セット自動生成プログラム、記憶媒体
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体
JP4359087B2 (ja) 音声合成装置
JP3573889B2 (ja) 音声出力装置
JP3528849B2 (ja) キーワード抽出装置およびキーワード抽出方法
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JP2005345846A (ja) 入力テキストのポーズ位置予測装置
JP3446341B2 (ja) 自然言語処理方法および音声合成装置
JPH08123459A (ja) 自然言語処理方法および音声合成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20061127