JPH09198074A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH09198074A
JPH09198074A JP8003426A JP342696A JPH09198074A JP H09198074 A JPH09198074 A JP H09198074A JP 8003426 A JP8003426 A JP 8003426A JP 342696 A JP342696 A JP 342696A JP H09198074 A JPH09198074 A JP H09198074A
Authority
JP
Japan
Prior art keywords
bunsetsu
separation
degree
speech
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8003426A
Other languages
English (en)
Inventor
Kenichi Magata
謙一 澗潟
Tomoki Hamagami
知樹 濱上
Mitsuo Furumura
光夫 古村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Secom Co Ltd
Original Assignee
Secom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Secom Co Ltd filed Critical Secom Co Ltd
Priority to JP8003426A priority Critical patent/JPH09198074A/ja
Publication of JPH09198074A publication Critical patent/JPH09198074A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音韻に影響する文節間の分離度(結合度)を
精度よく定めるには、深い言語情報の解析や、多くの属
性を記述した大きな単語辞書が必要であった。 【解決手段】 テキスト解析処理部において、文40を
文節に分割する(図中42)。次に文節タイプ(文節
種)を決定し、これをキーとして予測分離度テーブル3
0を検索し、文節に予測分離度を付与する。文節タイプ
は、文節末尾が助詞ならばその助詞自体であり、文節末
尾が活用語ならばその活用形の種類であり、また、文節
末尾が助詞以外の非活用語ならばその品詞の種類で定義
される。この文節タイプに対応する予測分離度は、多く
のサンプル文から統計的性質として抽出され、予測分離
度テーブル30に予め格納されている。(図中46)予
測分離度は、自然音声の観測から得られる文節間の相互
関係に基づく修正規則により、必要に応じて修正され、
分離度が決定される(図中48)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声を規則合成する
音声合成装置、特に韻律(イントネーション)に係わる
文節間の区切り度合い(分離度)を適切に決定する音声
合成装置に関する。
【0002】
【従来の技術】テキストから音声を生成する音声合成装
置は、一般に、音色、基本周波数の高さ、及び強度とい
う音声の3要素を、テキスト(文字列)から生成し、こ
れらを合成することにより音声を生成するものである。
ちなみに、音声の周波数スペクトルは、基本周波数とそ
の逓倍周波数の音波成分によって構成され、音色はこの
周波数スペクトルの包絡形状に依存する。また基本周波
数はピッチと呼ばれ、音の高さを定め、その時間的変動
はピッチパタンにより表される。強度は音声の振幅とし
て捉えられる。
【0003】音声合成装置での上記3要素の決定におい
て、文節間の意味的な距離などに起因する文節間の音韻
的な結合度合いである「結合度」は、文節間の「間(ポ
ーズ)」のほか、音声の強度やピッチパタンにも影響を
与える。本願ではこの結合度を逆の観点から、音韻的な
区切りの強弱を表す尺度である「分離度」として捉えて
いる。
【0004】従来より、テキストから音声を合成する音
声合成装置においては、テキストを解析して上記分離度
を決定していた。従来の方法は大きくは2つに分けられ
る。従来の第1の方法は、構文解析、意味解析などとい
った複雑な(深い)言語解析を行い、その結果得られる
文章構造を基に分離度を決定する方法である。この方法
は、入力されたテキストを実際に解析して、分離度に大
きな影響を及ぼす文節間の意味的な距離を求め、これに
より分離度を決定する(例えば特開昭64−20598
号参照)。
【0005】一方、従来の第2の方法は、隣接する単語
の組合せにより分離度を決定する方法である(例えば特
開平7−134713号参照)。この方法は、例えば、
形態素解析の結果から得られる単語の品詞属性を利用す
る(例えば特開平5−333892号参照)。形態素解
析とは、文を単語に分割しその単語ごとの性質を辞書に
記述された属性に基づいて同定する解析であり、上記第
1の方法で用いる構文解析よりも一般に精度がよい。な
お、上記従来の両方法は、分離度をテキスト情報のみか
ら導出しようとする点において共通している。
【0006】
【発明が解決しようとする課題】しかし、上記第1の方
法では、自然言語が持つ曖昧さのために構文解析・意味
解析の精度が不十分となりがちであり、このため従来の
規則合成装置においては韻律が不自然になる場合が多か
った。すなわち、この方法による分離度の精度改善には
構文解析・意味解析の精度の向上が必要であるが、その
ためにはこれらの解析を行う言語解析部が数多くの情報
・規則を保有しなければならずその構成が複雑化、大規
模化するという問題がある。例えば言語解析部をコンピ
ュータにて構成する場合、メモリ容量、ディスク容量の
所要量が増大し、また処理時間が遅くなるといったこと
が起こる。しかも、現在の言語解析技術では、テキスト
の表層上の構造から文の意味を常に正しく判断すること
は極めて困難であるので、上記のように言語解析部の強
化を図っても、意味解析の完全を期することはできな
い。
【0007】一方、上記第2の方法では、隣接する単語
間というミクロな評価のみが行われ、文の構造は考慮さ
れていないため、分離度の精度が低いという問題があっ
た。精度向上のためには辞書に多くの属性を記述する必
要があったが、この方法においても多くの場合、音声合
成装置はコンピュータにて構成され、具体的には単語辞
書の増大によって、やはり、メモリ容量、ディスク容量
の所要量増大等の問題を引き起こす。
【0008】なお、実際の音声に見られる現象には、テ
キストに基づく言語理論だけでは説明できないものがあ
ることが判明している。例えば、一息に発声できる文字
数に限度があるといった人間の生理的制約が関係する場
合などである。このような場合においては、従来のよう
なテキスト情報のみから導出する分離度では、実音声の
韻律の観測によって得られる真の分離度と相違すること
がある。
【0009】本発明は上記問題点を解決し、複雑な言語
解析を行うことなく、しかも文節の文中における係り受
け関係を反映して分離度を決定して、合成音声における
韻律の自然さを向上できる音声合成装置を提供すること
を目的とする。また、本発明の目的は、助詞個有の性質
に着目した新しい分離度決定方法が適用された音声合成
装置を提供することにある。加えて、本発明は、分離度
の決定において自然音声の観測に基づく修正を行うこと
により、分離度の精度をさらに高め、合成音声における
韻律の自然さを一層向上させることを目的とする。
【0010】
【課題を解決するための手段】本発明に係る音声合成装
置は、入力されたテキストを文節に区切る文節解析手段
と、文節内の助詞を基本判断要素として各文節の文節タ
イプを判別する文節タイプ判別手段と、当該文節と次の
文節との間の区切りの強さを示す予測分離度を前記各文
節タイプごとに対応づけてテーブル化した予測分離度テ
ーブルと、この予測分離度テーブルを参照し、文節のタ
イプに応じて各文節ごとに予測分離度を決定する予測分
離度決定手段と、各文節の予測分離度を必要に応じて修
正し、各文節間の分離度を決定する分離度修正手段とを
含み、この分離度に基づいて音声合成を行うことを特徴
とする。
【0011】本発明者による研究から、文節内の助詞と
分離度との間には相関があることが明らかになった。あ
る文節からその係り受け関係にある文節までの文節数で
ある「係り受け距離」は分離度と深い関係があることが
知られている。各種のサンプルを解析した結果、この係
り受け距離には、当該文節内の助詞が何であるかに応じ
た興味深い差異が見出された。従って、係り受け距離は
助詞から予測でき、換言すれば、その係り受け距離に相
関する分離度は助詞から予測できる。また同様に、文節
末尾に助詞を有さない場合には、文節末尾が活用語なら
ばその活用形、文節末尾が非活用語ならばその品詞によ
って係り受け距離に差異が見られた。従って、文節末尾
に助詞がない場合には、末尾の語の活用形や品詞により
係り受け距離を予測でき、これに相関する分離度も予測
できる。すなわち、文節内の助詞を基本判断要素とした
文節タイプを判断し、そのタイプから分離度を予想でき
る。そこで、本発明では、この関係をテーブル化した予
測分離度テーブルを備え、文節の文節タイプから分離度
の予測値を得、必要に応じてこの予測値を修正すること
とした。なお、この修正は、例えば当該文節の周囲の文
節の文節タイプなどの情報に基づく修正規則により行わ
れる。
【0012】このように本発明は文節タイプに基づいて
分離度を決定するので、テキストについての複雑な言語
解析を行う必要がない。しかも文節タイプに対応づけら
れた予測分離度は対象となる文節の係り受け距離を反映
しており、隣接文節間よりも大きな構造が考慮された分
離度である。また分離度修正手段においても、文全体の
文節を参照した修正が行われ得る。
【0013】本発明に係る音声合成装置においては、上
記文節タイプ判別手段が、文節末尾における助詞の有無
を判別する文節末尾判別部と、文節末尾が助詞と判別さ
れた場合に当該助詞自体により文節タイプを判別する助
詞判別部と、文節末尾が非助詞と判別された場合に、当
該文節末尾について、活用語か否かを判別し、活用語で
ある場合にはその活用形の種類により文節タイプを判別
し、非活用語である場合にはその語の品詞により文節タ
イプを判別する非助詞判別部と、を含むことを特徴とす
る。この分類により、文節末尾に助詞を伴わない場合に
おいても適切な分離度が付与される。
【0014】本発明に係る音声合成装置においては、上
記予測分離度テーブル中の予測分離度が、文節からその
係り受け関係にある文節までの標準的な距離に基づいて
予め定められたことを特徴とする。すでに述べたが、文
節の分離度は当該文節と係り受け関係にある文節までの
距離と深い関係があるといわれている。そこで本発明に
おいては、各文節タイプごとに係り受け距離について統
計をとり、この統計により求められる距離、例えば平均
値や最多値、に応じて予測分離度を決定する。ここで、
係り受け距離は例えば文節数により測られる。
【0015】本発明に係る音声合成装置においては、上
記分離度修正手段が、テキスト中の文節を参照して予測
分離度を修正する修正規則を含むことを特徴とし、また
上記修正規則は、自然音声の観測結果から抽出された規
則を含むことを特徴とする。本発明においては、ある文
節の予測分離度を修正する規則は、例えば、その文節以
外の文節の文節タイプやモーラ数に係わるものである。
【0016】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は本実施形態に係る日本語音
声合成装置のブロック構成図である。本音声合成装置は
従来同様に、電子化された日本語文のテキストから合成
音声を規則合成して出力するものである。
【0017】テキスト解析処理部2は入力された日本語
テキストを言語解析し、この日本語テキストの「読み」
を表す情報に、音声合成処理に必要な文節の境界、アク
セントの位置、ポーズの位置、母音の無声化といった韻
律情報を加えた音韻記号列を生成する。ここで、この音
韻記号列には、本発明の特徴に係る文節間の音韻的な区
切りである分離度を表す情報も含まれている。分離度の
決定方法については後述する。
【0018】この分離度を含んだ音韻記号列は音韻継続
時間長生成部4に入力される。音韻継続時間長生成部4
は、音韻記号列に、目的の発話速度を実現する音韻の時
間長情報を付加して出力する。音韻継続時間長生成部4
の出力は、スペクトルパタン生成部6、音源振幅パタン
生成部8及びピッチパタン生成部10に入力される。
【0019】スペクトルパタン生成部6は、音韻結合規
則により、母音・子音といった音韻の種類からデータベ
ースを検索し、各音韻の周波数スペクトルの包絡パタン
を結合しフォルマントパタンを生成して出力する。スペ
クトルパタン生成部6の上記データベースには、従来同
様にVCV(母音−子音−母音)単位のスペクトルパタ
ンが蓄積されている。
【0020】音源振幅パタン生成部8は、音声のパワー
包絡をパワーに関する規則により決定する。ピッチパタ
ン生成部10は、韻律制御についての規則からアクセン
トやフレーズを形作るピッチパタンを生成する。
【0021】音源生成部12は、音源振幅パタン生成部
8からのパワーパタンと、ピッチパタン生成部10から
のピッチパタンとを入力とし、音源情報を生成する。音
声合成部14は、スペクトルパタン生成部6から入力さ
れるフォルマントパタンによって、音源生成部12から
の音源情報を変調して音色を付加し合成音声を生成す
る。
【0022】テキスト解析処理部2において、音韻記号
列に反映された分離度は、音韻記号列とともに、上記テ
キスト解析処理部2以降のブロックに渡される。この分
離度は、例えば、音韻継続時間長生成部4においてはポ
ーズ長制御に、音源振幅パタン生成部8においてはパワ
ー制御に、ピッチパタン生成部10においてはピッチパ
タン生成などに利用される。
【0023】図2は、本実施形態の特徴的構成要素であ
るテキスト解析処理部2の構成を示す模式図である。テ
キスト解析処理部2への入力である日本語テキスト20
は、まず文節解析手段としての機能を有する形態素解析
部22により、従来同様の形態素解析を受ける。これに
より日本語テキスト20は単語に分割され、その単語ご
とに品詞、活用形などの属性が同定され、また、文節が
決定される。なお、単語、文節は従来より知られる言語
学的に定義される単位である。
【0024】文節間分離度決定部24は、形態素解析部
22における解析結果を利用して文節間ごとに分離度を
決定する。文節間分離度決定部24は、予測分離度付与
部26と修正規則適用部28とを含んでいる。詳細は後
述するが、予測分離度付与部26は、日本語テキスト2
0の各文節について文節タイプを判別し、この文節タイ
プをキーとして予測分離度テーブル30を検索する。予
測分離度テーブル30には、文節タイプごとに予測され
る分離度(予測分離度)が予め格納されており、上記検
索によって、各文節にその文節タイプに対応した予測分
離度が付与・決定される。この予測分離度を各文節に付
与された日本語テキストは、修正規則適用部28に渡さ
れる。
【0025】修正規則適用部28は、複数文節間の関係
に基づく修正規則を有する。修正規則適用部28は、こ
の修正規則を適用しなければならない文節に対しては、
その文節に付与された予測分離度をその他の文節との関
係に基づいて修正し、分離度を決定する分離度修正手段
である。分離度は音韻記号生成部32に入力される。音
韻記号生成部32は、各文節間の分離度のほかのアクセ
ントやポーズの位置などの発音情報を生成し、これらを
音韻記号列34の形にして出力する。
【0026】図3は、図2に示したテキスト解析処理部
2における処理を説明する模式図である。入力される日
本語テキスト20の例として、文40「小さな鰻屋に熱
気のようなものがみなぎる」を用いる。形態素解析部2
2における処理42により、文40における文節が決定
される。図のテキスト44中、「/」で文節間を表して
いる。
【0027】予測分離度付与部26の処理46により、
テキスト44の各文節ごとに文節タイプ(文節種)が判
別される。文節末尾に助詞を有する文節については、そ
の助詞自体で文節タイプを定義する。例えば、文節「鰻
屋に」、「ものが」は末尾に互いに異なる助詞「に」、
「が」を有するので異なる文節タイプに分類され、その
文節タイプにはその助詞自体、すなわち「に」、「が」
が与えられる。また、文節末尾が助詞ではなく活用語で
ある文節は、その活用語の活用形の種類で文節タイプを
定義する。例えば、文節「熱気のような」、「小さな」
は、それぞれ末尾に助動詞「ようだ」の連体形「よう
な」、形容詞「小さい」の連体形「小さな」を有してい
るので、それぞれ文節タイプを「連体形」とする。文節
「みなぎる」は動詞の文末終止であるので、文節タイプ
を「文末終止」とする。その他、図には示されていない
が、文節末尾が助詞でも活用語でもない、非活用語であ
る文節は、その非活用語の品詞の種類で文節タイプを定
義する。例えば、非活用語が名詞であるならば、文節タ
イプを「名詞」とする。上述した予測分離度付与部26
の文節タイプ判別の機能は、文節末尾の助詞の有無を判
別する文節末尾判別部と、これにより判別される助詞の
有る場合と無い場合とに対応し、それぞれの場合の文節
タイプを判別する助詞判別部と非助詞判別部とによって
構成してもよい。
【0028】次に予測分離度付与部26の処理46にお
いて、予測分離度テーブル30が各文節の文節タイプを
キーとして検索され、各文節に予測分離度が付与され
る。文44の文節「小さな」、「鰻屋に」、「熱気のよ
うな」、「ものが」、「みなぎる」には「1」、
「2」、「1」、「2」、「なし」が付与される。ここ
では、予測分離度には、1〜3の3段階(分離度には0
〜3の4段階)と文末に位置する文節の「なし」とがあ
るとしている。分離度を表す数字の値が大きいほど、文
節間の区切りは強いことを表す。なお、この分離度に用
意される段階数は必要に応じて、多くも少なくもでき
る。
【0029】修正規則適用部28の処理48では、修正
規則により上記予測分離度が修正される。修正規則適用
部28の有する修正規則は、テキスト中の分離度決定対
象とする文節以外の文節も参照して予測分離度を修正す
る規則である。例えば、文節タイプや文節のモーラ数な
どに関して、自然音声の観測結果から抽出された文節間
関係を表すものである。具体的には、文44に対して
は、「文節タイプが『連体形』である文節が読点を伴わ
ず、その次文節が自立語体言でかつ3モーラ以下の場
合、当該文節の分離度は0となる。」という修正規則が
文節「熱気のような」に適用され、その予測分離度
「1」が分離度「0」に修正され、また「文節タイプが
格助詞『が』である文節の次文節の自立語が用言の場
合、当該文節の分離度は1となる。」という修正規則が
文節「ものが」に適用され、その予測分離度「2」が分
離度「1」に修正される。ここでは他の文節について
は、修正する必要がないので、予測分離度付与部26に
て付与された予測分離度がそのまま分離度として確定さ
れる。このように、文節の予測分離度は分離度の標準的
な値であるので、多くの場合、そのまま分離度として用
いられる。修正規則は、当該文節が他の文節と特別な関
係にある、限られた場合にのみ必要とされる。修正規則
の数は予測分離度をどの程度の精度まで修正するかに依
るが、十のオーダーの個数で実用上、十分である。
【0030】音韻記号生成部32の処理50では、文4
4に対応する音韻記号列52が生成される。音韻記号列
はテキストの読みを表すローマ字表記に、他の情報を織
り込んだものである。ここで、分離度については、
「0」が「*」、「1」が「+」、「2」が「/」、
「3」が「|」にて音韻記号列に表記される。またアク
セントは「’」、長音は「−」、促音は「$」、文末は
「.」にて表記される。
【0031】以上、本装置、特にテキスト解析処理部2
は、コンピュータ上のソフトウェアとして構成すること
もできるし、ハードウェア化も可能である。予測分離度
テーブル30は、コンピュータのメモリ、磁気ディスク
に保持される。
【0032】図4は、予測分離度テーブルの概念図であ
る。予測分離度テーブルは図の左欄に示すような様々な
文節タイプ60のそれぞれに予測分離度62が対応づけ
られたものである。助詞には格助詞類64、接続助詞類
66、副助詞類68、終助詞類70があるが、予測分離
度は各助詞類に属する助詞ごとに定義される。活用語類
72も各活用形ごとに、また非活用語類74も各品詞ご
とに、予測分離度が定義される。
【0033】予測分離度テーブル30に予め格納される
予測分離度は、文節から係り受け関係にある文節までの
距離(係り受け距離)についての多数の分析に基づいて
定められる。この手順を説明する。図5は、予測分離度
テーブル作成のための分析例を示す図である。分析は複
数の文をサンプルとし、このサンプル文の各文節につい
て、その文節タイプとその文節の係り受け距離と、係り
受け距離の制限となる当該文節の文中における位置とを
解析することが行われる。この解析されたサンプル文に
ついてのデータは、統計的に処理される。すなわち、サ
ンプル文の数は予測分離度に要求される統計的精度に依
存する。係り受け距離は、当該文節から係り受け関係に
ある文節までの文節数を用いて測る。同図には、文80
「あらゆる現実を全て自分の方へねじ曲げたのだ。」な
どをサンプル文とした場合の分析例などが示されてい
る。図において例えば文80の上に記された矢印は文節
の係り受け関係を示すものであり、この矢印に付された
数字は係り受け距離を示す。
【0034】図6は上記分析により得られたデータの解
析結果を示す模式的なグラフである。このグラフは縦軸
が係り受け距離、横軸が文節の文中位置を表したもので
ある。なお、この文中位置は、分析対象となった文節か
ら文末までの文節数を意味している。
【0035】一般に、係り受け距離は分離度と相関があ
ると考えられている。つまり、ある文節の係り受け距離
が大きい程、当該文節とその次文節との結びつきは弱
く、すなわち分離度が大きい傾向が見られる。そこで、
このことに基づいて、係り受け距離が大きい性質を持つ
文節タイプほど大きな予測分離度を定義すればよい。本
実施形態では、上記相関関係を係り受け距離の大きさに
応じ3つに分類し、各分類内の文節タイプには同一の予
測分離度を定義している。例えば、図の文節タイプα、
β、γに対してはそれぞれ予測分離度「3」、「2」、
「1」が予測分離度テーブル30に定義される。ちなみ
に、本実施形態では上述の経緯により、この予測分離度
は上記相関関係の分類を示す番号としての意味合いも有
している。
【0036】上述したように、本実施形態の予測分離度
は、各文節の末尾に着目して定められる。このようにし
た理由は、日本語の修飾関係は前から後に及び、そのた
め文節間の分離度に関する情報は、これら文節のうち前
の文節の末尾に内包されると考えられるからである。こ
の日本語固有の特性によって、ある文節とその文節より
後の文節との関係の疎密が、文節末尾の助詞、活用語の
活用形などが何であるかに現れるのである。予測分離度
は、この関係の疎密の標準的な度合いを表すものであ
る。
【0037】次に、修正規則適用部28に予め与えられ
る修正規則の作成方法を説明する。図7は、修正規則の
作成方法を説明する模式図である。例えば、文90「小
さな鰻屋に熱気のようなものがみなぎる」の各文節に
は、上述のように作成された予測分離度テーブル30に
より予測分離度92が付与される。この予測分離度92
はテキスト情報をベースに係り受け距離などを解析して
得られたものである。
【0038】一方、文節間の音韻的な区切りを表す分離
度の真の値は文90に対する自然音声のピッチパタン9
4についての観測から導出することができるものであ
る。このピッチパタンから得た分離度と先の予測分離度
とを比較すると、両者の間に差異がある場合がある。例
えば、予測分離度92と分離度96とは、文節「熱気の
ような」、「ものが」において異なる。
【0039】複数のサンプル文について比較を行い、こ
の予測分離度と分離度との差異を生じる場合について、
その場合の当該文節の前後の文節タイプやモーラ数な
ど、当該文節以外の文節情報を蓄積する。この蓄積され
たデータの当該文節以外の文節情報から、当該文節とそ
の他の文節が所定の条件下にあり同様の差異が一定以上
の頻度で現れるという関係が認められた場合、その関係
を修正規則として、修正規則適用部28に登録する(図
中98)。例えば、上記「ものが」という文節に見られ
る差異については、先に述べた「文節タイプが格助詞
『が』である文節の次文節の自立語が用言の場合、当該
文節の分離度は1となる。」が導出されている。上述し
たように、本実施形態の修正規則は、言語情報をベース
に標準値として導出された予測分離度を、実文章内での
文節間の相互関係により微調整する規則である。
【0040】なお、本実施形態では、自然音声のピッチ
パタンとの比較に基づき修正規則を導出したが、自然音
声の代わりに合成音声のピッチパタン生成用に構築され
たモデルを用いるのも有効である。
【0041】
【発明の効果】本発明の音声合成装置によれば、文節間
の音韻的区切りを示す分離度は、複雑な言語解析を行う
ことなく、しかも文節の文中における係り受け関係を反
映して決定されるので、合成音声における韻律の自然さ
が向上するという効果がある。加えて、本発明は、分離
度の決定において自然音声の観測に基づく修正を行うの
で、分離度の精度がさらに高まり、合成音声における韻
律の自然さを一層向上するという効果がある。また本発
明の音声合成装置は、分離度を決定するために、数多く
の情報・規則や多くの単語属性を記述する辞書を保有す
る必要がないので、装置を例えばコンピュータにて構成
した場合、メモリ容量、ディスク容量の所要量が抑制さ
れるという効果と、それに伴い処理が迅速であるという
効果がある。
【図面の簡単な説明】
【図1】 本実施形態に係る日本語音声合成装置のブロ
ック構成図。
【図2】 テキスト解析処理部の構成を示す模式図。
【図3】 テキスト解析処理部における処理を説明する
模式図。
【図4】 予測分離度テーブルの概念図。
【図5】 予測分離度テーブル作成のための分析例を示
す図。
【図6】 予測分離度テーブル作成のための分析により
得られたデータの解析結果を示す模式的なグラフ。
【図7】 修正規則の構築方法を説明する模式図。
【符号の説明】
2 テキスト解析処理部、4 音韻継続時間長生成部、
6 スペクトルパタン生成部、8 音源振幅パタン生成
部、10 ピッチパタン生成部、12 音源生成部、1
4 音声合成部、22 形態素解析部、24 文節間分
離度決定部、26 予測分離度付与部、28 修正規則
適用部、30 予測分離度テーブル、32 音韻記号生
成部、34 音韻記号列。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 テキストから音声を合成する音声合成装
    置において、 入力されたテキストを文節に区切る文節解析手段と、 文節内の助詞を基本判断要素として各文節の文節タイプ
    を判別する文節タイプ判別手段と、 当該文節と次の文節との間の区切りの強さを示す予測分
    離度を前記各文節タイプごとに対応づけてテーブル化し
    た予測分離度テーブルと、 この予測分離度テーブルを参照し、文節のタイプに応じ
    て各文節ごとに予測分離度を決定する予測分離度決定手
    段と、 各文節の予測分離度を必要に応じて修正し、各文節間の
    分離度を決定する分離度修正手段と、 を含み、 この分離度に基づいて音声合成を行うことを特徴とする
    音声合成装置。
  2. 【請求項2】 請求項1記載の音声合成装置において、 上記文節タイプ判別手段は、 文節末尾における助詞の有無を判別する文節末尾判別部
    と、 文節末尾が助詞と判別された場合に当該助詞自体により
    文節タイプを判別する助詞判別部と、 文節末尾が非助詞と判別された場合に、当該文節末尾に
    ついて、活用語か否かを判別し、活用語である場合には
    その活用形の種類により文節タイプを判別し、非活用語
    である場合にはその語の品詞により文節タイプを判別す
    る非助詞判別部と、 を含むことを特徴とする音声合成装置。
  3. 【請求項3】 請求項1記載の音声合成装置において、 上記予測分離度テーブル中の予測分離度は、文節からそ
    の係り受け関係にある文節までの標準的な距離に基づい
    て予め定められたことを特徴とする音声合成装置。
  4. 【請求項4】 請求項1記載の音声合成装置において、 上記分離度修正手段は、テキスト中の文節を参照して予
    測分離度を修正する修正規則を含むことを特徴とする音
    声合成装置。
  5. 【請求項5】 請求項4記載の音声合成装置において、 上記修正規則は、自然音声の観測結果から抽出された規
    則を含むことを特徴とする音声合成装置。
JP8003426A 1996-01-11 1996-01-11 音声合成装置 Pending JPH09198074A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8003426A JPH09198074A (ja) 1996-01-11 1996-01-11 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8003426A JPH09198074A (ja) 1996-01-11 1996-01-11 音声合成装置

Publications (1)

Publication Number Publication Date
JPH09198074A true JPH09198074A (ja) 1997-07-31

Family

ID=11557058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8003426A Pending JPH09198074A (ja) 1996-01-11 1996-01-11 音声合成装置

Country Status (1)

Country Link
JP (1) JPH09198074A (ja)

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
EP1213705B1 (en) Method and apparatus for speech synthesis
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US20050119890A1 (en) Speech synthesis apparatus and speech synthesis method
JPH086591A (ja) 音声出力装置
JP4038211B2 (ja) 音声合成装置,音声合成方法および音声合成システム
RU2421827C2 (ru) Способ синтеза речи
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
KR20080045413A (ko) 정적 특성과 동적 특성이 반영된 끊어읽기 예측 방법 및이를 기반으로 하는 음성합성 방법 및 시스템
Mittrapiyanuruk et al. Issues in Thai text-to-speech synthesis: the NECTEC approach
JP4829605B2 (ja) 音声合成装置および音声合成プログラム
Chen et al. A Mandarin Text-to-Speech System
Tatham et al. Improving text-to-speech synthesis
JPH1115497A (ja) 氏名読み音声合成装置
JPH09198074A (ja) 音声合成装置
JPH05134691A (ja) 音声合成方法および装置
EP1777697B1 (en) Method for speech synthesis without prosody modification
Dong et al. A Unit Selection-based Speech Synthesis Approach for Mandarin Chinese.
JPH0962286A (ja) 音声合成装置および音声合成方法
JP2002311982A (ja) 韻律情報設定方法及び装置並びにプログラム及び記録媒体
Ng Survey of data-driven approaches to Speech Synthesis
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPH09198073A (ja) 音声合成装置
Khalifa et al. SMaTalk: Standard malay text to speech talk system
Narupiyakul et al. A stochastic knowledge-based Thai text-to-speech system