JP3314116B2 - 音声規則合成装置 - Google Patents

音声規則合成装置

Info

Publication number
JP3314116B2
JP3314116B2 JP18251894A JP18251894A JP3314116B2 JP 3314116 B2 JP3314116 B2 JP 3314116B2 JP 18251894 A JP18251894 A JP 18251894A JP 18251894 A JP18251894 A JP 18251894A JP 3314116 B2 JP3314116 B2 JP 3314116B2
Authority
JP
Japan
Prior art keywords
phrase
sentence
prosody
inter
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18251894A
Other languages
English (en)
Other versions
JPH0844391A (ja
Inventor
治 木村
延佳 海木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP18251894A priority Critical patent/JP3314116B2/ja
Publication of JPH0844391A publication Critical patent/JPH0844391A/ja
Application granted granted Critical
Publication of JP3314116B2 publication Critical patent/JP3314116B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声規則合成装置に関
し、特に任意の入力文について合成音声を生成する音声
規則合成装置に関する。
【0002】
【従来の技術】一般に音声合成装置における韻律の制御
は、生成される合成音声の自然性に大きな影響を与え
る。従来から行われている韻律制御法は、文節間結合度
というものを定義し、その結合度からポーズの長さやフ
レーズ指令の大きさを決定する方法として知られてい
る。
【0003】文節間結合度を用いた基本的な考え方は、
日本音響学会誌27巻9号(1971)「日本語単語アクセ
ントの基本周波数パタンとその生成機構のモデル」及び
音声研究会資料SP89−5「文章音声の音調統合型導
出規則の検討」に開示されている。図5に示すように、
ケース1は両文節の結合が最も弱い場合であり、明確な
ポーズが入ってそれぞれの文節が独立に句を構成する。
文節間結合度が強まるにつれて、ケース2に示すように
ポーズ長が短くなると共に、それぞれのフレーズ成分が
一本のフレーズ成分に近づく。ケース3は1本のフレー
ズ成分上に2つの文節がのり、後続文節単独のフレーズ
はない。更に結合が進むと、ケース4に示すように後続
文節のアクセント指令も小さな値となり、ケース5に示
すように最終的に一つの複合語のピッチパターンとな
る。この様に、文節間結合度に応じてフレーズ指令とポ
ーズ長の大きさを制御している。
【0004】なお、フレーズ成分とはピッチパタンを近
似する滑らかな曲線で、フレーズ成分に各アクセント句
のアクセント成分を重畳することによりピッチパターン
が作成される。この様に、ピッチパタンをフレーズ成分
とアクセント成分に分け、文節間結合度に応じて独立に
それぞれの成分を制御するモデルは、ルール化が容易な
ことから日本語朗読音声のピッチパタン記述モデルとし
て広く用いられている。
【0005】なお、本出願人は、特開平4−51099
号公報により、まず文節間結合度を求め、文節間結合度
からメモリに格納されている自立語−ラベル表、品詞ま
たは活用−ラベル、文節間結合度−フレーズ−ポーズ長
の表からフレーズ成分、アクセント成分を算出する音声
合成装置を提案している。
【0006】
【発明が解決しようとする課題】従来の音声規則合成装
置においては、結合度とフレーズ成分、アクセント成分
が1対1に対応するモデルでは、ピッチパタンの記述が
単調になり、自然音声で見受けられるピッチパタンの様
々な振る舞いを十分に表現できず、合成音の韻律が単調
で多様性に欠ける。
【0007】また、特開平4−51099号公報に開示
されている音声合成装置においては、文節間結合度が決
まれば一意にフレーズ成分、アクセント成分が決まるの
で、合成音の韻律は単調で多様性に欠ける。
【0008】本発明は、上記のような課題を解消するた
めになされたもので、韻律の単調さを軽減して、自然発
声に近い韻律を持つ合成音を得られる音声規則合成装置
を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は、任意の入力文
について合成音声を生成する音声規則合成装置であっ
て、連続して発生された自然音声から抽出した文のフレ
ーズ成分情報、アクセント成分情報及びポーズ長情報
を、当該文を構成する文節のモーラ数情報及び文節間結
合度の組合せに対応させて格納する韻律制御用メモリ手
段と、前記任意の入力文を構成する各文節のモーラ数情
報及び文節間結合度の組合せと一致もしくは類似するも
のが前記韻律制御用メモリ手段に存在する場合、前記韻
律制御用メモリ手段から前記任意の入力文に対応するフ
レーズ成分情報、アクセント成分情報及びポーズ長情報
を得ることによって韻律制御を行う韻律制御手段とを有
し、前記韻律制御手段は、前記任意の入力文と前記韻律
制御用メモリ手段に格納された文との距離Dが、所定の
しきい値以下である場合に、前記任意の入力文を構成す
る各文節のモーラ数情報及び文節間結合度の組合せと一
致もしくは類似するものが前記韻律制御用メモリ手段に
存在すると判断し、前記距離Dが、以下の式によって算
出され、
【数2】 ここで、MO(i,J)及びCO(I,J)は、前記韻
律制御用メモリ手段に格納されているi番目の文のj番
目の文節のモーラ数及び文節間結合度を表し、mo
(j)及びco(j)は、合成する文章のj番目の文節
のモーラ数情報及び文節間結合度を表し、Nは文節の総
数を表し、α及びβは、文節間結合度の算出アルゴリズ
ムによって決定される0以上1以下の定数である、こと
を特徴とする音声規則合成装置を提供する。
【0010】
【0011】
【作用】本発明の音声規則合成装置によれば、韻律制御
用メモリ手段により連続して発生された自然音声から抽
出した文のフレーズ成分情報、アクセント成分情報及び
ポーズ長情報が、当該文を構成する文節のモーラ数情報
及び文節間結合度の組合せに対応させて格納され、韻律
制御手段により任意の入力文を構成する各文節のモーラ
数情報及び文節間結合度の組合せと一致もしくは類似す
るものが前記韻律制御用メモリ手段に存在する場合、韻
律制御用メモリから前記任意の入力文に対応するフレー
ズ成分情報、アクセント成分情報及びポーズ長情報を得
ることによって韻律制御が行われる。これにより、自然
音声に極めて近い合成音が得られる。
【0012】
【0013】
【実施例】以下、本発明の音声規則合成装置の実施例を
図1を参照しながら説明する。
【0014】本実施例の音声規則合成装置は、漢字仮名
交じり文を入力する入力部10と、各部を制御するプロ
グラムされたコンピュータからなる制御部11と、入力
された文章の音声を合成する音声合成部12と、合成さ
れた音声を出力する出力部13と、単語毎に品詞、読
み、モーラ数及びアクセント等を格納する日本語辞書用
メモリ14と、連続して発生された自然音声から抽出し
た文のフレーズ成分、アクセント成分情報及びポーズ長
情報等の韻律情報を、当該文を構成する文節の少なくと
も文節間結合度、及び文節の位置、長さ、アクセント型
などのテキスト情報に対応させて格納する韻律制御用メ
モリ手段としての韻律制御用メモリ15と、単語の読み
に対応する合成単位を格納する音声データ辞書用メモリ
16と、各部を接続するバス17とを具備している。
【0015】前記制御部11は、図2に示すように、入
力部10及び日本語辞書メモリ14と接続されており、
入力された漢字仮名交じり文を、日本語辞書用メモリ1
4を参照して最長一致法または文中の文節数が最小とな
るように単語を選択する文節最小法を用いて各単語に分
割する単語分割処理部21と、単語毎にアクセントの型
及び読みを設定して文節間結合度を算出する単語読みア
クセント処理部22と、任意の入力文について、文節間
結合度及びテキスト情報と一致もしくは類似するものが
前記韻律制御用メモリ15に存在する場合、韻律制御用
メモリ15からフレーズ成分とアクセント成分及びポー
ズ長を得ることによって韻律制御を行う韻律制御手段と
しての韻律処理部23と、合成用単位の音声データ辞書
用メモリ16を参照して各単語の読みに対応する合成単
位を検索して音声合成用の音声パラメータを時系列で出
力する音声パラメータ生成部24とを具備しており、単
語分割処理部21及び単語読みアクセント処理部22に
より文字列解析部20が構成されている。
【0016】次に、本実施例の動作について説明する。
【0017】入力部10から入力された漢字仮名交じり
文は、制御部11の単語分割処理部21に入力される。
この漢字仮名交じり文は、日本語辞書用メモリ14が参
照されて最長一致法または文中の文節数が最小となるよ
うに単語を選択する文節最小法等を用いて各単語に分割
される。分割された単語は、単語読みアクセント処理部
22により単語毎にアクセントの型及び読みが設定され
て文節間結合度が算出され、この文節間結合度は韻律処
理部23へ出力される。韻律処理部23により文節間結
合度と文節のモーラ数を用いて後述する方法によりピッ
チパタン、ポーズ長の設定が行われて韻律が制御され
る。音声パラメータ生成部24により合成用単位の音声
データ辞書用メモリ16が参照されて各単語の読みに対
応する合成単位が検索され、最終的に音声合成用の音声
パラメータが時系列で音声合成部12を介して出力部1
3から出力される。
【0018】韻律制御用メモリ15に格納される韻律情
報は、図3に示すように、文がいくつかの文節から構成
されており、文節毎に、文節のモーラ数、文節間結合
度、アクセント型と共にフレーズ指令、アクセント指
令、ポーズ長情報が格納されている。例えば、文番号1
の文は、「次の電車は天理行きです。」と発音された自
然音声を分析した結果であり、「次の」の文節は、モー
ラ数が3でかつ文節間結合度が10、アクセント型が0
型、フレーズ指令が10、アクセント指令が9であるこ
とを示す。また、「電車は」の後に130msecのポ
ーズが挿入されていたことがわかる。なお、フレーズ指
令、アクセント指令は藤崎モデル(日本音響学会誌2
7、445−453(1971))として既知のフレー
ズ指令及びアクセント指令の大きさを相対的に表したも
ので、これらのパラメータからフレーズ成分とアクセン
ト成分が算出でき、ピッチパタンが得られる。また、こ
の藤崎モデルを用いずに、フレーズ成分あるいはアクセ
ント成分の時系列をメモリに格納すれば、ピッチパタン
算出の際に計算量が削減できる。
【0019】文節間結合度は、構文解析を用いる方法
や、係り受け関係、句読点、文節のモーラ数等から線形
モデルを用いる方法などの提案が行われているが、本実
施例では、本出願人により特開平4−51099号公報
に開示されているアルゴリズムを用いる。なお、韻律制
御用メモリ15に蓄える際に用いた文節間結合度の算出
法と単語読みアクセント処理部22での算出法が同一で
あれば、文節間結合度の算出方法自体はどれでもよい。
【0020】次に、韻律処理部23におけるピッチパタ
ン及びポーズ長の設定法を図4のフローチャートに沿っ
て説明する。なお、文字列処理部で算出された文節間結
合度と文節のモーラ数に最もマッチングする文を韻律制
御用メモリ15から抽出し、その韻律パラメータを用い
ることによって実現する。
【0021】入力された文と韻律制御用メモリ15に蓄
えられた分との距離Dが以下の式により算出される(ス
テップS1)。但し、MO(i,j)及びCO(I,J)は、韻律制御
用メモリ15に格納されているi番目の文のj番目の文
節のモーラ数及び文節間結合度を表し、mo(j)及びco(j)
は、合成する文章のj番目の文節のモーラ数及び文節間
結合度を表し、Nは文節の総数を表すものとする。更
に、α及びβは、モーラ数と文節間結合度に掛ける0以
上1以下の定数であり、文節間結合度の算出アルゴリズ
ムによって決定され、例えばα=1、β=0.1を用い
るものとする。
【0022】
【数1】
【0023】次に、上述ステップS1で求めた距離Dの
最小値が、所定のしきい値、例えば3以下であるか否か
が判定され(ステップS2)、しきい値以下である場
合、その最小値の文のフレーズ指令、アクセント指令、
ポーズ長などの韻律パラメータが韻律制御用メモリ15
から読み込まれる(ステップS3)。また、しきい値以
下でない場合、従来の規則を用いて文節間結合度から韻
律パラメータが算出される(ステップS4)。
【0024】そして、韻律パラメータが藤崎モデルのパ
ラメータ(フレーズ指令及びアクセント指令)であるか
否かが判断され(ステップS5)、韻律パラメータが藤
崎モデルのパラメータであると判断した場合、藤崎モデ
ル式によりフレーズ成分とアクセント成分とが算出され
る(ステップS6)。また、韻律パラメータが藤崎モデ
ルのパラメータでないと判断した場合、入力文のアクセ
ントと韻律制御用メモリ15のアクセントが異なるか否
かが判断される(ステップS7)。入力文のアクセント
と韻律制御用メモリ15のアクセントが異なると判断さ
れた場合、入力文のアクセント型に応じてピッチが高く
なるモーラの母音中心が韻律制御用メモリ15に格納さ
れたアクセント成分の最も高いピッチに合わせられ、ピ
ッチが低くなるモーラの母音中心のピッチが0にされる
(ステップS8)。
【0025】そして、各母音中心間を直線補間すること
によってアクセント成分が算出される。ここでいうピッ
チの高いモーラとは、アクセントが1型では1モーラ
目、2型では2モーラ目、3型では3モーラ目を指し、
それ以外のモーラをピッチの低いモーラと呼ぶ。フレー
ズ成分とアクセント成分とを重畳してピッチパタンが算
出される(ステップS9)。
【0026】なお、本実施例では、文字列解析部20を
設けているが、予めテキスト解析を行い、その解析情報
を入力部10の入力とした場合は、文字列解析部20を
省略することができる。
【0027】以上のように、自然音声を分析して得た韻
律情報を用いることによって、従来の文節間結合度から
規則でピッチパタン生成する方法に比べて、単調さが軽
減され、自然発声に近い韻律が算出できる。
【0028】
【発明の効果】本発明の音声規則合成装置によれば、極
めて近い合成音を得ることができる。また、アクセント
成分情報及びポーズ長情報を、文節間結合度、及びテキ
スト情報に対応させることにより、韻律制御用メモリ手
段に格納する韻律パタンの数を削減することができる。
【0029】
【図面の簡単な説明】
【図1】本発明の音声規則合成装置の実施例を示すブロ
ック図である。
【図2】図1の音声規則合成装置の制御部の構成を示す
ブロック図である。
【図3】図1の音声規則合成装置の韻律制御用メモリに
格納される韻律情報を示す図である。
【図4】図2の韻律処理部の動作を示すフローチャート
である。
【図5】文節間結合度と韻律との関係を示す図である。
【符号の説明】
10 入力部 11 制御部 12 音声合成部 13 出力部 14 日本語辞書用メモリ 15 韻律制御用メモリ 16 音声データ辞書用メモリ 21 単語分割処理部 22 単語読みアクセント処理部 23 韻律処理部 24 音声パラメータ生成部
フロントページの続き (56)参考文献 特開 昭60−205596(JP,A) 特開 平2−281298(JP,A) 特開 平4−51099(JP,A) 特開 平5−134691(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 - 13/08

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 任意の入力文について合成音声を生成す
    る音声規則合成装置であって、連続して発生された自然
    音声から抽出した文のフレーズ成分情報、アクセント成
    分情報及びポーズ長情報を、当該文を構成する文節のモ
    ーラ数情報及び文節間結合度の組合せに対応させて格納
    する韻律制御用メモリ手段と、 前記任意の入力文を構成する各文節のモーラ数情報及び
    文節間結合度の組合せと一致もしくは類似するものが前
    記韻律制御用メモリ手段に存在する場合、前記韻律制御
    用メモリ手段から前記任意の入力文に対応するフレーズ
    成分情報、アクセント成分情報及びポーズ長情報を得る
    ことによって韻律制御を行う韻律制御手段とを有し、 前記韻律制御手段は、前記任意の入力文と前記韻律制御
    用メモリ手段に格納された文との距離Dが、所定のしき
    い値以下である場合に、前記任意の入力文を構成する各
    文節のモーラ数情報及び文節間結合度の組合せと一致も
    しくは類似するものが前記韻律制御用メモリ手段に存在
    すると判断し、 前記距離Dが、以下の式によって算出され、 【数1】 ここで、MO(i,J)及びCO(I,J)は、前記韻
    律制御用メモリ手段に格納されているi番目の文のj番
    目の文節のモーラ数及び文節間結合度を表し、mo
    (j)及びco(j)は、合成する文章のj番目の文節
    のモーラ数情報及び文節間結合度を表し、Nは文節の総
    数を表し、α及びβは、文節間結合度の算出アルゴリズ
    ムによって決定される0以上1以下の定数である、こと
    を特徴とする音声規則合成装置。
JP18251894A 1994-08-03 1994-08-03 音声規則合成装置 Expired - Fee Related JP3314116B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18251894A JP3314116B2 (ja) 1994-08-03 1994-08-03 音声規則合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18251894A JP3314116B2 (ja) 1994-08-03 1994-08-03 音声規則合成装置

Publications (2)

Publication Number Publication Date
JPH0844391A JPH0844391A (ja) 1996-02-16
JP3314116B2 true JP3314116B2 (ja) 2002-08-12

Family

ID=16119706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18251894A Expired - Fee Related JP3314116B2 (ja) 1994-08-03 1994-08-03 音声規則合成装置

Country Status (1)

Country Link
JP (1) JP3314116B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6845358B2 (en) * 2001-01-05 2005-01-18 Matsushita Electric Industrial Co., Ltd. Prosody template matching for text-to-speech systems

Also Published As

Publication number Publication date
JPH0844391A (ja) 1996-02-16

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
JP4302788B2 (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
US6499014B1 (en) Speech synthesis apparatus
US6470316B1 (en) Speech synthesis apparatus having prosody generator with user-set speech-rate- or adjusted phoneme-duration-dependent selective vowel devoicing
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
JPH04331997A (ja) 音声合成装置のアクセント成分制御方式
WO2006106182A1 (en) Improving memory usage in text-to-speech system
JPH1138989A (ja) 音声合成装置及び方法
JP2006227589A (ja) 音声合成装置および音声合成方法
Stöber et al. Speech synthesis using multilevel selection and concatenation of units from large speech corpora
US6970819B1 (en) Speech synthesis device
Yegnanarayana et al. Significance of knowledge sources for a text-to-speech system for Indian languages
KR0146549B1 (ko) 한국어 텍스트/음성 변환 방법
JP3314116B2 (ja) 音声規則合成装置
JP3439840B2 (ja) 音声規則合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JP3314106B2 (ja) 音声規則合成装置
JPH05134691A (ja) 音声合成方法および装置
JP3078073B2 (ja) 基本周波数パタン生成方法
JP3034911B2 (ja) テキスト音声合成装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JPH09292897A (ja) 音声合成装置
JP2003330482A (ja) 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成方法、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム
JP3303428B2 (ja) 音声合成装置のアクセント成分基本テーブルの作成方法
JPH06214585A (ja) 音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080531

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090531

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees