JP2628994B2 - 文−音声変換装置 - Google Patents

文−音声変換装置

Info

Publication number
JP2628994B2
JP2628994B2 JP62087100A JP8710087A JP2628994B2 JP 2628994 B2 JP2628994 B2 JP 2628994B2 JP 62087100 A JP62087100 A JP 62087100A JP 8710087 A JP8710087 A JP 8710087A JP 2628994 B2 JP2628994 B2 JP 2628994B2
Authority
JP
Japan
Prior art keywords
time length
rule
parameter
unit
fluctuation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62087100A
Other languages
English (en)
Other versions
JPS63253996A (ja
Inventor
達郎 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62087100A priority Critical patent/JP2628994B2/ja
Publication of JPS63253996A publication Critical patent/JPS63253996A/ja
Application granted granted Critical
Publication of JP2628994B2 publication Critical patent/JP2628994B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 この発明は、文章を音声に変換して出力する文−音声
変換装置において、合成する音声の各音素の時間長を夫
々固定して同じ内容を発声させた場合、毎回同じ時間長
となってしまい、不自然な合成音声が生成されてしまう
問題を解決するため、発声される各音素に対応する合成
単位記号に付与する時間長にゆらぎを与えて音声合成す
る構成を採用することにより、同じ発声内容であって
も、毎回時間長を変化させ、より人の発声に近い、自然
性の高い合成音声を出力するようにしている。
〔産業上の利用分野〕
本発明は、文章に対応する合成単位記号毎に付与する
時間長にゆらぎを与えて音声合成し、出力する文−音声
変換装置に関するものである。
この文−音声変換装置は、任意の文章を入力とし、音
声に変換して出力するものであって、翻訳電話やコンピ
ュータの音声出力、盲人用読書機などの多くの分野で利
用されるものである。
〔従来の技術〕
第10図および第11図を参照して文章を音声に合成して
出力する従来の処理の流れを説明する。
第10図において、入力された文章に対し、合成単位記
号生成部11によって変換ルール12が適用され、合成の基
本単位を表す合成単位記号列に変換される。この変換さ
れた合成単位記号列は、パラメータ時系列生成部13によ
ってパラメータルール14が適用され、音声合成部15に与
えるためのパラメータ時系列に変換される。このパラメ
ータ時系列は、音声合成部15によって音声合成され、音
声として出力される。
次に、第11図を用いてパラメータ時系列生成部13の処
理の流れを詳細に説明する。
第11図において、時間長設定部13−1は、通知された
合成単位記号列に対し、時間長ルール13−2を適用して
合成単位記号毎に時間長の割り当てを行うと共に、音素
環境による時間長の違いを考慮して時間長の調整を行
う。パラメータ設定部13−3は、この調整された時間長
を用いて、合成単位記号列に対応するパラメータ値を設
定し、更に補間を行ってパラメータ時系列を生成する。
この際、音声の自然性を高めるために、パラメータ間を
滑らかに接続したり、実音声に見られるような“ゆら
ぎ”を与える処理を行う。このようにして生成されたパ
ラメータ時系列を音声合成部15に入力することによっ
て、音声が合成され、出力される。
〔発明が解決しようとする問題点〕
人が同じ単語(文)を何回も繰り返し発声する場合、
発声された音声は、発声毎にその物理的な特徴(振幅、
ピッチ、ホルマント周波数、発声長など)が変化してい
る。
従来の第10図および第11図に示すような文音声変換装
置は、パラメータ設定部13−3において、パラメータ間
を滑らかに接続したり、パラメータ値にゆらぎを付加し
たりすることが考えられる。しかし、これは時間長を固
定したままであるため、同じ内容を発声させた場合、毎
回、同じ時間長となる不自然な音声が合成・出力される
という問題点があった。
〔問題点を解決するための手段〕
本発明は、前記問題点を解決するため、文章に対応づ
けて生成した合成単位記号に対し、時間長ルール3を適
用して時間長の割り当てを行う時間長設定部2と、この
時間長設定部2によって割当てられた時間長に対し、時
間長ゆらぎルール5を適用してゆらぎを付加する時間長
ゆらぎ付加部4と、この時間長ゆらぎ付加部4によって
ゆらぎが付加された時間長に対し、パラメータルール7
を適用してパラメータ値を設定した後、パラメータ時系
列を生成するパラメータ設定部6とを設け、このパラメ
ータ設定部6によって生成されたパラメータ時系列を音
声合成部に供給して音声を合成して出力するようにして
いる。
第1図は本発明の原理構成図を示す。図中パラメータ
時系列生成部1は、合成単位記号を入力とし、パラメー
タ時系列を生成して出力するものである。これは、第10
図図中パラメータ時系列生成部13に対応するものであっ
て、時間長に更にゆらぎを付加して生成したパラメータ
時系列を出力するものである。
時間長設定部2は、入力された合成単位記号に対し、
時間長ルール3を適用して時間長を割り当てるものであ
る。
時間長ゆらぎ付加部4は、割り当てられた時間長に対
し、時間長ゆらぎルール5を適用してゆらぎを付加する
ものである。
パラメータ設定部6は、パラメータルール7を適用し
て、合成単位記号列と、ゆらぎの付加された時間長とに
従って、パラメータ値を設定して音声合成部に与えるパ
ラメータ時系列を生成するものである。
〔作用〕
次に動作を説明する。
第1図において、合成単位記号を時間長設定部2に入
力すると、時間長ルール3が適用され、夫々の合成単位
記号に対し、時間長が設定される。この時間長を時間長
ゆらぎ付加部4に入力すると、時間長ゆらぎルール5が
適用され、これらの時間長に毎回異なる値のゆらぎが付
加される。このゆらぎの付加された時間長、および合成
単位記号をパラメータ設定部6に入力すると、パラメー
タルール7が適用され、パラメータ値が設定され、更に
補間が行われてパラメータ時系列が生成される。このパ
ラメータ時系列を音声合成部に入力することにより、音
声が合成され、出力される。
以上のように、時間長ルール3を適用して生成した時
間長に対し、更に時間長ゆらぎルール5を適用してゆら
ぎ例えば乱数を用いて生成したゆらぎを付加してパラメ
ータ時系列を生成し、音声合成を行って出力することに
より、同じ内容を発声させても、毎回異なる時間長から
なる自然な音声が出力される。
〔実施例〕
次に、第2図ないし第9図を用いて本発明の1実施例
の構成および動作を詳細に説明する。
第2図において、時間長設定部2は、入力された合成
単位記号に対し、時間長ルール3を適用して時間長を割
り当てるものである。
時間長調整部2−1は、割り当てられた時間長に対
し、時間長調整ルール2−2を適用して各合成単位記号
の環境による時間長の違いを調整するものである。
時間長ゆらぎ付加部4は、調整された時間長に対し、
時間長ゆらぎルール5を適用して合成単位記号毎にゆら
ぎの幅が異なることを考慮し、ゆらぎを付加するもので
ある。
超分節素パラメータ設定部4−1は、ゆらぎの付加さ
れた時間長に対し、超分節素パラメータルール4−2を
適用して振幅、ピッチなどの超分節素(音声学的に意味
のある音声の最小単位である分節素の枠を越えて、音節
や句、文などの広範囲に渡る音声特徴を有するもの)パ
ラメータの設定を行うものである。
パラメータ設定部6−1は、超音節素の付加されたも
のに対し、パラメータルール7を適用してパラメータ値
を設定するものである。
パラメータ補間部6−2は、設定されたパラメータ値
の間の補間例えば直線補間、2次曲線補間などを行っ
て、音声合成部に与えるパラメータ時系列を生成するも
のである。
次に、第2図構成の処理の流れを第3図ないし第7図
ルールを用いて順次説明する。
第3図は時間長ルール例を示す。これは、入力された
合成音声記号に対し、時間長設定部2によって適用され
るルールを示す。このルール1は、“AEの時間長は、20
0msである”旨を表す。ここで、“AE"は例えば英語“ca
t"の発音記号(合成単位記号に対応する)〔kt〕中
の“”を表し、DUは区間を表し、startおよびendは処
理する場合に使用する時間変数名を表す。時間長設定部
2がこのルール1を合成単位記号“”に対して適用す
ることによって、時間変数start=0、および時間変数e
nd=200(ms)に設定される。
第4図は時間長調整ルール例を示す。これは、時間長
ルール例えばルール1によって設定された時間長(時間
変数start=0、時間変数end=200)に対し、時間長調
整部2−1によって適用されるルールを示す。このルー
ル2は“有声の摩擦音に先行する母音の時間長は120%
に伸張する”、ルール3は“無声の閉鎖音に先行する母
音の時間長は75%に短縮する”旨を夫々表す。ここで、
〔 〕内は合成単位記号の素性(音響的特徴)を表し、
合成単位記号毎に予め設定しておく必要がある。〔vowe
l〕はその合成単位が母音、〔+voc〕は有声、〔−vo
c〕は無声、〔fric〕は摩擦音、〔stop〕は閉鎖音であ
ることを夫々表す。ルールの左から第1番目の項例えば
〔vowel〕はルール適用の対象となる合成単位記号又は
その素性を表す。第2番目の項例えば(DU 120%)はル
ール適用後の結果を表す。第3番目の項例えば“_〔+
voc fric〕”は対象となる合成単位記号の環境(合成単
位記号又はその素性)を表す。以下同様である。時間長
調整部2−1がこれらルール2あるいはルール3を合成
単位記号に適用することによって、右欄に示すように、
時間変数endが1.2倍あるいは0.75倍される。
第5図は時間長ゆらぎルール例を示す。これは、時間
長調整ルール2−2によって調整された後の時間長に対
し、時間長ゆらぎ付加部4によって適用されるルールを
示す。このルール4は“母音の時間長はその20%の範囲
でゆらぐ”、ルール5は“摩擦音の時間長はその10%の
範囲でゆらぐ”旨を夫々表す。ここで、RNDは、乱数例
えば一様乱数、あるいはスペクトルが1/fとなるように
フィルタリングされた乱数などであって、−1から+1
の値を持つものを表す。時間長ゆらぎ付加部4が例えば
合成単位記号AEに対して適用すると、第5図ルールの右
欄に示すような演算が実行される。例えば、乱数が−0.
3の値を取った場合、ルール1で設定された時間変数end
=200に対し、下式によって算出される時間変数end=18
8に設定される。
end=200+200×0.2×(−0.3)=188 ……(1) 以上のルールを適用することによって、時間長に対す
る処理を完了する。次に、パラメータ値の設定の処理を
説明する。
第6図は超分節パラメータルール例を示す。これは、
ゆらぎの付加された時間長に対し、超分節素パラメータ
設定部4−1によって適用されるルールを示す。このル
ール6は“母音の始点と終点との振幅は0dBである”、
ルール7は“母音の始点から30ms後の振幅は60dB、およ
び終点の30ms前の振幅は55dBである”、ルール8は“母
音の始点から70ms後の振幅は70dBである”旨を夫々表
す。これにより、第8図(イ)図中黒丸を用いて示す位
置のパラメータ値が設定されたこととなる。また、ルー
ル9は“母音の始点のピッチは100Hzである”、ルール1
0は“母音の終点のピッチは先に設定されている始点の
ピッチの0.9倍である”旨を夫々表す。これにより、第
8図(ロ)図中黒丸を用いて位置のパラメータが設定さ
れたこととなる。ここで、使用している時間変数start
および時間変数endは、前段で設定された値が入ってい
る。また、AVは振幅値、F0はピッチ周波数、$は先に設
定したパラメータ値を保持し、後に使用するための変数
を表す。
第7図はパラメータルール例を示す。これは、パラメ
ータ設定部6によって適用されるルールを示す。このル
ール11は“AEの始点と終点の第1ホルマントは600Hz、
第2ホルマントは1600Hz、第3ホルマントは2300Hzであ
る”旨を夫々表す。
以上によって、ゆらぎの付加された時間長に対し、振
幅、ピッチ周波数、第1ホルマント、第2ホルマント、
第3ホルマントなどのパラメータ値が第9図に示される
ように設定される。そして、第2図パラメータ補間部6
−2は、第9図に示すように不連続に設定されたパラメ
ータ値を、音声合成部が必要とするパラメータ指定間隔
毎に値を持つように補間を行う。この補間は、線形補
間、2次曲線補間、臨界制動2次系による補間などを用
いて行う。この補間を行う際に、パラメータ値にゆらぎ
を加えてもよい。このようにして補間して生成したパラ
メータ時系列を音声合成部に入力して音声を合成して出
力することにより、発声毎に時間長が変化する自然性の
高い音声を出力することができる。
第8図(イ)は、既述したように、第6図ルール6な
いし8によって設定されたパラメータ値を模式的に表
し、第8図(ロ)は第6図ルール9、10によって設定さ
れたパラメータ値を模式的に表したものである。
第9図は、既述したルール1ないし3、6ないし11に
よって設定されたパラメータ値を夫々示す。尚、この図
中には、ルール4、5によって適用されるゆらぎは示し
てないが、当該ルール4、5が適用される場合には、TI
ME欄の200msが乱数の20%(ルール4適用の場合)ある
いは10%(ルール5適用の場合)だけゆらぎとして付加
されるものである。
〔発明の効果〕
以上説明したように、本発明によれば、発声される各
音素に対応する合成単位記号に付与する時間長にゆらぎ
を与えて音声合成する構成を採用しているため、同じ発
声内容であっても、毎回時間長を変化させ、より人の発
声に近い、自然性の高い合成音声を生成することができ
る。
【図面の簡単な説明】
第1図は本発明の原理構成図、第2図は本発明の1実施
例構成図、第3図は時間長ルール例、第4図は時間長調
整ルール例、第5図は時間長ゆらぎルール例、第6図は
超分節素パラメータルール例、第7図はパラメータルー
ル例、第8図は超分節素パラメータルール適用例、第9
図はパラメータ値例、第10図は文−音声変換装置の構成
図、第11図は従来のパラメータ時系列生成部の構成図を
示す。 図中、1はパラメータ時系列生成部、2は時間長設定
部、3は時間長ルール、4は時間長ゆらぎ付加部、5は
時間長ゆらぎルール、6はパラメータ設定部、7はパラ
メータルールを表す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文章を音声に変換して出力する文−音声変
    換装置において、 発声される各音素に対応する合成単位記号に対応づけて
    時間長を設定する時間長ルール(3)を保持する時間長
    ルール保持部と、 文章に対応づけて生成した上記合成単位記号に対し、上
    記時間長ルール保持部に保持されている時間長ルール
    (3)を適用して長時間の割り当てを行う時間長設定部
    (2)と、 上記合成単位記号に対応づけて時間長のゆらぎを乱数で
    設定する時間長ゆらぎルール(5)を保持する時間長ゆ
    らきルール保持部と、 上記時間長設定部(2)によって割り当てられた時間長
    に対し、上記時間長ゆらぎルール保持部に保持されてい
    る時間長ゆらぎルール(5)を適用して乱数によってゆ
    らぎを付加する時間長ゆらぎ付加部(4)と、 パラメータの値を設定するパラメータルール(7)を保
    持するパラメータルール保持部と、 上記時間長ゆらぎ付加部(4)によってゆらぎが付加さ
    れた時間長に対し、上記パラメータルール保持部に保持
    されているパラメータルール(7)を適用してパラメー
    タ値を設定した後、パラメータ時系列を生成するパラメ
    ータ設定部(6)とを備え、 このパラメータ設定部(6)によって生成されたパラメ
    ータ時系列を音声合成部に供給して音声を合成して出力
    するよう構成したことを特徴とする文一音声変換装置。
JP62087100A 1987-04-10 1987-04-10 文−音声変換装置 Expired - Fee Related JP2628994B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62087100A JP2628994B2 (ja) 1987-04-10 1987-04-10 文−音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62087100A JP2628994B2 (ja) 1987-04-10 1987-04-10 文−音声変換装置

Publications (2)

Publication Number Publication Date
JPS63253996A JPS63253996A (ja) 1988-10-20
JP2628994B2 true JP2628994B2 (ja) 1997-07-09

Family

ID=13905529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62087100A Expired - Fee Related JP2628994B2 (ja) 1987-04-10 1987-04-10 文−音声変換装置

Country Status (1)

Country Link
JP (1) JP2628994B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5334791A (en) * 1992-05-22 1994-08-02 Ligands Inc. Hydrogenation process with transition metal catalysts derived from bifunctional phosphorus-nitrogen ligands
JP2003295882A (ja) 2002-04-02 2003-10-15 Canon Inc 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム
JP5029168B2 (ja) * 2007-06-25 2012-09-19 富士通株式会社 音声読み上げのための装置、プログラム及び方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5713879A (en) * 1980-06-27 1982-01-23 Matsushita Electric Ind Co Ltd Projection type color television device
JPS58186800A (ja) * 1982-04-26 1983-10-31 日本電気株式会社 音声合成装置
JPS5953560A (ja) * 1982-09-21 1984-03-28 Nippon Oil & Fats Co Ltd 防汚塗料組成物

Also Published As

Publication number Publication date
JPS63253996A (ja) 1988-10-20

Similar Documents

Publication Publication Date Title
JPH0632020B2 (ja) 音声合成方法および装置
US7251601B2 (en) Speech synthesis method and speech synthesizer
EP1246163B1 (en) Speech synthesis method and speech synthesizer
JP2628994B2 (ja) 文−音声変換装置
JPS5972494A (ja) 規則合成方式
JP2596416B2 (ja) 文・音声変換装置
Přibil et al. Application of expressive speech in TTS system with cepstral description
JP3113101B2 (ja) 音声合成装置
JP2703253B2 (ja) 音声合成装置
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP2001312300A (ja) 音声合成装置
JP7280605B2 (ja) 音声処理装置、および音声処理方法
JPS5880699A (ja) 音声合成方式
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
JPH0229800A (ja) 音声合成装置
Ademi et al. NATURAL LANGUAGE PROCESSING AND TEXT-TO-SPEECH TECHNOLOGY.
JP2023014765A (ja) 音声合成装置、音声合成プログラム及び音声合成方法並びに音声変換装置、音声変換プログラム及び音声変換方法
JPH0667685A (ja) 音声合成装置
JPS6132096A (ja) 音声合成装置の音声合成方式
JPH06161490A (ja) 音声合成装置の韻律処理方式
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPH0553595A (ja) 音声合成装置
JPH07311588A (ja) テキスト音声合成装置
JPH0464080B2 (ja)
d’Alessandro et al. RAMCESS framework 2.0 Realtime and Accurate Musical Control of Expression in Singing Synthesis

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees