JPH04280B2 - - Google Patents

Info

Publication number
JPH04280B2
JPH04280B2 JP58062879A JP6287983A JPH04280B2 JP H04280 B2 JPH04280 B2 JP H04280B2 JP 58062879 A JP58062879 A JP 58062879A JP 6287983 A JP6287983 A JP 6287983A JP H04280 B2 JPH04280 B2 JP H04280B2
Authority
JP
Japan
Prior art keywords
speech
speech synthesis
sound source
buffer register
vocal tract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58062879A
Other languages
English (en)
Other versions
JPS59188700A (ja
Inventor
Yamato Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58062879A priority Critical patent/JPS59188700A/ja
Publication of JPS59188700A publication Critical patent/JPS59188700A/ja
Publication of JPH04280B2 publication Critical patent/JPH04280B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 この発明は単語より小さい音声単位のパラメー
タを組合せて任意の音声を合成する音声合成装置
に関し、特に音声各部の持続時間の制御を容易な
らしめようとするものである。
<背景技術> デイジタル技術を用いた音声合成装置において
は、合成器に与える音源パラメータ(ピツチ周波
数、音源振幅)と声道パラメータ(ホルマント周
波数やPARCOR係数など)とを一定周期毎に更
新する。この周期、あるいはその時間長をフレー
ム周期、フレーム長などと呼び、通常5〜20m
secの値がとられる。
従来の音声合成装置では、フレーム周期は固定
であるか、半固定であつた。半固定の場合、5、
10、20、40msecなどとびとびの値をとることが
可能であり、合成器への制御情報量を多くして合
成音の品質を向上させたい場合は5msecなどの
短かいフレーム周期が選択され、品質よりも高い
情報圧縮が優先される場合には20msecなどの長
いフレーム周期が選択された。また、音声のパラ
メータを抽出する分析の段階で10msecのフレー
ム更新周期で分析したものを合成装置のパラメー
タメモリに蓄積しておき、5msecのフレーム周
期で合成すると2倍速度が早い早口の合成音が得
られ、逆に20msecのフレーム周期で合成すると
速度が半分のゆつくりした口調の合成音が実現で
きるなどの応用も可能であつた。しかし、これら
の方法では合成すべき音声区間全体にわたつて一
様な速度調整しか行つていなかつた。
一方、単語より小さな合成単語を用いて任意の
連続音声を合成する方式では、適切なリズム感を
与えるため、子音部、母音定常部、母音間あるい
は子音−母音間の遷移部において異なつた持続時
間の制御を行う必要がある。従来はこのような制
御を行うため、つまり規則により定められた音声
区分長にするために、あらかじめ蓄積された合成
単位の持続時間より長い持続時間を実現する必要
のある場合は、同一フレームの音声パラメータを
繰り返し使用する、あるいは逆に短かい持続時間
を実現する必要のある場合は、適当なフレームの
音声パラメータを間引く、すなわちそのフレーム
を使用しないことによつて短かい時間を実現する
などの手法を用いる必要があつた。しかし、これ
らの場合、音声のどの部分を繰り返し使用した
り、間引いたりするかを決めるアルゴリズムが明
確でないばかりでなく、間引くことによる音声パ
ラメータ値のギヤツプが合成音の品質に悪影響を
及ぼす可能性があるなどの欠点があつた。
<発明の概要> この発明の目的は合成音声に自然なリズムとテ
ンポを与えるため、音声区分、例えば母音、子音
など音声各部の持続時間の制御を簡単に行えるよ
うにした音声合成装置を提供することにある。
この発明によれば合成すべき音声信号と対応し
た音声単位の音声合成パラメータをパラメータ蓄
積部から読出し、その読出された音声単位の音声
合成パラメータのフレーム数を変更することな
く、音韻規則によつて定められた音声区分長を実
現するように各フレームの合成サンプル数を演算
し、その演算された合成サンプル数を、少くとも
それが変るごとにフレーム長バツフアレジスタに
格納し、そのフレーム長バツフアレジスタの合成
サンプル数だけ合成するごとに音源情報バツフア
レジスタ及び声道パラメータバツフアレジスタに
対する書替え要求を出す。
<実施例> 第1図はこの発明による音声合成装置の実施例
を示す。制御部1では合成すべき音声を表現する
文字情報等に基づいて音声合成パラメータ蓄積部
2より、連続音声を合成するに必要な音声単位の
音声合成パラメータを読み出す。音声単位は音声
合成のための単位であつて音素(音韻)もしくは
〔子音−母音(CV)〕、〔子音−母音−子音
(CVC)〕などの音素の複合単位であり、
PARCOR係数、振幅、有声/無声係数などのパ
ラメータの形式で表現されている。また、蓄積部
2には無声部、子音摩擦部、子音破裂部、母音立
上り部、母音定常部、母音立下り部などの各セグ
メントを示す情報も同時に記憶させてある。
制御部1では、読み出した音声合成パラメータ
からピツチ周波数の時間パタンを生成して、ピツ
チ周期、振幅、有声/無声係数などの音源情報を
作り出す一方、読み出されたPARCOR係数をも
とに、音源情報及び声道パラメータからなる1フ
レーム分の音声合成パラメータを組立て、その音
源情報を音源バツフアレジスタ3に、声道パラメ
ータを声道パラメータバツフアレジスタ4にそれ
ぞれ転送する。
また制御部1は与えられたテンポや着目してい
る音素の単語内の位置、周囲の音素環境に基づい
て規則によつて定められた音声区分長、つまり一
つの音素の立上り区分、定常区分、立下り区分、
その音素自体の区分などの持続時間を実現する各
フレームの時間を、例えば従来と同様の手法によ
り計算し、前記読み出された音声単位についてあ
らかじめ蓄積されているその音声単位の相当部分
の長さとの比較から、その読み出された音声単位
の音声合成パラメータのフレーム数を変更するこ
となく、そのフレームの合成サンプル数、つまり
フレーム長を算出し、フレーム長バツフアレジス
タ5に転送する。
例えば〔SaKuYa〕という合成音を作成する場
合を考えてみる。合成のための音声単位はCV型
であるとし、語頭の〔Sa〕における母音〔a〕
の前記計算により求まつた実現すべき持続時間は
60msecであつたとする。音声合成単位は8KHzサ
ンプリング、10msecのフレーム周期で分析され
ているので、1フレーム長に相当する合成サンプ
ル数は80である。また、音声合成単位〔Sa〕の
〔a〕のあらかじめ記憶されている持続時間は90
msec、即ち9フレームとすると、 (60/90)×80=53 が、合成すべき1フレーム長(合成サンプル数)
となる。すなわち、1フレーム長が53サンプルで
9フレームを合成することにより、60msecの持
続時間を有する〔a〕を実現する。
フレーム長カウンタ6は合成音を1サンプル合
成する毎にクロツク発生器11のクロツクを計数
して計数値を1進め、カウンタ6の計数値は比較
器7によつてフレーム長バツフアレジスタ5の合
成サンプル数と比較され、この合成サンプル数を
越えると、比較器7は制御部1に次の1フレーム
分の音声データを要求し、新たな音声合成デー
タ、つまり音源情報、声道パラメータ及び合成サ
ンプル数が音源バツフアレジスタ3、声道パラメ
ータバツフアレジスタ4、フレーム長バツフアレ
ジスタ5にそれぞれ転送される。
上記操作をくり返しながら、音源生成部8及び
音声合成声道回路9はクロツク発生器11のクロ
ツクで動作し、各バツフアレジスタ3,4よりそ
れぞれデータを読みとり、音源生成部8で音源信
号を生成し、その音源信号を音声合成声道回路9
に供給し、音声合成声道回路9の伝達関数がバツ
フアレジスタ4のデータにより設定され、音声を
合成して出力端子10に出力する。
一般に合成すべき音声のテンポが指定された場
合、母音と子音では伸縮の割合が異なる。また、
子音の種類、母音の種類によつても伸縮の割合が
異なる。例えば発声のテンポをゆつくりしていく
と、有声破裂音は50〜60msecを境として、それ
以上持続時間が伸びないが、摩擦音や母音では持
続時間が伸びる傾向がある。逆に早いテンポでは
摩擦音の持続時間は一定値以下にはなりにくいな
どの性質がある。従つて種々の文音声を合成する
場合、音素毎にあるいは場合によつては音素より
も小さい音声セグメント(音声区間)毎に持続時
間を決めてやることが好ましい。しかし従来にお
いてはテンポを調整する場合は先に述べたように
フレーム長を半固定的にしか変化せず、音声合成
の途中できめ細かくフレーム長を制御することは
行つていなかつた。前述のようにテンポの変更に
より持続時間が比例的に変化しない場合はあらか
じめ個別に発声され、蓄積されている音声合成単
位の時間構造とテンポによつて異なつたものとな
る。この発明ではこのような関係をあらかじめ記
憶しておき、これを参照することによつて前述し
たフレーム長可変方式で音素毎に持続時間を調整
することができ、より品質のよい合成音声を得る
ことができる。
第1図ではフレーム毎に音声合成パラメータと
フレーム長とを変更する実施例を示したが、第2
図は他の実施例を示すものである。即ちこの例で
はフレーム周期の更新が必要の場合のみ、つまり
計算した合成サンプル数が変化した時のみ制御部
1から制御線12を介してフレーム長バツフアレ
ジスタ5の内容を更新する。合成音の時間制御は
母音毎あるいは子音毎に行うのが普通であるから
同一フレーム長での合成は数フレーム継続するこ
とが多い。従つて音声合成パラメータをバツフア
レジスタに転送するたびに、フレーム長データを
必ずしも転送する必要はない。この実施例では一
定長の音声セグメント(音声区間)を合成後に、
合成フレーム長を更新する必要が生じた場合に、
フレーム長バツフアレジスタ5の内容を書き替え
ることが可能である。
<効果> 以上説明したように、この発明は合成音声全体
を一様に伸縮するのではなく、音声区間毎にその
持続時間の制御をきめ細かく行うことができ、し
かもその場合はフレームは変更しないため、どの
フレームを繰返すか、どのフレームを間引くかの
判定をする必要がなく簡単に行うことができるた
め、単語より小さな音声単位から任意音声を合成
する際、適切なリズム等の実現が容易に行える利
点がある。
【図面の簡単な説明】
第1図及び第2図はそれぞれこの発明の実施例
を示すブロツク図である。 1:制御部、2:音声合成パラメータ蓄積部、
3:音源バツフアレジスタ、4:声道パラメータ
バツフアレジスタ、5:フレーム長バツフアレジ
スタ、6:フレーム長カウンタ、7:比較器、
8:音源生成部、9:音声合成声道回路、10:
出力端子、11:クロツク発生回路、12:制御
線。

Claims (1)

  1. 【特許請求の範囲】 1 音声合成パラメータ蓄積部から、合成すべき
    音声信号に対応した音声単位の音声合成パラメー
    タを読出し、その読出された音声合成パラメータ
    を1フレーム分ごとの音声合成パラメータに組立
    て、その各フレームの音声合成パラメータ中の音
    源情報を音源バツフアレジスタに格納し、その音
    声合成パラメータ中の声道パラメータを声道パラ
    メータバツフアレジスタに格納し、その音源バツ
    フアレジスタの音源情報により音源生成部で音源
    信号を生成し、その音源信号により音声合成声道
    回路を駆動すると共にその音声合成声道回路の伝
    達特性を上記声道パラメータバツフアレジスタの
    声道パラメータにより設定してその音声合成声道
    回路から合成音声信号を出力する音声合成装置に
    おいて、 上記読出された音声単位の音声合成パラメータ
    のフレーム数を変更することなく、規則によつて
    定められた音声区分長を実現するように各フレー
    ムの合成サンプル数を演算する手段と、その演算
    された合成サンプル数が、少くともそれが変化す
    るごとに格納されるフレーム長バツフアレジスタ
    と、そのフレーム長バツフアレジスタの合成サン
    プル数の合成が終了するごとに上記音源情報バツ
    フアレジスタ及び上記声道パラメータレジスタに
    対する書替え要求を出す手段とを具備することを
    特徴とする音声合成装置。
JP58062879A 1983-04-08 1983-04-08 音声合成装置 Granted JPS59188700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58062879A JPS59188700A (ja) 1983-04-08 1983-04-08 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58062879A JPS59188700A (ja) 1983-04-08 1983-04-08 音声合成装置

Publications (2)

Publication Number Publication Date
JPS59188700A JPS59188700A (ja) 1984-10-26
JPH04280B2 true JPH04280B2 (ja) 1992-01-06

Family

ID=13212988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58062879A Granted JPS59188700A (ja) 1983-04-08 1983-04-08 音声合成装置

Country Status (1)

Country Link
JP (1) JPS59188700A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0741668B2 (ja) * 1985-03-05 1995-05-10 三井石油化学工業株式会社 熱収縮フイルム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57125999A (en) * 1981-01-29 1982-08-05 Seiko Instr & Electronics Voice synthesizer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57125999A (en) * 1981-01-29 1982-08-05 Seiko Instr & Electronics Voice synthesizer

Also Published As

Publication number Publication date
JPS59188700A (ja) 1984-10-26

Similar Documents

Publication Publication Date Title
US6308156B1 (en) Microsegment-based speech-synthesis process
JP2000305582A (ja) 音声合成装置
JPH0632020B2 (ja) 音声合成方法および装置
JP3576840B2 (ja) 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
US5659664A (en) Speech synthesis with weighted parameters at phoneme boundaries
JP5360489B2 (ja) 音素符号変換装置および音声合成装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP3437064B2 (ja) 音声合成装置
JPH04280B2 (ja)
JP3233036B2 (ja) 歌唱音合成装置
JPH08248993A (ja) 音韻時間長制御方法
JPS5914752B2 (ja) 音声合成方式
JPH11161297A (ja) 音声合成方法及び装置
JP3284634B2 (ja) 規則音声合成装置
JPH0447840B2 (ja)
JPH08160991A (ja) 音声素片作成方法および音声合成方法、装置
JP3515268B2 (ja) 音声合成装置
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
Datta et al. Introduction to ESOLA
JPH056191A (ja) 音声合成装置
JPH03203800A (ja) 音声合成方式
JP3830200B2 (ja) 人物画像合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
O'Shaughnessy Recent progress in automatic text-to-speech synthesis
JP2000010580A (ja) 音声合成方法及び装置