JPS63285596A - 音声合成における発話速度変更方式 - Google Patents

音声合成における発話速度変更方式

Info

Publication number
JPS63285596A
JPS63285596A JP62119123A JP11912387A JPS63285596A JP S63285596 A JPS63285596 A JP S63285596A JP 62119123 A JP62119123 A JP 62119123A JP 11912387 A JP11912387 A JP 11912387A JP S63285596 A JPS63285596 A JP S63285596A
Authority
JP
Japan
Prior art keywords
phoneme
formant
speech
temporal change
change pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62119123A
Other languages
English (en)
Inventor
誠一 山本
樋口 宜男
徹 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
Kokusai Denshin Denwa KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Denshin Denwa KK filed Critical Kokusai Denshin Denwa KK
Priority to JP62119123A priority Critical patent/JPS63285596A/ja
Publication of JPS63285596A publication Critical patent/JPS63285596A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、規則による音声合成方式に関し、特にかな文
字列とそれに付加されたアクセント、イントネーション
等の韻律記号列を入力することにより高品質な音声を合
成する規則による音素接続形パラメータ規則合成方式に
おける発話速度変更方式に関する。
(従来の技術) 従来、規則により音声を合成する際、各音素を特徴づけ
る複数個のホルマント周波数及びホルマント帯域幅等の
特徴ベクトルと隣接音素間の音素変化を表わす特徴ベク
トル係数の時系列を蓄積し、隣接音素間の過渡部は、線
形補間法を用いて各音素の特徴ベクトルおよび特徴ベク
トル係数の線形結合によシ作成する方法等がある。これ
らの方法では前後の音素9発話速度等によシ定まる各音
素の持続時間に応じて定常部分を表示している特徴ベク
トル部分を伸縮する方法が用いられる。しかし、このよ
うな方法は発話速度が異なっても過渡部分は同じである
という粗い近似であり、これにより得られる合成音は発
話速度によっては、特に速い発話速度の場合には不自然
な感じとなるのを免れない。
(発明が解決しようとする問題点) 本発明の目的は、このような従来の欠点を改善するため
、人間の大音声の分析により抽出されるホルマント周波
数等の時間的変化パターンと極めてよく一致するホルマ
ント周波数等の時間的変化パターンを人工的に発生させ
、任意の文章を種々の発話速度で高品質な音声に変換す
る規則による音声合成方式を提供することである。
(問題点を解決するための手段) 本発明による規則による音声合成方式は、かな文字列若
しくはローマ字表現されたかな文字列とそれに付加され
たアクセント、イントネーション等の韻律記号列を入力
することによシ、音素持続時間、ピッチ周波数の時間的
変化パターン、ホルマント周波数及びホルマント帯域幅
の時間的変化バタ・−ン及び音源強度の時間的変化パタ
ーンを予め定めた規則を用いて決定1−1音声波形を合
成する規則による音声合成方式において、各音素のホル
マント周波数等の時間的変化パターンを、当該音素の持
続長円の2つの位置(以下、ターゲット位置という)で
の値(以下、ターゲツト値という)とそれらの間の接続
方法を規定し、それらの値を用いて逐次算出する規則に
よる音素接続形パラメータ規則合成方式である。
このような規則による音声合成方式において、発話速度
が変化すれば、ホルマント周波数等の音声合成パラメー
タのターゲット位置やターゲツト値を変化させなければ
、人間の発声プロセスの近似度が低下し、高品質の音声
を得ることは困難である。このため、発話速度が異なる
毎に、ホルマント周波数等の音声合成パラメータのター
ゲツト値やターゲット位置として異なる値を与えるよう
に、規則の数を拡張する方法がある。しかし、この方法
は規則数の増大によシ必要とするメモリが増大する欠点
及び規則選択のための処理時間が増大するという欠点が
ある。これに対し、本発明は、音素の持続時間について
その一部が伸縮するような規則を与え、その伸縮率を発
話速度によって変更することを特徴とする。
(実施例) 本発明による規則による音声合成方式においては、各音
素を特徴づける音声合成パラメータとして、ホルマント
周波数、ホルマント帯域幅、音源強度等を用いており、
これらの時間的変化パターンを2つの点(ターゲット位
置)における値(ターゲツト値)とその間の接続方法を
規定し、更に、音素持続時間についても2つのターゲッ
ト位置間の伸縮を規定する方法により、発話速度の変更
に対応できるようにしている。第1図は上記の関係をホ
ルマント周波数について示した図である。
第1図において、横軸はある音素の持続時間内の相対位
置を示しており、左側の縦軸はホルマント周波数を、右
側の縦軸は時間長を示している。
1は第1ホルマントの時間的変化パターンを示している
。すなわち、ある音素の相対位置の前から20チの所と
80%の所をターゲット位置とし、七〇間を線形に変化
している例を示している。2は第2ホルマント、3は第
3ホルマントに関する同様の時間的変化パターンを示し
ている。4は音素の時間伸縮の例を示しておシ、音素の
持続時間の内先頭の40%と後方の20%の部分につい
ては時間伸縮はないが、真中の40俤については持続時
間が150%伸びている例を示している。
第2図に、音声合成パラメータの時間的変化パターンす
なわち予め定めた時間間隔毎の音声合成パラメータの算
出方法を示す。第2図において、横軸はある音素の絶対
時間を示しており、上側の縦軸はホルマント周波数を、
下側の縦軸はある時間長で正規化された相対時間を示し
ている。1は第1ホルマントの相対時間に対する時間的
変化パターンを示している。2,3は各々第1ホルマン
トのターゲット、4は音素の時間伸縮を示している。r
、 、 r2はターゲットl及び2の相対位置、P+ 
+ I)tはrl p ”tからの垂線が折れ線4と交
わる点、1. 、12はP+ 、p2からの垂線が絶対
時間軸と交わる点であり、すなわち、ターゲットl及び
2の時間伸縮後の位置を示している。ntl及びnt2
は時間伸縮後の位置p1.p2でのターゲツト値を示し
ている。すなわち、図から明らかなように、発話速度が
ゆっくりの場合は全体の音素継続時間長が伸びると共に
、ターゲット1及び2の位置が適当にずれている。
第3図は本発明の実施態様の一例を示す構成図である。
図中1は韻律記号が付加されたかな文字列が入力される
入力端子、2はかな文字列の各音素を前後の音素や韻律
記号を参照して音韻記号に変化させる音韻記号変換回路
、3は各音韻の特徴ベクトルを4の音韻特徴ベクトルテ
ーブルから取り出すための音韻特徴ベクトル選定回路、
4は各音韻毎に持続時間長とその伸縮方法、ホルマント
周波数、ホルマント帯域幅、音源強度のターゲット位置
とターゲット値、ピッチパターン情報を記憶している音
韻特徴ベクトルテーブル、5は音韻特徴ベクトルを用い
て予め定めた時間間隔毎のホルマン4ト周波数等の音声
合成パラメータ演算回路、6はホルマント形音声合成器
、7は合成された音声波形を出力する出力端子である。
以下、図に沿ってその動作を説明する。入力端子1より
入力された韻律記号が付加されたかな文字列は、音韻記
号変換回路2によシ、各音素とそれぞれの音素に韻律記
号の付された音韻記号の列に変換される。音韻記号は3
の音韻特徴ベクトル選定回路へ入力される。音韻特徴ベ
クトル選定回路は1種のインデックスファイルであり、
入力された各音韻毎の特徴ベクトルが記憶されている音
韻特徴ベクトルテーブル4内のアドレスを各音韻毎に記
憶している。音韻特徴ベクトルテーブル4内に記憶され
ている特徴ベクトルとしては、持続時間長と、その伸縮
方法、ホルマント周波数、ホルマント帯域幅、音源強度
のターゲット位置とターゲット値、ピッチパターン情報
がある。ピッチパターン情報としては、例えば、アクセ
ント核の位置と戸車て成分の位置を使用する方法は公知
である(例えば、藤崎、須藤°:1日本語単語アクセン
トの基本周波数パターンとその生成機構モデル′。
日本音響学会誌、 27.445−453(1971)
 )。これらの特徴ベクトルは音声合成パラメータ演算
回路5に入力される。音声合成パラメータ演算回路5は
これらの特徴ベクトルを用いて、予め定めた時間間隔例
えば5 m see毎の音声合成パラメータを算出する
。その算出方法は、既に第2図において説明したように
、予め定めた時間間隔毎の相対位置を持続時間長の伸縮
方法に関する特徴ベクトルを用いて求める。続いて、そ
の相対位置が、今求めようとしている音声合成パラメー
タの2つのターゲット位置にはさまれるのか又は左右に
位置するのかを判定する。この判定結果に基づき、その
相対位置の左右のターゲツト値が決定され、このターゲ
ツト値を結ぶ接続方法により、その相対位置の値が一意
的に決定される。例えば、接続方法が線形接続であれば
、その相対位置と2つのターゲット位置との距離の荷重
平均がその相対位置での値となる。以上述べたように、
音声合成パラメータ演算回路5は、2つのターゲット位
置のターゲツト値を直線若しくは任意の曲線で接続する
際の予め定めた間隔毎の値を算出するものであるため、
演算機能を有するマイクロコンピュータで構成可能であ
る。なお、上記任意の曲線を表わす関数は、1つの入力
値に対してその値が一意的に定まる条件を有する曲線で
あることは当然である。  ゛音声合成パラメータ演算
回路5で求められた音声合成パラメータはホルマント形
音声合成器6に入力される。ホルマント形音声合成器6
は公知(例えば、D、H,Klaff : ’ Sof
tware for a cascade/paral
lel formant 5ynthesizer ’
 、 J+Acoust。
、帥、 、 67−3 (1980) ’)であシ、上
記信号を用いて音声波形を合成し、出力端子7へ出力す
る。
(発明の効果) 以上説明したように、本発明によれば、任意の文章を色
々な発話速度で自然性の高い音声として出力可能である
。しかも、ホルマント周波数等の音声合成パラメータに
関する規則の数は、発話速度の種類が増しても、増加し
ないため、記憶容量の増加はなく、また規則の選択過程
の複雑化による処理量の増加を防ぐことができる。
【図面の簡単な説明】
第1図は本発明の前提となる規則による音声合成システ
ムの構成原理を示した図、第2図は本発明の発話速度の
変更方法を示した図、第3図は本発明の実施例の構成を
示す因である。 1・・・入力端子、2・・・音韻記号変換回路、3・・
・音韻特徴ベクトル選定回路、4・−・音韻特徴ベクト
ルテーブル、5・・・音声合成パラメータ演算回路、6
・・・音声合成器、7・・・出力端子。

Claims (1)

  1. 【特許請求の範囲】 文字列とそれに付加されたアクセント、イントネーシヨ
    ンをふくむ韻律記号列を入力することにより、音素持続
    時間、ピッチ周波数の時間的変化パターン、ホルマント
    周波数及びホルマント帯域幅の時間的変化パターン及び
    音源強度の時間的変化パターンを予め定めた規則を用い
    て決定し、音声波形を合成する規則による音声合成方式
    において、 各音素のホルマント周波数及びホルマント帯域幅の時間
    的変化パターン及び音源強度の時間的変化パターンを、
    当該音素の持続時間内の2ケ所の位置とその位置での値
    及びその間の遷移方法を用いて規定するテーブルと、当
    該音素の持続時間の伸縮方法を規定するテーブルとを有
    し、当該音素の伸縮方法を変更することにより、予め定
    めた時間間隔毎のピッチ周波数、ホルマント周波数、ホ
    ルマント帯域幅、及び音源強度を変更することを特徴と
    する音声合成における発話速度変更方式。
JP62119123A 1987-05-18 1987-05-18 音声合成における発話速度変更方式 Pending JPS63285596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62119123A JPS63285596A (ja) 1987-05-18 1987-05-18 音声合成における発話速度変更方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62119123A JPS63285596A (ja) 1987-05-18 1987-05-18 音声合成における発話速度変更方式

Publications (1)

Publication Number Publication Date
JPS63285596A true JPS63285596A (ja) 1988-11-22

Family

ID=14753507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62119123A Pending JPS63285596A (ja) 1987-05-18 1987-05-18 音声合成における発話速度変更方式

Country Status (1)

Country Link
JP (1) JPS63285596A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091474A (ja) * 2000-09-05 2002-03-27 Lucent Technol Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091474A (ja) * 2000-09-05 2002-03-27 Lucent Technol Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置
JP2013011902A (ja) * 2000-09-05 2013-01-17 Alcatel-Lucent Usa Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置

Similar Documents

Publication Publication Date Title
JPS63285598A (ja) 音素接続形パラメ−タ規則合成方式
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JPH031200A (ja) 規則型音声合成装置
JP2002202790A (ja) 歌唱合成装置
US5987413A (en) Envelope-invariant analytical speech resynthesis using periodic signals derived from reharmonized frame spectrum
JP2009047837A (ja) 音声合成方法及びその装置
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JP2003345400A (ja) ピッチ変換装置、ピッチ変換方法及びプログラム
JPH09319391A (ja) 音声合成方法
JPS63285596A (ja) 音声合成における発話速度変更方式
JP3344487B2 (ja) 音声基本周波数パターン生成装置
JPH08248993A (ja) 音韻時間長制御方法
JPS63285597A (ja) 音素接続形パラメ−タ規則合成方式
JPH0642158B2 (ja) 音声合成装置
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JP3515268B2 (ja) 音声合成装置
JP3284634B2 (ja) 規則音声合成装置
JPS5880699A (ja) 音声合成方式
JP2995774B2 (ja) 音声合成方式
JPH0553595A (ja) 音声合成装置
JPH056191A (ja) 音声合成装置
JPS58129500A (ja) 歌声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
KR970003092B1 (ko) 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법
JPH0836397A (ja) 音声合成装置