JP3160277B2 - 基本周波数パターン推定装置 - Google Patents

基本周波数パターン推定装置

Info

Publication number
JP3160277B2
JP3160277B2 JP06192989A JP6192989A JP3160277B2 JP 3160277 B2 JP3160277 B2 JP 3160277B2 JP 06192989 A JP06192989 A JP 06192989A JP 6192989 A JP6192989 A JP 6192989A JP 3160277 B2 JP3160277 B2 JP 3160277B2
Authority
JP
Japan
Prior art keywords
frequency pattern
basic frequency
fundamental frequency
error
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06192989A
Other languages
English (en)
Other versions
JPH02239294A (ja
Inventor
正典 宮武
芳典 匂坂
Original Assignee
株式会社エイ・ティ・アール自動翻訳電話研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エイ・ティ・アール自動翻訳電話研究所 filed Critical 株式会社エイ・ティ・アール自動翻訳電話研究所
Priority to JP06192989A priority Critical patent/JP3160277B2/ja
Publication of JPH02239294A publication Critical patent/JPH02239294A/ja
Application granted granted Critical
Publication of JP3160277B2 publication Critical patent/JP3160277B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は基本周波数パターン推定装置に関し、特
に、自然な音声を合成するために重要な基本周波数パタ
ーンの形状を精度良く推定するための基本周波数パター
ン推定装置に関する。
[従来の技術] 自然な音声を合成するためには、基本周波数の制御が
重要とされる。モデルによって基本周波数パターンを生
成する場合には、実音声の基本周波数パターンを推定
し、モデルのパラメータを適切に決定する必要がある。
基本周波数パターンの推定法として、Analysis by Sy
nthesis法(以下、AbS法と略称する)を適用する手法が
挙げられる。これは、モデルに仮のパラメータ値を与え
ることにより得られる推定基本周波数パターンと実音声
の基本周波数パターンとの誤差を求め、この誤差が小さ
くなるようにパラメータ値を繰返し変化させ、適切なモ
デルのパラメータ値を得る方法である。
基本周波数パターンを生成するためのモデルとして
は、従来より種々の方法があるが、ここでは臨界制動2
次系の応答を用いたモデルについて説明する。これは、
アクセント指令時点・振幅の大きさなどの指定により、
基本周波数パターン全体を生成するモデルである。近似
式は、たとえば、「日本語単語アクセントの基本周波数
パターンとその生成機構のモデル」と題された、藤崎他
による、日本音響学会誌27巻9号445ないし453頁、1971
年)に、以下のように示されている。
F0(t)=Fmin・exp(Gv(t−t0)−Gv(t−t3) +(Ga(t−t1)−Ga(t−t2)−g2] …(1) Gv(t)=Avαt・exp(−αt) …(2) Ga(t)=Aa[1−(1+βt)・exp(−βt)] …(3) ここで、F0(t)は対数基本周波数パターンであり、
Fminは発振可能な最低周波数であり、時間t0,t3はそれ
ぞれ話調指令の始点および終点であり、時間t1,t2はそ
れぞれアクセント指令の始点および終点であり、g2は発
振停止に相当する入力信号の値である。また、Avは話調
成分の応答の大きさを示す振幅パラメータであり、Aaは
アクセント成分の応答の大きさを示す振幅パラメータで
あり、αおよびβはそれぞれの成分の応答速度を示す時
係数である。
第3図はAbS法を適用した基本周波数パターン推定法
の従来例を示すブロック図である。第3図を参照して、
パラメータ値記憶部1はモデルのパラメータ群の値を記
憶する。パラメータ値記憶部1から読出されたパラメー
タ群は推定基本周波数パターン生成部2に与えられる。
推定基本周波数パターン生成部2はパラメータ値記憶部
1から読出されたパラメータ群の値を用いて、モデルに
基づいて推定基本周波数パターンを生成する。実音声基
本周波数パターン保持部3は、実音声から抽出された実
音声基本周波数パターンを保持している。実音声基本周
波数パターン保持部3から出力された実音声基本周波数
パターンと推定基本周波数パターン生成部2によって生
成された推定基本周波数パターンは自乗誤差計算部4に
与えられる。自乗誤差計算部4は推定基本周波数パター
ンと実音声基本周波数パターンとの自乗誤差を計算す
る。制御部5は自乗誤差計算部4で計算された自乗誤差
が小さくなるように、パラメータ値記憶部1に記憶され
たパラメータ群の値を変化させる。
次に、第3図を参照して、従来例の推定基本周波数パ
ターンの動作について説明する。まず、パラメータ値記
憶部1内のパラメータ群に適当な初期値が与えられる。
基本周波数パターン生成部2は、初期のパラメータ群の
値を上述の第(1)式ないし第(3)式に適用すること
により、推定基本周波数パターンF0(t)を生成する。
一方、実音声基本周波数パターン保持部3には予め実音
声から抽出されたn個の標本点からなる実音声基本周波
数パターンf0(t)(t=Ti,i=1,2…n)が保持され
る。自乗誤差計算部4は、これら2つの基本周波数パタ
ーンF0(t)とf0(t)との自乗誤差εを次の第(4)
式を用いて算出する。
次に、制御部5はパラメータ値記憶部1に記憶された
パラメータ群の1つ、たとえば話調成分の応答の大きさ
を示す振幅パラメータAvを正あるいは負の方向に適当な
変化幅で変化させる。その結果、推定基本周波数パター
ン生成部2で生成される推定基本周波数パターンが更新
され、したがって自乗誤差計算部4で計算される自乗誤
差εが変化する。
制御部5はこの自乗誤差εの値を調べながらパラメー
タAvを繰返し変化させ、自乗誤差εが極小になるときの
パラメータAvの値を新たにパラメータ値記憶部1に記憶
させる。他のパラメータについても順次同様にして決定
し、パラメータ値記憶部1に記憶されたパラメータ群の
値を更新する。上述の手順を繰返し、適当な条件でもっ
て処理を打切る。これによって、モデルの適正なパラメ
ータをパラメータ値記憶部1内に得ることができる。
第4図は従来の基本周波数パターン推定法における自
乗誤差εについてさらに詳しく示した図である。第4図
を参照して、標本点の数n=3として説明する。実音声
基本周波数パターン10は、t=T1,T2,T3におけるそれぞ
れの標本点101,102,103から成立っている。推定基本周
波数パターン20はt=T1,T2,T3のそれぞれに対応する3
つの点201,202,203を通っている。また、別の推定基本
周波数パターン21は、t=T1,T34においては基本周波数
パターン20と同じ点201,203を通り、t=T2においては
点212を通っている。
[発明が解決しようとする課題] ところで、2点102,202間の距離と、2点102,212の間
の距離とが等しい場合、実音声基本周波数パターン10と
推定基本周波数パターン20との間の自乗誤差をε
し、実音声基本周波数パターン10と推定基本周波数パタ
ーン21との間の自乗誤差をεとすれば、前述の第
(4)式により、ε=εであることがわかる。
しかし、自然な音声を合成するためには、種々の標本
点における位置の値だけでなく、基本周波数パターンの
形状、すなわち基本周波数パターンの上昇と下降の度合
も非常に重要となる。すなわち、ε<εであること
が望ましいにもかかわらず、従来の方法では、パターン
間誤差の計算において上述のような推定基本周波数パタ
ーンの形状の違いが誤差計算に反映されていないという
欠点があった。
それゆえに、この発明の主たる目的は、実音声基本周
波数パターンと推定基本周波数パターンとの誤差を計算
する際に、パターンの形状の違いが誤差に反映されるよ
うな基本周波数パターン推定装置を提供することであ
る。
[課題を解決するための手段] この発明は基本周波数パターン推定装置であって、推
定基本周波数パターンを生成するためのパラメータ群の
値を記憶するパラメータ値記憶手段、実音声から抽出し
た実音声基本周波数パターンを保持する実音声基本周波
数パターン保持手段と、パラメータ値記憶手段から読出
されたパラメータ群の値を用いて推定基本周波数パター
ンを生成する推定基本周波数パターン生成手段と、生成
された基本周波数パターンと保持されている実音声基本
周波数パターンとの自乗誤差を計算する自乗誤差計算手
段と、保持されている実音声基本周波数パターンの傾斜
の度合と推定された推定基本周波数パターンの傾斜の度
合との誤差を計算する傾斜誤差計算手段と、計算された
自乗誤差と傾斜の度合との差とを予め定められた割合で
加重平均して2つの基本周波数パターン間の誤差値を算
出する加重平均手段と、算出された誤差値を用いてパラ
メータ値記憶手段に記憶されているパラメータ群の値を
最適化する制御手段を備えて構成される。
[作用] この発明における基本周波数パターン推定装置は、パ
ラメータ値記憶手段に記憶されたパラメータ群の値を用
いて推定基本周波数パターン生成手段によって推定基本
周波数パターンを生成し、実音声基本周波数パターン保
持手段によって保持されている実音声から抽出した実音
声基本周波数パターンと基本周波数パターンとの自乗誤
差を計算するとともに、実音声基本周波数パターンの傾
斜の度合と推定基本周波数パターンの傾斜の度合との誤
差を計算し、計算された自乗誤差と傾斜の度合の差とを
予め決められた割合で加重平均して2つの基本周波数パ
ターン間の誤差値を算出し、その誤差値を用いてパラメ
ータ値記憶手段に記憶されているパラメータ群の値を最
適化する。
[発明の実施例] 第1図はこの発明の一実施例の概略の構成を示すブロ
ック図である。第1図において、パラメータ値記憶部1
と推定基本周波数パターン生成部2と実音声基本周波数
パターン保持部3と制御部5は第3図に示したものと同
じである。誤差計算部40は自乗誤差計算部41と傾斜誤差
計算部42と加重平均部43とからなる。自乗誤差計算部41
は第3図の従来例で示した自乗誤差計算部4と同様にし
て、前述の第(4)式を用いて、推定基本周波数パター
ン生成部2によって生成された推定基本周波数パターン
と実音声基本周波数パターン保持部3に保持されている
実音声基本周波数パターンとの自乗誤差εを計算する。
傾斜誤差計算部42はたとえば次の第(5)式を用いて、
上述の2つのパターンの傾斜の度合の差ε′を計算す
る。
加重平均部43は自乗誤差計算部41で計算された自乗誤
差εと傾斜誤差計算部42で計算された傾斜の度合の差
ε′とを予め決められた割合で加重平均し、上述の2つ
の基本周波数パターン間の誤差値を算出する。制御部5
はこの誤差値を用いて、パラメータ値記憶部1内のパラ
メータ群の値を更新し、最適なパラメータ群の値を決定
する。
第2図は第1図に示した傾斜誤差計算部のより具体的
なブロック図である。第2図を参照して、バッファ401
〜404は基本周波数パターンの値を記憶し、それぞれ第
(5)式のf0(Ti),f0(Ti+1),F0(Ti),F0(Ti+1
に対応する。差分器405ないし407と自乗演算器408およ
び累積加算器409はそれぞれ第(5)式の演算を行な
う。ゲート410ないし413はそれぞれ実音声基本周波数パ
ターン保持部3および推定基本周波数パターン生成部2
からの基本周波数の値を順にバッファ401ないし404に送
る。ゲート414は自乗演算器408による演算結果を累積加
算器409に送る働きをする。タイミング信号発生器415は
ゲート410ないし414の開閉を制御するための信号を発生
する。なお、クリア信号416は制御部5がパラメータ値
記憶部1のパラメータ群の値を更新するごとに発生され
る。
次に、傾斜誤差計算部42の具体的な動作について説明
する。クリア信号416が発生されると、累積加算器409に
累積された結果がクリアされるとともに、タイミング信
号発生器415から所定の間隔で信号が生成される。この
信号によってゲート410ないし413が開かれ、実音声基本
周波数パターン保持部3に保持された実音声基本周波数
パターンおよび推定基本周波数パターン生成部2で生成
された推定基本周波数パターンの値が時間順にバッファ
401ないし404に格納される。これらの値は差分器405な
いし407および自乗演算器408に送られてそれぞれの演算
が行なわれる。
タイミング信号発生器415からゲート410ないし413に
送られる2回目以降の信号に対応して、タイミング信号
発生器415からゲート414の開閉を制御するための信号が
送られ、これによって自乗演算器408での演算結果が累
積加算器409に与えられ、2つのパターン間の傾斜の度
合の差が求められる。
前述した従来例のように、パターン間の誤差を自乗誤
差で計算すると、第4図において、実音声基本周波数パ
ターン10と推定基本周波数パターン20の間の誤差ε
よび実音声基本周波数パターン10と推定基本周波数パタ
ーン21の間の誤差εは等しくなる。しかし、この発明
によれば、2つのパターン間の誤差にパターンの傾斜の
度合の差が含まれるので、明らかにε<εとなる。
したがって、推定基本周波数パターンとして20のみが採
用されることになる。このように、この発明の一実施例
によれば、基本周波数の上昇,下降の度合を考慮した精
度の良い基本周波数パターンを推定することができる。
なお、上述の説明では、自乗誤差を用いたが、自乗誤
差の平方根や絶対値誤差を用いる方法もあり、また傾斜
の度合の差の定義も第(5)式以外にも種々のものが考
えられ、これによってこの発明の及ぶ範囲が何ら制限さ
れるものではない。
[発明の効果] 以上のように、この発明によれば、実音声から抽出さ
れた基本周波数パターンと推定基本周波数パターンとの
パターン間誤差の計算に基本周波数パターンの傾斜の度
合の差が含まれているため、基本周波数の上昇,下降の
度合を考慮した基本周波数パターンの推定が可能にな
り、より精度の高いモデルのパラメータを得ることがで
きる。また、このようにして得られた基本周波数パター
ンを用いることによって、より自然な人間らしい合成音
声を生成することが可能となり、その効果が大きい。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図である。
第2図は第1図に示した傾斜誤差計算部のより具体的な
ブロック図である。第3図は従来の基本周波数パターン
推定装置の概略の構成を示すブロック図である。第4図
は従来の基本周波数パターン推定装置における基本周波
数パターン間の誤差の計算方法を示す図である。 図において、1はパラメータ値記憶部、2は推定基本周
波数パターン生成部、3は実音声基本周波数パターン保
持部、5は制御部、40は誤差計算部、41は自乗誤差計算
部、42は傾斜誤差計算部、43は加重平均部、401ないし4
04はバッファ、405ないし407は差分器、408は自乗演算
器、409は累積加算器、410ないし414はゲート、415はタ
イミング信号発生器を示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 匂坂 芳典 京都府相楽郡精華町大字乾谷小字三平谷 5番地 株式会社エイ・ティ・アール自 動翻訳電話研究所内 (56)参考文献 特開 昭63−46497(JP,A) 特開 昭59−192293(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】推定基本周波数パターンを生成するための
    パラメータ群の値を記憶するパラメータ値記憶手段、 実音声から抽出した実音声基本周波数パターンを保持す
    る実音声基本周波数パターン保持手段、 前記パラメータ値記憶手段から読出されたパラメータ群
    の値を用いて推定基本周波数パターンを生成する推定基
    本周波数パターン生成手段、 前記推定基本周波数パターン生成手段によって生成され
    た基本周波数パターンと、前記実音声基本周波数パター
    ン保持手段に保持されている実音声基本周波数パターン
    との自乗誤差を計算する自乗誤差計算手段、 前記実音声基本周波数パターン保持手段に保持されてい
    る実音声基本周波数パターンの傾斜の度合と、前記推定
    基本周波数パターン生成手段によって生成された推定基
    本周波数パターンの傾斜の度合との誤差を計算する傾斜
    誤差計算手段、 前記自乗誤差計算手段によって計算された自乗誤差と前
    記傾斜誤差計算手段によって計算された傾斜の度合との
    差とを予め定められた割合で加重平均して、前記2つの
    基本周波数パターン間の誤差値を算出する加重平均手
    段、および 前記加重平均手段によって算出された誤差値を用いて、
    前記パラメータ値記憶手段に記憶されているパラメータ
    群の値を最適化する制御手段を備えた、基本周波数パタ
    ーン推定装置。
JP06192989A 1989-03-13 1989-03-13 基本周波数パターン推定装置 Expired - Fee Related JP3160277B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06192989A JP3160277B2 (ja) 1989-03-13 1989-03-13 基本周波数パターン推定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06192989A JP3160277B2 (ja) 1989-03-13 1989-03-13 基本周波数パターン推定装置

Publications (2)

Publication Number Publication Date
JPH02239294A JPH02239294A (ja) 1990-09-21
JP3160277B2 true JP3160277B2 (ja) 2001-04-25

Family

ID=13185344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06192989A Expired - Fee Related JP3160277B2 (ja) 1989-03-13 1989-03-13 基本周波数パターン推定装置

Country Status (1)

Country Link
JP (1) JP3160277B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6216809B2 (ja) * 2016-01-27 2017-10-18 日本電信電話株式会社 パラメータ調整システム、パラメータ調整方法、プログラム
JP6902485B2 (ja) * 2018-02-20 2021-07-14 日本電信電話株式会社 音声信号解析装置、方法、及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59192293A (ja) * 1983-04-15 1984-10-31 株式会社日立製作所 発声言語のピツチ周波数発生装置
JP2749802B2 (ja) * 1986-04-18 1998-05-13 株式会社リコー 音声合成方式

Also Published As

Publication number Publication date
JPH02239294A (ja) 1990-09-21

Similar Documents

Publication Publication Date Title
US5744742A (en) Parametric signal modeling musical synthesizer
Ding et al. Simultaneous estimation of vocal tract and voice source parameters based on an ARX model
JPS6370900A (ja) デジタル音声符号化および復号方法および装置
JP6035702B2 (ja) 音響処理装置および音響処理方法
Askenfelt et al. From touch to string vibrations. III: String motion and spectra
US6111183A (en) Audio signal synthesis system based on probabilistic estimation of time-varying spectra
JP3160277B2 (ja) 基本周波数パターン推定装置
US5812967A (en) Recursive pitch predictor employing an adaptively determined search window
US20030088417A1 (en) Speech analysis method and speech synthesis system
JPH02106575A (ja) エレベータの位置制御装置の調整方法
JP2600384B2 (ja) 音声合成方法
Laroche et al. Analysis/synthesis of quasi-harmonic sounds by use of the karplus-strong algorithm
JPH08305396A (ja) 音声帯域拡大装置および音声帯域拡大方法
JPH10281925A (ja) 振動試験装置
Yu et al. Determination of vocal-tract shapes from formant frequencies based on perturbation theory and interpolation method
JP3459948B2 (ja) 楽音合成装置
JP3576792B2 (ja) 音声情報処理方法
JP3284634B2 (ja) 規則音声合成装置
JPH10254500A (ja) 補間音色合成方法
JP2749802B2 (ja) 音声合成方式
JPH03253900A (ja) 音声認識装置
JPH01237700A (ja) 基本周波数パターン生成装置
JP3428230B2 (ja) 電子楽器の繰返し波形の形成法及び繰返し波形形成装置
JPS5981697A (ja) 規則による音声合成方法
Zhu et al. A speech analysis-synthesis-editing system based on the ARX speech production model

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees