JPH01134400A - 残差駆動型音声合成器のピッチ周波数制御方式 - Google Patents

残差駆動型音声合成器のピッチ周波数制御方式

Info

Publication number
JPH01134400A
JPH01134400A JP29180987A JP29180987A JPH01134400A JP H01134400 A JPH01134400 A JP H01134400A JP 29180987 A JP29180987 A JP 29180987A JP 29180987 A JP29180987 A JP 29180987A JP H01134400 A JPH01134400 A JP H01134400A
Authority
JP
Japan
Prior art keywords
pitch
period
residual
prediction
prediction residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP29180987A
Other languages
English (en)
Inventor
Toshiro Shibanuma
敏郎 柴沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP29180987A priority Critical patent/JPH01134400A/ja
Publication of JPH01134400A publication Critical patent/JPH01134400A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔1既   要〕 所望の音韻情報を含む予測係数の組を用いて構成したデ
ィジタル合成フィルタに、有声音の代表的なピッチ区間
の予測残差セットを所望のピ・ノチ周期の間隔で並べて
作成した再生予測残差を音源信号として入力して、音声
合成を行う残差駆動型音声合成器におけるピッチ周期(
ピッチ周波数)の制御方式に関し、 サンプリング周期を変更することなく正確なピッチ周期
を有する再生予測残差を得ることを目的とし、 与えられたピッチ周期に対応する仮想的な位置に前記予
測残差セットの各振幅値を配置し、各サンプル点におけ
る振幅値を前記予測残差セ・ノドの各振幅値を補間して
求めることにより前記再生予測残差を作成するように構
成する。
〔産業上の利用分野〕
本発明は、所望の音韻情報を含む予測係数の組を用いて
構成したディジタル合成フィルタに、有声音の代表的な
ピッチ区間の予測残差セットを所望のピッチ周期の間隔
で並べて作成した再生予測残差を音源信号として入力し
て、音声合成を行う残差駆動型音声合成器におけるピッ
チ周期(ピッチ周波数)の制御方式に関する。
〔従来の技術〕
音声合成装置は、半導体メモリやディスク記憶装置等に
記憶させた音声情報から音声を合成して発音させる装置
であり、機械的可能部がなく小型化が可能であることか
ら様々な分野への応用が期待されている。
特に音声規則合成装置は、ユーザが記憶装置から音韻情
報を選択し、更にピッチ周波数の情報を選択して与えて
やることにより、任意の音声を発声できる装置である。
これを利用すれば、ピッチ周波数として音階を与えるこ
とにより歌声を合成することも可能であり、作詞・作曲
の支援システムや音声による広告装置等に応用すること
ができる。
第4図に、上記音声処理を行うためのシステム構成を示
す。まず、音声分析部lによってアナログ音声人カフを
分析し、予めその音声情報を記憶装置3に蓄積しておく
。記憶装置3は半導体メモリ又はディスク記憶装置等に
よって実現される。
そして、音声規則合成部2で記憶装置3から音声情報を
任意に読み出して、アナログ音声出力20を合成、発音
する。
音声分析部lは、予め音韻の種類がわかっているアナロ
グ音声人カフを、A/D変換器4によって8112程度
のサンプリング周波数でA/D変換してディジタル音声
入力8に変換した後、線形予測分析部5で線形予測分析
を行う。
線形予測分析は、ディジタル音声入力8を例えば10m
5ec毎(3Kl(zサンプリングではlサンプル= 
1/8000 = 125 μsecなので、10m5
ec = 80サンプル)に分析し、音韻情報であるホ
ルマントを有する音声周波数包絡特性を、10個程度の
予測係数9によってモデル化する。これを、各音韻の発
声時間(例えば0.5秒程度)の分だけ分析することに
よって、「あ」、「い」・・・等の音韻情報を予測係数
9の組として記憶装置3に記憶できる。なお、この時各
予測係数9の組には、それがどの音韻に対応するかとい
う情報を付加しておく。
上記線形予測分析部5において得られた予測係数9を用
いて逆フィルタ6と呼ばれるディジタルフィルタを構成
し、ディジタル音声入力8から上記の音韻情報を除去す
ると、予測残差10と呼ばれるものが得られる。これは
言い換えれば、ディジタル音声入力8から予測係数9に
よって予測される音曲情報を除去した誤差信号であり、
特に有声音区間では人間の声帯振動に帰因する鋭いパル
ス列が得られる。また、線形予測分析でモデル化しきれ
なかった音韻情報の残りの成分が含まれる。
第5図に、ディジタル音声入力8及びそれに対応する予
測残差lOの例を示す。ここで、各パルス間隔T、、’
rz 、  ・・・はピッチ周期と呼ばれて声帯振動の
周期に対応し、声の高さを決定する重要な情報である。
ピッチ周期は成人男性では声が低いため長くなり、女性
や子供では声が高いため短くなる。
ここで音声分析部1の機能を逆に考えると、予測係数9
を用いて音韻情報を再生するディジタルフィルタを構成
し、それに予測残差10を音源信号として入力すれば、
再び音声を合成することができる。
このとき、所望の予測係数9を選択すれば、任意の音韻
の音声を合成することができ、また、第5図のピッチ周
期の間隔’r、 、 T、を所望の間隔に操作すれば、
任意の声の高さで合成できる。この動作を行うのが音声
規則合成部2である。
ここで、第5図の予測残差10は、各パルス毎にその特
性が似ているため、破線16で示すような代表的なピッ
チ区間のみを抽出してやって、予測残差セット16とし
て記憶装置3に記憶する。
次に、第4図の音声規則合成部2では、まず、ピッチ周
波数発生部11で発音させたい所望のピソチ周波数17
を発生する(時間とともに変化する)。そして、予測残
差再生部12では、前記処理により記憶装置3に予め記
憶されている予測残差セット16を選択して読み出し、
与えられたピッチ周波数17に対応するピッチ周期の間
隔で予測残差セット16を並べて、第5図に示すように
所望のピッチ周期の間隔T3 、 Ta 、  ・・・
を有する再生予測残差18を再生する。
この時、ピッチ周期の間隔’rs 、 Ta 、  ・
・・が短くなると、予測残差セット16が隣り合うピッ
チ周期で互いに重なることがあるが、予測残差セット1
6を様々な条件(例えば、男女別)に合わせて複数種用
意し、選択するようにすればよい。
また、一周期分全部ではなく、ピークの近傍のみを保存
するようにしてもよい。
次に、予測係数選択部13において、発音させたい所望
の音韻に対応する予測係数17の組を記憶装置3から選
択して読み出し、ディジタルフィルタである合成フィル
タ14を構成する。そして、このフィルタに前記再生予
測残差18を音源信号として入力して音声合成を行い、
所望の音韻と所望のピッチ周波数を有するディジタル音
声出力19を得る。最後にこの出力は、D/A変換器1
5でD/A変換されアナログ音声出力20として、特に
は図示しない増幅器、スピーカ等を介して発音される。
以上のシステムにおいて、ピッチ周波散発生部11にお
いて音楽の音階に対応するピッチ周波数17を発生して
やれば、歌声を合成するこも可能である。ここで、歌声
の発声等においては、ある音程は数秒程度続くため、第
5図のピッチ周期の間隔T3.T、、  ・・・は実際
は同じ間隔で数千回程度繰り返される。
〔発明が解決しようとする問題点〕
第4図の予測残差再生部12において、予測残差セット
16を与えられたピッチ周波数に対応するピッチ周期で
並べる場合、従来、予測残差セット16の各振幅値は、
離散データであるというディジタル信号処理の制約から
各サンプル点に合うように並べており、従ってピッチ周
期は必ずサンプリング周期の整数倍となっていた。
しかし、例えばピッチ周期=3.8221m5ec (
ピッチ周波数”261.63Hz)のハ音の音階を得よ
うとする場合、サンプリング周期が125μsec  
(8KHzサンプリング)であるならば、第6図(a)
の模式的な予測残差セット16′に示すように隣り合う
パルス間隔が30サンプルでは、ピッチ周期は125μ
sec X30−3.750 m5ecとなり、また、
同じ<31サンプルでは第6図(b)に示すようにピッ
チ周期は125μsec X31=3.875 m5e
cとなってしまい、正確なハ音のピッチ周期を有する再
生予測残差18(第4図)を得ることができなかった。
このため、合成されたアナログ音声出力は音程が正確で
なく、いわゆる音痴な歌声が合成されてしまうという問
題点を有していた。
本発明は上記問題点を解決するために、サンプリング周
期を変更することな(正確なピッチ周期を有する再生予
測残差を得ることのできる残差駆動型音声合成器のピッ
チ周波数制御方式を提供することを目的とする。
〔問題点を解決するための手段〕
第1図に、本発明の基本原理図を示す。本発明は、所望
の音韻情報を含む予測係数の組を用いて構成したディジ
タル合成フィルタに、音源信号として入力するための再
生予測残差を再生するための予測残差再生部24におけ
るピッチ周波数の制御方式である。
今、ピッチ周期23が与えられた場合、ピッチ周期23
をサンプリング周期で割って、そのピッチ周期23に対
応するピッチ間隔PT(小数部を含む)を求める。そし
て、1つ前のピッチ区間の基準となるピッチ位置(X□
−1,+1)に、ピッチ間隔PTを加算して得た位置X
(K+++を基準とする仮想的な位置x(K+I+ 、
x(K+21 *  X (K+31 +x(K+4+
+  ・・・に、予測残差セット21の各振幅値po 
+   1)+ +  pz +  p3+  ・・・
を配置する。
そして、各サンプル点n、n+l、n+−2,n+3.
・・・における振幅値Qo r  qI +  qz 
+q1.・・・を、仮想的な位置X (K11 +  
x(K、Z) *X (K+3) +  X (K、4
1 +  ” ・に配置された予測残差セット21の振
幅値p。、pI+  I)z +  pJ +・・・ 
(X(K、0)の振幅値は0とする)から補間して求め
、このようにして求まった各サンプル点毎の振幅値の列
を再生予測残差22として出力し、ディジタル合成フィ
ルタへの入力とする。
〔作  用〕
以上の構成において、ピッチ周期23がサンプリング周
期の整数倍に一致しなくても、補間によって求めた各サ
ンプル点n、n+l、  ・・・の振幅値q。、qI、
・・・の集合により、真のピッチ周期23に対応する仮
想的な位置X。、1.。
x(K、り+  ・・・に、予測残差セラ1−21の各
振幅値 po+  p++  ・・・を配置したのと近
似的に等価な再生予測残差22を得ることができる。
〔実  施  例〕
以下、本発明の実施例につき詳細に説明を行う。
本発明の対象とするシステム構成は第4図と全く同様で
あり、本発明は、第4図の予測残差再生部12における
ピッチ周波数の制御方式に関するものである。
第2図は、本発明によるピッチ周波数制御方式を示した
図である。この図では説明を簡単にするために、第4図
又は第5図の予測残差セット16を、模式的に5つの振
幅値の集合(po、p+。
pz、  po、  p4’j として表す。
今、第4図のピッチ周波数発生部IIから与えられるピ
ッチ周波数17をfp、Hz、サンプリング周波数をf
s、Hzとすれば、ピッチ周期のサンプル数、すなわち
ピッチ間隔αは、α=fs/fpサンプルとなる。ただ
し、αは小数点以下まである実数である。
ここで、ピッチ間隔αが複数ピッチ分繰り返すとし、各
ピッチ区間で予測残差セット16が配置される基準とな
る仮想的なサンプル位置を、小数部も含めてα、、(n
=o、l、2.  ・・・)とする。従って、1つ前の
ピッチ区間の基準仮想位置α7−1にピッチ間隔αを加
算した位置が、現在のピッチ区間の基準仮想位置α9で
ある。
この場合、基準仮想位置α7を整数部A1と小数部B。
で表すと、 αn =An +3.          ・−・(t
)となる。本発明によるピッチ周波数制御方式は、上記
基準仮想位置α1を基準とする各仮想位置α7+1、α
、+2、α1+3、α7+4に、予測残差セット16の
各振幅値1)o 、I)I % pz、p、を配置した
場合に、近似的にそれと等価な信号を前記(1)式の整
数部へ〇を基準とする各サンプル点An 、Ar+ +
1、A、l+2、A7+3、A7+4で、各振幅値Qo
 、Q+ 、qz 、Q3、q4として求めるものであ
る。
そのために、各サンプル点での振幅値を前後の仮想位置
の予測残差セラ1−16の各振幅値から補間して求める
。第3図に、補間動作を行う場合の関係を示す。今、求
めたいのは各サンプル黒人〇+j (0≦j≦4)にお
ける振幅値q、であり、その値は各サンプル点Afi+
jをはさむ2つの仮想位置αn”Jl、α7+jの、予
測残差セット16の各振幅値pj−1、Pjから直線補
間によって演算される。即ち、 (qj  I’j−+ )  :  (1)j −pj
−+ )= ((A、、+j)−(α、+j−1)):
((αn”j)   (α、+ 3−1 ) )  (
2)であり、前記(1)式を代入してqJに関して整理
すると、 qj =pj   81% (pJ −pJ−I)  
   (3)として演算することができる。これを、j
=0、L、2.3.4について計算すればよい。ただし
、pj−+=0である。
以上のようにして、第2図のピッチ間隔αで予測残差セ
ット16の各振幅値po+・・・p4を配置したのと近
似的に等価な信号を、各サンプル点A6.・・・、AM
 +4における振幅値の集合(qo、・・・、q4)と
して求めることができる。このような動作を、α7の位
置を前記(11式に   。
従ってnの値を順次更新しながら繰り返し、第4図の再
生予測残差18を再生すればよい。
以上の方式により、第6図で問題としたハ音の音階など
のように、ピッチ周期= 3.8221m5ec、即ち
、ピッチ間隔= 30.577533サンプルというよ
うな場合でも、等価的にそのピッチ周期と同等の周期を
有するパルス列を各サンプル点で得ることができる。
上記の実施例は、音声の規則合成を行う第4図のような
システムに対するものであるが、−船釣な音声分析・合
成システムに対する合成側での予測残差の再生のための
ピッチ制御にも応用することができる。
〔発明の効果〕
本発明によれば、ピッチ周期がサンプリング周期の整数
倍に一致しなくても、そのピッチ周期と等価な周期を有
する再生予測残差のパルス列を、各サンプル点で得るこ
とができる。
これにより、特に歌声の合成などのように、正確なピッ
チ周期を必要とする場合の合成音声の音質を、向上させ
ることが可能となる。
【図面の簡単な説明】
第1図は、本発明の基本原理図、 第2図は、本発明によるピッチ周波数制御方式を示した
図、 第3図は、補間動作の説明図、 第4図は、音声処理システムの構成図、第5図は、ディ
ジタル音声入力、予測残差と再生予測残差の波形図、 第6図fa)、(b)は従来列の問題点の説明図である
。 21・・・予測残差セット、 22・・・再生予測残差、 23・・・ピッチ周期、 24・・・予測残差再生部、 po、pr 、  pz  ・・・振幅値、Qo + 
 q+ +  Q2  ・・・振幅値、X (K++1
1+ X (k++1+ X (klZl 、・・・仮
想位置、n、n+1.fi+2.  ・・・サンプル点
。 ネ南゛間動イ乍の言えす1図 第3図 16″予;則残°差セット            1
6″予渭’J FS’笈1.ト16′予唄・j浅見セッ
ト            161予須・1バ差七ツト
ピ1.7子周期の間隔カ\゛゛31サンフ゛ルの場合・ (b) 従来介・l 、 1%”l慧ゑの説明図第6図

Claims (1)

  1. 【特許請求の範囲】 所望の音韻情報を含む予測係数の組を用いて構成したデ
    ィジタル合成フィルタに、有声音の代表的なピッチ区間
    の予測残差セットを所望のピッチ周期の間隔で並べて作
    成した再生予測残差を音源信号として入力して音声合成
    を行う残差駆動型音声合成器において、 与えられたピッチ周期(23)に対応する仮想的な位置
    (x_(_K_,_0_)、x_(_K_,_1_)、
    ・・・)に前記予測残差セット(21)の各振幅値(p
    _0、p_1、・・・)を配置し、各サンプル点(n、
    n+1、・・・)における振幅値(q_0、q_1、・
    ・・)を前記予測残差セット(21)の各振幅値(p_
    0、p_1、・・・)から補間して求めることにより前
    記再生予測残差(22)を作成することを特徴とする残
    差駆動型音声合成器のピッチ周波数制御方式。
JP29180987A 1987-11-20 1987-11-20 残差駆動型音声合成器のピッチ周波数制御方式 Pending JPH01134400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29180987A JPH01134400A (ja) 1987-11-20 1987-11-20 残差駆動型音声合成器のピッチ周波数制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29180987A JPH01134400A (ja) 1987-11-20 1987-11-20 残差駆動型音声合成器のピッチ周波数制御方式

Publications (1)

Publication Number Publication Date
JPH01134400A true JPH01134400A (ja) 1989-05-26

Family

ID=17773697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29180987A Pending JPH01134400A (ja) 1987-11-20 1987-11-20 残差駆動型音声合成器のピッチ周波数制御方式

Country Status (1)

Country Link
JP (1) JPH01134400A (ja)

Similar Documents

Publication Publication Date Title
US4435832A (en) Speech synthesizer having speech time stretch and compression functions
WO1997017692A1 (en) Parametric signal modeling musical synthesizer
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
US4542524A (en) Model and filter circuit for modeling an acoustic sound channel, uses of the model, and speech synthesizer applying the model
US5321794A (en) Voice synthesizing apparatus and method and apparatus and method used as part of a voice synthesizing apparatus and method
US4601052A (en) Voice analysis composing method
Dutilleux et al. Time‐segment Processing
JP2600384B2 (ja) 音声合成方法
JPH01134400A (ja) 残差駆動型音声合成器のピッチ周波数制御方式
JP2000099009A (ja) 音響信号の符号化方法
JPS608520B2 (ja) メロデイ音合成兼用の音声合成装置
JPH02153397A (ja) 音声収録装置
JPS5880699A (ja) 音声合成方式
JPH0477320B2 (ja)
JP2560277B2 (ja) 音声合成方式
JPS6036600B2 (ja) 音声合成装置
JP2547532B2 (ja) 音声合成装置
JPH0142000B2 (ja)
JPS5898800A (ja) 音素片編集型音声合成方式
JPS5949599B2 (ja) メロデイ音合成兼用の音声合成装置
JPS5814900A (ja) 音声合成装置
JPS6036597B2 (ja) 音声合成装置
JPS60113299A (ja) 音声合成装置
JPH0664477B2 (ja) 音声合成装置
JPS6040636B2 (ja) 音声合成装置