JPH0431900A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH0431900A
JPH0431900A JP2137711A JP13771190A JPH0431900A JP H0431900 A JPH0431900 A JP H0431900A JP 2137711 A JP2137711 A JP 2137711A JP 13771190 A JP13771190 A JP 13771190A JP H0431900 A JPH0431900 A JP H0431900A
Authority
JP
Japan
Prior art keywords
pitch
synthesis
waveform
interpolation
parcor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2137711A
Other languages
English (en)
Inventor
Kanji Kunisawa
国澤 寛治
Noboru Uechi
上地 登
Akira Yamamura
山村 彰
Junko Omukai
大向 順子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP2137711A priority Critical patent/JPH0431900A/ja
Publication of JPH0431900A publication Critical patent/JPH0431900A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声応答装置等に用いられる音声合成装置に
関するものである。
[従来の技術] 音声合成方式として例えばPARCOR合成方式がある
。この方式では人間の音声発声機構をモデル化して音声
を情報圧縮しているため、圧m率が高く、大量の音声を
少ない容量の記憶手段で記憶できるので、コストが安価
となり、種々の機器や、商品に広く応用されている。第
2図はPARCOR合成方式により音声の生成モデルの
一例を示しており、このモデルでは線形分離等価回路モ
デルが用いられている。
この第2図に示すモデルについて説明する。この第2図
のモデルは音源部1と、声道調音等価フィルタ2と、出
力部3とから構成されている。尚図中Pはピッチ周期、
V/Llは有声/無声の判定、Aは音源強度、fkil
は偏相関係数を示す。
まず図において音源について考えてみる6有声音に対す
る音源をインパルス源1aからのインパルス列で表す場
合、第j番目のインパルスの位置をp(j)、1フレー
ムの長さをし、第iフレームのピッチの値をP(i)と
すると、 p(i>=p(j−1)+P([p(j−1)/L]+
1)(但し[]はガウス記号、つまり[]の中の値を越
えない最大の整数を示す、) となり、音源波形g(t)は第iフレームの振幅パラメ
ータの値をA(i>とすると、 g(t)=Σδ(p(j))・^([P(j)/L]+
 1)となる。
一方声道調音等価フィルタ2の特性H(ω・t)は第i
フレームのカッパパラメータに対応する周波数特性をK
(ω・t)とすると、 H(ω・t)=K(m・【) (但し、(i−1)・t<t<i4のとき)となる。
第3図は上記音源波形g(t)と、声道調音透過フィル
タ2の時系列関係を示している。
[発明が解決しようとする課1[] ところで従来のPARCOR合成方式では情報圧縮率を
上げるために、フレームシフト長を長くし、その代わり
にフレーム内でパラメータを直線補間するということが
行われるが、調音パラメータであるカッパパラメータが
物理量に対応していないために補間特性が悪く、合成音
声が劣化するという問題があった。琥た補間特性が悪い
ので、規則合成のように各音節を補間によって結合する
必要のある規則合成へ利用されることがなかった。
本発明は上述の問題点に鑑みて為されたもので、その目
的とするところはPARCOR合成方式における補間特
性を改善し、圧縮率が高くて、少ない容量の記憶手段が
使え、しかも品質の高い合成音声が得られる音声合成装
置を捉供するにある。
[課題を解決するための手段] 本発明は上述の目的を達成するために、一対の調音パラ
メータと振幅パラメータからPARCOR合成により1
ピツチ分の波形を生成する手段と、この生成された波形
をピッチパラメータによって指定された周期毎に重畳し
て合成音声波形を出力する手段とを備えたものである。
[作用] 本発明によると、補間は波形上で行われることになるの
で、補間特性が向上し、品質の高いPARCOR合成が
行える。また補間特性が改善できるので、韻律の制御で
きるPARCOR合成の規則合成への利用を可能とする
[実施例] 以下本発明を実施例により説明する。
第1図は本発明の実施例の回路構成を示しており、PA
RCOR合成部4と、前フレームの1ピツチ波形を記憶
する1ピツチ波形記憶部5と、PARCOR合成部4か
らの現フレームの1ピツチ波形を上記1ピツチ波形記憶
部5に記憶している前フレームの1ピツチ波形を用いて
補間を行う福間計算部6と、更にこの補間された1ピツ
チ分の波形をピッチパラメータによって指定された周期
で記憶する1ピツチ波形記憶部6と、この1ピツチ波形
記憶部6で記憶した1ピツチ波形をピッチ間隔毎に並べ
て重畳するための加算器7及び遅延器8とから構成され
ている。
而してまずPARCOR合成部4ではカッパパラメータ
及び振幅パラメータを用い、第iフレームについて^(
i)の振幅を持つインパルスを第iフレームに与えられ
るカッパパラメータによって構成されるフィルタ(図示
せず 尚特性はK(ω、i))に通して得られるlピッ
チ分の波形(f(t、i))を求める。この1ピツチ分
の波形を前フレームの1ピツチ分の波形に基づいて補間
を行って、1ピツチ波形記憶部6に記憶し、更にピッチ
パラメータに基づいて加算器8及び遅延器9によりピッ
チ間隔毎に並べて重量して合成音声を得るのである。
即ち、出力波形を5(t)とすると 5(t)=Σf(t−p(j)、[p(j)A]忙Dり
Σ^([p(j)/Ll”l)・k(t−p(j)、[
p(j)/Ll÷1)(但しk(t、i)はK(m、i
)の逆フーリエ変換)となる。
次に内部補間について考えてみる。まず1フレームをM
個に分割して内部補間するとすると、ここで扱っていた
フレームについてM個ずつ合わせたものを新たに1フレ
ームとすると考えなおせば良く、従って第iフレームと
第i+Mフレームにパラメータが与えられ、その間を補
間すると考えればよい。従って、本発明ではスペクトル
上で補間を行うことになる。つまり第i+にフレームの
1ピツチ分の波形f(t、i+k)は、f(t、i+k
)・(k−f(t、i)”(N−k)・f (t 、 
i 4M))/Nとなる。
ここでf(t、i)のフーリエ変化をF(ω、i)とす
ると、上式より、 F(a+、i令1c)=(k−F(ω 、i)+(M−
k)・F(m、i+M))/Mとなる。つまり本発明に
よれば周波数上で直線補間したことになって、良好な補
間特性が得られることになる。
尚上記の説明では音声が全て有声音からなることを前提
としているが、無声音の場合も同様の処理を行う、但し
無声音から有声音への遷移部や有声音から無声音への遷
移部ではスペクトルは連続的に変化していないと考えら
れるので、無声フレームと無声フレームの直前の有声フ
レームでは内部補間を行わない。
また上記各パラメータを求める方法については、カッパ
パラメータとピッチパラメータは従来の方法で、振幅パ
ラメータはAbs(合成による分析)手法を用いて求め
れば良く、またAbs手法を簡略化して、まず全ての振
幅パラメータの値を1にして合成を行い、この合成音声
の第iフレームのパワー(パワー計算時には隣接するフ
レーム間で連続的になるようにシフト長よりも長い窓を
かけておこなう)をPs(i)、原音声の第iフレーム
のパワーをPo(i)とすると、 ^(i)=flτの/、「匹て口 として求めることもできる。
[発明の効果] 本発明は一対の調音パラメータと振幅パラメータからP
ARCOR合成により1ピツチ分の波形を生成する手段
と、この生成された波形をピッチパラメータによって指
定された周期毎に重畳したものを合成音声波形として出
力する手段とを備えたので、補間をスペクトル上で行わ
れることになるので、補間特性が向上し、品質の高いP
ARCOR合成が行え、また補間特性が改善できるので
、韻律の制御できるPARCOR合成の規則合成への利
用が可能となるという効果があり、その上従来のPAR
COR合成方式の回路に僅かの回路を追加するだけで良
いので、品質の高い音声合成が安価な回路構成で実現で
きるという効果がある。
【図面の簡単な説明】
第1図は本発明の実施例の回路構成図、第2図はPAR
COR合成方式における音声の生成モデルの構成図、第
3図は音声波形と声道調音フィルタの時系列を示す説明
図であり、4はPARCOR合成部、5は1ピツチ波形
記憶部、6は補間計算部、7は1ピツチ波形記憶部、8
は加算器、9は遅延器である。 代理“人 弁理士 石 1)長 七 1は))A r(COR合成部 5は]ピッチ波形記憶部 8は加算器 第2図

Claims (1)

    【特許請求の範囲】
  1. (1)一対の調音パラメータと振幅パラメータからPA
    RCOR合成により1ピッチ分の波形を生成する手段と
    、この生成された波形をピッチパラメータによって指定
    された周期毎に重畳して合成音声波形を出力する手段と
    を備えたことを特徴とする音声合成装置。
JP2137711A 1990-05-28 1990-05-28 音声合成装置 Pending JPH0431900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2137711A JPH0431900A (ja) 1990-05-28 1990-05-28 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2137711A JPH0431900A (ja) 1990-05-28 1990-05-28 音声合成装置

Publications (1)

Publication Number Publication Date
JPH0431900A true JPH0431900A (ja) 1992-02-04

Family

ID=15205041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2137711A Pending JPH0431900A (ja) 1990-05-28 1990-05-28 音声合成装置

Country Status (1)

Country Link
JP (1) JPH0431900A (ja)

Similar Documents

Publication Publication Date Title
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
US7013270B2 (en) Determining linear predictive coding filter parameters for encoding a voice signal
JPH1097287A (ja) 周期信号変換方法、音変換方法および信号分析方法
WO1990013887A1 (en) Musical signal analyzer and synthesizer
JP2009042716A (ja) 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
JP3430985B2 (ja) 合成音生成装置
JP2000515992A (ja) 言語コーディング
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
US5235670A (en) Multiple impulse excitation speech encoder and decoder
JPS645720B2 (ja)
Bonada et al. Generation of growl-type voice qualities by spectral morphing
JPH08305396A (ja) 音声帯域拡大装置および音声帯域拡大方法
JPH0431900A (ja) 音声合成装置
Hanna et al. Time scale modification of noises using a spectral and statistical model
JPH05158497A (ja) 音声伝送方式
JP2583883B2 (ja) 音声分析装置および音声合成装置
JP2615856B2 (ja) 音声合成方法とその装置
TW322567B (en) Base frequency synchronized linear predicted phonic synthesizer
JP2844672B2 (ja) 声帯声道型音声分析装置
JPS62102294A (ja) 音声符号化方式
KR100310930B1 (ko) 음성합성장치및그방법
JPH01304500A (ja) 音声合成方式とその装置
CN114974271A (zh) 一种基于声道滤波和声门激励的语音重构方法
JPH0468400A (ja) 音声符号化方式