JPS59168494A - 音声合成方式 - Google Patents

音声合成方式

Info

Publication number
JPS59168494A
JPS59168494A JP58042169A JP4216983A JPS59168494A JP S59168494 A JPS59168494 A JP S59168494A JP 58042169 A JP58042169 A JP 58042169A JP 4216983 A JP4216983 A JP 4216983A JP S59168494 A JPS59168494 A JP S59168494A
Authority
JP
Japan
Prior art keywords
information
pulse
sound source
speech
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58042169A
Other languages
English (en)
Inventor
市川 「あきら」
武田 昌一
久司 西山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58042169A priority Critical patent/JPS59168494A/ja
Publication of JPS59168494A publication Critical patent/JPS59168494A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は音声合成方式に関し、特にいわゆる規則合成に
適用可能な音声合成方式に関するものである。
〔従来技術〕
音声の規則合成においては、/ア/とか/イ/のような
言葉の情報を主に担うスペクトル・エンベロープ情報(
以下、「スペクトル情報」という)と、アクセントやイ
ントネーションのような抑揚を担う音源情報とを、独立
に制御することが必要であシ、生成源方式と呼ばれる合
成方式の一部が適用可能である。
従来、規則合成には、PAR,CO几(partial
Auto Correlation  )方式、L S
 P (、[、ineSpectrum pair )
方式、ホル−q 7ト方式等の諸方式が用いられて来た
。これらの方式においては、前記スペクトル情報として
、PARCOR,係数、LsP係数あるいはホルマント
情報を用い、音源情報としてはインパルスや三角波、雑
音を用いるのが普通でアシ、このため自然さに欠ける機
械的音質になってしまうという問題があった。
この問題を解消するだめには、PARcoR方式やLS
P方式において残差波形を音源に用いることも考えられ
るが、この場合には、取扱う情報量が大幅に増加するこ
と、規則合成に嫡男することが困難になること等の新た
な問題が生ずる。
〔発明の目的〕
本発明は実記事情に鑑みてなされたもので、その目的と
するところは、従来の音声合成方式における上述の如き
問題を解消し、前記残差音源波形(以下、単に「残差波
形」という)の情報を利用しながら、情報量の増加を抑
えて、規則合成に適用可能な、自然な音質を与える音声
合成方式を提供することにある。
〔発明の概要〕
本発明の要点は、スペクトル情報と音源情報とから音声
を合成する音声合成方式において、前記音源情報を複数
のパルス情報から構成し、かつ、該複数のパルス情報を
、各パルスごとに、パルスの相互位置と振幅情報とから
構成した点にある。
以F1 この点につき、図面を用いて詳細に説明する。
第1図はある母音をPARCOR分析したときの残差波
形の一例を示すものである。なお、説明を簡単にするた
め、以下の説明はすべてPARCOR。
方式を用いる例で行うが、前記LSP方式あるいはLP
C(Linear prediction Coeff
icient )方式等の線形予測分析技術を用いる方
式でも全く同様の取扱いが可能である。
第1図から明らかな如く、例えば、残差波形中の振幅の
大きいパルスは、ピッチ周期に同期して、連続して数ピ
ツチ区間にわたり類似した形状のものが繰)返されてい
る。そこで、このような類似した波形をまとめて1つの
代表波形とし、その繰り返しで置換えることにより、平
均的に5〜6波形を1つにまとめてみたところ、聴覚的
には元の波形との音質の差が殆んどわからないことが実
験的に確認された。
更に、1つのピッチ区間内の残差波形を見ると、隣接し
たピッチ区間の波形の対応する部分と類似の形状を示す
、上述の比較的振幅の大きいパルスと、類似度の低い、
雑音的な振幅も相対的に小さいパルスとが混在している
ことがわかる。このような比較的振幅の小さいパルスを
残差波形から除去して行くと、ピッチ区間内の全パルス
の約75チを除いて音声を再合成しても、元の音声と聴
覚的には殆んど区別がつかないことも実験的に確かめら
れている。
本発明は1記2つの手法を併用することにより、残差波
形の情報量を圧縮するようにしたものであシ、以下に、
その具体例を示す。
〔発明の実施例〕
第2図は本発明の一実施例である音声合成装置の概要を
示すブロック図である。図において、lは制#部、2は
合成部、3はデータファイル、4はインタフェース、そ
して5は合成音声出力である。データファイル3中には
、制御部1で作成した制御データが格納されている。本
実施例装置の動作の概要は、制御部1がインタフェース
4を介して与えられた指令に基づいて前記データファ・
fル3中の制御データ?合成部2に送ジ、後述j゛る手
順により音声の規則合成を行い、合成音声出力5を得る
というものである。なお、合成部2はPARCOR方式
の場合を例にとるが、LsP方式。
I、PC方式でも同様の取扱いが可能であることは前述
の通りである。
第3図に音声合成のだめの制御データの構造の一例を示
す。本実施例においては、女性の声を合成することを想
定し、PARCOR係数kを10次までのに1〜JO%
音源波形のパルス数を10個までとし、そのパルス振幅
および位置をそれぞれa1〜”IO+pI””−plo
sまた、制御データの繰返し使用回数Nをまとめて1つ
の制御データとし、時間(り方向に並べた形で前記デー
タファイル3中に格納してあシ、制御部1からの要求に
よシ順次読出すことが可能に構成されている。
第4図は上記合成部2の構成の詳細を示すものである。
図において、21は音声合成フィルタ、22はパルス振
幅aのレジスタ、23はパルス位置pのレジスタ、24
は繰返し使用回数Nのカウンタ、25はPARCOR係
数にのレジスタ、また、26はパルス位置pのカウンタ
、27は音源レジスタを示している。音声合成フィルタ
21は広く知られているものであシ、該音声合成フィル
タ21には、フィルタの係数としてのPA几COR係数
k]〜kro (251)と、フィルタへの入力どして
の音源パルス振幅情報(271)が与′見られる。
上述の如く構成される本実施例装置の動作を以下説明す
る。
合成部2には、前述の如く、データファイル3から読出
される制御データとして、PARCOR係数に1音源パ
ルス振幅a1パルス位置pおよび制御データ繰返し使用
回数Nが与えられる。繰返し使用回数Nのカウンタ24
は、制御間隔のクロック29に同期してデータ使用回数
をモニタし、制御間隔ごとに信号(241)を出力して
t、PARCOR係数レジスタ25の出力(251)と
してPARCOR係数kを音声合成フィルタ21に供給
するとともに、パルス振幅レジスタ22とパルス位置レ
ジスタ23の読出しアドレスをリセットさせる。また、
データ使用回数がNに達した場合には、次の制御データ
を要求する信号(242)を出力する。
パルス位置情報(231)は、レジスタ23から順次パ
ルス位置カウンタ26に供給される。パルス位置カウン
タ26はサンプリングクロック28によシ歩進され、パ
ルス位置情報だけカクントすると信号(261)を出力
して、前記音源パルス振幅情報(271)を音源レジス
タ27から音声合成フィルタ21に入力させるとともに
、次のパルス振幅情報をレジスタ22から音源レジスタ
27にセットさせ(221) 、次のパルス位置情報を
レジスタ23からカウンタ26にセットさせる(231
)。
上述の動作によシ、パルス位置情報piの間隔で音源パ
ルス振幅情報a!を音声合成フィルタ21に供給するこ
とができ、音声を順次合成し出力する(211)ことが
可能となる。
なお、音声を8KHz、8ビツトでA/D変換する場合
を例にとって若干補足説明をしておく。
前記ピッチ周波数は、男性では60〜400Hz。
女性では100〜500Hz程度であるから、1ピッチ
周期はサンプル点数にして、16〜133点程度となる
。前述の如く、75%が除かれた結果、25%程度残っ
た残差パルスの各位置を、先行するパルスからの相対位
置で表わすとすると、最悪の条件として、殆んどすべて
のパルスがピッチ区間の頭部に集中し、最後の1つが区
間の最後のサンプル点に存在する場合でも、ザンプル点
間の差の最大値は100以ドとなるから、8ビツトで表
現することが可能となる。すなわち、約75チが除かれ
、残った25チ程度の数のパルス列で表現された残差波
形は、パルス位置とパルス振幅ノ値ヲ各々8ビット、計
16ビツトで表現しても、原残差波形の情報8KHz、
8ビツトの変換を行これと先に述べた残差波形の類似性
を利用した練成することができる。
このように圧縮した残差音源の情報量は、5〜61(ビ
ット/秒となり、これを、LSP方式等の線形予測分析
技術を用いて圧縮したスペクトル情報量1〜7にビット
/秒と組合わせると、6〜10にビット/秒程度の情報
量となる。これは、従来のPARCOR方式並みの情報
量であや、すなわち、本発明により取扱う情報量を増加
させることなく、音質の良い合成音声を得ることができ
ることになる。また、本発明の方式は、ピッチ周期単位
で、残差波形を取扱うため、音源の制御が可能であり、
規則合成に適した方式と言うことができる。
なお、上記実施例においては、残差波形のパルスの75
96程度を除去する例を示したが、これは50%程度で
も効果がある。また、残ったパルスの位置の表現は、特
定のパルスからの相対位置としても良いことは言うまで
もない。
〔発明の効果〕
以上述べた如く、本発明によれば、スペクトル情報と音
源情報とから音声を合成する音声合成方式において、前
記音源情報を複数のパルス情報から構成し、かつ、該複
数のパルス情報を、各パルスごとにパルスの相互位置と
振幅情報とから構成したので、残差波形の情報を利用し
ながら、情報量の増加を抑えて、規則合成に適用可能な
自然な音質を与える音声合成方式を実現できるという顕
著な効果を奏するものである。
【図面の簡単な説明】
第1図は残差音源波形を説明する図、第2図は本発明の
一実施例である音声合成装置の概要を示すブロック図1
第3図は制御データの構造の一例を示す図、第4図は実
施例の詳細を示す図である。 1・・・制御部、2・・・合成部、3・・・データファ
イル、4・・・インタフェース、5・・・合成音声出力
、21・・・音声合成フィルタ、22・・・パルス振幅
レジスタ、23・・・パルス位置レジスタ、24・・・
繰返し使用回数カウンタ、25・・・PARCOR係数
レジスタ、芽 3 ロ ー−÷を 第 4 図

Claims (1)

  1. 【特許請求の範囲】 1、スペクトル情報と音源情報とから音声を合成する音
    声合成方式において、前記音源情報を複数のパルス情報
    から構成し、かつ、該複数のパルス情報を、各パルスご
    とに、パルスの相互位置と振幅情報とから構成したこと
    を特徴とする音声合成方式。 2、前記音源情報は、同一音源情報を複数区間にわたっ
    て繰返し使用することを特徴とする特許請求の範囲第1
    項記載の音声合成方式〇
JP58042169A 1983-03-16 1983-03-16 音声合成方式 Pending JPS59168494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58042169A JPS59168494A (ja) 1983-03-16 1983-03-16 音声合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58042169A JPS59168494A (ja) 1983-03-16 1983-03-16 音声合成方式

Publications (1)

Publication Number Publication Date
JPS59168494A true JPS59168494A (ja) 1984-09-22

Family

ID=12628464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58042169A Pending JPS59168494A (ja) 1983-03-16 1983-03-16 音声合成方式

Country Status (1)

Country Link
JP (1) JPS59168494A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223800A (ja) * 1987-03-13 1988-09-19 日本電気株式会社 音声符号化・復号化方式とその装置
JPH02281300A (ja) * 1989-04-21 1990-11-16 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置及び音声符号化・復号化装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223800A (ja) * 1987-03-13 1988-09-19 日本電気株式会社 音声符号化・復号化方式とその装置
JPH07101356B2 (ja) * 1987-03-13 1995-11-01 日本電気株式会社 音声符号化・復号化方式とその装置
JPH02281300A (ja) * 1989-04-21 1990-11-16 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置及び音声符号化・復号化装置

Similar Documents

Publication Publication Date Title
DE3041423C1 (de) Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals
JP2782147B2 (ja) 波形編集型音声合成装置
JPH031200A (ja) 規則型音声合成装置
RU2296377C2 (ru) Способ анализа и синтеза речи
JPH0237600B2 (ja)
JP4867076B2 (ja) 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法
JPS59168494A (ja) 音声合成方式
JP4747434B2 (ja) 音声合成方法、音声合成装置、半導体装置及び音声合成プログラム
JPS5888798A (ja) 音声合成方式
JP3081300B2 (ja) 残差駆動型音声合成装置
JPS5880699A (ja) 音声合成方式
JPS5961891A (ja) 残差信号符号化方法
JP3394281B2 (ja) 音声合成方式および規則合成装置
JPS62102294A (ja) 音声符号化方式
JPS6162100A (ja) マルチパルス型符号化復号化装置
JPH0772897A (ja) 音声合成方法および装置
JPS5965897A (ja) 残差信号符号化方法
JPS5965895A (ja) 音声合成方法
JPS63223697A (ja) 音声規則合成用パラメ−タの作成方法
JPS63262699A (ja) 音声分析,合成装置
JPS61259300A (ja) 音声合成方式
JPH01187000A (ja) 音声合成装置
JPS60144799A (ja) 自動通訳装置
JPS58162998A (ja) 音声合成方式
JPS6228800A (ja) 規則音声合成用駆動信号生成方法