JPS58158696A - Voice synthesizer - Google Patents

Voice synthesizer

Info

Publication number
JPS58158696A
JPS58158696A JP57041011A JP4101182A JPS58158696A JP S58158696 A JPS58158696 A JP S58158696A JP 57041011 A JP57041011 A JP 57041011A JP 4101182 A JP4101182 A JP 4101182A JP S58158696 A JPS58158696 A JP S58158696A
Authority
JP
Japan
Prior art keywords
parameter
parameters
pitch
data
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57041011A
Other languages
Japanese (ja)
Inventor
稔 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP57041011A priority Critical patent/JPS58158696A/en
Publication of JPS58158696A publication Critical patent/JPS58158696A/en
Pending legal-status Critical Current

Links

Landscapes

  • Reciprocating, Oscillating Or Vibrating Motors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】[Detailed description of the invention]

本発明は、音声信号を適当にリシウリシクして抽出した
特徴パラメータを圧縮してデータ記憶部に記憶させてお
き、データ記憶部から読出され1こ圧縮パラメータに基
いて音声を合成するようにしTこ音声合成装置に関する
ものであり、その目的とするところは各圧縮パラメータ
に対応して複数種の音量あるいは音程が異なる音声を選
択的に再生できる音声合成装置f k提供することにあ
る。 一般に、音声信号を音声周波数よりも高い周波数のサー
Jづリンクパルスにてサンづリンクして音の大小を表す
振巾パラメータ(以下、A)\ラメータと略称する)と
、音の高低すなわち基本周期を表すピッチパラメータ(
以下Pパラメータと略称する)と、音の音色すなわちス
ペクトル分布を表わすスペクトルパラメータ(以下Sパ
ラメータと略称する)とよりなる特徴パラメータを抽出
1〜。 各特徴パラメータをそれぞれ音質に寄与する度合に応じ
Tこじット数に圧縮して圧縮パラメータと1゜てデータ
記憶部に記憶し、データ記憶部から順次読出さlする圧
縮ハラメータにて予め各特徴パラメータを記憶させた再
生用ROMをアクセスし、11生用IL OMから続み
出されTこ特徴パラメータにより酋源を駆前して音声全
再生するようにし1ここのなる音声を再生する場合と同
葎に、各行)iあるいは音程の音声f対応し1こ圧縮ハ
ラシータをデータ記憶部に記憶させておく必要があつ1
こ。し1こがって、周囲の騒音の状態あるいは使用者の
好みに応じた音量あるいは音程で箭声?書生し得るよう
(でするには、各音量あるいは音程の音声に対応1.て
そlぞれ圧縮パラメータをデータ記憶部に記憶させてお
く必要があり、データ記憶部の記憶谷M全必要以上に大
きくしなければなら々いという欠点か矛・つfコ。本発
明pま上記の欠点に鑑みて為さ511コものである。 以下、P/IRcOR型音角合成装置の一実施例につい
て1ン1を;tJいて説明する。PAにCOR型音西合
成万式は第1図に示す」−うVC音声信弓(Vs )を
ガシプリンタパルスにより適当周期(to)でサンプリ
ング(−1”fyう’J ンク大f1. r、:+1′
ンプリ、、Iり1直xt トxt −p)間にある(P
−1)個のサシづリシク11による相関関係を除外し、
The present invention compresses feature parameters extracted by suitably processing an audio signal and stores them in a data storage unit, and synthesizes audio based on the compressed parameters read from the data storage unit. The present invention relates to a speech synthesis device, and its purpose is to provide a speech synthesis device fk that can selectively reproduce a plurality of types of voices with different volumes or pitches corresponding to each compression parameter. In general, the amplitude parameter (hereinafter abbreviated as A) which expresses the magnitude of the sound by linking the audio signal with a siren pulse with a frequency higher than the audio frequency, and the basic Pitch parameter representing the period (
Extracting characteristic parameters consisting of a spectral parameter (hereinafter abbreviated as an S parameter) representing the timbre or spectral distribution of a sound (hereinafter abbreviated as a P parameter). Each feature parameter is compressed into a T number of bits according to the degree of contribution to sound quality, stored in a data storage unit at 1° with the compression parameter, and read out sequentially from the data storage unit. Access the playback ROM in which the parameters are stored, and use the characteristic parameters continued from the IL OM for 11th grade students to advance the source and play back the entire audio. At the same time, it is necessary to store in the data storage unit 1 compressed harashita corresponding to each line i or pitch f.
child. 1. Will the volume or pitch be adjusted according to the surrounding noise condition or the user's preference? In order to be able to read the voice of each volume or pitch, it is necessary to store each compression parameter in the data storage unit, and the memory valley M of the data storage unit is more than necessary. The drawback is that the P/IRcOR type sound angle synthesizer has to be made larger.The present invention has been designed in view of the above drawbacks.Hereinafter, an example of the P/IRcOR type sound angle synthesizer will be described. 1 and 1 will be explained by ;tJ.The COR type sound synthesis system for PA is shown in Figure 1.''--The VC audio signal (Vs) is sampled (-1) at an appropriate period (to) by a gas printer pulse. ``fyu'J nk large f1.r, :+1'
(P) between xt -p)
-1) Excluding the correlation due to the number 11,
X

【とXt−pとの相関関係のみ全抽出し1こPARC
OR係数(部分自己相関係数:以下にパラメータと略称
する)をSパラメータとして音声を合成するものであり
、Kパラメータは音声がほぼ定常状態とみなせる1フレ
ーム(5〜20m sec 、) [おいて、適当周期
(、tO)(約IQQμ5ec)毎に音声はJi+(■
S)のサンブリー、Jり全行ない、隣り合うサンづり、
7り値開の相関係数をに1とし、複数間隔離李t′IT
こサンづり2i夕値間では、その間に侠ま711コサ′
Jラリyグ値による影響を最小2乗誤差による線形予測
によって求め、そオ′1らを差引いてできる相関係数を
に2〜に1oとし1こものである1、このにパラメータ
はKl、に2,1〜3のようにxty(H近い点との部
分自己相関関係を表わす係数にはスペクトル分布に関す
る惰V8Jが豊冨r含才れているが、Ks 、に9 、
KIOのようなK【から遠い点との部分自己相関係数f
はスペクトル分布に関する情報があまり含まItでいな
いので、低次のにパラメータに多数の磁子化ヒツトを削
り当て、高次のにパラメータには少数のt子化ヒツト?
割り当てることによりヒツト数金節減して冗長度金小さ
くするほうが効果的である。 し1こかってPARCOR方式/isパラメータとして
自己相関係数を用いて各係数に同一ピット数全割り当て
るようにした自己相関係数方式に比べて帯域圧縮率かす
ぐれているものである。通常谷A。 P、にパラメータは圧縮されて記憶あるいけ伝送さね、
Aパラメータに対して5ヒツト、Pパラメータに対して
6ピツト、Kパラメータの各係数Kl。 K2・・・Kloに対(2て7 、6 、5 、4 、
4 、4 、8 。 S、S、Sじ・ソト等のようK i&lJり当てる。 以下本発明−・実施例の構成全図示実施例について、p
r 1illに説明する。第3図は本発明に係る音声合
成装置dのづ099図である。同図に示すようにこの音
声合成装置はデータ記憶部(8)を含む制御用IC(A
)と音声合成用IC(点線部A、Bを1余いた部分)と
の2千ツブで構成さj、でおり、両者間でピットシリア
ルにデータの受渡しを行なうように1−2だものである
。音声の特徴パラメータはすべて再生用ROMfll内
に10ピ・υトのデータとして記憶されており、各特徴
パラメータに割り当てられるデータの個数は、その特徴
パラメータが音質に寄与する度合に応じて最適に配分さ
れている。弔4図は再生用ROM ill内に記憶さj
、たA 、 P 、 KIO〜Klの各特徴パラメータ
のデータ個数を示している。 例えばAパラメータの場合10ピツトで表現されるデー
タが32個記録されている。し1こがってAパラメータ
の任意の号−夕とアクセスするときに必要とされる相対
アドレスのピット@ば5ピツトである。この相対アドレ
スは特徴パラメータを必要最小限に圧縮して表現し1こ
ものであるので圧縮パラメータと呼ばn・る。こfl、
[対して再生用ROM Hの内に記憶されている実際の
特徴パラメータは再生パラメータと呼ばlる。上述[7
Tこ所からl:Il4らかなように再生パラメータのピ
ット@けA、 、 P 、KIO〜に1の& Ml”f
ly 7〜ラメータについてすべて共通[10ピツトで
あるが、圧縮パラメータのピット数はA。 P 、 K1o〜に1の各パラメータについて異なるも
のであり、それぞfl、5.6.8,8,8.8,4,
4゜4.5,6+7eツト(合計53ピツト)である。 そのほか予備エリアとして3ビツト分すなわちデータ8
個分が再生用ROM内に確保されている。 かか/)圧縮パラメータは音声信号かほぼ定K状態とみ
なし得る20 rn sea (Iフレーム)ごとに1
組(=53ピット)抽出されるのであるから、d々26
50ピ・ソト/秒で音声信@全記録することかでき、無
音区間やリヒート区間をも考り腋に人ね、ると央1蛸f
(は1600ピット/秒程度で音声信号を記録すること
ができるものである。 このよりにしてデータ記1意都(8)にi己1意されて
いる圧縮パラメータ(すなわち再生用ROMII+の相
対アドレス) V=t +フレームごとに切換回路(1
0)を介してリンクレジスタ(3)にヒツトシリアルに
人力さ旧、るものであるか、このような相対アドレスt
ごけで再生用ROM t++から記憶データを取り出す
ことができないので、イ′Jチツクス筑OMf21の中
に第5図に示すように記憶さねている先頭アドレス全ア
ドレスカラシタ(11)の制御の下に順次取り出して、
上記相対アドレスと加算回路(4)によって加算するこ
とにより再生用ROM toの絶対アドレス(9ヒツト
)を計算し、該絶対アドレスによって再生用1(OM 
fll kアクセスするようにしている。以下再生用R
OM 11)に記憶されている再生ハラメータの読み出
し前作を詳述する。インデックスR01vj [2)に
は圧縮パラメータのピット配分数を3ピツトの2進数で
記憶させており、再生用ROM fllの記憶容量削減
のTこめの共通化ヒツトを1ピット設けており、さらに
再生用i(OM (11円の予備エリアに対応する予備
じ・υトを設けている。圧縮パラメータのヒツト配分@
に関するデータは再生制御回路(圃に送らね、丙生制御
御回路(12)は、該ピット配分数だけシフトクロtリ
ク全りシフレジスタ(3)に送出する。 し1こがってり′Jシフレジスタ3(からは、」二sI
2ヒ・ソト配分に夕に応じて例えばAパラメータの場合
には5ピツト、Pハラメータの場合[に6し・ソト、K
t。 パラメータの場合には3し・υト、1(lパラメータの
場合には7ヒツトという具合に圧縮〕\ラメータ(相対
アトしス)をそf’lそれJJII界回路にシリアルに
送出するものである。す、:、Il)レジスタ(3)は
できるだけ子ツラ面奎責をとらないようにタイナミツク
シフトレジスタで構成されている。まfこインデックス
ROM (21内に記憶さねている各特徴パラメータの
再生用ROM (1)内における先頭アドレスは、パラ
レルシリアル便換回路(13)を介して1じ・リドずつ
順次加算回路(4)に送出されるので、順次1ビツトず
つ加算されて絶対アドレスか計算されるものである。計
算され1こ直列データの絶対アドレスにシリアルパラレ
ル変換装置(14)を介して並列データに変換さね、再
生用ROM (1)全アクセスできるようになっている
。図中(9)はパラメータコード検出回路である。再生
ROM (1)から読み出され1こ特徴パラメータは適
宜音量補正回路(Boa)および音程補正回路(80b
) i介して補間計算回路(5)に入力さjるようKな
っており、音程補正回路(30a)で月、特徴パラメー
タのうちのAパラメータにノ凶当な音駄補正データを加
算もるいは減算して補正Aハラメータを出力し、−万、
背押補正回路(80b)では、Pパラメータに適当な背
押補正データ全加算あるいは減算して補正Pパラメータ
を出力する。なお画補正回路(8(D )(80b)の
具体的構成および動作VJ後述する。 ところで、補正Aパラメータ、顛正Pパラメータ、にノ
\ラメ−タが入力される補1?1]計算回路は、lフレ
ーム毎に更新さね、る特徴パラメータのフレーム間の接
続点(でおける不連続な変化による音声信号の歪み(明
瞭度の低下〕を防止するもので、データ更新のVQVC
′4徴パラメータかスムーズに変化し得るよう【1フレ
ーム内の8点において近似的な直線的補間を行なうよう
にしている。、この補間計算(ロ)路(5)はタイ三−
、/グ制郁回路128)にて制御され、タイミンク制御
回路(28)でtゴ第2図に承すよう。 vClフレーム(20m蹴)中に8個の補間用りり〇’
J り(2,5m sec ) ’!iニー’r生し、
1個の1) り[] ’ツクック25個のパラメータ読
込用Pりロック(100p 1iec )、さらに11
1I!JのPりロック中に221固のピット読込用’r
 9 [1”J り(4,5p st、c)が作成さl
る。84固のDり0ツクのうち、最初のDIVCおいて
データ入力端子(8)からリンクレジスタ(3)にデー
タカ・瞠み込まれる。 各圧縮パラメータA 、 P 、 Lto・・・、K1
は奇数番目のPクロックで順次読み込まれるものであり
、例えばAパラメータばP1区歯の1′6〜rt oの
5個のrりO1υりで読み込ま旧る。偶数番目のPり0
ツクあるいは上記以外の′1゛り0ツクは補lTh1計
I回路(5)、音源ROM +61、デジタルフィルタ
(7)などqノタイ、l:yりとして使用されるもので
ある。上記桶[ml計算回路tel Kよって2.5m
5ecごとに新しい値に更新され1こ各特徴パラメータ
は、それぞれPラッチ(I6)、AKラッチ(23)に
一時的に蓄えられる。1こだし、補間計算に差し当り必
要のないパラメータはすべてAKパラメータスタック(
241に転送してデジタルフィルタ(7)の音声合成用
データとして蓄積する、1Pう・リチ(16) vc 
Jえらlた音声の基本1M期に関するデータすなわちP
パラメータは一致回路07)KてPり0ツク(100μ
5ec)全力ウシトするアドレスカウンタ(1樽出力と
比較され、アドレスカウンタ(18)出力がl″ノ\ラ
メ−タ一致し1ことき一致回路(17)からアドレスカ
ウンタ(18jをリセ・ソトするリセット信q・(VR
)か出力される。しtこかつてアドレスカウンタt1g
j)まI゛パラメータ基い1こ周期でリセットされ、こ
の周期で音源ROM +6+から音源制(財)データが
順次制み出される。この音源制御データにて有声音源(
19)全駆助して基本周期を有する有声音全発生させる
。 例えばPパラメータが1−25」の場合には基本周期が
25X100μ就(4001(Z )の有声音が発生さ
れることになる。なお、上記音源制御1データは原音を
周波数分析して得られる残差波形を再現して音色を忠実
に再生するTこめのデータである。一方、音声に基本周
期がない場合VCは、音源制御回路(20)にて切換回
路(四を駆動1〜、無声音源41)に切り換える。 無声音源[21) i基本周期を持1こないホワイトノ
イズ(白雑音)を発生するものである。次にAハラメー
タおよびにパラメータはVCAを具備しfこデジタルフ
ィルタ(7)に供給さj、音源回路より供給(有声音源
(19)あるいけ無声音源121)から出力)され1こ
信号に振幅の大小およびスjベクトル分布に関する情報
全村は加えることにより音声全再生するものである。な
お、第3図において(25)はアンプ、(z6)はスし
一カ、(271は水品兄振回路であるか、これらは不発
ll′!IJの要旨には直接的には関連しないのでその
詳細々説明に省略する。 以下、音量補正回路(80a)の具体回路構成および動
作について説明する。第6図は音量補正回路(foa 
)の具体回路例を示すもので、図中(81a )(81
b)は大音mt=−ド、標準七−ド、小首鍵七−ドを切
換える七−ド切換信号(VMI)(VM2)を入力する
七−ド切換スイッチ、(Il)〜(■7)はインバータ
回路、(NAI)〜(NA5)ll−1′ナシド回路、
(At)〜(A4)はアンド回路、(Not)〜(NO
s)はノア回路、(El)(E2)はエクスクルージづ
オア回路、(F)は桁上げ+Pリー発生用フリッづフD
・ツブ、(AD)は1しットアクーであり、(3力は補
正用信号発生部、(33)はン短算制(I14]都、(
34)は加減演算Klsである。 い才、再生用ROM(31から読み出さrまた直列デー
タよりなる特徴パラメータは入力端子(IN)[Tりロ
ックに同期して順次入力され、制御)゛樹子(CO)に
はAパラメータが読み出されているときにゝゝ1“とな
る制御クロック(P2)が入力されてしする。クロック
入力端子(CLt)〜(CL4)には第7図に示すよう
なりロック信号(TC+ )〜(TC7)が入力されて
おり、補正用信号発生部(32により同図に示すような
減算中Pり一信号(VD)および補正データra、J 
r6Jに対応する補正信号(Vs)(Va)を発生する
。但し、−上記信号(VD)(Vs )(Vs )は制
御り0ツク(P2)か1“のときのみ発生される。この
ようにして発生され1こ減算+Pり一信号(VD)およ
び補正信号(Vs) (Va )はt−ド切換スイッチ
(81a)(Blb) Kて制御される演算制御部(3
31を介して演算制御入力あるいけ加減算入力データと
して加減演算部(3彎に入力され、1じットアタ−(A
D)では、フリツプフDツづ(杓から出力される桁上げ
士セリ−と、再生用ROM illから読み出された特
徴パラメータのうちのAパラメータと音量補正データと
を加算あるいけ減算し、出力端子(OU′r)に補正A
パラメータが出力される。 t−ド切換スイッチ(31a)C31b)にて人力され
る七−ド切換信号(VMI ) (VM2 )とAパラ
メータの補正データ値△Aとの関係は下表のようになっ
ている。 し1こかつて、データ記憶部(8)の圧縮パラメータに
基いて再生用ROM filから読出さt′lTこAパ
ラメータに上記補正データ値△Aを加減算した補正Aパ
ラメータが油面計算回路(5)に送られ、各モードの音
声が再生さl、ることになる。なお、実施例にあっては
2個の七−ド切換スイッチ(81a)(3tb)全切換
えることにより、2ヒ・シトのt−ド切換信号を発生さ
せ1個の圧縮パラメータに対応1−で4E−ドの音量の
異った音声を再生できるようにしているが、多ピットの
t−ド切換信月°を用いればより多くのt−ドが設定で
へる。ま1こ、Aパラメータの補正データl+i! (
△A)は任意[設定できることtゴ宮うまでもない。 なお、音程補正回路(Bob)の具体的構造および動作
は上記音量補正回路(80a)と全く同様であるので説
明を省略する。但し、制N4子(CO)にばPパラメー
タが読出されているときにゝゝ1“となる制御り0ツク
(P4)が印加される。し1こかって、音程補正回路(
80b)からは音量補正回路(80a)と同様に適当な
音程油止データが加算されTコ低音1−ドの補IEPパ
ラメータ、音程補正データが減算された高音t−ドの補
正Pパラメータあるいは補正しない標準モードのPパラ
メータが遣損的に出力される。 @8図は他の実施例金示すもので、ロ■記ズ施例の音量
補正回路r aoa )および音程補正回路(80b)
の補正用信号発生都喉全プログラマづル0シックアレイ
(PLAt ) (PLA 2 )を用いて形成し、演
算11JIJ m1都(33)および加減演算部(圓を
共用化して音届、音程油止回路(30)としtこもので
ある。図中(DC)は4ヒツトのt−ド切換信号(VM
)を16ピツトの信号に変換するヂコータ、(ps)は
パラレルデータをシリアルデータに変換するp−s変換
器、(Onx)(ω2)は制御端子であり、″jOタラ
マプルロジ・yクアレイ(PIAl)(PLA2)によ
る論理演算を適当に設計することによって前記実施例と
同様の動作を行なわせることができ、補正データ値(△
A)(△P)の設定が容易になるとともに、回路構成が
簡単になる。 なお、音量あるいは音程の補正を制御するための補正コ
ード全データ記憶部に記憶させておくようにし、この補
正コード全コード検出部で検出して七−ド切換信号(V
M)’i発生させるようにしても良い。また、音程を補
正する1T−ドとして音程補正データ値(△P)を+1
あるいは−1に設定し1こ音階用音程補正し一ドを設け
ておき、複数フレームよりなるH−の音階音(1刊、[
−レ」、「ミ」、・・・)を合成する場合において、適
当な周期で音階用音程補正モードのフレームを設けるこ
とにより、音程ずれのない音階音全合成することができ
る。例えば、Pパラメータが「13」の場合に、5フレ
ーム毎に音階用音程補正を一ド(△P−1)を設けるこ
とにより、Pパラメータ「】3」にてd声か合成される
フレームとPパラメータ「12」にて音声が合成される
フ1ノームとか4:lの割合でくり返えさね1、Pパラ
メータr12 、8Jに相当する音階金回(782Hz
)が合成できることになる。なお、上記音階音合成方式
については、既出用(特願昭56−69950号および
特願昭56−69951号)VC詳述されているので、
詳しい説明は省略する。 本発明は上述のように構成されており、ぎ角信号を適当
にサンづりυりして抽出し1こ特徴パラメータを圧縮し
てデータ記憶部に記憶させておき、データ記憶部から読
出され1こ圧縮パラメータに基いて音声を合成するよう
にLfこ音声合成装置において、特徴パラメータのうち
の振巾パラメータに適宜音量補正データを加算あるいに
減算する音量補正回路を設けるとともに、ピッチパラメ
ータに適宜音程補正データを加算あるいは減4する音程
補正回路を設け1こので、データ記憶部に記憶されてい
る各圧、縮パラメータに対応して複M理の音iあるいけ
音(イの異なる音声を合成することかでき、複数種の音
量あるいは音程の異なるg両全選択的に合成できるよう
にしTこにも拘らず、データ記憶部に各音量あるいは音
程の音声に対応する圧縮パラメータをそねぞれ記憶させ
ておく必要がなく、データ記憶部の記憶容量k小びくす
ることかできるという利点がある。
Extract all the correlations between [and Xt-p and 1 piece PARC
Speech is synthesized using the OR coefficient (partial autocorrelation coefficient: hereinafter abbreviated as parameter) as the S parameter, and the K parameter is used for one frame (5 to 20 m sec,) in which the speech can be considered to be in an almost steady state. , the sound is Ji+(■
S)'s sunburi, Jri complete line, adjacent sunzuri,
The correlation coefficient of the 7-value opening is set to 1, and the isolation between multiple values t'IT
Between Kosanzuri 2i evening price, Kyouma 711 Kosa'
The influence of the J-Rari y-g value is determined by linear prediction using the least squares error, and the correlation coefficient obtained by subtracting the values is 1 and the correlation coefficient is 1, and the parameter is Kl. 2, 1 to 3, the coefficients representing the partial autocorrelation with points near xty (H) include the spectral distribution.
Partial autocorrelation coefficient f with points far from K[ such as KIO
Since it does not contain much information about the spectral distribution, a large number of magnetization hits are applied to the low-order parameters, and a small number of magnetization hits are applied to the high-order parameters.
It is more effective to reduce the cost of redundancy by allocating resources. However, this method has a better band compression rate than the autocorrelation coefficient method in which the PARCOR method uses the autocorrelation coefficient as the is parameter and allocates the same number of pits to each coefficient. Normal valley A. The parameters are compressed and stored in P, and then transmitted.
5 hits for the A parameter, 6 pits for the P parameter, and each coefficient Kl of the K parameter. K2... Paired with Klo (2, 7, 6, 5, 4,
4, 4, 8. Assign K i & l J like S, S, Sji, Soto, etc. The following is a description of the entire illustrated embodiments of the present invention--embodiments.
r Ill will explain. FIG. 3 is a 099 diagram of the speech synthesis device d according to the present invention. As shown in the figure, this speech synthesis device includes a control IC (A
) and a voice synthesis IC (dotted line areas A and B with 1 extra), and is composed of 2,000 blocks, and it is a 1-2 block so that data is exchanged between the two in a pit serial manner. be. All audio feature parameters are stored as 10 bits of data in the playback ROM, and the number of data assigned to each feature parameter is optimally distributed according to the degree to which that feature parameter contributes to sound quality. has been done. Funeral diagram 4 is stored in the playback ROM ill.
, A, P, KIO to Kl. For example, in the case of the A parameter, 32 pieces of data expressed by 10 pits are recorded. Therefore, there are five relative address pits required when accessing any number of A parameters. This relative address compresses and expresses the feature parameter to the necessary minimum and is called a compressed parameter because it is one piece. This fl,
[On the other hand, the actual characteristic parameters stored in the playback ROM H are called playback parameters. Above [7
From here, set the playback parameter pit @ to A, , P, KIO ~ to 1&Ml”f
ly 7~ All parameters are common [10 pits, but the number of pits in the compression parameter is A. P, K1o~ are different for each parameter of 1, fl, 5.6.8, 8, 8.8, 4, respectively.
4°4.5,6+7e points (53 pits in total). In addition, there is a reserve area for 3 bits, that is, data 8.
A portion for each is reserved in the playback ROM. The compression parameters are 1 for every 20 rn sea (I frames), which can be considered as an almost constant K state.
Since pairs (=53 pits) are extracted, d26
It is possible to record all voice messages at 50 ps/sec, and it is also possible to record silent sections and reheat sections.
(is capable of recording an audio signal at approximately 1600 pits/second.) Based on this, the compression parameters (i.e., the relative address of the playback ROM II+) specified in data record 1 (8) ) V=t + switching circuit for each frame (1
0) to the link register (3) via a relative address t like this.
Since it is not possible to retrieve the stored data from the playback ROM t++ due to the cracks, the control of the first address full address calculator (11) is stored in the memory card OMf21 as shown in Figure 5. Take it out one by one from below,
By adding the relative address and the addition circuit (4), the absolute address (9 hits) of the reproduction ROM to is calculated, and the absolute address is used to calculate the absolute address of the reproduction ROM
I'm trying to access it from file to file. R for reproduction below
The previous readout of the playback harameter stored in the OM 11) will be described in detail. The index R01vj [2] stores the number of pits allocated for compression parameters as a 3-pit binary number, and has 1 pit for commonization of T to reduce the storage capacity of the playback ROM full. i(OM (A reserve reserve corresponding to the reserve area of 11 yen is provided. Hit distribution of compression parameters @
The data regarding the regeneration control circuit (12) is not sent to the field, but the reproduction control circuit (12) sends all the shift clocks corresponding to the number of pit allocation to the shift register (3). 3 (from, “2sI
For example, in the case of A parameter, it is 5 pits, and in the case of P parameter, it is 6 pits, K.
t. In the case of a parameter, it is compressed to 3, υ, 1 (in the case of an l parameter, it is compressed to 7), and the parameter (relative attribution) is sent serially to the JJII world circuit. Yes, :, Il) The register (3) is constructed of a dynamic shift register so as to minimize the burden on children. The leading address in the ROM (1) for reproducing each characteristic parameter stored in the mafko index ROM (21) is sequentially added by 1 and 1 through the parallel/serial switching circuit (13). 4), the absolute address is calculated by sequentially adding one bit at a time.The calculated one bit is converted into an absolute address of the serial data and converted into parallel data via the serial/parallel converter (14). The playback ROM (1) can be fully accessed. (9) in the figure is a parameter code detection circuit. This characteristic parameter is read from the playback ROM (1) and is sent to the volume correction circuit (Boa) as appropriate. ) and pitch correction circuit (80b
) K is inputted to the interpolation calculation circuit (5) via I, and the pitch correction circuit (30a) adds unreasonable pitch correction data to the A parameter of the feature parameters. is subtracted and outputs the corrected A harammeter, -10,000,
The back press correction circuit (80b) adds or subtracts appropriate back press correction data to the P parameter and outputs a corrected P parameter. The specific configuration and operation of the image correction circuit (8(D) (80b) will be described later).By the way, the compensation 1?1] calculation circuit in which the correction A parameter, correction P parameter, and the parameter are input. is updated every frame to prevent audio signal distortion (decrease in intelligibility) due to discontinuous changes at connection points between frames of feature parameters.
Approximate linear interpolation is performed at 8 points within one frame so that the 4-character parameters can change smoothly. , this interpolation calculation (b) path (5) is
, and a timing control circuit (28), and a timing control circuit (28) as shown in FIG. 8 interpolation marks during vCl frame (20m kick)
J Ri (2,5m sec)'! i knee'r live,
1) P lock for reading 25 parameters (100p 1iec), and 11
1I! 'r for reading the pit of 221 hard during J's P lock
9 [1”J ri (4,5 p st, c) was created l
Ru. In the first DIVC of the 84-wire D/O check, data is transferred from the data input terminal (8) to the link register (3). Each compression parameter A, P, Lto..., K1
are read sequentially at odd-numbered P clocks, and for example, the A parameter is read at five intervals from 1'6 to rto of the P1 section tooth. Even numbered Pri0
The '1' and '0' blocks other than those mentioned above are used as q-tie and l:y-tie, such as the complementary lTh1 total I circuit (5), the sound source ROM +61, and the digital filter (7). The above bucket [ml calculation circuit tel K is 2.5m]
Each characteristic parameter, which is updated to a new value every 5 ec, is temporarily stored in the P latch (I6) and the AK latch (23), respectively. All parameters that are not needed for the time being are stored in the AK parameter stack (
241 and stored as voice synthesis data for the digital filter (7).
Data regarding the basic 1M period of J.E.L.A.T. voice, that is, P
The parameters are matching circuit 07) K and P 0 (100 μ
5ec) The address counter (18j) is reset to full power and is compared with the output of 1 barrel, and when the output of the address counter (18) matches the l'' parameter, the match circuit (17) resets and resets the address counter (18j). Shinq・(VR
) is output. Address counter t1g
j) The I' parameter is reset every cycle, and sound source system data is sequentially generated from the sound source ROM +6+ at this cycle. With this sound source control data, the voiced sound source (
19) All voiced sounds having a fundamental period are generated with full assistance. For example, if the P parameter is 1-25, a voiced sound with a fundamental period of 25x100μ (4001 (Z)) will be generated.The above sound source control 1 data is the residual sound obtained by frequency analysis of the original sound. This data is used to faithfully reproduce the tone by reproducing the difference waveform.On the other hand, when the voice does not have a fundamental period, the VC is controlled by the sound source control circuit (20). 41). Unvoiced sound source [21] This source generates white noise with i fundamental period and less than 1. Next, the A-harameter and parameters are supplied to a digital filter (7) equipped with a VCA, supplied from a sound source circuit (outputted from a voiced sound source (19) or an unvoiced sound source 121), and then converted into a signal with an amplitude of By adding information regarding the size and Sj vector distribution, the entire audio is reproduced. In addition, in Fig. 3, (25) is an amplifier, (z6) is a switch, and (271 is a Mizuhina oscillator circuit), but these are not directly related to the gist of the failure ll'!IJ. Therefore, detailed explanation thereof will be omitted.The specific circuit configuration and operation of the volume correction circuit (80a) will be explained below.
) in the figure, (81a) (81
b) is a seventh-key changeover switch (Il) to (■7 ) is an inverter circuit, (NAI) ~ (NA5)ll-1' nacido circuit,
(At) to (A4) are AND circuits, (Not) to (NO
s) is a NOR circuit, (El) (E2) is an exclusive OR circuit, (F) is a flip D for carry + P Lee generation.
・Tsubu, (AD) is 1 point, (3 forces are the correction signal generator, (33) is short arithmetic system (I14), (
34) is the addition/subtraction operation Kls. In addition, characteristic parameters consisting of serial data are read from the playback ROM (31) and are input sequentially to the input terminal (IN) in synchronization with the T lock, and A parameters are read to the tree (CO). The control clock (P2) that becomes "1" is input when the clock is in the state of 1.The clock input terminals (CLt) to (CL4) receive lock signals (TC+) to (TC7) as shown in FIG. ) is input, and the correction signal generator (32) generates the subtraction signal (VD) and correction data ra, J as shown in the figure.
A correction signal (Vs) (Va) corresponding to r6J is generated. However, - the above signal (VD) (Vs) (Vs) is generated only when the control signal is 0 (P2) or 1.It is generated in this way and the signal (VD) and correction are The signal (Vs) (Va) is controlled by the arithmetic control section (3) controlled by the t-mode changeover switch (81a) (Blb).
31, it is input to the addition/subtraction calculation section (3) as an arithmetic control input or addition/subtraction input data,
In D), the carry operator series output from the flip-flop is added or subtracted from the A parameter of the characteristic parameters read from the playback ROM ill and the volume correction data, and the result is output. Correction A to terminal (OU'r)
Parameters are output. The relationship between the 7-mode switching signal (VMI) (VM2) manually input by the t-mode switching switch (31a) (C31b) and the correction data value ΔA of the A parameter is as shown in the table below. The correction A parameter obtained by adding or subtracting the correction data value △A to the t'lTkoA parameter read from the reproduction ROM file based on the compression parameter of the data storage section (8) is calculated by the oil level calculation circuit (5). ), and the audio of each mode will be played. In addition, in the embodiment, by fully switching the two 7-mode changeover switches (81a) (3tb), a 2-hi-sight t-mode switching signal is generated, which corresponds to one compression parameter. Although it is possible to reproduce 4E-do sounds with different volumes, if a multi-pit t-do switching signal is used, more t-dos can be set. Well, A parameter correction data l+i! (
△A) is optional (it goes without saying that it can be set). Note that the specific structure and operation of the pitch correction circuit (Bob) are exactly the same as those of the volume correction circuit (80a), so a description thereof will be omitted. However, when the P parameter is read out to the control N4 (CO), a control voltage (P4) that becomes "1" is applied.
Similar to the volume correction circuit (80a), from 80b), suitable pitch oil stop data is added to supplementary IEP parameters for T-co bass 1-C, and correction P parameters or corrections for treble t-C from which pitch correction data is subtracted. The standard mode P parameters that are not used are outputted as a waste. Figure @8 shows another embodiment, including the volume correction circuit (raoa) and the pitch correction circuit (80b) of the embodiment described in B.
The signal generation for correction is formed using a full programmer zero thick array (PLAt) (PLA 2), and the calculation 11JIJ m1 capital (33) and addition/subtraction calculation section (circle is shared to achieve sound delivery, pitch stoppage, etc.). The circuit (30) is composed of the circuit (30). In the figure (DC) is the 4-bit switching signal (VM
) to a 16-pit signal, (ps) is a p-s converter that converts parallel data to serial data, (Onx) (ω2) is a control terminal, By appropriately designing the logical operation by (PLA2), it is possible to perform the same operation as in the above embodiment, and the correction data value (△
A) Setting of (ΔP) becomes easier and the circuit configuration becomes simpler. Note that a correction code for controlling volume or pitch correction is stored in the total data storage section, and this correction code is detected by the total code detection section and output as a 7-key switching signal (V
M) 'i may be generated. In addition, the pitch correction data value (△P) is +1 as 1T-do to correct the pitch.
Alternatively, set it to -1, correct the pitch for the 1-ko scale, and set the 1-do.
-), "Mi", . . . ), by providing a frame in the scale interval correction mode at an appropriate period, it is possible to completely synthesize scale tones without pitch deviation. For example, when the P parameter is "13", by setting the pitch correction for the scale by 1 do (△P-1) every 5 frames, the frame where the d voice is synthesized with the P parameter "]3" and The sound is synthesized with the P parameter "12", such as the f1 gnome, which is repeated at a ratio of 4:1, the P parameter r12, and the scale golden times (782 Hz) corresponding to 8J.
) can be synthesized. The above-mentioned scale sound synthesis method has been described in detail in the previously published VC (Japanese Patent Application No. 56-69950 and 1987-69951).
Detailed explanation will be omitted. The present invention is configured as described above, and the gear angle signal is appropriately sampled and extracted, one feature parameter is compressed and stored in the data storage section, and one is read out from the data storage section. In order to synthesize speech based on this compression parameter, the Lf speech synthesis device is provided with a volume correction circuit that adds or subtracts volume correction data as appropriate to the amplitude parameter among the characteristic parameters, and also adds or subtracts volume correction data as appropriate to the pitch parameter. A pitch correction circuit that adds or subtracts pitch correction data is provided 1. This allows the pitch correction circuit to add or subtract pitch correction data. Although it is possible to selectively synthesize multiple types of sounds with different volumes or pitches, compression parameters corresponding to each volume or pitch are stored in the data storage unit. This has the advantage that it is not necessary to store the information in advance, and the storage capacity of the data storage section can be reduced.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明−夾雁例の音声合成方式の原理説明図、
@2図は同上の動作呪り1図、弔3商は向上のづロック
回路図、第4図および第5図はそれぞれ同上の再生用i
t (J M、イシケツクスROMの構成を示す図、第
6図は向上の要部具体回路図、′粥7図は同上の動作説
明図、第8図は他の央厖例の要部具体回路図である。 (1)は再生用ILOM、(8)リデータ記何部、t1
9J ull U音源、(30a)ll−1:音量補正
回路、(3Qb) (1−1音程補正回路である。
FIG. 1 is an explanatory diagram of the principle of the speech synthesis method according to the present invention,
@Figure 2 is the same operation curse 1 diagram, the 3rd quotient is the improvement lock circuit diagram, and Figures 4 and 5 are the same as above for reproduction.
t (J M, Diagram showing the configuration of Ishiketsu ROM, Figure 6 is a specific circuit diagram of the main part of the improvement, Figure 7 is a diagram explaining the operation of the same as above, Figure 8 is a specific circuit of the main part of another example The figure is: (1) ILOM for reproduction, (8) redata storage section, t1
9J ull U sound source, (30a) ll-1: volume correction circuit, (3Qb) (1-1 pitch correction circuit).

Claims (1)

【特許請求の範囲】[Claims] (1)音声信号を音声周波数よりも高い周波数のサンづ
リンクパルスにてサシづリンクして振巾パラメータフピ
ツチパラメータおよびスペクトルパラメータよりなる特
徴パラメータを抽出し、各特徴パラメータをそれぞれ音
質に寄与する度合に応じTこピット敬に圧縮して圧縮パ
ラメータとしてデータ記憶部に記録し、データ記憶部か
ら順次読出される圧縮パラメータにて予め各特徴パラメ
ータを記憶させtこ再生用ROM1アクセスし、再生用
ROMから読み出された特徴パラメータにより音源を駆
動して音声を再生するようにし1こ音声合成装置におい
て、上記再生用ROMから読出された特徴パラメータの
うち、振巾パラメータに適宜音量補正データを加算ある
いは減算する音量補正回路を設けるとともにピッチパラ
メータに適宜音程補正データを加算あるいけ減算する音
程補正回路を設け、音量補正回路および音程補正回路か
ら出力される補正振巾パラメータおよび補正ピッチパラ
メータに基いて音声を再生するようにして成ることを特
徴とする音声合成装置f 。
(1) Link the audio signal using a link pulse with a frequency higher than the audio frequency to extract feature parameters consisting of amplitude parameters, pitch parameters, and spectrum parameters, and each feature parameter contributes to sound quality. According to the degree of compression, the compression parameters are recorded in the data storage section as compression parameters, and each characteristic parameter is stored in advance using the compression parameters read out sequentially from the data storage section. A sound source is driven to reproduce the sound using the characteristic parameters read from the ROM, and in the single voice synthesizer, appropriate volume correction data is added to the amplitude parameter among the characteristic parameters read from the reproduction ROM. Alternatively, a volume correction circuit for subtracting is provided, and a pitch correction circuit is provided for adding or subtracting pitch correction data as appropriate from the pitch parameter, and based on the corrected amplitude parameter and corrected pitch parameter output from the volume correction circuit and the pitch correction circuit. A speech synthesis device f characterized in that it is configured to reproduce speech.
JP57041011A 1982-03-15 1982-03-15 Voice synthesizer Pending JPS58158696A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57041011A JPS58158696A (en) 1982-03-15 1982-03-15 Voice synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57041011A JPS58158696A (en) 1982-03-15 1982-03-15 Voice synthesizer

Publications (1)

Publication Number Publication Date
JPS58158696A true JPS58158696A (en) 1983-09-20

Family

ID=12596447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57041011A Pending JPS58158696A (en) 1982-03-15 1982-03-15 Voice synthesizer

Country Status (1)

Country Link
JP (1) JPS58158696A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56143498A (en) * 1980-04-10 1981-11-09 Casio Computer Co Ltd Voice synthesizer
JPS56150799A (en) * 1980-04-24 1981-11-21 Casio Computer Co Ltd Voice synthesizer
JPS5740299A (en) * 1980-08-22 1982-03-05 Nippon Denso Co Automotive voice informing method and device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56143498A (en) * 1980-04-10 1981-11-09 Casio Computer Co Ltd Voice synthesizer
JPS56150799A (en) * 1980-04-24 1981-11-21 Casio Computer Co Ltd Voice synthesizer
JPS5740299A (en) * 1980-08-22 1982-03-05 Nippon Denso Co Automotive voice informing method and device

Similar Documents

Publication Publication Date Title
TW460835B (en) Karaoke system and contents storage medium therefor
JPS58158696A (en) Voice synthesizer
JP2797644B2 (en) Karaoke device with vocalization function
JPS5842478B2 (en) Noise removal device for electronic musical instruments
JPS6040633B2 (en) Speech synthesizer with silent plosive sound source
JPS60192993A (en) Musical sound generator by inputting voice
JPS6040635B2 (en) speech synthesizer
JPS59116696A (en) Electronic musical instrument
JPH0142000B2 (en)
JPS5865500A (en) Voice synthesizer
JPS6040636B2 (en) speech synthesizer
JPS58158697A (en) Voice synthesizer
JPS6036600B2 (en) speech synthesizer
JPH0141999B2 (en)
JP3755385B2 (en) Sound source device and recording medium readable by sound source device
JPS608520B2 (en) Speech synthesis device for melody sound synthesis
Zayniddinovich THEORETICAL BASIS OF THE USE OF COMPUTER PROGRAMS IN TEACHING (ON THE EXAMPLE OF THE SCIENCE OF MUSIC CULTURE)
JPS59176782A (en) Digital sound apparatus
JPS6036597B2 (en) speech synthesizer
JPH0325800B2 (en)
JPH0713037Y2 (en) Electronic piano sound source circuit
JP2712199B2 (en) Electronic musical instrument
JPH08123421A (en) Musical sound signal synthesizing device
JP2900077B2 (en) Waveform recording / playback method and waveform playback device
JPS6040634B2 (en) Speech synthesis device with variable frame length