JPH0325800B2 - - Google Patents

Info

Publication number
JPH0325800B2
JPH0325800B2 JP58226003A JP22600383A JPH0325800B2 JP H0325800 B2 JPH0325800 B2 JP H0325800B2 JP 58226003 A JP58226003 A JP 58226003A JP 22600383 A JP22600383 A JP 22600383A JP H0325800 B2 JPH0325800 B2 JP H0325800B2
Authority
JP
Japan
Prior art keywords
parameter
data
parameters
circuit
clock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58226003A
Other languages
English (en)
Other versions
JPS60118900A (ja
Inventor
Minoru Kuroda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP58226003A priority Critical patent/JPS60118900A/ja
Publication of JPS60118900A publication Critical patent/JPS60118900A/ja
Publication of JPH0325800B2 publication Critical patent/JPH0325800B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Reciprocating, Oscillating Or Vibrating Motors (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 〔技術分野〕 本発明は合成された音声の音程や音量のみなら
ず、音声のスペクトル分布についても微妙に補正
できるようにした音声合成装置に関するものであ
つて、音声目覚時計や音声時報装置、音声警報装
置、マツサージ椅子のような各種の電気製品に組
み込まれて音声メツセージの出力を行なうような
用途に使用されるものである。
〔背景技術〕
一般に、音声信号を音声周波数よりも高い周波
数のサンプリングパルスにてサンプリングして音
の大小を表わす振巾パラメータ(以下Aパラメー
タと略称する)と、音の高低すなわち基本周期を
表わすピツチパラメータ(以下Pパラメータと略
称する)と、音の音色すなわちスペクトル分布を
表わすスペクトルパラメータ(以下Kパラメータ
と略称する)とよりなる特徴パラメータを抽出し
各特徴パラメータをそれぞれ温質に寄与する度合
に応じたビツト数に圧縮して圧縮パラメータとし
てデータ記憶部に記憶し、データ記憶部から順次
読出される圧縮パラメータにて予め各特徴パラメ
ータを記憶させた再生用ROMをアクセスし、再
生用ROMから読み出された特徴パラメータによ
り音源を駆動して音声を再生するようにした音声
合成装置において、音量(振巾)あるいは音程
(ピツチが異なる略同一の音声であつても全く異
なる音声を再生する場合と同様に、各音量あるい
は音程の音声に対応した圧縮パラメータをデータ
記憶部に記憶させておく必要があつた。したがつ
て、周囲の騒音の状態あるいは使用者の好みに応
じた音量あるいは音程で音声を再生し得るように
するには、各音量あるいは音程の音声に対応して
それぞれ圧縮パラメータをデータ記憶部に記憶さ
せるおく必要があり、データ記憶部の記憶容量を
必要以上に大きくしなければならないという欠点
があつた。
そこで従来、本発明者は特願昭57−41011号の
特許出願に示すように、再生用ROMから読出さ
れた特徴パラメータのうち、振巾パラメータ適宜
音量補正データを加算あるいは減算する音量補正
回路を設けるとともにピツチパラメータに適宜音
程補正データを加算あるいは減算する音程補正回
路を設け、音量補正回路および音程補正回路から
出力される補正振巾パラメータおよび補正ピツチ
パラメータに基いて音声を再生するようにした音
声合成装置や、特願昭58−4892号の特許出願にい
示すように、1つのパラメータ補正回路を時分割
的に使用して上記音量補正回路と音程補正回路と
を共用化できるようにした音声合成装置などを開
発したものである。
しかしながら、近年英語圏内の国々において開
発されているような規則合成システム、すなわち
単語の綴り字だけからその単語に対応する音声を
規則的に合成しようとするようなシステムを、日
本語においても構成しようとすれば、上述のよう
な音量および音程のみの補正だけでは充分なでは
なく、音声のスペクトル分布の微妙な補正をも行
ない得るようにしなければ、各音節の結合が完全
に滑らかには行なえないという問題がある。そこ
で本発明者は、音声スペクトル分布を決定するパ
ラメータについても微妙な補正を行ない得るよう
に、新たな補正回路を付加することを検討したも
の、である。ところが、音声のスペクトル分布を
表わすKパラメータの情報量は、音声の振巾やピ
ツチを表わすAパラメータやPパラメータの情報
量に比べると格段に多く、すべてのKパラメータ
について微妙な補正を行ない得るようにすること
は著しく困難であつた。
〔発明の目的〕
本発明は上述のような点に鑑みて為されたもの
であり、音声のスペクトル分布を表わすパラメー
タのうち、音質に寄与する度合の大きい部分につ
いてのみ補正を行なうようにして補正回路の構成
を簡単化できるようにした音声合成装置を提供す
ることを目的とするものである。
〔発明の開示〕
(構成) 本発明は、第1図のクレーム対応ブロツク図に
示すように、音声信号を音声周波数よりも高い周
波数のサンプリングパルスにてサンプリングして
抽出させる振巾パラメータA、ピツチパラメータ
PおよびスペクトルパラメータK1〜K10を予めデ
ータ記憶部1に記録し、データ記憶部1から順次
読出される各パラメータにそれぞれ適宜補正デー
タを加算あるいは減算するパラメータ補正回路2
を設け、補正された各パラメータにて、音源3を
駆動して音声を合成するようにした音声合成装置
にいおいて、スペクトルパラメータK1〜K10とし
て音声信号を互いに近接したサンプリング値間の
部分自己相関係数を用い、隣り合うサンプリング
値間の部分自己相関係数を1次係数とし、Nサン
プリング値(Nは自然数)分だけ離れて隣り合う
サンプリング値間の部分自己相関係数を(N+
1)次係数とし、パラメータ補正回路2は(N+
1)個の部分自己相関係数のうち、低次の係数
K1〜K4についてのみ補正データを加算あるいは
減算するようにしたものである。第1図のブロツ
ク図においては、パラメータ補正回路2は加減算
回路2aと、この加減算回路2aに補正データを
与える補正データ設定手段2bとを有している。
補正データは、振巾を決定するAパラメータとピ
ツチを決定するPパラメータ、および低次のKパ
ラメータK1〜K4についてのみ用意されており、
高次のKパラメータK5〜K10については補正デー
タは用意されておらず、補正も行なわれない。こ
れは高次のKパラメータK5〜K10は、後述するよ
うに音質に寄与する度合が少ないからである。第
1図において、加減算回路2aから出力される各
パラメータのうち、アステリスク(*印)の付い
ているのもは補正データを加算あるいは減算され
さパラメータである。本発明にあつてはこのよう
に低次のパラメータK1〜K4についてのみ補正を
行なうようにしているので、パラメータ補正回路
2の構成、特に補正データ設定手段2bの構成を
簡単化することができるものである。
(実施例) 第2図は本発明の一実施例に係る音声合成装置
の概略構成を示すブロツク図であり、第3図は同
上の要部ブロツク図である。また第4図は第3図
回路動作を示すタイムチヤートである。本発明の
音声合成装置は上述のように、音声スペクトル分
布を表わすパラメータとして、部分自己相関係数
(いわゆるPARCOR係数)を用いており、
PARCOR型の音声合成装置と呼ばれている。か
かるPARCOR型の音声合成装置においては、第
5図に示すように、音声信号VSをサンプリング
パルスにより適宜周期tOでサンプリングし、サン
プリングされたサンプリング値XtとXt−pの間
にある(p−1)個のサンプリング値による相関
関係を除外し、、XtとXt−pとの相関関係のみを
抽出したPARCOR係数をスペクトル分布を表わ
すKパラメータとして音声を合成するものであ
り、Kパラメータは音声がほぼ定常状態とみなせ
る1フレーム(5〜20msec)において、周期tO
(約100μsec)毎に音声信号VSのサンプリングを
行ない、隣り合うサンプリング値間の相関係数を
K1とし、複数間隔離れたサンプリング値間では、
その間に挾まれたサンプリング値による影響を最
小2乗誤差による線形予測によつて求め、それら
を差引いてできる相関係数をK2〜K10としたもの
である。このKパラメータはK1,K2,K3のよう
にXtにい近い点との部分自己相関関係を表わす
係数にはスペクトル分布に関する情報が豊富に含
まれているが、K8,K9,K10のようなXtから遠
い点との部分自己相関係数にはスペクトル分布に
関する情報があまり含まれていないので、低次の
Kパラメータには多数の量子化ビツトを割り当
て、高次のKパラメータには少数の量子化ビツト
を割り当てることによりビツト数を節減して冗長
度を小さくしているものである。したがつて
PARCOR方式はKパラメータとして自己相関係
数を用いて各係数に同一ビツト数を割り当てるよ
うにした自己相関係数方式に比べて帯域圧縮率が
すぐれているものである。各A、P、Kパラメー
タは圧縮されて記憶され、Aパラメータに対して
5ビツト、Pパラメータに対して6ビツト、Kパ
ラメータの各係数K1,K2…K10に対して7、6、
5、4、4、4、3、3、3、3ビツトのように
割り当てられる。
第2図に示す音声合成装置はデータ記憶部1を
含む制御用IC(A)と音声合成用IC(点線部A,Bを
除いた部分)との2チツプで構成されており、両
者間でビツトシリアルにデータを受渡しを行なう
ようにしているのである。音声の特徴パラメータ
はすべて再生用ROM4内に10ビツトのデータと
して記憶されており、各特徴パラメータに割り当
てられるデータの個数は、その特徴パラメータが
音質に寄与する度合に応じて最適に配分されてい
る。第7図は再生用ROM4内に記憶されたA、
P、K10〜K1の各特徴パラメータのデータ個数を
示している。例えば、Aパラメータの場合10ビツ
トで表現されるデータが32個記録されている。し
たがつてAパラメータの任意のデータをアクセス
するときに必要とされる相対アドレスのビツト数
は5ビツトである。この相対アドレスは特徴パラ
メータを必要最小限に圧縮して表現したものであ
るので圧縮パラメータと呼ばれる。これに対して
再生用ROM4の内に記載されている実際の特徴
パラメータは再生パラメータと呼ばれる。上述し
た所から明らかなように再生パラメータのビツト
数はA、P、K10〜K1の各特徴パラメータについ
て共通に10ビツトであるが、圧縮パラメータのビ
ツト数はA、P、K10〜K1の各パラメータについ
て異なるものであり、それぞれ5、6、3、3、
3、3、4、4、4、5、6、7ビツト(合計53
ビツト)である。このほか予備エリアとして3ビ
ツト分すなわちデータ8個分が再生用ROM4内
に確保されている。圧縮パラメータは音声信号が
ほぼ定常状態のとみなし得る20msec(1フレー
ム)ごとに1組(=53ビツト)抽出されるのであ
るから、高々2650ビツト/秒で音声室号を記録す
ることができ、無音区間やリピート区間をも考慮
に入れると実際には1600ビツト/秒程度で音声信
号を記録することができるものである。
データ記憶部1に記憶されている圧縮パラメー
タ(すなわち再生用ROM4の相対アドレス)は
1フレームごとに切換回路5を介してリングレジ
スタ6にビツトシリアルに入力されるものである
が、このような相対アドレスだけで再生用ROM
4からの記憶データを取り出すことはできないの
で、インデツクスROM7の中に第8図に示すよ
うに記憶されている先頭アドレスをアドレスカウ
ンタ8の制御の下に順次取り出して、この先頭ア
ドレスと上記相対アドレスとを加算回路9によつ
て加算することにより再生用ROM4の絶対アド
レス(9ビツト)を計算し、この絶対アドレスに
よつて再生用ROM4をアクセスするようにして
いる。
以下再生用ROM4に記憶されている再生パラ
メータの読み出し動作を説明する。インデイツク
スROM7には圧縮パラメータのビツト配分数を
3ビツトの2進数で記憶させており、再生用
ROM4の記憶容量削減のための共通化ビツトを
1ビツト設けており、さらに再生用ROM4内の
予備エリアに対応する予備ビツトを設けている。
圧縮パラメータのビツト配分数に関するデータば
再生制御回路10に送られ、再生制御回路10
は、該ビツト配分数だけシフトロツクをリングレ
ジスタ6に送出する。したがつてリングレジスタ
6からは、上記ビツト配分数に応じて例えばAパ
ラメータの場合は5ビツト、Pパラメータの場合
には6ビツト、K10パラメータの場合には3ビツ
ト…、K1パラメータの場合には7ビツトという
具合に圧縮パラメータ(相対アドレス)をそれぞ
れ加算回路9にシリアルに送出するものである。
リングレジスタ6はできるだけチツプ面積をとら
ないようにダイナミツクシフトレジスタで構成さ
れている。またインデツクスROM7内に記憶さ
れている各特徴パラメータの再生用ROM4内に
おける先頭アドレスは、パラレルシリアル変換回
路11を介して1ビツトずつ順次加算回路9に送
出されるので、順次1ビツトずつ加算されて絶対
アドレスが計算されるものである。計算された直
列データの絶対アドレスはシリアルパラレル変換
回路12を介して並列データに変換され、再生用
ROM4をアクセスできるようになつている。
再生用ROM4から読み出された再生パラメー
タはパラレルシリアル変換回路13にて直列デー
タに変換され、パラメータ補正回路2に入力され
る。パラメータ補正回路2は、再生用ROM4か
らAパラメータが出力されるタイミングにおいて
はAパラメータに適当な音量補正データを加算あ
るいは減算して補正Aパラメータを出力し、また
再生用ROM4からPパラメータが出力されるタ
イミングにおいては、Pパラメータに適当な音程
補正データを加算あるいは減算して補正パラメー
タを出力するものである。一方、再生用ROM4
から高次のKパラメータK10〜K5が出力されるタ
イミングにおいては、これらの各Kパラメータを
補正せずにそのまま通過させるようになつてい
る。また再生用ROM4から低次のKパラメータ
K4〜K1が出力されるタイミングにおいては、こ
れらの各Kパラメータにそれぞれ適当な補正デー
タを加算あるいは減算して補正Kパラメータを出
力するものである。かかるパラメータ補正回路2
の具体的構成および動作については、第3図ブロ
ツク図の説明において後述する。
ところで、補正Aパラメータ、補正Pパラメー
タ、K10〜K5パラメータぼよび補正K4〜K1パラ
メータが入力される補間計算回路14は、1フレ
ーム毎に更新される特徴パラメータのフレーム間
の接続点における不連続な変化による音声信号の
歪み(明瞭度の低下)を防止するもので、データ
更新の際に特徴パラメータがスムーズに変化し得
るように1フレーム内の8点において近似的な直
線的補間を行なうようにしている。この補間計算
回路14はタイミング制御回路15にて接続さ
れ、タイミング制御回路15では第6図に示すよ
うに1フレーム(20msec)中に8個の補間Dク
ロツク(2.5msec)を発生し、1個のDクロツク
中に25個のパラメータ読込用Pクロツク
(100μsec)、さらに1個のPクロツク中に22個
のビツト読込用Tクロツク(4.5μsec)が作成さ
れる。8個のDクロツクのうち、最初のD1にお
いてデータ入力端子16からリングレジスタ6に
データが読み込まれる。各圧縮パラメータA、
P、K10…、K1は奇数番目のPクロツクで順次読
み込まれるものであり、例えばAパラメータは
P1区間のT6〜T10の5個のTクロツクで読み込ま
れる。偶数番目のPクロツクあるいは上記以外の
Tクロツクは補間計算回路14、音源ROM1
7、デジタルフイルタ18などのタイミングとし
て使用されるものである。上記補間計算回路14
によつて2.5msecごとに新しい値に更新された各
特徴パラメータは、それぞれPラツチ19、AK
ラツチ20に一時的に蓄えられる。ただし、補間
計算に差し当り必要のないパラメータはすべて
AKパラメータスタツク21に転送してデジタル
フイルタ18の音声合成用データとして蓄積す
る。
補間計算回路14における補間計算は、リング
レジスタ6内のデータを繰り返し循環させて送出
することによつて容易に行なえるようになつてい
る。このリングレジスタ6の動作について説明す
ると、まず補間区間D1のときには、データ入力
端子16からリングレジスタ6内に直列にデータ
を読み込み、また補間区間D2〜D8のときには、
リングレジスタ6内にてサイクリツクにデータを
循環させ、これによつてアドレス計算用の加算回
路9へは1フレームの全補間区間にわたつて常に
同じデータをA,P,K10,K9…,K2,K1の順
に繰り返し送出できるようになつている。ゆえに
補間計算回路14はD1〜D8の補間区間にわたつ
て同じデータを同じ順序で8回受けとることにな
る。このように補間計算回路14が繰り返して8
回受け取るデータをaとし、1フレーム前のデー
タをbとし、補間された値をC,1C2…,C3とすれ
ば次式によつてほぼ近似的に直線補間を行なうこ
とができるものである。
D1;C1=b D2;C2=C1+(a−C1)×1/8 D3;C3=C2+(a−C2)×1/8 D4;C4=C3+(a−C3)×1/8 D5;C5=C4+(a−C4)×1/4 D6;C6=C5+(a−C5)×1/4 D7;C7=C6+(a−C6)×1/4 D8;C8=C7+(a−C7)×1/2 以上のように、いかなる場合においても1つ前
の補間区間におけるデータを記憶しておきさえす
れば、繰り返し送出されるデータaと共に常に補
間計算を実行することができる。C1乃至C8は具
体的にはA、P、Kのパラメータを示している。
今、D2の補間区間を例にとつて補間計算の動
作を説明すると、まずP1においてパラレルシリ
アル変換回路13からの次のフレームのAパラメ
ータの値aが送出されて来るから、AKラツチ2
0から1つ前の補間区間D1におけるAパラメー
タC1の値を取り出して、a及びC1から次の補間
区間D2におけるAパラメータの補間値C2を計算
する。計算結果C2はAKラツチ20を介してパラ
メータスタツク21に転送蓄積される。このとき
パラメータスタツク21からはK10パラメータの
1つ前の補間値C1が取り出されAKラツチ20に
転送蓄積される。これらの一連の動作は、Aパラ
メータがP1において転送されてから、次のPパ
ラメータがP3において転送されるまでの間のブ
ランク期間P2においてなされるものである。以
下同様にしてP3,P5,P7…,P23において転送さ
れるP,K10,K9K1の補間計算処理はP4
P6,P8,P10…,K24の各ブランク期間において
それぞれ行なわれるものである。したがつてパラ
メータスタツク21ならびにPラツチ19には
D1〜D8の各区間ごとに、言い換えれば2.5msecご
とに新しく補間されたパラメータが更新記憶され
ることになる。
Pラツチ19に蓄えられた音声の基本周期に関
するデータすなわちPパラメータは一致回路22
にてPクロツク(100μsec)をカウントするアド
レスカウンタ22の出力と比較され、アドレスカ
ウンタ22の出力がPパラメータに一致したとき
一致回路21からアドレスカウンタ22をリセツ
トするリセツト信号VRが出力される。したがつ
てアドレスカウンタ22はPパラメータに基いた
周期でリセツトされ、この周期で音源ROM17
から音源制御データが順次読み出される。この音
源制御データにて有声音源23を駆動して基本周
期を有する有声音を発生させる、例えばPパラメ
ータが「25」の場合には基本周期が25×100μsec
(400Hz)の有声音が発生されることになる。な
お、上記音源制御データは原音を周波数分析して
得られる残差波形を再現して音色を忠実に再生す
るためのデータある。一方、音声に基本周期がな
い場合には、音源制御回路24にて切換回路25
を駆動し、無声音源26に切り換える。無声音源
26は基本周期を持たないホワイトノイズ(白雑
音)を発生するものである。次にAパラメータお
よびKパラメータはVCAを具備したデジタルフ
イルタ18に供給され、音源回路により供給(有
声音源23あるいは無声音源26から出力)され
た信号に振幅の大小およびスペクトル分布に関す
る情報を付け加えることにより音声を再生するも
のである。なお、第2図において27はアンプ、
28はスピーカ、29は水晶発振回路であるが、
これらは本発明の要旨には直接的には関連しない
のでその詳細な説明は省略する。
以下、パラメータ補正回路2の具体回路構成お
よび動作について説明する。第3図はパラメータ
補正回路2の具体回路例を示すものである。まず
入力されたパラメータに所定の補正データを加算
するための回路は全加算器30と、桁上がり記憶
用のフリツプフロツプ31とから構成されてお
り、全加算器30の桁上がり出力Coはフリツフ
ロツプ31によつてTクロツク1個分の時間だけ
遅延されて桁上がり入力Co−1に入力されるよ
うになつている。全加算器30の一方の入力Aに
は再生用ROM4から出力された再生パラメータ
がパラレルシリアル変換回路13によつてTクロ
ツクに同期した直列データに変換されて入力され
るものである。また全加算器30の他方の入力B
には、補正データ切換回路32からTクロツクに
同期として出力される直列データが入力されるも
のである。かかるデータ入力は上述のようにT5
のタイミングから開始されるものであり、したが
つて桁上がりの記憶用のフリツプフロツプ31は
T4のタイミングにおいてリセツトしておくもの
である。PGT0〜PGT3は補正データ入力用の
入力端子である。PGT0〜PGT3に入力された
4ビツトのデジタルデータはデコーダ33にて解
読され、Aエンコーダ34、Pエンコーダ35、
およびK4エンコーダ36乃至K1エンコーダ39
に入力される。Aエンコーダ34はPGT0〜
PGT3の入力に対応した音量補正データを出力
するものであり、またPエンコーダ40はPGT
0〜PGT3の入力に対応した音程補正データを
出力するものである。さらにK4エンコーダ36
乃至K1エンコーダ39は、それぞれPGT0〜
PGT3の入力に応じて、各KパラメータK4〜K1
の補正データを出力するものである。40および
41はAエンコーダ34およびPエンコーダ35
の各出力を記憶保持ラツチ回路である。また42
〜45はK4エンコーダ36乃至K1エンコーダ3
9の出力を記録保持するラツチ回路である。これ
らの各ラツチ回路40〜45は音声合成開始時に
出力されるREADY信号の前縁によつてリセツト
され、NANDゲート46〜51の出力がLレベ
ルになつたときに、各エンコーダ34〜39の出
力をそれぞれ記億保持するものである。各
NANDゲート46〜51の一方の入力にはD2
ロツクが入力されており、また他方の入力には、
それぞれP1,P3,P17,P19,P21,P23の各Pクロ
ツクとT22クロツクおよびTクロツクTCLKとの
論理積が入力されている。第4図a〜cはかかる
各クロツクの関係を示す図である。上記各図にお
いては、音声合成の1フレームは20msecとなつ
ており、この1フレームを上述のようにD1〜D8
の各Dクロツクで8等分している。まず第4図a
は、D1クロツクとD2クロツクとの関係を示して
おり、同図に示すように各Dクロツクは2.5msec
のパルス巾を有しているものである。第4図bは
D1クロツクについて、P1クロツクと、Poddクロ
ツク、およびT22クロツクの関係を示している。
ここでPoddクロツクとは、奇数番目のPクロツ
クのことである。同図に示すように、T22クロツ
クは1つのPクロツクの期間内における最後のタ
イミングを示すクロツクである。第4図cは、上
述の各NANDゲート46〜51に入力されるラ
ツチ回路40〜45のラツチタイミングを決定す
るクロツクの関係を示す図である。この第4図c
におけるD2・P1・T22クロツクのタイミングにお
いてはAパラメータの補正データがAエンコーダ
34からラツチ回路40に読み込まれてるもので
ある。したがつて、このD2・P1・T22クロツクの
直前にPGT0〜PGT3にAパラメータの補正デ
ータを設定しておけば、ラツチ回路40にAパラ
メータの補正データを入力することができる。同
様に、D2・P3・T22、D2・P17・T22、D2・P19
T22、D2・P21・T22、D2・P23・T22の各クロツク
のタイミングにおいては、Pパラメータおよび
K4〜K1パラメータの各補正データが各エンコー
ダ35〜39から各ラツチ回路41〜45に読み
込まれるものであるから、これらの各データ読み
込み用のクロツクの直前にPGT0〜PGT3に各
パラメータの補正データを設定しておけば、各ラ
ツチ回路41〜45に所望の補正データをそれぞ
れ入力することができるものである。
こうしてラツチ回路40〜45にラツチされた
パラレルデータは、偶数番目のPクロツクPevn
の最初のタイミングT1においてパラレルシリア
ル変換回路52〜57に入力されて、Tクロツク
に同期したシフトクロツクによりシリアルデータ
に変換されるものである。各パラレルシリアル変
換回路52〜57から出力されるシリアルデータ
はそれぞれ補正データ切換回路32を介して補正
データ加算用の全加算器30に切換入力される。
補正データ切換回路32にはP2クロツク、P4
ロツク、P18クロツク、P20クロツク、P22クロツ
ク、およびP24クロツクが切換タイミング制御信
号として入力されており、Aパラメータの補間計
算が行なわれる。P2クロツクのタイミングにお
いてはパラレルシリアル変換回路52から出力さ
れるシリアルデータを補正データ加算用の全加算
器30に入力し、またPパラメータの補間計算が
行なわれるP4クロツクのタイミングにおいては
パラレルシリアル変換回路53から出力されるシ
リアルデータを全加算器30に入力しており、さ
らにK4〜K1パラメータの補間計算が行なわれる。
P18,P20,P22、およびP24の各Pクロツクのタイ
ミングにおいては、それぞれパラレルシリアル変
換回路54〜57から出力されるシリアルデータ
を全加算器30に入力している。
このように本実施例においては、入力端子
PGT0〜PGT3を介して音量補正データ、音程
補正データ、およびK4〜K1パラメータの補正デ
ータを同一のフレーム内で4ビツトの情報として
入力することが可能であるので、制御用IC(A)内
に含まれている制御用CPUを用いて入力端子
PGT0〜3のデータを制御することにより、1
フレーム毎のAパラメータ、Pパラメータ、およ
びK4〜K1パラメータの各補正データの入力を行
なうようにすれば、音声メツセージの中に現われ
る単位音節のイントネーシヨンやアクセント、ピ
ツチおよびスペクトル分布によつて決まる声の質
などを微妙に制御することが可能になるものであ
る。例えば音声時報装置として用いる場合におい
て、「11時35分」を報知するときに、単純に「ジ
ユウ」「イチ」「ジ」「ニ」「ジユウ」「ゴ」「フン」
の各単位音節を連結させても不自然な再生音しか
得られないが、CPU制御にいよる1フレーム毎
の音量、音程および音質の補正データの入力を行
なうようにすれば、上述の「ジユウ」や「イチ」
のような単位音節を構成する多数個のフレーム毎
に音量、音程および音質を微妙に補正できるので
あ各単位音節が滑らかに連続するように制御する
ことが可能となるものである。
なおここで低次のKパラメータについての補正
を特にK4〜K1パラメータのみに選定した理由は、
このK4〜K1パラメータが音質に寄与する度合が
特に大きいからである。実際、従来のPARCOR
型の音声合成装置においても、有声音を合成する
際には、K10〜K1パラメータをすべて使用してい
るが、無音声を合成する際には、K4〜K1パラメ
ータのみを使用して、K10〜K5パラメータについ
ては使用していないのである。したがつて仮に低
次のKパラメータについての補正を例えばK5
K1パラメータと選定すると、K5パラメータにつ
いてのパラメータ補正回路は有声音の合成時には
使用されるが、無声音の合成時には使用されない
ことになる。つまりこの場合にはK5パラメータ
の補正のために設けたエンコーダやラツチ回路お
よびパラレルシリアル変換回路などが使用されな
いことになる。このような点を考慮して本実施例
では低次のKパラメータについて補正をK4〜K1
パラメータと選定したものである。しかしなが
ら、音声の規則合成に関する今後の研究動向によ
つては、低次のKパラメータについての補正は例
えばK1パラメータおよびK2パラメータについて
のみ行なえば足りるという研究成果が得られるこ
とも充分に考えられる。
第9図は本発明の他の実施例におけるパラメー
タ補正回路2を示す回路図である。本実施例にあ
つては、Dフリツプフロツプを4個パラレルに設
けた4ビツトのパラレルデータ用のラツチ回路
Q0〜Q5を6個シリアルに接続すると共に、その
始端と終端とを切換回路58を介して接続するこ
とにより、4ビツト単位のパラレルデータの循環
が可能なリングレジスタ59を構成している。こ
のリングレジスタ59のデータ循環クロツク
CIRCは、Podd・41625・T22・TCLKク
ロツクと等価であつて、第10図の動作説明図に
示すように、D2クロツクの期間中においては、
P1・T22、P3・T22、P17・T22、P19・T22、P21
T22、P23・T22の各クロツクのタイミングにおい
て合計6回に亘つて、しかもA、P、K4〜K1
各パラメータのデータ読み込みタイミングにおい
て生じるものである。ところでこのD2クロツク
の期間中においては、各切換回路58は入力端子
PGT0〜PGT3の側に切り換えられており、し
たがつて、上述の6回のデータ循環クロツクのタ
イミングにおいてそれぞれ入力端子PGT0〜
PGT3にA、P、K4〜K1の各パラメータの補正
データを入力すれば、リングレジスタ59へのデ
ータ入力が完了した状態において、各ラツチ回路
Q0〜Q5にはそれぞれK1〜K4、P、Aの各パラメ
ータの補正データが各々4ビツトずつ記録保持さ
れていることになる。第10図の動作説明は、か
かるD2クロツクの期間中におけるリングレジス
タ59のデータ読み込み動作を示しており、同図
においてK1′〜K4′,P′,A′は前フレームにおけ
るデータを示しており、またK1〜K4,P,Aは
新たに読み込んだ現フレームにおけるデータを示
している。次にD3フレームに入ると、各切換回
路58は最終出力段のラツチ回路Q5の出力を入
力団のラツチ回路Q0の入力に接続するように切
り換えられる。したがつて、現フレームのD3
D8クロツクおよび次フレームのD1クロツクの各
期間中は、データ循環クロツクCIRCが入力され
るたびにリングレジスタ59内のデータは何度も
循環して利用されるものである。この際1つのD
クロツクの間にデータ循環クロツクCIRCが合計
6回発生するので、こによつてリングレジスタ5
9内のデータは丁度1回循環して元の状態に戻る
ようになつている。リングレジスタ59の入力段
におけるラツチ回路Q0の出力データはデコーダ
60を介してエンコーダ61に入力されている。
またエンコーダ61の出力はパラレルシリアル変
換回路62に入力されて、シリアルデータに変換
されるようになつている。すなわち本実施例にお
いては、リングレジスタ59を用いたことにより
第3図実施例回路におけるエンコーダ34〜39
およびパラレルシリアル変換回路52〜57を
各々1つのエンコーダ61とパラレルシリアル変
換回路62とで共用化できるようにしたものであ
る。ラツチ回路40〜45についてはリングレジ
スタ59の各ラツチ回路Q0〜Q5で置き換えられ
ている。したがつて第3図回路を使用するよりも
第9図回路を使用する方が音声合成用LSIのチツ
プ面積は小さくすることができるものである。パ
ラレルシリアル変換回路62からの出力されるシ
リアルデータは、補正データ加算用の全加算切3
0の入力Bに順次入力されるものであるが、K10
〜K5パラメータの補間計算の期間に相当するP5
〜P17クロツクの期間中はNORゲート63によつ
てデータの通過を阻止している。今、Aパラメー
タの補正データの場合についてリングレジスタ5
9からの全加算器30までのデータの流れを説明
すると、まずD3クロツクの期間中におけるP1
T22クロツクのタイミングにおいて、第10に示
すようにデータ循環クロツクCIRCが発生するか
ら、このときにリングレジスタ59のデータが1
ステツプだけシフトして、ラツチ回路Q0にはA
パラメータの補正データが記憶保持される。また
ラツチ回路Q1〜Q5には、K1〜K4、およびPの各
パラメータの補正データがそれぞれ記憶保持され
る。ラツチ回路Q0の出力たるAパラメータの補
正データはデコーダ60およびエンコーダ61を
介してパラレルシリアル変換回路62に入力され
ることになる。パラレルシリアル変換回路62
は、READY状態において偶数番目のPクロツク
Pevnの最初のTクロツクT1にてデータを入力し、
Tクロツクに同期したシフトクロツクにより入力
データをシリアルデータに変換して出力するもの
である。このシリアルデータは上述のように、
NORゲート63を介して全加算器30に入力さ
れるようになつている。PパラメータおよびK4
〜K1パラメータの各補正データについても同様
にリングレジスタ59から順次データ循環クロツ
クCIRCによつて読み出されてパラレルシリアル
変換回路62にそれぞれ入力されてシリアルデー
タとして全加算器30に入力されるようになつて
いるものである。
第11図は本発明のさらに他の実施例における
パラメータ補正回路2を示す回路図である。本実
施例にあつては、リングレジスタ59におけるデ
ータ循環のタイミングを略一定にすることによ
り、リングレジスタ59を構成する各ラツチ回路
Q0〜Q5としてダイナミツク形のフリツプフロツ
プを使用できるようにしたものである。一般に
LSIのチツプ上にフリツプフロツプを構成しよう
とする場合には、第13図aに示すようなダイナ
ミツク形のシフトレジスタと、同図bに示すよう
なスタテイツク形のシフトレジスタとが使用可能
である。前者はMOSトランジスタ2個で1つの
フリツプフロツプを構成でき、後者が1つのフリ
ツプフロツプにMOSトランジスタを4個も必要
とするのに比べると大幅にLSIチツプ上の面積を
小さくすることができる。しかしながら、前者は
データを記憶保持しておくためには常にデータを
一定周期毎に循環せしめることが必要であり、後
者がこのようなデータの循環を必要としないのに
比べると若干使用条件が制約されるものである。
本発明の第11図実施例は、リングレジスタ59
内のデータをA、P、K4〜K1パラメータの補間
計算のタイミングのみならず、K10〜K5パラメー
タの補間計算のタイミングにおいても循環せしめ
ることにより、リングレジスタ59を構成する各
フリツプフロツプとしてダイナミツク形のものを
使用できるようにしたものである。第12図は第
11図実施例の動作説明用のタイムチヤートであ
り、同図においてはD2クロツク期間中における
リングレジスタ59内のデータ循環の仕方、およ
びデータ入力の仕方を示している。同図におい
て、CIRTはリングレジスタ59のデータ循環ク
ロツクであり、Podd・25・T22クロツクと等価
である。このデータ循環クロツクCIRTは、第1
2図に示すように、D2クロツクの期間中におい
ては、P1・T22クロツクからP23・T22までの各
Podd・T22クロツクのタイミングにおいて合計12
回発生するものである。したがつて、リングレジ
スタ59内のデータは1つのDクロツクの期間中
に2回循環することになる。また第12図におい
て、RECRは各切換回路58の切換信号であり、
D2516クロツクと等価である。この切換信
号RECRがHレベルである期間中は、リングレジ
スタ59のラツチ回路Q0のデータ入力は入力端
子PGT0〜PGT3に接続され、反対にLレベル
である期間中は、最終出力段のラツチ回路Q5
出力が入力段のラツチ回路Q0の入力に接続され
るようになつている。しかして第12図からも明
らかなように、この切換信号RECRは、Aパラメ
ータおよびPパラメータの各補正データの読み込
みタイミングであるP1・T22クロツクおよびP3
T22クロツクのタイミングと、K4〜K1パラメータ
の各補正データの読み込みタイミングである
P17・T22〜P23・T22クロツクのタイミングにお
いてはHレベルとなるが、P5・T22〜P15・T22
ロツクのタイミングにおいては、Lレベルとな
る。第12図においてA′,P′,K4′〜K1′は前フ
レームにおける補正データの内容を示しており、
A,P,K4〜K1は現フレームにおける補正デー
タの内容を示している。同図に示すように、D2
クロツクの期間中においては、P1クロツクおよ
びP3クロツクのタイミングにおいて、A、P、
パラメータの各補正データが更新され、前フレー
ムのA′,P′がそれぞれA,Pに置き換えられる
ものであり、以後P5〜P15の各Poddクロツクにお
いては、A,P,K4′〜K1の各補正データがリン
グレジスタ59内を循環し、さらにP17〜P23の各
PoddクロツクにおいてK4〜K1パラメータの各補
正データが更新され、前フレームのK4′〜K1′がそ
れぞれ現フレームのK4〜K1に置き換えられるも
のである。したがつて本実施例にあつては、リン
グレジスタ59のデータは常に循環されることに
なるので、各ラツチ回路Q0〜Q5としてはダイナ
ミツク形のフリツプフロツプを用いることができ
るものである。さらに本実施例にあつては、A、
Pパラメータの補正データ用のエンコーダ61お
よびパラレルシリアル変換回路62と、K4〜K1
パラメータの補正データ用のエンコーダ64およ
びパラレルシリアル変換回路65とを別々に構成
している。これはA、Pパラメータと補正データ
についてのエンコーダ61上のテーブル値が、K
パラメータの補正データについてのエンコーダ6
4上のテーブル値とは異なつてくることが考えら
れるので、それぞれのテーブル値に合わせたエン
コーダ61,64を別個に設けているのである。
各パラレルシリアル変換回路62,65の出力
ば、切換回路66を介して全加算器30のB入力
に接続されている。この切換回路66は、P1
P4のPクロツクのタイミングにおいてはパラレ
ルシリアル変換回路62を選択し、P5〜P25の各
Pクロツクのタイミングにおいてはパラレルシリ
アル変換回路65を選択するようになつている。
〔発明の効果〕
本発明は叙上のように構成されており、音声合
成用の振巾、ピツチ、およびスペクトルの各パラ
メータに対してそれぞれ適宜補正データを加算あ
るいは減算するパラメータ補正回路を設け、補正
された各パラメータにて、音源を駆動して音声を
合成するようにした音声合成装置において、スペ
クトルパラメータとして音声信号の互いに近接し
たサンプリング値間の部分自己相関係数を用い、
隣り合うサンプリング値間の部分自己相関係数を
1次係数とし、Nサンプリング(Nは自然数)分
だけ離れて隣り合うサンプリング値間の部分自己
相関係数を(N+1)次係数とし、パラメータ補
正回路は(N+1)の個の部分自己相関係数のう
ち、低次の係数についてのみ補正データを加算あ
るいは減算するようにしたものであるから、部分
自己相関係数は低次の係数ほど音質に寄与する度
合が大きく、高次の係数は余り音質に影響を与え
ないという性質を利用して、すべてのスペクトル
パラメータについて補正データを加減算する必要
をなくし、一部のスペクトルパラメータについて
のみ補正データを加減算すればよいようにしたも
のであり、したがつてスペクトルパラメータにつ
いてのパラメータ補正回路の構成を簡単化するこ
とができるという効果がある。
なお本発明の第3図実施例において示したよう
に、振巾、ピツチ、およびスペクトルの各パラメ
ータに対する補正データをそれぞれ同一の入力端
子から時分割的に順次読み込んで別々のラツチ回
路に記憶保持するように構成すれば、1つのフレ
ームにおける各パラメータの補正データを同一の
入力端子を介して入力することが可能になるの
で、音成合成用LSIのピン数を少なくすることが
できるので好都合なものである。
また本発明の第9図実施例において示したよう
に、補正データ用の入力端子から順次時分割的に
入力された各パラメータに対する補正データを一
旦リングレジスタに読み込んで、このリングレジ
スタ内のデータを各パラメータ補間計算のタイミ
ングに合わせて順次循環させながら使用するよう
にすれば、補正データをエンコードするためのエ
ンコーダや、エンコードされた補正データをシリ
アルデータに変換して補正データ加算用の全加算
器に送出するパラレルシリアル変換回路等を各パ
ラメータの補正データについてすべて共用化する
ことができるので、音声合成用LSIチツプ面積を
小さくすることができるものである。
さらにまた本発明の第11図実施例において示
したように補正データ用の入力端子から順次リン
グレジスタ内に時分割的に入力されるA、P、お
よびK4〜K1の各パラメータについての補正デー
タが、一時的に入力されなくなるタイミング、す
なわちK10〜K5の各パラメータの補間計算のタイ
ミングにおいてもリグレジスタ内のデータをその
まま循環せしめるように構成すれば、リングレジ
スタを構成するフリツプフロツプとしてダイナミ
ツク形のものを使用することができ、音声合成用
LSIチツプ面積を小さくすることができるもので
ある。
【図面の簡単な説明】
第1図は本発明の特許請求の範囲に記載された
構成を示すいわゆるクレーム対応ブロツク図、第
2図は本発明の一実施例に係る音声合成装置の全
体構成を示すブロツク図、第3図は同上の要部と
なるパラメータ補正回路のブロツク図、第4図は
同上の動作説明図、第5図は本実施例において用
いるPARCOR型音声合成方式の原理説明図、第
6図は同上の動作説明図、第7図および第8図は
それぞれ同上の再生用ROM、インデツクス
ROMの構成を示す図、第9図は本発明の他の実
施例の要部となるパラメータ補正回路のブロツク
図、第10図は同上の動作説明図、第11図は本
発明のさらに他の実施例の要部となるパラメータ
補正回路のブロツク図、第12図は同上の動作説
明図、第13図a,bはそれぞれダイナミツク形
およびスタテイツク形の各フリツプフロツプの構
成を示す回路図である。 1はデータ記録部、2はパラメータ補正回路、
2aは加減算回路、2bは補正データ設定手段、
3は音源である。

Claims (1)

    【特許請求の範囲】
  1. 1 音声信号を音声周波数よりも高い周波数のサ
    ンプリングパルスにてサンプリングして抽出せる
    振巾パラメータ、ピツチパラメータおよびスペク
    トルパラメータを予めデータ記憶部に記録し、デ
    ータ記憶部から順次読出される各パラメータにそ
    れぞれ適宜補正データを加算あるいは減算するパ
    ラメータ補正回路を設け、補正された各パラメー
    タにて、音源を駆動して音声を合成するようにし
    た音声合成装置において、スペクトルパラメータ
    として音声信号の互いに近接したサンプリング値
    間の部分自己相関係数を用い、隣り合うサンプリ
    ング値間の部分自己相関係数を1次係数とし、N
    サンプリング値(Nは自然数)分だけ離れて隣り
    合うサンプリング値間の部分自己相関係数を(N
    +1)次係数とし、パラメータ補正回路は(N+
    1)個の部分自己相関係数のうち、低次の係数に
    ついてのみ補正データを加算あるいは減算するよ
    うにして成ることを特徴とする音声合成装置。
JP58226003A 1983-11-30 1983-11-30 音声合成装置 Granted JPS60118900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58226003A JPS60118900A (ja) 1983-11-30 1983-11-30 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58226003A JPS60118900A (ja) 1983-11-30 1983-11-30 音声合成装置

Publications (2)

Publication Number Publication Date
JPS60118900A JPS60118900A (ja) 1985-06-26
JPH0325800B2 true JPH0325800B2 (ja) 1991-04-08

Family

ID=16838262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58226003A Granted JPS60118900A (ja) 1983-11-30 1983-11-30 音声合成装置

Country Status (1)

Country Link
JP (1) JPS60118900A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63286897A (ja) * 1987-05-19 1988-11-24 ヤマハ株式会社 楽音信号発生装置

Also Published As

Publication number Publication date
JPS60118900A (ja) 1985-06-26

Similar Documents

Publication Publication Date Title
US5321794A (en) Voice synthesizing apparatus and method and apparatus and method used as part of a voice synthesizing apparatus and method
JPH0325800B2 (ja)
JPS6040636B2 (ja) 音声合成装置
JPS5975294A (ja) 楽音合成装置
JPH0142000B2 (ja)
JPS6036600B2 (ja) 音声合成装置
JPH043558B2 (ja)
JPS58158697A (ja) 音声合成装置
JPS6040635B2 (ja) 音声合成装置
JPS6040637B2 (ja) 音声合成装置
JPH035600B2 (ja)
JPS6036597B2 (ja) 音声合成装置
JPS5968793A (ja) 音声合成装置
JPS608520B2 (ja) メロデイ音合成兼用の音声合成装置
JP3351543B2 (ja) 信号処理方法
JPH04349499A (ja) 音声合成システム
JPH01197793A (ja) 音声合成装置
JPS5949596B2 (ja) 音声パラメ−タの再生制御方式
JPS6040633B2 (ja) 無声破裂音源付きの音声合成装置
JPH0141999B2 (ja)
JPS6040640B2 (ja) 多重音声合成システム
JPS6040639B2 (ja) 多重音声合成システム
JPS58205200A (ja) 電子音声合成回路装置
JPH0325799B2 (ja)
JPS5949600B2 (ja) メロデイ音合成兼用の音声合成装置