JPH01239599A - 音声合成方式 - Google Patents

音声合成方式

Info

Publication number
JPH01239599A
JPH01239599A JP63067826A JP6782688A JPH01239599A JP H01239599 A JPH01239599 A JP H01239599A JP 63067826 A JP63067826 A JP 63067826A JP 6782688 A JP6782688 A JP 6782688A JP H01239599 A JPH01239599 A JP H01239599A
Authority
JP
Japan
Prior art keywords
value
storage means
sampling point
waveform
quantization width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63067826A
Other languages
English (en)
Other versions
JPH0769718B2 (ja
Inventor
Sukeyuki Tofuku
東福 祐之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63067826A priority Critical patent/JPH0769718B2/ja
Publication of JPH01239599A publication Critical patent/JPH01239599A/ja
Publication of JPH0769718B2 publication Critical patent/JPH0769718B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は適応型差分パルス符号変調方式(以下、単にA
DPCM方式)を用いた音声合成に係わり、特に1つの
代表波形素片を合成し、この代表波形素片をくり返し使
用することにより音声を合成する波形素片合成方式に関
する。
[従来の技術] 従来、音声合成方式にはPCM方式、ADPCM方式な
どの公知の波形符号化方式が採用されており、特にAD
PCM方式はPCM方式に比べて172以下のデータ量
で波形を合成できるためデータ量の圧縮という面では非
常に有効な方式である。ADPCM方式というのは音声
の隣接したサンプリング間の相関の強さを利用したデー
タ圧縮方式であり、連続したサンプリングポイントでの
振幅値の差を符号化・量子化する際に、その量子化幅を
適応的に変化させて信号中のノイズを軽減させる方式で
ある。量子化に使用する量子化幅は、現在の量子化幅と
ADPCM符号とにより次の量子化幅を予測して使用す
る。この予測計算の一例を示すと、Δn+1=ΔnXM
(Ln)となり、Lnはn番目のADPCM符号データ
、△nはn番目のサンプリングポイントに対する量子化
幅の大きさを表しM(Ln)は予測係数であり、上式に
したがって現在の量子化幅△nに予測係数M(Ln)を
乗じた値を次のサンプリングポイントの量子化幅△n+
1として使用する。音声レベルが小さい時は予測係数M
(Ln)は1より小さくなり量子化幅△n+1も小さく
なる。逆に音声レベルが大きくなると予測係数M(Ln
)は1より大きくなり、その結果量子化幅Δn+1は大
きくなる。但し量子化幅が大きくなりすぎると逆にノイ
ズが多くなる為、量子化幅の上限の値を決めておく必要
があり、また量子化幅の値が0になってしまうと次にい
かなる予測係数をかけても0のままとなってしまうため
量子化幅の下限もあらかじめ設定しておく必要がある。
このような予測係数M(Ln)との乗算を含む処理をし
、読み出し専用メモリ(以下、ROM)に量子化幅△n
のデータをテーブル化して入れておき、上式に示された
予測演算をROMから読みだされる量子化幅Δnを使用
して行うようにする方式が高集積回路(以下、LSI)
化するのに適している。上記LSIにはADPCM符号
と量子化幅ポインタでROMのアドレスを指定可能なよ
うにして差分値データのテーブルを作成している。
量子化幅ポインタに応じてROMに入れる差分値を一定
の比率で増大するような値にしておけば量子化幅ポイン
タの値を増加させることは量子化幅に1より大きい予測
係数をかけることを意味し、予測係数の乗算を量子化幅
ポインタに対する加減算に置き換えることができる。
[発明が解決しようとする問題点] 一般に音声波形は子音部の音声ノイズと母音部のトーン
波形とその間のつなぎの部分に分けられ、特に母音部の
トーン波形はほとんど同じ周期で同じ形の波形が連続的
に少しずつ形を変化させながらエンベロープをつけて並
んでいるのが普通である。その中で連続する2ないし3
波形について見ればほとんど同じ形になっている為、波
形素片合成方式では代表波形として1波形選びそれをく
り返し使用することにより音声合成のデータ量を圧縮し
ている。
ADPCM方式でこのような波形のくり返しを使って音
声合成のデータ量を圧縮しようとする場合、ADPCM
方式では音声をナイキスト周波数でサンプリングし隣接
したサンプリングポイント間での音声波形の振幅値の差
分値を適当な量子化幅で符号化するもので、しかも量子
化幅を各サンプリングポイントの差分値の大きさに応じ
て適応的に変化させる方式である。従ってADPCM方
式で代表波形素片を合成する場合量子化幅は1波形内で
一定ではなく、また各サンプリングポイントでの量子化
幅はそれぞれ直前のADPCMデータに依存することに
なる。またADPCM方式においてはサンプリング周波
数は通常音質とビットレートの関係により4KH2〜8
KH2が使用されている。以上説明したようなADPC
M方式を用いて代表波形素片を合成する場合実際の原波
形のピッチ周期と合成した波形のピッチ周期は完全に一
致させることはできず、ピッチ周期の誤差の影響により
合成波形の最後のサンプリングポイントの振幅は0にな
らない。また原音のピッチ周期と合成波形のピッチ周期
が完全に一致した場合でも最後のサンプリングポイント
での振幅値は直前のサンプリングポイントでの振幅値に
量子化幅とADPCM符号により決まる差分値を加えた
ものであるため直前のサンプリングポイントでの量子化
幅の値によっては1波形内の最後のサンプリングポイン
トの振幅値をOにてきない場合が生じる。
以上説明したように従来のADPCM方式をそのまま用
いて代表波形素片を合成する場合、代表波形素片の最後
のサンプリングポイントでの振幅値を0にできない為、
このような代表波形素片を用いて代表波形素片の合成を
複数回くり返しを行うと合成波形の振幅中心が変化して
しまうことになる。これはADPCM方式が基本的に各
サンプリングポイントの振幅値に差分値を加えて次のサ
ンプリングポイントの振幅値を得るという差分符号化方
式であるため、1波形の最終振幅値が0でないとその最
終振幅値の値が誤差となり、これらの誤差が複数回のく
り返しにより累積されてゆき、合成波形の振幅中心が変
化してしまうことになるからである。合成波形の振幅中
心が変化すると波形データを音声に変換するD/Aコン
バータで振幅中心が変化した分だけオーバーフローする
可能性があり、オーバーフローした場合には正常な音声
波形が合成できなくなるという重大な欠点が生じる。
[問題点を解決するための手段、作用及び効果コ本発明
は、まず、第1の記憶手段と第2の記憶手段とにそれぞ
れの初期値を設定した後、第1のサンプリングポイント
のADPCM符号データの供給を受は差分値供給手段が
、該ADPCM符号データと第1の記憶手段の初期値と
に基づき差分値を出力すると、出力波形振幅データ更新
手段が第2の記憶装置の初期値に差分値を加えて第1の
サンプリングポイントの出力波形振幅データを形成する
。この出力波形振幅データは第2の記憶手段に記憶され
ると共に出力される。一方、量子化幅ポインタ更新手段
もADPCM符号データと第1の記憶手段の初期値に基
づき新たな量子化幅ポインタの値を形成し、これを第1
の記憶手段に記憶させる。続く、第2のサンプリングポ
イントでは、そのADPCM符号データと更新された量
子化幅ポインタの値とに基づき差分値が出力され、出力
波形振幅データ更新手段がこの差分値を更新された出力
波形振幅データに加算して第2のサンプリングポイント
の出力波形振幅データを形成し、これを第2の記憶手段
に記憶させると共に第2サンプリングポイントの出力波
形振幅データとして出力する。一方、量子化幅ポインタ
の値も更新される。こうして複数の出力波形振幅データ
が出力されると、第1の記憶手段と第2の記憶手段とが
それぞれの初期値に再び設定され、後続する繰り返し波
形についても上記と同様の手順で複数の出力波形振幅デ
ータが形成される。
したがって、代表波形素片を合成する場合でも、各代表
波形素片の最後のサンプリングポイントにおける出力波
形振幅データを期間値設定手段により初期値、例えば「
0」に設定することができ、複数の代表波形素片を連続
的に処理しても、各合成波形の振幅中心を一定の初期値
に保つことができ、オーバーフローなどの欠点を完全に
解決することができる。
さらに本発明の一実施例では、複数の差分値の組を有し
ており、これらの組の一つを選択して使用するので、同
じADPCM符号データをくり返し使用しても、同一の
振幅データのくり返しとはならす−、1波形ごとにエン
ベロープを負荷することができるという利点を有してい
る。
[実施例コ 次に本発明について図面を参照して説明する。
第1図は本発明の第1実施例の回路構成図であり、第1
図に示された音声合成方式ではADPCM符号データが
Lレジスタ101にラッチされ、Lレジスタ101の内
容に基づき差分値データテーブルROM106の第1ア
ドレスを指定する。
Lレジスタ101の内容をデコーダ102でデコードし
た値と、現在の量子化幅ポインタの値を保持しているA
レジスタ104の値とを加算して次のサンプリングポイ
ントの量子化幅ポインタの値を定め、これをAレジスタ
104に再び入れ、このAレジスタ104の内容で差分
値データテーブルROM106の第2アドレスを指定す
る。量子化幅ポインタの値が指定外の値にならないよう
に加算器とAレジスタ105との間にリミッタ103を
入れておく。差分値データテーブルROM106に供給
されるアドレスの上位2ビツトでROM出力を切り替え
ている。量子化幅ポインタの値が入っているAレジスタ
104の内容をへ8レジスタ105に転送して予め記憶
させておき必要な時Aルジスタ105の内容をAレジス
タ104に読み出せるようにしておく。差分値データテ
ーブルROM106からは差分値データが出力され、サ
ンプリングポイントごとに1つ前の波形振幅値が入って
いるXレジスタ107の内容と差分値データを加算し、
次の波形振幅値をXレジスタ107に入れている。Xレ
ジスタ107の内容はリセット信号で「0」にすること
ができるようになっている。音声合成のフコ−チャート
を第3図に示している。音声合成が開始されるとまず最
初はXレジスタ107とAレジスタ104とADI・A
D2にそれぞれ初其月値「0」をセ・ントしくステ・ン
ブ■)、サンプリングポイントごとにADPCM符号デ
ータをLレジスタ101にラッチしくステップ■のL−
DATA)、Lレジスタ101の値と量子化幅ポインタ
のAレジスタ104の値とでROMアドレスを指定して
差分値データテーブルROM106の出力とXレジスタ
107内の値とを加算し、その結果をXレジスタ107
に格納しくステップ■のX’+−X+ (L、 ’A)
 )、Xレジスタ107の内容をD/Aコンバータから
出力する。
この時Lレジスタの内容をデコーダ102でデコードし
た値(L)と、Aレジスタ104の値とを加算し次の量
子化幅ポインタとしてAレジスタ104に格納する(ス
テップ■のA+A+ (L))。
以上が通常のADPCM方式による音声合成時のフロー
であり、次にくり返される波形の合成時のフローを説明
すると、最初のくり返し波形の始めにXレジスタ107
とADl・AD2を「O」にリセットし、Aレジスタ1
04の内容をAルジスタ105に記憶させてから(ステ
ップ■)最初のサンプリングポイントS1についてXレ
ジスタ107にセットすべき値Xを演算して求める。以
下、サンプリングポイン)(Sl−S8、第5図参照)
ごとに通常の演算処理をくり返しXレジスタ107の値
をD/Aコンバータから出力する(ステップ■)。2回
目のくり返し波形の始めにXレジスタ107を「0」に
リセットしくステップ■のX←0)、Aルジスタ105
の内容をAレジスタ104に読み出しくステップVのA
HA”)、差分値データテーブルROM106の内容と
しては、ROM上位アドレスのAD1=O,AD2=0
の場合に通常の差分値データが選ばれ、AD1=O,A
D2=1の場合に全体的に1.2倍に大きくされた差分
値データが選ばれ、AD 1 = 1゜AD2=1の場
合全体的に0.8倍に小さくした差分値データが選ばれ
るようにしておき、差分値データテーブルROM106
の上位アドレスADlφAD2をエンベロープの増加・
減少に合わせて適当な値に設定してから(ステップ■の
AD 1゜2←設定値)各サンプリングポイントごとに
通常の演算処理を行いXレジスタ107の値をD/Aコ
ンバータから出力する(ステップ■)。上記ステップ■
と■とは必要なくり返し回数RPだけくり返せば第5図
の89〜S24に示すような同じADPCM符号データ
を使ってエンベロープのついたくり返し波形を出力させ
ることができる。
第1実施例では、Aレジスタ104とXレジスタ107
がそれぞれ第1、第2の記憶手段を、差分値データテー
ブルROM106が差分値供給手段を、Lレジスタ10
1、デコーダ102、加算器が量子化幅ポインタ更新手
段を、差分値データテーブルROMの出力側加算器が出
力波形振幅デ−タ更新手段を、Aルジスタ、Xレジスタ
107のリセット信号が初期値設定手段をそれぞれ構成
している。
第2図は本発明の第2実施例の回路構成図である。AD
PCM符号データがLレジスタ201にラッチされ、L
レジスタの201内容で差分値データテーブルR0M2
06〜208のアドレスを指定する。Lレジスタ201
の内容をデコーダ202でデコードした値と、現在の量
子化幅ポインタの値を保持しているAレジスタ204の
値とを加算して得られる次のサンプリングポイントの量
子化幅ポインタの値をAレジスタ204に入れ、Aレジ
スタ204の内容で差分値データテーブルROM 20
6〜20日のアドレスを指定する。量子化幅ポインタの
値が指定外の値にならないようリミッタ203を入れて
おく。差分値データテーブルR0M206〜208は通
常の差分値データ群を記憶しているROM2 (207
)と全体的に1.2倍に大きくした差分値データ群を記
憶しているROM3 (208)と全体的に0.8倍小
さくした差分値データ群を記憶しているROMI (2
06)とで構成されており、スイッチ209てROMの
出力を選択的に切り替えている。
音声合成のフローチャートを第4図に示しているが、第
1実施例に比べてスイッチ209て差分値データテーブ
ルROM206〜208をエンベロープの増加・減少に
合わせて選択的に切り替えること以外は全く同じフロー
であり、第5図に示すエンベロープのついたくり返し波
形を第1実施例と同様に出力させることができる。
上記第2実施例ではAレジスタ204、Xレジスタ21
0が第1の記憶手段と第2の記憶手段とをそれぞれ構成
しており、差分値データテーブルROMI〜ROM3 
(206〜208)は差分値供給手段をLレジスタ20
1、デコーダ202、加算器は量子化幅ポインタ更新手
段を、差分値データテーブルROMI〜ROM3の出力
側加算器が出力波形振幅データ更新手段を、Aルジスタ
205、Xレジスタ210のリセット信号が初期値設定
手段をそれぞれ構成している。
以上説明したように本発明の実施例ではくり返し波形の
最初のサンプリングポイントの差分値として振幅0を基
準にし、2回目以降のくり返し波形の最初のサンプリン
グポイントの量子化幅ポインタの値は1回目の値を使用
してくり返し波形の初期値を同じにしてADPCM方式
で代表波形素片のADPCM符号データをそのまま使用
し、同一波形をくり返し合成することができ、しかも差
分値データテーブルROMにエンベロープの増加・減少
に合わせた差分値データをあらかじめ入れておくことに
より1波形ごとにエンベロープの変化する。くり返し波
形を合成することが可能であり、音質を劣化させずに合
成データ量の圧縮を行うのに非常に有効である。なお上
記第1、第2実施例では通常の差分値データと全体的に
1.2倍大きくした差分値データと全体的に0.8倍に
小さくした差分値データの3種類を使用しているがエン
ベロープの振幅変化の精度に合わせて差分値データテー
ブルROMを任意に設定して良いことは明らかである。
【図面の簡単な説明】
第1図は本発明の音声合成方式の第1実施例を示す回路
構成図、第2図は本発明の音声合成方式の第2実施例を
示す回路構成図、第3図は第1図の第1実施例で音声合
成を行うためのフローチャート、第4図は第2図の第2
実施例で音声合成を行うためのフローチャート、第5図
は合成した波形のサンプリングポイントを示す波形図で
ある。 101.201・・・Lレジスタ、 102.202・・・デコーダ、 103.203・・・リミッタ、 104.204・・・Aレジスタ、 105.205・・・A′ レジスタ、106.206
゜ 207.208・・差分値データテーブルROM。 209・・・・・・スイッチ、 107.210・・・Xレジスタ。 第3図 第4図

Claims (2)

    【特許請求の範囲】
  1. (1)複数のサンプリングポイントごとに出力波形振幅
    データを形成して出力する音声合成方式において、初期
    値または各サンプリングポイントに先行するサンプリン
    グポイントの量子化幅ポインタの値を一時的に記憶する
    第1の記憶手段と、各サンプリングポイントにおけるA
    DPCM符号データと上記第1の記憶手段に記憶されて
    いる初期値または先行するサンプリングポイントにおけ
    る量子化幅ポインタの値とに基づき差分値を出力する差
    分値供給手段と、各サンプリングポイントにおけるAD
    PCM符号データと上記第1の記憶手段に記憶されてい
    る初期値または先行するサンプリングポイントにおける
    量子化幅ポインタの値とに基づき後続するサンプリング
    ポイントのための量子化幅ポインタの値を形成し、該後
    続するサンプリングポイントのための量子化幅ポインタ
    の値を上記第1の記憶手段に記憶させる量子化幅ポイン
    タ更新手段と、初期値または各サンプリングポイントに
    おける出力波形振幅データを一時的に記憶し、外出力波
    形振幅データを出力する第2の記憶手段と、上記差分値
    を上記第2の記憶手段に一時的に記憶されている初期値
    または先行するサンプリングポイントにおける出力波形
    振幅データに加算して各サンプリングポイントにおける
    出力波形振幅データを形成し、該出力波形振幅データを
    上記第2の記憶手段に記憶させる出力波形振幅データ更
    新手段と、複数の出力波形振幅データを出力するごとに
    第1の記憶手段と第2の記憶手段とにそれぞれの初期値
    を設定する初期値設定手段とを含むことを特徴とする音
    声合成方式。
  2. (2)上記差分値供給手段が複数組の差分値を有してお
    り、該差分値の複数組のうちの一つを選択し、該選択さ
    れた組から差分値を出力するようにした特許請求の範囲
    第1項記載の音声合成方式。
JP63067826A 1988-03-22 1988-03-22 音声合成方式 Expired - Lifetime JPH0769718B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63067826A JPH0769718B2 (ja) 1988-03-22 1988-03-22 音声合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63067826A JPH0769718B2 (ja) 1988-03-22 1988-03-22 音声合成方式

Publications (2)

Publication Number Publication Date
JPH01239599A true JPH01239599A (ja) 1989-09-25
JPH0769718B2 JPH0769718B2 (ja) 1995-07-31

Family

ID=13356140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63067826A Expired - Lifetime JPH0769718B2 (ja) 1988-03-22 1988-03-22 音声合成方式

Country Status (1)

Country Link
JP (1) JPH0769718B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683398A (ja) * 1992-08-31 1994-03-25 Nec Corp 音声合成方法及びその装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683398A (ja) * 1992-08-31 1994-03-25 Nec Corp 音声合成方法及びその装置

Also Published As

Publication number Publication date
JPH0769718B2 (ja) 1995-07-31

Similar Documents

Publication Publication Date Title
EP0714089B1 (en) Code-excited linear predictive coder and decoder, and method thereof
US5682502A (en) Syllable-beat-point synchronized rule-based speech synthesis from coded utterance-speed-independent phoneme combination parameters
JPH11259100A (ja) 励起ベクトルの符号化方法
JPH0160840B2 (ja)
JP3531780B2 (ja) 音声符号化方法および復号化方法
JPH10222197A (ja) 音声合成方法およびコード励振線形予測合成装置
JPH01239599A (ja) 音声合成方式
JP2674161B2 (ja) 音源データ圧縮符号化方法
US4633500A (en) Speech synthesizer
JP3283152B2 (ja) 音声パラメータ量子化装置およびベクトル量子化装置
JP2000298500A (ja) 音声符号化方法
JPS63118800A (ja) 波形合成方式
JPH0833742B2 (ja) 音声合成方式
JP4107085B2 (ja) 波形データ圧縮方法
JP3591451B2 (ja) データ処理装置およびデータ処理方法
JP3071800B2 (ja) 適応ポストフィルタ
JPH01216400A (ja) 音声合成方式
JPS59104699A (ja) 音声合成器
JP3351543B2 (ja) 信号処理方法
JPS5914760B2 (ja) Adpcm再生器
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
JP4007194B2 (ja) 音源装置
JPS6331800B2 (ja)
JPS6136800A (ja) 可変長フレ−ム音声分析合成方式
JPH0695677A (ja) 楽音合成装置