JPS5925236B2 - 音声合成器 - Google Patents

音声合成器

Info

Publication number
JPS5925236B2
JPS5925236B2 JP54145891A JP14589179A JPS5925236B2 JP S5925236 B2 JPS5925236 B2 JP S5925236B2 JP 54145891 A JP54145891 A JP 54145891A JP 14589179 A JP14589179 A JP 14589179A JP S5925236 B2 JPS5925236 B2 JP S5925236B2
Authority
JP
Japan
Prior art keywords
parameter
memory
input
gate
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54145891A
Other languages
English (en)
Other versions
JPS5669695A (en
Inventor
康彦 新居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Mobile Communications Co Ltd
Original Assignee
Matsushita Communication Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Communication Industrial Co Ltd filed Critical Matsushita Communication Industrial Co Ltd
Priority to JP54145891A priority Critical patent/JPS5925236B2/ja
Publication of JPS5669695A publication Critical patent/JPS5669695A/ja
Publication of JPS5925236B2 publication Critical patent/JPS5925236B2/ja
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声分析合成方式を用いた汎用性の高い音声合
成器に関するものである。
第1図はラテイスフイルタの構成要素であつて、101
は前段からの信号が加わる入力端子、102は前段への
フィードバック端子、111および112はそれぞれ加
算器、121および122はそれぞれ乗算器、140は
フィルタの伝達特性を与える反射係数の入力端子、13
1は後段への出力端子、132は後段からのフィードバ
ック端子、150は遅延素子である。
このような構成要素を複数段梯子状に接続することによ
り種々の伝達特性を有するデジタルフィルタが構成され
る。
ところ。でこのようなデジタルフィルタは従来、主に大
型の計算機、あるいは高速のマイクロコンピュータにプ
ログラムすることによつて実現されていた。以下、この
ようなデジタルフィルタを音声合成器に用いた場合につ
いて説明する。
前段からの入力信号をAn+1(i)、前段へのフィー
ドバック信号をBn+1(i)、後段への出力信号をA
n(i)、後段からのフィードバック信号をBn(i)
とすれば次式が成立する。
An(i)■ An+1(i)+KnBn(i−1)・
・・・・・〔1〕Bn+1(i)■Bn(i−1)−K
nAn(i)・・・・・・2ここで、n ■1|2|3
・・・・・・・・・NKn=第n段フィルタに与える反
射係数i■時間サイクル である。
音声を合成する場合、初段のフィードバック端子は開放
、最終段(n=1)の出力端は短絡とし、かつ、声道の
伝達特性を表わすような反射係数Knが与えられる。通
常このKnは実際の音声を線形予測分析することによつ
てあらかじめ決定しておく方法(分析合成の手法)が採
られている。また、Nは10程度で極めて自然性の高い
合成音が得られることがコンピユータシシユレーシヨン
によつて明らかにされている。式1,2を演算する際n
−Nから順次N−1,N−2,・・・2,1の順序で演
算を行ない、最終段出力A1(1)がフイルタ・の出力
信号となる。フイルタを駆動する入力信号(,駆動信号
)は、An+,(1)として印加する。1駆動信号は、
無声音を合成する場合には白色雑音、有声音を合成する
場合には周期性のパルス信号などが使用されている。
第2図はN=10とした時の上記の音声合成フイルタの
全体構成であつて、200は駆動信号発生器、300は
出力端子である。
第2図のフイルタをデジタル回路で実現する場合、19
回の乗算と19回の加算が必要となる。
通常は高速の乗算器と加算器を用いて繰返し演算する方
法が採られる。今、合声音声の信号帯域巾を5KHzと
すれば時間サイクルは100μsとなり、式〔1〕およ
び〔匂の計算をn−10からn=1にわたつて100t
ts以内に完了しなければならない。従つて乗算時間が
Tml加算時間がTaのとき、19(Tm+Ta)く1
00(μs) ・・・・・・〔Jでなければならない。
即ち、Tm+Taく5.263(μs) を満足させなければならない。
乗算と加算を並列に実行して加算時間がほぼ無視できた
としても、乗算を5μs程度で実行しなければならない
。高速乗算LSIを利用すれば、200ns程度で乗算
が実行できるが、消費電力が数ワツトに及び、全く実用
的でない。一方、特開昭54−7838号公報に記載さ
れたデジタルフイルタによれば、バイブライン処理方式
による乗算器を用いて、みかけ上の乗算速度を5μsと
しているが、乗算器の構成が極めて複雑となり、従つて
制御回路も増加する欠点を有している。また、上記公開
特許公報による「デジタルフイルタ」では有声音の合成
に用いる駆動波形がリードオンリーメモリ(ROM)に
記憶されており、変更が容易でない。さらに、反射係数
Knなどのパラメータを符号化する際のビツト割当てが
一義的に固定化されているために音声品質が固定化され
、応用面での汎用性に欠く難点があつた。この種の合成
器を、電話用自動応答装置、あるいは駅や空港における
自動案内放送装置に応用する場合、極めて高品質の音声
を出力することが要求され、かつ男声、女声、日本語、
英語、のように多彩な音声を出力できることが要求され
る。
本発明は全ての演算を1個の加算器を用いて時分割で処
理する方式を採用して回路構成を単純化すると共に、た
とえばパラメータのデコードおよびパラメータの伝送制
薗を汎用マイクロフンピユータで行なうようにして、音
声品質とコストのバランスが目的ごとに最適化できると
共に書き換え可能な駆動波形メモリを内蔵して、声質(
男声、女声、英語、日本語などによる声の相違)に合せ
て最適な駆動波形がマイクロコンピユータより随時転送
できるようにして、汎用性の高い音声合成器を実現しよ
うとするものである。以下、実施例とともに説明する。
第3図は全体システムの構成図であつて、10は起動入
力端子、11は汎用マイクロコンピユータ、12はパラ
メータメモリ、13は音声合成器、14はDA変換器、
15は低域淵波器、16は合成音声出力端子である。次
にこの実施例の動作について説明する。
マイクロコンピユータ11は初期設定モードでパラメー
タメモリ12から駆動波形を読み出して、合成器13へ
転送した後、待ち状態となる。起動入力端子10から信
号が入力されると、マイクロコンピユータ11はパラメ
ータメモリ12から音源パラメータ(音源のピツチおよ
び振巾を決定するパラメータ)およびラテイスフイルタ
の特性を決定するKパラメータ(反射係数)を読み出し
て合成器13へ転送する。なおこれらのパラメータはあ
らかじめ自然音声から抽出してパラメータメモリ12に
格納しておく。合成器13に各バラメータが転送される
と、第1式および第2式に従つて音声を合成し、順次D
A変換器14へ出力する。DA変換された合成音声信号
は低域済波器15でスムージングし、出力端子16より
取り出すようにしてある。なおマイクロコンピユータ1
1から合成器13へ転送するパラメータは12種であり
、前述のように、これらのパラメータは自然音声から抽
出しておくものである。
例えば、自然音声をサンプリング周波数10KHzでA
D変換(12ビツトPCM)した後、30msの窓関数
を掛け、これを20ms(フレーム周期)づつ移動させ
ながら分析する方法がとられる。フレームごとに抽出さ
れるパラメータはピツチパラメータ、振巾パラメータ、
および10個のKパラメータ(反射係数)である。これ
らのパラメータは20ms(フレーム周期)ごとにマイ
クロコンピユータ11から合成器13へ転送する。また
、パラメータメモリ12にはそれぞれのパラメータを符
号化して格納しておく。
例えば、ピツチパラメータには5ビツト、振巾パラメー
タには6ビツト、KパラメータにはK1から順に7,6
,5,4,4,4,3,3,3,3ビツトの符号が割当
てられる。フレーム周期、および各パラメータのビツト
配分は合成品質を規定する。特に、フレーム周期および
Kパラメータは合成品質を左右する重要なパラメータで
ある。ところで、合成品質を高くするためには、フレー
ム周期を10msあるいは5msと短くし、Kパラメー
タに多くのビツト(例えば、10,8,6,6,6,5
,5,5,4,4ビツト)を割当てる必要がある。従つ
て一定長(例えば1秒)の音声を合成するために必要な
パラメータメモリの記憶容量が増大して、コスト高とな
る。本実施例では任意のビツト配分に対するデコード、
および各種のフレーム周期(異なるフレーム周期の混在
を含む)に対するパラメータ伝送制御を全てマイクロコ
ンピユータ11で行なうようにして、合成品質とコスト
のバランスが目的ごとに最適化できるようにしている。
マイクロコンピユータ11のプログラムは全ての場合に
対処できるよう共通化(汎用化)し、パラメータメモリ
12の記憶形式によつて、マイクロコンピユータ11が
自動的に判断して処理できるようにしている。第4図は
合成器13の内部構成を示すものである。
マイクロコンピユータ11から転送される駆動波形は入
力端子1から駆動波形メモリ(EXiM)へ書き込まれ
、12個のパラメータは入力端子2から第1のパラメー
タメモリ(PMl)へ書き込まれるよらにしてある。第
2のパラメータメモリ(PM2)は合成演算に使われる
パラメータを記憶しておくためのもので、言い換えれば
フレーム間を2.5msごとにパラメータ補間した値を
記憶しておくためのものである。各パラメータはフレー
ムごとに一定の値であるが、なめらかな合成音声を得る
ために、通常2.5msごとに直線補間したものが使わ
れる。本実施例における補間は以下のように行なわれる
今、あるパラメータの現在値をa1次フレームの値をb
とし、フレーム間をL点補間するものとし、第1番目の
補間値をClとすると、である。
第4式では、A,b,Cn,.lおよびLを記憶するメ
モリを必要とする。パラメータは全部で12個(フレー
ム当り)であるから、A,b,Clにはそれぞれ12語
のメモリ(合計36語)が必要である。ただし1とLは
パラメータごとに共通に使用できるから2語で済む。本
実施例ではパラメータメモリを削減するため、第4式か
ら次式を導出する。
即ち、従つて、 を得る。
第5式を用いれば、パラメータメモリは、b(5C1の
2種類(合計24語)で良く、パラメータメモリPMl
とPM2を用いた第4図の構成でパラメータ補間が可能
となる。第4図で0Rゲート(0R2)はパラメータメ
モリPMlの内容(bに相当する)を直接パラメータメ
モリPM2へ転送する場合(補間演算不要の場合)と、
補間演算結果をPM2へ格納する場合の切換ゲートであ
る。1−Lの時はCL−bであり、補間演算は不要であ
る。
この場合、ゲート0R2を通して、パラメータメモリP
Mlの内容を直接PM2へ転送するようにしている。と
ころで、補間すべきパラメータは12個あり、1個の補
間演算には、減算2回加算1回、除算1回が必要であり
、1サンプリ当り100μsしかない合成演算(第1式
および第2式の演算)の合間に12回の補間演算を行な
うことは、到底不可能である。
シヨツトキ一TTLを用いて高速処理する場合でも、ク
ロツク周波数は高々5MHzであり、10段のラテイス
フイルタ演算(合成演算)に80μs〜90μsを要し
、100tts内では1回の補間演算しか実行できず、
全てのパラメータの同時補間(見かけ上の)は不可能で
ある。ところで本実施例では100μsまたは200μ
sごとにパラメータを1個づつ補間するようにしている
。200μsに1個づつ補間する場合、全てのパラメー
タが補間されるまで2.4msを要するが、これは2.
5msの補間周期以内であり、タイミング的には全く問
題ない。
それぞれのパラメータが時間差を持つて補間されること
による合成音声の品質劣化をコンピユータシミユレーシ
ヨンで確認したが、同時に補間した場合と全く遜色ない
ことがわかつた。マイクロコンピユータ11からパラメ
ータメモリPMlおよびPMlからPM2へのパラメー
タ転送タイミングは、全て補間演算タイミングに合せ、
各パラメータを100ttsまたは200μsづつ遅ら
せて順に転送するようにしている。
第4図におけるピツチコントローラ(PCNT)は、パ
ラメータメモリPM2から読み出したピツチパラメータ
を記憶するラツチと、駆動波形メモリ(EXiM)の1
番地指定を行なうアドレスカウンタ、およびアドレス比
較器で構成され、ピツチパラメータで指定された時間長
を有する駆動波形をメモリEXiMから読み出すように
メモリEXiMの番地を制両する。ピツチパラメータ1
0F?の時は0Rゲート(0R1)をランダム雑音発生
器(RN4)側に切換えるようにしている。一方ピツチ
パラメータが1701の時は音源が無周期性であること
を意味し、従つてランダム雑音でラテイスフイルタを駆
動するようにしている。ゲート0R1の出力とパラメー
タメモリPM2に記憶されている振巾パラメータの積が
第1式におけるAn+1(1)であり、この乗算は演算
器(ALu)で行なうようにしている。即ち、ゲート0
R1の出力を0Rゲート(0R3)を経て演算器ALu
のY端子に入力し、パラメータメモリPM2から読み出
した振巾パラメータを演算器(ALu)のX端子に入力
し、両者の積をZ端子から取り出して一時記憶レジスタ
(TREG)に格納するようにしている。遅延反射信号
メモリ(BSTC)は10個のメモリで構成され、第1
式、第2式におけるBlO(1一1),B9(1−1)
,・・・,B1(1−1)を記憶しておくために使用す
る。
Bn(1−1)はBn(1)を100!Ts遅らせた値
であり、1サイクル(100μs)前の時間サイクルに
第2式によつて算出された値である。次に第1式の演算
手順について説明する。
前述のようにAn+1(1)はレジスタTREGに、ま
た、Bn(1−1)はメモリBSTCに格納されている
。ここでメモリPM2からKnを読み出して演算器AL
u(1)X端子から入力し、続いてBSTCからBn(
1−1)を読み出して0Rゲート(0R3)を通して演
算器(ALu)のY端子から入力して両者の乗算を行な
う。結果は演算器ALu内部のB1およびCレジスタに
セツトされるようにしてある。BおよびCレジスタはシ
フトレジスタで構成し、乗算結果の有効ビツトのみがB
レジスタにセツトできるようにしてある。有効ビツトを
Bレジスタにセツトした後(即ち、Kn−Bn(1−1
)をBレジスタにセツトした後)TREGよりAn+1
(1)を読み出して演算器ALuのY端子より入力して
加算を行なう。この時、Y端子からの入力は演算器AL
u内部のAレジスタにセツトされ、Aレジスタの内容と
Bレジスタの内容を加算すると、加算結果がBレジスタ
にセツトされるようにしてある。従つてKO・BnG−
1)+An+1(1)がBレジスタにセツトされる。こ
こでBレジスタの内容をレジスタ(TREG)へ転送し
、An+1(1)をA。(1)に更新する。続いて第2
式の演算手順について説明する。まずメモリ(PM2)
からKnを読み出して演算器ALu(7)X端子から入
力し、続いて、AnをレジスタTREGから読み出して
ゲート0R3を経て演算器ALuO)Y端子から入力し
て両者の乗算を行なう。乗算結果の有効ビツトがBレジ
スタにセツトされた後、メモリBSTCよりBO(1−
1)を読み出して、ゲート0R3を経て演算器ALuの
Y端子へ入力する。Y端子からの入力は演算器ALU内
部のAレジスタにセツトされる。ここで、Aレジスタの
内容からBレジスタの内容を減算する。その結果は、B
レジスタにセツトされるようにしてあるから、Bn(1
−1)−Kn−An(1)すなわち、Bn+1(1)が
Bレジスタにセツトされる。これをZ端子より取り出し
て、(BSTC)へ格納し、Bn+1(1−1)の値を
更新する。以上のような、合成演算処理をn=10から
順に、n−1まで繰返すごとに、合成音声データが1個
づつ得られる。第2図に示した通り、出力データはA1
(1)(これはB1(1)に等しい)であり、A1(1
)は第4図のZ端子より取り出して出力レジスタ0RE
Gにセツトするようにしている。ここで音声分析の際の
サンプリング周波数を10KHzとすれば、合成音声デ
ータが100μsの時間サイクルごとに出力されること
になる。なお、演算器(ALu)はA,B,Cの各レジ
スタおよび1個の並列加算器で構成されている。
X端子からの入力はCレジスタにセツトし、Y端子から
の入力はAレジスタにセツトするようにしている。Aレ
ジスタの内容とBレジスタの内容を並列加算器で加算し
、その結果はBレジスタにセツトする。減算は減数の補
数を被減数に加算する方法を採用しており、Aレジスタ
の内容からBレジスタの内容を減算した結果をBレジス
タにセツトする。Bレジスタの内容からAレジスタの内
容を減算した結果も、同様にBレジスタにセツトする。
乗算はブースの2次のアルゴリズムを用いて、加算およ
び減算に置き換えて実行している。B,Cレジスタに乗
算結果が得られる。除算は減算を繰返すことによつて実
現している。次に制御方式の概要について説明する。
第4図において、CGENはクロツク発生器で、基本ク
ロツク(5MHz)およびこれを分周した複数個の信号
を出力するようにしている。CMEMは制圓情報メモリ
で、先に詳述した演算手順に従つて合成器が動作するよ
うに制脚タイミングを規定するためのものである。TD
ECはタイミングデコーダで、メモリCGENの内容に
従つてその出力をデフードして全体の制御信号を作り出
すためのものである。以上実帷例により説明したが、本
発明l計戴的単純な回路構成の音成合成器と内用マソク
ロコンピユータの組合せにより、極めて汎用性の高い音
成合成システムが実現でき、駅や空港における自動案内
放送装置のように高品質の合成音が要求される場合はも
ちろんのこと、玩具等の広汎な製品に応用できる。
【図面の簡単な説明】
第1図はラテイスフイルタの構成要素のプロツク図、第
2図は従来の音声合成フイルタの構成図、第3図は本発
明の一実施例による音成合成器を用いた装置のプロツク
図、第4図は本発明の一実施例による音成合成器のプロ
ツク図、第5図はパラメータ補間の説明図である。 ALU・・・・・・演算器、PMl,PM2・・・・・
・パラメータメモ1八0R1,0R2,0R3・・・・
・・0Rゲート。

Claims (1)

    【特許請求の範囲】
  1. 1 第1および第2の入力端子を有し、1個の並列加算
    器および複数個のレジスタで構成される四則演算器と、
    入力端が前記四則演算器の出力端子に接続され、かつ出
    力端子が第1のORゲートを介して上記四則演算器の第
    2の入力端に接続された1語長の一時記憶レジスタ、お
    よび同様に接続されたn語長(nは正整数)の遅延反射
    信号メモリと、外部から書き換え可能なm語長(mは正
    整数)の駆動波形メモリおよびランダムパルス発生器と
    を有し、上記駆動波形メモリおよびランダムパルス発生
    器の出力を第2のORゲートおよび上記第1のORゲー
    トを介して上記四則演算器の第2の入力端に接続し、外
    部から入力される制御パラメータを記憶する(n+2)
    語長の第1のパラメータメモリおよび補間されたパラメ
    ータを記憶する(n+2)語長の第2のパラメータメモ
    リを有し、第1のパラメータメモリの出力端を上記第1
    のORゲートを介して上記四則演算器の第2の入力端に
    接続すると共に第3のORゲートを介して第2のパラメ
    ータメモリの入力端に接続し、上記四則演算器の出力端
    を前記第3のORゲートを介して第2のパラメータメモ
    リの入力端に接続し、第2のパラメータメモリの出力端
    を上記四則演算器の第1の入力端に接続すると共に第1
    のORゲートを介して上記四則演算器の第2の入力に接
    続して成る音声合成器。
JP54145891A 1979-11-09 1979-11-09 音声合成器 Expired JPS5925236B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP54145891A JPS5925236B2 (ja) 1979-11-09 1979-11-09 音声合成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP54145891A JPS5925236B2 (ja) 1979-11-09 1979-11-09 音声合成器

Publications (2)

Publication Number Publication Date
JPS5669695A JPS5669695A (en) 1981-06-11
JPS5925236B2 true JPS5925236B2 (ja) 1984-06-15

Family

ID=15395432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54145891A Expired JPS5925236B2 (ja) 1979-11-09 1979-11-09 音声合成器

Country Status (1)

Country Link
JP (1) JPS5925236B2 (ja)

Also Published As

Publication number Publication date
JPS5669695A (en) 1981-06-11

Similar Documents

Publication Publication Date Title
US4435832A (en) Speech synthesizer having speech time stretch and compression functions
US4577343A (en) Sound synthesizer
US4393272A (en) Sound synthesizer
US4209844A (en) Lattice filter for waveform or speech synthesis circuits using digital logic
US4344148A (en) System using digital filter for waveform or speech synthesis
JPH0160840B2 (ja)
US4541111A (en) LSP Voice synthesizer
US4489437A (en) Speech synthesizer
US4653099A (en) SP sound synthesizer
US4601052A (en) Voice analysis composing method
JPS5925236B2 (ja) 音声合成器
KR0147758B1 (ko) Mpeg-2 오디오 복호화기의 합성 필터
CA1118104A (en) Lattice filter for waveform or speech synthesis circuits using digital logic
GB2059726A (en) Sound synthesizer
JPS6239758B2 (ja)
JP3252296B2 (ja) 波形データ出力装置
JPS58200296A (ja) 包絡線信号発生方法
JPH0664477B2 (ja) 音声合成装置
JPS5952840B2 (ja) 音声合成器の補間装置
JPH0695677A (ja) 楽音合成装置
KR840002361B1 (ko) 디지탈 필터
JPS58200294A (ja) 包絡線信号発生装置
JPH02179696A (ja) 処理装置
JP2755590B2 (ja) 音声合成装置
CA1170370A (en) Sound synthesizer