JPS645720B2

JPS645720B2 -

Info

Publication number: JPS645720B2
Application number: JP56011871A
Authority: JP
Inventors: Takuro Fukuichi; Yasuo Kusumoto; Sumio Fujita; Hideji Kawamura
Original assignee: Seiko Instruments Inc
Current assignee: Seiko Instruments Inc
Priority date: 1981-01-29
Filing date: 1981-01-29
Publication date: 1989-01-31
Also published as: GB2093668A; GB2093668B; JPS57125999A; US4489437A

Description

【発明の詳細な説明】

この発明は、PARCOR方式で代表される線形
予測符号化方式の音声分析合成手法に基づく音声
合成装置に関する。最近実用化されたPARCOR方式の音声合成装
置では、合成時の各種パラメータの更新周期、即
ちフレーム長を一定とした固定長フレーム方式が
採用されており、そのフレーム周期を比較的大き
く選んで、合成に必要な情報量を少なくすること
が計られ、その結果、合成回路を１チツプのLSI
で実現できるまでになつている。また、合成パラ
メータの時間的変化が滑らかになるように、フレ
ーム途中のパラメータを補間により変化させる補
間処理が一般に行なわれるが、この補間処理によ
る音質向上を充分得るには、フレーム周期をある
程度短くして、もとの合成パラメータの時間的変
化をある程度滑らかにしておく必要がある。この
面で、従来のこの種の音声合成装置では、充分満
足のいく合成音声の音質が得られていないのが実
状である。 PARCOR方式の音声分析合成の一手法として、
ピツチの存在する有音声についてその１ピツチを
１フレームの基本時間とし、従つて原音声のピツ
チ変化によりフレーム周期も変化させる可変長フ
レーム方式がある。この方式によれば、固定長フ
レームに比べて良好な合成音質が得られる反面、
合成に必要な情報量が増大するという問題があ
る。この発明は、上述のような技術的背景に鑑みな
されたもので、その目的は、PARCOR方式で代
表される線形予測符号化方式で、かつ上述の可変
長フレーム方式の音声分析合成手法に基づく音声
合成装置において、ほぼ同一波形の連続する音声
の合成を繰返し処理（リピート処理）により行な
うようにして、合成に必要な情報量を大幅に減ら
すとともに、可変長フレームおよびリピート処理
の中で適切な合成パラメータの補間処理を行なう
ようにして、良好な合成音質を得るようにした音
声合成装置を提供することにある。以下、この発明の一実施例を図面に基づいて詳
細に説明する。図に示すのは、本発明に係る音声合成装置の要
部である合成回路のブロツク図であり、図中のス
ピーカ１およびその駆動回路２等を除くほぼ全体
が１チツプのLSIで構成されている。周知のよう
に、この合成回路に対して、図示しないマイクロ
プロセツサの制御により、音声ROMに蓄えられ
た分析音声データが所定の手順で順次与えられ
る。詳述すると、本合成回路におけるカウンタ３か
ら後述のように発生するデータ要求信号REQに
応答し、マイクロプロセツサ側から次に示す１フ
レーム分の音声データが、バスライン４に供給さ
れる。

【表】周知のように、PARCOR係数k_iはデイジタル
フイルタ部５の伝達特性を決定するパラメータで
あり、振幅データAMP、ピツチデータPITCHお
よびリピート回数REPEATは、有声音合成の際
にデイジタルフイルタ部５に入力する音源信号と
してのパルス信号の振幅，周期およびパルス数を
決定する情報である。ここで、リピート回数
REPEATが１である場合、分析合成音のピツチ
（周期）とフレーム周期とが一致し、完全な可変
長フレームとなる。ところが本発明においては、
同一ピツチでほぼ同一波形の有声音の合成を、そ
の１周期に１フレームを割当てるのではなく、リ
ピート回数REPEATに必要な繰返し周期数を与
えることで行なうようにしており、その結果、通
常の音声合成に必要となる情報量を実質的に大幅
に削減することができる。また無声音の合成時には、ノイズ発生器６から
のランダムノイズ（極性がランダムなパルス信
号）のデイジタル符号化し、デイジタルフイルタ
部５に音源信号として入力するが、その際に、上
記振幅データAMPによつて上記ノイズの振幅が
決定され、上記ピツチデータPITCHおよびリピ
ート回数REPEATでもつてノイズ印加の経続時
間が決定される。なお、無声音に関しては、分析
時のフレーム（分析窓）を一定とし、従つてピツ
チデータPITCHを一定とし、リピート回数
REPEATで実質的に合成時のフレーム周期を適
宜に決定するようにしている。上記の如く、マイクロプロセツサから与えられ
る１フレーム分の音声データの合成処理は、（PITCH）×（REPEAT）＝T_f で表わされる時間T_fで演算実行されるのであり、
この時間T_f、即ちフレーム間隔は、与えられる
音声データに応じて随時変化する。前記音声データ表中の最後の補間周期分類信号
Ｎは、上記フレーム間隔T_fに応じて、その時間
T_fを何等分した値をPARCOR係数k_iの補間周期
△ｔとするかを示す信号である。つまり、△ｔ＝
T_f／Ｎであり、フレーム間隔T_f中にPARCOR係
数k_iについて周期△ｔで（Ｎ―１）回の補間を行
なうことを示している。ここで、実施例について具体的数値をあげて説
明すると、本実施例では、リピート回数
REPEATを１，２，４，８，…という２の累乗
の値に制限をし、また補間周期分類信号Ｎを４，
８，16，32という２の累乗値の４種に制限し、
T_fとＮとの関係を次の表のように定めている。

【表】上記の表から明らかなように、k_iについての補
間周期△ｔ＝T_f／Ｎは、補間の効果が充分に表
われる2.5ｍsec以下となるようにしている。また本実施例では、PARCOR係数k_iの補間に
加えて、リピート回数REPEATが１でない場合、
つまり繰返し処理を行なう場合に、振幅データ
AMPをT_fの間一定とするのではなく、次のフレ
ームデータの振幅との間を滑らかに変化させるべ
く、AMPの補間も行なう。次に、回路動作について詳述する。まず、表１に示した１フレーム分の音声データ
がバスライン４に順次供給されると、本合成回路
の制御部７の制御により、PARCOR係数k_iはメ
モリ８ａに、振幅データAMPはメモリ９ａに、
ピツチデータPITCHはメモリ１０ａに、リピー
ト回数REPEATはメモリ１１ａに、補間周期分
類信号Ｎはメモリ１２ａに、有声音／無声音識別
信号Ｖ／UVはメモリ１３ａにそれぞれ取込まれ
る。次に制御部７からの信号により、メモリ８ａ
の記憶データk_iはメモリ８ｂに、メモリ９ａの記
憶データAMPはメモリ９ｂに、メモリ１０ａの
記憶データPITCHはメモリ１０ｂに、メモリ１
１ａの記憶データREPEATはメモリ１１ｂに、
メモリ１２ａの記憶データＮはメモリ１２ｂに、
メモリ１３ａの記憶データＶ／UVはメモリ１３
ｂにそれぞれ転送される。次にマイクロプロセツ
サ側に要求を発し、後続する次のフレームの音声
データをバスライン４に送出させ、その新たに供
給される次のフレームの音声データのうち、
PARCOR係数k_iはメモリ８ａに、AMPはメモリ
９ａに、PITCHはメモリ１０ａに、REPEATは
メモリ１１ａに、信号Ｎはメモリ１２ａに、信号
Ｖ／UVはメモリ１３ａにそれぞれ格納される。即ち、メモリ８ｂ〜１３ｂに最初のフレームの
音声データDATA１が格納され、メモリ８ａ〜
１３ａに次のフレームの音声データDATA２が
格納される。そしてDATA１の合成時に、
DATA２のPARCOR係数k_i，振幅データAMPを
参照して、その変化を滑らかにすべく補間処理が
行なわれる。ここでDATA１中のPARCOR係
数，振幅データをそれぞれk_i1，AMP₁と表わし、
DATA２中のそれぞれをk_i2，AMP₂と表わす。 PARCOR係数の補間に必要な前処理について
説明する。まず、前述した補間周期△ｔを求める動作につ
いて説明する。メモリ１０ｂに格納されたピツチ
データPITCHは乗算回路として機能するシフト
回路１４にプリセツトされる。またメモリ１１ｂ
に格納されたリピート回数REPEATは上記シフ
ト回路１４の内容を桁上げするシフト信号として
印加される。REPEATは前述のように、2ⁿ＝１，
２，４，８，……の値をとるように決められてい
るので、シフト回路１４をｎビツトシフトアツプ
することにより、シフト回路１４の内容は、 T_f＝（PITCH）×（REPEAT）となる。このデータT_fは除乗回路として機能す
るシフト回路１５にプリセツトされる。またメモ
リ１２ｂに格納された補間周期分類信号Ｎは、上
記シフト回路１５の内容を桁下げするシフト信号
として印加される。信号Ｎは前述のように、2^m＝
４，８，16，32の値をとるように決められている
ので、シフト回路１５をｍビツトシフトダウンす
ることにより、シフト回路１５の内容は、 △ｔ＝T_f／Ｎとなる。この補間周期△ｔは、プリセツタブルダ
ウンカウンタ１６にプリセツトされる。このカウ
ンタ１６は、合成開始後クロツク信号CK（分析時
のサンプリング周波数と等しく、例えば、10KHz
に選ばれる）によつてダウンカウントされ、△ｔ
時間経過する毎に、カウントアツプ信号Ｃ１を出
力する。この信号Ｃ１は、PARCOR係数の補間
回路１７に対して補間タイミング信号として印加
される。また補間回路１７における前処理として、メモ
リ８ｂのk_i1とメモリ８ａのk_i2とから、１回の補
間により加減算すべき補間値、即ち次式で示す補
間値△k_iを求め、これを補間値メモリ１８に格納
する。 △k_i＝k_i2−k_i1／Ｎこの△k_iを算出するのに、まず、メモリ８ｂ中
のk_i1、および切換ゲート１９を介してメモリ８
ａの中のk_i2が補間回路１７に取込まれ、該回路
において（k_i2−k_i1）が演算され、その演算結果
は補間回路１７中のシフト回路（図示省略、シフ
ト回路１５と同様に除算回路として機能する）に
プリセツトされる。このシフト回路に対してメモ
リ１２ｂに格納され補間周期分類信号Ｎが桁下げ
シフト信号として印加され、その結果、前述のよ
うに、（k_i2−k_i1）／Ｎが求まり、その値△k_iが補
間値メモリ１８に格納される。勿論、以上の演算
はｉ＝１〜10の10種類のパラメータについてそれ
ぞれ時分割的に高速に行なわれる。振幅データAMPの補間回路２０にても、同様
な前処理が行なわれる。AMPの補間周期は
PITCHであり、補間回数は（REPEAT―１）で
ある。従つて、補間値△AMPは次式で与えられ
る。 △AMP＝AMP₂−AMP₁／REPEAT この値△AMPを求める動作は、前記△k_iの場
合とほぼ同様で、メモリ９ｂ中のAMP₁、および
切換ゲート２１を介してメモリ９ａ中のAMP₂が
補間回路２０に取込まれ、該回路において、
（AMP₂−AMP₁）が演算され、除算回路として
機能するシフト回路（図示省略）にプリセツトさ
れる。そのシフト回路に対してメモリ１１ｂ中の
REPEATが桁下げシフト信号として印加され、
その結果、前式の△AMPが求まり、その値、△
AMPは補間値メモリ２２に格納される。また、合成開始時に、メモリ１０ｂ中の
PITCHおよびメモリ１１ｂ中のREPEATはプリ
セツトブルダウンカウンタ２３および３にそれぞ
れプリセツトされる。カウンタ２３は、前述のク
ロツクCKによつてダウンカウントされ、PITCH
時間経過する毎にカウントアツプ信号Ｃ２を出力
する。カウンタ３は、上記カウントアツプ信号Ｃ
２によつて順次カウントダウンされ、そのカウン
トアツプ信号Ｃ３は、前に述べたデータ要求信号
REQとして出力される。また、カウンタ２３のカウントアツプ信号Ｃ２
は、AMPの補間回路２０に対して補間タイミン
グ信号として印加される。また、このカウントア
ツプ信号Ｃ２より若干遅れて発生するカウンタ２
３のプリセツト信号PSは、有声音源信号を送り
出すゲート２４の開信号として印加される。合成動作時において、PARCOR係数の補間回
路１７に補間タイミング信号Ｃ１が印加される
と、補間回路１７は、メモリ８ｂ中のk_i1を取込
むとともに、ゲート１９を介して補間値メモリ１
８中の補間値△k_iを取込み、（k_i1＋△k_i）を演算
し、その演算結果をゲート２７を介してデイジタ
ルフイルタ部５に印加すると同時に、メモリ８ｂ
中のデータk_i1も（k_i1＋△k_i）に書き換える。従
つて、補間タイミング信号Ｃ１が発生する毎に、
メモリ８ｂの内容およびデイジタルフイルタ部５
に供給されるPARCOR係数は、 k_i1 ↓ k_i1＋△k_i ↓ k_i1＋２△k_i ↓ k_i1＋３△k_i 〓と変化する。 AMPの補間回路２０においても同様で、補間
タイミング信号Ｃ２が印加されると、ゲート２１
を介して補間値メモリ２２中の補間値△AMPを
取込み、該補間回路２０に一時記憶している。
AMP₁と加算し、その結果（AMP₁＋△AMP）
を出力するとともに、該回路２０に一時記憶する
データをAMP₁から（AMP₁＋△AMP）に更新
する。従つて、補間タイミング信号Ｃ２が発生す
る毎に、補間回路２０から出力される振幅データ
は、 AMP₁ ↓ AMP₁＋△AMP ↓ AMP₁＋２△AMP ↓ AMP₁＋３△AMP 〓と変化する。メモリ１３ｂに格納された有声音／無声音識別
信号Ｖ／UVは、切換ゲート２５に切換信号とし
て印加される。信号Ｖ／UVが有声音を示すと
き、切換ゲート２５は（Ｖ）側に切換えられ、こ
の場合には、カウンタ２３のプリセツト信号PS
につて極く短時間だけゲート２４が開かれたと
き、AMP補間回路２０から出力されている振幅
データがゲート２４，２５を介してデイジタルフ
イルタ部５に音源信号として印加される。また信号Ｖ／UVが無声音を示すとき、切換ゲ
ート２５は（UV）側に切換えられる。この場
合、ノイズ発生器６からのランダムノイズに基づ
き、振幅符号制御回路２６において、AMP補間
回路２０から出力されている振幅データに対応
し、極性がランダムに変化するデイジタル符号化
されたランダムノイズが作られ、そのノイズがゲ
ート２５を介してデイジタルフイルタ部５に音源
信号として印加される。デイジタルフイルタ部５において、上記音源信
号とPARCOR係数に基づいてデイジタル的に音
声波形が合成され、そのデイジタル出力はまるめ
回路２８，Ｄ／Ａ変換器２９を経て、アナログの
音声波形となり、駆動回路２を介してスピーカ１
からの音響的に出力される。そして、１フレーム分の音声データDATA１
の合成処理が終了すると、カウンタ３からデータ
要求信号REQが出力される。これに応動して、
メモリ８ａ〜１３ａに格納されていた第２フレー
ム目の音声データDATA２をメモリ８ｂ〜１３
ｂに転送するとともに、バスライン４に供給され
る第３フレーム目の音声データDATA３をメモ
リ８ａ〜１３ａに格納する。この状態から、前記
と同様に、第２フレーム目の音声データDATA
２の合成処理が、第３フレーム目の音声データ
DATA３中のk_i3とAMP₃を参照しての補間を行
ないながら実行される。なお上記実施例においては、各フレーム毎に
T_fに対応した分類信号Ｎを予め音声データとし
て与えるようにしたが、合成回路中において、シ
フト回路１４の出力T_fに基づいてＮおよび△ｔ
を決定する回路部を設けても良い。以上詳細に説明したように、本発明は、線形予
測符号化方式の音声合成手法に基づく音声合成装
置であつて、分析合成音の１ピツチを１フレーム
の基本時間とし、かつ同一波形の繰返しをリピー
ト回数として与える可変長フレーム方式とし、与
えられる音声データ中のピツチとリピート回数と
からフレーム間隔を求める回路部と、求められた
フレーム間隔に対応して補間周期を決定し、その
補間周期と相前後する２フレームの合成パラメー
タとから補間１回当りの補間値を求める回路部
と、上記補間タイミング信号と上記補間値とに基
づいて上記合成パラメータを順次補間する回路部
とを有することを特徴とするものである。つま
り、繰返し処理の採用により、合成に必要な情報
量を大幅に削減できるとともに、フレーム間隔の
大・小に係わらず、各フレーム間隔に応じて適切
な合成パラメータの補間が行なえ、良好な合成音
質を得ることができるのである。

【図面の簡単な説明】

図は、本発明に係る音声合成装置の一実施例を
示すブロツク図である。１……スピーカ、４……バスライン、１７……
PARCOR係数補間回路、１８……補間値メモリ、
T_f……フレーム間隔、△ｔ……補間周期。

Claims

【特許請求の範囲】１線形予測符号化方式の音声合成手法に基づく
音声合成装置であつて、原音声の１ピツチを基本
時間とし、かつほぼ同一波形の繰返しをリピート
回数として与え（１ピツチ）×（リピート回数）を
１フレーム長とする可変長フレーム方式とし、与
えられる音声データ中のピツチデータとリピート
回数からフレーム間隔を求める回路部と、求めら
れたフレーム間隔に対応して補間周期を決定し、
その補間周期毎に補間タイミング信号を発生する
回路部と、上記補間周期と相前後する２フレーム
の合成パラメータとから補間１回当りの補間値を
求める回路部と、上記補間タイミング信号と上記
補間値とに基づいて上記合成パラメータを順次補
間する回路部とを有することを特徴とする音声合
成装置。２上記リピート回数を2ⁿとし、上記（１ピツ
チ）×（リピート回数）の乗算を（１ピツチ）デー
タのシフトのみで行なう演算回路を備え、かつ、
フレーム間隔が10ｍsec以下の場合には、１フレ
ームに（2²―１）回、10〜20ｍsecの場合には
（2³―１）回、20〜40ｍsecの場合には（2⁴―１）
回、40ｍsec以上の場合には（2⁵―１）回の補間
を行なうように定め、補間周期の演算を（１ピツ
チ）×（リピート回数）の値を2ⁿで除する、すなわ
ち、ｎビツトの右シフトのみで行なう演算回路を
備えた特許請求の範囲第１項記載の音声合成装
置。