JPS645720B2 - - Google Patents
Info
- Publication number
- JPS645720B2 JPS645720B2 JP56011871A JP1187181A JPS645720B2 JP S645720 B2 JPS645720 B2 JP S645720B2 JP 56011871 A JP56011871 A JP 56011871A JP 1187181 A JP1187181 A JP 1187181A JP S645720 B2 JPS645720 B2 JP S645720B2
- Authority
- JP
- Japan
- Prior art keywords
- interpolation
- pitch
- circuit
- frame
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000034 method Methods 0.000 claims abstract description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 34
- 238000003786 synthesis reaction Methods 0.000 claims description 34
- 238000001308 synthesis method Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 description 54
- 239000011295 pitch Substances 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101710170231 Antimicrobial peptide 2 Proteins 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- HODRFAVLXIFVTR-RKDXNWHRSA-N tevenel Chemical compound NS(=O)(=O)C1=CC=C([C@@H](O)[C@@H](CO)NC(=O)C(Cl)Cl)C=C1 HODRFAVLXIFVTR-RKDXNWHRSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/04—Selecting arrangements for multiplex systems for time-division multiplexing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この発明は、PARCOR方式で代表される線形
予測符号化方式の音声分析合成手法に基づく音声
合成装置に関する。 最近実用化されたPARCOR方式の音声合成装
置では、合成時の各種パラメータの更新周期、即
ちフレーム長を一定とした固定長フレーム方式が
採用されており、そのフレーム周期を比較的大き
く選んで、合成に必要な情報量を少なくすること
が計られ、その結果、合成回路を1チツプのLSI
で実現できるまでになつている。また、合成パラ
メータの時間的変化が滑らかになるように、フレ
ーム途中のパラメータを補間により変化させる補
間処理が一般に行なわれるが、この補間処理によ
る音質向上を充分得るには、フレーム周期をある
程度短くして、もとの合成パラメータの時間的変
化をある程度滑らかにしておく必要がある。この
面で、従来のこの種の音声合成装置では、充分満
足のいく合成音声の音質が得られていないのが実
状である。 PARCOR方式の音声分析合成の一手法として、
ピツチの存在する有音声についてその1ピツチを
1フレームの基本時間とし、従つて原音声のピツ
チ変化によりフレーム周期も変化させる可変長フ
レーム方式がある。この方式によれば、固定長フ
レームに比べて良好な合成音質が得られる反面、
合成に必要な情報量が増大するという問題があ
る。 この発明は、上述のような技術的背景に鑑みな
されたもので、その目的は、PARCOR方式で代
表される線形予測符号化方式で、かつ上述の可変
長フレーム方式の音声分析合成手法に基づく音声
合成装置において、ほぼ同一波形の連続する音声
の合成を繰返し処理(リピート処理)により行な
うようにして、合成に必要な情報量を大幅に減ら
すとともに、可変長フレームおよびリピート処理
の中で適切な合成パラメータの補間処理を行なう
ようにして、良好な合成音質を得るようにした音
声合成装置を提供することにある。 以下、この発明の一実施例を図面に基づいて詳
細に説明する。 図に示すのは、本発明に係る音声合成装置の要
部である合成回路のブロツク図であり、図中のス
ピーカ1およびその駆動回路2等を除くほぼ全体
が1チツプのLSIで構成されている。周知のよう
に、この合成回路に対して、図示しないマイクロ
プロセツサの制御により、音声ROMに蓄えられ
た分析音声データが所定の手順で順次与えられ
る。 詳述すると、本合成回路におけるカウンタ3か
ら後述のように発生するデータ要求信号REQに
応答し、マイクロプロセツサ側から次に示す1フ
レーム分の音声データが、バスライン4に供給さ
れる。
予測符号化方式の音声分析合成手法に基づく音声
合成装置に関する。 最近実用化されたPARCOR方式の音声合成装
置では、合成時の各種パラメータの更新周期、即
ちフレーム長を一定とした固定長フレーム方式が
採用されており、そのフレーム周期を比較的大き
く選んで、合成に必要な情報量を少なくすること
が計られ、その結果、合成回路を1チツプのLSI
で実現できるまでになつている。また、合成パラ
メータの時間的変化が滑らかになるように、フレ
ーム途中のパラメータを補間により変化させる補
間処理が一般に行なわれるが、この補間処理によ
る音質向上を充分得るには、フレーム周期をある
程度短くして、もとの合成パラメータの時間的変
化をある程度滑らかにしておく必要がある。この
面で、従来のこの種の音声合成装置では、充分満
足のいく合成音声の音質が得られていないのが実
状である。 PARCOR方式の音声分析合成の一手法として、
ピツチの存在する有音声についてその1ピツチを
1フレームの基本時間とし、従つて原音声のピツ
チ変化によりフレーム周期も変化させる可変長フ
レーム方式がある。この方式によれば、固定長フ
レームに比べて良好な合成音質が得られる反面、
合成に必要な情報量が増大するという問題があ
る。 この発明は、上述のような技術的背景に鑑みな
されたもので、その目的は、PARCOR方式で代
表される線形予測符号化方式で、かつ上述の可変
長フレーム方式の音声分析合成手法に基づく音声
合成装置において、ほぼ同一波形の連続する音声
の合成を繰返し処理(リピート処理)により行な
うようにして、合成に必要な情報量を大幅に減ら
すとともに、可変長フレームおよびリピート処理
の中で適切な合成パラメータの補間処理を行なう
ようにして、良好な合成音質を得るようにした音
声合成装置を提供することにある。 以下、この発明の一実施例を図面に基づいて詳
細に説明する。 図に示すのは、本発明に係る音声合成装置の要
部である合成回路のブロツク図であり、図中のス
ピーカ1およびその駆動回路2等を除くほぼ全体
が1チツプのLSIで構成されている。周知のよう
に、この合成回路に対して、図示しないマイクロ
プロセツサの制御により、音声ROMに蓄えられ
た分析音声データが所定の手順で順次与えられ
る。 詳述すると、本合成回路におけるカウンタ3か
ら後述のように発生するデータ要求信号REQに
応答し、マイクロプロセツサ側から次に示す1フ
レーム分の音声データが、バスライン4に供給さ
れる。
【表】
周知のように、PARCOR係数kiはデイジタル
フイルタ部5の伝達特性を決定するパラメータで
あり、振幅データAMP、ピツチデータPITCHお
よびリピート回数REPEATは、有声音合成の際
にデイジタルフイルタ部5に入力する音源信号と
してのパルス信号の振幅,周期およびパルス数を
決定する情報である。ここで、リピート回数
REPEATが1である場合、分析合成音のピツチ
(周期)とフレーム周期とが一致し、完全な可変
長フレームとなる。ところが本発明においては、
同一ピツチでほぼ同一波形の有声音の合成を、そ
の1周期に1フレームを割当てるのではなく、リ
ピート回数REPEATに必要な繰返し周期数を与
えることで行なうようにしており、その結果、通
常の音声合成に必要となる情報量を実質的に大幅
に削減することができる。 また無声音の合成時には、ノイズ発生器6から
のランダムノイズ(極性がランダムなパルス信
号)のデイジタル符号化し、デイジタルフイルタ
部5に音源信号として入力するが、その際に、上
記振幅データAMPによつて上記ノイズの振幅が
決定され、上記ピツチデータPITCHおよびリピ
ート回数REPEATでもつてノイズ印加の経続時
間が決定される。なお、無声音に関しては、分析
時のフレーム(分析窓)を一定とし、従つてピツ
チデータPITCHを一定とし、リピート回数
REPEATで実質的に合成時のフレーム周期を適
宜に決定するようにしている。 上記の如く、マイクロプロセツサから与えられ
る1フレーム分の音声データの合成処理は、 (PITCH)×(REPEAT)=Tf で表わされる時間Tfで演算実行されるのであり、
この時間Tf、即ちフレーム間隔は、与えられる
音声データに応じて随時変化する。 前記音声データ表中の最後の補間周期分類信号
Nは、上記フレーム間隔Tfに応じて、その時間
Tfを何等分した値をPARCOR係数kiの補間周期
△tとするかを示す信号である。つまり、△t=
Tf/Nであり、フレーム間隔Tf中にPARCOR係
数kiについて周期△tで(N―1)回の補間を行
なうことを示している。 ここで、実施例について具体的数値をあげて説
明すると、本実施例では、リピート回数
REPEATを1,2,4,8,…という2の累乗
の値に制限をし、また補間周期分類信号Nを4,
8,16,32という2の累乗値の4種に制限し、
TfとNとの関係を次の表のように定めている。
フイルタ部5の伝達特性を決定するパラメータで
あり、振幅データAMP、ピツチデータPITCHお
よびリピート回数REPEATは、有声音合成の際
にデイジタルフイルタ部5に入力する音源信号と
してのパルス信号の振幅,周期およびパルス数を
決定する情報である。ここで、リピート回数
REPEATが1である場合、分析合成音のピツチ
(周期)とフレーム周期とが一致し、完全な可変
長フレームとなる。ところが本発明においては、
同一ピツチでほぼ同一波形の有声音の合成を、そ
の1周期に1フレームを割当てるのではなく、リ
ピート回数REPEATに必要な繰返し周期数を与
えることで行なうようにしており、その結果、通
常の音声合成に必要となる情報量を実質的に大幅
に削減することができる。 また無声音の合成時には、ノイズ発生器6から
のランダムノイズ(極性がランダムなパルス信
号)のデイジタル符号化し、デイジタルフイルタ
部5に音源信号として入力するが、その際に、上
記振幅データAMPによつて上記ノイズの振幅が
決定され、上記ピツチデータPITCHおよびリピ
ート回数REPEATでもつてノイズ印加の経続時
間が決定される。なお、無声音に関しては、分析
時のフレーム(分析窓)を一定とし、従つてピツ
チデータPITCHを一定とし、リピート回数
REPEATで実質的に合成時のフレーム周期を適
宜に決定するようにしている。 上記の如く、マイクロプロセツサから与えられ
る1フレーム分の音声データの合成処理は、 (PITCH)×(REPEAT)=Tf で表わされる時間Tfで演算実行されるのであり、
この時間Tf、即ちフレーム間隔は、与えられる
音声データに応じて随時変化する。 前記音声データ表中の最後の補間周期分類信号
Nは、上記フレーム間隔Tfに応じて、その時間
Tfを何等分した値をPARCOR係数kiの補間周期
△tとするかを示す信号である。つまり、△t=
Tf/Nであり、フレーム間隔Tf中にPARCOR係
数kiについて周期△tで(N―1)回の補間を行
なうことを示している。 ここで、実施例について具体的数値をあげて説
明すると、本実施例では、リピート回数
REPEATを1,2,4,8,…という2の累乗
の値に制限をし、また補間周期分類信号Nを4,
8,16,32という2の累乗値の4種に制限し、
TfとNとの関係を次の表のように定めている。
【表】
上記の表から明らかなように、kiについての補
間周期△t=Tf/Nは、補間の効果が充分に表
われる2.5msec以下となるようにしている。 また本実施例では、PARCOR係数kiの補間に
加えて、リピート回数REPEATが1でない場合、
つまり繰返し処理を行なう場合に、振幅データ
AMPをTfの間一定とするのではなく、次のフレ
ームデータの振幅との間を滑らかに変化させるべ
く、AMPの補間も行なう。 次に、回路動作について詳述する。 まず、表1に示した1フレーム分の音声データ
がバスライン4に順次供給されると、本合成回路
の制御部7の制御により、PARCOR係数kiはメ
モリ8aに、振幅データAMPはメモリ9aに、
ピツチデータPITCHはメモリ10aに、リピー
ト回数REPEATはメモリ11aに、補間周期分
類信号Nはメモリ12aに、有声音/無声音識別
信号V/UVはメモリ13aにそれぞれ取込まれ
る。次に制御部7からの信号により、メモリ8a
の記憶データkiはメモリ8bに、メモリ9aの記
憶データAMPはメモリ9bに、メモリ10aの
記憶データPITCHはメモリ10bに、メモリ1
1aの記憶データREPEATはメモリ11bに、
メモリ12aの記憶データNはメモリ12bに、
メモリ13aの記憶データV/UVはメモリ13
bにそれぞれ転送される。次にマイクロプロセツ
サ側に要求を発し、後続する次のフレームの音声
データをバスライン4に送出させ、その新たに供
給される次のフレームの音声データのうち、
PARCOR係数kiはメモリ8aに、AMPはメモリ
9aに、PITCHはメモリ10aに、REPEATは
メモリ11aに、信号Nはメモリ12aに、信号
V/UVはメモリ13aにそれぞれ格納される。 即ち、メモリ8b〜13bに最初のフレームの
音声データDATA1が格納され、メモリ8a〜
13aに次のフレームの音声データDATA2が
格納される。そしてDATA1の合成時に、
DATA2のPARCOR係数ki,振幅データAMPを
参照して、その変化を滑らかにすべく補間処理が
行なわれる。ここでDATA1中のPARCOR係
数,振幅データをそれぞれki1,AMP1と表わし、
DATA2中のそれぞれをki2,AMP2と表わす。 PARCOR係数の補間に必要な前処理について
説明する。 まず、前述した補間周期△tを求める動作につ
いて説明する。メモリ10bに格納されたピツチ
データPITCHは乗算回路として機能するシフト
回路14にプリセツトされる。またメモリ11b
に格納されたリピート回数REPEATは上記シフ
ト回路14の内容を桁上げするシフト信号として
印加される。REPEATは前述のように、2n=1,
2,4,8,……の値をとるように決められてい
るので、シフト回路14をnビツトシフトアツプ
することにより、シフト回路14の内容は、 Tf=(PITCH)×(REPEAT) となる。このデータTfは除乗回路として機能す
るシフト回路15にプリセツトされる。またメモ
リ12bに格納された補間周期分類信号Nは、上
記シフト回路15の内容を桁下げするシフト信号
として印加される。信号Nは前述のように、2m=
4,8,16,32の値をとるように決められている
ので、シフト回路15をmビツトシフトダウンす
ることにより、シフト回路15の内容は、 △t=Tf/N となる。この補間周期△tは、プリセツタブルダ
ウンカウンタ16にプリセツトされる。このカウ
ンタ16は、合成開始後クロツク信号CK(分析時
のサンプリング周波数と等しく、例えば、10KHz
に選ばれる)によつてダウンカウントされ、△t
時間経過する毎に、カウントアツプ信号C1を出
力する。この信号C1は、PARCOR係数の補間
回路17に対して補間タイミング信号として印加
される。 また補間回路17における前処理として、メモ
リ8bのki1とメモリ8aのki2とから、1回の補
間により加減算すべき補間値、即ち次式で示す補
間値△kiを求め、これを補間値メモリ18に格納
する。 △ki=ki2−ki1/N この△kiを算出するのに、まず、メモリ8b中
のki1、および切換ゲート19を介してメモリ8
aの中のki2が補間回路17に取込まれ、該回路
において(ki2−ki1)が演算され、その演算結果
は補間回路17中のシフト回路(図示省略、シフ
ト回路15と同様に除算回路として機能する)に
プリセツトされる。このシフト回路に対してメモ
リ12bに格納され補間周期分類信号Nが桁下げ
シフト信号として印加され、その結果、前述のよ
うに、(ki2−ki1)/Nが求まり、その値△kiが補
間値メモリ18に格納される。勿論、以上の演算
はi=1〜10の10種類のパラメータについてそれ
ぞれ時分割的に高速に行なわれる。 振幅データAMPの補間回路20にても、同様
な前処理が行なわれる。AMPの補間周期は
PITCHであり、補間回数は(REPEAT―1)で
ある。従つて、補間値△AMPは次式で与えられ
る。 △AMP=AMP2−AMP1/REPEAT この値△AMPを求める動作は、前記△kiの場
合とほぼ同様で、メモリ9b中のAMP1、および
切換ゲート21を介してメモリ9a中のAMP2が
補間回路20に取込まれ、該回路において、
(AMP2−AMP1)が演算され、除算回路として
機能するシフト回路(図示省略)にプリセツトさ
れる。そのシフト回路に対してメモリ11b中の
REPEATが桁下げシフト信号として印加され、
その結果、前式の△AMPが求まり、その値、△
AMPは補間値メモリ22に格納される。 また、合成開始時に、メモリ10b中の
PITCHおよびメモリ11b中のREPEATはプリ
セツトブルダウンカウンタ23および3にそれぞ
れプリセツトされる。カウンタ23は、前述のク
ロツクCKによつてダウンカウントされ、PITCH
時間経過する毎にカウントアツプ信号C2を出力
する。カウンタ3は、上記カウントアツプ信号C
2によつて順次カウントダウンされ、そのカウン
トアツプ信号C3は、前に述べたデータ要求信号
REQとして出力される。 また、カウンタ23のカウントアツプ信号C2
は、AMPの補間回路20に対して補間タイミン
グ信号として印加される。また、このカウントア
ツプ信号C2より若干遅れて発生するカウンタ2
3のプリセツト信号PSは、有声音源信号を送り
出すゲート24の開信号として印加される。 合成動作時において、PARCOR係数の補間回
路17に補間タイミング信号C1が印加される
と、補間回路17は、メモリ8b中のki1を取込
むとともに、ゲート19を介して補間値メモリ1
8中の補間値△kiを取込み、(ki1+△ki)を演算
し、その演算結果をゲート27を介してデイジタ
ルフイルタ部5に印加すると同時に、メモリ8b
中のデータki1も(ki1+△ki)に書き換える。従
つて、補間タイミング信号C1が発生する毎に、
メモリ8bの内容およびデイジタルフイルタ部5
に供給されるPARCOR係数は、 ki1 ↓ ki1+△ki ↓ ki1+2△ki ↓ ki1+3△ki 〓 と変化する。 AMPの補間回路20においても同様で、補間
タイミング信号C2が印加されると、ゲート21
を介して補間値メモリ22中の補間値△AMPを
取込み、該補間回路20に一時記憶している。
AMP1と加算し、その結果(AMP1+△AMP)
を出力するとともに、該回路20に一時記憶する
データをAMP1から(AMP1+△AMP)に更新
する。従つて、補間タイミング信号C2が発生す
る毎に、補間回路20から出力される振幅データ
は、 AMP1 ↓ AMP1+△AMP ↓ AMP1+2△AMP ↓ AMP1+3△AMP 〓 と変化する。 メモリ13bに格納された有声音/無声音識別
信号V/UVは、切換ゲート25に切換信号とし
て印加される。信号V/UVが有声音を示すと
き、切換ゲート25は(V)側に切換えられ、こ
の場合には、カウンタ23のプリセツト信号PS
につて極く短時間だけゲート24が開かれたと
き、AMP補間回路20から出力されている振幅
データがゲート24,25を介してデイジタルフ
イルタ部5に音源信号として印加される。 また信号V/UVが無声音を示すとき、切換ゲ
ート25は(UV)側に切換えられる。この場
合、ノイズ発生器6からのランダムノイズに基づ
き、振幅符号制御回路26において、AMP補間
回路20から出力されている振幅データに対応
し、極性がランダムに変化するデイジタル符号化
されたランダムノイズが作られ、そのノイズがゲ
ート25を介してデイジタルフイルタ部5に音源
信号として印加される。 デイジタルフイルタ部5において、上記音源信
号とPARCOR係数に基づいてデイジタル的に音
声波形が合成され、そのデイジタル出力はまるめ
回路28,D/A変換器29を経て、アナログの
音声波形となり、駆動回路2を介してスピーカ1
からの音響的に出力される。 そして、1フレーム分の音声データDATA1
の合成処理が終了すると、カウンタ3からデータ
要求信号REQが出力される。これに応動して、
メモリ8a〜13aに格納されていた第2フレー
ム目の音声データDATA2をメモリ8b〜13
bに転送するとともに、バスライン4に供給され
る第3フレーム目の音声データDATA3をメモ
リ8a〜13aに格納する。この状態から、前記
と同様に、第2フレーム目の音声データDATA
2の合成処理が、第3フレーム目の音声データ
DATA3中のki3とAMP3を参照しての補間を行
ないながら実行される。 なお上記実施例においては、各フレーム毎に
Tfに対応した分類信号Nを予め音声データとし
て与えるようにしたが、合成回路中において、シ
フト回路14の出力Tfに基づいてNおよび△t
を決定する回路部を設けても良い。 以上詳細に説明したように、本発明は、線形予
測符号化方式の音声合成手法に基づく音声合成装
置であつて、分析合成音の1ピツチを1フレーム
の基本時間とし、かつ同一波形の繰返しをリピー
ト回数として与える可変長フレーム方式とし、与
えられる音声データ中のピツチとリピート回数と
からフレーム間隔を求める回路部と、求められた
フレーム間隔に対応して補間周期を決定し、その
補間周期と相前後する2フレームの合成パラメー
タとから補間1回当りの補間値を求める回路部
と、上記補間タイミング信号と上記補間値とに基
づいて上記合成パラメータを順次補間する回路部
とを有することを特徴とするものである。つま
り、繰返し処理の採用により、合成に必要な情報
量を大幅に削減できるとともに、フレーム間隔の
大・小に係わらず、各フレーム間隔に応じて適切
な合成パラメータの補間が行なえ、良好な合成音
質を得ることができるのである。
間周期△t=Tf/Nは、補間の効果が充分に表
われる2.5msec以下となるようにしている。 また本実施例では、PARCOR係数kiの補間に
加えて、リピート回数REPEATが1でない場合、
つまり繰返し処理を行なう場合に、振幅データ
AMPをTfの間一定とするのではなく、次のフレ
ームデータの振幅との間を滑らかに変化させるべ
く、AMPの補間も行なう。 次に、回路動作について詳述する。 まず、表1に示した1フレーム分の音声データ
がバスライン4に順次供給されると、本合成回路
の制御部7の制御により、PARCOR係数kiはメ
モリ8aに、振幅データAMPはメモリ9aに、
ピツチデータPITCHはメモリ10aに、リピー
ト回数REPEATはメモリ11aに、補間周期分
類信号Nはメモリ12aに、有声音/無声音識別
信号V/UVはメモリ13aにそれぞれ取込まれ
る。次に制御部7からの信号により、メモリ8a
の記憶データkiはメモリ8bに、メモリ9aの記
憶データAMPはメモリ9bに、メモリ10aの
記憶データPITCHはメモリ10bに、メモリ1
1aの記憶データREPEATはメモリ11bに、
メモリ12aの記憶データNはメモリ12bに、
メモリ13aの記憶データV/UVはメモリ13
bにそれぞれ転送される。次にマイクロプロセツ
サ側に要求を発し、後続する次のフレームの音声
データをバスライン4に送出させ、その新たに供
給される次のフレームの音声データのうち、
PARCOR係数kiはメモリ8aに、AMPはメモリ
9aに、PITCHはメモリ10aに、REPEATは
メモリ11aに、信号Nはメモリ12aに、信号
V/UVはメモリ13aにそれぞれ格納される。 即ち、メモリ8b〜13bに最初のフレームの
音声データDATA1が格納され、メモリ8a〜
13aに次のフレームの音声データDATA2が
格納される。そしてDATA1の合成時に、
DATA2のPARCOR係数ki,振幅データAMPを
参照して、その変化を滑らかにすべく補間処理が
行なわれる。ここでDATA1中のPARCOR係
数,振幅データをそれぞれki1,AMP1と表わし、
DATA2中のそれぞれをki2,AMP2と表わす。 PARCOR係数の補間に必要な前処理について
説明する。 まず、前述した補間周期△tを求める動作につ
いて説明する。メモリ10bに格納されたピツチ
データPITCHは乗算回路として機能するシフト
回路14にプリセツトされる。またメモリ11b
に格納されたリピート回数REPEATは上記シフ
ト回路14の内容を桁上げするシフト信号として
印加される。REPEATは前述のように、2n=1,
2,4,8,……の値をとるように決められてい
るので、シフト回路14をnビツトシフトアツプ
することにより、シフト回路14の内容は、 Tf=(PITCH)×(REPEAT) となる。このデータTfは除乗回路として機能す
るシフト回路15にプリセツトされる。またメモ
リ12bに格納された補間周期分類信号Nは、上
記シフト回路15の内容を桁下げするシフト信号
として印加される。信号Nは前述のように、2m=
4,8,16,32の値をとるように決められている
ので、シフト回路15をmビツトシフトダウンす
ることにより、シフト回路15の内容は、 △t=Tf/N となる。この補間周期△tは、プリセツタブルダ
ウンカウンタ16にプリセツトされる。このカウ
ンタ16は、合成開始後クロツク信号CK(分析時
のサンプリング周波数と等しく、例えば、10KHz
に選ばれる)によつてダウンカウントされ、△t
時間経過する毎に、カウントアツプ信号C1を出
力する。この信号C1は、PARCOR係数の補間
回路17に対して補間タイミング信号として印加
される。 また補間回路17における前処理として、メモ
リ8bのki1とメモリ8aのki2とから、1回の補
間により加減算すべき補間値、即ち次式で示す補
間値△kiを求め、これを補間値メモリ18に格納
する。 △ki=ki2−ki1/N この△kiを算出するのに、まず、メモリ8b中
のki1、および切換ゲート19を介してメモリ8
aの中のki2が補間回路17に取込まれ、該回路
において(ki2−ki1)が演算され、その演算結果
は補間回路17中のシフト回路(図示省略、シフ
ト回路15と同様に除算回路として機能する)に
プリセツトされる。このシフト回路に対してメモ
リ12bに格納され補間周期分類信号Nが桁下げ
シフト信号として印加され、その結果、前述のよ
うに、(ki2−ki1)/Nが求まり、その値△kiが補
間値メモリ18に格納される。勿論、以上の演算
はi=1〜10の10種類のパラメータについてそれ
ぞれ時分割的に高速に行なわれる。 振幅データAMPの補間回路20にても、同様
な前処理が行なわれる。AMPの補間周期は
PITCHであり、補間回数は(REPEAT―1)で
ある。従つて、補間値△AMPは次式で与えられ
る。 △AMP=AMP2−AMP1/REPEAT この値△AMPを求める動作は、前記△kiの場
合とほぼ同様で、メモリ9b中のAMP1、および
切換ゲート21を介してメモリ9a中のAMP2が
補間回路20に取込まれ、該回路において、
(AMP2−AMP1)が演算され、除算回路として
機能するシフト回路(図示省略)にプリセツトさ
れる。そのシフト回路に対してメモリ11b中の
REPEATが桁下げシフト信号として印加され、
その結果、前式の△AMPが求まり、その値、△
AMPは補間値メモリ22に格納される。 また、合成開始時に、メモリ10b中の
PITCHおよびメモリ11b中のREPEATはプリ
セツトブルダウンカウンタ23および3にそれぞ
れプリセツトされる。カウンタ23は、前述のク
ロツクCKによつてダウンカウントされ、PITCH
時間経過する毎にカウントアツプ信号C2を出力
する。カウンタ3は、上記カウントアツプ信号C
2によつて順次カウントダウンされ、そのカウン
トアツプ信号C3は、前に述べたデータ要求信号
REQとして出力される。 また、カウンタ23のカウントアツプ信号C2
は、AMPの補間回路20に対して補間タイミン
グ信号として印加される。また、このカウントア
ツプ信号C2より若干遅れて発生するカウンタ2
3のプリセツト信号PSは、有声音源信号を送り
出すゲート24の開信号として印加される。 合成動作時において、PARCOR係数の補間回
路17に補間タイミング信号C1が印加される
と、補間回路17は、メモリ8b中のki1を取込
むとともに、ゲート19を介して補間値メモリ1
8中の補間値△kiを取込み、(ki1+△ki)を演算
し、その演算結果をゲート27を介してデイジタ
ルフイルタ部5に印加すると同時に、メモリ8b
中のデータki1も(ki1+△ki)に書き換える。従
つて、補間タイミング信号C1が発生する毎に、
メモリ8bの内容およびデイジタルフイルタ部5
に供給されるPARCOR係数は、 ki1 ↓ ki1+△ki ↓ ki1+2△ki ↓ ki1+3△ki 〓 と変化する。 AMPの補間回路20においても同様で、補間
タイミング信号C2が印加されると、ゲート21
を介して補間値メモリ22中の補間値△AMPを
取込み、該補間回路20に一時記憶している。
AMP1と加算し、その結果(AMP1+△AMP)
を出力するとともに、該回路20に一時記憶する
データをAMP1から(AMP1+△AMP)に更新
する。従つて、補間タイミング信号C2が発生す
る毎に、補間回路20から出力される振幅データ
は、 AMP1 ↓ AMP1+△AMP ↓ AMP1+2△AMP ↓ AMP1+3△AMP 〓 と変化する。 メモリ13bに格納された有声音/無声音識別
信号V/UVは、切換ゲート25に切換信号とし
て印加される。信号V/UVが有声音を示すと
き、切換ゲート25は(V)側に切換えられ、こ
の場合には、カウンタ23のプリセツト信号PS
につて極く短時間だけゲート24が開かれたと
き、AMP補間回路20から出力されている振幅
データがゲート24,25を介してデイジタルフ
イルタ部5に音源信号として印加される。 また信号V/UVが無声音を示すとき、切換ゲ
ート25は(UV)側に切換えられる。この場
合、ノイズ発生器6からのランダムノイズに基づ
き、振幅符号制御回路26において、AMP補間
回路20から出力されている振幅データに対応
し、極性がランダムに変化するデイジタル符号化
されたランダムノイズが作られ、そのノイズがゲ
ート25を介してデイジタルフイルタ部5に音源
信号として印加される。 デイジタルフイルタ部5において、上記音源信
号とPARCOR係数に基づいてデイジタル的に音
声波形が合成され、そのデイジタル出力はまるめ
回路28,D/A変換器29を経て、アナログの
音声波形となり、駆動回路2を介してスピーカ1
からの音響的に出力される。 そして、1フレーム分の音声データDATA1
の合成処理が終了すると、カウンタ3からデータ
要求信号REQが出力される。これに応動して、
メモリ8a〜13aに格納されていた第2フレー
ム目の音声データDATA2をメモリ8b〜13
bに転送するとともに、バスライン4に供給され
る第3フレーム目の音声データDATA3をメモ
リ8a〜13aに格納する。この状態から、前記
と同様に、第2フレーム目の音声データDATA
2の合成処理が、第3フレーム目の音声データ
DATA3中のki3とAMP3を参照しての補間を行
ないながら実行される。 なお上記実施例においては、各フレーム毎に
Tfに対応した分類信号Nを予め音声データとし
て与えるようにしたが、合成回路中において、シ
フト回路14の出力Tfに基づいてNおよび△t
を決定する回路部を設けても良い。 以上詳細に説明したように、本発明は、線形予
測符号化方式の音声合成手法に基づく音声合成装
置であつて、分析合成音の1ピツチを1フレーム
の基本時間とし、かつ同一波形の繰返しをリピー
ト回数として与える可変長フレーム方式とし、与
えられる音声データ中のピツチとリピート回数と
からフレーム間隔を求める回路部と、求められた
フレーム間隔に対応して補間周期を決定し、その
補間周期と相前後する2フレームの合成パラメー
タとから補間1回当りの補間値を求める回路部
と、上記補間タイミング信号と上記補間値とに基
づいて上記合成パラメータを順次補間する回路部
とを有することを特徴とするものである。つま
り、繰返し処理の採用により、合成に必要な情報
量を大幅に削減できるとともに、フレーム間隔の
大・小に係わらず、各フレーム間隔に応じて適切
な合成パラメータの補間が行なえ、良好な合成音
質を得ることができるのである。
図は、本発明に係る音声合成装置の一実施例を
示すブロツク図である。 1……スピーカ、4……バスライン、17……
PARCOR係数補間回路、18……補間値メモリ、
Tf……フレーム間隔、△t……補間周期。
示すブロツク図である。 1……スピーカ、4……バスライン、17……
PARCOR係数補間回路、18……補間値メモリ、
Tf……フレーム間隔、△t……補間周期。
Claims (1)
- 【特許請求の範囲】 1 線形予測符号化方式の音声合成手法に基づく
音声合成装置であつて、原音声の1ピツチを基本
時間とし、かつほぼ同一波形の繰返しをリピート
回数として与え(1ピツチ)×(リピート回数)を
1フレーム長とする可変長フレーム方式とし、与
えられる音声データ中のピツチデータとリピート
回数からフレーム間隔を求める回路部と、求めら
れたフレーム間隔に対応して補間周期を決定し、
その補間周期毎に補間タイミング信号を発生する
回路部と、上記補間周期と相前後する2フレーム
の合成パラメータとから補間1回当りの補間値を
求める回路部と、上記補間タイミング信号と上記
補間値とに基づいて上記合成パラメータを順次補
間する回路部とを有することを特徴とする音声合
成装置。 2 上記リピート回数を2nとし、上記(1ピツ
チ)×(リピート回数)の乗算を(1ピツチ)デー
タのシフトのみで行なう演算回路を備え、かつ、
フレーム間隔が10msec以下の場合には、1フレ
ームに(22―1)回、10〜20msecの場合には
(23―1)回、20〜40msecの場合には(24―1)
回、40msec以上の場合には(25―1)回の補間
を行なうように定め、補間周期の演算を(1ピツ
チ)×(リピート回数)の値を2nで除する、すなわ
ち、nビツトの右シフトのみで行なう演算回路を
備えた特許請求の範囲第1項記載の音声合成装
置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56011871A JPS57125999A (en) | 1981-01-29 | 1981-01-29 | Voice synthesizer |
| GB8202118A GB2093668B (en) | 1981-01-29 | 1982-01-26 | A speech synthesizer |
| US06/343,198 US4489437A (en) | 1981-01-29 | 1982-01-27 | Speech synthesizer |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56011871A JPS57125999A (en) | 1981-01-29 | 1981-01-29 | Voice synthesizer |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS57125999A JPS57125999A (en) | 1982-08-05 |
| JPS645720B2 true JPS645720B2 (ja) | 1989-01-31 |
Family
ID=11789779
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56011871A Granted JPS57125999A (en) | 1981-01-29 | 1981-01-29 | Voice synthesizer |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US4489437A (ja) |
| JP (1) | JPS57125999A (ja) |
| GB (1) | GB2093668B (ja) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA1181859A (en) * | 1982-07-12 | 1985-01-29 | Forrest S. Mozer | Variable rate speech synthesizer |
| GB2130852B (en) * | 1982-11-19 | 1986-03-12 | Gen Electric Co Plc | Speech signal reproducing systems |
| JPS59188700A (ja) * | 1983-04-08 | 1984-10-26 | 日本電信電話株式会社 | 音声合成装置 |
| JPS60158498A (ja) * | 1984-01-27 | 1985-08-19 | 株式会社リコー | パターン照合装置 |
| US4718087A (en) * | 1984-05-11 | 1988-01-05 | Texas Instruments Incorporated | Method and system for encoding digital speech information |
| JPH0776873B2 (ja) * | 1986-04-15 | 1995-08-16 | ヤマハ株式会社 | 楽音信号発生装置 |
| US5029214A (en) * | 1986-08-11 | 1991-07-02 | Hollander James F | Electronic speech control apparatus and methods |
| JPH0727397B2 (ja) * | 1988-07-21 | 1995-03-29 | シャープ株式会社 | 音声合成装置 |
| US5408580A (en) * | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
| KR20020006164A (ko) * | 2000-07-11 | 2002-01-19 | 송문섭 | 음성 신호 부호화시 격자방법을 이용한 고정소수점선형예측부호화 계수 추출 방법 |
| CA2840732C (en) * | 2011-06-30 | 2017-06-27 | Samsung Electronics Co., Ltd | Apparatus and method for generating bandwidth extension signal |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4335275A (en) * | 1978-04-28 | 1982-06-15 | Texas Instruments Incorporated | Synchronous method and apparatus for speech synthesis circuit |
| US4270027A (en) * | 1979-11-28 | 1981-05-26 | International Telephone And Telegraph Corporation | Telephone subscriber line unit with sigma-delta digital to analog converter |
-
1981
- 1981-01-29 JP JP56011871A patent/JPS57125999A/ja active Granted
-
1982
- 1982-01-26 GB GB8202118A patent/GB2093668B/en not_active Expired
- 1982-01-27 US US06/343,198 patent/US4489437A/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| GB2093668A (en) | 1982-09-02 |
| GB2093668B (en) | 1984-10-24 |
| JPS57125999A (en) | 1982-08-05 |
| US4489437A (en) | 1984-12-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4435832A (en) | Speech synthesizer having speech time stretch and compression functions | |
| US4624012A (en) | Method and apparatus for converting voice characteristics of synthesized speech | |
| JPS645720B2 (ja) | ||
| Weenink | The KlattGrid speech synthesizer. | |
| JPH1078791A (ja) | ピッチ変換器 | |
| JPH0318197B2 (ja) | ||
| JPS5952840B2 (ja) | 音声合成器の補間装置 | |
| JPS6286394A (ja) | 楽音信号発生方法 | |
| US4520502A (en) | Speech synthesizer | |
| JP2661391B2 (ja) | 楽音信号処理装置 | |
| JP2937322B2 (ja) | 音声合成装置 | |
| JPS5950997B2 (ja) | 音声パラメ−タ情報抽出方式 | |
| JPH01189700A (ja) | 音声合成装置 | |
| JPH0431900A (ja) | 音声合成装置 | |
| JPH0121520B2 (ja) | ||
| JP2797300B2 (ja) | 音声合成装置 | |
| JPS5952839B2 (ja) | 電子楽器 | |
| Baumwolspiner | Speech generation through waveform synthesis | |
| JPS61105595A (ja) | 楽音信号発生装置 | |
| JPH032900A (ja) | 声帯声道型音声分析装置 | |
| JPS5925236B2 (ja) | 音声合成器 | |
| JPS5936276B2 (ja) | 音声合成装置 | |
| JPS6036597B2 (ja) | 音声合成装置 | |
| JPH0157359B2 (ja) | ||
| JP2003108143A (ja) | 波形再生装置 |