JPS60150100A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPS60150100A
JPS60150100A JP59005583A JP558384A JPS60150100A JP S60150100 A JPS60150100 A JP S60150100A JP 59005583 A JP59005583 A JP 59005583A JP 558384 A JP558384 A JP 558384A JP S60150100 A JPS60150100 A JP S60150100A
Authority
JP
Japan
Prior art keywords
speech
waveform
error
residual
analysis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59005583A
Other languages
English (en)
Other versions
JP2539351B2 (ja
Inventor
武田 昌一
市川 熹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59005583A priority Critical patent/JP2539351B2/ja
Publication of JPS60150100A publication Critical patent/JPS60150100A/ja
Application granted granted Critical
Publication of JP2539351B2 publication Critical patent/JP2539351B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野] 本発明は音声分析合成方式の改良に関する。
〔発明の背景〕
音声を171とか1イ1のような情報を主に担うスペク
トル・エンベロープ情Nと、アクセントやイントネーシ
ョンのような抑揚を担う音源情報に分離して処理あるい
は伝送する方式は生成原方式と呼ばれている。PARC
OR方式、LSP方式などがその例である。これら生成
原方式は、狭帯域伝送が可能であり、そのだめボイスメ
ール、玩具、教有機器などへの応用に適している。まだ
、生成原方式の上記の情報分離性は、規則合成には不可
欠な性質である。従来の生成原方式においては、第1図
(a)に示すように、音源情報として疑似的に発生させ
るた白色雑声1あるいはインパルス列2を切換えて用い
ていた。このとき合成器に印加する音源情報は、■有音
/無声情報3.■音源振]+m 4−および■ピッチ周
期(あるいはピッチ周波数)5であつ庭。すなわち、上
記■の”情報を用いて・有声の場合インパルス列を発生
させ、無声の場合白色雑音を発生させる。これらの信号
の振幅は上記品により与えられる。捷だインバース列の
発生間隔は上記■により与えられる。
このような疑似音源を用いることにより次のような音質
劣化が起こり、従来の生成原方式による分析合成音声が
一定の品質の限界を乗り越えることは不可能であった。
(1)分析時に起こる有声/無声の誤判定による音質劣
化。
(2) ピッチ抽出誤りによる音質劣化。
(3)女声1イ1や1つ1などに藷生するホルマント成
分とピッチ成分の分離の不完全性に基く音質劣化。
(41PAR,COR方式などAllモデルの限界によ
り・スペクトルの零の情報を和えないために生ずる音質
劣化。
(5)音声の自然性に重要な非冗常成分、ゆらぎの情報
が棄てられるために生ずる音質劣化。
[’ 9ij明の目的〕 本発明の目的は、これらの音質劣化の要因を−きよに除
去する手段として、PARCOR方式や ′LSP方式
の予測残差の情報を用いることにより、自然な音質を与
える音声分析合成方式の改良方式を114供することに
あり、その中でも特に、残差情報の効果的な圧縮方式を
提供することにある。
〔発明の概要〕
上記の目的を達成するため・本発明は生成源処理による
音声分析合成装置に音声の品質上重要性の少ない部分を
取除いた残差信号を用いることにより・原音声のもつ高
品質を維持しながら伝送情報を圧縮する。
〔発明の実施例〕 第1図(b)は、同図(a)に示す従来の分析合成方式
の疑似音源の代りに1分析器の出力信号として得られる
残差信号を合成器の音源として用いた場合の分析合成系
を示したものである。このような分析合成系を通過して
得られる合成波形は、原理的に原波形と一致するので音
ノh劣化は生じない0しかしながら伝送情報が全く圧縮
されないので、生成源方式を利用する長所もまだ薄れて
くる。
そこで本発明では、伝送情報を圧縮するために第2図に
示すような残差情報圧縮方式を提供する。
以下に・第2図を引用して残差情報を圧縮する方式を説
明する。基本的には・音声の原波形を分析して得られる
残差波形を+1・f成するパルスの中から適当な1本あ
るいは数本を抜]IS7す(すなわちOの値に置き換え
)、抜取り後の残っだ残差パルス列(圧縮化残差波形)
を駆動音源として合成器に入力して合成波形を得る。こ
の合成波形は残差圧縮によるひずみを含んでいる。そこ
で原波形とこの合成波形の誤差を計算することにより、
そのひずみの度合を評価する。このような誤差計算を対
象となっている音声短区間中のあらゆる残差パルスの所
定の本数の抜取りの組合せについて行う。
そしてその中で最も誤差が小さくなるよう々組合せで残
差パルスを抜取った後の残りの残差パルスを記憶してお
く。上記抜取操作は必要に応じて数段階繰返してもよい
。このようにして最後まで残った残差パルスを伝送残差
信号(圧縮化残差波形)とし1合成器の音源として用い
る。
上記の方式において・誤差の定該の1方・および抜取操
作方法によって多f!!!類の手法が実現できる。例え
ば上記誤差としては、■原波形と合成波形の対応するサ
ンプル点における差の2乗和、■上記のOrs差に例え
ばNo1se Weighting pilterのよ
うな電み付はフィルタを適用して聴覚補正を施した誤差
尺度、■残差パルス抜取りにより変化した合成波形の振
幅値を補正した上記■あるいは■の誤差尺度、■原波形
と合成波形のスペクトルひずみ、■重み付はフィルタを
適用して聴覚補正をbfl+シたスペクトルひずみ・な
どが挙げられる。
また、抜取方法としては・01本ごとに誤差が最小とな
るような残差パルスをめ、所定の本故になるまで順次抜
取りを続けていく(これを遂次抜取法と呼ぶことにする
)、■一度に所定の本数の残差パルスを誤差が最小とな
る組合せで抜く(これを同時抜取法と呼ぶことにする)
、などの方法が挙げられる。上記■〜■および■■の組
合せだけでも10通りの手法が存在することになる。勿
論、上記以外の組合せも存在し得る。
当然のことながら・合成音声の品質は、残差ノくルスの
抜取り本数の増加とともに劣化していく。
そこで、目的に応じて要求される品質あるいは情報伝送
量を満足するように抜取す本数を決定する必要がある。
抜取り本数は、合成音声の長時間平均の品質が所望の水
準を満たすような一定値、あるいは所望の情報伝送Ii
、となる一定値として定めることも可能である。しかし
ながら、一般に同一の品質を得るだめの抜取り本数は、
音韻の種類等音声波形の性質により異なるため、抜取り
本数を一定値に定めると合成音声の品質にムラが生ずる
そのため、たとえばもし最も品質が悪い場合でも少くと
もある水準の品質を保つように抜をり本数を決定しよう
とすれば・合成音声に不必要に高品質な部分が生じ、こ
の部分では過剰な情報を伝送することによるムダが生ず
る。このように品質のムラ、あるいは情報のムダを減ら
し・効率的に情報を伝送するために、以下に説明するよ
うな音声波形の性質に適応して・最適な残差パルス抜取
本#(+ (以下、略して「残差抜取機」と呼ぶことに
する)を決定する方式を導入する。
第3図は、左から右に一定区間の残差パルスを振幅値の
小さい方から大きい方へ順に並べたもので、振幅の大き
さを棒の高さで表現したものである。第3図のうち(a
)図は音韻1alの例であり、(b)図は+1+の例で
ある。図中の矢印は、それで示した残差パルス以上の振
幅を持つ残差パルスは、ピッチ情報等音声の品質上重要
な情報を担っているので不可欠であることを示している
。図かられかるように、lalの場合はさまざまな振幅
値の残差パルスが含まれているが、+1+の場合は、は
とんどが小さい振幅値の残差パルスであり、大きい振幅
値の残差パルスはわずかじか含寸れていない。このよう
に、一般に残差パルスの4辰幅値の分布は、音韻によっ
て異なる。さらに、音声の品買上重要な情報を担ってい
る残差パルスは、振幅の大きい残差パルスであることも
わかる。したがって、大きい振幅値の残差パルスが多く
含まれているlalでは多くの残差パルスを必要とし、
大きい眼幅値の残差パルスがわずかしか含まれていない
+i+ではわずかな数の残差パルスだけを伝送すればよ
いと言える。以上より、残差抜窄数はその残差波形の振
幅の大きさに依存する量として設定すればよい。
上に述べたことは、一定の短区間における残差振幅値の
分布に着目して残差敗取数が決定できるということであ
ったが、他の方法としては、長時間の音声データの残差
の振幅値の分布に着目して定めたしきい値より小さい振
幅値の残差パルスを抜をるという方法も存在する。
第4図は以上の方式を1とめて概念的に示したものであ
る。
残差抜取数を決定する他の方式として、第5図に示すよ
うに、原波形と合成波形の誤差値に基いて決定するとい
う方式がある。横軸に残差抜取数、縦軸に波形誤差ある
いはスペクトルひずみ反間のような誤差値をとって誤差
増加曲線を描くと、第3図と類似の傾向が見られる。す
なわち、Ialの場合は少い残差抜取数で比較的誤差増
加の立ち上りが♀<、+i+の場合は逆に、残差抜取数
が多くなってもなか々か誤差値が大きくならない。
このことは・ U+の方がエリ多くの残差を抜取れるこ
とを意味している0したがって、例えば誤差値が予め定
めた一定値以下で最大となるように残差法11v数を決
定すれば、所期の目的が達成できるO そのほかの変形方式としては1例えば原波形の振幅情報
、あるいは合成波形の振幅情報に基いてず 残差抜取数を決定んる方式がある。いずれにせよ、基本
的に何らかの音声情采を用いて適応的に残差抜取数を自
動決定するという共通の方式であり。
上に述べた方式に準じて実施することが出来る。
以上の原理に基〈方式は・高品質音声合成のための音源
を得る分析方式として用いることができることはもとよ
り、この音源を用いた高品質音声合成方式として単独に
用いることも可能である。
さらに上記分析方式と合成方式を一体とした分析合成方
式として用いることができることは言うまでもない。
第6図は第1の実施例を示したもので、具体例としてP
ARCOR分析器、 PARCO’R合成器を使用した
分析合成系について説明しであるが、スペクトル・エン
ベロープ情報と音源情報を分離することを基本とする生
成源処哩の分析・合成器であるならば、PARCOR分
析・合成器の代りに用いることができる。以下の説明は
音声データから切出された短区間(1フレーム)音声デ
ータについての一回の処理内容についてであって、全音
声区間については、以下に説明する処理を繰返し実行す
ればよい。
第1の実施例は、誤差の評価にθに形誤差を世いる方式
であって、評価量は具体的には次式によって表わされる
ここにεは誤差の評価量・Xjは原音声信号X5を聴覚
補正などを目的とした重み付はフィルタW(Z)(Zは
Z変換を意味する)に通過させた出力信号、xjは合成
音声信号x′j をW(Z)に通過させた出力信号であ
るo−1,た・aは残差パルス抜取りに伴う振幅の変化
を補正する係数である。
さらに、Lは誤差を評価する区間のデータの個数である
。なお、本実施例では1重み付はフィルタとして、No
1se Weighting pilterを例にとっ
た場合について説明することにする。
振幅補正係数aは(1)式においてεの最小値を与える
解として与えられる。したがって(1)式において・ と置けば、(2)式よりaは次式のようにまる。
残差パルスの抜き方については・前述の01本ずつ誤差
εの最小値をめながら所定の本数(これをM本とする)
まで抜いていく方式(遂次抜取法)と、前述の■一度に
M本IM<方式(同時抜取法)の2方式を例示する。以
下の説明では・1フレーム内の抜取り対象の残差パルス
の総本数をN本とする。ここで評価区間データ数りと上
記Nとの表記が異なるのは、評価区間と残差抜取区間と
は必ずしも一致しないからである。一般に残差抜取区間
は評価区間内に含1れる。
以下・■の残差パルスを1本ずつ誤差εの最小値をめ・
ながら所定の本数まで抜いていく方式(遂次抜取法)に
ついて説明する。
1ず、切出された1フレーム音声データ(原音声)は、
メモリ6に格納される。次にメモリ6に格納された音声
データxjはPARCOR分析器7に入力され、PAR
COR分析によりPARCOR係数に+ (i=1.2
.・・・、p) が計算され、同時にPARCOR分析
器7の出力信号として残差信号がめられる。残差信号t
Ijは、−たんメモリ8に格納される。以上の演算は1
フレームにつき唯一回だけ行われる。次に、メモリ8に
格納されている残差信号はそのままメモリ9に転送され
る。
しかる後に、誤差最小値探索部10の中に設置されてい
るカウンタ値CNで指定されるメモリ9内の番地のレジ
スタに0を書き込む。この動作はメモリ9に書込1れて
いる残差パルス列”j(j=1゜2、・・・、N)中の
j =CHの残差パルスを抜取る(すなわちujcN=
0とする)ことを意味している。ここでCNの値は・抜
ルリ対象残差パルスの時間方向並びに対応して・クロッ
クの起動によりCN=1.2.・・・、Nまで順次変化
する。すなわち、メモリ9内では、クロックの起動ごと
に、残差パルスがul + ”2 + u3 *・・・
、uNの順に0に置き換えられる。第1回目の誤差計算
前にはカウンタ値CNはリセットされCN=1にセット
される。
従って第1回目はCN=1であるからul 、=Qとし
た場合の誤差が計算される。誤差計算は以下のとおりで
ある。すなわち、ujのうちの1本を0としたメモリ9
内の残差パルス列(これらを改めてU;と表記する)を
PArLCOll 合成器11に入力し、その出力波形
をメモリ12に格納する。
このときのPAR,C0IL係数に、は前もってPAR
COll、分析器7によってめておいたものを用いる。
上記メモリ12に格納された波形(合成波形)Xlを重
み付はフィルタW (Z) 13に通過させ・W(Z)
13の出力としてX、を得る。他方メモリ6に格納され
た原音声波形XjもW(Z)13′を通過させ、 W(
Z) 13’の出力としてxj を得る。このX3から
上記X、に掛算器14によりaを掛けたものを加3)器
18により引くとXj−aXjが計算され、さらに、)
il算器15により2乗計算をしたものとメモリ16内
のデータ値との和を加算器17によりめ、改めてメモリ
16に格納すれば(1)式にょるεの値が計算される。
ただしメモリ16はεの値の計1ツ゛に先立ってゼロク
リアしておく。ここでaの値は掛算器14による計算を
行う前に計算回路19により(3)式を計算することに
よりめておく。以下、剖算回路19の詳細を第7図によ
り説明する。メモリ20.21は予めゼロクリアをして
おく。まず・掛算器22により)J−Xjを計算し、そ
の結果とメモリ20の値の和を加算器23により計算し
・その結果を改めてメモリ20内に格納する。これをj
=1からL回繰返せばその結果としてメモリ20内に(
3)式の分子を得る。同様にして、掛算器24・加算器
25およびメモリ21を用いて(3)式の分母をメモリ
21に得ることができる。メモリ20の値を割算器26
を用いてメモリ21の値で割れば、(3)式によりaの
値がまるので、この値を第3図のメモリ27に格納する
以上によりまった・ul を抜取ったときの誤差εは、
誤差最小値探索部10に入力される。第8図は誤差最小
値探索部10の詳細図であり・ここでは・εが前回まで
に演算された誤差最小値(メモリ29に格納されている
)よりも小さいか否か比較器28により比較される。も
しそうであれば比較器28からラッチ信号LTが出力さ
れ、ここで計算したεの値が誤差最小値としてメモリ2
9に更新登録され、同時にそのときのカウンタ値CNも
メモリ30に更新登録される。第1回目の誤差計算にお
いては、メモリ29に予めセットしである・εの値とは
なり得ない十分大きい値EMAXとの比較であるだめ必
ずεの値およびCN=1が登録される。
以上の誤差計算処理を第8図のクロック信号CLKに同
期させてカウンタ値CN=1からN回繰返す。このとき
1回の誤差割算が終り誤差最小値が確定してから2回目
の誤差計算が始まるまでの間に、第6図のメモリ9の内
容をメモリ8の内容に書き換えることによりセットして
おく。
このようにしてN回の誤差船°算が終ると第8図のメモ
リ30には最小誤差を与える残差パルス位置Rが格納さ
れている。そこで次のステップに入る前に第6図のメモ
リ8の中の11.で指定された番地のレジスタの値を0
に置換える。かくして第1段階における圧縮化残差波形
は、メモリ8に格納されることになる。このようなステ
ップをM段階−繰返せば、最終的にM本抜取った所望の
圧縮化残差波形は、メモリ8に格納されることになる。
そこで、最後にこの圧縮圧残差波形をメモリ59を通過
させた後、PARCOR合成器11に入力すれば、結果
としてメモリ12に1フレ一ム分の合成波形が得られる
以上の説明において、PARCO几分析器7、PARC
OR合成器11、重み付はフィルタ13゜13′は公知
なので実現用能であるOさらに重み付はフィルタに与え
るLPCパラメータα+ (i=1.2.・・・、p)
をめるLPC分析器32も公知なので実現可能である。
次に、前述の■の残差パルスを一度に所定の本数(M本
)抜く方式(同時抜取法)について説明する0 全体構成は、前述の■遂次抜取法と同様、第6図に示す
とおりである0■との相違点は誤差最小値探索部10の
機能であり、その内容は第9図〜第11図に示すとおり
である。■方式については■方式と異なる部分について
のみ説明する。第9図は県差最小値探索部10の詳細を
示したものである。図中のカウンタ31′、からの出力
値Iは。
クロックCLKに同期して0,1,2.・・・、Cの順
に変化していく。ここにCはN個の残差パルスの中から
M個を抜取る組合せの数で である・I=Oとなるのは、初期設定のとき、および後
述の組合せ発生部33から、すべての組合せの発生終了
を知らせるフラグ(Iout =0’)が出力されたと
きであり、これによりカウンタ31′はリセットされる
。組合せ発生部33では、上記カウンタ31′から出力
されたIの値に対応する上記組合せIC0NBI(1)
、ICOMBI(2)、・・・。
I COMB I (M) が出力される。第10図は
N=5、M=3とした場合のIの値(Iinで表わした
値)とそれに対応する組合せI C0NB I [1)
IC0VIBI(21,ICOMBI(3)の値を例示
したものである。ここでIoutと゛書いであるのは、
組合せ発生部33で組合せ発生終了後に更新された工の
値であり、■の値として0〜C−1が入力されたとき、
これに1加えられたものが出力される。
ただし■−Cが入力されたときには・すべての組合せの
発生が終了したことを示すフラグとしてIout=0 
が出力される。この組合せ発生部33を動作させるに先
立ってNおよびMの値は予め与えておく。組合せ発生部
33を実現するには、たとえばマイクロ・コンピュータ
などを用いて第11図のフローチャートに示すような処
理を実行すればよい。このようにしてまった組合せIC
OMBIは、 >v 6 +wのメモリ9内のレジスタ
の番地指定に用いられる。すなわち、I COM B(
1)。
I COM、B I (2)、・・・、ICOMBI(
M)の値で指定した番地の上記レジスタの値をOに置換
えることにより、それに対応する残差パルスは取除かれ
る。
す\゛ かくして、同時にM個の残差パルスの抜取られることに
なる。なお、複数量の番地指定を同時に実行することが
困難であるならば、819図のクロックCL Kの1周
期内にIC0NB 工(11,I COMB I(2)
、・・・、ICOMBI(M)の川内に夕、(ひ、モパ
ルスを抜いていけばよい。このようにして一部取除かれ
た残差パルスを音源として音声合成を行い誤差を評価す
る動作は、■方式の場合と同様である。このとき第9図
において誤差εがメモリ29の値より小さいときにメモ
リ30′にラッチされるのは、これまでの計算で最小誤
差を与える抜取り残差位置の組合せである。かくしてI
’=0.1,2.・・・。
C−1まで誤差の比較が終了すると、最終結果としてメ
モリ30′にはすべての組合せのうちで最′小誤差を与
える抜取り残差位1θの組合せRが格納され、メモリ2
9にはその最小誤差値が格納されている。この直後から
次のフレームでの誤差計算が開始するまで(したがって
メモリ30′の内容がクリアされる前)に上記組合せR
が第6図のメモリ8に与えられ、それに対応する残差パ
ルスが抜取られる。このようにして?j1られた最適抜
泡り後の圧縮された残差パルスは合成器の駆動音源とし
て用いられる。第9図に立ち返り、前にも述べたように
、すべての組合せ発生が終了すると組合せ発生部33か
らIout=Oが出力されるので、この情報を利用して
、カウンタ31′、メモリ29カどのリセットが行われ
る。このときカウンタ31′には0が、またメモリ29
にはEΔ・IAXの値がセットされる。
次に・残差抜取数Mを音声情報から適応的に決定する方
法を説明する。
第12図は、第3図と同様残差パルスを左から右へ、振
幅値の小さいものから大きいものへ順に並べたものを包
絡線により示したものである。第12図(a)の111
T+□は・該短区間の残差パルスの振幅の最大値であり
、uthは残差抜取り操作により。
この値未満の振幅値の残差パルスが抜取られる最大本数
Mで抜取り操作を打切るという、■長幅のしきい値であ
る。uthの値の定め方の1例を示すと、次式のように
なる。
u th= r、 @ umax (5)ここに、rl
は0<rl<1なる定数である。
uthを決定する他の例を示すと1次式のようになる。
11t)、=r2°u(6) ここに、r2はr2>Oなる定数、Uは残差振幅の長時
間平均値である。なお、(6)式は、r2の選び方や音
声信号のレベルによっては、uthの値が”+1+mK
の値を超えることがある。この場合は全残差パルスを抜
取ることになり1合成器を駆動する音源がなくなり不都
合である。したがって(+(1)式を用いるときには、
最大残差抜取数Mmax (Mm、、 <N)を予め定
めておき、(6)式の引算の結果、もしM > N)m
axなるMを与えるIIthがまったときには(6)式
によらずMmMmaxに定めることとする。
(6)式は、長時間の音声波形の中で、音声の品質の影
響は、振幅の大きい部分でより多く受けるので、残差伝
送44:ハ・音声の振幅の大きさに対応して増加させる
という考えに基くものである。なお、ut+If:必ず
しもUに比例して定める必要はなく・uth = r2
6 f (u) (6)’としてもよい・ここにf(u
)VJ、uの一価の非線形増加関係である。
(5)式によるLIthをめ方は口1算が簡単であるが
・umaX の値のばらつきに左右され易いという難点
がある。そこでより安定にMの値をめる方法を次に説明
する。いま・小さい方から大きい方へ並べた残差パルス
の振幅値をu189吋、・・・、福。
・・・、 11N(= umax )で表わすものとす
る。基本的な考え方は、第12図(b)においてS+/
Sを一定になるように’Mの値を定めるということであ
る。
ここに。
S=S++82(−Σ ub) (9)k=1 である。これは、音声の品質上重要な情報量は。
振幅の大きい残差パルスの振幅値の総和に比例するとい
う考え方に基くものである。この演算が安定である理由
は、Sl’PSの計算が総和をめる演3つ、であり・ば
らつきを平滑化する機能があるからである。
上記説明したuthをめる方法は・音声の品質を表わす
物理量と直接に対応が付きにくいという欠点がある。そ
こで、音声の品質を表わす諸量によりMの値を決定する
方式を示す。
音声の情報として重要でたい振幅の小さい残差パルス列
は白色雑音と見なすことができる。したがって全く圧縮
していない残差パルス列を雑音のない信号と見た場合、
上記小振幅の残差ノ(ルスを抜取る操作は・信号に白色
雑音を一1倍して加えたものと等測的に等しい。したが
って1合成音声の品質をS/N比として評価するのは自
然である。
このような考え方に立てば、残差抜取本数Mは。
次式で定義するS/N比を超えない最大抜取本数として
定めればよい。
S/N=201og −(dB) (101σ2 ここに であり、σ、σ2はそれぞれ信号および雑音の標準偏差
を表わしている。ただし、それぞれ信号・雑音の直流成
分はOとして計算している。
更に、もう一つの方法は残差抜取数を原波形と合成波形
の誤差に依存して決定するという方法で・例えば(1)
式の誤差εを用いれば。
ε≦ε*h (13) なる最大抜取本数として残差抜取数Mを決定すればよい
・ここで6thはしきい値である・勿論誤差は、(11
式で示した波形誤差に限定されず・スペクトルひずみ尺
度など他の誤差で評価してもよい。
以上説明した実施例以外に、残差振幅情報あるいは誤差
情報の代りに・原音声波形・合成音声波形などの情報を
基に抜取本数Mを決定する、さまざまな変形方式が存在
する。
上記の抜取本数Mをめる一連の計算は、四則演算器、メ
モリ、テーブル参照、比較器などにより容易に実行する
ことができる。例えば・(6)7式のf (u)は、f
(u)を関数テーブルとして用意しておき、テーブル参
照によりめればよい。また(1υ(13式においては、
平方根の演算を行わずσ2およびσ: をめておき・細
穴の代りに S/N=10Log′”7 (dB) (10)’σ2 を計算すれば、演算計を減らすことができる。
なお、残差パルス等の信号の振幅を小さい方から大きい
方へ順に並べる処理は、公知のソーティング手法を用い
れば実現できる。
第13図は第2の実施例の構成図を示したもので、第1
の実施例との違いは、振幅補正を省略したということで
ある。すなわち、(1)式においてa=1とした場合の
式 を誤差の評価式として用いたということである。
振幅補正を省略した場合5.、I振幅誤差は省略しない
場合より大きくはなるが1回路構成を大幅に簡略化でき
るという長所が生れる。第134図と第6図の違いは、
第1図においてaを計算する回路構成。
すなわち、計算回路19.メモリ27・および掛算器1
4を取除いたということを2重み付はフィルタ13.1
3’を1つにまとめたということである。これにより回
路構成が大幅に簡略化されている。なお重み付はフィル
タを1つにまとめられるのは、このフィルタが線形フィ
ルタである場合に限られる。すなわち1重み付はフィル
タのインパルス応答をwj、XjとMJのたたみ込み演
算をXj■Wjで表わせば、 Xj、 XJ は定義に
より。
Xj=Xj■W j (14) xj=XS■町 (15) で表わされる。これを(1)7式に代入し、式の線形性
を考慮に入れて(1)7式を整理すれば・を得る。(7
)式は、原波形Xj および合成波形のおのおのに重み
付けを行ってから引き算を行うのではなく、引き算を行
ってから重み付けを行えばよいことを示しており・これ
を図示したのが第13図の加算器18・重み付はフィル
タ13の部分であるO 以上が重み付はフィルタを1つにまとめられる根拠であ
る。
第14図は第3の実施例の構成図を示しだもので・第1
および第2の実施例との違いは・誤差の評価式として・
成形誤差の代りに(8)式で示されるスペクトルひずみ
尺度SDを用いた点であるOすなわち・ (17) ここにXI、 X’、はそれぞれ原波形Xjおよび合成
波形x1のフーリエ変換・八′はXIあるいはXSのデ
ータの個数である。波形誤差とスペクトルひずみ尺度と
の特性上の相違は、波形誤差はスペクトルの振幅成分と
位相成分が共に誤差の中に盛込1れているが、スペクト
ルひずみ尺度はスペクトルの振幅成分めみを評価する尺
度であるという点である。さらに・スペクトルひずみ尺
度は信号値の対数をとっていることより、一般に大きい
パワーをもつホルマント成分が抑制され・零が相対的に
強調されるという特性を有している。以上より両誤差尺
度により得られる圧縮化残差波形の性質は一般に異なっ
たものとなる。演算量の観点から言えば、スペクトルひ
ずみ尺度では窓かけ、FFT演算、対数演算などを実行
しなければならないので、波形誤差に比べて演算量は膨
大なものとなり著しく不利である。その反面、零が強調
されるので、零の情報が品質上重要な鼻音や無声破裂音
などの品質を適切に評価することができる。
以下、第1あるいは第2の実施例と異なる部分について
のみ説明する。第14図では2重み付けおよび振幅補正
を施した例について説明する。このとき、(8)式にお
いてXlの代りにXI(xjのフーリエ変換)−XIの
代りにaXI(x、のフーリエ変換に振幅補正係数を乗
じたもの)を用いることになる。第14図において・原
波形を重み付はフィルタ13′に通過させた出力波形)
Jに対して、ハニンク窓、ハミング窓等の公知の窓かけ
処理を施す。これは波形を短区間で切出したために生ず
る切出し端の不連続の影響を和らげるだめの処理であり
2窓かけ回路34により実行する。次に窓かけ処理を施
した後の波形に対してFFT演算器35によりFFT演
算を適用し、Xjの振幅スペクトルl XIlをめ、−
タんバッファメモリ36に格納しておく。次にバッファ
メモリ36よりl XIlを1要素ずつ取出し、常用対
数計算回路37により、その常用対数をめる。同様にし
て、合成波形に重み付けを施し、振幅補正係数を掛けた
波形aXjに対しても・34’、35’、36’。
37′により順次窓かけ・FFT、バッファメモリへ格
納、要素の常用対数計算を行っていく。次に常用対数計
算回路37.37’からの出力を加算器18を用いて減
算し・、該要素のtogtolaXllさらにこの値を
掛算器38により20倍し、続いて掛算器15により2
乗した結果の値をメモリ16に格納しである値(初期値
は0)と加算器17により足し合せ、その値を改めてメ
モリ16の上記の演算をi=1からi−N’まで繰返せ
ば。
最終的にメモリ16にスペクトルひずみ尺度の値をめる
ことができる。但しここでは演算を簡略にするためにN
′で割る処理と平方根をめる処理は省いている。スペク
トルひずみ尺度値をめる目的が・誤差を最小とする抜取
残差をめることであるので、値の相対比較さえ出来れば
よい。
したがって上記の演算を省略しても何ら支障はない。
上記演算は、09式の値をめる1例を示したもので20
7)式を演算する手順は本実施例が吃−の方法ではない
。例えば加算器18で引算を行う代りを行ってもよい。
また、窓かけ処理、FFT演算などを2つの回路で行わ
ず1つに共通化してもよいO 勿論1本実施例は、重み付はフィルタを省略した場合・
振幅補正を行わない場合等にも適用出来、組合せにより
さまざまな変形が存在する。
残差パルスの抜取方法についても、遂次法事法。
同時抜取法のいずれにも適用可能である。
なお1重み付はフィルタについては、必ずしもNo1s
e Weighting pilterに限定される必
要はない。例えば、ローパス・フィルタを用いれば、ベ
ースバンド(IKH2以下の周波数成分)のみを強調で
きるので、ピッチ周波数成分を強調して評価することが
できる。すなわち、残差パルスのうちでピッチの情報を
担うパルスの欠落の有無をより忠実に評価する尺度を構
成することができる。
このように周波数のどのような特徴を強調したいかによ
って、任意の重み付はフィルタを用い得る。
今まで述べてきた方法は、誤差を計算するたびに合成処
理を実行しなければならない。演算量の多い合成処理を
誤差計算回数だけ実行する計算回数の総和は莫大な数と
なり、処理時間も長大なものとなる。そこで、前もって
合成器のインパルス応答をめておくだけで・後は合成処
理は全く行わずに誤差を計算する。以下その原理につい
て述べる。誤差εの一般式は(1)式で示される。そこ
でXjと)Jとの関係、あるいはXjとxjとの関係は
、WjをW(Z)のインパルス応答とすれば、それぞれ
as、 (1’J式に示すたたみ込みで表わされる。
壕だ、原音声信号XjのZ変換をX(Z)、 残差信号
IJのZ変換をU(Z)とすれば、U(Z)は線形予測
分析フィルタG−’(Z)の出力であるからX(Z)と
U(Z)の関係は U (Z) = G−’ (Z) X(Z) (20)
で表わされる。したがって X (Z) =G、(Z) U (Z) (21)が成
立する。ただしG(Z)はG−’(Z)の逆フィルタ、
すなわち合成器の伝達関数である。12◇式を時間領域
で表現すると、G(Z)のインパルス応答をgj とし
てに)式で表わされる。
一方、圧縮された残差信号をul で表わせば、合成音
声信号 Sは(23)式で表わされる。
ただし・抜取る残差パルスの個数をM−に番目に抜取る
残差パルス位置をrlkで表わせばU(は。
ここにδ□、nはクロネッ力−のデルタ・すなわちδl
Tlln=l(m=n)、 δ、、、n=0 (m’=
n )テする。(24)式を(23)式に代入して整理
するとX′は次のようになる。
X3 = xj −11(M) (25)ここに Aj(M)M E unkgj J。
h=t (26) (a)式から、 Aj(M)は、抜取られた残差パルス
を音源として駆動して得られた合成器の出力波形、すな
わち残差パルスを抜取ることにより発生した音声信号の
誤差成分となっている。
いま、(1)式の誤差εを抜取り個数に依存する”I・
という意味で改めてε(M)と表わせば、ε(M)は(
18) 、 (19) 、 (22) 、 (25)お
よび(26)式を用いて(1)式を整理すると(27)
式のようになる。
であり、hjは合成器と重み付はフィルタW(Z)を縦
続接続させた系、す々わち11(Z)酋G(Z)W(Z
)のインパルス応答である。ただし、重み付けを行わな
い場合、すなわちW(Z):1の場合はhjFigjに
等しくなる。
次に(27)式からaを消去することを考える。まず、
振幅補正を施さない場合は次のようになる。
振幅補正を施さない場合はa==1であるから(27)
式はさらに次のように簡単になる。
ここで fj(M):Σ unkJ−nk(30)k=1 ト置くト、fJ(M) は残差パルスを抜取ることによ
り発生した音声信号の誤差成分に重み付けを施して表現
したもので1重み付けを施さない場合のtj(M) (
(26)式)に対応するものである。
次に、振幅補正を施した場合は次のようになる。
振幅補正係数aは、(1)式においてεの最小値を与え
る解として与えられる。したがって(1)式において と置けば、aは次式のようにまる。
ここで、(18) 、 (19) 、 (25) 、 
(26) 、 (28)および終曲に次の(16)式が
得られる。ただし評価区間の有限長演算打切りにより生
ずる誤差は無視している0 Xj= Xj−f j(M) (32)この式を(15
)式に代入すれば、aは次のようになるO さらに(32) 、 (33)式を(1)式に代入して
整理すれば・誤差の式として最終的に次式を得る。
ここに B= Σ (f j(M) )2(37)j=1 以上で誤差を計算することができるわけで、以下にこれ
らの誤差の式を用いて誤差の最小値を与えるM個の除去
パルス位置n k(k = l 、 2.・・・、M)
をめるアルゴリズムについて説明する。
まず逐次抜取法について説明する。逐次抜取法は、(2
9)式あるいは(34)式において、逐次的にそれぞれ
ε(1)、ε(2)、・・・、ε(M)の最小値をめつ
つパルスを抜取っていく処理である。
振幅補正を施さない場合、 (29)式を書き直すと次
のようになる。
(29) ’ ここで()内の第1項は直前までのステップで既に抜取
られたパルス、すなわちunk=O(k=1.2.・・
・、M−1)なので0となる。したがって(29)’式
は・ となる。パルスの抜取りは、評価区間の端部の影響をで
きるだけ受けないようにするため一評価区間[1,Ll
の中心部付近の一部の区間[”s。
”2 )で行うこととする。ここで・ n 1≦n M≦n 2(39) 1 << n 1< 12 << L (40)である
。(26)式の条件エリhjはjキLではほと値はnM
の値に関係なくほぼ一定となる。そこでと貿き、この式
を(38)式に代入すれば次式を得る。
ε(M) =に−u−M(42) (42)式は、直前管でのステップで既に抜取られOと
置き換えられたパルスを除いて、抜取区間[”+ 1 
”2] 内で振幅が酸も小さいパルスを取除けば、抜取
りにより生ずる誤差が最小となることを示している。す
なわち、振幅補正を施さない場合の逐次抜取法のアルゴ
リズムは、抜取区間内で振幅が小さい順に所定の数だけ
残差パルスを取除く、というものである。これは極めて
単純なアルゴリズムであり、誤差計算すら必要としない
のが大きな特長である。この方式を次に述べる振幅補正
を施した場合の逐次抜取法と区別するために特に「小振
幅順残差抜増法」と呼ぶことにする。
これに対して振幅補正を施した場合の逐次抜取法を「補
正付逐次抜つ法」と呼ぶことにする。
振幅補正を施した場合、上で述べたのと同じ理由でfj
(M)は次式のようにff1i略化できる。
tj (M) = ’nu ’1j−nu eηj、 
”M (43)−’、’H,k = ukhj−h (
43)’(35) 、 (37)式におけるfj(M)
として(30)式の代りに(43)式を計算することに
より演算量を減らすことができる。なお、 (36)式
におけるAは八−−Sに関係なく一定値であるから前も
って一回だけ計算しておけばよい。またφは前もって(
43)’式を計算してηj、にの2次元のテーブルを作
成しておき、A−4>−s時に各パルスごとに(35)
式をXjとηj+にの積和として割算すればよい。同様
にBはA−1p−s時にηj、にの2乗和として計算す
ればよい。
次に同時抜取法について説明する。同時抜取法とは、(
29)式あるいは(34)式で表わされるε(M)の値
を増除くM個のパルスの起り得るすべての組合せについ
て計算し・ ε(M)の最小値をめこのときの除去パル
ス位置をめる処理である。
振幅補正を施さない場合、ε(M)を(29)式により
計算してε(M)の最小値をめる。
また振幅補正を施した場合、ε(M)を(34)式によ
り計算してε(M)の最小値をめる。ただしf j(M
)の値は(30)式によりめる。
上記のように同時抜取法は、逐次抜取法のような式の簡
略化ができないので、ε(M)をめる演算量そのものも
遂次抜取法より大きくなる。ただし、逐次抜取法の場合
と同様にA−1,−8に先立ってηj+にテーブルを作
成しておけば、A−1)−8ごとにηJ+kを計算する
場合より著しく演算量が減少できる。
第15図は第4の実施例を示したもので2音声分析およ
び音声合成の具体例としてPARCOR分析器、PAR
CO几合成器全合成器た分析合成系について説明する。
スペクトル・エンベロープ情報と音源情報を分離するこ
とを基本とする生成源処理の分析・合成器であるならば
PARCOR分析・合成器の代りに用いることができる
(実施例5以降についても同様)。以下の説明は音声デ
ータから切出された短区間(1フレーム)音声データに
ついての一回の処理内容についてであって・全音声区間
については・以下に説明する処理を繰返し実行すればよ
い(実施例5以降についても同様)。
残差パルスの抜き方については、前述の01本ずつ誤差
εの最小値をめながら所定の本数(M本)まで抜いてい
く方式(遂次抜取法)と、前述の@一度にM本抜く方式
(同時抜取法)の2方式を例示する。以下の説明では、
1フレーム内の抜取り対象の残差パルスの総本数をN本
とする。ここで評価区間データ数りと上記Nとの表記が
異なるのは、評価区間と残差抜取区間とは必ずしも一致
しないからである。一般に残差抜取区間は評価区間内に
含まれる。
以下、■の残差パルスを1本ずつ誤差εの最小値をめな
がら所定の本数まで抜いていく方式(遂次抜取法)につ
いて説明するO まず、切出された1フレーム音声データ(原音声)は、
メモリ6に格納される。次にメモリ6に格納された音声
データXjはPARCOR分析器7に入力され、PAR
COR分析によりPltCOR係数に+ (+ =1 
+ 2 +・・・、p)が計算され、同時にI) A 
RCOR分析器7の出力信号として残差信号ujがめら
れる。残差信号ujは、−たんメモリ8に格納される。
以上の演算は1フレームにつき唯一回だけ行われる。次
に、メモリ8に格納されている残差信号はそのままメモ
リ9に転送される0しかる後に・誤差最小値探索部10
の中に設置されているカウンタ値CNで指定されるメモ
リ9内の番地のレジスタにOを書き込む。この動作はメ
モリ9に書込まれている残差パルス列tlj(j=1.
2.・・・、N)中のj=cNの残差パルスを抜取る(
すなわちucN=0とする)ことを意味している。ここ
でCNO値は・抜取り対象残差パルスの時間方向並びに
対応して、クロックの起動によりCN=1.2.・・・
、Nまで順次変化する。
すなわち、メモリ9内では・クロックの起動ごとに・残
差パルスがul + ’2 + ”11 +・・・、u
Nの順に0に置き換えられる。第1回目の誤差計算前に
はカウンタ値CNはリセットされCN=1にセットされ
る。従って第1回目はCN=1であるからu、=Qとし
た場合の誤差が計算される。誤差計算は以下のとおりで
ある。すなわち、ujのうちの抜取るべき1本のパルス
を上記と同様にカウンタ値CNにより指定することによ
り、抜取残差選択回路13により抽出し、同回路13内
のメモリに格納する。−男前に1)All、C(l 分
析器7によりめたPARCOR係数kt(i=1.2.
・・・。
p)の値をPARCO几合成器11′に与え、この合成
器11′に音源として単位インパルス信号を入力して得
られたインパルス応答波形gJを重み付はフィルタ14
に入力し、その応答波形としてhjを得、メモリ15に
格納する0々おこのh3をめる処理は、A−1>−8に
先だって1フレームに唯一度だけ実行しておけばよ10
次にこのhjと先程求めた抜尉残差パルスLlnいを用
いて。
(M=にとして)抜取誤差成分計算回路16により(4
3)式を計算しfj(M)を得る。なお、この計算はA
−17−8中に行ってもよいが、前にも述べたようにA
−17−sに先立って上の方法により(43)’式のη
1+にテーブルを作成しておき、A−/>−8時にはテ
ーブル検索のみによってfj(M)をめるようにした方
が処理が速くなる。他方、A−b−sに先立って予め原
音声波形Xj より。
重み付はフィルタ14’ (14と併用してもよい)処
理を施した音声波形Xjをめ、メモリ17に格納してお
く。このXjと先に述べておいたf j(haを用いて
、誤差計算回路18により、(35)〜(37)式を計
算し、さらにこれらを基に(18)式を計算して誤差ε
(M)をめる。このとき、前に述べたように(20)式
のAはA−レーSに先立って計算しておいた方が処理速
度が速くなり望ましい。
以上によりまった。uj を抜取ったときの誤差ε(M
)は、誤差最小値探索部10に入力される。
第8図は誤差最小値探索部10の詳細図であり、ここで
は((M)が前回までに演算された誤差最小値(メモリ
29に格納されている)よりも小さいか否か比較器28
により比較される。もしそうであれば比較器28からラ
ッチ信号L’Tが出力されここで計算したε(M)の値
が誤差最小値としてメモリ29に更新登録され5回時に
そのときのカウンタ値CNもメモリ30に更新登録され
る。ただし・第1回目の誤差計算においては、メモリ2
9に予めセットしである。ε(M)の値とはなり得ない
十分大きい値EMAXとの比較であるため必ずε(M)
の値およびCN=1が登録される。
以上の誤差計算処理を第8図のクロック信号CLKに同
期させてカウンタ値CN=1からN回繰返す。このとき
1回の誤差計算が終り誤差最小値が確定してから2回目
の誤差計17が始まるまでの間に、第6図のメモリ9の
内容をメモリ8の内容に書き換えることによりリセット
、−しておく。
このようにしてN回の誤差計算が終ると第5図のメモリ
30には最小誤差を与える残差パルス位置Rが格納され
ている。そこで次のステップに入る前に第6図のメモリ
8の中のRで指定された番地のレジスタの値を0に置換
える。かくして第1段階における圧縮化残差波形は、メ
モリ8に格納されることになる。このようなステップを
M段階繰返せば、最終的にM本法事った所望の圧縮化残
差波形は、メモリ8に格納されることになる。そ圧 こて、最後にこの圧my、差波形をメモリ9を通過させ
た後、PARCOR合成器11に入力すれば、結果とし
てメモリ12に1フレ一ム分の合成波形が得られる。
以上の説明において、PARCOR分析器7゜P A 
R,CO几合成器111重み付はフィルタ14゜14′
は公知なので実現可能である。また、重み付はフィルタ
に与えるLPCパラメータα1(i=1.2.・・・、
p)をめるLPC分析手段も公知なので実現可能である
。さらに、第3図の誤差計算部19における演算(34
)〜(37)式143)。
(43)’式等はすべて公知の四則演算手段により実行
できるので実現可能である。
第5の実施例は、■の同時抜取法において、振幅補正を
省略した場合の例である。すなわち、(1)式において
a=1とした場合の式 L 〜 〜〆 ε= Σ(xj−x 312(1)’ j=1 を誤差の評価式として用いた場合の例である。この場合
、振幅誤差は省略しない場合より大きくはなるが、回路
構成を簡略化できるという長所が生れる。以下に、第1
の実施例と異なる部分に限り説明する。
第5の実施例の回路構成は・第15図において重み付は
フィルタ14′およびメモリ17を省いたものに等しい
第4の実施例と同様の手順に従ってfj(M)をめた後
・誤差計算回路18VC,より、(34)式を計算しな
いで代りに(29)式を引算すれば誤差ε(M)がする
。(29)式は公知の四則演算手段で実行できるので・
実現可能であるオ 第6の実施例は、■の逐次抜取法において・振幅補正を
省略した場合の例で、第5の実施例同様誤差は(1)′
式により表わされる。ただし・この場合は1発明の詳細
な説明のところで述べたように、誤差式ε(M)は究極
的に(42)式で表わさ6れ、「抜取区間内で振幅が小
さい順にM木桟差パルスを増除く」処理に帰着でき・誤
差計算すら不要々極めて単純かつ演算量の少々い処理と
なる。この処理を実現する方法の例を第16図および第
17図を引用して説明する。
Pr51.fj1図において 第4の実施例と同様、メモリ6中の原音声波形をPAR
,COR分析器7により分析し残差波形ujをめメモリ
8に格納する。残差波形は別続きメモリ9にも格納し、
小4辰幅順抜増制御部34により振幅の小さい方から順
に番号を付したM木の残差パルスの位置nk(k=1.
2.・・・、M) を指定し、メモリ9中のnl(の位
置のレジスタの内容をOに14換えることにより、その
位置の残差パルスを消去する。なおメモリ8は非圧縮残
差格納用に設けであるだけなので、この機能をメモリ9
と兼用してメモリを1つに減らしてもよい。次に小振幅
順抜取制御部34の機能について第17図を引用して説
明する。残差波形u1は−たんバッファメモリ35に格
納しておく。−チず11 jをソーティング手段36に
より、振幅の小さい順に並べなおす。この並べなおした
残差パルス列を、振幅の小さい順に11.、u2.・・
・、d、・・・ 、W(=u max )と呼ぶことに
する。これらt+ k(k = l 。
2、・・・、N)はメモリ37に格納される。次に予め
設定しておいた残差抜取り本数Mでメモリ37中のアド
レスを指定する。この指定されたアドレスの残差振幅を
IIMとし、特に残差4辰幅のしきい値と呼ぶことにす
る。しかる後に、クロックCLKによりカウンタ38の
値を1.2.・・・l jcl・・・。
Nの順に変化させる。このカウンタ値」Cに対応した残
差パルスujeをバッファメモリ35よりアドレス指定
により読出し、前にめだしきい値uMと比較器39によ
り比較する。そしてuM≧ujcを満足したときにラッ
チ信号LTを出力する++−〆 ようにしておき、このときに限りメモリ40に格納され
だカウンタ値jcを残差抜取位置nkとして出力する。
一←の例は、残差抜取本数Mを何らかの手段によって予
め指定した場合の例であるが、Mを指定する代りに、残
差振幅のしきい値uMを他の手段によって指定してもよ
い。このときソーティング手段36およびメモリ37は
不要となる。
上の実施例において、ソーティング手段36は公知のソ
ーティング法により実行できるので実現可能である。
以上述べた処理にエリ得られた圧縮化残差波形u1はP
AI’LCOR合成器11 (紀t 61’9)ノfi
として印加され、11の出力としてlフレーム分の合成
音声波形x1が得られ、メモリ12に格納される。
第18図は、補正付逐次抜取法(実施例1における逐次
抜取法)および同時抜取法(実施例4における同持抜増
法および実施例5)の誤差ε(M)の計算回数を21フ
レーム内の抜をり対象の残差パルスの総本数Nと残差パ
ルス抜取本数Mをさまざまな値に選んだ場合について示
したものである。
この図よりε(M)の計算回数はNの減少に伴い。
いずれの抜取法でも著しく減少することがわかる。
そこで、残差抜取区間をに個の小区間に分割しくその小
区間に含まれる抜Jl’7り対象の残差パルスの総本数
をそれぞれ2I’T+ * N2 *・・・、Nkとす
る)、各区間ごとにA−b−sを実行すれば、演算量の
大幅な減少が期待できる。ここで、分割は一般に等分割
でなくてもよい。もし等分割の場合はN+=N2=・・
・−Nk◇口となる。すなわち、艮 で計算することができる。この実施例4に示す方式を分
割A−b−s法と呼ぶことにする。
以上の第4.第5の実施例において、重み付はフィルタ
を省略することもできる。この場合は第15図において
14および14′が省略でき回路が簡単になる。
以上説明したごとく、本発明によれば、音声の品質上重
要な情報のみを有効に残し、不要な部分を取除Aた残差
パルスを1合成器の音源として用いることができるので
5合成音声を高品質に保ちながら、有効に音源情報の圧
縮を行うことができる。これにより、パラメータの情報
伝送量の低M化を図ることができる。
特に分割A4−8法の効果の一例を示すと。
N=40本、M=20本、に〜4の歩合、分割しない場
合に比して次のようにε(M+の計算回敷が減少する。
補正付逐次抜取法 0,26 倍 同時抜取法(補正付無共) 0.73X10−’倍”引
用文献 1i、S、 Ata I and J 、L l(、e
md e : A l’Jew Mod e 10f、
T、PC Excitation for producing 
Natural −8ounding 5peech 
at LOW Bit Ratcs。
Pr0C,ICASSP 82.1)[)614−61
7(1982)
【図面の簡単な説明】
第1図(a)は従来の分析合成方式を説明する図。 (tl)は残差を音源としたときの分析合成系を示す図
、第2図は本発明の詳細な説明する図、2菖3図は残差
パルスを振幅の小さい方から並べた図、第4図及び第5
図は残差抜を数をめる図、第6図は本発明の第1の実施
例を示す図、第7図は残差パルス抜取に伴う振幅の変化
を補正する係数をめる回路図、第8図及び第9[゛ン1
は誤差最小値探索部を説明する図、第1O図はN = 
5、u = 3とした場合の■in及びIcount(
り t = 1〜3の値を示す図、第11図は組合せ発
生部のフローチャートを示す図、第12図は残差パルス
の包絡線を示す図・紀13図は本発明の第2の実施例を
示す図、第14図は本発明の第3の実施例を示す図・第
15図は本発明の第4の実施例を示す図、第16図は第
6の実施例を説明する図、第17図は小振幅順抜取制御
部の機能を示す図、第18図は誤差の計算回数を示す図
。 7・・・PARCOT’L 分析器、10・・・誤差最
小値探索部、11・・・PARCOR合成器、13.1
3’。 14.14’・・・重み付はフィルタ、16.18・・
・誤差計算回路、19・・・誤差計17回路部・32・
・・T、 P C分析器、33・・・組合せ発生部、3
4・・・小振幅順接を制御部、35.35’・・・T”
 F T演算器。 第1図 (α) (7) ’Az 図 誇左 第3図 C(L) ↑ (7つ 第 4 図 へヤ臂 λ 冨 5 図 第 6 図 ■7図 2ゴ 第 q 図 f(IC5MBr 第 10 図 N二5 /−1=3 rs r(、MβI(+) I(、TMBr(Z) u
lMBI(3) f6(1t0 1 23 / 1 1 24 2 2’ + 2’ 5 3 31 3 d 4 4 1 3 5 5 5 1 4 5 に 6 2 J 4 7 72 3 5 3 ff2 4 5q 93 d 5 、θ lO(3〕 (4) (5) θ 猶 11 図 Z tb 図 T lq 図 元 /2 閏 一輩一−−x−2山゛正イ寸領4ンに11辷耳又5L−
o−6−同時抜取」

Claims (1)

  1. 【特許請求の範囲】 1、音声波形をスペクトル情報と音源情報に分離する音
    声分析部と前記スペクトル情報と前記音源情報とから音
    声波形を合成する音声合成部とを有し、前記音声分析部
    より得られる前記音源情報は複数個のパルス情保からな
    り、これらのパルス情報の一部を原音声波形とこの原音
    声波形を基に分析・合成して得られる合成音声波形との
    誤差が峡小となるような組合せで除去することにより圧
    縮したパルス情報を得ることを特徴とする音声分析方式
    。 2、前記特許請求の範囲第1項記載の音声分析方式にお
    いて、原音角波形と合成音声波形との誤差が最小となる
    ように該合成音声波形の振幅調整を施した後に、上記パ
    ルス情報圧縮のための誤差計算を実行することを特徴と
    する音声分析方式。 3、前記特許請求の範囲第1項または2項記載の音声分
    析方式において・予め定められた周波数以下の帯域を強
    調するフィルタに、原音声波形、および合成音声波形を
    通過させた後に、上記パルス情報圧縮のための誤差計算
    を実行することを特徴とする音声分析方式。 4、前記特許請求の範囲第1,2項または3項記載の音
    声分析方式において、遂次的に上記誤差が峡小となる上
    記パルスを所定の数に至るまで抜いていくことを特徴と
    する音声分析方式。 5.4f許請求の範囲1.2または3項記載の音声分析
    方式において、上記誤差が最小となる上記パルスを同時
    に所定の数だけ抜くことを特徴とする音声分析方式。 6、 前記特許請求の範囲第1項記載の音声分析方式に
    おいて、除去する音源パルスの数を・上記誤差値に依存
    した値として設定することを特徴とする音声分析方式。 7、 前記特許請求の範囲紀1項記載の音声分析方式に
    おいて、除去する音源パルスの数を、原音声波形の振幅
    値に依存して定まる評価惜を計算することによ、り設定
    することを特徴とする音声分析方式。 8、前記特許請求の範囲第1項記載の音声分析方式にお
    いて・除去する音源パルスの数を、合成音声波形の振幅
    値に依存して定まる評価量を計算することにより設定す
    ることを特徴とする音声分析方式。 9、前記特許請求の範囲第1項記載の音声分析方式にお
    いて、音声波形をスペクトル情報と音源情報に分離する
    音声分析部と、スペクトル情報と音源情報から音声波形
    を合成する音声合成部を有し、音声分析部より得られる
    複数個のパルス情報からなる音源情報の一部を該パルス
    振幅の小さい順に所定の数だけ除去することにより圧縮
    したパルス情報を得ることを特徴とする音声分析方式。 10、前記特許請求の範囲第1項または第9項記載の音
    声分析方式において・残差パルス抜取区間を複数個の小
    区間に分割し、該小区間ごとに上記パルス情報の除去を
    行うことを特徴とする音声分析方式。 11、特許請求の範囲1〜10の音声分析方式により得
    られた上記圧縮したパルス情報を音源として用いること
    を特徴とする音声合成方式。
JP59005583A 1984-01-18 1984-01-18 音声合成方法 Expired - Lifetime JP2539351B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59005583A JP2539351B2 (ja) 1984-01-18 1984-01-18 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59005583A JP2539351B2 (ja) 1984-01-18 1984-01-18 音声合成方法

Publications (2)

Publication Number Publication Date
JPS60150100A true JPS60150100A (ja) 1985-08-07
JP2539351B2 JP2539351B2 (ja) 1996-10-02

Family

ID=11615259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59005583A Expired - Lifetime JP2539351B2 (ja) 1984-01-18 1984-01-18 音声合成方法

Country Status (1)

Country Link
JP (1) JP2539351B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
JP2008256912A (ja) * 2007-04-04 2008-10-23 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
WO2012053146A1 (ja) * 2010-10-20 2012-04-26 パナソニック株式会社 符号化装置及び符号化方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
JP2008256912A (ja) * 2007-04-04 2008-10-23 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
WO2012053146A1 (ja) * 2010-10-20 2012-04-26 パナソニック株式会社 符号化装置及び符号化方法
CN103119650A (zh) * 2010-10-20 2013-05-22 松下电器产业株式会社 编码装置和编码方法
US8760323B2 (en) 2010-10-20 2014-06-24 Panasonic Corporation Encoding device and encoding method

Also Published As

Publication number Publication date
JP2539351B2 (ja) 1996-10-02

Similar Documents

Publication Publication Date Title
US9031834B2 (en) Speech enhancement techniques on the power spectrum
JPH03501896A (ja) 波形の加算重畳による音声合成のための処理装置
KR20040028932A (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
KR100327969B1 (ko) 음성재생속도변환장치및음성재생속도변환방법
EP1369846B1 (en) Speech synthesis
JPS60150100A (ja) 音声合成方法
JP3282693B2 (ja) 声質変換方法
JPH02280200A (ja) 音声符号化復号化方式
EP1267327B1 (en) Optimization of model parameters in speech coding
US20040210440A1 (en) Efficient implementation for joint optimization of excitation and model parameters with a general excitation function
JPS6162100A (ja) マルチパルス型符号化復号化装置
Steiglitz et al. Pitch extraction by trigonometric curve fitting
JP2000298500A (ja) 音声符号化方法
JPS5816297A (ja) 音声合成方式
JP3112462B2 (ja) 音声符号化装置
JP2615856B2 (ja) 音声合成方法とその装置
JPS6113300A (ja) 音声分析合成方式
JPH0514280B2 (ja)
JPH0258640B2 (ja)
Smyth et al. On the Role of Lip Reflection/Transmission in the Relationship Between LPC and Waveguide Vocal Tract Models
Saha et al. Comparison of Musical Pitch Analysis Between LPC and CELP
JPS61256400A (ja) 音声分析合成方式
Schnell et al. Modeling Fluctuations of Voiced Excitation for Speech Generation Based on Recursive Volterra Systems
JPS60262200A (ja) スペクトルパラメ−タ補間方法
JPS621000A (ja) 音声処理装置