JPS61256400A - 音声分析合成方式 - Google Patents

音声分析合成方式

Info

Publication number
JPS61256400A
JPS61256400A JP60097743A JP9774385A JPS61256400A JP S61256400 A JPS61256400 A JP S61256400A JP 60097743 A JP60097743 A JP 60097743A JP 9774385 A JP9774385 A JP 9774385A JP S61256400 A JPS61256400 A JP S61256400A
Authority
JP
Japan
Prior art keywords
speech
sound source
information
pulse
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60097743A
Other languages
English (en)
Inventor
武田 昌一
市川 熹
浅川 吉章
宮本 宜則
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60097743A priority Critical patent/JPS61256400A/ja
Publication of JPS61256400A publication Critical patent/JPS61256400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は音声の分析合成方式の改良に関する。
〔発明の背景〕
音声を/ア/とか/イ/のような情報を主に担うスペク
トル・エンベロープ情報と、アクセントやイントネーシ
ョンのような抑揚を担う音源情報に分離して処理あるい
は伝送する方式は生成源方式と呼ばれている。パーコー
ル(PARCOR:偏自己相関)方式、エルエスピー(
1,SP:8スペク1〜ル対)方式などがその例である
。これら生成源方式は、音声の情報圧縮が可能であり、
そのためボイスメール、玩具、教育機器などへの応用に
適している。また、生成源方式の上記の情報分離性は、
規則合成には不可欠な性質である。従来の生成源方式に
おいては、第1図に示すように、音源情報として疑似的
に発生させた白色雑音1あるいはインパルス列2を切換
えて用いていた。このとき合成器に印加する音源情報は
、■有声/無声情報3、■音源振幅4および■ピッチ周
期(あるいはピッチ周波数)5であった。すなわち、上
記■の情報を用いて有声の場合インパルス列を発生させ
、無声の場合白色雑音を発生させる。これらの信号の振
幅はJ二記■により与えられる。またインパルス列の発
生間隔は」二記■により与えられる。
このような疑似的音源を用いることにより次のような音
質劣化が起こり、従来の生成源方式による分析合成音声
が一定の品質の限界を乗り越えることは不可能であった
(1)分析時に起こる有声/無声の判定誤りによる音質
劣化。
(2)ピッチ抽出誤りによる音質劣化。
(3)女声の/イ/や/つ/などに発生するホルマント
成分とピッチ成分の分離の不完全性に基づく音質劣化。
(4) PARCOR方式など全極モデルの限界により
、スペクトルの零の情報を担えないために生ずる音質劣
化。
(5)音声の自然性に重要な非定常成分、ゆらぎの情報
が棄てられるために生ずる音質劣化。
これらの音質劣化の要因を除去する手段の一つとして、
PARCOR方式や丁、SP方式の予測残差信号(パル
ス列)から音質上の影響の少ないパルスを間引いた残り
のパルスを合成器の音源として利用する「残差圧縮法」
 〔代用・市川、「残差圧縮法による音声合成の検討」
、昭和59年度電子通信学会総合全国大会1.636 
(文献1)、浅用他、「残差情報を利用した音声合成法
の検討」日本音響学会講演論文集3−1−7(昭59.
1−0(文献2)〕が公知の手段として挙げられる(第
2図)。
残差圧縮法によれば確かに合成音声の品質は向」ニする
。しかし残った残差パルスが必ずしも音源パルスとして
最適であるという保証はなく、音質改善の余地がまた残
されている。
〔発明の目的〕
本発明の目的は、間引いた残りの残差パルスの振幅を最
適化処理により修正して、合成音声の音質を改善する方
法を提供することにある。
〔発明の概要〕
1フレーム内の処理について考える。いま原音声波形を
Xj  (i=1.2,3. ・=、L)、残差圧縮法
により圧縮した残差パルス(圧縮化残差パルス)  u
h’  (k=1.2.・・・、M)を音源に用いて合
成した音声波形を xJ′ とする。ただし、Lは1フ
レームにおける誤差評価区間内の音声サンプル数、Mは
圧縮化残差パルスの本数である。
合成音声波形は、合成フィルタのインパルス応答をgj
とすれば次式で表わされる。
X、、/=Σ uk′gJ  n、h      ”’
(]、)ここに、nhは1つフレーム内のに番目の圧縮
化残差パルスの位置を表わす。
したがって誤差を波形値の差の2乗和 ε=Σ (XJ−Σ−uh’ gjnh) ”・13)
を得る。
本発明は、誤差が最小となるように圧縮化残差パルスは
振幅を修正する方法を提供するものである。これは(3
)式の誤差が最小となるようにuk/  (k=1.2
. ・=、M)の値を決定する問題に帰着される。その
ため(3)式を U 、 /について偏微分してOと置
くと次のようになる。
i=1.2.・・・9M これを整理すれば次のu 、 /に関する連立1次方程
式を得る。
Σuh”7nhtni=ψn、  i=1.2.−、 
M’−(4)ここにηはg、の自己相関関数、ψはXJ
 とgAの相互相関関数を表わし、それぞれ(5)、(
6)式で定義される。
η1n−Σ gJ−−g、+−++         
 −cs)J+l u 、 l  は(4)式を公知の連立方程式の解法に
より解くことにより求めることができる。
〔発明の実施例〕
以下、本発明の一実施例を第3図〜第6図により説明す
る。
本実施例では、前記文献])および2)の公知例に見ら
れる、残差の振幅(絶対値)の小さい順に抜取る圧縮法
を例にとるが、勿論、他の抜取法についても適用可能で
ある。
第3図のメモリ6中の原音声波形をPARCOR等音声
分析器7により分析し、スペク1へルエンベローブパラ
メータに=  (i=1,2.・・・+ p: Pはパ
ラメータ次数)と残差波形u4を求める。uJはメモリ
8に格納し、引続き音源パルス生成部9の中のメモリ1
0(第5図)にも格納する。しかる後に、小振幅順抜取
制御部34により、振幅(絶対値)の小さい方から順に
番号を付してM′本の残差パルスの位置nk’ (k、
 = 1− 、2 、・・・M’)を指定し、メモリ1
o中の n、′の位置のレジスタの内容をOに置換える
ことにより、その位置の残差パルスを消去する。ここで
M′は抜取る残差パルスの本数で、]、フレーム中の総
残差パルスの本数Nから音源パルス(圧縮化残差パルス
)の本数Mを引いた数に等しい。なお、メモリ8は非圧
縮残差格舶用に設けであるだけなので、この機能をメモ
リ1.0(第5図)と兼用してメモリを1つ減らしても
よい。
次に小振幅順抜取制御部34の機能について第4図を引
用いて説明する。残差波形uJ は−たんバッファメモ
リ35に格納しておく。まずu、l をソーティング手
段36により、振幅の小さい順に並べなおす。この並べ
なおした残差パルス列を、振幅の小さい順にu、a、u
げ、・・・、 uh’、・・・。
u%=(umaj と呼ぶことにする。これらU−(k
=1.2.・・・、N)はメモリ37に格納される。次
に予め設定しておいた残差抜取り本数M′でメモリ37
中のアドレスを指定する。この指定されたアドレスの残
差振幅をu MD’ とし、特に残差振幅のしきい値と
呼ぶことにする。しかる後にクロックCLKによりカウ
ンタ38の値を1,2゜・・・y+]cy・・・、Nの
順に変化させる。このカウンタ値j0に対応した残差パ
ルスuJcをバッファメモリ35よりアドレス指定によ
り読出し、前に求めたしきい値u IID’と比較器3
9により比較する。
そしてu )ID’≧IJ、。を満足したときにラッチ
信号LTを出力するようにしておき、このときに限りメ
モリ40に格納されたカウンタ値j0を残差抜取位置n
k′ として出力する。
上の例は、残差抜取本数M′を何らかの手段によって予
め指定した場合の例であるが、M′を指定する代りに、
残差振幅のしきい値u woa を他の手段によって指
定してもよい。このときソーティング手段36およびメ
モリ37は不要となる。なお、ソーティング手段36は
公知のソーティング法により実施できる。
次に小振幅順に抜取られた後に残った残差パルスを振幅
に関して最適化する。最適化は第5図の最適化手段13
により実行される。ここでnhは1フレーム内のに番目
の圧縮化残差パルスの位置を示し、圧縮化残差が格納さ
れているメモリ10の残差の存在するアドレスを見るこ
とにより得ることができる。
第6図は最適化手段13の詳細を示したものである。ま
ず前に求めておいたスベクl−ルエンベロープパラメー
タ値kl  (i=1* 2t・・・tp)を合成フィ
ルタ1.1−’(11と同一:兼用してもよい)に設定
し、該合成フィルタ11′の入力に単一インパルス信号
を印加して、その応答波形としてgJ F=1t 2t
・・・L)を得てメモリ14に−たん格納しておく。し
かる後に、gJ を用いて自己相関計算手段15により
自己相関関数η、、。
を計算し、メモリ17に格納する。同様に、gJと原音
声波形XJ を用いて相互相関計算手段16により相互
相関関数ψ、を計算し、メモリ18に格納する。ここで
、自己相関関数および相互相関関数はそれぞれ(5)お
よび(6)により計算さく10) れる。(5)、(6)式の実行は公知の積和計算手段に
より容易に実現できる。次に自己相関行列(η、9.)
および相互相関ベクトル(ψ。)が連立方程式の解算出
手段19に入力され、その解として圧縮化残差振幅u、
l が求まる。ここで連立方程式の解算出手段19にお
いては(4)式が計算される。該計算は公知の連立方程
式解法により容易に解くことができる。
以」二述べた処理により得られた圧縮化残差波形U1.
′  は、合成器コ−1(第3図)の音源として印加さ
れ、11の出力として]フレーム分の合成音声波形xJ
′  が得られ、メモリ12に格納される。
以」二の処理を逐次的にフレームごとに実行すれば全音
声の分析・合成が実現できる。
〔発明の効果〕
本発明によれば、圧縮化残差パルスをさらに振幅に関し
て最適化しているので、従来の圧縮化残差パルスを音源
として用いるより、一層高品質の合成音声を得ることが
できる。最適化に用いる連立方程式の計算の処理量は、
残存する少ない数のパルスに対する計算なので、ごくわ
ずかである。
【図面の簡単な説明】
第1図は従来の分析合成方式の説明図、第2図は残差圧
縮法の基本原理を示す説明図、第3図は本発明方式の一
実施態様を示すブロック図、第4図は小振幅順抜取制御
部の機能説明のためのブロック図、第5図は音源パルス
生成部の内部説明図、第6図は最適化手段の一例を示す
ブロック図である。 9・・・音源パルス生成部、13・・・最適化手段、1
5・・・自己相関計算手段、16・・・相互相関計算手
段、19・・・連立方程式の解算出手段。

Claims (1)

  1. 【特許請求の範囲】 1、音声波形(原音声波形)をスペクトル情報と音源情
    報に分離する音声分析部と、スペクトル情報と音源情報
    から音声波形(合成音声波形)を合成する音声合成部を
    有し、音声分析部より得られる複数個のパルス情報から
    なる音源情報の一部を該パルス振幅の小さい順に所定の
    数だけ除去することにより圧縮したパルス情報を得るこ
    とを特徴とする音声分析合成方式において、上記音声合
    成部のインパルス応答波形の自己相関関数を求める手段
    と、該インパルス応答波形と上記原音声波形の相互相関
    関数を求める手段を具備し、これらの手段により求めら
    れた自己相関関数、相互相関関数、および上記圧縮した
    パルスの位置情報より得られる定数部を係数とした一次
    連立方程式を解くことにより、得られた値により音源パ
    ルスの振幅値を補正設定することを特徴とする音声分析
    合成方式。 2、特許請求の範囲1記載の音声分析方式により得られ
    た音源パルスを合成器の音源として使用することを特徴
    とする音声分析合成方式。
JP60097743A 1985-05-10 1985-05-10 音声分析合成方式 Pending JPS61256400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60097743A JPS61256400A (ja) 1985-05-10 1985-05-10 音声分析合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60097743A JPS61256400A (ja) 1985-05-10 1985-05-10 音声分析合成方式

Publications (1)

Publication Number Publication Date
JPS61256400A true JPS61256400A (ja) 1986-11-13

Family

ID=14200369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60097743A Pending JPS61256400A (ja) 1985-05-10 1985-05-10 音声分析合成方式

Country Status (1)

Country Link
JP (1) JPS61256400A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008256912A (ja) * 2007-04-04 2008-10-23 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
JP2011150232A (ja) * 2010-01-25 2011-08-04 Nippon Telegr & Teleph Corp <Ntt> Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008256912A (ja) * 2007-04-04 2008-10-23 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
JP2011150232A (ja) * 2010-01-25 2011-08-04 Nippon Telegr & Teleph Corp <Ntt> Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム

Similar Documents

Publication Publication Date Title
US4709390A (en) Speech message code modifying arrangement
US4220819A (en) Residual excited predictive speech coding system
RU2414010C2 (ru) Трансформация шкалы времени кадров в широкополосном вокодере
KR20170107283A (ko) 자연어 음성인식의 성능향상을 위한 데이터 증강방법
US11393452B2 (en) Device for learning speech conversion, and device, method, and program for converting speech
JPS61134000A (ja) 音声分析合成方式
US7643988B2 (en) Method for analyzing fundamental frequency information and voice conversion method and system implementing said analysis method
JP2798003B2 (ja) 音声帯域拡大装置および音声帯域拡大方法
US6594631B1 (en) Method for forming phoneme data and voice synthesizing apparatus utilizing a linear predictive coding distortion
JPS61256400A (ja) 音声分析合成方式
JP3255190B2 (ja) 音声符号化装置並びにその分析器及び合成器
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH07101358B2 (ja) マルチパルス符号化方法および装置
JPS62102294A (ja) 音声符号化方式
JPS6162100A (ja) マルチパルス型符号化復号化装置
Sasou et al. Glottal excitation modeling using HMM with application to robust analysis of speech signal.
JP2539351B2 (ja) 音声合成方法
JP2000298500A (ja) 音声符号化方法
JPS6113300A (ja) 音声分析合成方式
Zhou et al. Linear Prediction and Long Term Predictor Analysis and Synthesis
JPH0122638B2 (ja)
EP0119033B1 (en) Speech encoder
JPH0511799A (ja) 音声符号化方式
JPS621000A (ja) 音声処理装置
Rahman et al. Speech analysis based on modeling the effective voice source