JPS6113300A - 音声分析合成方式 - Google Patents

音声分析合成方式

Info

Publication number
JPS6113300A
JPS6113300A JP59133144A JP13314484A JPS6113300A JP S6113300 A JPS6113300 A JP S6113300A JP 59133144 A JP59133144 A JP 59133144A JP 13314484 A JP13314484 A JP 13314484A JP S6113300 A JPS6113300 A JP S6113300A
Authority
JP
Japan
Prior art keywords
sound source
speech
pulses
waveform
analysis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59133144A
Other languages
English (en)
Inventor
武田 昌一
市川 熹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59133144A priority Critical patent/JPS6113300A/ja
Publication of JPS6113300A publication Critical patent/JPS6113300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は音声分析合成方式の改良に関する。
〔発明の背景〕
音声を/ア/とか/イ/のような情報を主に担うスペク
トル0エンベロープ情報と、アクセントやイントネーシ
ョンのような抑揚を担う音源情報に分離して処理あるい
は伝送する方式は生成原方式と呼ばれている、。PAR
COR方式、I、SP方式 −などがその例である。こ
れら生成原方式は、狭帯域伝送が可能であり、そのため
ボイスメール、玩具、教育機器などへの応用に適してい
る。筐だ、生成原方式の上記の情報分離性は、規則合成
には不可欠な性質である。従来の生成原方式においては
、第1図(a)に示すように、音源情報として疑似的に
発生させた白色雑音1あるいはインパルス列2、を切換
えて用いていた(例えば、特開昭51−137307 
 >。このとき合成器に印加する音源精報は、■有声/
無声i報3、■音源振幅4、お”よび■17チ周期(あ
る叱12チ周竺数)5であ・つた。すなわち、上記■の
情報を用いて、有声の場合インパルス列を発生させ、無
声の場合白色雑音を発生させる。これらの信号の振幅は
上記■により与えられる。またインパルス列の発生間隔
は上記■により与えられる。
このような疑似音源を用いることによシ次のような音質
劣化が起こり、従来の生成原方式による分析合成音声が
一定の品質の限界を乗り越えることは不、可能であった
(1)分析時に、起こる有声/無声の誤判定に±る音質
劣化。
(2) ピッチ抽出誤りによる音質劣化。
(3)女声の/イ/や/つ/などに発生するホルマント
成分とピッチ成分も分離の不完全性に基く音質劣−化。
′ (J  PARCOR方式などARモデルの限界により
、スペクトルの苓の情、報を担えないために生ずる音質
劣化。
(5)音声の自然性に重要な非定常成分、ゆらぎの情報
が棄てられるために生ずる音質劣化。、これらの音質劣
化の要因を除去する手段の一つとして、1ピッチ周期内
あるいは無声の場合はその周期に相当する時間内に複数
本のパルスを疑似的に発生させたものを、従来の「単一
インパルス/白色雑音」の代りに音源として用いる「マ
ルチパルδ駆動法」が公知の手段として挙げられる(第
1図Φ))、。
マ化チパルス駆動法によれば確かに合成音声の品質は向
上するが、その代償として、音源情報量(パルス位!お
よび符号付振幅値)が増大する。
〔発明の目的〕
−本発明の目的は、音韻の種類等音声の性質の違いに対
応して音源情報の効果的な圧縮方法を提供することにあ
る。
〔発明の概要〕
上記の目的を達成するため本発明では原音声波形と、こ
の波形を分析合成して得られる合成音声、波形との誤差
が一最小になる、時点及θ振1幅値を設定することによ
り発生させた音源パルδ数を前記誤差値に依存した値と
して設定、することを特徴とする。
〔発明の実施例〕
まず本発明の原理にS!いて説明する。
合成音声の品質は、音源パルスの付加本数、(以下、略
1て「パルス付加本数」あるいは単に「付加本数」と呼
ぶことにする)の増加とともに向上していく。そとで、
目的に応じて要求される品質あるいは情報伝送量゛を満
足するように付加本数を決定する必要がある。付加本数
は、合成音声′の長゛ 時間平均の品質が所望の水準を
漬たすような一定値、゛あるいは所望の情報伝送量とな
る一定一として定めることも可能である。しかしながら
、一般に同一の品質を得るためめ′付加本数は、音韻の
種類等音声波形の性質により異なるため、付加本数を一
定値に定める左合成音−の品質に゛ムラ示生ずる。そめ
ため、た表えばもし最も品質が悪い場合′でも少くとも
ある水準の品質を保つように付加本数を決定しようとす
れば、合成音声に不必要に高品質な部分が生じ、iの部
分では過剰な情報を伝送することによるムダが生ず乏。
このように品質のムラ、あるいは情報のムダを減らし、
゛効−的に#l報を伝送する丸めに、以下に説明する゛
ような音声波−の性質は適応して、最適な音源パルス付
加”本数を決定゛する方゛式を導入テる。
第2図ば、′左から右に二定音声区間(短区間)の音源
パルスを発生した順に並べたもor:振幅の絶対値(以
下、特にことわらない限り振幅の絶対値を単に「振幅値
」と呼ぶことにする)を棒の高さで表現したものである
。第2図のうち(a)図は音韻/a/の例であシ、Φ)
図は/i/の例である。
図中の矢印は、それで示した音源パルス以降に発生する
音源パルスには、付加することによる品質の向上がほと
んど認められないという、限界を示している。図かられ
かるように、/a/の場合は多数の音源パルスが合成音
声の品質上重要な情報を担っているが、/i/の場合は
重要な情報を担っている音源パルスはわずかである。こ
のことを換言すれば、/a/には振幅値の大きい音源パ
ルスが多く含まれておC1/i/にはそれがわずかしか
含まれていない、ということである。このように、一般
に音源パルスの振幅値の分布は、音韻によって異なる。
さらに、音声の品質上重要な情報を担っている音源パル
スは、振幅の大きい音源パルスであることもわかる。し
たがって、大きい振幅値の音源パルスが多く含まれてい
る/a/では多くの音源パルスを必要とし、大きい振幅
値の音源パルスがわずかしか含まれていない/i/では
わずかな数の音源パルスだけを伝送すればよいと言える
。以上より、パルス付加本数はその音源パルスの振幅の
大きさに依存する量として設定すればよい。
上に述べたことは、一定の短区間における音源振幅値の
分布に着目して付加本数が決定できるということであっ
たが、他の方法としては、長時間の音声データの音源の
振幅値の分布に一目して定めたしきい値以上の振−値の
音源パルスのみを付加するという方法も存在する。
第3図は以上の方式をまと9て概念的に示したものであ
る。
パルス付加本数を決定する他の方式とし梁、第4図に示
すように、原波形と合成波形の誤差値に基いて決定する
という方式返ある。横軸に付加本数、縦軸に波形誤差あ
るいはスペクトルひずみ尺度のような誤差値をとって誤
差減少曲線を描くと、第2図と類似の傾向が見られる。
すなわち、/i/の場合は少い付加本数で比較的誤差減
少の立ち下りが早く、/a/の場合は逆に、付加本数が
多くなってもなかなか誤差値が小さくならない。このこ
とは、/a/の方がより多くの音源パルスを必要として
いることを意味している。したがって、例えば誤差値が
予め定めた一定値以下で最大となるようにパルス付加本
数を決定すれば、所期の目的が達成できる。
そのほかの変形方式としては、例えば原波形の振幅情報
、あるいは合成波形の振幅情報に基いて、パルス付加本
数を決定する方式(第5図および第6図)がある。いず
れにせよ、基本的に何らかの音声情報を用いて適応的に
付加本数を自動決定するという共通の方式であり、上に
述ぺ”た方式に′準じて実施することが出来る。
以上の原理、に基く方式は、高品質音声合成のための音
源を得る分析方式として用い不ことができることはもと
よ“す、この音源を用いた高品質音声合成方式どして単
独に用いるととも可能である。
さらに上記分析方式と合成方式を一体とした分析合成方
式として用いることができることは言うまでもない。
次に、パルス付加本数Mを音声情報から適応的に決定す
る実施例を説明する。
第3図〜第6図における誤差計算の方法にはさまざまな
方式が考えられる。例えば原音声と合成音声の波形の2
乗誤差や両讐声のスペクトルひずみ、あるいはこれらの
誤差にNoise−Weight ingFi l t
er” のような聴覚的な重み付けを適用したものを誤
差評価尺度として用いることができる。
ここでは、誤差評価尺度の一例とじて、(1)式で示す
2乗誤、差を採用した場各について実施例を示す。
2乗誤差をεとすれば ここで記号パ憂”はたたみ込み番示す。またNは誤差を
計算する区間のサンプル数゛、x(n)’、 x’(n
)はそれぞれ原音声信号と合成信号、w (n)は重み
付はフィルタ のインパルス応答を示す。さらにamは線形予測(LP
C)フィルタのフィルタ係数、pはフィルタ次数、rは
重み付けの度合いを示す係数で、0〈r〈1に選ばれる
(1)式で誤差を定義した場合、引用文献2)あるいは
3)に示された公知例によれば、誤差の最小値およびそ
れを与える音源パルスの位置および振幅は次の手順によ
り求められる。なお以下の手順はlフレーム内の処理で
あり、長い音声データについてはこの処理をフレームご
とに繰返し実行していけばよい。
1番目のパルスについて、フレームの端からの位置をm
l、符号付振幅をglで表わせば、合成フィルタの駆動
音源信号部、は、時刻nにりいて(3)式のように表わ
せる。
ここでδ、1..はクロネツカーのデルタであり、δ、
、、 =、1 (n =mI) 、δm、 m 1 =
 0 (n 4 fnl )でおる。Mは音源パルスの
個数である。いま、合成フィルタの伝達特性をインパル
ス応答上(rl) (0≦n≦N−1)で表わせば、合
成音声信号x (n)は、となる。(3)式を(4)式
に代入して整理すれば、合成音声信号の式として次式を
得る。
あるいは重み付けのされた合成音声信号として次式を得
る。
さらK (4) ’式を(1)式に代入すれば、誤差の
式として次式を得る。
以上(4)’ 、 (4)“、α)′の式は、最初に該
フレームの合成フィルタのインパルス応答を求めておき
さえすれば、合成音声信号値や誤差値を実際に波形を合
成せずに得ることができることを意味している。
(1)7式を最小化するパルスの振幅1位置は、(1)
7式をgIについて偏微分して0とおくことにより得ら
れる次式が最大となる点で与えられる。
ここで、Rhb  はり、(n) (gh(n)*w(
ロ))の自己相関関数、ψ、8はり、(n)とXv (
n) < e x i)+ W(n))との相互相関関
数を示す。(0式の最大値および最大値を与える位置は
、公知の最大値探索法によシ求めることができる。
以上の原理に基いて構成される音声分析合成方式(音声
符号化法)の公知例は第7図(a)のとおりである。
本発明は、例えば第7図(a)の音声分析合成方式にお
けるパルス付加本数Mを与える方式に関するもので、そ
れを実現するためのいくつかの実施例を以下に示す。な
お、以下に示す実施例は、例えば文献3)に示されてい
る第7−Cb)の音声分析合成方式など、さまざまな変
形方式に対1ても適用できる一般的な方式であることは
言うまでもないが、ここでは、第7図(a)の方式を例
として実施例を示す。他の方式についても同様の考え方
で適用すればよい。
(実施例1) 第8図に第1の実施例をブロック図により示す。
本実施例では、音源パルスの情報を基にパルス付加本数
Mを計算する。Mはパルス付加本数計算部6によシ計算
して音源パルス計算部に与える。音源パルスの計算は、
パルス本数がMに到達したら、M番目のパルス1其を最
後に打切る。第8図におりては、音源パルスの情報は量
子化/符号化Q2を実行する前の値を利用するように記
述しであるが、勿論、量子化/符号化Q2を実行した後
の値を利用してもよい。このことは、後に述べるすべて
の実施例たついても同様である。
以下にパルス付加本数計算部6を実現するいくつかの実
施例を−示す。
第9図は、第2図と同様音源パルスを左から右へ、発生
した順に並べたものを振幅値の包絡線により示したもの
である。第9図(a)のg、、、は、該に 短区間の音源パルスの振幅の最大値であり、elhパル
ス付加よりこの値未満の振幅値の音源パルスが初めて発
生する直前の最大本数Mで付加操作を打切るという、振
幅のしきい値である。雫tbの値の定め方の1例を示す
と、次式のようになる。
デtk=rl翠□8      ・・・・・・・・・(
6)ここに、rlは0(rt(1なる定数である。
Vtkを決定する他の例を示すと、次式のようになる。
代表値am−’H(1== l 、 2.・・・)の長
時間平均値、すなわち、 (iはフレーム番号、Ntは長時間の総フレーム数)で
あり、例えば学−は次のようにして定めればよい。
jr= (撃maX)l        ・・・・・・
・・・(8)あるいは *j=(Σ #k)1      ・・・・・・・・・
(9)k暉1 ここにapkは、発生−した順に並べられた音源パルス
のうち、k番目の音源パルスの振幅値(絶対値−絶対値
記号は省略して示しである)、mは適当に定めた定数で
ある。またサフィックスiは第17レームのデータであ
ることを示す。
なお、(η式は、’2の選び方や音声信号のレベルによ
っては、マthの値が都1.8の値を超えることがある
。この場合は音源パルスの発生が生じないことになり、
もし、音声が無音でない場合合成器を駆動する音源がな
くなり不都合である。した・“かって(7)式を用いる
ときには、最小パルス付加数Maim  を予め定めて
おき、(7)式の計算の結果、もしM<M−u−なるM
を与える4hthが求まったときには(7)式によらず
M=M、+−に定めることとする。
(7)式は、長時間の音声波形の中で、音声の品質の影
響は、振幅の大きい部分でより多く受けるので、音源伝
送量は、音声の振幅の大きさに対応して増加させるとい
う考えに基くものである。なお、#、には必ずしも槃に
比例して定める必要はなく、(4k ’l#tb = r * f (W )      −
”・(7)’しく としてもよい。ここにf(ψ)は輩の一価の非線形tL
    械 増加関係である。
(6)式で示したWthの求め方は簡単であるが、収 !1□の値のばらつきに左右され易いという難点がある
。そこでより安定にMの値を求める方法を次に説明する
。いま、発生JIK並べた音源パルスL、LA    
 LA の振幅値(絶対値)を零1 t ’2 r・・・、?M
、・・・で表わすものとする。基本的な考え方は、第9
図(ロ)においてSlを一定になるようにMの値を定め
るということである。ここに、 である。これは、音声の品質上重要な情報量は、振幅の
大きい音源パルスの振幅値の総和に比例するという考え
方に基くものである。この演算が安定である理由は、S
iの計算が総和を求める演算であり、ばらつきを平滑化
する機能があるからである。
上記諸実施例は、音声の品質を表わす物理量と直接に対
応が付きにくいという欠点がある。そこで、音声の品質
を表わす残差によりMの値を決定する方式の一例として
、波形誤差に基いてMの値を決定する実施例を示す。
第10図に第2の実施例をブロック図により示す。本実
施例は、パルス付加本数を原波形と合成音声波形の誤差
に依存して決定するという方法でおる。まず誤差eは、
原音声信号2合成フィルタのインパルス応答、音源パル
スの振幅、さらに必要に応じて重み付はフィルタのイン
パルス応答などより、誤差計算部7により計算される。
次にこの誤差を基にパルス付加本数計算部6によりパル
ス付加本数Mが計算され、Mは音源パルス計算部に与え
られる。これによりM本の音源パルスが計算される。こ
こで誤差計算部7では、例えばα)7式の演算が実行さ
れる。ただし、(1)、、’において’+w(n)”の
たたみ込み演算は省略してもよい。
この誤差εを利用した場合、パルス付加本数計算部6で
は次の演算が行われる。すなわちパルス付加本数Mは、 ε≦しi      ・・°・・・・・・・αυなる最
大付加本数として決定すればよい。ここで、ashはし
きい値である。勿論誤差は、上述の波形誤差に限定され
ず、スペクトルひずみ尺度など他の誤差で評価してもよ
い。
以上説明した実施例以外に、音源振幅情報あるいは誤差
情報の代りに、原音声波形1金成音声波形などの情報を
基に付加本数Mを決定する、さまざまな変形方式が存在
する。例えば第11図は原音声波形を基に付加本数Mを
決定する例であり、第12図は合成音声波形を基にMを
決定する例である。これらの処理は、上述の一連の実施
例に準じた方法にrり実行することができる。なお、第
12図において、合成音声計算部8の処理は(4)7式
あるいは(4)“式を計算することにより実行可能であ
る。
上記の付加本数Mを求める一連の計算は、四則演算器、
メモリ、テーブル参照、−比較器などにより容易に実行
することができる。例えば、(7)7式のfQは、f 
(W)・を関数チースルとして用意しておき、テーブル
参照により求めればよい。
以上の実施例で説明した音源パルス付加本数Mを自動的
に決定する一連の手法は、上記の実施例のみに限定され
ない。すなわち、上記音源パルス付加本数自動決定手法
は、どのような実施例であろうと、基本的に、音声の品
質上重要な音源パルスを付加する本数を決定する手法と
して、一般的に利用できる手法である。
〔発明の効果〕
以上説明したごとく、本発明によれば、音声の品質上重
要な情報のみを有効に抽出した音源パルスを、合成器の
音源として用いることができるので、合成音声を高品質
に保ちながら、有効に音源情報の圧縮を行うことができ
る。これにより、パラメータの情報伝送量の低減化を図
ることができる。
”引用文献 1)  B 、 S−Atal ’and J 、毘’
l(、emde : A NewModel Of L
PCExcitation for producin
gNatural −8ounding f3peec
h at LOW BitRates、 Proc、 
ICASSP82. ppei4−6172)小澤、荒
関:小野:マルチパルス駆動形音声符号化の検討、儒学
技報C382−16’l。
ppH5−122(1983−a5 3)小澤、小野、荒関:マルチパルス駆動形音声符号化
法の品質改善、日本音響学会音声研究会資料883−7
8 (1984−1)
【図面の簡単な説明】
第1図(a)従来の分析合成方式を示す図、(b)公知
の改良方式(マルチパルス駆動法を用いた分析合成方式
)を示す図、第2図〜第6図は本発明の詳細な説明する
歯、第7図〜第12図は実施例を説明する図である。 6・・・パルス付加本数計算部、7・・・誤差計算部、
8    ′第 1  図 (り 第 2 図 (α) ↑ ’  (/;−) m3[21、 η4 図 ′!7fJ5 図 貞60 第 1 図 (α) (り Q−’:V司1J\=ル硼イζシ 1!J8 口 第10図

Claims (1)

  1. 【特許請求の範囲】 1、音声波形をスペクトル情報と音源情報に分離する音
    声分析部とスペクトル情報と音源情報から音声波形を合
    成する音声合成部とを有し、音源情報を原音声波形とこ
    の原音声波形を基に分析、合成して得られる合成音声波
    形との誤差が最小になるような時点及び振幅値を設定す
    ることにより発生させた複数個のパルス列(音源パルス
    )を求める音声分析方式(マルチパルス駆動法による音
    声分析方式)において、前記発生させる該音源パルスの
    数を、前記誤差値に依存した値として設定することを特
    徴とする音声分析方式。 2、前記特許請求の範囲第1項記載の音声分析方式にお
    いて、発生させる該音源パルスの数を、音源パルスの振
    幅値に依存して定まる評価量を計算することにより設定
    することを特徴とする音声分析方式。 3、前記特許請求の範囲第1項記載の音声分析方式にお
    いて、発生させる該音源パルスの数を、原音声波形の振
    幅値に依存して定まる評価量を計算することにより設定
    することを特徴とする音声分析方式。 4、前記特許請求の範囲第1項記載の音声分析方式にお
    いて、発生させる該音源パルスの数を、合成音声波形の
    振幅値に依存して定まる評価量を計算することにより設
    定することを特徴とする音声分析方式。 5、前記特許請求の範囲第1項、第2項、第3項または
    第4項記載の音声分析方式により得られた上記音源パル
    スを音源として用いることを特徴とする音声合成方式。
JP59133144A 1984-06-29 1984-06-29 音声分析合成方式 Pending JPS6113300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59133144A JPS6113300A (ja) 1984-06-29 1984-06-29 音声分析合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59133144A JPS6113300A (ja) 1984-06-29 1984-06-29 音声分析合成方式

Publications (1)

Publication Number Publication Date
JPS6113300A true JPS6113300A (ja) 1986-01-21

Family

ID=15097761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59133144A Pending JPS6113300A (ja) 1984-06-29 1984-06-29 音声分析合成方式

Country Status (1)

Country Link
JP (1) JPS6113300A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63282795A (ja) * 1987-05-14 1988-11-18 日本電気株式会社 マルチパルス符号化装置
US5692678A (en) * 1995-05-01 1997-12-02 Kawasaki Steel Corporation Flame spraying burner
JP2008149220A (ja) * 2006-12-14 2008-07-03 Terumo Corp 噴霧ガン、噴霧システム及び噴霧方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63282795A (ja) * 1987-05-14 1988-11-18 日本電気株式会社 マルチパルス符号化装置
US5692678A (en) * 1995-05-01 1997-12-02 Kawasaki Steel Corporation Flame spraying burner
JP2008149220A (ja) * 2006-12-14 2008-07-03 Terumo Corp 噴霧ガン、噴霧システム及び噴霧方法

Similar Documents

Publication Publication Date Title
US7257535B2 (en) Parametric speech codec for representing synthetic speech in the presence of background noise
US5060269A (en) Hybrid switched multi-pulse/stochastic speech coding technique
KR100615480B1 (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
JPS61134000A (ja) 音声分析合成方式
US6003000A (en) Method and system for speech processing with greatly reduced harmonic and intermodulation distortion
JPS6113300A (ja) 音声分析合成方式
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JPH07101358B2 (ja) マルチパルス符号化方法および装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPS6238500A (ja) 高能率音声符号化方式とその装置
JP3510168B2 (ja) 音声符号化方法及び音声復号化方法
JP3481027B2 (ja) 音声符号化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JPS6162100A (ja) マルチパルス型符号化復号化装置
JP3074703B2 (ja) マルチパルス符号化装置
JPS62102294A (ja) 音声符号化方式
JP3475958B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JPS60150100A (ja) 音声合成方法
JPH043878B2 (ja)
JP2639118B2 (ja) マルチパルス型音声符号復号化装置
JPS61256400A (ja) 音声分析合成方式
JPH0339320B2 (ja)
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
McCree et al. A Mixed Excitation LPC Vocoder with Frequency-Dependent Voicing Strength
JPS6087400A (ja) マルチパルス型音声符号復号化装置