JPH0242240B2 - - Google Patents

Info

Publication number
JPH0242240B2
JPH0242240B2 JP58149007A JP14900783A JPH0242240B2 JP H0242240 B2 JPH0242240 B2 JP H0242240B2 JP 58149007 A JP58149007 A JP 58149007A JP 14900783 A JP14900783 A JP 14900783A JP H0242240 B2 JPH0242240 B2 JP H0242240B2
Authority
JP
Japan
Prior art keywords
pulse
amplitude
cross
audio signal
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58149007A
Other languages
English (en)
Other versions
JPS6041100A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP58149007A priority Critical patent/JPS6041100A/ja
Priority to CA000457390A priority patent/CA1219079A/en
Priority to US06/625,055 priority patent/US4720865A/en
Publication of JPS6041100A publication Critical patent/JPS6041100A/ja
Publication of JPH0242240B2 publication Critical patent/JPH0242240B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】
本発明はマルチパルス型ボコーダに関する。入
力音声信号を分析して、この入力音声信号の音声
情報を構成するスペクトル包絡情報と音源情報と
を分析側で抽出し、これら音声情報を伝送路を介
して合成側に送出して入力音声信号を再生するボ
コーダはよく知られている。 上述したスペクトル包絡情報は、入力音声信号
を発生する声道系のスペクトル分布情報を表わす
もので、通常LPC分析によつて得れた分析次数
に対応する個数のLPC係数、たとえばαパラメ
ータ、Kパラメータ等によつて表現され、また音
源情報はスペクトル包絡の微細構造を示すもので
入力音声信号からスペクトル分布情報を除いた、
いわゆる残差信号として知られるもので、入力音
声信号の音源の強さ、ピツチ周期および有声・無
声に関する情報が含まれ、通常これらの情報は入
力音声信号の分析フレームごとの自己相関係数を
介して抽出されることもよく知られている。 さて、スペクトル包絡情報はボコーダの合成側
で入力音声信号を合成する場合、通常全極型のデ
ジタルフイルタを利用して近似的声道系を形成せ
しめるLPC合成器の係数として利用され、音源
情報はこのデジタルフイルタの駆動音源として利
用され、このデジタルフイルタによつて入力音声
信号が合成される。 このようにして得れる従来のLPCボコーダは、
約4Kb(キロビツト)以下の低ビツトレートでも
音声の合成が可能であり多用されているものの、
高品質の音声合成は高ビツトレートにおいても困
難であるという欠点を有する。この原因は音源情
報のモデル化の場合、有声音に対してはその内容
に対応するピツチ周期を抽出してこのピツチ周期
に対応する単一のインパルス列で近似的に表現
し、ランダム周期の無声音に対しては白色雑音で
近似的に表現するという単純なモデル化処理を前
提としているため、入力音声信号の音源情報を忠
実に抽出したものとならず、従つて音源情報に含
まれる入力音声信号の波形情報の分析・合成が実
施されていないことによる。 マルチパルス型ボコーダは、このような波形非
伝送による問題の改善を図るため波形伝送を行な
つて入力音声信号の合成を実施するボコーダのひ
とつとして近時よく知られつつあるものである。 第1図は従来のマルチパルス型ボコーダの分析
側基本的構成を示すブロツク図である。 LPC合成器1は声道をシミユレートする全極
型デジタルフイルタを備え、その係数は入力端子
2001を介して入力される入力音声信号x(n)
(n=1,2,3……N)をLPC分析器2により
分析フレームごとに分析したLPC係数が供給さ
れる。音源パルス発生器3は、入力音声信号の音
源情報から複数個のインパルス系列、すなわちマ
ルチパルスからなる駆動音源系列V(n)を得て、
これをLPC合成器1の駆動音源として供給する。 LPC合成器1はこうして入力するLPC係数を、
通常は全極型デジタルフイルタを利用する合成フ
イルタの係数とし、マルチパルスを駆動音源とし
て駆動された合成信号x〓(n)を出力する。この
場合、マルチパルスは入力音声信号の波形情報を
含むものである。LPC合成器1は波形情報を含
む入力音声信号の合成を行なうこととなる。 さて、LPC合成器1から出力する合成信号x〓
(n)は次に減算器4で入力音声信号x(n)との
差をとり、誤差e(n)を得てこれを聴感重み付
け器5に送出する。 聴感重み付け器5は、誤差e(n)に対し次の
(1)式に示す特性w(z)を有する重み付けフイル
タによつて聴感的な重み付けを付与したうえ、こ
れらを2乗誤差最小化器6に送出するものであ
る。 w(z)=〔1−pk=1 αkz-k〕/〔1−pk=1 αkγkz-k〕 ……………(1) (1)式においてαkはLPC合成器1の全極型デジ
タルフイルタの係数とすべきLPC係数、pはそ
の次数であり従つてLPC分析次数、γは重み付
け係数、zは全極型デジタルフイルタのz変換表
示による伝達関数H(z-1)におけけるz=exp
(jλ)を示し、ここにλ=2πΔTfでありΔTは分
析フレームの標本化サンプリング周期、fは周波
数を示す。 また(1)式において重み付け係数γは、0<γ<
1の範囲で設定される。 (1)式に示すw(z)はγ=1に対しては1,γ
=0に対してはw(z)=1−p(z)の範囲で変
化し、γの値は誤差e(n)の周波数スペクトル
におけるフオルマント領域に現われる過大なレベ
ルを抑圧する程度に対応して前述した範囲の中で
設定され、合成すべき信号の聴感重み付けの役割
を果たすものであり、通常予め最適聴感テストに
よつてその最適値が選定される。 このようにして重み付けされた誤差e(n)は、
音源パルス発生器3から出力される駆動音源系列
V(n)、すなわちマルチパルスの最適時間位置と
振幅とを決定するために2乗誤差最小化器6に送
出され、次の(2)式による2乗誤差εを計算し、ε
を最小にするように駆動音源系列V(n)が選択
される。 ε=Nn=1 〔e(n)〓w(n)〕2 ……………(2) (2)式において記号〓は聴感重み付け器5の重み
付けフイルタよるたたみ込み積分、Nはマルチパ
ルスを計算する区間長を示す。 上述した処理はマルチパルスのパルスごとに繰
返され、分析による合成がマルチパルスごとに行
なわれる、いわゆるAnalysis−by−Synthesis手
法(以下A−b−S手法と略称する)であつて、
このA−b−S手法は上述した内容からも明らか
な如く、マルチパルス1つずつについてパルス発
生、2乗誤差計算およびパルス位置・振幅調整の
ループで行なわれるため、低ビツトレート領域に
おける有効な手段であるにもかかわらずその演算
量が極めて膨大なものとなるという欠点がある。 なお、このA−b−S手法については、B.S.
Atal et al、“A New Model of LPC
Excitation for Producing Natural−Sounding
Speech at Low Bit Rates”,Proc.ICASSP82,
pp614−617,(1982)等に詳述されている。 このような従来のA−b−S手法における欠点
に対して、相関演算にもとづき最適なマルチパル
スを効率的に計算する次のような演算処理アルゴ
リズムが最近紹介されている。 すなわち、入力音声信号x(n)はNサンプル
ごと処理フレームによつて区分され、このフレー
ムごとにマルチパルスが包括的に計算されるもの
である。 いま、1分析フレーム内に音源パルスがk個存
在するものとし、i番目のパルスがフレーム端か
ら時間位置miにあり、かつその振幅がgiであると
すると、LPC合成フイルタの駆動音源d(n)は
次の(3)式で示される。 d(n)=Ii=1 gi・δn・mi(n=1,2,…,N) ……………(3) (3)式においてδn,miはクロネツカーのデルタ
関数であり、δn,mi=1(n=mi),δn,mi=0
(n≒mi)である。又、Iはマルチパルスの総パ
ルス数を示す。 LPC合成フイルタはこの駆動音源d(n)によ
つて駆動され合成信号x〓(n)を出力する。 LPC合成フイルタとして、たとえば全極型デ
ジタルフイルタを考えるものとし、その伝達関数
をインパルス応答h(n)(0≦n≦M−1)で表
現するものとすると、合成信号x〓(n)は次の(4)
式で表わされる。 x〓(n)=M-1 〓 〓l=1 d(l)×h(n−l)(n=1,2,…,N)…
…………(4) (4)式においてd(l)は駆動音源を表わす。次
に入力音声信号x(n)と合成信号x〓(n)と合成
信号x〓との誤差に対し聴感的な補正を施した重み
付け誤差ew(n)とするとew(n)は次の(5)式で
示される。 ew(n)={x(n)−x〓(n)}〓w(n) (n=1,2,…,N) ……………(5) さらに2乗誤差は(5)式から誘導して次の(6)式で
示すことができる。 Nn=1 e2w(n)=N 〓 〓n=1 〔{x(n)−x〓(n)}〓w(n)〕2…………
…(6) (6)式においてNは誤差を最小化する区間のサン
プル数を示し、たとえば1分析フレーム長に選
ぶ。最適な音源パルス列としてのマルチパルスは
(6)式を最小化するgiを得ることによつて得られ、
このgiは上述した(3),(4)および(6)式から次の(7)式
の如く誘導される。 gi(mi)=Mn=1 xw(n)×hw(n−mii-1l=1 〔glNN=1 hw(n−ml)・hw(n−mi)〕 /Nn=1 hw(n−mi)・hw(n−mi) ……………(7) (7)式においてxw(n)はx(n)〓w(n),hw
(n)はh(n)〓w(n)を示す。(7)式の右辺の
分子の第1項はxw(n)とhw(n)との時間遅れ
miの相互相関関数φhx(mi)を示すものであり、
また、第2項のMM=1 (n−ml)・hw(n−mi)はhw
(n)の共分散関数φhh(ml+mi)(1≦ml,mi
N)を示す。共分散関数φhh(ml,mi)は自己相
関数Rhh(|ml,mi|)と等しくなり、従つて(7)
式は次の(8)式の如く表わすことができる。 ところで相関処理に基づくマルチパルス検索ア
ルゴリズムの基本的な考え方は被分析音声波形を
“LPC合成フイルタのインパルス応答波形”の線
形加算で能率よく表現しようとするものである。
線形加算されるインパルス応答波形の数はマルチ
パルス数に対応し、各インパルス応答波形の始点
がマルチパルスの位置に、線形加算の重み係数が
マルチパルスの振幅に対応する。 相関処理に基づくマルチパルス検索アルゴリズ
ムは被分析波形からしかるべき(最適な)位置、
振幅の励振パルスを設定しようとするものであ
る。 しかしながら被分析波形からしかるべき位置、
振幅のパルスを決定する手法は現存しない。この
アルゴリズムは以下に示すSTEPにより準最適に
パルスの振幅と位置とを決定しようとするもので
ある。 (STEP−1) 被分析波形を高々1ケのインパルス応答波形で
表現することを考える。 この場合、最適なパルスの振幅は被分析波形と
単位インパルス応答との相互相関係数の最大値
(絶対値)により単純に決定され、パルスの位置
は前記最大値の位置と一致していることは自明で
ある。従つて、 被分析波形と(単位)インパルス応答との相
互相関係数φhx(mi)mi=1,…を算出する。 φhx(mi)の最大値検索する。 最大値をg1とする。 φhx(mi)=gとなるmiをml(l=1)とする。 (STEP−2) 被分析波形からml(l−1)にg1の振幅のパルス
を設定したときのインパルス応答波形を除去した
波形(残留波形と仮に呼ぷ)を考える。残留波形
を高々1ケのインパルス応答波形で表現する。こ
の場合も最適なパルスの振幅、位置は残留波形と
単位インパルス応答との相互相関係数の最大値に
より単純に決定される。 ところで残留波形と単位インパルス応答との相
互相関は以下により残留波形と単位インパルス応
答との相互相関=(被分析波形−ml(l=1)にg1
の振幅のパルスを設定したときのインパルス応
答)と単位インパルス応答との相互相関 =被分析波形と単位インパルス応答との相互相
関ml(l=1)にg1の振幅のパルスを設定したとき
のインパルス応答と単位インパルス応答との相互
相関 =前記φhx(mi)−ml(l=1)を中心とした
(インパルス応答の自己相関係数)に重みg1を掛
けたもの 従つて φhx(mi)−g1Rhh(|ml−mi|)を求める。 上記の最大値を検索する 最大値g2とする 対応するmiをml=(l=2)とする (STEP−3〜STEP−N)(STEP−2)の処
理を必要に応じて繰返す。 このアルゴリズムは各ステツプで決定されるパ
ルスは最適であるがSTEP−1〜STEP−Nで決
定されるパルス全体としては各パルスのインパル
ス応答間に相関があるため最適でない。 上述のアルゴリズムの具体例を前記(8)式と第2
図とを用いて説明する。 説明の都合上Rhh(o)=“1”(正規化済)の場
合で述べる。 〔1〕 相互相関係数φhx(mi)(mi=1,2,…,
240)を算出する。算出結果は第2図Aである。 〔2〕 上記φhx(mi)の絶対値の最大を検索する。 mi=72 φhx=(72)=−5.3が検索される。 〔3〕 マルチパルスを構成することになる第1の
パルスが決定される。 当然 mi=72 gi=−5.3のパルスである。 〔4〕 以下の手順でφhx(mi)をRhhを用いて修正す
る。(Rhhは第3図の形状) φhx(72)=φhx(72)−(−5.3)Rhh(0) (=0) φhx(71)=φhx(71)−(−5.3)Rhh(1) φhx(73)=φhx(73)−(−5.3)Rhh(1) φhx(70)=φhx(70)−(−5.3)Rhh(2) φhx(74)=φhx(74)−(−5.3)Rhh(2) φhx(48)=φhx(48)−(−5.3)Rhh(24) φhx(96)=φhx(96)−(−5.3)Rhh(24) −5.3はg1 Rhh(−i)=Rhh(i) 〔5〕 修正したφhx(第2図Bに示す)の絶対値の
最大を検索する。 mi=109,φhx(109)=−5.0が検索される。 〔6〕 マルチパルスを構成することになる第2の
パルスが決定される。 当然mi=109 gi=−5.0のパルスである。 〔7〕 φhx(mi)をRhhを用いて修正する φhh(109)=φhh(109)−(−5.0)Rhh(0) (=0) φhh(108)=φhh(108)−(−5.0)Rhh(1) φhh(110)=φhh(110)−(−5.0)Rhh(1) 〔8〕 修正したφhx(第2図Cに示す)を用いて第
3のパルスを決定する。 〔9〕 以下、必要に応じてφhxを修正しながらパル
スを決定していく。 つまり、ある音源パルスに着目し、種種の時間
位置において(8)式によりその振幅を計算したう
え、その振幅の絶対値を最大とするものが(6)式に
示す2乗誤差を最小化するパルスとなり、このよ
うな手続を繰返して複数個の音源パルスを求める
ことができる。 なお、上述した計算アルゴリズムに関しては、
小沢、荒関、小野“マルチパルス駆動形音声符号
化法の検討”、1983年3月 電子通信学会 通信
方式研究会に詳述されている。 このような計算アルゴリズムに基づいて行なわ
れるマルチパルスの発生によれば、相互相関係数
と自己相関関数ならびに最大値演算から最適なマ
ルチパルスの計算が可能となるため、構成が非常
に簡素化されたものとなり演算量を大幅に低減し
うるマルチパルス型ボコーダを実現することがで
きる。 しかしながら、このようにして改善したマルチ
パルス型ボコーダにあつてもさらに次に述べるよ
うな欠点がある。 すなわち、小沢らのアルゴリズムよれば、マル
チパルスの時間位置と振幅とは以下の手順により
決定されていく。先ずφhx(mi)を求める。第2図
Aの波形はある男性話者が発声た音声のφhx(mi
の実測値である。次にRhhを求める。 第3図は同様にRhhの実測値である。マルチパ
ルスを構成する第1番目のパルスの位置は第2図
Aの波形の絶対値が最大になる位置(mi=72)
として決定され、パルスの振幅はmi=72におけ
るφ(mi)の値(φ(72)=−5.3)として決定され
る。次にφ(mi)から第1番目のパルスによる影
響分を除去する。この操作は第2図Aの波形か
ら、mi=72を中心にして第3図の波形を(−5.3)
倍して減じることを意味する。第2図Bの波形は
第2図Aの波形から第1番目のパルスによる影響
分を除去した結果を示している。第2図Bの波形
について第1番目のパルスの位置と振幅とを決定
した方法と同様の方法で第2番目のパルスの位置
と振幅とを決定する。次に第2図Bの波形から第
2番目のパルスによる影響分を除去する。(結果
を第2図Cに示す)、以上の操作を繰返第3、号
4,……第l……番目のパルスの位置と振幅とを
決定してゆく。小沢らのアルゴリズムは上述し様
に第2図の各波形において絶対値が最大となる
miを検索し、更にmiにおけるφ、又はパルスの
影響を除去したφの値φ(mi)を求め、更に前記
miおよびφ(mi)をパルスの位置、振幅と決定し
ている。しかしながら必づしもmi付近における
φ(mi)の形状がRhhの形状と類似であるとは限
らない。例えば第2図Fのmi=159付近の波形は
第3図の波形とはその形状が大きく異なる。その
結果第2図Gの波形はFに比べてmi=163付近の
φの値を増加させており第2図Iにおいてmi
163にパルスが生成される遠因になつている。 以上述べた様に小沢らのアルゴリズムφ(mi
又は、パルスの影響を除去したφ(mi)の絶対値
が最大になるmiおよび対応するφ(mi)とそれぞ
れパルスの時間的位置、振幅と決定するため、特
にφ(mi)とRhhとの形状が大きく異なる場合に
φ(mi)が必づしも最適に減少せず、パルス数の
不要な増加を伴い、符号化の効率が低下するとい
う欠点を有していた。 小沢らのアルゴリズムの欠点を云い換えれば、
もし入力音声波形を完全に再現する合成波形が決
定されたマルチパルスを音源として合成されたと
すれば、前記φ(mi)はmiがいたる所で“0”と
なる。同様にマルチパルスを音源として合成され
た合成波形が入力音声波形を精密に近似している
場合には前記φ(mi)は全体として“0”に近い
値をとり、比較的に精密さに欠ける近似をしてい
る場合には前記φ(mi)は全体として“0”に比
較的に遠い値をとる。反対に入力音声波形を近似
し得るマルチパルスを決定するには前記φ(mi
がmiがいたる所で“0”に近くなるようにマル
チパルスを決定すれば良い。しかしながら、小沢
らのアルゴリズムはφ(mi)をmiがいたる所で
“0”に近づける意味では必らずしも適切ではな
い。 本発明の目的は上述した欠点を除去し、マルチ
パルス型ボコーダにおいて、xw(n)(すなわち、
入力音声信号x(n)と聴感重み付け器5のイン
パルスレスポンスw(n)とのコンボリユーシヨ
ンx(n)〓w(n)とhw(n)(すなわちLPC合
成器1と聴感重み付け器との相互インパルスレス
ポンス)との相互相関係数φ(mi)と、前記hw
(n)自己相関係数Rhhとの類似度をmiの全サン
プルについて算出し、算出した類似度の最大値を
検索し、更に最大値に対応した振幅と位置のパル
スを決定することにより小沢らのアルゴリズムの
欠点を除去し、マルチパルスによる符号化の効率
を向上し得るマルチパルス型ボコーダを提供する
ことにある。 本発明のマルチパルス型ボコーダは、入力音声
信号を分析フレームごとにLPC分析して抽出し
たLPC係数をスペクトル包絡情報としてこのス
ペクトル包絡情報とともに前記入力音声信号の音
声情報を構成する音源情報を分析フレームごとに
この音源情報の特徴に対応する発生時間位置と振
幅とを有する複数個のインパルス系列(マルチパ
ルス)を以つて表現し前記入力音声信号の分析お
よび合成を行なうマルチパルス型ボコーダにおい
て、前記入力音声信号と音声合成フイルタのイン
パルス応答との相互相関係数列を算出する手段
と、前記インパルス応答の自己相関係数列を算出
する手段と、前記相互相関係数列と前記自己相関
係との類似度を算出する手段とを分析側に備え、
且つ更に前記類似度の最大値を検索し、更に前記
類似度の最大値に対応した振幅と位置にインパル
系列(マルチパルス)の振幅、位置をフオワード
的に決定する手段を分析側に備えて構成される。 次に図面を参照して本発明を詳細に説明する。
第4図は本発明によるマルチパルス型ボコーダの
分析側の一実施例を示すブロツク図、第5図は本
発明によるマルチパルス型ボコーダの合成側の一
実施例を示すブロツク図である。 第4図に示す本発明によるマルチパルス型ボコ
ーダの分析側は、LPC分析器7,相互相関関数
算出器8,符号化器(1)9,自己相関関数算出器1
0,類似度算出器11,符号化器(2)12およびマ
ルチプレクサ13を備えて構成されている。 入力端子7001を介して入力した入力音声信
号は、LPC分析器7および相互相関関数算出器
8に供給される。 LPC分析器7は入力音声信号を分析フレーム
ごとに、予め設定するビツト数のデジタル量とし
て量子化し、この量子化音声信号をLPC分析し
てLPC係数としてのp次のKパラメータ(偏自
己相関係数)を抽出、これを出力ライン701を
介して符号化器(1)9に供給する。本実施例におい
ては分析フレームは20mSECに設定している。な
お、算出手段は自己相関法である。自己相関法に
ついてはJ.D.Markel,A.H.Gray,Jr.“Linear
Rredicti of Speech”,SPriger−Verlcgの
Fig.3.1に述べられている。 符号化器(1)9は、入力したLPC係数の量子化
と符号化を行なつたのち、出力ライン901を介
してマルチプレクサ13に送出する。 LPC分析器7はまた、LPC係数からインパル
ス応答h(n)(1≦n≦N−1)を計算し、出力
ライン702,符号化器(1)9,出力ライン902
を介して相互相関関数算出器8および自己相関関
数算出器10に供給する。 なお、前記インパルス応答h(n)はαパラメ
ータを用いた全極型フイルタ にインパルス即ちn=0に於いて振幅“1”、n
=1,2,…に於いて振幅“0”を入力したとき
の出力として求められるものであり h(0)=1 h(1)=α1 h(2)=α2+α1・h(1) h(3)=α3+α2・h(1)+α1・h(2) h(4)=α4+α3・h(1)+α2・h(2)+α1・h(3) 無論、上記α1の代りに減衰係数γ(0≦γ≦1)
を用いたγiαiを用いてもよい。 なお、上記αパラメータは前記自己相関法によ
りKパラメータと同時に求まるものである。 相互相関関数算出器8は、入力音声信号とイン
パルス応答h(n)とを利用して相互相関関数数
φhxを計算し、これを出力ライン801を介して
類似度算出器11に送出する。 また、自己相関関数算出器10は、入力したイ
ンパルス応答h(n)の自己相関関数Rhhを計算
し、これを出力ライン1001を介して類似度算
出器11に送出する。 類似度算出器11はこうして入力した分析フレ
ームごとの相互相関関数φhxと自己相関関数Rhh
を利用して後述する類似度の計算を実行し所定の
数の音源パルス列を得て、これらのパルスの振幅
および位置情報を出力ライン1101を介して符
号化器(2)12に送出し、これによつて量子化およ
び符号化を行なつたのち出力ライン1201を介
してマルチプレクサ13に送出する。 このようにして、量子化よび符号化されてマル
チプレクサ13に送出されるLPC係数およびマ
ルチパルスデータは、入力音声信号のスペクトル
包絡および音源情報を表わすデータとしてマルチ
プレクサ13を介して所定の方式で時分割され、
伝送路1301を介して第2図に示す分析側から
第5図に示す合成側に伝送される。 第5図に示す合成側は、伝送路1301を介し
て分析側から伝送されたデータに基づいて入力音
声信号の合成を行なうものであり、デマルチプレ
クサ14,復号化器(1)15、復号化器(2)16,
LPC合成器17およびLPF(Low Pass Filtcr)
18等を備えて構成される。 デマルチプレクサ14は、伝送路1301を介
して入力した各種データをマルチプレクサ13の
時分割伝送形式よる変換前の状態に復元し、
LPC係数データは出力ライン141を介して復
号化器(1)15に、マルチパルスデータは出力ライ
ン142を介して復号化器(2)16にそれぞれ供給
され、これらの復号化器によつてデータの復号化
を行なつたうえ、それぞれ出力ライン151,1
61に送出する。 LPC合成器17は、このようにして入力する
マルチパルスを音源情報としてp次の全極型デジ
タルフイルタの駆動音源に利用し、また出力ライ
ン151を介して入力するp次のLPC係数デー
タを上記全極型デジタルフイルタ係数としてこの
LPC合成フイルタを制御して入力音声信号を合
成し、これを出力ライン211を介してLPF1
8に送出し、所定の低域フイルタリングを行つて
アナログ量の合成音声として出力ライン181に
送出する。 次に類似度算出器11を図面を参照して詳細に
説明する。第6図は類似度算出器11の一実施例
を示すブロツク図である。 伝送路801を介して相互相関関数φhxが相互
相関係数メモリ19へ蓄積される。伝送路100
1を介して自己相関関数Rhhが自己相関正規化器
20へ供給される。自己相関正規化器20は前記
Rhhを波形と見なしたときの電力に対応する正規
化係数aを次の(9)式より算出する。 a=R2 hh(o)+2MRS=1 R2 hh(s) ………(9) ただしRhh(x)は遅れxのRhhの成分を示す。
又、NRは前述したインパルスレスポンスhw(n)
実用上の持続時間を示す。更に自己相関正規化器
20は前記aでRhh(x)の各要素を正規化し、
結果を正規化自己相関係数R′hhとして伝送路20
1を介して自己相関係数メモリ21へ出力する。
積和算出器22は伝送路191を介して供給され
る相互相関関数φhxの遅れmiを中心にして前後
NR分の要素と、伝送路211を介して供給され
る正規化自己相関係数R′hhとの積和bniを次の(10)
式により算出する。 bniNRS=NR φhx(mi+s)・R′hh(s) ……………(10) 積和算出器22は相互相関関数φhxの定義され
る区間(本実施例では240)、即ちmi=1〜mi
=240についてbniを次々に算出し結果を伝送路2
21を介して最大検索器3へ出力する。最大値検
索器23は前記bniの列のうち最大の絶対値を有
するものを検索し、遅れ時間(第1番目のパルス
の時間位置に対応する)τ1と振幅bとを決定し、
更に前記τ1,b〓1を伝送路231,232を介し
て相互相関補正器24およびマルチパルスメモリ
25へ出力する。 ところで、従来例(小沢らのアルゴリズム)に
関する説明で述べた様に、入力音声波形を精密に
近似し得るマルチパルスを決定するには前記φ
(mi)がmiがいたる所で“0”に近くなるように
マルチパルスを決定すれば良い。 本実施例ではまず入力音声波形を高々1ケのイ
ンパルス応答波形で表現したときにφ(mi)が全
体として最もよく減少する位置と振幅のパルスを
決定する。 φ(mi)Rhhを適切な重みで、適切な位置にお
いて差引かれたとき全体として最もよく減少す
る。 φ(mi)をRhhを用いて最適に除去するために
はφ(mi)とRhhとの積和Bnjを(mj=1,2,…
…)について求める。 mjNRS=-NR φhx(mj+s)×Rhh(s) mj=1,2,…… 次にBnjの最大値(絶対値)β=MAX(Bnj
を検索する。対応するml(l=1)=miが決定さ
れる。(パルス位置) 次にパルスの振幅を以下のようにして決定す
る。 即ち、ml(l=1)において振幅Vのパルスを
印加した場合φhxが最もよく減少すると仮定する。 φhxの位置ml(l=1)を中心にRhhの成分
(Rhhと直したい成分)がV倍されてφhhの中に存
在している。 前記成分とRhhとの積和は Bnl(l=1)=NRS=-NR V・Rhh(s)・Rhh(s)=V(Rhh(o)+2NRS=1 Rhh(s)=aV 但しaは(9)式で求めたaである。 結局VはBnl(l=1)を正規化係数aで割つた
値 Bnl(l=1)/aとなる。 さて Bmj/a=1/aNRS=-NR V・Rhh(s)・Rhh(s)=1/aNRS=-NR φhx(mj+s)・Rhh(s) =NRS=-NR φhx(mj+s)・Rhh(s)/a=NRS=-NR φhx(mj+s)・R′hh(s) の関係があり、求める振幅はφhxとR′hhとの積和
の最大値として決定される。 以上の理由により本実施例では相互相関補正器
24は相互相関係数メモリ19より伝送路191
を介して供給される。 φhxを遅れτ1を中心にして、自己相関係数メモ
リ21より伝送路211を介して供給されるR′hh
と前記振幅b〓1とを用いて次の(11)式により修正す
る。 φhx(τ1+t)=φhx(τ1+t) −b〓1・R′hh(t) ……………(11) ただしtは修正区間であり−S〜+Sに設定さ
れる。相互相関補正器24は更に上記(11)式の結果
を伝送路241を介して相互相関係数メモリ19
へ供給する。 以上の処理を必要とするマルチパルスの数に達
するまで繰返し実行し、結果を次々にマルチパル
スメモリ24へ記憶する。マルチパルスメモリ2
4は繰返し終了後マルチパルスの時間位置と振幅
とを伝送路1101へ出力する。 次に第6図の構成により求められたφhxおよび
修正されたφhxの実施例(音声サンプルは第2図
の例と同一である)を第7図に示す。第7図Aは
相互相関係数φhxとの入力音声波形の位置1から
240に対応する係数列と、前記係数列と正規化自
己相関係数列R′hhとの類似度が最大となる位置に
類似度と一致する振幅に設定されたパルス(位置
遅れ72,振幅−6.55×103)即ち、求めるべきマ
ルチパルスとして決定された第1番目のパルスの
時間位置と振幅とを示す。Bは第1番目のパルス
のインパルス応答波形を除去した波形、即ち残留
波形とインパルス応答波形との相互相関係数列を
示すものである。第6図Bに示す係数列は小沢ら
のアルゴリズムと同様に第6図Aに示す係数列を
Rhh(第3図に示す)を用いて修正することによ
り求められる。 φhx(72)=φhx(72)−(−6.55×103)Rhh(0) φhx(71)=φhx(71)−(−6.55×103)Rhh(1) φhx(73)=φhx(73)−(−6.55×103)Rhh(1) 又、第6図Aに示すパルスと同様の手法で第6
図Bに示すパルス(位置:遅れ110、振幅:・5.9
×10)が設定され、求めるべき第2番目のパルス
として決定された第2番目のパルスの時間位置と
振幅とを示している。同様にC〜Kは修正された
φhxと決定されたパルスの時間位置、振幅を示し
ている。 なお、第2図Aに示す第1番目のパルス位置72
と第6図Aに示す第1番目のパルス位置72が一致
しているのは偶然であり一般には必ずしも一致し
ない。因に、小沢らのアルゴリズム(第2図)と
本実施例(第6図)で求めたパルスの位置、振幅
を示すと、
【表】 本発明は小沢らのアルゴリズムと異なり相互相
関係数φhxと正規化自己相関係数R′hhとの類似度
の最大値を検索している。その結果第2図Fに示
す様なφhxとRhhとの形状が大きく異る時間位置に
パルスが決定されることがなく、従つてパルス数
の不要な増加を伴なわない。 次に本発明よる入力音声(端子7001の音声
信号)を基準にした出力音声(端子181の音声
信号)のS/N比をマルチパルスのパルス数を可
変して測定した一データ例を同様の方法により測
定した小沢らのアルゴリズムよるS/N比と比較
して第8図に示す。第8図において、Xは従来方
法によるSN比、・は本発明によるSN比を示す。
第8図から明らかな様に本発明は小沢らのアルゴ
リズムより符号化の効率が向上している。 以上、類似度の例として相互相関係数φhx又は
パルスの影響を考慮して修正されたφhxと正規化
自己相関係数Rhhとの積和を示したが類似度とし
ては必づしも前記積和に限定されるものではな
い。例えば下記の(12)式で示されるφhxとRhhとの遅
れmiにおけるマグニチユードを最大とするCni
算出し、更に各遅れにおけるマグニチユードが最
小となる。即ち、類似度が最大となるmiを検索
してもよい。 Cni=minNR 〓 〓S=-NR |φhx(mi+s)−Cni・Rhh(s)|……………(
12) マグニチユードを類似度として使用する場合に
は自己相関正規化器20は必づしも必要でない。
又、積和算出器22,最大値検索器23をそれぞ
れ最小マグニチユード推定器と最小値検索器とに
置換えることにより類似度算出が可能となること
は自明である。 上記の説明は本発明の重要な要素である類似度
及びこれの算出手段の理解を容易にするために、
聴感重み付けの機能を除外したものであるが、聴
感重み付け機能を除外しなくても本発明は容易に
実現勧能である。即ち、聴感重み付けを行なう場
合には、本発明は相互相関係数算出器8で直接、
入力音声信号とインパルス応答h(n)とを利用
し相互相関係数φhxを算出する代りに(1)式で示さ
れる伝達関数を有する重み付けフイルタを通過し
た音声信号と後述するインパルス応答h′(n)と
を利用して相互相関関係数φhxを算出する。又、
LPC分析器7は符号化器(1)9、出力ライン90
2を介して相互相開開数算出器8と自己相関関数
算出器10とに供給するインパルス応答h(n)
の代りに、(1)式内で示される重み付け係数γより
下記(13)式により算出される線形予測係数a′k
(k=1,2,…,p)から求められるインパル
ス応答h′(n)を相互相関関数算出器8と自己相
相関関数算出器10とに供給する。 a′k=ak・γk(k=1,2,…p)
……………(13) なお、第4図および第5図に示す本発明の実施
例においては、LPC係数としてKパラメータを
用いているがこれは他のLPC係数、たとえばα
パラメータ等を利用してもよく、また符号化器と
マルチプレクサ、および復号化器とデマルチプレ
クサはそれぞれこれらを一体化した構成のものと
しても同様に実施し得るとは明らかであり、また
LPC合成フイルタは全極型以外の非極型デジタ
ルフイルタ等を置換してもほぼ同様に実施しうる
こともまた明らかである。 以上説明した如く本発明によれば、マルチパル
スボヨーダにおいて、入力音声信号と音声合成フ
イルタのインパルス応答との相互相関係数を算出
する手段と、前記インンパルス応答の自己相関係
数列を算出する手段と、前記相互相関係数列と前
記自己相関係数列との類似度を算出する手段とを
分析側に備え、且つ更に前記類似度の最大値を検
索しインパルス系列(マルチパルス)の振幅、位
置をフオワード的に算出する手段を分析側に有す
ることにより、効率よく前記相互関係数列からマ
ルチパルスの影響を減じることを可能とし、マル
チパルス符号化の効率を向上させ得るという効果
がある。
【図面の簡単な説明】
第1図は従来のマルチパルス型ボコーダの基本
的構成を示すブロツク図、第2図A〜Kは従来方
法における相互相関係数φhxとマルチパルス決定
手順との関係を示す波形図、第3図はインパルス
応答の自己相関係数Rhhを示す波形図、第4図は
本発明によるマルチパルス型ボコーダの分析側の
一実施例を示すブロツク図、第5図は本発明によ
るマルチパルス型ボコーダの合成側の一実施例を
示すブロツク図、第6図は類似度算出器11を詳
細に説明するためのブロツク図、第7図A〜Kは
本発明による相互相関係数φhxとマルチパルス決
定手順との関係を示す波形図、第8図は本発明の
符号化効率向上効果を従来方法と対比してS/N
で評価した波形図である。 1……LPC合成器、2……LPC分析器、3…
…音源パルス発生器、4……減算器、5……聴感
重み付け器、6……2乗誤差最小化器、7……
LPC分析器、8……相互相関関数算出器、9…
…符号化器(1)、10……自己相関関数算出器、1
1……類似度算出器、12……符号化器(2)、13
……マルチプレクサ、14……デマルチプレク
サ、15……復号化器(1)、16……復号化器(2)、
17……LPC合成器、18……LPF、19……
相互相関係数メモリ、20……自己相関正規器、
21……自己相関係数メモリ、22……積和算出
器、23……最大値検索器、24……相互相関補
正器、25……マルチパルスメモリ。

Claims (1)

    【特許請求の範囲】
  1. 1 入力音声信号を分析フレームごとにLPC
    (Linear Prediction Coefficient,線形予測係数)
    分析して抽出したLPC係数をスペクトル包絡情
    報としこのスペクトル包絡情報とともに前記入力
    音声信号の音声情報を構成する音源情報を分析フ
    レームごとにこの音源情報の特徴に対応する発生
    時間位置と振幅とを有する複数個のインパルス系
    列(マルチパルス)を似つて表現して前記入力音
    声信号の分析および合成を行なうマルチパルス型
    ボコーダにおいて、前記入力音声信号と音声合成
    フイルタのインパルス応答との相互相関係数列を
    算出する手段と、前記インパルス応答の自己相関
    係数列を算出する手段と、前記相互相関係数列と
    前記自己相関係数列との類似度を算出する手段と
    を分析側に備え、且つ更に前記類似度の最大値を
    検索し、前記最大値に比例する振幅を有するパル
    スを前記最大値に対応するパルス発生時間位置に
    設定し、更に前記最大値と自己相関係数列とを用
    いて相互相関係数列から前記設定したパルスの成
    分を除去する手段を分析側に備え、この除去する
    手段を繰返して用いることによりインパルス系列
    (マルチパルス)の振幅、位置をフオワード的に
    算出する手段を分析側に有することを特徴とする
    マルチパルス型ボコーダ。
JP58149007A 1983-06-27 1983-08-15 マルチパルス型ボコ−ダ Granted JPS6041100A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP58149007A JPS6041100A (ja) 1983-08-15 1983-08-15 マルチパルス型ボコ−ダ
CA000457390A CA1219079A (en) 1983-06-27 1984-06-26 Multi-pulse type vocoder
US06/625,055 US4720865A (en) 1983-06-27 1984-06-26 Multi-pulse type vocoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58149007A JPS6041100A (ja) 1983-08-15 1983-08-15 マルチパルス型ボコ−ダ

Publications (2)

Publication Number Publication Date
JPS6041100A JPS6041100A (ja) 1985-03-04
JPH0242240B2 true JPH0242240B2 (ja) 1990-09-21

Family

ID=15465626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58149007A Granted JPS6041100A (ja) 1983-06-27 1983-08-15 マルチパルス型ボコ−ダ

Country Status (1)

Country Link
JP (1) JPS6041100A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus

Also Published As

Publication number Publication date
JPS6041100A (ja) 1985-03-04

Similar Documents

Publication Publication Date Title
US7599832B2 (en) Method and device for encoding speech using open-loop pitch analysis
JP4005359B2 (ja) 音声符号化及び音声復号化装置
US5295224A (en) Linear prediction speech coding with high-frequency preemphasis
RU2646357C2 (ru) Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра
RU2644123C2 (ru) Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
CA1219079A (en) Multi-pulse type vocoder
US5235670A (en) Multiple impulse excitation speech encoder and decoder
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH0782360B2 (ja) 音声分析合成方法
JPH0242240B2 (ja)
JPS6162100A (ja) マルチパルス型符号化復号化装置
JPH0377999B2 (ja)
JPH043876B2 (ja)
JPS62102294A (ja) 音声符号化方式
Kim et al. On a Reduction of Pitch Searching Time by Preprocessing in the CELP Vocoder
JP2560860B2 (ja) マルチパルス型音声符号化及び復号化装置
JP2898641B2 (ja) 音声符号化装置
EP1267327A2 (en) Optimization of model parameters in speech coding
JPH043880B2 (ja)
JPH11184499A (ja) 音声符号化方法および音声符号化方法
JPH043560B2 (ja)
Ni et al. Waveform interpolation at bit rates above 2.4 kb/s
Lashkari et al. Joint optimization of model and excitation in parametric speech coders
JPH0455899A (ja) 音声信号符号化方式
Saha et al. Comparison of Musical Pitch Analysis Between LPC and CELP