JPH0457100A - マルチパルス符号化装置 - Google Patents

マルチパルス符号化装置

Info

Publication number
JPH0457100A
JPH0457100A JP2166883A JP16688390A JPH0457100A JP H0457100 A JPH0457100 A JP H0457100A JP 2166883 A JP2166883 A JP 2166883A JP 16688390 A JP16688390 A JP 16688390A JP H0457100 A JPH0457100 A JP H0457100A
Authority
JP
Japan
Prior art keywords
filter
term prediction
long
composite
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2166883A
Other languages
English (en)
Other versions
JP3074703B2 (ja
Inventor
Naoto Iwahashi
直人 岩橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP02166883A priority Critical patent/JP3074703B2/ja
Publication of JPH0457100A publication Critical patent/JPH0457100A/ja
Application granted granted Critical
Publication of JP3074703B2 publication Critical patent/JP3074703B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号の高能率符号化を行うマルチパルス
符号化装置に関するものである。
〔発明の概要〕
本発明は、駆動パルスを複数の合成フィルタに供給して
得られた複数の音声情報と入力音声情報とを比較して、
一つの合成フィルタ及び対応する駆動パルスの対を選択
し、この対の合成フィルタ及び駆動パルスに関連する情
報を符号化することにより、音声信号を低ビツトレート
に圧縮符号化することができると共に、低ビツトレート
であっても音声合成によって品質の良い合成音を得るこ
とができるようになるマルチパルス符号化装置を提供す
るものである。
〔従来の技術] 従来の音声の分析合成系(ボコーダ)として、例えばい
わゆる線形予測分析(LPG)を用いた音声分析合成系
がある。また、このL P G分析合成系を用いた音声
信号の符号化において、品質の良い合成音声を得ること
のできる符号化の手法としては、例えば、いわゆるマル
チパルス駆動線形予測符号化(MPC或いはMPEC)
がある。このMPCは、上記LPG分析合成系において
、般に行われているパルスと雑音による音源のモデル化
を避け、音源をを声音・無声音にかかわらず複数のパル
スによって表現し、これによってLPG合成フィルタを
駆動する方法である。
第2図に上記MPCを用いた従来の音声合成回路のブロ
ック図を示す。
この第2図において、入力端子101には、後述するパ
ルスの振幅と位置を示す信号P (n)が供給され、マ
ルチパルス生成回路102に送られる。
該マルチパルス生成回路102では、上記パルスの振幅
と位置の信号P (n)に基づいてマルチパルス列V 
(n)が生成される。当該マルチパルス列■(n)で、
LPG合成フィルタである長期予測合成フィルタ103
と短期予測合成フィルタ104が駆動されることにより
、合成音声信号Q (n)が得られるようになっている
。該合成音声信号Q (n)が出力端子105から出力
される。
ここで、上記長期予測合成フィルタ103のフィルタ特
性FsL(Z) は、 F 5L(Z)= 1 / (1+βZ−’ )   
     (1)で表せる。なお、(1)式中のMは該
長期予測合成フィルタ103の遅延タップ数、βは予測
係数である。また、上記短期予測合成フィルタ104の
フィルタ特性Fss(Z)は、 Fss(Z)=1/(1−t−cr+Z−’+α2Z−
”・−・)  (2)で表せる。この(2)式中αは予
測係数である。
ただし、一般のMPCを用いた音声合成の場合、上記長
期予測合成フィルタ103は必ずしも必要ではないが、
この第2図のように長期予測合成フィルタ103を用い
ることで、音声の長期の相関をとることができるように
なり、このため音質が向上し、また、マルチパルスのエ
ネルギが少なくて済むようになる。
ところで、上述した長期予測合成フィルタ103及び短
期予測合成フィルタ104の各フィルタ特性F 5L(
Z)及びFss(Z)は、例えば第3図のような構成を
用いて決定されている。
この第3図の入力端子111には、原音声信号である入
力音声信号S (n)が供給されている。ここで、上述
した第2図での短期予測合成フィルタ104の予測係数
α、(iは1,2,3.・・・)は、例えば上記入力音
声信号S (n)のLPG分析を行うことで得られる。
また、第2図の長期予測合成フィルタ103の遅延タッ
プ数M及び予測係数βは、F as(Z)= 1+α1
Z−1+α2Z−2・・・   (3)で表されるフィ
ルタ特性F□(Z)の短期予測分析フィルタ112に、
上記入力音声信号S (n)を入力した時の出力R+(
n)を分析することで得られる。
この時の分析方法としては、例えば、 FAL(Z)・1+βZ−M            
(4)のフィルタ特性FAL(Z)の長期予測分析フィ
ルタ113に、上記短期予測分析フィルタ112の出力
R+(n)を入力した時の出力R2(n)の2乗和が最
小になるように、すなわち、 Σ(Rz(n))2 が最小となるように、上記予測係数β及び遅延タップ数
Mが求められる。なお、上記出力Rz(n)は出力端子
114から出力される。
このようにして上記フィルタ特性FAL(Z)及びFs
s(Z)が求められた第2図の長期予測合成フィルタ1
03と短期予測合成フィルタ104を上記マルチパルス
列V (n)で駆動するのが上記MPCである。
また、上記音声合成装置では、例えば合成音声信号Q 
(n)が所望の値に近くなるようなマルチパルス列V 
(n)の探索が行われ、この探索によって得られたマル
チパルス列V (n)によって音声の合成がなされるよ
うになっている。この時のマルチパルス列V (n)探
索のアルゴリズムとしては、例えば、いわゆるA−b−
3(アナリシスーバイシンセシス)法の原理を用いた方
法がある。この方法では、第4図に示すような構成によ
って、入力音声信号S (n)と上記合成音声信号Q 
(n)との誤差を計算し、聴覚特性による重み付けを行
ってから、平均2乗誤差が最小になるような上記マルチ
パルス列V (n)の探索が行われる。
すなわち、この第4図の構成において、初期状態として
既にある数のパルス(マルチパルス列■(n))が決定
されているとすると、該マルチパルス列V (n)は、
上述した長期予測合成フィルタと短期予測合成フィルタ
とで構成されたLPG合成フィルタ123を通って合成
音声信号Q (n)に変換される。この合成音声信号Q
 (n)は、端子126から供給される上記入力音声信
号S (n)と、該合成音声信号Q (n)との減算演
算を行うことで誤差信号e (n)を得る減算器124
に送られる。その後、該誤差信号e (n)に聴感的な
重み付け(重み付けの係数W(z)による重み付け)を
行う重み付はフィルタ125に送られ、その出力CI、
、(n)に基づいて2乗誤差最小化回路121で2乗誤
差が最小になるように新しいパルスの振幅と位置の信号
P (n)が決定されてマルチパルス生成回路122に
送られる。すなわち、該第4図の構成では、これまでに
(例えば初期状態で)決定されたマルチパルス列V (
n>による合成音声信号Q (n)と入力音声信号S 
(n)との誤差信号e (n)に基づいて、新しいマル
チパルス列V (n)を追加し、この誤差信号e (n
)が予め設定した値より小さくなるか、或いは予め設定
した数のパルス(マルチパルス列V (n))が決定さ
れるまで、上述した処理を繰り返すようになっている。
〔発明が解決しようとする課題〕
従来のMPCの方式では、上述したように、例えば上記
A−b−3法の原理を用いたマルチパルス列V (n)
の探索に先立って、上記長期予測合成フィルタ及び短期
予測合成フィルタのフィルタ特性を決定しておく必要が
あるが、上記長期予測合成フィルタのフィルタ特性決定
の手法としては最適な方法がなく、特に上記遅延タップ
数Mを求めるのが困難である。このため、音声合成装置
で得られた合成音声が、良好なものとなっているとは言
い難い。
そこで、本発明は、上述のような実情に鑑みて提案され
たものであり、音声信号の圧縮符号化ができると共に、
簡単に最適な合成音声信号を得ることができるマルチパ
ルス符号化装置を提供することを目的とするものである
〔課題を解決するだめの手段〕
本発明のマルチパルス符号化装置は、上述の目的を達成
するために提案されたものであり、複数の合成フィルタ
と、これら複数の合成フィルタに対応する駆動パルス発
生手段と、当該駆動パルス発生手段によって発生された
駆動パルスを対応する合成フィルタに供給して得られた
音声情報と、入力音声情報とを比較し、上記複数の合成
フィルタの一つとこれに対応する駆動パルスの対を選択
する比較選択手段と、当該比較選択手段で選択された合
成フィルタ及び駆動パルスに関連する情報を符号化する
符号化手段とを有してなるものである。
〔作用] 本発明によれば、合成フィルタからの音声情報(合成音
声情報)と、入力音声情報とを比較し、この比較結果に
基づいた合成フィルタとこれに対応する駆動パルスに関
連する情報を符号化しているので、この符号化出力から
得られる合成音は最もよい合成音となる。
〔実施例〕
以下、本発明を適用した実施例について図面を参照しな
がら説明する。
第1図に本発明実施例のマルチパルス符号化装置の概略
構成のブロック図を示す。
この第1図の符号化装置は、複数の合成フィルタとして
の長期予測合成フィルタ3.〜3.(mは整数)及び短
期予測合成フィルタ41〜4□と、これら複数の合成フ
ィルタに対応する駆動パルス発生手段であるマルチパル
ス生成回路2□〜2イと、当該マルチパルス生成回路2
.〜2うによって発生された駆動パルス(マルチパルス
列V (n)〜■(n)、)を対応する合成フィルタに
供給して得られた音声情報である合成音声信号Q(n)
、〜Q(n)、と入力音声情報である入力音声信号S 
(n)とを比較し、最も良い合成音声信号Q(nL  
(gは1〜mの内の何れか)が得られる上記複数の合成
フィルタの一つとこれに対応する駆動パルスの対を選択
する比較処理部11と選択処理部12とからなる比較選
択回路10と、当該比較選択回路10で選択された合成
フィルタ及び駆動パルスに関連する情報としての長期予
測合成フィルタの遅延タップ数M、と予測係数β9.マ
ルチパルス列V (n) 9及び短期予測合成フィルタ
の予測係数を符号化する符号化回路6とを有してなるも
のである。
すなわち、この第1図に示す本実施例装置は、MPCを
用いた音声合成を行うものであって、長期予測合成フィ
ルタ31〜31を用いることで、音声の長期の相関がと
れるようにして音質を向上させ、また、マルチパルスの
エネルギを少なくて済むようにしている。ここで、上記
各長期予測合成フィルタ3.〜3□は、前述した(1)
式中遅延タップ数Mと予測係数βがそれぞれ異なるもの
とされることで、各々異なるフィルタ特性FSL(Z)
〜FSL(Z)、とされている。また、上記短期予測合
成フィルタ41〜4.の各フィルタ特性はそれぞれ同じ
フィルタ特性Fss(Z)となっている。なお、上記短
期予測合成フィルタ41〜4.の各フィルタ特性Fss
(Z)は、前述した(2)式で表すことができるもので
あ4゜更に、上記マルチパルス生成回路21〜21から
は、前述した第4図のようにして、対応する長期予測合
成フィルタ31〜3□での最適のマルチパルス列V (
n) I〜V(n)11が生成されるようになっている
。例えば、これらマルチパルス生成回路2.〜2ffl
からは、前述した第4図に示したLPG合成フィルタ1
23内の長期予測合成フィルタのフィルタ特性を、本実
施例の各長期予測合成フィルタ3□〜3fflのフィル
タ特性FSL(Z)I〜Fst(Z)、とし、該フィル
タ特性FSL(Z)I−FSL(Z)−とされた長期予
測合成フィルタが配されたLPG合成フィルタ123を
用いて、当該第4図の構成でそれぞれ選ばれた最適のマ
ルチパルス列が得られるようになっている。
このようにして得られたマルチパルス列V(n)+〜V
an)、が、第1図のLPG合成フィルタである長期予
測合成フィルタ3□〜3□及び短期予測合成フィルタ4
、〜4□を介することにより、合成音声信号Q (n)
 1〜Q(n)、Thが得られるようになっている。こ
れら合成音声信号Q (n) 1〜Q(n)、が上記比
較選択回路10に送られる。
本実施例装置においては、上述したように各長期予測合
成フィルタ3.〜3fflのフィルタ特性がそれぞれ異
なっているため、各短期予測合成フィルタ4.〜4゜の
各出力すなわち合成フィルタの出力である合成音声信号
Q(n)1〜Q(n)、もそれぞれ異なったものとなっ
ている。これら各合成音声信号Q(n)1〜Q(n)イ
の中で、最も良い合成音が比較選択回路10で選ばれる
ここで、上記比較選択回路10の比較処理部11では、
入力音声信号S (n)に最も近くなる合成音声信号Q
 (n)、を選ふような処理を行う。具体的には、例え
ば各合成音声信号Q (n) 、〜Q(n)、、。
と、端子5を介した入力音声信号S (n)との誤差信
号(入力音声信号S (n)に対する誤差信号)をそれ
ぞれ得て、これら誤差信号に基づいて2乗誤差が最小と
なるような合成音声信号Q(n)9を選ぶ。換言すれば
、2乗誤差が最も小さくなるということは、入力音声信
号S (n)に最も近い合成音声信号Q(n)9である
ことを示す。この比較処理部11での比較結果は、上記
選択処理部12に送られる。
また、上記比較選択回路10の選択処理部11には、各
マルチパルス生成回路21〜2LIからのマルチパルス
列V (n) I〜V(n)、、と、各長期予測合成フ
ィルタ31〜3□の各遅延タップ数M1〜M、及び予測
係数β1〜β1の情報も供給されている。該選択処理部
12では、上記比較処理部11の比較結果に応じて、上
記最適の合成音声信号Q (n) 9が得られる長期予
測合成フィルタの遅延タップ数M9と予測係数β9及び
対応するマルチパルス生成回路のマルチパルス列V(n
)9の情Iを選択して出力するようになっている。
当該遅延タップ数M9.予測係数β9とマルチパルス列
V(nLの情報、及び端子9からの短期予測合成フィル
タの予測係数の情報が符号化回路6に送られて符号化さ
れた後、出力端子7から出力信号C(n)として出力さ
れる。
上述のようなことから、本実施例装置においては、マル
チパルス符号化において用いられる長期予測合成フィル
タを決定(フィルタ特性を決定)する場合、それぞれ異
なるフィルタ特性の複数の長期予測合成フィルタを用意
しておき、これらの長期予測合成フィルタを用いて得ら
れた合成音声信号の中から最適な合成音を得ることがで
きるようになる信号を選び、この選ばれた合成音声信号
Q (n)、に対応する長期予測合成フィルタの遅延タ
ップ数M9及び予測係数β9Q情報と、該長期予測合成
フィルタに対応したマルチパルス生成回路の出力(マル
チパルス列V(n)、)を得て、これらの情報を短期予
測合成フィルタの予測係数と共に符号化して出力するよ
うにしている。このため、後に当該符号化出力に基づい
て音声を合成すれば、良好な合成音声が得られるように
なる。上述のようなことから、従来例の場合と同じビッ
トレートで符号化しても、本実施例装置での符号化出力
に基づいた合成音の方が音質が向上するようになる。更
に、各長期合成フィルタ3□〜3□のフィルタ特性も最
適なものが選ばれるようになっているため、合成音声の
品質が向上することになる。
(発明の効果〕 本発明のマルチパルス符号化装置においては、複数の合
成フィルタと、これら複数の合成フィルタに対応する駆
動パルス発生手段からの駆動パルスを対応する合成フィ
ルタに供給して得られた複数の音声情報と入力音声情報
とを比較して、一つの合成フィルタ及び対応する駆動パ
ルスの対を選択することで、合成フィルタの最適な特性
を選ぶことができるようになり、この選択された対の合
成フィルタ及び駆動パルスに関連する情報を符号化する
ことによって、音声信号を低ピッi・レートに圧縮符号
化することができると共に、低ビツトレートであっても
音声合成によって簡単に品質の良い合成音を得ることが
できるようになる。
【図面の簡単な説明】
第1図は本発明実施例装置の概略構成を示すブロック回
路図、第2図は従来例の合成回路を示すブロック回路図
、第3図はフィルタ特性決定のための構成を示すブロッ
ク回路図、第4図はマルチパルス列探索のための構成を
示すブロック回路図である。 6・・・・・・・・・・・・・・・・符号化回路21〜
2.I・・・・・・・・マルチパルス生成回路3、〜3
□・・・・・・・・長期予測合成フィルタ41〜4□・
・・・・・・・短期予測合成フィルタ10・・・・・・
・・・・・・・・比較選択回路11・・・・・・・・・
・・・・・比較処理部12・・・・・・・・・・・・・
・選択処理部特許出願人    ソニー株式会社 代理人 弁理士  小池 晃 (他2名)+00

Claims (1)

  1. 【特許請求の範囲】  複数の合成フィルタと、 これら複数の合成フィルタに対応する駆動パルス発生手
    段と、 当該駆動パルス発生手段によって発生された駆動パルス
    を対応する合成フィルタに供給して得られた音声情報と
    、入力音声情報とを比較し、上記複数の合成フィルタの
    一つとこれに対応する駆動パルスの対を選択する比較選
    択手段と、 当該比較選択手段で選択された合成フィルタ及び駆動パ
    ルスに関連する情報を符号化する符号化手段とを有して
    なることを特徴とするマルチパルス符号化装置。
JP02166883A 1990-06-27 1990-06-27 マルチパルス符号化装置 Expired - Fee Related JP3074703B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02166883A JP3074703B2 (ja) 1990-06-27 1990-06-27 マルチパルス符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02166883A JP3074703B2 (ja) 1990-06-27 1990-06-27 マルチパルス符号化装置

Publications (2)

Publication Number Publication Date
JPH0457100A true JPH0457100A (ja) 1992-02-24
JP3074703B2 JP3074703B2 (ja) 2000-08-07

Family

ID=15839387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02166883A Expired - Fee Related JP3074703B2 (ja) 1990-06-27 1990-06-27 マルチパルス符号化装置

Country Status (1)

Country Link
JP (1) JP3074703B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998040877A1 (fr) * 1997-03-12 1998-09-17 Mitsubishi Denki Kabushiki Kaisha Codeur vocal, decodeur vocal, codeur/decodeur vocal, procede de codage vocal, procede de decodage vocal et procede de codage/decodage vocal

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658438B2 (ja) 1989-10-19 1997-09-30 日本電気株式会社 音声符号化方法とその装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998040877A1 (fr) * 1997-03-12 1998-09-17 Mitsubishi Denki Kabushiki Kaisha Codeur vocal, decodeur vocal, codeur/decodeur vocal, procede de codage vocal, procede de decodage vocal et procede de codage/decodage vocal
AU733052B2 (en) * 1997-03-12 2001-05-03 Mitsubishi Denki Kabushiki Kaisha A method and apparatus for speech encoding, speech decoding, and speech coding/decoding
US6408268B1 (en) 1997-03-12 2002-06-18 Mitsubishi Denki Kabushiki Kaisha Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method

Also Published As

Publication number Publication date
JP3074703B2 (ja) 2000-08-07

Similar Documents

Publication Publication Date Title
US7496506B2 (en) Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
US20050053130A1 (en) Method and apparatus for voice transcoding between variable rate coders
JPH08328588A (ja) ピッチラグを評価するためのシステム、音声符号化装置、ピッチラグを評価する方法、および音声符号化方法
JP2002202799A (ja) 音声符号変換装置
KR19990006262A (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
JP2004517348A (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JPH0457100A (ja) マルチパルス符号化装置
Tzeng Analysis-by-synthesis linear predictive speech coding at 2.4 kbit/s
Kim et al. An efficient transcoding algorithm for G. 723.1 and EVRC speech coders
JP3510643B2 (ja) 音声信号のピッチ周期処理方法
Sreenivas Modelling LPC-residue by components for good quality speech coding
JP3578933B2 (ja) 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2583883B2 (ja) 音声分析装置および音声合成装置
JP3192051B2 (ja) 音声符号化装置
JP2000305597A (ja) 音声圧縮のコード化
Tseng An analysis-by-synthesis linear predictive model for narrowband speech coding
JP3332132B2 (ja) 音声符号化方法および装置
JPS58188000A (ja) 音声認識合成装置
Tzeng Analysis-by-Synthesis Linear Predictive Speech Coding at 4.8 kbit/s and Below
JP3071800B2 (ja) 適応ポストフィルタ
Yuan The weighted sum of the line spectrum pair for noisy speech

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees