JPS61148500A - 音声信号符号化方法とその装置 - Google Patents

音声信号符号化方法とその装置

Info

Publication number
JPS61148500A
JPS61148500A JP59269914A JP26991484A JPS61148500A JP S61148500 A JPS61148500 A JP S61148500A JP 59269914 A JP59269914 A JP 59269914A JP 26991484 A JP26991484 A JP 26991484A JP S61148500 A JPS61148500 A JP S61148500A
Authority
JP
Japan
Prior art keywords
circuit
parameter
drive signal
representing
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59269914A
Other languages
English (en)
Other versions
JP2844589B2 (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59269914A priority Critical patent/JP2844589B2/ja
Publication of JPS61148500A publication Critical patent/JPS61148500A/ja
Application granted granted Critical
Publication of JP2844589B2 publication Critical patent/JP2844589B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号を低いビットレイトで高品質に符号化
するだめの音声信号符号化方法とその装置に関する。
(従来技術とその問題点) 音声信号を16にビット/秒程度以下の伝送情報量で符
号化するための方式として、最近マルチパルス駆動形音
声符号化方式が提案されている。
これは、駆動音源信号系列を表わす複数個のパルス系列
(マルチパルス)を、短時間毎に、符号器側でアナリシ
ス パイ シンセシス(ANALY8−IS−bY−8
YNTHE8I8 ;A−b−8)の手法を用いて逐次
的に求め、このパルス系列を符号化伝送する方式である
。この方式の詳細については、ビー・ニス・アタール(
B、S、ATAL)氏らによるアイ・シー・ニー・ニス
9ニス・ビー(1,C,A。
s、s、p、)の予稿集、1982年614〜617頁
に掲載の論文「ア会二、−・モデル・オブ・エル・ビー
・シー・エクサイティシ、ン・フォー−フロデ、−シン
グ・ナチュラル・サウンディング・スピーチ・アット・
ロウ・ビット・レイクJ(ANEW MODEL OF
 LPCEXCITATION FO−RPRODUC
ING NATURAL−80UNDING 8−PE
ECHAT LOW BIT RATES) (文献1
)に説明されている。
第4図はこの文献1に記載された符号器側の処理を示す
゛ブロック図である。図において、400はA/D変換
された音声信号系列X (n)が入力される符号器入力
端子、410は音声信号系列を17レーム(例えば8k
Hzサンプリングの場合でフレーム長を10m5ecと
すると80サンプル)分蓄積するバッファメモリ回路で
ある。このバッファメモリ回路410の出力値は減算器
420と、Kパラメータ計算回路480とに出力される
。但し、文献1によればにパラメータのかわりにREF
LECTIO−N C0EFFICIENT8と記載さ
れているが、これはにパラメータと同一のパラメータで
ある。とのにパラメータ計算回路480は、バッファメ
モリ回路410の出力値を用い、共分散法に従ってフレ
ーム毎の音声信号スペクトルを表わすにパラメータKを
16次分(1≦l≦16)求め、これらを合成フィルタ
430へ出力する。440は音源パルス発生回路で6!
I、lフレーム内にあらかじめ定められた個数のパルス
系列を発生させる。ここでは、このパルス系列をd t
illと記する。
この音源パルス発生回路440によって発生された音源
パルス系列の一例を、第5図に示す。第5図で横軸は離
散的な時刻1に%縦軸は振幅をそれぞれに示す。ここで
は、1フレーム内に8個のパルスを発生させる場合につ
いて示しである。音源パルス発生回路440によって発
生されたパルス系列d (El)は、合成フィルタ43
0を駆動する。この合成74ルタ430は、d(n)t
−人力して音声信号x (nlに対応する再生信号x 
(n)を求め、これを減算器420へ出力する。こζで
合成フィルタ430は、Kパラメータに、を入力し、こ
れらを予測パラメータa、(1≦i≦16)へ変換し%
”Lを用いて再生信号x (n)を計算する。x (n
lは、d(nlと為を用いて下式のように表わすことが
できる。
との式でPは合成フィルタの次数を示し、ここではP−
16としている。減算器420は、原信号Xtn)と再
生信号x (nlとの差e (n)を計算して重み付は
回路490へ出力し、重み付は回路490はe (nl
を入力し、重み付は関数w (nlを用いて次式に従っ
て重み付は誤差e W tn+t−計算する。
e W ff1l = W till * e (nl
           ・・・・−・(2)この式で、
記号*はたたみこみ積分を表わす。また、重み付は関数
w (nlは、周波数軸上で重み付けを行なうものであ
シ、その2変換値をW■とすると、合成フィルタの予測
パラメータalを用いて、次式によ)表わされる。
!=1j;工 ・・・・・・(3) この式でrはO≦r≦1の定数でsb、w■の周波数特
性を決定する。つまl)、r−1とすると、W■−1と
なシ、その周波数特性は平坦となシ、1 =s Qとす
ると、W■は合成フィルタの周波数特性の逆特性となる
。従って、rの値によりてW(2)の特性を変えること
ができる。また、(3)式で示したようKW■を合成フ
ィルタの周波数特性に依存させて決めているのは、聴感
的なマスク効果を利用しているためである。つまシ、入
力音声信号のスペクトルのパワが大きな箇所では(例え
ばフォルマントの近傍)、再生信号のスペクトルとの誤
差が少々大きくても、その誤差は耳につき難いという聴
感的な性質による。
第6図はあるフレームにおける入力音声信号のスペクト
ルとW■の周波数特性の一例とを示した特性図である。
ここではrmo、sとした。図において、横軸は周波数
(最大4kHz)を、縦軸は対数振幅(最大60 dB
 )をそれぞれ示す。また、上部の曲線は音声信号のス
ペクトルを、下部の曲線は重み付は関数の周波数特性を
表わしている。
第4図へ戻って、重み付は誤差e 、 (n)は、誤差
最小化回路450ヘフイードバツクされる。誤差最小化
回路450は、Cw(”)の値を1フレーム分記憶し、
これらを用いて次式に従い、重み付け2乗誤差Cを計算
する。
6−Σev (”l ”              
・・・・・・(4)ここで、Nは2乗誤差を計算するサ
ンプル数を示す。文献lの方式では、この時間長を5m
5ecとしてお)、これは8kHzサンプリングの場合
にはN−40に相当する。
次に、誤差最小化回路450は、この(4)式で計算し
た2乗誤差εを小さくするように音源パルス発生回路4
40に対し、パルス位置及び振幅情報を与え、音源パル
ス発生回路440はこの情報に基づいて音源パルス系列
を発生させる。合成フィルタ430は、この音源パルス
系列を駆動源として再生信号x (nlを計算する。次
に、減算器420では、先に計算した原信号と再生信号
との誤差e (nlから現在求まった再生信号x (n
lを減算して、これを新たな誤差e (nlとする。重
み付は回路490はe (n)を入力し重み付は誤差e
 W (nlを計算し、これを誤差最小北回一 路450フィードバックする。誤差最小化回路450は
、再び2乗誤差を計算し、これを小さくするように音源
パルスの振幅と位置を調整する。こうして音源パルス系
列の発生から誤差最小化による音源パルス系列の調整ま
での一連の処理は、音源パルス系列のパルス数があらか
じめ定められた数に達するまでくシ返され、音源パルス
系列が決定される。
この従来の方式の場合、伝送すべき情報は、合成フィル
タのパラメータに、(1≦i≦16)と、音源パルス系
列のパルス位置及び振幅であり、1フレーム内にたてる
パルスの数によって任意の伝送レイトを実現できる。こ
の伝送レイトを16kbps以下とする領域に対しては
、良好な再生音質が得られ有効な方式と考えられる。
しかしながら、この従来方式は、演算量が非常に多いと
いう欠点がある。これは音源パルス系列におけるパルス
の位置と振幅を計算する際に、そのパルスに基づいて一
旦信号を再生し、原信号と再生信号との誤差及び2乗誤
差を計算し、それらをフィードバックさせて、2乗誤差
を小さくするようにパルス位置と振幅を調整しているこ
とに起因している。
またこの従来方式によれば、伝送レイトを下げるとピッ
チ周波数の高い音声の場合、例えば女性話者の音声を入
力した場合には、再生音質が劣化するという欠点があっ
た。これは、ピッチ周波数が高い場合には、ピッチ周波
数が低い場合に比ベパルスを計算するためのフレームに
よシ多くのピッチ波形が含まれることになシ、このピッ
チ波形を良好に再生するためには、ピッチ周波数が低い
話者の場合と比べて、より多くの個数の音源パルスを必
要とするという理由による。
(発明の目的) 本発明の目的は、比較的少ない演算量で、低い伝送レイ
トにも適用し得る高品質な音声信号符号化方法とその装
置を提供することにある。
(発明の構成) 本発明の音声信号符号化方法の構成は、送信側では、離
散的な音声信号系列を入力しあらかじめ定められた時間
間隔毎にピッチを表わすピッチパラメータと短時間スペ
クトル包絡を表わすスペクトルパラメータとを抽出し、
前記音声信号系列を表わすための駆動信号を前記ピッチ
に応じて分割した時間区間のうちの一部区間について求
め前記一部区間以外の区間については前記一部区間から
暫定駆動信号を求めさらに補正量を求めて前記音声信号
系列を表わす駆動信号を推定し、前記ピッチパラメータ
と前記スペクトルパラメータと前記駆動信号と前記補正
量とを組み合わせて出力し、受信側では、前記ピッチパ
ラメータと前記スペクトルパラメータと前記駆動信号と
前記補正量とを分離して駆動音源信号を復元し、前記音
声信号系列を再生することを特徴とする。
本発明の音声信号符号化装置の構成は、入力した音声信
号系列からあらかじめ定められた時間間隔毎にピッチを
表わすピッチパラメータと短時間スペクトル包絡を表わ
すスペクトルパラメータを抽出し出力するパラメータ計
算回路と、前記音声信号系列を前記ピッチに応じた時間
区間に分割し前記音声信号系列を表わす駆動信号を前記
時間区間のうちの一部区間について求め前記一部区間以
外の区間については前記一部区間から暫定駆動信号を求
めさらに前記音声信号系列を表わすための補正量を求め
前記駆動信号を表わす符号と前記補正量を表わす符号と
を出力する駆動信号計算回路と、前記パラメータ計算回
路の出力符号と前記駆動信号計算回路の出力符号とを組
み合わせて出力するマルチプレクサ回路とを有すること
を特徴とする。
本発明の音声信号復号化装置の構成は、ピッチパラメー
タを表わす符号とスペクトルパラメータを表わす符号と
駆動信号を表わす符号と補正量を表わす符号とが組み合
わされた符号系列を入力して分離し復号するデマルチプ
レクサ回路と、前記復号されたピッチパラメータと前記
復号された駆動信号と前記復号された補正量をもとく駆
動音源信号を復元する駆動信号復元回路と、前記駆動音
源信号と前記復号されたスペクトルパラメータを用いて
音声信号系列を再生し出力する合成フィルタ回路とを有
することを特徴とする。
(発明の原理) 本発明は、音声信号の周期性を利用して入力音声信号を
ピッチ周期毎のサブフレームに分割し、これらサブフレ
ームのうち一部のサブフレーム区間に対して前記音声信
号を表わすための駆動パルス利金計算し、残りのサブフ
レーム区間に対しては、前記駆動パルス列をくり返すか
または前記駆動パルス列から補間して求めた信号に対し
て、振幅または位置あるいは振幅と位置の両方について
補正を施すための補正量を求め、ピッチ周期を表わすピ
ッチパラメータと、入力音声信号のスペクトル包絡を表
わすスペクトルパラメータと、前記駆動パルス列と、前
記補正量とを伝送し、伝送された情報から音声信号を合
成することを特徴としている。
(実施例) 以下本発明の実施例について図面を参照して詳細に説明
する。
第1図iり 、 (b)は本発明による音声符号化方式
の符号器側および復号器側の一実施例を示すブロック図
である。第1図(alにおいて、音声信号系列X(nl
は、入力端子100から入力され、あらかじめ定められ
たサンプル数だけ区切られてバッファメモリ回路110
に蓄積される。次ににパラメータ計算回路140は、バ
ッツァメモリ回路110Vc蓄積されている音声信号の
うち、あらかじめ定められたサンプル数を入力し、入力
信号のスペクトル包絡を表わすLPCパラメータを計算
する。このLPCパラメータとしては種々知られている
が以下ではパーコール係数と同一のパラメータであるに
パラメータを用いるものとして説明を進める。
このにパラメータの計算法としては代表的表方法として
、自己相関法と共分散法とがよく知られているが、ここ
ではフィルタの安定性の判別が容易な自己相関法を用い
ることにする。尚、この方法の詳細は、ジョン・マクホ
ウル(JOHN MA−KHOUL)氏らによるアイ・
イー・イー・イー・トランサクシ、ンズ・オン・ニー・
ニス・ニス・ピー(IEEE  TRAN8ACTIO
N8  ON A、8.S。
P、)、1975年6月号、309〜321頁に掲載の
論文「クオンタイゼイシ、ン・プロパティズ・オン・ト
ランスミッション・パラメターズ・イン・リニア・ブリ
ディクチイブ・システムズ」(Q−UANTIZATI
ON PROPERTIES OF TRAN−8MI
SSION  PARAMETER8IN  LINE
ARPREDICTIVE 8Y8TEM8 )(文献
2)等に述べられているので、ここでは説明を省略する
第1図faK戻って、Kパラメータに1はにパラメータ
符号化回路160へ出力され、Kパラメータ符号化回路
160は、あらかじめ定められた量子化ビット数に基づ
いてに、を符号化し、符号ix+をマルチプレクサ26
0へ出力する。また、Kパラメータ符号化回路160は
s  fiKIを復号化して得たにパラメータ復号値に
、を用い文献2に記載の方法に従い、予測係数値a′1
に変換し、インパルス応答計算回路170と重み付は回
路200と合成フィルタ回路250とへ出力する。
次に、ピッチ分析回路130は、バッファメモリ回路1
10の出力である1フレ一ム分の音声信号を用いてピッ
チ周期Pdを計算する。このP4の計算法としては1例
えばアール働ブイ・コックス(R,V、C0X)氏らく
よるアイ・イー・イー・イー・トランサクシ、ンズ・オ
ン・ニー・ニス拳ニス、 ピー(IEEE TRANS
ACTION8  ON A、8゜8、P )1983
年2月号、258〜272頁に掲載の論文「リプル−タ
イム・インプリメンティジョン・オン・タイム・ドメイ
ン・ハーモニック・スケーリング・オン・スピーチ・フ
ォー・レイト11そディフィケーション・アンド・コー
ディング」(REAL−TIME IMPLEMEN’
I’ATION OF TI−ME DOMAIN H
ARMONIC5CALING 0F8PEECHFO
RRATE MODIFICATION A−ND C
0DING)(文献3)等に説明されている音声信号の
自己相関々数を用いて計算する方法が知られている。ピ
ッチ符号化回路150は、ピッチ周期P、t−人力し、
あらかじめ定められた量子化ビット数で量子化符号化し
、符号皇、t−マルチプレクサ260へ出力する。また
、符号l、を復号化して得たP′Iを駆動信号計算回路
220と駆動信号復元回路240へ出力する。
次に、インパルス応答計算回路170は、Kパラメータ
符号化回路160から予測係数値d、を入力し、重み付
けされた合成フィルタの伝達関数を表わすインパルス応
答hv(”)を計算する。ここで、h w (n)の計
算には、例えば特願昭59−42305号明細書の第4
図(alに記載のインパルス応答計算回路210と同一
の方法を用いることができる。このインパルス応答h 
、 (nlは自己相関々数計算回路180と相互相関々
数計算回路210とへ出力される。
また自己相関々数計算回路180は、インパルス応答計
算回路170からインパルス応答h 、 tnzt−人
力し、次式に従って自己相関々数Rhh(T)t−6ら
かじめ定められた遅れ時間τだけ計算する。
N−τ Rhh(r)−Σhv(n)・hv (n + τ) 
  −−(s)nI!+1 自己相関々数R’hb (τ)は駆動信号計算回路22
0へ出力される。
次に1減算器120は、バッファメモリ回路110に蓄
積された音声信号x (nlを入力し、x(nlから合
成フィルタ回路250の出力系列t−1フレームサンプ
ル分減算し、減算結果e (n)を重み付は回路200
へ出力する。
この重み付は回路200は、波計器120から減算結果
a (nlとにパラメータ計算回路140から予測係数
値d′1とを入力し、e(n)に対して重み付けを施し
たe、(n)を出力する。ここでe 、 (n)の計算
には、例えば特願昭59−42305 の第4図(al
に記載の重み付は回路410と同一の方法を用いること
ができる。
次の相互相関々数計算回路210は、重み付は回路20
0からのeア(nlとインパルス応答計算回路170か
らのインパルス応答h W (n)とを入力し、次式に
従い相互相関々数ψ、!(τ)t−計算する。
ψh−(τ)−Σev(n)・h、 (n  r ) 
n=1 (1≦τ≦N)    ・・・・・・(6)この相互相
関々数ψhz(τ)は駆動信号計算回路220へ出力さ
れる。
次に駆動信号計算回路220及び補正情報計算回路19
0について説明する。ここで駆動信号計算回路220で
は音声信号を表わす駆動信号としてパルス系列を計算す
る。この駆動信号計算回路220での処理手順を以下に
示す。ここでは2ピッチ区間に対し1ピッチ分のパルス
と補正情報を伝送する場合について説明する。
1)第1番目のパルスを計算し、このパルスの位置とピ
ッチ周期P′dとを用い、フレームをピッチ周期P ’
、iサンプル毎のサブフレームに分割する。
第2図(alに17L/−ム区間(ここでは20 tn
secに選んだ)の音声波形、第2図(blにフレーム
をサブフレームに分割した一例を示す。
2)第2図(blでパルスを伝送するサブフレームは(
+) 、 (Ill) 、 &)のサブフレームであシ
、これらのサブフレームに対して次式に従いパルス数を
割り当てる。
L工+L、!+L3=LF        ・・・・・
・(7)この式でLl、L2.L3はそれぞれ(1) 
、 (fit) 、位)のサブフレームに割シ当てるパ
ルス数、LFはフレーム毎に割り当てられるパルス数を
示す。なおり、の値はビットレイトからあらかじめ求め
ておく。
3)次に、サブフレーム(1)に対してパルスをL、個
計算する。ここでパルス計算には次式を用いる。
gI(m+)= Rhh(0) (1≦i≦L工)             ・・・・
・・(8)この式でg (、ff1Iは1番目のパルス
の振幅1位置を示し、ψhx、Rhhはそれぞれ相互相
関々数。
自己相関々数を示す。このようにして求めたパルスは補
正情報計算回路190と符号化回路230へ出力される
補正情報計算回路190では、サブフレーム(11)の
音声を良好に表わすパルスを、サブフレーム(1)で求
めたパルスとその補正情報(パルスの振幅2位置に対す
る補正)という形で表現し、最良の補正情報を求める。
この補正情報の求め方はいくつか考えられるが、ここで
はあらかじめ補正情報を数種類用意しておき、このなか
から最良なものを選択する方法を用いる。ここであらか
じめ用意されている補正情報の一例を第3図に示す。こ
の図では、補正情報は振幅1位置を含めて16種類の補
正値をもっており、各々の補正値は4ビツトの符号と対
応している。この補正値のわりおて方としては種々考え
られるが、パルスの位置の変化が振幅に比べ少ないとす
れば、第3図に示すようK、パルス位置の補正量として
”+1’、′0”、′−1”の3種を用意し、各々の位
置補正量に対応する振幅補正量を@1.2’、@1.1
”、″1.0’、″″0.9”、0.8”の5種を用意
する。但し、位置補正が1″をとる頻度は他の2種の場
合と比べ大きいと予想されるので、位置補正″″0”の
時のみ振幅補正値を6種用意する。今、補正値として最
上段のパルスが選択された場合は、一つ過去(左隣)の
サブフレームで求まったパルスをピッチ周期だけずらし
てくシ返してパルスに対して、全てのパルス位置t−”
l’サンプルだけ時間正方向くずらし、かつ全てのパル
ス振幅に@1.2”の値を乗する。そして補正値を表わ
す符号としては”oooo”の符号を出力する。この補
正値のわシあて方は、例えばパルス振幅1泣置の統計的
な変化から補正値を求めてわシあててもよい。
次に補正情報計算回路190における補正情報の選択法
は種々考えられるが、例えばサブフレームの音声信号と
補正されたパルスによって合成される信号とのS/Nを
用いて、8/Nt−最大とする補正情報を選択する方法
を用いることができる。
ここで8/Nは、補正されたパルスを用いて次式から計
算される。パルスの補正はサブフレーム(1)の全ての
パルスに対して一様に行なわれる。
R,、(0) (1≦i≦16)    ・・・・・・(9)この式で
 、/  、 m′1  は、サブフレーム(1)で求
め1ま たパルスに対して16種の補正のうち、i番目の補正を
施した後のパルスの振幅9位置を示している。またR 
、 、(0)は、信号e 、 (n)に対するサブフレ
ーム01)の区間での電力を示す。
この方法によシ選択された補正情報は駆動信号計算回路
220と駆動信号復元回路240へ出力され、tた選択
された補正情報を表わす符号がマルチプレクサ260へ
出力される。
4)次に駆動信号計算回路220は、サブフレーム(t
i+)のパルスをL2個前述の(8)弐に従い計算する
。ここでサブフレーム(1)及びθ1)で求めたパルス
の影響は、相互相関々数からあらかじめ除去しておく。
以上の処理をくり返して、駆動信号計算回路220はサ
ブフレーム(1) 、 (Ill) 、 (v)のパル
スを求め、補正情報計算回路190はサブフレーム(I
f) 、 (Iv)の補正情報を求める。以上で駆動信
号計算回路220と補正情報計算回路190の説明を終
える。
次に符号化回路230は、入力したパルスの振幅。
位置を符号化し、!ルナプレクサ260へ出力する。
また、パルスの振幅2位置の復号値g’l 、 rn’
lを駆動信号復元回路240へ出力する。ここでパルス
の振幅1位置の符号化法には、例えば特願昭57−23
1605に記載の符号化回路250と同一の方法を用い
ることができる。
次に、駆動信号復元回路240は、ピッチ周期P′4、
パルスの振幅1位置の復号1[g’(+ ”’1及び補
正情報を崩いて、1フレ一ム分のパルスを発生させ、こ
れを駆動音源信号として合成フィルタ回路250へ出力
する。
この合成フィルタ回路250は、駆動音源信号を入力し
、1フレ一ム分の応答信号x (nlを計算する。
ここで応答信号x (nlの計算には、例えば特願昭5
7−231605に記載の合成フィルタ回路320と同
一の方法を用いることができる。
次に、マルチプレクサ260は、Kパラメータ符号化回
路160の符号fLK  とピッチ符号化回路150の
符号1.と補正情報計算回路190からの補正情報符号
と符号化回路230の符号を入力し、これらを組み合わ
せて送信側出力端子270から通信路へ出力する。以上
で符号器側の説明を終える。
次に本実施例の復号器側について、第1図+bit−参
照して説明する。デマルチプレクサ290は、受信側入
力端子280から入力した符号のうち、Kパラメータを
表わす符号と、ピッチ周期を表わす符号と、パルスの振
幅2位置を表わす符号と、補正情報を表わす符号を分離
して、それぞれにパラメータ復号回路330.ピッチ復
号回路320.パルス復号回路300 、補正情報復号
回路310へ出力する。
次に、Kパラメータ復号回路330は、Kパラメータを
復号し、Kパラメータ復号値に′iを合成フィルタ回路
350へ出力し、ピッチ復号回路320はピッチ周期を
復号しピッチ周期復号値P′、を駆動信号復元回路34
0へ出力し、パルス復号回路300は、音源パルス系列
の振幅1位置を復号し、それぞれg ’H、ffl’l
として駆動信号復元回路340へ出力する。
次に1補正情報後号回路310は、符号器側の補正情報
計算回路190と同一の補正情報のセットをあらかじめ
もってお)、この補正情報を表わす符号を入力し、符号
に対応する補正情報を選び出し駆動信号復元回路340
へ出力する。
この駆動信号復元回路340は、符号器側の駆動信号復
元回路240と同一の動作をする。つまり、ピッチ周期
復号値Pシを用いて、フレームをサブフレームに分割し
、サブフレームに発生させるパルス数を計算する。この
処理には、符号器側の駆動信号計算回路220における
方法と同一の方法を用いる。また駆動信号復元回路は、
音源パルス系列の振幅2位置の復号値g ’(、rn 
; と補正情報を用いてサブフレームにパルスを発生さ
せる。ここで偶数番目のサブフレームでは、P、lと補
正情報を用いて1つ前(時間的に過去)のサブフレーム
のパルスの全てを補正してパルスを発生させる。このよ
うにして1フレ一ム分のパルスを復元し、これを駆動信
号として合成フィルタ回路350へ出力する。
この合成フィルタ回路350は、駆動信号を入力し合成
信号X(rllt−1フレーム分計算し、これを受信側
出力端子360から出力する。ここで合成信号x (n
lの計算には例えば特願昭59−42305 の合成フ
ィルタ回路550と同一の方法を用いることができる。
以上で復号器側の説明を終える。
本実施例においては、パルス探索アルゴリズムとして前
述の(8)式を用いたが、これは他のパルス探索アルゴ
リズムを用いてもよい。例えば従来例として文献1に示
した方式を用いてもよい。また、(8)式の方法ではパ
ルスを1つずつ順番に探索していたが、パルスt−1つ
求める毎にこれよシ過去に求まった複数個のパルスの振
幅を再調整するような方法を用いてもよい。また本実施
例では2ピッチ区間に対し、1ピッチ分のパルスと補正
情報を伝送する例について説明したが、3ピッチ以上の
区間に対して1ピッチ分のパルスと補正情報を伝送する
ようにしてもよい。このようにした方がパルスを伝送す
るための情報量を低減することができる。
また本実施例では、駆動信号計算回路220において、
フレームをピッチ周期P′Kに応じたサブフレームに分
割すれ際に、第2図(bl 、 fc)に示したように
、フレームの左端からP′Iサンプル毎にサブフレーム
に分割したが、このサブフレームの分割法としては次の
ようにしてもよい。
まず、フレームに対してあらかじめ定められた個数のパ
ルスを計算する。次に求まったパルスのうち、フレーム
の左端に最も近いパルスの近傍を始点Tとしてsadサ
ンプル毎にサブフレームに分割する。このようKした場
合は、始点Tの位置を受信側へ伝送する必要がある。こ
れには例えば、フレーム左端から始点Tまでの距離Tp
t”6らかしめ定められた長さの符号で表わして伝送し
てもよいし、TPとピッチ周期P′dとの比をららかじ
め定められた長さの符号で表わして伝送してもよい。
また本実施例では、補正情報として第3図に示したよう
な振幅と位置の両方の補正を行なうセットを用意してお
いた。このセッ□トとしては、位置の補正は行なわずに
、振幅の補正のみを行なうような補正情報のセットを用
意しておいてもよいし、位置および振幅の両方の補正情
報を用意しておく場合、位置の補正の種類は、サブフレ
ームをまびくまひき率に応じて種類を変えるようにして
もよい。具体的にはまびくサブフレーム数が少ない場合
には、位置の補正の種類を減らし、まびくサブフレーム
数が多い場合には、この種類を増すようにしてもよい。
このようにした方が位置の補正を良好に行なうことがで
きる。
また本実施例では、補正情報計算回路190における補
正情報の選択法として、(9)式のS/Nを最大にする
補正情報を選択していたが、これは次のようにしてもよ
い。一つの方法としては、本実施例の方法と等価である
が、補正情報によシ補正したパルスから信号を合成し、
該当するサブフレームの音声との誤差電力を計算し、こ
の誤差電力を最も小さくするような補正情報を選択する
ようにしてもよい。他の方法としては、補正情報を求め
るサブフレームでは−1パルスを求め、このパルスを最
も良好に表わす補正情報を選択するようにしてもよい。
あるいは補正情報を求めるサブフレーム内の原信号の電
力と補正したパルスから合成した信号の電力とが最も近
くなるような補正情報を選択してもよい。更にまた、補
正情報を求めるサブフレーム内の原信号の最大値とパル
スから合成した信号の最大値とが最も近くなるような補
正情報を選択してもよい。以上述べた方法は、補正情報
として振幅のみを補正する場合にも用いることができる
また以上述べた実施例では、補正情報を求めるサブフレ
ームよりも1つ過去のサブフレームのバルスに対する補
正値を補正情報として伝送していたが、例えば前後のサ
ブフレームからパルスを補間して求め、このパルスに対
する補正値を補正情報として伝送するようにしてもよい
。また補正情報を用いてパルスを補正する際に、全ての
パルスについて一様に補正を施していたが、一部のパル
ス(例えば振幅の大きなパルス)のみについて補正を施
すようにしてもよい。また補正情報のセットとして、ピ
ッチ周期に応じていくつかの異なるセラ)を用意してお
いてもよい。
また補正情報としてるらかしめ用意されているセットを
使うのではなく、1つ過去のサブフレームからのパルス
の振幅2位置の変化値を用い、この変化値を求め符号化
して伝送するようにしてもよい。またこの場合、量子化
されたパルスの振幅に対して変化値を求めるようにして
もよい。
また本実施例では、ピッチ周期に応じて分割したサブフ
レームが、次のフレームにまたがる際には、現在のフレ
ームの最後のサブフレームではパルスをあらかじめ定め
られた個数だけ新たに求め直して伝送していたが、次の
ようにしてもよい。
サブフレームが次のフレームにまたがる際には、次のフ
レームの信号を入力し、フレームt−またいでサブフレ
ームの分割を行ない、2つのフレームKまたがるサブフ
レームに対しても補正情報を求めるようにしてもよい。
また本実施例では、受信側においてパルスを復元するた
めに用いるピッチ周期P′、として、送信側で求めたピ
ッチ周期を伝送して用いる構成としたが、ピッチ周期は
伝送せずに、受信側では受信したパルス系列または過去
に合成された合成信号系列x (n)の周期性からピッ
チ周期Pd′を抽出し、これをもとにパルスを復元する
ような構成としてもよい。
尚、ディジタル信号処理の分野でよく知られているよう
に1自己相関々数はパワスペクトルから計算してもよく
、また相互相関々数はクロス・パワスペクトルから計算
してもよい。パワスペクトルと自己相関々数との対応関
係、クロスパワスペクトルと相互相関々数との対応関係
については、ニー・ブイ・オッペンハイム(A 、 V
 、 OPPEN−HEIM)氏らによる「ディジタル
信号処理(DI−GITAL  5IGNAL  PR
OCESSING)Jと題した単行本の第8章にて詳細
に説明されているので、ここでは説明を省略する。
(発明の効果) 以上説明したように、本発明によれば、数ピツチ区間の
音声’t−1ピッチ分のパルスと少ない情報量の補正情
報とで良好に表わすことが可能であるため、従来方式に
みられた欠点を改善し、伝送レイトが低い場合にも高品
質な音声を合成できるという効果がある。
【図面の簡単な説明】
第1図ta) 、 (blは本発明の一実施例の符号器
側および復号器側のブロック図、第2図(al〜、(C
)は駆動信号計算回路220における処理内容の一例を
示す波形図、第3図は第1図fa)の補正情報計算回路
440のあらかじめ用意されている補正情報のセットの
一例を示す図、第4図は従来方式の構成を示すブロック
図、第5図は音源パルスの一例を示す図、第6図は音声
信号のあるフレームにおける周波数特性と重み付は回路
の周波数特性の一例を示す特性図である。図において、
110,410・・・・・・バッファメモリ回路、12
0,420・・・・・・減算回路、250゜350.4
30・・・・・・合成フィルタ回路、200 、490
・・・・・・重み付は回路、170・・・・・・インパ
ルス応答計算回路、180・・・・・・自己相関々数計
算回路、190・・・・・・補正情報計算回路、220
・・・・・・駆動信号計算回路、240.340・・・
・・・駆動信号復元回路、130・・・・・・ピッチ分
析回路、140,480・・・・・・Kパラメータ計算
回路、150・・・・・・ピッチ符号化回路、160・
・・・・・Kパラメータ符号化回路、230・・・・・
・符号化回路、260・・・・・・マルチプレクサ、2
90・・・・・・デマルチプレクサ、300・・・・・
・パルス復号回路、310・・・・・・補正情報復号回
路、320・・・・・・ピッチ復号回路、330・・・
・・・Kパラメータ復号回路、440・・・・・・音源
パルス発生回路、450・・・・・・誤差最小化回路、
をそれぞれ示す。 y、ti Oす ?Z伝 (久J (し) (C) 一一一τ 牛古1 ¥−2釦

Claims (3)

    【特許請求の範囲】
  1. (1)送信側では、離散的な音声信号系列を入力しあら
    かじめ定められた時間間隔毎にピッチを表わすピッチパ
    ラメータと短時間スペクトル包絡を表わすスペクトルパ
    ラメータとを抽出し、前記音声信号系列を表わす駆動信
    号を前記ピッチに応じて分割した時間区間のうちの一部
    区間について求め前記一部区間以外の区間については前
    記一部区間から暫定駆動信号を求めさらに補正量を求め
    て前記音声信号系列を表わす駆動信号を推定し、前記ピ
    ッチパラメータと前記スペクトルパラメータと前記駆動
    信号と前記補正量とを組み合わせて出力し、受信側では
    、前記ピッチパラメータと前記スペクトルパラメータと
    前記駆動信号と前記補正量とを分離して駆動音源信号を
    復元し、前記音声信号系列を再生することを特徴とする
    音声信号符号化方法。
  2. (2)入力した音声信号系列からあらかじめ定められた
    時間間隔毎にピッチを表わすピッチパラメータと短時間
    スペクトル包絡を表わすスペクトルパラメータを抽出し
    て出力するパラメータ計算回路と、前記音声信号系列を
    前記ピッチに応じた時間区間に分割し前記音声信号系列
    を表わす駆動信号を前記時間区間のうちの一部区間につ
    いて求め前記一部区間以外の区間については前記一部区
    間から暫定駆動信号を求めさらに前記音声信号系列を表
    わす補正量を求め前記駆動信号を表わす符号と前記補正
    量を表わす符号とを出力する駆動信号計算回路と、前記
    パラメータ計算回路の出力符号と前記駆動信号計算回路
    の出力符号とを組み合わせて出力するマルチプレクサ回
    路とを有することを特徴とする音声信号符号化装置。
  3. (3)ピッチパラメータを表わす符号とスペクトルパラ
    メータを表わす符号と駆動信号を表わす符号と補正量を
    表わす符号とが組み合わされた符号系列を入力して分離
    し復号するデマルチプレクサ回路と、前記復号されたピ
    ッチパラメータと前記復号された駆動信号と前記復号さ
    れた補正量をもとに駆動音源信号を復元する駆動信号復
    元回路と、前記駆動音源信号と前記復号されたスペクト
    ルパラメータを用いて音声信号系列を再生し出力する合
    成フィルタ回路とを有することを特徴とする音声信号復
    号化装置。
JP59269914A 1984-12-21 1984-12-21 音声信号符号化方法とその装置 Expired - Lifetime JP2844589B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59269914A JP2844589B2 (ja) 1984-12-21 1984-12-21 音声信号符号化方法とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59269914A JP2844589B2 (ja) 1984-12-21 1984-12-21 音声信号符号化方法とその装置

Publications (2)

Publication Number Publication Date
JPS61148500A true JPS61148500A (ja) 1986-07-07
JP2844589B2 JP2844589B2 (ja) 1999-01-06

Family

ID=17478974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59269914A Expired - Lifetime JP2844589B2 (ja) 1984-12-21 1984-12-21 音声信号符号化方法とその装置

Country Status (1)

Country Link
JP (1) JP2844589B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01239597A (ja) * 1988-03-22 1989-09-25 Toshiba Corp 符号化方式及び復号化方式
JPH01314300A (ja) * 1988-06-14 1989-12-19 Nec Corp 音声符号化復号化方法とその装置
JPH0258100A (ja) * 1988-08-24 1990-02-27 Nec Corp 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH0284700A (ja) * 1988-09-21 1990-03-26 Nec Corp 音声符号化復号化装置
JPH0353300A (ja) * 1989-07-20 1991-03-07 Nec Corp 音声符号化装置
JPH03132799A (ja) * 1989-10-19 1991-06-06 Nec Corp 音声符号化方法とその装置
US6553343B1 (en) 1995-12-04 2003-04-22 Kabushiki Kaisha Toshiba Speech synthesis method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5860799A (ja) * 1981-10-06 1983-04-11 シャープ株式会社 音声デ−タの圧縮方法
JPS5911679A (ja) * 1982-07-12 1984-01-21 Hitachi Ltd 電荷転送装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5860799A (ja) * 1981-10-06 1983-04-11 シャープ株式会社 音声デ−タの圧縮方法
JPS5911679A (ja) * 1982-07-12 1984-01-21 Hitachi Ltd 電荷転送装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01239597A (ja) * 1988-03-22 1989-09-25 Toshiba Corp 符号化方式及び復号化方式
JPH01314300A (ja) * 1988-06-14 1989-12-19 Nec Corp 音声符号化復号化方法とその装置
JPH0258100A (ja) * 1988-08-24 1990-02-27 Nec Corp 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH0284700A (ja) * 1988-09-21 1990-03-26 Nec Corp 音声符号化復号化装置
JPH0353300A (ja) * 1989-07-20 1991-03-07 Nec Corp 音声符号化装置
JPH03132799A (ja) * 1989-10-19 1991-06-06 Nec Corp 音声符号化方法とその装置
US6553343B1 (en) 1995-12-04 2003-04-22 Kabushiki Kaisha Toshiba Speech synthesis method
US7184958B2 (en) 1995-12-04 2007-02-27 Kabushiki Kaisha Toshiba Speech synthesis method

Also Published As

Publication number Publication date
JP2844589B2 (ja) 1999-01-06

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
JP2707564B2 (ja) 音声符号化方式
JPS61148500A (ja) 音声信号符号化方法とその装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP3303580B2 (ja) 音声符号化装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP2946525B2 (ja) 音声符号化方式
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JPH0738116B2 (ja) マルチパルス符号化装置
JP2900431B2 (ja) 音声信号符号化装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP2658438B2 (ja) 音声符号化方法とその装置
JPH0481199B2 (ja)
JP2844590B2 (ja) 音声符号化方式とその装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JPH0632035B2 (ja) 音声符号化方法とその装置
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置
JPS6120997A (ja) 音声信号符号化方式とその装置
JPH043878B2 (ja)
JPS62133498A (ja) 音声符号化方法とその装置
JP3017747B2 (ja) 音声符号化装置
JPH034300A (ja) 音声符号化復号化方式
JPH0632030B2 (ja) 音声符号化方法
JPH0426119B2 (ja)