JPH0573097A - 低遅延符号駆動形予測符号化方法 - Google Patents

低遅延符号駆動形予測符号化方法

Info

Publication number
JPH0573097A
JPH0573097A JP3236258A JP23625891A JPH0573097A JP H0573097 A JPH0573097 A JP H0573097A JP 3236258 A JP3236258 A JP 3236258A JP 23625891 A JP23625891 A JP 23625891A JP H0573097 A JPH0573097 A JP H0573097A
Authority
JP
Japan
Prior art keywords
pitch period
frame
component
filter
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3236258A
Other languages
English (en)
Inventor
Akitoshi Kataoka
章俊 片岡
Takehiro Moriya
健弘 守谷
Kazunori Mano
一則 間野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3236258A priority Critical patent/JPH0573097A/ja
Publication of JPH0573097A publication Critical patent/JPH0573097A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 伝送路でのビット誤りに復号側で影響し難い
符号化法とする。 【構成】 過去のフレームの復号化した音声波形から線
形予測したフィルタ係数を合成フィルタに設定し、その
合成フィルタと、ピッチ周期成分と雑音成分との2種類
の励振源とを用いて、予測符号化する方法において、過
去のフレームの復号化した音声を、逆フィルタに通して
残差波形を求め、その残差波形の自己相関を求め、大き
な順に複数のピッチ周期候補Ti (i=1〜m)を得、
その各Ti について、Ti ,2Ti ,3Ti それぞれさ
かのぼった点から1フレーム分の波形を残差波形から取
出し、これら3つの波形を加算してピッチ周期成分候補
とし、このm個のピッチ周期成分候補から現フレームに
対し歪最小のものを選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は二つの励振源からそれ
ぞれ選択した励振候補を、それまでに復号した波形から
線形予測によって求めたフィルタ係数をセットした合成
フィルタを用いて決定し、その決定した励振候補を符号
化出力して少ない遅延で音声を符号化する低遅延符号駆
動形予測符号化法に関するものである。
【0002】
【従来の技術】ディジタル移動通信などの分野では、電
波の有効利用などを図るため、種々の高能率符号化法が
用いられている。8kbit/s程度の情報量で符号化
する方法としては、CELP(符号駆動形線形予測)、
VSELP(ベクトル加算駆動形線形予測)、マルチパ
ルス符号化などが知られている。これらの方式では図3
に示すように、複数サンプルの入力音声からフィルタ係
数決定部11で線形予測により予測係数を計算してフィ
ルタ係数を決定し、そのフィルタ係数を合成フィルタ1
2に設定する。A(z)は合成フィルタ12の伝達関数
である。ピッチ励振源13の複数のピッチ周期成分(励
振候補)から取り出したピッチ周期成分と、符号帳励振
源14の複数の雑音波形ベクトル(例えば乱数ベクト
ル,励振候補)から取り出した候補とをそれぞれ利得部
15,16で適当な利得を加えた後、加算して合成フィ
ルタ12に駆動信号として供給して音声を合成し、その
合成音声の入力音声に対する歪が最も小さくなるように
パワー計算部17で両励振源13,14中の各励振候補
を選び、かつ利得部15,16の各利得を設定する符号
出力部18では予測係数、ピッチ周期成分候補と符号帳
の候補とのそれぞれに対して選ばれたコード番号と各利
得などが符号として出力される。
【0003】これら従来法では、合成フィルタのフィル
タ係数を決定する予測係数は入力音声の分析によって求
める。20〜30ms程度(通常、サンプル数で128
又は256)を1フレームとして処理が行われる。この
ように符号化しようとするサンプルから予測係数を求め
る前方予測形であるため、符号化出力は少なくとも1フ
レーム分の遅れが生じる。これらの方法では、1フレー
ムが長いため、大きな遅延が生じてしまう。
【0004】現在は、パーソナル通信などの用途におい
て、音声符号化法に対しては遅延の少ない方法が求めら
れており、上記のような大きな遅延を生じる方法は望ま
しくない。低遅延の音声符号化法としては、16kbi
t/sでLD−CELP(低遅延符号駆動形線形予測)
符号化方式が知られている。この方法では次数の高い、
例えば50次の後方予測を用いている。すなわち予測係
数の算出に現在量子化しようとするフレーム内の信号を
使わずに、図3に破線で示すように符号化出力を記憶復
号部19に記憶しておき、過去の符号を復号化し、フィ
ルタ係数決定部11でこの復号音声に窓をかけ、相関関
数を経由してピッチの周期性も含めた線形予測をおこな
う。この50次の予測によってピッチ成分も同時に予測
されている。そのため、図3のピッチ励振源13と利得
部15は使用しない。過去のフレームの波形を復号し
て、その波形から合成フィルタ12のフィルタ係数を求
め、その合成フィルタ12を用いて、符号帳励振源14
中の形状ベクトル(雑音成分)候補を求め、その符号を
伝送する。
【0005】この方法では符号器と復号器との双方で過
去に復号化された音声は共通に利用できるので、予測係
数の情報を伝送する必要がない。従って1フレーム当り
のサンプル数が少なく、例えば5〜10サンプル数とす
ることができ、フレーム長を短くすることができ、遅延
の少ない符号化が実現されている。しかし、LD−CE
LPは現在のフレームの予測を過去の復号化された系列
のみから行うので、予測誤差が従来の前方予測形に比べ
て大きい。そのため、8kbit/s程度の符号化では
急激に波形歪が増大し、品質が低下する。そのため、8
kbit/s程度の情報量で、低遅延での音声符号化を
実現するため、LD−CELPのようにピッチの周期性
を線形予測に含めるのではなく、ピッチ周期成分も復号
化された音声から抽出する手法が提案されている。これ
らの手法はLD−CELPと同様に、過去のフレームの
波形の復号波形から合成フィルタのフィルタ係数を求
め、この合成フィルタを用いて、ピッチ励振源中のピッ
チ周期成分の候補を求めると共に、符号帳励振源中の形
状ベクトル(雑音成分)候補を求め、これら求めた両候
補の符号を伝送する。つまり、図4Aに示すように、記
憶復号部19で過去に復号化し、その復号音声波形を、
合成フィルタ12のフィルタ係数をセットした逆フィル
タ21に通して、残差波形を得る。この残差波形を相関
器22を通して自己相関を計算し、選択部23で最長ピ
ッチ周期の存在区間内で相関値の高い順に音声の周期の
候補Ti {i=1〜m}を得る。mは候補の数。図4B
に示すように、これら各候補ピッチ周期Ti {i=1〜
m}が現在から過去にさかのぼった位置から、過去の復
号した音声の残差波形を1フレーム分切り出して、ピッ
チ周期成分の候補とする。これらm個のピッチ周期成分
の候補をピッチ励振源13の候補とし、これと、符号帳
励振源14の雑音成分とから合成フィルタ12を用いて
音声を合成して、入力音声との歪が最も小さい1つのピ
ッチ周期成分と1つの雑音成分とを選ぶ。
【0006】
【発明が解決しようとする課題】ただ、これらの手法は
伝送路にビット誤りのない時には非常に良い品質が得ら
れるが、伝送路での誤りの発生を考慮していないため、
伝送した符号が過った場合には、復号器での復号音声が
本来復号されるべきものとは異なり、復号音声の品質が
大きく低下する。特にピッチ周期成分は過去の復号音声
に基づいて処理されるため、以後、伝送路でビット誤り
が発生しなくとも、1度起こったビット誤りの影響が次
のフレーム、さらに次のフレームに拡がっていくと言う
問題があった。
【0007】この発明の目的は、過去の復号化された音
声から予測して、次のフレームを処理する低遅延で音声
を予測符号化する方法において、伝送路でビット誤りが
発生しても、その影響を少なくし、良い品質の音声を復
号することを可能とする符号化方法を提供することにあ
る。
【0008】
【課題を解決するための手段】この発明は、前記LD−
CELPの改良法と同様に過去のフレーム波形の復波形
から合成フィルタのフィルタ係数を求め、その合成フィ
ルタを用いて、ピッチ励振源中のピッチ周期成分の候補
と符号帳励振源中の雑音成分の候補を求めるが、この発
明では複数のピッチ周期の候補のそれぞれについて、過
去のフレームの残差波形又は過去のフレームの励振信号
からそのピッチ周期ずつ順次ずれた部分の波形を複数取
出して重ね合せて、それぞれピッチ周期成分候補とし、
これをピッチ励振源に入れる。
【0009】
【実施例】この発明はLD−CELPでピッチ励振源を
用い、そのビッチ励振源のピッチ周期成分候補の作成に
特徴がある。そのピッチ周期成分候補の作成の例を以下
に示す。図4Aについて述べたようにして複数のピッチ
候補Ti (i=1〜m)を得る。その相関値の一番高い
周期をT1 とすると、音声は周期T1 で繰り返している
確率が高いので、図1に示すように残差波形X(n)よ
り現在からT1 前の時点から現在側に1フレーム分を切
り出してX(n−T1 )とし、同様に2T1 前にさかの
ぼった1フレーム分の波形X(n−2T1 )、さらに3
1 前にさかのぼった1フレーム分の波形X(n−3T
1 )を切り出し、これらを加算平均してピッチ成分候補
1 (n)とする。つまり、Y1 (n)は次式で表現さ
れる。 Y1 (n)={X(n−T1 )+X(n−2T1 )+X(n−3T1 )}/3 Y1 (n)は最初のピッチ成分候補とする。
【0010】相関値が2番目に高いピッチ周期候補T2
についても同様の処理を行いピッチ成分候補Y2 (n)
を求める。同様にして各ピッチ周期候補Ti {i=1〜
m}について求めたこれらのピッチ周期成分各候補Yi
(n){i=1〜m}を図3中のピッチ励振源13の各
候補としてその中から、合成フィルタを用いて音声を合
成して、入力音声との歪が最も少ないものを選ぶ。な
お、1フレームはピッチ周期の最短のものと同程度乃至
それ以下の長さとされる。
【0011】このように複数の波形を組み合わせること
で、例えば、n−Ti 付近の波形に誤りがあっても、波
形X(n−2Ti )とX(n−3Ti )によって誤りに
よって歪んだ波形X(n−T1 )の影響を小さくするこ
とができ、伝送路の誤りに対して強くできる。上述例で
はピッチ周期ずつずらして取出した複数の波形を同一重
みで加算したが、各波形に重み付けを行って加算しても
よい。その重み係数として相関係数を用いた場合例を次
に説明する。
【0012】図2に示すように現フレームから過去の複
数フレーム以上の区間の残差波形Z(n)と、このZ
(n)に対し、ピッチ周期候補T1 だけ過去の同一区間
長の残差波形XX1 (n)、更にT1 だけ過去の同一区
間長の残差波形XX2 (n)、及び更にT1 だけ過去の
同一区間長の残差波形XX3 (n)との各相関値の絶対
値cori を計算する。この相関値は現フレームに対し
てTi ,2Ti ,3Ti 離れた波形との相関の強さを表
している。
【0013】 cori =|(XXi ,Z)/(√Pxi・√PZ )| (XX,Z)はXXとZの内積、PxiはXXi (n)の
パワ、PZ はZ(n)のパワ、相関値の計算を1フレー
ムより長い範囲で計算しているため、もしその区間に誤
りが発生していても、その影響が小さくてすむ。
【0014】この値cori を用いて図1と同様に各ピ
ッチ周期候補についてピッチ周期ずつずれて取出した波
形に対し、次式のような重み付けを行って、ピッチ周期
成分候補Yi (n)を得る。 Yi (n)={cor1 ・X(n−Ti )+cor2 ・X(n−2Ti ) +cor3 ・X(n−3Ti )}/(cor1 +cor2 +cor3 ) 音声は時間と共に変化するので、過去の波形をそのまま
足し合わせるのではなく、重み付けをして足し合わせる
ことで、相関の高い波形の割合を大きく、相関の低い波
形はその割合を小さくすることができる。このように重
み付けを行うことで、伝送路誤りに強くて、良い品質の
音声が得られる。
【0015】このようにして得られたピッチ周期成分候
補のピッチ励振源と、符号帳励振源と、過去の復号音声
から線形予測したフィルタ係数の合成フィルタとを用
い、現フレーム音声に対し、歪が最小となるピッチ周期
成分と雑音符号とを選択することは従来と同一である。
上述で過去の残差波形から取出す数は3に限らない。残
差波形の代りに合成フィルタの励振信号の過去のものを
同様に用いてもよい。
【0016】
【発明の効果】以上述べたようにこの発明によれば、ピ
ッチ周期成分候補をピッチ周期順次ずれた複数の波形に
よって合成して求めるため、伝送路においてビット誤り
が発生しても、他の誤りのない過去の波形も用いられる
ため、誤りの影響を小さくすることができ、ビット誤り
に対するロバストネス(耐性)が向上する。
【図面の簡単な説明】
【図1】この発明の要部であるピッチ周期成分候補の作
成法を示す図。
【図2】この発明の要部であるピッチ周期成分候補の作
成法の他の例を示す図。
【図3】予測符号化の構成を示すブロック図。
【図4】Aはピッチ周期の検出の構成例を示すブロック
図、Bは従来のピッチ周期成分候補の切り出し方法を示
す図である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を最短ピッチ周期と同程度以下
    の短いサンプル数を1フレームとして、合成フィルタの
    フィルタ係数を、1フレーム前までに復号化した音声波
    形から線形予測して設定し、 ピッチ周期成分と、雑音成分との2種類の励振源と上記
    合成フィルタとを用いて予測符号化する符号化方法にお
    いて、 複数のピッチ周期の候補のそれぞれについて、過去のフ
    レームの符号から合成した音声を逆フィルタに通した残
    差波形、又は過去のフレームの励振信号からそのピッチ
    周期ずつ順次ずれた部分の波形を複数取出して重ね合せ
    てそれぞれピッチ周期成分候補を作り、 これらピッチ周期成分候補の中から現在のフレームに最
    も合う候補を選択して上記ピッチ周期成分とすることを
    特徴とする低遅延符号駆動形予測符号化方法。
JP3236258A 1991-09-17 1991-09-17 低遅延符号駆動形予測符号化方法 Pending JPH0573097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3236258A JPH0573097A (ja) 1991-09-17 1991-09-17 低遅延符号駆動形予測符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3236258A JPH0573097A (ja) 1991-09-17 1991-09-17 低遅延符号駆動形予測符号化方法

Publications (1)

Publication Number Publication Date
JPH0573097A true JPH0573097A (ja) 1993-03-26

Family

ID=16998118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3236258A Pending JPH0573097A (ja) 1991-09-17 1991-09-17 低遅延符号駆動形予測符号化方法

Country Status (1)

Country Link
JP (1) JPH0573097A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002043052A1 (en) * 2000-11-27 2002-05-30 Nippon Telegraph And Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
KR100409166B1 (ko) * 1998-09-11 2003-12-12 모토로라 인코포레이티드 지연 윤곽 조정을 사용하여 정보 신호를 코딩하는 방법 및장치
WO2006016439A1 (ja) * 2004-08-12 2006-02-16 Oki Electric Industry Co., Ltd. 消失補償装置、消失補償方法、および消失補償プログラム
KR100538985B1 (ko) * 1996-09-27 2006-03-23 소니 가부시끼 가이샤 음성부호화방법및장치와피치검출방법및장치
US7373298B2 (en) 2003-09-17 2008-05-13 Matsushita Electric Industrial Co., Ltd. Apparatus and method for coding excitation signal

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100538985B1 (ko) * 1996-09-27 2006-03-23 소니 가부시끼 가이샤 음성부호화방법및장치와피치검출방법및장치
KR100409166B1 (ko) * 1998-09-11 2003-12-12 모토로라 인코포레이티드 지연 윤곽 조정을 사용하여 정보 신호를 코딩하는 방법 및장치
WO2002043052A1 (en) * 2000-11-27 2002-05-30 Nippon Telegraph And Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US7065338B2 (en) 2000-11-27 2006-06-20 Nippon Telegraph And Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US7373298B2 (en) 2003-09-17 2008-05-13 Matsushita Electric Industrial Co., Ltd. Apparatus and method for coding excitation signal
WO2006016439A1 (ja) * 2004-08-12 2006-02-16 Oki Electric Industry Co., Ltd. 消失補償装置、消失補償方法、および消失補償プログラム
GB2435749A (en) * 2004-08-12 2007-09-05 Oki Electric Ind Co Ltd Loss compensation device, loss compensation method, and loss compensation program
CN100445716C (zh) * 2004-08-12 2008-12-24 冲电气工业株式会社 消失补偿装置和消失补偿方法
GB2435749B (en) * 2004-08-12 2009-02-18 Oki Electric Ind Co Ltd Loss compensation device, loss compensation method, and loss compensation program
US7793202B2 (en) 2004-08-12 2010-09-07 Oki Electric Industry Co., Ltd. Loss compensation device, loss compensation method and loss compensation program

Similar Documents

Publication Publication Date Title
US7774200B2 (en) Method and apparatus for transmitting an encoded speech signal
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
US6978235B1 (en) Speech coding apparatus and speech decoding apparatus
WO1998006091A1 (fr) Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
US5659659A (en) Speech compressor using trellis encoding and linear prediction
US6804639B1 (en) Celp voice encoder
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP4550176B2 (ja) 音声符号化方法
EP0557940A2 (en) Speech coding system
JPH0573097A (ja) 低遅延符号駆動形予測符号化方法
JP2658816B2 (ja) 音声のピッチ符号化装置
US6973424B1 (en) Voice coder
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
US6856955B1 (en) Voice encoding/decoding device
JP3299099B2 (ja) 音声符号化装置
JP4510977B2 (ja) 音声符号化方法および音声復号化方法とその装置
JP3249144B2 (ja) 音声符号化装置
JP2000298500A (ja) 音声符号化方法
CN1327410C (zh) 语音编解码方法之间的代码转换方法及装置
JP3226180B2 (ja) 音声のピッチ周期符号化法
JP3099836B2 (ja) 音声の励振周期符号化方法
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP3471542B2 (ja) 音声符号化装置
JPH04115300A (ja) 音声のピッチ予測符号化法
JP3270146B2 (ja) 音声符号化装置