JPH05315968A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH05315968A
JPH05315968A JP4119314A JP11931492A JPH05315968A JP H05315968 A JPH05315968 A JP H05315968A JP 4119314 A JP4119314 A JP 4119314A JP 11931492 A JP11931492 A JP 11931492A JP H05315968 A JPH05315968 A JP H05315968A
Authority
JP
Japan
Prior art keywords
sound source
outputs
weighted
subframe
driving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4119314A
Other languages
English (en)
Inventor
Koji Yoshida
田 幸 司 吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4119314A priority Critical patent/JPH05315968A/ja
Publication of JPH05315968A publication Critical patent/JPH05315968A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 高品質な音声を得ることができる音声符号化
装置の提供。 【構成】 聴感重み付けフィルタ11により一定区間の
入力音声の聴感重み付けを行ない重み付き入力音声を生
成する。次に適応コードブック12と確率的コードブッ
ク13から駆動音源生成器14により駆動音源を生成
し、聴感重み付き合成フィルタ15により聴感重み付き
音声を合成する。そして歪最小化器16により重み付き
入力音声に対する重み付き合成音声の誤差の二乗和を計
算し、それを最小とする長期予測遅延、確率的コードブ
ックのインデクスおよびそれぞれのゲインを複数候補決
定し、それらの駆動音源符号および最小歪を出力し、そ
れらとそれらを1サブフレーム遅延器17で遅延させた
ものとを入力して、駆動音源符号決定器18により前サ
ブフレームおよび現サブフレームの最小歪の和を最小に
するような前サブフレーム駆動音源符号を決定し出力す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル通信、ボイ
スメール等に利用される音声符号化装置に関する。
【0002】
【従来の技術】近年、4.8〜8.0kb/s程度の低
ビットレートにおける音声符号化装置は、図2に示すよ
うなCELP(Code Excited Linear Prediction)または
SELP(Stochastically Excited Linear Prediction)
音声符号化装置が広く用いられている。この一例が「W.
B.Kleijn et al. “IMPROVED SPEECH QUALITY AND EFFI
CIENT VECTOR QUANTIZATION IN SELP ”Proc. ICASSP,P
155 〜P158,1988 」に記載されている。
【0003】以下、従来の音声符号化装置の一例につい
て図2を参照して説明する。図2において、21は入力
音声の聴感重み付けを行なう聴感重み付けフィルタであ
り、重み付き入力音声を出力する。22は過去の駆動音
源を蓄えてある適応コードブックであり、23は複数の
雑音音源を予め保持してある確率的コードブックであ
る。24は適応コードブック22と確率的コードブック
23に基づいて駆動音源信号を生成する駆動音源生成
器、25は駆動音源を入力として聴感重み付き合成音声
を生成する聴感重み付き合成フィルタである。26は重
み付き入力音声に対する重み付き合成音声の2乗誤差を
計算し、これが最小となるような長期予測遅延、長期予
測ゲイン、確率的コードブック内のベクトルインデクス
およびそのベクトルに乗ずるゲインのそれぞれの符号を
出力する歪最小化器である。
【0004】以上のように構成された音声符号化装置に
おいて、以下のその動作について説明する。まず、聴感
重み付けフィルタ21で重み付き入力音声v[n](n
は信号の時系列サンプル番号)を求める。CELP符号
化装置は、聴感重み付き合成フィルタ25でこれに最も
近い重み付き合成音声を生成するような駆動音源e
[n]を、駆動音源生成器24が適用コードブック22
および確率的コードブック23から生成し、これをサブ
フレーム(音声を一定単位の時間で区切った単位である
フレームをさらに時分割した区間)単位で歪最小化器2
6により符号化するものである。ここで、駆動音源e
[n]は、下記式(1)のように、適応コードブック2
2の出力である長期予測信号aL [n]と確率的コード
ブック23内の雑音ベクトルCI [n]からなる。
【0005】 e[n]=β・aL [n]+γ・CI [n] ・・・(1)
【0006】ただし、Lは適応コードブック22に蓄え
られた過去の駆動信号をどれだけ遡るかを示す長期予測
遅延、Iは確率的コードブック23内のI番目のベクト
ルを示すインデクス、βは長期予測信号aL [n]に乗
ずるゲイン(長期予測ゲイン)、γは雑音ベクトルCI
[n]に乗ずるゲインである。
【0007】実際には、両成分を同時に決定するのは困
難であり、通常、適応コードブックから長期予測成分β
・aL [n]のみをまず歪最小化により決定し(これを
適応コードブック探索という。)、長期予測遅延Lと最
適長期予測ゲインβの符号を出力する。次に、残りの歪
が最小となるように確率的コードブック23により歪最
小化し(これを確率的コードブック探索という。)、選
ばれた確率的コードブック23内ベクトルのインデクス
Iとそのベクトルに乗ずるゲインγの符号を出力する。
【0008】
【発明が解決しようとする課題】しかしながら、上記の
従来の音声符号化装置では、音源符号をサブフレーム単
位で決定しているため、音源符号決定の際に次サブフレ
ームへの影響が考慮されておらず、特に4.8kb/s
程度以下の低ビットレートでは復号音声品質の劣化が大
きくなるという問題点を有していた。
【0009】本発明は、上記従来の問題を解決するもの
であり、2サブフレームにわたり音源符号を最適に決定
することにより、音声品質を向上させることができる優
れた音声符号化装置を提供するものである。
【0010】
【課題を解決するための手段】本発明は、上記目的を達
成するために、従来の音声符号化装置に、2サブフレー
ムにわたる歪最小化による音源符号化を行なう駆動音源
符号決定器および前サブフレームの駆動音源符号および
音源符号化最小歪を得るための1サブフレーム遅延器を
設け、2サブフレームにわたり音源符号を最適に決定す
ることにより音声品質を向上させるようにしたものであ
る。
【0011】
【作用】したがって、本発明によれば、駆動音源符号決
定器により前サブフレームおよび現サブフレームの音源
符号化最小歪の和を最小にするように前サブフレーム音
源符号を決定することにより、2サブフレームにわたる
最適な音源符号化を行なうことができ、復号音声品質を
向上させることができるという効果を有する。
【0012】
【実施例】図1は本発明の一実施例の構成を示すもので
ある。図1において、11は入力音声の聴感重み付けを
行なう聴感重み付けフィルタ、12は過去の駆動音源を
蓄える適応コードブック、13は複数の雑音音源を予め
保持している確率的コードブック、14は適応コードブ
ック12と確率的コードブック13から駆動音源信号を
生成する駆動音源生成器、15は駆動音源を入力として
聴感重み付き合成音声を生成する聴感重み付き合成フィ
ルタ、16は重み付き入力音声に対する重み付き合成音
声の2乗誤差を計算し、これが最小となるような音源符
号(長期予測遅延、長期予測ゲイン、確率的コードブッ
ク内のベクトルインデクスおよびそのベクトルに乗ずる
ゲインのそれぞれの符号)およびその際の最小歪(2乗
誤差)を出力する歪最小化器、17はこの歪最小化器1
6の出力を1サブフレーム遅延させる1サブフレーム遅
延器、18は2サブフレーム間の音源最適符号化により
前サブフレームの駆動音源信号を決定して出力する駆動
音源符号決定器である。
【0013】次に上記実施例の動作について説明する。
まず、聴感重み付けフィルタ11で聴感重み付き入力音
声v[n](nは信号の時系列サンプル番号)を求め、
以後聴感重み付き合成フィルタ25でこれに最も近い重
み付き合成音声を生成する駆動音源e[n]を、駆動音
源生成器14が適用コードブック12および確率的コー
ドブック13から生成し、これを歪最小化器16により
サブフレーム単位で歪最小化により符号化し、駆動音源
符号とその最小歪を出力する。ここで、駆動音源e
[n]は、下記式(2)のように、適応コードブック1
2の出力である長期予測信号aL [n]と確率的コード
ブック13内の雑音ベクトルCI [n]との和からな
る。
【0014】 e[n]=β・aL [n]+γ・CI [n] ・・・(2)
【0015】ただし、Lは適応コードブック12に蓄え
られた過去の駆動信号をどれだけ遡るかを示す長期予測
遅延、Iは確率的コードブック13内のI番目のベクト
ルを示すインデクス、βは長期予測信号aL [n]に乗
ずるゲイン(長期予測ゲイン)、γは雑音ベクトルCI
[n]に乗ずるゲインである。
【0016】歪最小化器16によるサブフレーム単位の
歪最小化後、その出力を1サブフレーム遅延器17によ
り1サブフレームだけ遅延させ、駆動音源符号決定器1
8により前サブフレームと現サブフレームの2サブフレ
ームにわたる歪最小化による音源符号化を行なう。ま
ず、サブフレーム内での駆動音源候補を抽出する。上記
式(2)の長期予測成分β・aL [n]に対する聴感重
み付き合成音声の歪最小化により、長期予測成分の候補
音源パラメータ(長期予測遅延Lij、長期予測ゲインβ
ij:i,j=1,2)を決定する。ここで、この長期予
測成分の音源パラメータ(Lij,βij)は前サブフレー
ムで候補として決定された第1および第2候補音源をそ
れぞれ(i=1,2:適応コードブックは各々の候補音
源に対して予め更新されている。)に対して、各々2候
補の音源(j=1,2)を求めておく。
【0017】次に、決定された長期予測成分の候補音源
パラメータ(Lij,βij)それぞれに対して、今度は、
確率的コードブック13を用いて雑音音源成分γ・CI
[n]の候補音源パラメータ(確率的コードブック内の
ベクトルインデクスIij、そのベクトルに乗ずるゲイン
γij:i=1,2、j=1,2)を決定し、各候補音源
の符号化最小歪Eij(i,j=1,2)を求める。以上
のサブフレーム内の駆動音源候補の抽出後、駆動音源符
号決定器18による2サブフレーム間にわたる歪最小化
により前サブフレームの駆動音源符号を決定する。駆動
音源符号の決定は、2サブフレームの符号化最小歪の
和、 ERi =EpiI+Eil (i=1,2) (但し、Epi:前サブフレーム第i候補音源に対する符
号化最小歪)を最小にする前サブフレームの第i候補音
源(Lpi,βpi,Ipi,γpi,i=1,2)を前サブフ
レーム音源として決定し、それらの符号を出力する。
【0018】このように、上記実施例によれば、1サブ
フレーム遅延器17により歪最小化器16の出力を1サ
ブフレーム遅延させた後、駆動音源符号決定器18によ
り前サブフレームおよび現サブフレームの音源符号化最
小歪の和を最小にするように前サブフレーム音源符号を
決定することにより、2サブフレームにわたる最適な音
源符号化を行なうことができ、復号音声品質を向上させ
ることができる。
【0019】なお、上記実施例において、現サブフレー
ムの音源候補を前サブフレーム音源候補それぞれに対し
て2候補ずつ求めているが、駆動音源符号決定器18に
よる前サブフレーム音源符号決定前では、第1候補音源
(Li1,βi1,Ii1,γi1:i=1,2)のみを求め
て、前サブフレーム音源符号決定後に決定された前サブ
フレーム音源(Lpi,βpi,Ipi,γpi)に対しての
み、第2候補音源(Li2,βi2,Ii2,γi2)を求めて
もよい。これにより、候補音源抽出のための演算量を減
少させることができる。
【0020】また、上記実施例では音源候補を2候補と
しているが、2以上の複数候補による符号化を行なうこ
とも可能である。
【0021】さらにまた、上記実施例では、音源のコー
ドブックとして適応コードブック12および確率的コー
ドブック13を備えているが、これらに加えて、周期間
隔のパルス音源を生成するパルス音源生成器と、確率的
コードブックまたはパルス音源生成器から生成された音
源のいずれかを選択する音源切替器とを備え、確率的コ
ードブックからの雑音音源とパルス音源生成器からの周
期パルス音源のいずれかを切り替えて使用するようにし
てもよい。
【0022】
【発明の効果】本発明は、上記実施例から明らかなよう
に、従来の音源符号化装置に1サブフレーム遅延器およ
び駆動音源符号決定器を設けたものであり、駆動音源符
号決定器により前サブフレームおよび現サブフレームの
音源符号化最小歪の和を最小にするように前サブフレー
ム音源符号を決定することにより、2サブフレームにわ
たる最適な音源符号化を行なうことができ、復号音声品
質を向上させることができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施例における音声符号化装置の構
成を示すブロック図
【図2】従来の音声符号化装置の構成を示すブロック図
【符号の説明】
11 聴感重み付けフィルタ 12 適応コードブック 13 確率的コードブック 14 駆動音源生成器 15 聴感重み付き合成フィルタ 16 歪最小化器 17 1サブフレーム遅延器 18 駆動音源符号決定器

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 フレーム単位の入力音声の聴感重み付け
    を行なって重み付け入力音声を生成する聴感重み付けフ
    ィルタと、過去の駆動音源を蓄える適応コードブック
    と、複数の雑音音源を予め格納する確率的コードブック
    と、前記適応コードブックおよび確率的コードブックの
    出力をもとにして駆動音源を生成する駆動音源生成器
    と、前記駆動音源生成器で生成した駆動音源を入力とし
    て聴感重み付き音声を合成する聴感重み付き合成フィル
    タと、前記重み付き入力音声に対する重み付き合成音声
    の誤差の二乗和を最小とする長期予測遅延、長期予測ゲ
    イン、確率的コードブック内のベクトルインデクスおよ
    びそのベクトルに乗ずるゲインを複数候補決定してこれ
    ら駆動音源符号および最小歪を出力する歪最小化器と、
    前記歪最小化器の出力を1サブフレーム遅延させる遅延
    器と、前記歪最小化器および遅延器の出力をもとにして
    前サブフレームおよび現サブフレームの最小歪の和を最
    小にしうる前サブフレーム駆動音源符号を出力する駆動
    音源符号決定器とを備えた音声符号化装置。
  2. 【請求項2】 周期間隔のパルス音源を生成するパルス
    音源生成器と、確率的コードブックと前記パルス音源生
    成器から生成された音源のいずれかを選択する音源切替
    器とを備えた請求項1記載の音声符号化装置。
JP4119314A 1992-05-12 1992-05-12 音声符号化装置 Pending JPH05315968A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4119314A JPH05315968A (ja) 1992-05-12 1992-05-12 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4119314A JPH05315968A (ja) 1992-05-12 1992-05-12 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH05315968A true JPH05315968A (ja) 1993-11-26

Family

ID=14758380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4119314A Pending JPH05315968A (ja) 1992-05-12 1992-05-12 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH05315968A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214350A (ja) * 1996-02-01 1997-08-15 Matsushita Electric Ind Co Ltd ベクトル量子化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214350A (ja) * 1996-02-01 1997-08-15 Matsushita Electric Ind Co Ltd ベクトル量子化方法

Similar Documents

Publication Publication Date Title
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
JP3196595B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPH0353300A (ja) 音声符号化装置
JP3143956B2 (ja) 音声パラメータ符号化方式
JPH04270400A (ja) 音声符号化方式
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH0944195A (ja) 音声符号化装置
JP3095133B2 (ja) 音響信号符号化方法
JP3179291B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH05315968A (ja) 音声符号化装置
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3232701B2 (ja) 音声符号化方法
JP3089967B2 (ja) 音声符号化装置
JPH08185199A (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3192051B2 (ja) 音声符号化装置
JPH1069297A (ja) 音声符号化装置