JP3028886B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3028886B2
JP3028886B2 JP4292944A JP29294492A JP3028886B2 JP 3028886 B2 JP3028886 B2 JP 3028886B2 JP 4292944 A JP4292944 A JP 4292944A JP 29294492 A JP29294492 A JP 29294492A JP 3028886 B2 JP3028886 B2 JP 3028886B2
Authority
JP
Japan
Prior art keywords
sound source
pulse
codebook
generator
source generator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4292944A
Other languages
English (en)
Other versions
JPH06138898A (ja
Inventor
田 幸 司 吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP4292944A priority Critical patent/JP3028886B2/ja
Publication of JPH06138898A publication Critical patent/JPH06138898A/ja
Application granted granted Critical
Publication of JP3028886B2 publication Critical patent/JP3028886B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル通信やボイ
スメール等に利用される音声符号化装置に関するもので
ある。
【0002】
【従来の技術】近年、4.8kb/sから8.0kb/
s程度の低ビットレートにおける音声符号化装置とし
て、、図2に示すようなCELP(Code Excited L
inear Prediction corder)音声符号化装置が広く用い
られている。
【0003】以下、従来の音声符号化装置について図2
を参照して説明する。図2において、31は入力音声の
聴覚重み付けを行なう聴覚重み付けフィルタであり、重
み付き入力音声を出力する。32は適応コードブックで
あり、過去の駆動音源を蓄えている。33は確率的コー
ドブックであり、複数の雑音音源を予め保持している。
34は駆動音源生成器であり、適応コードブック32と
確率的コードブック33から駆動音源信号を生成する。
35は重み付き合成フィルタであり、駆動音源生成器3
4で生成された駆動音源を入力として重み付き合成音声
を生成する。36は歪最小化器であり、重み付き入力音
声に対する重み付き合成音声の歪を計算し、この歪が最
も小さくなるように、適応コードブック32の出力であ
る長期予測遅延とゲイン、確率的コードブック33の中
の代表ベクトルとゲインを決定する。
【0004】以上のように構成された音声符号化装置に
ついて、以下その動作を説明する。まず、聴覚重み付け
フィルタ31で重み付き入力音声v[n]を求める。C
ELP音声符号化装置は、これに最も近い重み付き合成
音声を生成するような駆動音源e[n]を符号化するも
のである。ここで、駆動音源e[n]は、次式に示すよ
うに、適応コードブック32の出力である長期予測信号
a[n−L]と確率的コードブック33の中のベクトル
I [n]からなる。 e[n]=β・a[n−L]+γ・CI [n] ……(1)
【0005】実際には、両成分を同時に決定するのは困
難であり、通常、適応コードブック32から長期予測成
分のみをまず歪最小化器36により決定し(適応コード
ブック探索)、過去の駆動信号をどれだけ溯るかを示す
長期予測遅延Lと最適ゲインβとを出力する。次に、残
りの歪が最小となるように確率的コードブック33によ
り歪最小化し(確率的コードブック探索)、選ばれたコ
ードベクトルの番号Iと最適ゲインγとを出力する。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化装置では、4.8kb/s程度以下の低
ビットレートでは、駆動音源信号の生成の性能が下がる
に伴い、その過去の駆動音源信号を蓄えた適応コードブ
ックからの長期予測成分の生成にも性能の劣化が生じ、
特にパルス性のピッチ周期音源を持つ有声音部で顕著な
音声品質の劣化が生じるという問題を有していた。
【0007】本発明は、上記従来の問題を解決するもの
で、低ビットレートでも、パルス性のピッチ周期音源を
持つ有声音部での音声品質の劣化を抑えた優れた音声符
号化装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明は、上記目的を達
成するために、一定区間の入力音声の聴覚重み付けを行
ない、重み付き入力音声を生成する聴覚重み付けフィル
タと、入力音声からピッチ周期を求めるピッチ抽出器
と、過去の駆動音源を蓄える適応コードブックと、ピッ
チ抽出器から得られたピッチ周期を用いてパルス列音源
を生成する第1のパルス音源生成器と、複数の雑音音源
を予め格納する第1の確率的コードブックと、第1のパ
ルス音源生成器または第1の確率的コードブックから生
成された音源のいずれかを選択する第1の音源切り替え
器と、第1のパルス音源生成器または第1の確率的コー
ドブックのいずれかから選択された音源と適応コードブ
ックの出力とから駆動音源を生成する第1の駆動音源生
成器と、ピッチ抽出器から得られたピッチ周期を用いて
パルス列音源を生成する第2のパルス音源生成器と、複
数の雑音音源を予め格納する第2の確率的コードブック
と、第2のパルス音源生成器および第2の確率的コード
ブックから駆動音源を生成する第2の駆動音源生成器
と、第1の駆動音源生成器または第2の駆動音源生成器
のいずれかの出力を選択する第2の音源切り替え器と、
第2の音源切り替え器を通して得られた駆動音源から音
声を合成する重み付き合成フィルタと、重み付き入力音
声に対する重み付き合成音声の誤差の二乗和を計算し、
それを最小とするような音源の組み合わせおよび各音源
のインデクスとゲインを決定してそれらの符号を出力す
る歪最小化器とを備えたものである。
【0009】
【作用】したがって、本発明によれば、従来の適応コー
ドブックと確率的コードブックという音源構成に加え、
適応コードブックとパルス音源、またはパルス音源と確
率的コードブックという音源構成を設け、それらの3種
類の音源構成のうちいずれか最適な音源構成により音源
を決定するようにしたので、入力音声の音源信号をより
正確に表現することができ、低ビットレートでも音声品
質の劣化を抑えた符号化を行なうことができる。
【0010】
【実施例】図1は本発明の一実施例の構成を示すもので
ある。図1において、11は一定区間の入力音声の聴覚
重み付けを行ない、重み付き入力音声を生成する聴覚重
み付けフィルタ、12は入力音声からピッチ周期を求め
るピッチ抽出器、13は過去の駆動音源を蓄える適応コ
ードブック、14はピッチ抽出器12から得られたピッ
チ周期を用いてパルス列音源を生成する第1のパルス音
源生成器、15は複数の雑音音源を予め格納する第1の
確率的コードブック、16は第1のパルス音源生成器1
4または第1の確率的コードブック15から生成された
音源のいずれかを選択する第1の音源切り替え器、17
は第1の音源切り替え器16を通して得られた第1のパ
ルス音源生成器14または第1の確率的コードブック1
5のいずれかの音源と適応コードブック13の出力とか
ら駆動音源を生成する第1の駆動音源生成器、18はピ
ッチ抽出器12から得られたピッチ周期を用いてパルス
列音源を生成する第2のパルス音源生成器、19は複数
の雑音音源を予め格納する第2の確率的コードブック、
20は第2のパルス音源生成器18および第2の確率的
コードブック19から駆動音源を生成する第2の駆動音
源生成器、21は第1の駆動音源生成器17または第2
の駆動音源生成器20のいずれかの出力を選択する第2
の音源切り替え器、22は第2の音源切り替え器21を
通して得られた駆動音源から音声を合成する重み付き合
成フィルタ、23は重み付き入力音声に対する重み付き
合成音声の誤差の二乗和を計算し、それを最小とするよ
うな音源の組み合わせおよび各音源のインデクスとゲイ
ンを決定してそれらの符号を出力する歪最小化器であ
る。
【0011】次に上記実施例の動作について説明する。
まず、聴覚重み付けフィルタ11で重み付き入力音声v
[n]を求め、以後これに最も近い重み付き合成音声を
生成する駆動音源e[n]を符号化する。ここで、駆動
音源e[n]は、第2の音源切り替え器21を通して得
られ、これは以下の3種類の音源構成のいずれかで表わ
される。
【0012】構成(1):適応コードブック13+第1
の確率的コードブック15 この構成は、第1の音源切り替え器16をa1側に、第
2の音源切り替え器21をa2側に切り替えることによ
って得られ、駆動音源e[n]は次式で表わされる。 e[n]=β・b[n−L]+γN1・c1 I [n] ……(2) ここで、b[n−L]は適応コードブック13の出力、
Lは過去の駆動信号のどの部分を用いるかを示す長期予
測遅延、c1 I [n]は第1の確率的コードブック15
の出力、β、γN1はそれぞれのゲインである。
【0013】構成(2):適応コードブック13+第1
のパルス音源生成器14 この構成は、第1の音源切り替え器16をb1側に、第
2の音源切り替え器21をa2側に切り替えることによ
って得られ、駆動音源e[n]は次式(3)で表わされ
る。 e[n]=β・b[n−L]+γP1・p1M1 [n] ……(3) ここで、p1M1[n]は第1のパルス音源生成器14の
出力で、位置M1からピッチ抽出器12から得られたピッ
チ周期(T)間隔で単位インパルスが立つパルス列音
源、γP1はそのゲインである。
【0014】構成(3):第2のパルス音源生成器18
+第2の確率的コードブック19 この構成は、第2の音源切り替え器21をb2側に切り
替えることによって得られ、駆動音源e[n]は次式
(4)で表わされる。 e[n]=γP2・p2M2 [n]+γN2・c2 I [n] ……(4) ここで、 p2M2 [n]は第2のパルス音源生成器18の
出力で、位置M2からピッチ抽出器12から得られたピッ
チ周期(T)間隔で単位インパルスが立つパルス列音
源、γP2はそのゲイン、c2 I [n]は第2の確率的コ
ードブック19の出力、γN2はそのゲインである。
【0015】以上の3種類の音源構成の駆動音源それぞ
れに対して重み付き合成フィルタ22により重み付き合
成音声を生成し、歪最小化器23により歪が最小になる
最適な音源構成および音源の各成分のインデクスとゲイ
ンを決定する。
【0016】このように、上記実施例によれば、従来の
適応コードブックと確率的コードブックという音源構成
に加え、適応コードブックとパルス音源、またはパルス
音源と確率的コードブックという音源構成を設け、それ
らの3種類の音源構成のうちいずれか最適な音源構成に
より音源を決定するようにしたものである。したがっ
て、パルス性のピッチ周期音源を持つ有声音において、
音声の立ち上がり等過去の区間との相関性が低い区間で
はパルス音源と確率的コードブックという音源構成を、
また過去の区間との相関性が高い区間では適応コードブ
ックとパルス音源という音源構成を選択できるようにす
ることにより、いずれもパルス成分の音源を生成でき、
低ビットレートでも音声品質の劣化を抑えた符号化を行
なうことができる。
【0017】なお、上記実施例において、第1のパルス
音源生成器14への入力として、ピッチ抽出器12から
の出力のピッチ周期を用いる代わりに、パルス音源の探
索に先立って決定される適応コードブック13の長期予
測遅延を用いてパルス列音源を生成するようにしてもよ
い。
【0018】
【発明の効果】本発明は、上記実施例から明らかなよう
に、従来の適応コードブックと確率的コードブックとい
う音源構成に加え、適応コードブックとパルス音源、ま
たはパルス音源と確率的コードブックという音源構成を
設け、それらの3種類の音源構成のうちいずれか最適な
音源構成により音源を決定するようにしたので、低ビッ
トレートでも音声品質の劣化を抑えた符号化を行なうこ
とができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施例における音声符号化装置の概
略ブロック図
【図2】従来のCELP音声符号化装置の概略ブロック
【符号の説明】
11 聴覚重み付けフィルタ 12 ピッチ抽出器 13 適応コードブック 14 第1のパルス音源生成器 15 第1の確率的コードブック 16 第1の音源切り替え器 17 第1の駆動音源生成器 18 第2のパルス音源生成器 19 第2の確率的コードブック 20 第2の駆動音源生成器 21 第2の駆動音源切り替え器 22 重み付き合成フィルタ 23 歪最小化器 31 聴覚重み付けフィルタ 32 適応コードブック 33 確率的コードブック 34 駆動音源生成器 35 重み付き合成フィルタ 23 歪最小化器
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/12 G10L 101:10 - 101:12

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 一定区間の入力音声の聴覚重み付けを行
    ない、重み付き入力音声を生成する聴覚重み付けフィル
    タと、入力音声からピッチ周期を求めるピッチ抽出器
    と、過去の駆動音源を蓄える適応コードブックと、前記
    ピッチ周期を用いてパルス列音源を生成する第1のパル
    ス音源生成器と、複数の雑音音源を予め格納する第1の
    確率的コードブックと、前記第1のパルス音源生成器ま
    たは第1の確率的コードブックから生成された音源のい
    ずれかを選択する第1の音源切り替え器と、前記第1の
    パルス音源生成器または第1の確率的コードブックのい
    ずれかから選択された音源と前記適応コードブックの出
    力とから駆動音源を生成する第1の駆動音源生成器と、
    前記ピッチ周期を用いてパルス列音源を生成する第2の
    パルス音源生成器と、複数の雑音音源を予め格納する第
    2の確率的コードブックと、前記第2のパルス音源生成
    器および第2の確率的コードブックから駆動音源を生成
    する第2の駆動音源生成器と、前記第1の駆動音源生成
    器または第2の駆動音源生成器のいずれかの出力を選択
    する第2の音源切り替え器と、前記第2の音源切り替え
    器を通して得られた駆動音源から音声を合成する重み付
    き合成フィルタと、重み付き入力音声に対する重み付き
    合成音声の誤差の二乗和を計算し、それを最小とするよ
    うな音源の組み合わせおよび各音源のインデクスとゲイ
    ンを決定してそれらの符号を出力する歪最小化器とを備
    えた音声符号化装置。
  2. 【請求項2】 第1のパルス音源生成器への入力とし
    て、ピッチ抽出器からの出力のピッチ周期を用いる代わ
    りに、パルス音源の探索に先立って決定される適応コー
    ドブックの長期予測遅延を用いてパルス列音源を生成す
    る請求項1記載の音声符号化装置。
JP4292944A 1992-10-30 1992-10-30 音声符号化装置 Expired - Fee Related JP3028886B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4292944A JP3028886B2 (ja) 1992-10-30 1992-10-30 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4292944A JP3028886B2 (ja) 1992-10-30 1992-10-30 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH06138898A JPH06138898A (ja) 1994-05-20
JP3028886B2 true JP3028886B2 (ja) 2000-04-04

Family

ID=17788442

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4292944A Expired - Fee Related JP3028886B2 (ja) 1992-10-30 1992-10-30 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3028886B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5864797A (en) * 1995-05-30 1999-01-26 Sanyo Electric Co., Ltd. Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
JP3616432B2 (ja) * 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置

Also Published As

Publication number Publication date
JPH06138898A (ja) 1994-05-20

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
JP4064236B2 (ja) 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JPH09160596A (ja) 音声符号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3028886B2 (ja) 音声符号化装置
JP3303580B2 (ja) 音声符号化装置
JP3178732B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3552201B2 (ja) 音声符号化方法および装置
JP2946525B2 (ja) 音声符号化方式
JP3057907B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JPH11259098A (ja) 音声符号化/復号化方法
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3102017B2 (ja) 音声符号化方法
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JP2658794B2 (ja) 音声符号化方式
JP2853170B2 (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees