JP3178732B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3178732B2
JP3178732B2 JP26784091A JP26784091A JP3178732B2 JP 3178732 B2 JP3178732 B2 JP 3178732B2 JP 26784091 A JP26784091 A JP 26784091A JP 26784091 A JP26784091 A JP 26784091A JP 3178732 B2 JP3178732 B2 JP 3178732B2
Authority
JP
Japan
Prior art keywords
sound source
pulse
noise
gain
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26784091A
Other languages
English (en)
Other versions
JPH05108098A (ja
Inventor
田 幸 司 吉
正 ▲吉▼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP26784091A priority Critical patent/JP3178732B2/ja
Publication of JPH05108098A publication Critical patent/JPH05108098A/ja
Application granted granted Critical
Publication of JP3178732B2 publication Critical patent/JP3178732B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル通信、ボイ
スメール等に利用する音声符号化装置に関するものであ
る。
【0002】
【従来の技術】近年、4.8〜8.0kb/s程度の低
ビットレートにおける音声符号化装置は、図3に示すよ
うなCELP(Code Excited Linear Prediction Coder
)と呼ばれる音声符号化装置が広く用いられている。
【0003】以下、従来のこの種の音声符号化装置につ
いて説明する。図3において、31は入力音声の聴覚重
み付けを行なう聴覚重み付けフィルタであり、重み付き
入力音声を出力する。32は適応コードブックであり、
過去の駆動音源を蓄えている。33は確率的コードブッ
クであり、複数の雑音音源を予め保持している。34は
適応コードブック32と確率的コードブック33とから
駆動音源信号を生成する駆動音源生成器である。35は
駆動音源を入力として重み付き合成音声を生成する重み
付き合成フィルタである。36は重み付き入力音声に対
する重み付き合成音声の歪を計算し、この歪が最も小さ
くなるような長期予測遅延とゲイン、確率的コードブッ
ク中の代表ベクトルとゲインの量子化符号を出力する歪
最小化器である。
【0004】以上のように構成された音声符号化装置に
ついて、以下その動作について説明する。まず、聴覚重
み付きフィルタ31で重み付き入力音声v[n]を求め
る。CELP符号化装置は、これに最も近い重み付き合
成音声を生成するような駆動音源e[n]を符号化する
ものである。ここで、駆動音源はe[n]は次式のよう
に、適応コードブック32の出力である長期予測信号a
[n−L]と確率的コードブック33中のベクトルcI
[n]からなる。
【0005】 e[n]=β・a[n−L]+γ・cI [n] ・・・・(1)
【0006】実際には、両成分を同時に決定するのは困
難であり、通常、適応コードブック32から長期予測成
分のみをまず歪最小化器36により決定し(適応コード
ブック探索)、過去の駆動信号をどれだけ遡るかを示す
長期予測遅延Lと最適ゲインβを出力する。次に、残り
の歪が最小となるように確率的コードブック33により
歪最小化し(確率的コードブック探索)、選ばれた代表
コードブックの番号Iと最適ゲインγを出力する。
【0007】
【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化装置では、4.8kb/s程度以下の低
ビットレートでは、駆動音源信号の生成の性能が下がる
に伴い、その過去の駆動音源信号を蓄えた適応コードブ
ックからの長期予測成分の生成にも性能の劣化が生じ、
特にパルス性のピッチ周期音源を持つ有声音で顕著な音
声品質の劣化が生じるという問題を有していた。
【0008】本発明は、上記従来の問題を解決するもの
であり、低ビットレートでも、パルス性のピッチ周期音
源を持つ有声音での音声品質の劣化を抑えた優れた音声
符号化装置を提供することを目的とするものである。
【0009】本発明の他の目的は、長期予測信号のパル
スと雑音成分のゲインを制御することにより、高い音声
品質を有する音声符号化装置を提供することである。
【0010】
【課題を解決するための手段】本発明は、上記目的を達
成するために、音声符号化装置を、一定区間の入力音声
の聴覚重み付けを行ない、重み付き入力音声を生成する
聴覚重み付けフィルタと、過去の駆動音源を蓄える適応
コードブックと、ピッチ周期間隔で単一インパルスを持
つパルス列で構成されるパルス音源を生成するパルス音
源生成器と、複数の雑音音源を予め格納する確率的コー
ドブックと、前記パルス音源生成器または確率的コード
ブックから生成された音源のいずれかを選択する音源切
り替え器と、前記パルス音源生成器または確率的コード
ブックのいずれかから選択された音源と適応コードブッ
クの出力とから駆動音源を生成する駆動音源生成器と、
前記駆動音源生成器から生成した駆動音源を入力として
音声を合成する重み付き合成フィルタと、前記重み付き
入力音声に対する重み付き合成音声の誤差の二乗和を計
算し、それを最小とする長期予測遅延の符号と、その長
期予測のゲイン、前記計算の結果、パルス音源又は雑音
音源のどちらかの歪み小さい方の音源が選択され、パル
ス音源が選択された場合にはこの選択されたときのパル
ス位置の符号、およびパルス音源の最適ゲイン、また、
雑音音源が選択された場合にはこの選択されたときの確
率的コードブックの符号、および雑音音源の最適ゲイ
ン、を出力する歪最小化器と、により構成したことを要
旨とするものである。これにより、低ビットレートで
も、パルス性のピッチ周期音源を持つ有声音での音声品
質の劣化を抑えることができる
【0011】また本発明の他の目的を達成するために、
適応コードブックの代わりに、長期予測信号のパルス成
分を生成する適応コードブックパルス成分格納器と、雑
音成分を生成する適応コードブック雑音成分格納器と、
長期予測のパルス成分および雑音成分のゲインを制御す
るパルス・雑音成分ゲイン制御器とを備え、長期予測信
号のパルスおよび雑音成分のゲインを制御することによ
り高い音声品質を実現するようにしたものである。
【0012】
【作用】したがって、本発明によれば、パルス音源生成
器の出力であるパルス音源と確率的コードブックから生
成される雑音音源のいずれか最適な音源を音源切り替え
器により選択することにより、低ビットレートでも、パ
ルス性のピッチ周期音源を持つ有声音でパルス成分を生
成することができ、音声品質の劣化を抑えた符号化が行
なえるという効果を有する。
【0013】また本発明によれば、長期予測器に設けら
れたパルス・雑音成分ゲイン制御器により、長期予測信
号のパルスおよび雑音成分のゲインを最適に制御するこ
とにより、高い音声品質を有する音声符号化が行なえる
という効果を有する。
【0014】
【実施例】図1は本発明の第1の実施例の構成を示すも
のである。図1において、11は入力音声の聴覚重み付
けを行なう聴覚重み付けフィルタ、12は過去の駆動音
源を蓄える適応コードブック、13はパルス音源を生成
するパルス音源生成器、14は複数の雑音音源を保持し
ている確率的コードブック、15はパルス音源生成器1
3または確率的コードブック14から生成された音源の
いずれかを選択する音源切り替え器、16はパルス音源
生成器13または確率的コードブック14のいずれかか
ら選択された音源と適応コードブック12の出力とから
駆動音源を生成する駆動音源生成器、17は駆動音源か
ら重み付き合成音声を生成する重み付き合成フィルタ、
18は重み付き入力音声と重み付き合成音声との歪を計
算し、その歪が最小となるような長期予測遅延とパルス
位置または確率的コードブック符号およびこれらのゲイ
の量子化符号を出力する歪最小化器である。
【0015】次に上記第1の実施例の動作について説明
する。まず、聴覚重み付けフィルタ11で重み付き入力
音声v[n]を求め、以後これに最も近い重み付き合成
音声を生成する駆動音源e[n]を符号化する。ここ
で、駆動音源生成器16で生成される駆動音源e[n]
は、適応コードブック12の出力の長期予測信号a[n
−L]、パルス音源生成器13で生成されたパルス音源
[n]または確率的コードブック14から雑音音源
[n]からなり、以下の式で表わされる。 e[n]=β・a[n−L]+γ・p[n] ・・・・(2) または、 e[n]=β・a[n−L]+γ・c[n] ・・・・(3) ここで、p[n]は位置Mからピッチ周期間隔で単一
インパルスを持つパルス列、β、γ、γはそれぞれ
長期予測、パルス、白色雑音成分のゲインである。ここ
で、上記ピッチ周期として、予め一定区間の入力音声ま
たはその残差信号から求めたピッチ周期を使用するか、
または、後に説明する長期予測信号決定後の長期予測遅
延を用いても良い。
【0016】上記式(2)おび(3)は、いずれも2つ
の成分を同時に決定することは困難であり、まず、適応
コードブック12の長期予測信号をその聴覚重み付き合
成音声の歪最小化により決定し、過去の駆動信号のどの
部分を用いるかを示す長期予測遅延Lと最適ゲインβを
出力する。次に、長期予測信号決定後の歪に対して、式
(2)および(3)のそれぞれに対応して、パルス音源
または雑音音源により歪最小化を行ない、歪の小さい方
の音源をその符号化区間で音源として選択し、それがパ
ルス音源であればパルス位置Mと最適ゲインγP の量子
化符号、雑音音源であれば選ばれた雑音ベクトルの番号
Iと最適ゲインγN の量子化符号を、その音源選択情報
(パルス音源/雑音音源のいずれが選択されたか)と共
に、出力する。
【0017】このように上記第1の実施例によれば、長
期予測信号決定後の歪に対して、パルス音源または雑音
音源のいずれか歪の小さい音源を選択することにより、
パルス性のピッチ周期音源を持つ有声音でパルス成分を
生成することができ、低ビットレートでも音声品質の劣
化を抑えた符号化が行なえる効果を有する。
【0018】図2は本発明の第2の実施例の構成を示す
ものである。図2において、21は適応コードブックの
パルス成分を持つ適応コードブックパルス成分格納器、
22は適応コードブックの雑音成分を持つ適応コードブ
ック雑音成分格納器、23は長期予測信号のパルスおよ
び雑音成分のゲインを制御するパルス・雑音成分ゲイン
制御器であり、他は第1の実施例と同じ構成である。す
なわち、24はパルス音源を生成するパルス音源生成
器、25は複数の雑音音源を保持している確率的コード
ブック、26はパルス音源生成器24または確率的コー
ドブック25から生成された音源のいずれかを選択する
音源切り替え器、27はパルス音源生成器24または確
率的コードブック25のいずれかから選択された音源と
パルス・雑音成分ゲイン制御器23の出力とから駆動音
源を生成する駆動音源生成器、28は駆動音源から重み
付き合成音声を生成する重み付き合成フィルタ、29は
重み付き入力音声と重み付き合成音声との歪を計算し、
その歪が最小となるような長期予測遅延とパルス位置ま
たは確率的コードブック符号およびこれらのゲインの量
子化符号を出力する歪最小化器、30は入力音声の聴覚
重み付けを行なう聴覚重み付けフィルタである。
【0019】次に上記第2の実施例の動作について説明
する。第1の実施例と同様に重み付き入力音声に最も近
い重み付き合成音声を生成する駆動音源e[n]を符号
化するため、まず長期予測信号の歪最小化を行なう。そ
の際、第2の実施例では、長期予測信号aS [n]をパ
ルス成分aP [n−L]と雑音成分aN [n−L]の和
で以下の式で表現し、長期予測遅延Lおよびそれぞれの
成分のゲインβP 、β N を決定する。 aS [n]=βP ・aP [n−L]+βN ・aN [n−L] ・・・(4)
【0020】長期予測遅延Lおよびそれぞれの成分のゲ
インβP 、βN の決定法の一例として、まずβP =βN
として長期予測遅延Lを求め、そのLに対して、以下の
式(5)で示される入力音声との重み付き二乗誤差Eを
最小にするような、最適なパルス成分ゲインβPおよび
雑音成分ゲインβN を決定する。 E=Σ{p[n]−βP ・bP [n]−βN ・bN [n]}2 →Min ・・・(5) p[n]:聴覚重み付き入力音声 bP [n]:適応コードブックパルス成分出力の聴覚重
み付き合成音声 βP : パルス成分ゲイン bN [n]:適応コードブック雑音成分出力の重み付き
合成音声 βN :雑音成分ゲイン
【0021】上記式においてEが最小になるように
βP 、βN について解くことにより、最適なβP 、βN
が以下のように求められる。
【0022】
【数1】
【0023】なお、適応コードブックの長期予測成分の
歪最小化後は、第1の実施例と同様に長期予測成分決定
後の歪に対して、パルス音源または雑音音源のいずれか
歪の小さい音源を選択する。また、適応コードブックの
更新は、パルス成分および雑音成分のそれぞれを別々に
行ない、選択された音源がパルス音源であれば、適応コ
ードブックのパルス成分の更新に使用し、雑音音源であ
れば雑音成分の更新に使用する。
【0024】このように上記第2の実施例によれば、適
応コードブックをパルス成分と雑音成分とに分離して格
納することにより、長期予測信号のパルス成分と雑音成
分のゲインを最適に制御することができ、これにより高
い音声品質を有する音声符号化が行なえるという効果を
有する。
【0025】
【発明の効果】本発明は、上記実施例から明らかなよう
に、長期予測成分決定後の歪に対して、パルス成分また
白色雑音成分のいずれか歪の小さい音源を選択すること
により、パルス性のピッチ周期音源を持つ有声音でパル
ス成分を生成することができ、低ビットレートでも音声
品質の劣化を抑えた符号化が行なえるという効果を有す
る。
【0026】また本発明によれば、適応コードブックを
パルス成分と雑音成分とに分離して格納することによ
り、長期予測信号のパルス成分と雑音成分のゲインを最
適に制御することができ、これにより高い音声品質を有
する音声符号化が行なえるという効果を有する。
【図面の簡単な説明】
【図1】本発明の第1の実施例における音声符号化装置
の概略ブロック図
【図2】本発明の第2の実施例における音声符号化装置
の概略ブロック図
【図3】従来のCELP音声符号化装置の概略ブロック
【符号の説明】
11 聴覚重み付けフィルタ 12 適応コードブック 13 パルス音源生成器 14 確率的コードブック 15 音源切り替え器 16 駆動音源生成器 17 重み付き合成フィルタ 18 歪最小化器 21 適応コードブックパルス成分格納器 22 適応コードブック雑音成分格納器 23 パルス・雑音成分ゲイン制御器 24 パルス音源生成器 25 確率的コードブック 26 音源切り替え器 27 駆動音源生成器 28 重み付き合成フィルタ 29 歪最小化器 30 聴覚重み付けフィルタ
フロントページの続き (56)参考文献 特開 昭64−54497(JP,A) 特開 平3−33900(JP,A) 特開 平3−123400(JP,A)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 一定区間の入力音声の聴覚重み付けを行
    ない、重み付き入力音声を生成する聴覚重み付けフィル
    タと、 過去の駆動音源を蓄える適応コードブックと、 ピッチ周期間隔で単一インパルスを持つパルス列で構成
    されるパルス音源を生成するパルス音源生成器と、 複数の雑音音源を予め格納する確率的コードブックと、 前記パルス音源生成器または確率的コードブックから生
    成された音源のいずれかを選択する音源切り替え器と、 前記パルス音源生成器または確率的コードブックのいず
    れかから選択された音源と適応コードブックの出力とか
    ら駆動音源を生成する駆動音源生成器と、 前記駆動音源生成器から生成した駆動音源を入力として
    音声を合成する重み付き合成フィルタと、 前記重み付き入力音声に対する重み付き合成音声の誤差
    の二乗和を計算し、 それを最小とする長期予測遅延の符号と、その長期予測
    のゲイン、 前記計算の結果、パルス音源又は雑音音源のどちらかの
    歪み小さい方の音源が選択され、 パルス音源が選択された場合にはこの選択されたときの
    パルス位置の符号、およびパルス音源の最適ゲイン、 また、雑音音源が選択された場合にはこの選択されたと
    きの確率的コードブックの符号、および雑音音源の最適
    ゲイン、 を出力する歪最小化器と、 を有する音声符号化装置。
  2. 【請求項2】 適応コードブックの代わりに、長期予測
    信号のパルス成分を格納する適応コードブックパルス成
    分格納器と、雑音成分を格納する適応コードブック雑音
    生成格納器と、長期予測信号のパルス成分および雑音
    のゲインを制御するパルス・雑音生成ゲイン制御器と
    を有し、長期予測信号のパルス成分と雑音成分のゲイン
    を独立に制御できることを特徴とする請求項1記載の音
    声符号化装置。
  3. 【請求項3】 パルス・雑音成分ゲイン制御器が、長期
    予測信号のパルス成分と雑音成分のゲインを、聴覚重み
    付き入力音声に対する聴覚重み付き合成音声の二乗誤差
    を最小にするように決定することを特徴とする請求項2
    記載の音声符号化装置。
JP26784091A 1991-10-16 1991-10-16 音声符号化装置 Expired - Lifetime JP3178732B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26784091A JP3178732B2 (ja) 1991-10-16 1991-10-16 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26784091A JP3178732B2 (ja) 1991-10-16 1991-10-16 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH05108098A JPH05108098A (ja) 1993-04-30
JP3178732B2 true JP3178732B2 (ja) 2001-06-25

Family

ID=17450356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26784091A Expired - Lifetime JP3178732B2 (ja) 1991-10-16 1991-10-16 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3178732B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5864797A (en) * 1995-05-30 1999-01-26 Sanyo Electric Co., Ltd. Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
EP0967594B1 (en) 1997-10-22 2006-12-13 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
JP3404016B2 (ja) 2000-12-26 2003-05-06 三菱電機株式会社 音声符号化装置及び音声符号化方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
JPH0333900A (ja) * 1989-06-30 1991-02-14 Fujitsu Ltd 音声符号化方式

Also Published As

Publication number Publication date
JPH05108098A (ja) 1993-04-30

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JPH0353300A (ja) 音声符号化装置
JPH11327597A (ja) 音声符号化装置及び音声復号化装置
JPH0612098A (ja) 音声符号化装置
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3178732B2 (ja) 音声符号化装置
JP3179291B2 (ja) 音声符号化装置
JP3329216B2 (ja) 音声符号化装置及び音声復号装置
JP3303580B2 (ja) 音声符号化装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JPH10222197A (ja) 音声合成方法およびコード励振線形予測合成装置
JP3194481B2 (ja) 音声符号化法
JP3028886B2 (ja) 音声符号化装置
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP2956068B2 (ja) 音声符号化復号化方式
JP3845316B2 (ja) 音声符号化装置及び音声復号装置
JPH11259098A (ja) 音声符号化/復号化方法
JP4179232B2 (ja) 音声符号化装置及び音声復号装置
JP3057907B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3103108B2 (ja) 音声符号化装置
JPH06130994A (ja) 音声符号化方法
JP3071800B2 (ja) 適応ポストフィルタ
JP2001013999A (ja) 音声符号化方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080413

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090413

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100413

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110413

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 11