JP3057907B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3057907B2
JP3057907B2 JP4156358A JP15635892A JP3057907B2 JP 3057907 B2 JP3057907 B2 JP 3057907B2 JP 4156358 A JP4156358 A JP 4156358A JP 15635892 A JP15635892 A JP 15635892A JP 3057907 B2 JP3057907 B2 JP 3057907B2
Authority
JP
Japan
Prior art keywords
sound source
generating
information
long
term prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4156358A
Other languages
English (en)
Other versions
JPH05346798A (ja
Inventor
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP4156358A priority Critical patent/JP3057907B2/ja
Publication of JPH05346798A publication Critical patent/JPH05346798A/ja
Application granted granted Critical
Publication of JP3057907B2 publication Critical patent/JP3057907B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声符号化装置に係わ
り、特に、入力音声から駆動音源符号を生成し、ディジ
タル通信・ボイスメイル等に利用するに好適な音声符号
化装置に関する。
【0002】
【従来の技術】近年、4.8〜8.0kb/s程度の低
ビットレートにおける音声符号化装置としては、CEL
P(Code−Excited Linear Pre
diction Coder)と呼ばれる音声符号化装
置が広く採用されている。従来のこの種のCELP符号
化装置としては、図2に示されるように、駆動音源とし
てパルス音源を用いたものが知られている。
【0003】図2において、21は入力音声の聴感重み
付けを行う聴感重み付けフィルタである。22は入力音
声からピッチ周期を抽出して出力するピッチ抽出器であ
る。23は適用コードブックで、過去の駆動音源を蓄え
ている。24はパルス音源を生成するパルス音源生成器
である。25は適応コードブックとパルス音源生成器2
4の出力から駆動音源を生成する駆動音源生成器であ
る。26は駆動音源から重み付き合成音声を生成する重
み付き合成フィルタである。27は重み付き入力音声に
対する重み付き合成音声の誤差を算出し、その二乗和を
最小にするように、長期予測遅延、パルス位置、及びゲ
インの符号を出力する歪最小化器である。
【0004】以上のように構成された音声符号化装置装
置について、以下にその動作を説明する。まず、聴感重
み付けフィルタ21で入力音声に対する重み付けを行っ
て重み付き入力音声を求める。次にピッチ抽出器22で
入力音声からピッチ周期を抽出し、このピッチ周期を復
号化装置側へ転送するとともに、パルス音源生成器24
へ出力する。パルス音源生成器24はパルス位置とピッ
チ周期を基にパルス音源を生成する。一方適応コードブ
ック23は長期予測遅延と過去に生成された駆動音源か
ら長期予測信号を生成する。駆動音源生成器25は長期
予測信号とパルス音源を基に駆動音源を生成する。この
駆動音源は重み付き合成フィルタ26で重み付けされて
合成音声に変換される。この合成音声が歪最小化器27
に入力されると、歪最小化器27において、合成音声の
重み付き入力音声に対する誤差の二乗和が算出される。
そしてこの算出値を最小とするように、長期予測遅延、
パルス位置及び駆動音源のゲインがそれぞれ決定され、
これらの符号が駆動音源符号として出力される。これに
より、この装置によれば、入力音声からピッチ周期符号
と駆動音源符号を生成してこれらの符号に関する情報を
出力することができる。
【0005】
【発明が解決しようとする課題】しかし、従来の音声符
号化装置では、パルス音源を生成するために、ピッチ周
期を用いているため、復号化装置側に駆動音源符号の他
にピッチ周期符号の情報を伝送しなければならず、伝送
情報量がその分だけ増加するという問題がある。
【0006】本発明は上記従来の課題を解決するもので
あり、ピッチ周期情報を伝送しなくても、復号化装置側
で周期間隔のパルス音源を生成することができる音声符
号化装置を提供することを目的とするものである。
【0007】
【課題を解決するための手段】本発明は、上記目的を達
成するために、入力音声に対して聴感重み付けを行って
重み付き入力音声信号を生成する聴感重み付け手段と、
入力音声のピッチ周期を抽出するピッチ周期抽出手段
と、長期予測遅延情報またはピッチ周期抽出手段の抽出
によるピッチ周期情報の何れか一方を指令に応じて選択
する選択手段と、選択手段の選択による情報と過去に生
成された駆動音源情報から長期予測信号を生成する長期
予測信号生成手段と、選択手段の選択による情報とパル
ス位置情報からパルス音源を生成するパルス音源生成手
段と、パルス音源生成手段の生成によるパルス音源と長
期予測信号生成手段の生成による長期予測信号にそれぞ
れゲインを掛けこれらの信号から駆動音源を生成する駆
動音源生成手段と、駆動音源生成手段の生成による駆動
音源に対して重み付けを行って重み付け合成音声を生成
する合成音声生成手段と、前記重み付け入力音声信号に
対する重み付け合成音声の誤差の二乗和を算出する二乗
和算出手段と、二乗和算出手段の算出値を最小とするピ
ッチ周期または長期予測遅延の何れか一方の選択を選択
手段に指令する選択指令手段と、二乗和算出手段の算出
値を最小とする長期予測遅延とゲインに関する情報を生
成する情報生成手段と、情報生成手段の生成による情報
を基に駆動音源符号を生成する駆動音源符号生成手段と
を備えている音声符号化装置を構成したものである。
【0008】
【作用】従って、本発明によれば、長期予測信号を生成
するための長期予測遅延情報をパルス音源を生成するた
めの周期間隔情報としても用いているため、復号化装置
側へ周期間隔情報を伝送するのが不要となる。さらに、
長期予測信号及びパルス音源を生成するための周期間隔
情報として、長期予測遅延情報の代わりにピッチ周期を
与えるための選択手段を設けているため、無音(無声
音)から有声音への立ち上がり部のような音声区間に対
してより正確な周期間隔を有するパルス列音源を生成す
ることができる。
【0009】
【実施例】図1は本発明の一実施例の構成を示すもので
ある。図1において、音声符号化装置は聴感重み付けフ
ィルタ11、ピッチ抽出器12、切換スイッチ13、適
応コードブック14、パルス音源生成器15、駆動音源
生成器16、重み付き合成フィルタ17、歪最小化器1
8を備えて構成されている。
【0010】聴感重み付けフィルタ11は入力音声に対
して聴感重み付けを行って、重み付き入力音声信号を生
成する聴感重み付け手段として構成されている。ピッチ
抽出器12は入力音声からピッチ周期を抽出するピッチ
周期抽出手段として構成されている。切換スイッチ13
はピッチ周期または長期予測遅延の何れか一方を選択
し、選択した情報を適用コードブック14とパルス音源
生成器15へ出力する選択手段として構成されている。
適用コードブック14は切換スイッチ13によって選択
された情報と過去に生成された駆動音源情報から長期予
測信号を生成する長期予測信号生成手段として構成され
ている。パルス音源生成器15は、切換スイッチで選択
された情報とパルス位置を基にパルス音源を生成するパ
ルス音源生成手段として構成されている。駆動音源生成
器16は長期予測信号とパルス音源にそれぞれゲインを
掛けこれらの信号から駆動音源を生成する駆動音源生成
手段として構成されている。重み付き合成フィルタ17
は駆動音源に重み付けを行って重み付け合成音声を生成
する合成音声生成手段として構成されている。歪最小化
器18は、重み付き入力音声に対する重み付け合成音声
の誤差の二乗和を算出する二乗和算出手段を構成すると
ともに、二乗和の算出値を最小とするピッチ周期または
長期予測遅延の何れか一方の選択を切換スイッチ13に
指令する選択指令手段を構成するようになっている。さ
らに、二乗和の算出値を最小とする長期予測遅延とゲイ
ンに関する情報を生成する情報生成手段と、情報生成手
段の生成による情報を基に駆動音源符号を生成して出力
する駆動音源符号生成手段を構成するようになってい
る。
【0011】次に、上記実施例の動作について説明す
る。まず音声符号化装置に音声が入力されると、聴感重
み付けフィルタ11において重み付き入力音声が求めら
れ、ピッチ抽出器12によって入力音声からピッチ周期
が抽出される。そしてピッチ周期と長期予測遅延のうち
何れか一方が切換スイッチ13で選択され、選択された
情報を基に長期予測信号とパルス音源が生成される。そ
して長期予測信号とパルス音源から駆動音源が生成さ
れ、駆動音源を基に合成音声が生成され、合成音声と重
み付き入力音声を基に駆動音源符号が生成されることに
なる。この駆動音源符号を生成するに際しては、重み付
き入力音声に最も近い重み付き合成音声を生成する駆動
音源e(n)を歪最小化により決定し、この決定に従っ
た符号化が行われることになる。
【0012】ここで、駆動音源生成器16で生成される
駆動音源e(n)は適用コードブック14出力の長期予
測信号a(n−L)、パルス音源生成器15で生成され
たパルス音源PM(n)からなり、次の(1)式で表さ
れる。
【0013】 e(n)=β・a(n−L)+γ・PM(n) ……(1) ここで、Lは切換スイッチ13で選択される長期予測遅
延lまたはピッチ抽出器12で抽出されたピッチ周期T
pで表される周期間隔、PM(n)は、パルス位置Mか
ら周期間隔Lでインパルスを有するパルス列、β,γは
それぞれ長期予測信号及びパルス音源のゲインである。
【0014】以下に、上記(1)式で示される駆動音源
のパラメータL,M,β,γを決定する手順について説
明する。まず、周期間隔Lとして、長期予測遅延lを選
択(L=l、l=lmin〜lmax)し、長期予測信号a
(n−L)に対して、その重み付き合成音声の歪最小化
により、周期間隔L及び最適ゲインβを決定する。これ
らの値が決定された後は、残った歪に対して、周期間隔
Lを有するパルス音源PM(n)の歪最小化により、パ
ルス位置M及び最適ゲインγを決定する。
【0015】次に、周期間隔Lとして、ピッチ周期Tp
を選択し(L=Tp)、そのときの長期予測信号の最適
ゲインβを決定する。そしてこれを決定した後は、残り
の歪に対して、前述したと同様に、周期間隔L(=T
p)を有するパルス音源のパルス位置M、最適ゲインβ
を決定する。そして、最後に、周期間隔Lとして、長期
予測遅延lあるいはピッチ周期Tpを選択する場合、こ
れらの情報のうち歪の小さい方を選択し、選択したもの
のL,β,M,γの符号を出力する。
【0016】このように、上記実施例によれば、長期予
測信号a(n−L)の長期予測遅延lをパルス音源の周
期間隔情報として用いているため、復号化装置側へ周期
間隔情報を伝送することが不要となる。さらに、長期予
測信号の長期予測遅延l及びパルス音源の周期間隔情報
Lとして長期予測遅延lの代わりに、ピッチ周期Tpを
与えることができる切換スイッチ13を設けているた
め、無音(無声音)から有声音への立ち上がり部のよう
な音声区間に対して、より正確な周期間隔を有するパル
ス列音源を生成することができる。
【0017】
【発明の効果】本発明は、上記実施例より明らかなよう
に、長期予測信号を生成するための長期予測遅延情報を
パルス音源を生成するための周期間隔情報としても用い
ているため、復号化装置側への周期間隔情報の伝送が不
要となる。さらに、長期予測信号を生成するための長期
予測遅延情報及びパルス音源を生成するための周期間隔
情報として、長期予測遅延情報の代わりにピッチ周期を
選択できる選択手段を設けたため、無音または無声音か
ら有声音への立ち上がり部のような音声区間に対して、
より正確な周期間隔を有するパルス音源を生成すること
ができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声符号化装置の概
略ブロック図
【図2】従来の音声符号化装置の概略ブロック図
【符号の説明】
11 聴感重み付けフィルタ 12 ピッチ抽出器 13 切換スイッチ 14 適用コードブック 15 パルス音源生成器 16 駆動音源生成器 17 重み付き合成フィルタ 18 歪最小化器
フロントページの続き (56)参考文献 特開 昭62−38500(JP,A) 特開 平5−108098(JP,A) 特開 平5−307400(JP,A) 電子情報通信学会技術研究報告[音声 ]Vol.91,No.288,SP91−66, 「低ビットレートCELP符号化へのパ ルス音源探索への適用」p.17−22 (1991年10月25日発行) (58)調査した分野(Int.Cl.7,DB名) G10L 19/12 G10L 101:12 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声に対して聴感重み付けを行って
    重み付き入力音声信号を生成する聴感重み付け手段と、
    入力音声のピッチ周期を抽出するピッチ周期抽出手段
    と、長期予測遅延情報またはピッチ周期抽出手段の抽出
    によるピッチ周期情報の何れか一方を指令に応じて選択
    する選択手段と、選択手段の選択による情報と過去に生
    成された駆動音源情報から長期予測信号を生成する長期
    予測信号生成手段と、選択手段の選択による情報とパル
    ス位置情報からパルス音源を生成するパルス音源生成手
    段と、パルス音源生成手段の生成によるパルス音源と長
    期予測信号生成手段の生成による長期予測信号にそれぞ
    れゲインを掛けこれらの信号から駆動音源を生成する駆
    動音源生成手段と、駆動音源生成手段の生成による駆動
    音源に対して重み付けを行って重み付け合成音声を生成
    する合成音声生成手段と、前記重み付け入力音声信号に
    対する重み付け合成音声の誤差の二乗和を算出する二乗
    和算出手段と、二乗和算出手段の算出値を最小とするピ
    ッチ周期または長期予測遅延の何れか一方の選択を選択
    手段に指令する選択指令手段と、二乗和算出手段の算出
    値を最小とする長期予測遅延とゲインに関する情報を生
    成する情報生成手段と、情報生成手段の生成による情報
    を基に駆動音源符号を生成する駆動音源符号生成手段と
    を備えている音声符号化装置。
JP4156358A 1992-06-16 1992-06-16 音声符号化装置 Expired - Fee Related JP3057907B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4156358A JP3057907B2 (ja) 1992-06-16 1992-06-16 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4156358A JP3057907B2 (ja) 1992-06-16 1992-06-16 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH05346798A JPH05346798A (ja) 1993-12-27
JP3057907B2 true JP3057907B2 (ja) 2000-07-04

Family

ID=15626017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4156358A Expired - Fee Related JP3057907B2 (ja) 1992-06-16 1992-06-16 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3057907B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1112625B1 (en) * 1998-09-11 2006-05-31 Motorola, Inc. Method for coding an information signal
EP1221694B1 (en) 1999-09-14 2006-07-19 Fujitsu Limited Voice encoder/decoder

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会技術研究報告[音声]Vol.91,No.288,SP91−66,「低ビットレートCELP符号化へのパルス音源探索への適用」p.17−22(1991年10月25日発行)

Also Published As

Publication number Publication date
JPH05346798A (ja) 1993-12-27

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
US6385577B2 (en) Multiple impulse excitation speech encoder and decoder
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPH0353300A (ja) 音声符号化装置
JPH0612098A (ja) 音声符号化装置
JP3137176B2 (ja) 音声符号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP3057907B2 (ja) 音声符号化装置
JP3303580B2 (ja) 音声符号化装置
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JPS6238500A (ja) 高能率音声符号化方式とその装置
JPH10207496A (ja) 音声符号化装置及び音声復号装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3232701B2 (ja) 音声符号化方法
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3178732B2 (ja) 音声符号化装置
JP3410931B2 (ja) 音声符号化方法及び装置
JP3028886B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3515216B2 (ja) 音声符号化装置
JP3099844B2 (ja) 音声符号化復号化方式
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP3071800B2 (ja) 適応ポストフィルタ

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080421

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090421

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100421

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110421

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120421

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees