JP2774003B2 - コード励振線形予測符号化装置 - Google Patents

コード励振線形予測符号化装置

Info

Publication number
JP2774003B2
JP2774003B2 JP3341177A JP34117791A JP2774003B2 JP 2774003 B2 JP2774003 B2 JP 2774003B2 JP 3341177 A JP3341177 A JP 3341177A JP 34117791 A JP34117791 A JP 34117791A JP 2774003 B2 JP2774003 B2 JP 2774003B2
Authority
JP
Japan
Prior art keywords
vector
excitation
vocal tract
code
excitation vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3341177A
Other languages
English (en)
Other versions
JPH05173596A (ja
Inventor
弘美 青柳
賢一郎 細田
浩 桂川
義博 有山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3341177A priority Critical patent/JP2774003B2/ja
Publication of JPH05173596A publication Critical patent/JPH05173596A/ja
Application granted granted Critical
Publication of JP2774003B2 publication Critical patent/JP2774003B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、コード励振線形予測符
号化装置に関する。
【0002】
【従来の技術】過去の原音声ベクトルに対する最適な励
振ベクトルを蓄積した適応励振コードブックと、予め定
められた励振ベクトルを蓄積した統計励振コードブック
とを備えたコード励振線形予測符号化装置は、例えば、
次記文献で開示されている。 文献名:N.S.Jayant and J.H.Ch
en,“SpeechCoding with Tim
e−Varying Bit Allocations
to Excitation and LPC Pa
rameters”,Proc.ICASSP,pp6
5−68,1989. この文献では、音声合成のための残差信号が、周期性の
ある信号と、雑音性の信号で構成されていると考え、統
計励振コードブックを雑音性の信号に対応させ、適応励
振コードブックを周期性の信号に対応させ、原音声ベク
トルに対する最適な励振ベクトルを選択決定するため
に、そこから読みだした複数個の適応励振ベクトルと複
数個の統計励振ベクトルとに基づいて複数個の励振ベク
トルを作成する。
【0003】
【発明が解決しようとする課題】上記文献においては、
統計励振ベクトルは予め定められており、低ビットレー
ト化に伴いそのベクトル数を減少させると、固定のベク
トルでは対応しきれなくなり、合成音声品質が劣化して
しまうという問題があった。従って、本発明は、低ビッ
トレートにおいても優れた合成音声品質が得られるコー
ド励振線形予測符号化装置を提供することを目的とす
る。
【0004】
【課題を解決するための手段】本発明は、量子化された
声道パラメータと励振ベクトルとに基づいて合成音声ベ
クトルを作成し、入力音声ベクトルとこの合成音声ベク
トルとの誤差を評価することによって、現時刻の入力音
声ベクトルに最適な励振ベクトルに対応した適応及び統
計励振コードブックのインデックスを決定し、声道パラ
メータと両インデックスとをトータルコードとして出力
するコード励振線形予測符号化装置に関するものであ
る。そして、声道パラメータに基づいて特定のインパル
ス応答を作成し、且つ、当該インパルス応答を用いて、
統計励振ベクトルに、畳み込み処理を施した後、適応励
振ベクトルと加算して励振ベクトルを作成する手段を備
えている。第1の発明では、このインパルス応答は、声
道パラメータを用いて表現された伝達関数のインパルス
応答に対応するものであり、例えば、次の式(1)で示
す伝達関数H(Z)のインパルス応答に対応するもので
ある。
【0005】
【数1】
【0006】ただし、A、Bは、0<A<B<1の定
数、aqjはLPC逆量子化器104の出力、pは声道分
析次数である。
【0007】また、第2の発明においては、このインパ
ルス応答は、次の式で示す伝達関数H(Z)のインパル
ス応答に対応するものである。 H(Z)=1/(1−εZ-L) (2) ただし、εは0<ε≦1なる定数、Lは適応励振ベクト
ルのインデックスから計算したピッチラグである。
【0008】
【作用】本発明では、適応励振ベクトルと統計励振ベク
トルとを加算して励振ベクトルを作成する前に、統計励
振ベクトルを変換修正しておく。変換修正は、入力音声
ベクトルの短時間的な性質(声道パラメータ)もしくは
長時間的な性質(ピッチラグ)を表わすインパルス応答
の、又は双方を表わすインパルス応答の畳み込み処理に
よって行う。この畳み込み処理は、eslを統計励振コ
ードブックの出力統計励振ベクトル、esclを変換後
の統計励振ベクトル、hをインパルス応答として、次の
式(3)で示すことができる。 escl=esl*h (3) ただし、escl=[x0 、x1 、、、xn-1 ]、es
l=[y0 、y1 、、、yn-1 ]、h=[h0
1 、、、hn-1 ]、[ ]は列ベクトル、x、y、h
はそれぞれの要素、nはサブフレーム長(又はフレーム
長)である。
【0009】インパルス応答は、入力音声ベクトルの短
時間的な性質を用いる第1の発明の場合は、声道パラメ
ータを用いて表現した伝達関数のインパルス応答であ
り、長時間的な性質を用いる第2の発明の場合は、ピッ
チラグを用いて表現した伝達関数のインパルス応答であ
る。
【0010】理論的には、入力音声ベクトルの周波数特
性は声道パラメータ及びピッチラグが担い、残差信号は
周波数的にはフラットな性質を持つはずであるが、実際
にはそのときの(逆フィルタを通した場合の)残差信号
に周波数的な性質が残る。本発明はこれを利用(あるい
は逆に利用)して、統計励振ベクトルに入力音声ベクト
ルの周波数的特性を加味させるようにして、合成音声品
質を向上させたものである。
【0011】
【実施例】図1は、本発明のコード励振線形予測符号化
器の第1実施例を示すブロック図である。図1におい
て、端子101よりフレーム単位にまとめられて、ベク
トルとして入力される入力音声ベクトルSは、まず声道
分析回路102に入力され、声道予測パラメータajが
計算される。声道分析回路102は、声道予測パラメー
タajをLPC量子化器103に送出する。LPC量子
化器103は、声道予測パラメータajを量子化し、そ
のコードIc(LPCコード)をLPC逆量子化器10
4、多重化回路106に送出する。LPC逆量子化器1
04は、LPCコードIcを声道予測パラメータaqj
に逆変換して合成フィルタ105に送出する。次に、適
応励振コードブック107は適応励振ベクトルeai
(i=1〜n)、統計励振コードブック108は統計励
振ベクトルesl(l=1〜m)、VQゲインコードブ
ック110は励振ゲインβk、γk(k=1〜p)を各
々出力する。
【0012】コードベクトル変換回路109は、次の式
(4)で示すフィルタ伝達関数H(Z)のインパルス応
答を用いてコードブック108からの統計励振ベクトル
eslを畳み込み、修正統計励振ベクトルesclを計
算する。
【0013】
【数2】
【0014】但し、aqjはLPC逆量子化器104の出
力、pは声道分析次数である。適応励振ベクトルeai
は乗算器113によりゲインβkが乗ぜられベクトルe
aikとなり、修正統計励振ベクトルesclは乗算器
114によりゲインγkが乗ぜられベクトルesclk
となる。加算器115は、ベクトルeaikとベクトル
esclkの成分単位の加算を行い励振ベクトルeを計
算する。合成フィルタ105は、励振ベクトルeに対す
る合成音声ベクトルSwを計算し、減算器116に送出
する。減算器116は、合成音声ベクトルSwと入力音
声ベクトルSの成分単位の減算を行い、誤差ベクトルe
rを知覚フィルタ111に送出する。
【0015】知覚フィルタ111は誤差ベクトルerに
対する知覚誤差ベクトルewを知覚誤差計算回路112
に送出する。知覚誤差計算回路112は、知覚誤差ベク
トルewの各成分の2乗平均を計算し、この値が最小と
なる励振ベクトル(即ち、i、l、kの組み合わせ)を
現時刻の入力音声ベクトルの最適な励振ベクトルとして
決定する。そして、その時の各コードブックのインデッ
クスIa、Is、Igを、適応励振コードブック10
7、統計励振コードブック108、VQゲインコードブ
ック110、多重化回路106に送出する。
【0016】適応励振コードブック107は、インデッ
クスIaにより最適な適応励振ベクトルeao、統計励
振コードブック107は、インデックスIsにより最適
な統計励振ベクトルeso、VQゲインコードブック1
10は、インデックスIgにより最適なVQゲインβ
o、γoを各々出力する。コードベクトル変換回路10
9は、最適な統計励振ベクトルesoを最適な修正統計
励振ベクトルescoに変換する。これらeao、es
co、βo、γoにより構成される最適な励振ベクトル
eoptは適応励振コードブック107に入力され、適
応励振コードブック107の内容が更新される。多重化
回路106は、Ic、Ia、Is、Igをトータルコー
ドCとして出力端子113により受信側に伝送する。
【0017】図2は、図1の符号化に対応したコード励
振線形予測復号化器のブロック図を示す。図2におい
て、入力端子201より入力されたトータルコードCは
多重分離回路212によりLPCコードIc、適応励振
コードインデックスIa、統計励振コードインデックス
Is、VQゲインコードインデックスIgに分離され、
各々LPC逆量子化器202、適応励振コードブック2
04、統計励振コードブック205、VQゲインコード
ブック207に送出される。LPC逆量子化器202
は、LPCコードIcを声道予測パラメータajに変換
して合成フィルタ203に送出する。適応励振コードブ
ック204はインデックスIaに相当する適応励振ベク
トルea、統計励振コードブック206はインデックス
Isに相当する統計励振ベクトルes、VQゲインコー
ドブック207はインデックスIgに相当する励振ゲイ
ンβ、γを各々出力する。
【0018】コードベクトル変換回路206は、第1の
実施例の符号化器と同様にしてベクトルesをベクトル
escに変換する。ea、esc、β、γにより励振ベ
クトルeが構成される。合成フィルタ203は励振ベク
トルeに対する合成音声ベクトルSを計算し、出力端子
211より出力する。適応励振コードブック204はベ
クトルeによりその内容が更新される。
【0019】図1を使い、本発明のコード励振線形予測
符号化器の第2実施例について説明する。コードベクト
ル変換回路109以外は、全て第1実施例の符号化器と
同じであるので、以下にコードベクトル変換回路109
の動作を説明する。コードベクトル変換回路109は、
以下に示すフィルタのインパルス応答を用いてベクトル
eslを畳み込み、ベクトルesclを計算する。 H(Z)=1/(1−εZ-L) (5) 但し、ε=1.0、Lは適応励振コードのインデックス
から求めたピッチラグである。なお、シフトタイプの適
応コードブック(特開平01−54497号公報参照)
では、適応励振コードのインデックスと、ピッチラグ
は、たとえば以下の様に1対1対応している。 適応励振コードインデックス 0 1 2・・・i・・・ ↓ ↓ ↓ ↓ ピッチラグ 20 21 22・・20+i・・・
【0020】
【発明の効果】統計励振ベクトルを符号化時刻毎に変換
するため、少ないベクトル数でも入力音声ベクトルによ
く適合した励振ベクトルが得られ、優れた合成音声品質
が得られる。これは、低ビットレート化に有効である。
【図面の簡単な説明】
【図1】図1は本発明に係るコード励振線形予測符号化
装置のブロック図。
【図2】図2は図1に対応したコード励振線形予測復号
化装置のブロック図。
【符号の説明】
102 声道分析回路 103 LPC量子化器 104 LPC逆量子化器 105 合成フィルタ 106 多重化回路 107 適応励振コードブック 108 統計励振コードブック 109 コードベクトル変換回路 110 VQゲインコードブック 111 知覚フィルタ 112 知覚誤差計算回路 113 乗算器 114 乗算器 115 加算器 C トータルコード eai 適応励振候補ベクトル esl 統計励振候補ベクトル Ia 適応励振コードインデックス Ic LPCコード Ig ゲインコードインデックス Is 統計励振コードインデックス S 入力音声ベクトル Sw 合成音声ベクトル βk 適応励振候補ゲイン γk 統計励振候補ゲイン
───────────────────────────────────────────────────── フロントページの続き (72)発明者 有山 義博 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 平3−101800(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/18 H03M 7/30 H04B 14/04

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声ベクトルを線形予測して声道パ
    ラメータを求める手段と、 当該声道パラメータを量子化して、量子化された声道パ
    ラメータとそれに対応した声道パラメータコードを出力
    する声道パラメータ量子化手段と、 過去の入力音声ベクトルの最適な励振ベクトルを表わす
    適応励振ベクトルを記憶している適応励振コードブック
    と、 予め定められている励振ベクトルである統計励振ベクト
    ルを記憶している統計励振コードブックと、 前記適応励振ベクトルと前記統計励振ベクトルとをそれ
    ぞれ励振ゲインを乗算した後加算して励振ベクトルを作
    成する手段とを備え、 量子化された前記声道パラメータと前記励振ベクトルと
    に基づいて合成音声ベクトルを作成し、前記入力音声ベ
    クトルと当該合成音声ベクトルとの誤差を評価すること
    によって、現時刻の当該入力音声ベクトルに最適な励振
    ベクトルに対応した前記両励振コードブックのインデッ
    クスを決定し、 前記声道パラメータと前記両インデックスとをトータル
    コードとして出力するコード励振線形予測符号化装置に
    おいて、 前記声道パラメータに基づいて特定のインパルス応答を
    作成し、且つ、当該インパルス応答を用いて、前記統計
    励振ベクトルに、畳み込み処理を施した後、前記適応励
    振ベクトルと加算して前記励振ベクトルを作成する手段
    を備え、 前記インパルス応答は、前記声道パラメータを用いて表
    現された伝達関数のインパルス応答に対応するものであ
    ることを特徴としたコード励振線形予測符号化装置
  2. 【請求項2】 入力音声ベクトルを線形予測分析して声
    道パラメータを求める手段と、 当該声道パラメータを量子化して、量子化された声道パ
    ラメータとそれに対応した声道パラメータコードを出力
    する声道パラメータ量子化手段と、 過去の入力音声ベクトルの最適な励振ベクトルを表わす
    適応励振ベクトルを記憶している適応励振コードブック
    と、 予め定められている励振ベクトルである統計励振ベクト
    ルを記憶している統計励振コードブックと、 前記適応励振ベクトルと前記統計励振ベクトルとをそれ
    ぞれ励振ゲインを乗算した後加算して励振ベクトルを作
    成する手段とを備え、 量子化された前記声道パラメータと前記励振ベクトルと
    に基づいて合成音声ベクトルを作成し、前記入力音声ベ
    クトルと当該合成音声ベクトルとの誤差を評価すること
    によって、現時刻の当該入力音声ベクトルに最適な励振
    ベクトルに対応した前記両励振コードブックのインデッ
    クスを決定し、 前記声道パラメータと前記両インデックスとをトータル
    コードとして出力するコード励振線形予測符号化装置に
    おいて、 前記声道パラメータに基づいて特定のインパルス応答を
    作成し、且つ、当該インパルス応答を用いて、前記統計
    励振ベクトルに、畳み込み処理を施した後、前記適応励
    振ベクトルと加算して前記励振ベクトルを作成する手段
    を備え、 前記インパルス応答は、次の式で示す伝達関数H(Z)の
    インパルス応答であることを特徴としたコード励振線形
    予測符号化装置。 H(Z)=1/(1−εZ−L) ただし、εは0<ε≦1なる定数、Lは適応励振ベクト
    ルの前記インデックスから計算したピッチラグである。
JP3341177A 1991-12-24 1991-12-24 コード励振線形予測符号化装置 Expired - Lifetime JP2774003B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3341177A JP2774003B2 (ja) 1991-12-24 1991-12-24 コード励振線形予測符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3341177A JP2774003B2 (ja) 1991-12-24 1991-12-24 コード励振線形予測符号化装置

Publications (2)

Publication Number Publication Date
JPH05173596A JPH05173596A (ja) 1993-07-13
JP2774003B2 true JP2774003B2 (ja) 1998-07-09

Family

ID=18343949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3341177A Expired - Lifetime JP2774003B2 (ja) 1991-12-24 1991-12-24 コード励振線形予測符号化装置

Country Status (1)

Country Link
JP (1) JP2774003B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG43128A1 (en) * 1993-06-10 1997-10-17 Oki Electric Ind Co Ltd Code excitation linear predictive (celp) encoder and decoder
CN1256000A (zh) * 1998-01-26 2000-06-07 松下电器产业株式会社 增强音调的方法和装置
EP1221694B1 (en) 1999-09-14 2006-07-19 Fujitsu Limited Voice encoder/decoder

Also Published As

Publication number Publication date
JPH05173596A (ja) 1993-07-13

Similar Documents

Publication Publication Date Title
KR100427752B1 (ko) 음성부호화방법 및 장치
EP0413391B1 (en) Speech coding system and a method of encoding speech
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
WO2005112005A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
CN101023471A (zh) 可伸缩性编码装置、可伸缩性解码装置、可伸缩性编码方法、可伸缩性解码方法、通信终端装置以及基站装置
JPH056199A (ja) 音声パラメータ符号化方式
US7970605B2 (en) Method, apparatus, program and recording medium for long-term prediction coding and long-term prediction decoding
US6330531B1 (en) Comb codebook structure
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2774003B2 (ja) コード励振線形予測符号化装置
JPH11184498A (ja) 音声符号化/復号化方法
JP3067676B2 (ja) Lspの予測符号化装置及び方法
JP2010256932A (ja) 音声信号標本値の符号化または復号化のための方法並びに符号化器ないし復号化器
JP3050966B2 (ja) コード励振線形予測符号化装置
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP2914305B2 (ja) ベクトル量子化装置
JP3068688B2 (ja) コード励振線形予測符号化方法
JP3194930B2 (ja) 音声符号化装置
JP3102017B2 (ja) 音声符号化方法
JP3212123B2 (ja) 音声符号化装置
JPH0211920B2 (ja)
JP3277090B2 (ja) ゲイン量子化方法及び装置、音声符号化方法及び装置並びに音声復号化方法及び装置
JP2808841B2 (ja) 音声符号化方式
JPH06222796A (ja) 音声符号化方式
JP2975764B2 (ja) 信号の符号化復号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980324

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080424

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090424

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100424

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100424

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110424

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110424

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 14