CZ304196B6 - Vektorové kvantizační zařízení LPC parametru, kodér řeči a přijímací zařízení signálu řeči - Google Patents

Vektorové kvantizační zařízení LPC parametru, kodér řeči a přijímací zařízení signálu řeči Download PDF

Info

Publication number
CZ304196B6
CZ304196B6 CZ2003-1500A CZ20031500A CZ304196B6 CZ 304196 B6 CZ304196 B6 CZ 304196B6 CZ 20031500 A CZ20031500 A CZ 20031500A CZ 304196 B6 CZ304196 B6 CZ 304196B6
Authority
CZ
Czechia
Prior art keywords
lpc
unit
distortion
vector
code
Prior art date
Application number
CZ2003-1500A
Other languages
English (en)
Other versions
CZ20031500A3 (cs
Inventor
Kazutoshi Yasunaga
Toshiyuki Morii
Hiroyuki Ehara
Kazunori Mano
Yusuke Hiwasaki
Original Assignee
Panasonic Corporation
Nippon Telegraph And Telephone Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corporation, Nippon Telegraph And Telephone Corporation filed Critical Panasonic Corporation
Publication of CZ20031500A3 publication Critical patent/CZ20031500A3/cs
Publication of CZ304196B6 publication Critical patent/CZ304196B6/cs

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • G10L2019/0014Selection criteria for distances

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Vektorové kvantizační zařízení LPC parametru obsahuje první výpočetní jednotku (102) pro vypočtení zkreslení (d.sub.m.n.) mezi souborem kódových vektorů (LSF.sub.m.n.[i]) postupně přečtených z kódového seznamu (101) pro uložení početného souboru kódových vektorů (LSF.sub.m.n.[i]), a kvantizačním cílem (LSF.sub.T.n.[i]) za použití prvního měřítka pro vyhodnocení zkreslení; předvolbovou jednotku (103) pro předběžné zvolení kódových vektorů (LSF.sub.Ncand[j].n.[i]), které zmenšují velikost zkreslení (d.sub.m.n.), z uvedeného početného souboru kódových vektorů (LSF.sub.m.n.[i]) podle uvedeného prvního měřítka pro vyhodnocení zkreslení; druhou výpočetní jednotku (108) pro vypočtení zkreslení (D.sub.j.n.) mezi předběžně zvolenými kódovými vektory (CEP.sub.Ncand[j].n.[i]) a uvedeným kvantizačním cílem (CEP.sub.T.n.[i]) za použití druhého měřítka pro vyhodnocení zkreslení, které je odlišné od prvního měřítka pro vyhodnocení zkreslení, a pro specifikování kódového vektoru (N.sub.cand.n.[J]), který minimalizuje velikost zkreslení (D.sub.j.n.), z předběžně zvolených kódových vektorů (CEP.sub.Ncand[j].n.[i]) podle druhého měřítka pro vyhodnocení zkreslení a pro výstup indexové informace (J) specifikovaného kódového vektoru (N.sub.cand.n.[J]). Kodér řeči obsahuje vektorové kvantizační zařízení LPC parametru. Vysílací zařízení signálu řeči je opatřené kodérem řeči obsahujícím vektorové kvantizační zařízení LPC parametru.

Description

Vynález se týká vektorového kvantizačního zařízení LPC parametru, kodéru řeči obsahujícího uvedené vektorové kvantizační zařízení a přijímacího zařízení signálu řeči opatřeného uvedeným kodérem.
Dosavadní stav techniky
Je-li signál řeči vysílán v paketovém komunikačním systému reprezentovaném Internetovou komunikací nebo mobilním komunikačním systémem, pak je často používána technologie zhušťován í/kódování dat pro zvýšení efektivity vysílání signálu řeči. Doposud bylo vyvinuto mnoho systémů kódování řeči, a mnohé ze systémů kódování řeči s nízko bitovou rychlostí vyvinuté v posledních letech rozdělují signál řeči na spektrální obálkové informace a na zvukové zdrojové informace, a zahušťují/kódují rozdělené části informací. Jedním z takových příkladů je například CELP systém popsaný v Dokumentu 1 (M. R. Schroeder, B. S. Atal: „Code Excited Linear Prediction: High Quality Speech at Low Bit Ratte - Kódově Excitovaná Lineární Předpověď: Řeč s Vysokou Kvalitou při Nízké Bitové Rychlosti“, IEEE proč., ICASSP'85, str. 937-940).
Dále bude vysvětlen kodér řeči založený na CELP použitím obr. 1. Předpokládejme, že vstupní signál řeči je přiváděn na vstup kodéru řeči postupně v každé zpracovávané stránce ohraničené časovým intervalem přibližně 20ms.
Vstupní signál řeči přiváděný do kodéru řeči pro každou zpracovávanou stránkuje nejprve předáván do jednotky pro LPC analýzu 11. Jednotka pro LPC analýzu 11 vykonává LPC (Linear Predictive Coding - Kódování s Lineární Předpovědí) analýzu vstupního signálu řeči, získává LPC vektor obsahující LPC koeficienty jako vektorové složky, vektorově kvantifikuje získaný LPC vektor pro získání LPC kódu, a dekóduje tento LPC kód pro získání dekódovaného LPC vektoru obsahujícího dekódované LPC koeficienty jako vektorové složky.
Jednotka J4 pro generování excitačního vektoru čte adaptivní kódový vektor a pevný kódový vektor z příslušného adaptivního kódového seznamu 12 a z pevného kódového seznamu J_3 a vysílá tyto kódové vektory do LPC syntetizačního filtru L5. LPC syntetizační filtr j_5 vykonává syntetizační filtrování adaptivního kódového vektoru a pevného kódového vektoru poskytovaného z jednotky pro generování excitačního vektoru 14 použitím vše-pólového modelu syntetizačního filtru 11 obsahujícího dekódované LPC koeficienty předávané z jednotky pro LPC analýzu jako filtrovací koeficienty a získává příslušný syntetizovaný adaptivní kódový vektor a syntetizovaný pevný kódové vektor.
Porovnávací jednotka 16 analyzuje vzájemný vztah mezi syntetizovaným adaptivním kódovým vektorem, syntetizovaným pevným kódovým vektorem L5 předávaným z LPC syntetizačního filtru a vstupním signálem řeči, a vypočítává příslušné optimální zesílení adaptivního kódového seznamu, kterým má být vynásoben syntetizovaný adaptivní kódové vektor, a optimální zesílení pevného kódového seznamu, kterým má být vynásoben syntetizovaný pevný kódový vektor. Porovnávací jednotka 16 dále sčítá vektor získaný vynásobením syntetizovaného adaptivního kódového vektoru optimálním zesílením adaptivního kódového seznamu a vektor získaný vynásobením syntetizovaného pevného kódového vektoru optimálním zesílením pevného kódového seznamu pro získání syntetizovaného vektoru řeči a vypočítává zkreslení mezi získaným syntetizovaným vektorem řeči a vstupním signálem řeči.
Porovnávací jednotka 16 dále vypočítává zkreslení mezi mnoha syntetizovanými vektory řeči získanými činností jednotky 14 pro generování excitačního vektoru a syntetizačního filtru 15 při
- 1 CZ 304196 B6 všech možných kombinacích adaptivních kódových vektorů uložených v adaptivním kódovém seznamu 12. a pevných kódových vektorů uložených v pevném kódovém seznamu 13. a vstupním signálem řeči, určuje index adaptivního kódového vektoru a index pevného kódového vektoru, který minimalizuje zkreslení, ze všech těchto kódových vektorů, a vysílá indexy kódových vektorů předávané z příslušných kódových seznamů, kódové vektory odpovídající indexům a optimální zesílení adaptivního kódového seznamu a optimální zesílení pevného kódového seznamu odpovídající indexům do jednotky 17 pro kódování parametru.
Jednotka 17 pro kódování parametru kóduje optimální zesílení adaptivního kódového seznamu a optimální zesílení pevného kódového seznamu pro získání kódů zesílení, a předává získané kódy zesílení, LPC kód převzatý z jednotky pro LPC analýzu 11 a indexy příslušných kódových seznamů společně pro každou zpracovávanou stránku.
Jednotka 17 pro kódování parametru dále přičítá dva vektory; vektor získaný vynásobením adaptivního kódového vektoru odpovídajícího indexu adaptivního kódového seznamu zesílením adaptivního kódového seznamu odpovídajícího kódu zesílení a vektor získaný vynásobením pevného kódového vektoru odpovídajícího indexu pevného kódového seznamu zesílením pevného kódového seznamu odpovídajícím kódu zesílení, čímž je získáván excitační vektor a aktualizuje starý adaptivní kódový vektor v adaptivním kódovém seznamu 12 získaným excitačním vektorem.
Pro syntetizační filtrování pomocí LPC syntetizačního filtru 15 je obecnou praxí, aby lineární předpovídací koeficienty, vysoko-frekvenční filtr a perceptuální váhový filtr používající dlouhodobý předpovídací koeficient získaný vykonáním dlouhodobé předpovídací analýzy vstupní řeči byly používány společně. Obecnou praxí je také to, aby vyhledávání optimálních indexů adaptivního kódového seznamu a pevného kódového seznamu, výpočet optimálních zesílení a kódovací zpracování optimálních zesílení bylo vykonáváno v jednotkách dílčích stránek získaných dílčím rozdělením stránky.
Dále bude detailně vysvětlen s odkazem na obr. 2 přehled zpracování „vektorového kvantifikování LPC vektoru“ vykonávaného pomocí jednotky 11 pro LPC analýzu. Předpokládejme, že LPC kódový seznam 22 ukládá skupinu vstupů typických LPC vektorů získaných předem aplikováním LBG algoritmu na mnoho LPC vektorů získaných skutečným vykonáváním LPC analýzy vstupních signálů řeči mnoha zpracovávaných stránek. S odkazem na LBG algoritmus, detaily této technologie byly předloženy v Dokumentu 2 (Y. Lindě, A. Buzo, R. M. Gray, „An Algorithm for Vektor Quantizer Design“, IEEE trans.Comm., Vol. COM-28, č.l, str. 84-95, Leden, 1980).
Kvantizační cílový vektor vstupující do vektorového kvantifikátoru na obr. 2 (LPC vektor získaný vykonáním LPC analýzy signálu řeči v jednotce pro zpracování stránky odpovídající kvantizačnímu cíli) je předáván do jednotky 21 pro výpočet zkreslení. Jednotka 21 pro výpočet zkreslení dále vypočítává Euklidovo zkreslení mezi LPC kódovým vektorem uloženým v LPC kódovém seznamu 22 a kvantizačním cílovým vektorem podle následující Rovnice (1):
dm = EwOGW-Mi))2 Rovnice (1) kde v Rovnici (1) x, představuje kvantizační cílový vektor, Cm je m-tý (l<=m<=M) LPC kódový vektor v LPC kódovém seznamu, i je číslo složky vektoru, N je řád vektoru (odpovídá řádu LPC analýzy) a dm je Euklidovo zkreslení mezi XT a Cm.
Jednotka 21 pro výpočet zkreslení postupně počítá Euklidovo zkreslení mezi všemi LPC kódovými vektory uloženými v LPC kódovém seznamu 22 a kvantizačním cílovým vektorem, dále následně předává výsledky výpočtů (příslušná Euklidova zkreslení) do jednotky pro vyhledávání v LPC kódovém seznamu 23. Jednotka pro vyhledávání v LPC kódovém seznamu 23 porovnává příslušná Euklidova zkreslení poskytovaná z jednotky 21 pro výpočet zkreslení a předává index
-2 CZ 304196 B6
LPC kódového vektoru, který minimalizuje Euklidovo zkreslení, jako LPC kód (kódově vyjádřené spektrální obálkové informace o zpracovávané stránce).
Na druhou stranu je možné získat dekódované LPC koeficienty (dekódovat LPC koeficienty) přečtením LPC kódového vektoru odpovídajícího indexu indikovanému LPC kódem z LPC kódového seznamu. Zpracování pro generování dekódovaných LPC koeficientů, které jsou používány pro vytvoření vše-pólového modelu LPC syntetizačního filtru, z LPC kódu je obecně vykonáváno jak v kodéru řeči, tak i v dekodéru řeči.
V mnoha kodérech/dekodérech řeči vyvinutých v poslední době LPC vektor není kvantifikován takový jaký je, a je obecnou praxí, že LPC vektor je převáděn na LSF (Line Spectral Frequency Linková Spektrální Frekvence) vektor obsahující jako složky vektoru LSF parametry nebo na LSP (Line Spectral Pairs - Linkové Spektrální Páry) vektor obsahující jako složky vektoru LSP parametry, které představují vzájemně převoditelné frekvenční doménové vektory, a poté je vektorově kvantifikován. Toto je uskutečněno proto, že vektorově-kvantifikovaný LPC vektor má po převodu na vektor ve frekvenční doméně v porovnání s přímou vektorovou-kvantifikací LPC vektoru v časové doméně vyšší efektivitu kvantifikování a vyšší interpolační charakteristiku. Vlastnosti LSF (nebo LSP) vektoru a způsob pro vzájemný převod na LPC vektor jsou popsány v Dokumentu 3 (F. Itakura, „Line Spectrum Representation of Linear Predictive Coefficients of Speech Signals“, J. Acoust. Soc. Amer., vol 157, str. S35, Duben 1975) nebo v Dokumentu 4 (L. K. Paliwal a B. S. Atal, „Efficient Vector Quantization of LPC Parametr at 24 Bits/Frame“, IEEE trans. On Speech and Audio Processing, vol. 1, str.3-14, Leden 1993).
Je-li například kvantifikován LSF vektor, pak LSF vektor LSFT[i] (i=l,....,N) ve frekvenční doméně získaný převodem LPC vektoru vstupuje do vektorového kvantifikátoru jako kvantizační cílový vektor. V tomto případě LPC kódový seznam ukládá kandidáty LSF kódových vektorů LSFm[i] (i=l,...,N), kde každý vektor obsahuje LSF parametry jako složky vektoru, a je možné vektorově-kvantifikovat cílový LSF vektor použitím stejného postupu jako v případě vektorového-kvantifikování cílového LPC vektoru. V případě kvantifikování LSF (nebo LSP) vektoru je však jako měřítko pro vyhledávání v kódovém seznamu často používáno níže uvedené váhové Euklidovo zkreslení dm podle Rovnice (2) namísto podle výše uvedené Rovnice (1).
d- = ZQw(i)’(LSFT(i)-LSF„(i))]J Rovnice (2)
Váhové Euklidovo zkreslení je detailně popsáno například v Dokumentu 4 nebo v Dokumentu 5 (A. Kataoka, T. Moriya a S. Hayashi, „An 8 kb/s Conjugate Structure CELP (CS-CELP) Speech Coder“, IEEE trans. Speech and Audio Processing, vol. 4, č. 6, str. 401—411, Listopad 1996) nebo v Dokumentu 6 (R. Hagen, E. Paksoy a A. Gersho, „Voicing-Specific LPC Quantization for Variable-Rate Speech Coding“, IEEE trans. Speech and Audio Processing, vol. 7, č. 5, str. 485 494, Září 1999).
Dekódované LSF parametry (dekódovat LSF parametry) je možno získávat přečtením LSF kódového vektoru odpovídajícího indexu indikovanému LPC kódem z LPC kódového seznamu použitím stejného způsobu jako pro získávání dekódovaných LPC koeficientů z LPC kódů, to znamená přečtením dekódovaného LPC kódového vektoru odpovídajícího LPC kódu z kódového seznamu. V tomto případě však dekódované LSF parametry přečtené na základě LPC kódu představují parametry ve frekvenční doméně. Z tohoto důvodu je požadováno další zpracování pro převod dekódovaných LSF parametrů ve frekvenční doméně na dekódované LPC koeficienty v časové doméně pro vytvoření vše-pólového modelu LPC syntetizačního filtru.
S ohledem na kodér/dekodér řeči podle CELP systému, atd., jsou LPC parametiy reprezentující krátké-časové spektrální obálkové informace signálu řeči (v tomto případě LPC koeficienty a parametry jako LSF, které jsou vzájemně převoditelné s LPC koeficienty budou obecně označovány jako „LPC parametry“) obecně zhušťovány/kódovány pomocí vektorového kvantifikátoru.
-3 CZ 304196 B6
Je-li však vektorový kvantifikátor v jednoduché konfiguraci zobrazené na obr. 2 aplikován takový jaký je, pak se budou zvyšovat kvantizační zkreslení vygenerované každou zpracovávanou stránkou, což povede k chybě při získávání přednostní syntetizované řeči. Z tohoto důvodu bylo doposud vykonáno mnoho výzkumů, jako jsou například „předpovídací vektorová kvantizační technologie“, „vícestavová vektorová kvantizační technologie“ a „rozdělená vektorová kvantizační technologie“, pro zlepšení vektorového kvantizačního výkonu. Za účelem navržení vektorového kvantifikátoru s vysokým výkonem je nezbytné použití více z těchto technologií v kombinaci.
Je-li nově navržen (nebo vylepšen) vektorový kvantifikátor LPC vektoru, pak je požadováno vyhodnocovací měřítko pro porovnání/vyhodnocení výkonu kvantifikátoru. Při vyhodnocování výkonu je přednostně používáno vyhodnocovací měřítko, ve kterém se uvažuje, že LPC parametry jsou původně parametry pro vyjádření krátkodobých spektrálních obálkových informací signálu řeči. Proto je pro vyhodnocovací měřítko výkonu často používáno CD (Cepstral Distortion — Cepstrální Zkreslení) měřítko podle níže uvedené Rovnice (3), které vyhodnocuje zkreslení v LPC cepstrum doméně odpovídající LPC spektrálnímu modelu nebo SD (Spectral Distortion Spektrální Zkreslení) měřítko podle níže uvedené Rovnice (4), které vyhodnocuje zkreslení ve FFT (Fast Fourier Transformation - Rychlá Fourierova Transformace) spektrální doméně:
CD
V CD®
L
!°gio
2]T(CEP®[i]-CEP®[i])2
Rovnice (3) kde v Rovnici (3) představuje L počet datových stránek používaných pro vyhodnocení, 1 je číslo stránky, Nc je řád LPC cepstra (má-li LPC analýza hodnotu N 10-tého řádu, Nc často dosahuje hodnoty 16-tého řádu), CEP,(1)(i) je cílové LPC cepstrum získané převodem kvantizačního cíle první zpracovávané stránky a CEPq (l)(i) je LPC cepstrum získané převodem dekódovaného LPC vektoru první zpracovávané stránky. Technologické detaily vlastností LPC cepstra a způsob vzájemného převodu mezi LPC vektorem a LPC cepstrem jsou popsány například v Dokumentu (7) (M R. Shroeder, „Direct (Nonrecursive) Relations Between Cepstrum and Predictor Coefficients“, IEEE trans, on vol. ASSP-29, č. 2, str. 297-301, Duben 1981).
(i) 10[SP,'l>(oJ)]-loglo[SP®(W,)])í · J Rovnice (4) kde v Rovnici (4) představuje L počet datových stránek používaných pro vyhodnocení, 1 je číslo stránky, Kje počet FFT bodů, SP,(®(coj) je FFT výkonové spektrum kvantizačního cíle první zpracovávané stránky, SPq (1)(mj) je FFT výkonové spektrum dekódovaného LPC vektoru první zpracovávané stránky a roj = 2nj/K. Technologické detaily vlastností SD jsou popsány například ve výše uvedeném Dokumentu (4).
Jak CD Rovnice (3), tak i SD Rovnice (4) jsou získány přičtením kvantizačního zkreslení vygenerovaného v každé zpracovávané stránce během vyhodnocování dat a poté zprůměrováním výsledku součtu pomocí počtu datových stránek ve vyhodnocovaných datech, což znamená, čím menší je CD nebo SD, tím je vyšší výkon vektorového kvantifikátoru.
Je-li LPC vektor vektorově kvantifikován, pak je jako referenční měřítko pro vyhledávání v LPC kódovém seznamu používána Rovnice (1) pro Euklidovo zkreslení nebo Rovnice (2) pro váhové Euklidovo zkreslení. Naopak, výkon LPC vektorového kvantifikátoru je obecně vyhodnocován použitím CD popsaného v Rovnici (3) nebo SD popsaného v Rovnici (4) jako vyhodnocovacího měřítko výkonu. To znamená, v doposud vyvinutých LPC vektorových kvantifikátorech je referenční měřítko používané pro vyhledávání v LPC kódovém seznamu odlišné od referenčního měřítka používaného pro vyhodnocování výkonu vektorového kvantifikátoru. Z tohoto důvodu
SD
1=) m log10W j=l
-4CZ 304196 B6
LPC kód vybraný pomocí vyhledávání v LPC kódovém seznamu nepředstavuje vždy index pro minimalizaci CD nebo SD měřítka. Toto vyvolává problémy při navrhování vektorového kvantifikátoru s vysokým výkonem.
Jako nejjednodušší způsob řešení výše uvedeného problému může být rozumné převádět kandidáta LPC vektorů na vzájemně převoditelná LPC cepstra (nebo FFT výkonová spektra) a ukládat je předem v kódovém seznamu, poté převádět cílový LPC vektor vkládaný v každé stránce na cílové LPC cepstrum (nebo na cílové FFT výkonové spektrum) a vybírat LPC cepstrální kódový vektor (nebo FFT výkonový spektrální kódový vektor) použitím CD (nebo SD) jako měřítka zkreslení. Výše uvedený způsob řešení však způsobuje drastické zvýšení paměťové kapacity pro ukládání kandidátů kódových vektorů. Dále, je-li uvažován vektorový kvantifikátor, který využívá „předpovídací vektorovou kvantizační technologii“ nebo „vícestavovou vektorovou kvantizační technologií“ často používanou v kódovacím systému řeči s nízkou bitovou rychlostí, pak je nezbytné ukládat vektory bez vzájemné převoditelnosti s LPC cepstrem (například předpovídací reziduální vektor nebo kvantizuační chybový vektor) předem do kódového seznamu, a z tohoto důvodu nemůže být výše uvedený způsob aplikován.
Podstata vynálezu
Předmětem vynálezu je vektorové kvantizační zařízení LPC parametru obsahující:
první výpočetní jednotku pro vypočtení zkreslení dm mezi souborem kódových vektorů LSFin[i] postupně přečtených z kódového seznamu pro uložení početného souboru kódových vektorů LSFm[i], a kvantizačním cílem LSF r[i] za použití prvního měřítka pro vyhodnocení zkreslení;
předvolbovou jednotku pro předběžné zvolení kódových vektorů LSFNcand(jj£i], které zmenšují velikost zkreslení dm, z uvedeného početného souboru kódových vektorů LSFm[i] podle uvedeného prvního měřítka pro vyhodnocení zkreslení;
druhou výpočetní jednotku 108 pro vypočtení zkreslení Dj mezi předběžně zvolenými kódovými vektory CEPNcaild|j][i] a uvedeným kvantizačním cílem CEPT[i] za použití druhého měřítka pro vyhodnocení zkreslení, které je odlišné od prvního měřítka pro vyhodnocení zkreslení, a pro specifikování kódového vektoru Ncand[J], který minimalizuje velikost zkreslení D,, z předběžně zvolených kódových vektorů CEPNcand[j][i] podle druhého měřítka pro vyhodnocení zkreslení a pro výstup indexové informace J specifikovaného kódového vektoru Ncand[J], přičemž podstata tohoto zařízení spočívá v tom, že předvolbová jednotka je uspořádána pro předběžné nastavení prahové hodnoty, což je velikost zkreslení podle prvního měřítka pro vyhodnocení zkreslení, a pro předběžné zvolení kódových vektorů, přičemž velikost zkreslení podle prvního měřítka pro vyhodnocení zkreslení je mešní než uvedená nastavená prahová hodnota.
Výhodně kvantizačním cílem LSFr[i] je LPC parametr, který reprezentuje krátkodobou spektrální obálkovou informaci signálu řeči.
Výhodně LPC parametrem je LPC koeficient získaný provedením lineární prediktivní analýzy signálu řeči ve zpracovatelské rámcové sekci.
Výhodně LPC parametrem je parametr získaný převodem LPC koeficientu, získaného provedením lineární prediktivní analýzy signálu řeči ve zpracovatelské rámcové sekci, na parametr ve frekvenční oblasti.
Výhodně LPC parametrem je LSF parametr získaný převodem LPC koeficientu, získaného provedením lineární prediktivní analýzy signálu řeči ve zpracovatelské rámcové sekci.
Výhodně LPC parametrem je LSP parametr získaný převodem LPC koeficientu, získaného provedením lineární prediktivní analýzy signálu řeči ve zpracovatelské rámcové sekci.
- 5 CZ 304196 Β6
Výhodně prvním měřítkem pro vyhodnocení zkreslení použitým pro výpočet zkreslení dm mezi kódovými vektory LSFm[i], postupně přečtenými z kódového seznamu, a kvantizačním cílem LSFT[i] je Euklidovo zkreslení.
Výhodně prvním měřítkem pro vyhodnocení zkreslení použitým pro výpočet zkreslení mezi kódovými vektory (LSFm[i]), postupně přečtenými z kódového seznamu, a kvantizačním cílem je vážené Euklidovo zkreslení.
Výhodně druhým měřítkem pro vyhodnocení zkreslení použitým pro vypočtení zkreslení D, mezi předběžně zvolenými kódovými vektory CEPNcand[j,[i] a kvantizačním cílem CEP2[i] je měřítko pro vyhodnocení velikosti zkreslení ve frekvenčním spektrálním prostoru.
Výhodně druhým měřítkem pro vyhodnocení zkreslení použitým pro vypočtení zkreslení Dj mezi předběžně zvolenými kódovými vektory CEPNcand|j][i] a kvantizačním cílem CEPt[í] je cepstrální zkreslení (CD).
Výhodně druhým měřítkem pro vyhodnocení zkreslení použitým pro vypočtení zkreslení mezi předběžně zvolenými kódovými vektory LSFNcand[i][i] a kvantizačním cílem CEPifi] je spektrální zkreslení SD.
Výhodně počet kódových vektorů předběžně zvolených v předvolbové jednotce je předem specifikován.
Výhodně vektorové kvantizační zařízení LPC parametru je uspořádáno pro provedení prediktivní vektorové kvantizace.
Výhodně vektorové kvantizační zařízení LPC parametru je uspořádáno pro provedení rozdělené vektorové kvantizace.
Výhodně vektorové kvantizační zařízení LPC parametru je uspořádáno pro provedení prediktivní vektorové kvantizace a rozdělené vektorovou kvantizaci.
Výhodně vektorové kvantizační zařízení LPC parametru je uspořádáno pro provedení MA prediktivní vektorové kvantizace třetího řádu, dvoustavové vektorové kvantizace a rozdělené vektorové kvantizace, pro vektorovou kvantizaci LPC parametru přivedeného na vstup jako kvantizační cíl a pro vyvedení LPC kódu na výstup.
Dalším předmětem vynálezu je kodér řeči, který obsahuje uvedené vektorové kvantizační zařízení LPC parametru, přičemž podstata tohoto kodéru řeči spočívá v tom, že dále obsahuje: adaptivní budicí kódový seznam, který reprezentuje periodickou složku vstupního signálu řeči; pevný budicí kódový seznam;
jednotku pro syntetizování syntetizovaného signálu řeči použitím budicích vektorů generovaných z pevného budicího kódového seznamu, a uvedených parametrů; a jednotku pro určení výstupů z pevného budicího kódového seznamu a adaptivního budicího kódového seznamu pro snížení zkreslení mezi vstupním signálem řeči a uvedeným syntetizovaným signálem.
Dalším předmětem vynálezu je vysílací zařízení signálu řeči opatřené uvedeným kodérem řeči obsahujícím vektorové kvantizační zařízení LPC parametru, přičemž podstata tohoto přijímacího zařízení spočívá v tom, že dále obsahuje:
adaptivní budicí kódový seznam, který zastupuje periodickou složku vstupního signálu řeči; pevný budicí kódový seznam;
-6CZ 304196 B6 jednotku pro syntetizování syntetizovaného signálu řeči použitím budicích vektorů generovaných z pevného budicího kódového seznamu a adaptivního budicího kódového seznamu, a uvedeného parametru;
jednotku pro určení výstupů z pevného budicího kódového seznamu a adaptivního budicího kódového seznamu pro snížení zkreslení mezi vstupním signálem řeči a uvedeným syntetizovaným signálem řeči.
Přehled obrázků na výkresech
Obr. 1 je blokový diagram ukazující konfiguraci kodéru řeči na základě CELP;
Obr. 2 je blokový diagram ukazující základní konfiguraci konvenčního vektorového kvantizačního zařízení LPC parametru;
Obr. 3 je blokový diagram ukazující konfiguraci vektorového kvantizačního zařízení LPC parametru podle Provedení 1 předloženého vynálezu;
Obr. 4 je blokový diagram představující způsob pro vytváření dekódovaného LPC vektoru podle Provedení 1 předloženého vynálezu;
Obr. 5 je blokový diagram ukazující konfiguraci vektorového kvantizačního zařízení LSF parametru podle Provedení 2 předloženého vynálezu;
Obr. 6 je blokový diagram ukazující konfiguraci LSF vektorového kvantizačního zařízení LSF parametru podle Provedení 3 předloženého vynálezu;
Obr. 7 je blokový diagram ukazující konfiguraci vysílacího zařízení signálu řeči a přijímacího zařízení signálu řeči podle Provedení 4 předloženého vynálezu;
Obr. 8 je blokový diagram ukazující konfiguraci kodéru řeči podle Provedení 4 předloženého vynálezu; a
Obr. 9 je blokový diagram ukazující konfiguraci dekodéru řeči podle Provedení 4 předloženého vynálezu.
Příklady provedení vynálezu
S odkazem na připojené obrázky budou nyní níže popsána provedení předloženého vynálezu.
Provedení 1
LPC vektorové kvantizační zařízení podle předloženého vynálezu bude popsáno s odkazem na obr. 3. Obr. 3 je blokový diagram ukazující konfiguraci LPC vektorového kvantizačního zařízení podle Provedení 1 předloženého vynálezu.
Toto vektorové kvantizační zařízení obsahuje kódový seznam 101, který je v zobrazeném příkladě provedení tvořen LSF kódovým seznamem, který ukládá vstupy LSF kódového vektoru, výpočetní jednotku 102, kteráje v zobrazeném příkladě provedení tvořena jednotkou pro výpočet zkreslení, která vypočítává zkreslení mezi vstupy LPS kódového vektoru v kódovém seznamu 101 a cílovým LSF vektorem, předvolbovou jednotkou 103, kteráje v zobrazeném příkladě tvořena jednotkou pro předvolbu LPC kódu, která předběžně vybírá přednastavený malý počet LPC kódů na základě zkreslení vypočtených ve výpočetní jednotce 102, LSF/LPC převodní jednotky 104 a 106, které převádějí LSF vektor na LPC koeficienty, LPC koeficient/LPC cepstrum pře-7CZ 304196 B6 vodní jednotky 105 a 107, které převádějí LPC koeficienty na LPC cepstrum, a jednotku 108 pro konečné vyhledávání, která je v zobrazeném příkladě provedení tvořena jednotkou pro konečné vyhledávání LPC kódu, která na závěr vybírá LPC kód na základě výsledků vyhodnocení zkreslení v LPC cepstrum doméně.
Předpokládejme, že kódový seznam 101 vektorového kvantizačního zařízení ve výše popsané konfiguraci ukládá M kandidátů vstupů kódového vektoru získaných předem pomocí LBG algoritmu. Dále předpokládejme, že LPC vektorové kvantizační zařízení podle tohoto provedení vykonává LPC analýzu signálu řeči v jednotce pro zpracování stránky pro získání LPC koeficientů, dále převádí získané LPC koeficienty na LSF vektor a získaný LSF vektor přivádí na vstup jako kvantizační cílový vektor. Kvantizační cílový vektor může být dále vyjádřen pomocí výrazu LSFT[i] (i=l,...,N), kde N představuje řád LPC analýzy.
Kvantizační cílový vektor LSFT[i] (i=l,.,.,Ν) přiváděný na vstup vektorového kvantizačního zařízení je nejprve předáván do výpočetní jednotky 102 a do LSF/LPC převodní jednotky 106. Na druhou stranu, kódový seznam 101 poskytuje LSF kódový vektor LSFm[i] (i=l,...,N) odpovídající instrukčním informacím (index m je poskytován jako informace) dodávaným z předvolbové jednotky 103 do výpočetní jednotky 102.
Výpočetní jednotka 102 vypočítává váhové Euklidovo zkreslení mezi kvantifikovacím cílovým vektorem LSFT[i] (i=l,...,N) a LSF kódovým vektorem LSFm[i] (i=l,...,N) podle výše popsané Rovnice (2) a předává výsledek výpočtu Dm do předvolbové jednotky 103. Předvolbová jednotka 103 po přijmutí zkreslení dm odpovídajícího indexu m ilustruje kódový seznam 101 o tom, že má předat další LSF kódový vektor odpovídající následujícímu indexu (m+1).
V případě, kódový seznam 101 ukládá M kandidátů LSF kódových vektorů, zpracování v předvolbové jednotce 103 se opakuje M krát, dokud není získáno M zkreslení mezi LSF kvantifikovacím cílovým vektorem a M kandidáty LSF vektoru, a M zkreslení je předáváno do předvolbové jednotky 103. Tímto způsobem je na vstup předvolbové jednotky 103 přivedeno M zkreslení dm (m=l,...,M) v časovém okamžiku ukončení zpracování pomocí předvolbové jednotky 103.
Předvolbová jednotka 103 porovnává hodnoty M vstupů váhových Euklidových zkreslení, a vybírá S kandidátů indexů s nejmenší hodnotou váhovou Euklidova zkreslení (v tomto provedení předpokládejme, že číslo S je přednastaveno) a zaznamenává indexy vybraných S kandidátů do Ncand[j] (j=l,...,S) (libovolný z indexů 1 až M je zaznamenán do Ncand[j]). Poté instruuje kódový seznam 101 o indexech zaznamenaných do Ncand[j] (j=l,...,S) a přijímá odpovídající LSF kódové vektory LSFNcand[j][i] (i=l,.,.,Ν,j=l,...,S) z kódového seznamu 101. Poté je S přijatých LSF kódových vektorů předáváno do LSF/LPC převodní jednotky 104.
LSF/LPC převodní jednotka 104 převádí S předběžně vybraných LSF kódových vektorů LSFNcand|j][i] (i=l ,.,.,Ν j=l ,...,S) dodávaných z předvolbové jednotky 103 na jejich příslušné LPC koeficienty pro získání LSFNcad[j][i] (i=l,...,N,j=l,...,S) a předává S sad získaných LPC koeficientů do LPC koeficient/LPC cepstrum převodní jednotky 105.
LPC koeficient/LPC cepstrum převodní jednotka 105 převádí S sad LPC koeficientů LSFNcand[j][i] (i=l,.,.,Ν j=l,...,S) předávaných z LSF/LPC převodní jednotky 104 na jejich příslušná LPC cepstra, LSFNcandU][i] (i=l ,.,.,Ν,j=l ,...,S), kde Ne je řád LPC cepstra, a předává S získaných LPC cepster do jednotky 108 pro konečné vyhledávání.
Na druhou stranu, LSF/LPC převodní jednotky 106 převádí kvantizační cíl LSFT[i] (i=l,...,N) na LPC koeficienty pro získání LPCT[i] (i=l,...,N) a předává získané koeficienty do LPC koeficient/LPC cepstrum převodní jednotky 107. LPC koeficient/LPC cepstrum převodní jednotka 107 převádí LPC koeficienty LPCT[i] (i=l,...,N) předávané z LSF/LPC převodní jednotky 106 koeficientů získané LPC cepstrum do jednotky 108 pro konečné vyhledávání.
-8CZ 304196 B6
Jednotka 108 pro konečné vyhledávání poté vypočítává zkreslení mezi S kandidáty LPC cepstra CEPNcand[j][i] (i=l ,...,Ncj=l poskytovanými LPC koeficient/LPC cepstrum převodní jednotkou 105 a cílovým LPC cepstrem CEPT][i] (i=l,...,Nc,j=l,...,S) poskytovaným LPC koeficient/LPC cepstrum převodní jednotkou 107 podle níže uvedené Rovnice (5) a ukládá příslušné výsledky výpočtů do Dj (j=l,...S).
Nc
D, =X(CEPT[i]-CEP
NcandOJ Rovnice (5) >=i
Poté jednotka 108 pro konečné vyhledávání porovnává hodnoty Dj (j=l,...S), specifikuje jeden index j, který minimalizuje Dj (specifikované j je zde vyjádřeno jako J) a předává Ncand[j] odpovídající specifikovanému J jako LPC kód relevantní zpracovávané stránky (kód pro vyjádření spektrálních obálkových informací signálu řeči relevantní zpracovávané stránky). Ze vzájemného vztahu mezi Rovnici (5) a Rovnicí (3) je zřejmé, že „J“ vybrané použitím výše uvedené minimalizační Rovnice (5) je shodné s LPC kódem (označovaným jako ,,J'“) vybraným použitím minimalizační Rovnice (3).
Pro zobecnění vysvětlení toto provedení předpokládá, že počet LSF kódových vektorů uložených v kódovém seznamu 101 je M a počet kódových vektorů předběžně vybraných pomocí předvolbové jednotky 103 je S. Výše popsaná hodnota M je určena počtem bitů přiřazených LPC parametrovému vektorovému kvantizačnímu zařízení. Je-li například vektorovému kvantizačnímu zařízení zobrazenému na obr. 3 přiřazeno 21 bitů na stránku, hodnota M dosahuje extrémně vysoké hodnoty 221. Dále, výše popsaná hodnota S může být volně nastavena, ale často je nastavena na hodnotu 8, 16 nebo 32 empiricky nebo pomocí předem vykonávaného vyhodnocovacího testu výkonu.
Dále bude vysvětleno zpracování pro generování dekódovaných LPC koeficientů (také nazývané „dekódovací zpracování LPC parametru“) z LPC kódu (Ncand[J]) předávaného z vektorového kvantizačního zařízení zobrazeného na obr. 3 použitím LPC vektorového dekodéru zobrazeného na obr. 4. Dekodér zobrazený na obr. 4 je vybaven stejným LSF kódovým seznamem 201 jako v případě vektorového kvantizačního zařízení a jednotkou 202 pro čtení kódového vektoru, která čte LSF kódový vektor z LSF kódového seznamu 201.
LPC kód Ncand[J] převáděný na vstup LPC vektorového dekodéru zobrazeného na obr. 4 je nejprve předáván do jednotky 202 pro čtení kódového vektoru. Jednotka 202 pro čtení kódového vektoru poté instruuje LSF kódový seznam 201 o tom, že má předat LSF kódový vektor odpovídající LPC kódu Ncand[J], LSF kódový seznam 201 poté předává LSFNcand|j][i] (i=l ,...,N) do jednotky 202 pro čtení kódového vektoru. Jednotka 202 pro čtení kódového vektoru předává vektor poskytovaný z LSF kódového seznamu 201 jako dekódovaný LSF vektor.
Protože dekódovaný LSF vektor předávaný z výše uvedeného LPC vektorového dekodéru představuje parametry v LSF-doméně, pro konstrukci vše-pólového modelu LPC syntetizačního filtru je vyžadováno další zpracování pro převod dekódovaného LSF vektoru z LSF-domény na dekódované LPC koeficienty v LPC doméně.
Podle výše popsaného LPC vektorového kvantizačního zařízení, je-li cílový LSF vektor, který je cílem kvantifikace, vektorově kvantifikován, je možné předběžně vybrat přednastavený malý počet LSF kódových vektorů ze všech kandidátů LSF kódových vektorů uložených v LSF kódovém seznamu použitím váhového Euklidova zkreslení jako měřítka, a je možné plně vybrat konečný kód z malého počtu předvolených kandidátů LSF kódových vektorů na základě výsledků předvolby použitím CD minimalizace jako měřítka.
-9CZ 304196 B6
Použití vektorového kvantizačního zařízení podle výše popsaného provedení proto umožňuje omezit problém konvenční technologie (problém spočívající v tom, že LPC kód vybraný pomocí vektorového kvantizačního zařízení často nesouhlasí s indexem kódového vektoru, který minimalizuje CD) bez drastického zvýšení počtu výpočtů požadovaném na LPC kódovém seznamu a umožňuje zvýšení výkonu LPC vektorového kvantizačního zařízení.
Podle tohoto provedení, porovnáme-li vektorové kvantizační zařízení podle předloženého vynálezu s vektorovým kvantizačním zařízením popsaným v části dosavadní stav techniky, vektorové kvantizační zařízení podle předloženého vynálezu mírně zvyšuje počet výpočtů požadovaný pro vyhledávání v LPC kódovém seznamu. Část odpovídající zvýšení počtu výpočtů může být shrnuta v následujících šesti bodech:
(1) Množství výpočtů pro převod kvantizačního cíle na cílové LPC koeficienty (2) Množství výpočtů pro převod cílového LPC vektoru v (1) na cílové LPC cepstrum (3) Množství výpočtů pro převod předběžně vybraného malého počtu LPC kódových vektorů na malý počet LPC koeficientů (4) Množství výpočtů pro převod malého počtu LPC vektorů v (3) na malý počet LPC cepster (5) Množství výpočtů pro výpočet zkreslení mezi cílovým LPC cepstrem v (2) a malým počtem LPC cepster v (4) (6) Množství výpočtů pro porovnání zkreslení v (5) a specifikování indexu kódového vektoru, který minimalizuje zkreslení.
V tomto případě je obecně možné řídit zvyšování výše popsaného množství výpočtů pomocí počtu kandidátů předběžně vybraných a vyloučených kódových vektorů (to proto, že (3), (4), (5) a (6) podstatně dominují množství výpočtů v (1) až (6) a tyto jsou přímo závislé na počtu kandidátů v předvolbě). To znamená, že ve vektorovém kvantizačním zařízení podle předloženého vynálezu je možné volně nastavovat dohodnutý vzájemný vztah mezi zvyšováním počtu výpočtů vyžadovaných pro vyhledávání v kódovém seznamu a zlepšováním výkonu zvyšováním/snižováním počtu předběžně vybraných kandidátů nastavených v předvolbové jednotce 103. Toto provedení tak umožňuje zvýšit výkon vektorového kvantizačního zařízení při uvažování zvýšení počtu výpočtů požadovaných pro vyhledávání v LPC kódovém seznamu.
Toto provedení dále popisuje případ, ve kterém je počet kandidátů LSF kódových vektorů povolených jednotkou pro předvolbu LPC kódu předdefinován, aleje také možné požívat jiné způsoby předvolby, jako například nastavení prahové hodnoty pro váhové Euklidovo zkreslení a ponechat kandidáta, jehož váhové Euklidovo zkreslení je menší než nastavená prahová hodnota, jako kandidáta pro vykonání předvolby, a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ, ve kterém jednotka pro předvolbu LPC kódu vykonává předvolbu LSF kódového vektoru použitím váhového Euklidova zkreslení podle Rovnice (2) jako měřítka, ale předložený vynález může být také realizován, je-li použito váhové Euklidovo zkreslení odlišné od výše uvedené Rovnice (2), jako například podle Rovnice (8) nebo Rovnice (10) ve výše uvedeném Dokumentu 4, a v tomto případě může být také dosaženo stejného účinku/funkce.
S odkazem na „váhové“ ve váhovém Euklidově zkreslení byly doposud navrženy různé způsoby výpočtů (například způsob popsaný v Dokumentu 5, kde jsou váhy vypočteny podle vzdáleností mezi sousedními prvky LSF parametrů, a způsob popsaný v Dokumentu 6, kde jsou váhy vypočteny podle výkonového spektra kvantizačního cíle), ale předložený vynález je aplikovatelný nezávisle na způsobu výpočtu „váhy“ a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ, ve kterém je LPC vektorem přiváděným na vstup vektorového kvantizačního zařízení LSF, ale předložený vynález je také aplikovatelný na případ, ve kte- 10CZ 304196 B6 rém je na vstup vektorového kvantizačního zařízení přiváděn jiný vektor vyjadřující krátkodobé spektrální obálkové informace než je LPC vektor, jako například LSP vektor nebo PARCOR vektor obsahující PARCOR parametry jako vektorové složky, a v tomto případě může být také dosaženo stejného účinku/funkce.
Je-li však jako kvantizační cíl přiváděn na vstup například LSP, je nezbytné změnit LSF/LPC převodní jednotky 104 a 106 na LPS/LPC převodní jednotky a změnit kódový seznam 101 na LPS kódový seznam.
Toto provedení dále popisuje případ, ve kterém jednotka pro konečné vyhledávání LPC kódu specifikuje konečný LPC kód použitím CD měřítka, ale jestliže jsou LPC koeficient/LPC cepstrum převodní jednotky 105, 107 nahrazeny LPC koeficient/FFT výkonové spektrum výpočetní jednotkou, která má funkci vypočítávání FFT výkonového spektra z LPC koeficientů, a výše uvedená Rovnice (5) vykonává pomocí jednotky 108 pro Konečné vyhledávání je nahrazena výpočetní rovnicí obsaženou v části druhé mocniny Rovnice (4), pak může být použito také SD (Speciál Distortion - Spektrální Zkreslení) jako měřítko pro specifikování konečného LPC kódu a v tomto případě může být také dosaženo stejného účinku/funkce.
Jak bylo vysvětleno výše, je pochopitelné, že vektorové kvantizační zařízení podle tohoto provedení je přednostně aplikovatelné v případech, ve kterých jsou krátkodobé spektrální obálkové informace signálu řeči kódovány/dekódovány kodérem/dekodérem řeči na základě CELP systému nebo Vocoder systému.
Provedení 2
Toto provedení popisuje konfiguraci vektorového kvantizačního zařízení, zpracovávací proceduru a jeho účinek/funkci v případě, že technologie podle předloženého vynálezu je aplikována na LPC kvantizační zařízení použitím předpovídací vektorové kvantizační technologie, vícestavové vektorové kvantizační technologie a rozdělené vektorové kvantizační technologie dohromady.
Konfigurace vektorového kvantizačního zařízení silně závisí na bitové rychlosti celého kodér/dekodéru řeči a na počtu bitů přiřazených LPC vektorovému kvantizačnímu zařízení. V tomto případě bude pro zjednodušení vysvětlování níže popsáno vektorové kvantizační zařízení s 21bitovou informací na zpracovávanou stránku s přiřazeným časovým intervalem 20 ms.
Pro zpřesnění dále předpokládejme, že vektorový kvantizační přístroj používaný při vysvětlování používá MA (Movin Average - Pohyblivý průměr) předpovídací technologií třetího řádu, a že používá 4 sady MA předpovídacích koeficientů na zpracovávanou stránku (pro přepínání MA předpovídacích koeficientů jsou vyžadovány 2-bitové informace). Dále předpokládejme, že vektorové kvantizační zařízení použité pro vysvětlení používá 2—stavovou vektorovou kvantizační technologii. Dále předpokládejme, že vektorové kvantizační zařízení použité pro vysvětlení používá rozdělenou vektorovou kvantizační technologii ve druhém stavu 2-stavového vektorového kvantizačního zařízení. Vektorovému kvantifikátoru prvního stavu, prvkům vektorového kvantifikátoru druhého stavu s nižší frekvencí a prvkům vektorového kvantifikátoru druhého stavu s vyšší frekvencí je přiřazeno příslušných 7 bitů, 6 bitů a 6 bitů.
Obr. 5 je blokový diagram ukazující konfiguraci vektorového kvantizačního zařízení podle Provedení 2 předloženého vynálezu. Jak je zobrazeno na obr. 5, vektorové kvantizační zařízení ve 2stavové rozdělené konfiguraci používající MA předpovídání třetího řádu, na které je aplikována technologie podle předloženého vynálezu, je vybaveno váhovou výpočetní jednotkou (WC) 301. kódovým seznamem 302 předpovídacích koeficientů (PCC), MA předpovídací jednotkou (MP) 303, předpovídací zbytkovou výpočetní jednotkou (PRC) 304, kódovým seznamem 305 prvního stavu (FSC), jednotkou 306 pro výpočet zkreslení prvního stavu (FSDCS), VQ předvolbovou jednotkou 307 prvního stavu (FSVPS), jednotkou 308 pro VQ zbytkový výpočet prvního stavu (FSVRC), kódovým seznamem 309 druhého stavu s nižší frekvencí (SSLFC), jednotkou 310 pro
- 11 CZ 304196 B6 výpočet zkreslení druhého stavu s nižší frekvencí (SSLFD), jednotkou 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí (SSHFD), kódovým seznamem 312 druhého stavu s vyšší frekvencí (SSHFC), jednotkou 313 pro vyhledávání v kódovém seznamu druhého stavu s nižší frekvencí (SSLFC), jednotkou 314 pro vyhledávání v kódovém seznamu druhého stavu s vyšší frekvencí (SSHFC), předpovídací zbytkovou dekódovací jednotkou (PRD) 315, jednotkou 316 pro generování dekódovaného LSF (DLG), převodními jednotkami 317 a 319 LSF/LPC koeficientů (LSF/LPC), převodními jednotkami 318 a 320 LPC koeficient/LPC cepstrum (LC/LC) a jednotkou 321 pro konečné vyhledávání LPC kódu (LCFS).
Při vysvětlování obr. 5 bude detailně popsáno zpracování od přivedení LSF vektoru na vstup do získání cílového vektoru vektorového kvantizačního zařízení prvního stavu (zpracování odpovídající váhové výpočetní jednotce 301, kódovému seznamu 302 předpovídacích koeficientů, MA předpovídací jednotce 303 a předpovídací zbytkové výpočetní jednotce 304.
LSF vektor přiváděný na vstup vektorového kvantizačního zařízení na obr. 5 je předáván do váhové výpočetní jednotky 301, do předpovídací zbytkové výpočetní jednotky 304 a do LSF/LPC převodní jednotky 319. Váhová výpočetní jednotka 301 vypočítává „váhu“ používanou pro výpočet váhového Euklidova zkreslení na základě LSF vektoru a předává tuto váhu (váhy) do jednotky 306 pro výpočet zkreslení prvního stavu, do jednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a do jednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí.
Jako způsob pro výpočet „váhy“ ve váhové výpočetní jednotce 301 může být použít způsob popsaný v Dokumentu 5 pro výpočet „váhy“ podle vzdálenosti mezi sousedícími prvky LSF parametrů nebo způsob popsaný v Dokumentu 6 pro výpočet „váhy“ podle výkonového spektra LSF vektoru, atd. V tomto provedení se předpokládá, že pro výpočet „váhy“ není nastaveno žádné speciální omezení.
MA předpovídací jednotka 303 vypočítává předpovídací vektory použitím dekódovaných předpovídacích zbytkových vektorů odpovídajících posledním 3 stránkám uloženým vjednotce 322 pro ukládání dekódovaného předpovídacího zbytku (DPRS) a MA předpovídacích koeficientů třetího řádu uložených v kódovém seznamu 302 předpovídacích koeficientů a předává vypočtený předpovídací vektor do předpovídací zbytkové výpočetní jednotky 304.
Předpokládá se, že výše popsané zpracování výpočtu/předávání předpovídacího vektoru je vykonáváno pro každou ze 4 sad MA předpovídacích vektorů třetího řádu uložených v kódovém seznamu 302 předpovídacích koeficientů. Z tohoto důvodu jsou z MA předpovídací jednotky 303 předávány celkem čtyři sady předpovídacích vektorů. Dále, tyto čtyři sady předpovídacích koeficientů uložené v MA předpovídací jednotce 303 jsou získávány předem aplikováním zobecněného Lloydova algoritmu uvedeného v Dokumentu 8 (S.P.Lloyd, „Least Square Quantization in PCM“, IEEE trans.Inform. Theory IT-28, str. 129-137, 1982), atd., na čtyři sady libovolně inicializovaných MA předpovídacích koeficientů. Pro zjednodušení vysvětlení v tomto případě předpokládáme, že čtyři sady MA předpovídacích koeficientů třetího řádu budou reprezentovány výrazy Mak[j][i].
Výše popsané označení k(=l,...,4) odpovídá číslu sady MA předpovídacích koeficientů třetího řádu, j(=l,...,3) odpovídá číslu stránky (j=0 odpovídá aktuálně zpracovávané stránce, j=l odpovídá stránce zpracovávané o jednu stránku před aktuálně zpracovávanou stránkou, j=2 odpovídá stránce zpracovávané o dvě stránky před aktuálně zpracovávanou stránkou, j=3 odpovídá stránce zpracovávané o tři stránky před aktuálně zpracovávanou stránkou), i (=1,...,N: N představuje řád LPC analýzy) odpovídá počtu vektorových složek předpovídacích koeficientů.
Předpovídací zbytková výpočetní jednotka 304 odděluje průměrné LSF parametry (AV[i], i=l,...N) uložené vjednotce 323 pro ukládání průměrného LSF (ALS) od LSF parametrů. Výše uvedené průměrné LSF parametry (AV[i], i=l,...N) jsou parametry získané předem ve stavu
- 12CZ 304196 Β6 předcházejícím skutečnému kódovacímu/dekódovacímu zpracování pomocí zprůměrování celých sad LSF parametrů cvičného signálu řečí, a uložené v jednotce 323 pro ukládání průměrného LSF. Poté předpovídací zbytková výpočetní jednotka 304 odděluje předpovídací vektory poskytované z MA předpovídací jednotky 303 od vektoru získaného výše uvedeným rozdělením, vypočítává předpovídací zbytkový vektor a předává vypočtený předpovídací zbytkový vektor jako cílový vektor vektorového kvantifikátoru prvního stavu do jednotky 306 pro výpočet zkreslení prvního stavu, do jednotky 308 pro VQ zbytkový výpočet prvního stavu a do jednotky 316 pro generování dekódovaného LSF.
Výše popsané zpracování výpočtu/předávání předpovídacího zbytkového vektoru je vykonáváno pro každou ze čtyř sad MA předpovídacích koeficientů. Z tohoto důvodu jsou z předpovídací zbytkové výpočetní jednotky 304 předávány celkem čtyři vstupy cílových vektorů vektorového kvantifikátoru prvního stavu.
Doposud bylo detailně popsáno zpracování po přivedení LSF parametru na vstup až do získání cílového vektoru vektorového kvantifikátoru prvního stavu. Dále bude detailně popsáno zpracování vektorového kvantifikátoru prvního stavu dvoustavového vektorového kvantifikátoru (zpracování odpovídající kódovému seznamu 305 prvního stavu, jednotce 306 pro výpočet zkreslení prvního stavu, VQ předvolbové jednotce 307 prvního stavu a jednotce 308 pro VQ zbytkový výpočet prvního stavu).
Kódová jednotka 305 prvního stavu ukládá 128 vstupů předpovídacích zbytkových kódových vektorů. Těchto 128 vstupů předpovídacích zbytkových kódových vektorů je získáno předem vykonáním sérií výše popsaných zpracování až do okamžiku, kdy je vypočten kvantizační cíl signálu řeči ve velkém počtu zpracovávaných stránek, získáním velkého počtu předpovídacích zbytkových vektorů, aplikováním LBG algoritmu na získaný velký počet předpovídacích zbytkových vektorů, vybráním 128 vstupů typických vzorků předpovídacích zbytkových vektorů a další aplikací zobecněného Lloydova algoritmu popsaného ve výše uvedeném Dokumentu 8, atd.
Jednotka 306 pro výpočet zkreslení prvního stavu vypočítává váhové Euklidovo zkreslení mezi cílovým vektorem (XK[i],i=1 ,.,.,Ν) vektorového kvantifikátoru prvního stavu poskytovaným z předpovídací zbytkové výpočetní jednotky 304 a vektorem (MAk[0][i]*Clll[i],i=l,...,N) získaným vynásobením předpovídacího zbytkového vektoru (Cm[i],i=l,...,N) s indexem m přečteným z kódového seznamu 305 prvního stavu aktuálním prvkem zpracovávané stránky MA předpovídacího koeficientu (MAk[0][i],i= 1 ,...,N) podle níže uvedené Rovnice (6) a předává hodnotu vypočteného zkreslení do VQ předvolbové jednotky prvního stavu 307.
dk,,n = £{w[i]*(Xk[i]-MAk[0][i]*CJi])}2 Rovnice (6) kde v Rovnici (6) w[i] označuje váhu vypočtenou pomocí váhové výpočetní jednotky 301, kje číslo sady (k=l,...4) MA předpovídacích koeficientů, mje index (m=l,...,128) předpovídacího zbytkového kódového vektoru v kódovém seznamu prvního stavu.
Výše popsané váhové Euklidovo zkreslení je vypočteno v jednotce 306 pro výpočet zkreslení prvního stavu pro 512 (=128*4) kombinací 128 vstupů (m=l,...,128) předpovídacích kódových vektorů (Cm[i],i=l,...,N) uložených v kódovém seznamu 305 prvního stavu a čtyř sad (k=l,...,4) MA předpovídacích koeficientů používaných pro vygenerování cílových vektorů (Χκ[ϊ],ί=1 ,...,N) poskytovaných z předpovídací zbytkové výpočetní jednotky 304. Z jednotky 306 pro výpočet zkreslení prvního stavuje proto předáváno 512 zkreslení dkm (k=l,...,4, m= 1,...,128) do VQ předvolbové jednotky prvního stavu 307.
VQ předvolbová jednotka 307 prvního stavu porovnává výše uvedených 512 zkreslení dkm (k=l,...,4, m=1,...,128) poskytovaných zjednotky 306 pro výpočet zkreslení prvního stavu, vybí- 15 CZ 304196 B6 rá N1 typů kombinovaných informací k (kterému odpovídá sada MA předpovídacích koeficientů třetího řádu ze čtyř sad MA předpovídacích koeficientů třetího řádu) a m (kterému odpovídá kódový vektor ze 128 vstupů kódových vektorů kódového seznamu 305 prvního stavu), a zaznamenává vybraná ka m do příslušných Nlcand_k[j] a do Nlcand_m[j], a předává zaznamenané Nlcand_k[j] a Nlcand_m[j] (j=l,...,Nl) do jednotky 308 pro VQ zbytkový výpočet prvního stavu, do předpovídací zbytkové dekódovací jednotky 315 a do jednotky 316 pro generování dekódovaného LSF.
Použitím sady předpovídacích koeficientů třetího řádu (přečtených z kódového seznamu 302 předpovídacích koeficientů) odpovídající informacím o NI kombinacích Nlcand_k[j] a Nlcand_m[j] (j=l,...,N 1) poskytovaných z VQ předvolbové jednotky 307 prvního stavu a kódového vektoru 305 (přečteného z kódového seznamu prvního stavu) v kódovém seznamu prvního stavu, vypočítává jednotka 308 pro VQ zbytkový výpočet prvního stavu NI zbytkových vektorů prvního stavu Xj(2)[i] (i=l,j=l,.,.,Ν 1), které zbývají po předvolbovém zpracování, podle níže uvedené Rovnice (7) a předává vypočtených NI vektorů do jednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a do jednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí.
X;2>[il = Xm-™P]-MANlaolll[0][i]‘Cmt-blli],i=l,...,N,j = l,...,Nl
Rovnice (7)
Vektorový kvantifikátor druhého stavu podle tohoto provedení přebírá rozdělenou konfigurací, rozkládající (rozdělující) VQ zbytkový vektor prvního stavu na prvky s nižší frekvencí (i=l,...,NL) a na prvky s vyšší frekvencí (i=NL+l,...,N) a vektorově kvantifikující příslušné získané vektory pomocí vzájemného rozdělení.
Vypočtený Xj(2)[i] (i=l,...,N, j=l,...,Nl) je proto předáván jednotkou 308 po VQ zbytkový výpočet prvního stavu do jednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a do jednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí v souladu s konfigurací vektorového kvantifikátoru druhého stavu. Přesněji, Χ/2'[ΐ] (i=l,...,NL, j=l,...,Nl) je předáván do jednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a Χ/2)[ί] (i=NL+l,...,N, j= 1 ,.,.,Ν 1) je předáván do jednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí.
Dosud bylo detailně popsáno zpracování vektorového kvantifikátoru prvního stavu dvou-stavového vektorového kvantifikátoru. Dále bude detailně popsáno zpracování vektorového kvantifikátoru druhého stavu dvou-stavového vektorového kvantifikátoru (zpracování odpovídající kódovému seznamu 309 druhého stavu s nižší frekvencí, jednotce 310 pro výpočet zkreslení druhého stavu s nižší frekvencí, jednotce 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí, kódovému seznamu 312 druhého stavu s vyšší frekvencí, jednotce pro vyhledávání v kódovém seznamu 313 druhého stavu s nižší frekvencí a jednotce 314 pro vyhledávání v kódovém seznamu druhého stavu s vyšší frekvencí).
Kódový seznam 309 druhého stavu s nižší frekvencí ukládá 64 vstupů kódových vektorů druhého stavu s nižší frekvencí (C2Lm2L[i], i=l,..-,NL, m2L=l,...,64). Výše uvedených 64 vstupů kódových vektorů je získáno předem vykonáním zpracování až do posledního zpracování vektorového kvantifikátoru prvního stavu, které vypočítává VQ zbytkové vektory prvního stavu v signálu řeči ve velkém počtu zpracovávaných stránek, získáním velkého počtu prvků s nižší frekvencí mnoha VQ zbytkových vektorů prvního stavu, aplikováním LBG algoritmu na tento velký počet získaných prvků s nižší frekvencí mnoha VQ zbytkových vektorů prvního stavu, vybráním 64 vstupů typických prvků s nižší frekvencí VQ zbytkových vektorů prvního stavu a dalším aplikováním zobecněného Llyodova algoritmu uvedeného v Dokumentu 8, atd., na těchto vybraných 64 vstupů typických prvků s nižší frekvencí VQ zbytkových vektorů prvního stavu.
- 14CZ 304196 B6
Naopak, kódový seznam 312 druhého stavu s vyšší frekvencí ukládá 64 vstupů kódových vektorů druhého stavu s vyšší frekvencí (C2Hm2H[i], i=NL+l,...,N, m2H=l,...,64) získaných aplikováním stejného způsobu jako je používán kódovým seznamem 309 druhého stavu s nižší frekvencí pro získání prvků s nižší frekvencí VQ zbytkových kódových vektorů prvního stavu.
Jednotka 310 pro výpočet zkreslení druhého stavu s nižší frekvencí vypočítává váhové Euklidovo zkreslení mezi prvky s nižší frekvencí Xj<2)[i] (i=l,...,NL, j=l,...,Nl) VQ zbytkového kódového vektoru prvního stavu dodávaného z jednotky 308 pro VQ zbytkový výpočet prvního stavu a vektorem (MANlcand _kD][0][i]*C2LM2L[i], i=l,...,NL) získaným vynásobením kódového vektoru druhého stavu s nižší frekvencí (C2Lm2L[i], i=l ,...,NL), s indexem m2L přečteným z kódového seznamu 309 druhého stavu s nižší frekvencí, prvkem aktuálně zpracovávané stránky (MANiCandj|j][0][i], i-l,...,NL) MA předpovídacích koeficientů podle níže uvedené Rovnice (8) a předává vypočtenou hodnotu zkreslení d2Lj m2, do jednotky 313 pro vyhledávání v kódovém seznamu druhého stavu s nižší frekvencí.
NL d2LjmIL =22í'v[ir(Xy,[i]-MANI„„d tLiJ[0][í]*C2Lm2L[i])}2, i=l j = 1,..., NI, m2L = 1,...,64
Rovnice (8) kde w[i] v Rovnici (8) představuje stejnou „váhu“ jako v Rovnici (6).
Předpokládáme, že jednotka 310 pro výpočet zkreslení druhého stavu s nižší frekvencí vykonává výpočet zkreslení podle výše uvedené Rovnice (8) pro 64 vstupů kódových vektorů uložených v kódovém seznamu 309 druhého stavu s nižší frekvencí pro každé j a předává všechna získaná váhová Euklidova zkreslení d2Lj m2L (j=l,...,Nl, m2L=l,...,64) do jednotky 313 pro vyhledávání v kódovém seznamu druhého stavu s nižší frekvencí (celkem je předáváno N1 *64 d2Lj m2L).
Jednotka 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí vykonává stejné zpracování složky vektoru s vyšší frekvencí jako jednotka 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a předává váhové Euklidovo zkreslení d2Hj m2H 0=1,.,.,Ν 1, m2H=l,...,64) do jednotky 314 pro vyhledávání v kódovém seznamu druhého stavu s vyšší frekvencí (celkem je předáváno NI *64 d2HJin2H).
Jednotka 313 pro vyhledávání v kódovém seznamu druhého stavu s nižší frekvencí specifikuje jeden index m2L, který minimalizuje zkreslení pro každé j pro váhové Euklidovo zkreslení d2Ljm2L (j=l,...,Nl, m2L=l,...,64) dodávané zjednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a zaznamenává specifikované NI (j=l,.,.,Ν 1) indexy do příslušných N2Lcand[j] (j=l,...,Nl) a předává zaznamenaných NI částí N2Lcand[j] (j=l,,.,,Ν 1) do předpovídací zbytkové dekódovací jednotky 315.
Jednotka 314 pro vyhledávání v kódovém seznamu druhého stavu s vyšší frekvencí specifikuje jeden index m2H, který minimalizuje zkreslení pro každé j pro váhové Euklidovo zkreslení d2Hj ,m2H (j 1,...,N1, m2H 1,...,64) dodavane zjednotky 311 pro vypočet zkresleni druhého stavu s vyšší frekvencí, zaznamenává specifikované NI (j=l,,.,,Ν 1) indexy do příslušných N2Hcand [j] (j=l,...,Nl) a předává zaznamenaných NI částí N2Hcand [j] (j=l,...,Nl) do předpovídací zbytkové dekódovací jednotky 315.
Dosud bylo detailně popsáno zpracování vektorového kvantifikátoru druhého stavu dvou-stavového vektorového kvantifikátoru. V okamžiku, kdy je zpracování výše uvedeného vektorového kvantifikátoru druhého stavu hotovo, do předpovídací zbytkové dekódovací jednotky 315 bylo dodáno NI (j—1 ,.,.,Ν 1) kombinací následujících čtyř částí informací:
(1) NIcand_k[j]: Která ze čtyř sad MA předpovídacích koeficientů byla předběžně vybrána (2) Nlcandmjjj: Který ze 128 vstupů kódových vektorů prvního stavu byl předběžně vybrán
- 15 CZ 304196 B6 (3) N2Lcand[j]: Který ze 64 vstupů kódových vektorů druhého stavu s nižší frekvencí byl předběžně vybrán (4) N2Hcand[j]: Který ze 64 vstupů kódových vektorů druhého stavu s vyšší frekvencí byl předběžně vybrán.
Následující popis tohoto provedení se bude detailně zabývat zpracováním pro specifikaci čísla kombinace kombinačních informací, které minimalizuje CD, z NI částí kombinovaných informací do tohoto okamžiku dodaných do předpovídací zbytkové dekódovací jednotky 315 (zpracování odpovídající předpovídací zbytkové dekódovací jednotce 315, jednotce 316 pro generování dekódovaného LSF, převodním jednotkám 317 a 319 LSF/LPC koeficientů, převodním jednotkám 318 a 320 LPC koeficient/LPC cepstrum a jednotce 321 pro konečné vyhledávání LPC kódu).
Předpovídací zbytková dekódovací jednotka 315 čte kódové vektory (CN|caild ,n[j], C2LN2Lcand[j] a C2HN2Hcand[j]) odpovídající třem vstupům indexových informací (Nlcand_m[j], N2Lcand[j] a N2Hcand[j]) z příslušného kódového seznamu 305 prvního stavu, z kódového seznamu 309 druhého stavu s nižší frekvencí a z kódového seznamu 312 druhého stavu s vyšší frekvencí, vypočítává NI (J=1,...,N1) dekódovaných předpovídacích zbytkových vektorů Cqj[i] (i=I,...,N) podle níže uvedené Rovnice (9) použitím těchto kódových vektorů, zaznamenává/zachovává vypočtené dekódované předpovídací zbytkové vektory a předává dekódované předpovídací zbytkové vektory do jednotky pro generování dekódovaného LSF 316.
Cqji] =CNlcand_m|j][i] + C2LN2LcandÍJJ[i] + C2HN2HcandD5[i], j = l,...,Nl,i = 1,...,N
Rovnice (9) kde v Rovnici (9) C2LN2Lcand|j] [i]=0.0 (I=NL+1,...,N), C2HN2Lcand[j] [i]=0.0 (1=1 „...„NL).
Předpovídací zbytková dekódovací jednotka 315 předává do jednotky 316 pro generování dekódovaného LSF také Nlcand_k[j] (j=l ,.,.,Ν 1).
Jednotka 316 pro generování dekódovaného LSF čte MAMlcand k[0][i] odpovídající Nlcand_k|j] (j=l ,.,.,Ν 1) dodávanému z předpovídací zbytkové dekódovací jednotky 315 z kódového seznamu 302 předpovídacích koeficientů, vypočítává NI (j=l,.,.,Ν 1) dekódovaných LSF parametrů (zde nadále označované jako „LSFqj[i], j=l,...,Nl, i=l,...,N) podle níže uvedené Rovnice (10) použitím výše přečteného MAnicana κ|ι|Ιθ]Ι')- průměrného LSF parametru AV[i] (i=l,...,N) přečteného z jednotky pro ukládání průměrného LSF 323, XiMicandjíDjD] odpovídajícího Nlcand_k[j] kvantizačního cílového vektoru dodávaného z předpovídací zbytkové výpočetní jednotky 304 a Cqj[i] (i=l,...,N) dodávaného z předpovídací zbytkové dekódovací jednotky 315 a předává vypočtené dekódované LSF parametry do převodní jednotky 317 LSF/LPC koeficientů.
LSFqj[i] = AV[i] + XNlcand klli[i] + MANlcand kuJL0][i]*CqJ[il, j = Ι,.,.,ΝΙ,ί = 1,...,N
Rovnice (10)
Převodní jednotka 317 LSF/LPC koeficientů převádí NI (j=l,...„Nl) dekódovaných LSF parametrů (LSFqj[i], j=l,...,Nl, i=l,...,N) dodávaných zjednotky 316 pro generování dekódovaného LSF na příslušné dekódované LPC koeficienty (zde nadále označované jako ,,LPCqj[i], j=l ,.,.,Ν 1, i=l ,.,.,Ν), a předává dekódované LPC koeficienty do převodní jednotky LPC koeficient/LPC cepstrum 318.
Převodní jednotka 318 LPC koeficient/LPC cepstrum převádí NI (j=l ,.,.,ΝΙ) dekódovaných LPC koeficientů (LPCqj[i], i=l,...,N) dodávaných z převodní jednotky 317 LSF/LPC koeficientů na
- 16CZ 304196 B6 dekódovaná LPC cepstra (zde nadále označovaná jako ,,QCEPj[i], i=l,...,Nc, j=l,...,Nl) a předává dekódovaná LPC cepstra do jednotky 321 pro konečné vyhledávání LPC kódu,
Převodní jednotka 319 LSF/LPC koeficientů převádí LSF parametry na LPC koeficienty a předává LPC koeficienty do převodní jednotky 320 LPC koeficient/LPC cepstrum. Převodní jednotka 320 LPC koeficient/LPC cepstrum převádí LPC koeficienty dodávané z převodní jednotky 319 LSF/LPC koeficientů na LPC cepstrum (zde nadále označované jako „CEP,[i], i=l ,...,Nc) a předává LPC cepstrum do jednotky 321 pro konečné vyhledávání LPC kódu.
Jednotka 321 pro konečné vyhledávání LPC kódu vypočítává zkreslení DlSj (j=l ,.,.,Ν 1) mezi LPC cepstrem (CEP,[i], i=l,...,Nc) dodávaným z převodní jednotky 320 LPC koeficient/LPC cepstrum a NI (j=l,.,.,Ν 1) dekódovanými LPC cepstry (QCEPj[i], i=l,...,Nc, j=l,-··,NI) dodávanými z převodní jednotky 318 LPC koeficient/LPC cepstrum podle níže uvedené Rovnice (11) a poté porovnává velikosti DlSj (j=l,...,Nl) a specifikuje jeden index J, který minimalizuje zkreslení.
DIS, =£(CEP,(i)-QCEP,(i))!, NI
Rovnice (11) i=l
Ze vzájemného vztahu mezi Rovnicí (11) a Rovnicí (3) je zřejmé, že je vybrán stejný index, je-li minimalizace podle výše uvedené Rovnice (11) použita jako referenční měřítko pro specifikování indexu a je-li minimalizace CD v Rovnici (3) použita jako referenční měřítko pro specifikování indexu.
Poté jsou 21-bitové informace kombinující následující čtyři položky informací odpovídající specifikovanému indexu „J“, to znamená:
(1) Nlcand_k[j]: Která ze čtyř sad MA předpovídacích koeficientů je optimální (používá 2 bity) (2) Nlcand_m[j]: Který ze 128 vstupů kódových vektorů prvního stavuje optimální (používá 7 bitů) (3) N2Lcand[j]: Který ze 64 vstupů kódových vektorů druhého stavu s nižší frekvencí je optimální (používá 6 bitů) (4) N2Hcand[j]: Který ze 64 vstupů kódových vektorů druhého stavu s vyšší frekvencí je optimální (používá 6 bitů) předávány jako LPC kód relevantní zpracovávané stránky (kód pro vyjádření spektrálních obálkových informací v jednotce pro zpracování stránky).
Vyhledávání v LPC kódovém seznamu dodává index J, který minimalizuje DlSj, do předpovídací zbytkové dekódovací jednotky 315. Poté předpovídací zbytková dekódovací jednotka 315 vybírá vektor Cqj[i] (i=l,-..,N) odpovídající indexu J zNl (j=l,- -,Nl) zachovaných/uložených dekódovaných předpovídacích zbytkových vektorů Cqj[i] (i=l,...,N) a předává jej do jednotky 322 pro ukládání dekódovaného předpovídacího zbytku.
Jednotka 322 pro ukládání dekódovaného předpovídacího zbytku vymazává nejstarší dekódovaný předpovídací zbytkový vektor z dekódovaných předpovídacích zbytkových vektorů odpovídajících skupině v minulosti uložených stránek (protože toto provedení vykonává MA předpovídání třetího řádu, jsou uloženy dekódované předpovídací zbytkové vektory odpovídající posledním třem stránkám) a nově zachovává Cqj[iJ (i=l,.,.,Ν) nově dodaný z předpovídací zbytkové dekódovací jednotky 315 pro MA předpovídání následující zpracovávané stránky.
Výklad dosud popisoval obsah sérií zpracování po přivedení LSF parametru na vstup vektorového kvantizačního zařízení až do předání LPC kódu. Na druhou stranu, dekodér LSF parametrů předávaných z vektorového kvantizačního zařízení (také dekodér LPC koeficientů získaných převodem LSF parametrů) může obsahovat krok rozkládání LPC kódu na čtyři části indexových informací (Nlcand_k[J], Nlcand_m[J], N2Lcand[J] a N2Hcand[J]), krok výpočtu dekódovaného
- 17CZ 304196 B6 předpovídacího zbytkového vektoru na základě každé části indexových informací získaných v kroku rozkládání LPC kódu a krok vygenerování dekódovaného LSF vektoru na základě dekódovaného předpovídacího zbytkového vektoru získaného v kroku vypočítávání dekódovaného předpovídacího zbytkového vektoru. Přesněji, v kroku rozkládání LPC kóduje LPC kód nejprve rozkládán na čtyři části indexových informací (Nlcand_k[J], Nlcand_m[J], N2Lcand[J] a N2Hcand[J]). Poté je možno v kroku vypočítávání dekódovaného předpovídacího zbytkového vektoru získat dekódovaný předpovídací zbytkový vektor Cq.i[i] (i=l,...,N) odpovídající LPC kódu přečtením kódového vektoru prvního stavu CN|Cand_m[j] z kódového seznamu 305 prvního stavu na základě indexových informací Nlcand_m[J], poté přečtením kódového vektoru druhého stavu s nižší frekvencí C2LN2Lcandp] z kódového seznamu 309 druhého stavu s nižší frekvencí na základě indexových informací N2Lcand[J], přečtením kódového vektoru druhého stavu s vyšší frekvencí C2HN2Hcand[j] z kódového seznamu 312 druhého stavu s vyšší frekvencí na základě indexových informací N2Hcand[J] a vykonáním dalšího zpracování popsaným v Rovnici (9) těchto tří přečtených vektorů. Poté je možné v kroku vytváření dekódovaného LSF vektoru získat konečný dekódovaný LSF parametr (zde nadále označovaný jako ,,LSFq.i[i], i=l,...,N) přečtením MANlcand k[j][O][i] odpovídajícího indexovým informacím Nlcand_k[J] z kódového seznamu 302 předpovídacích koeficientů a použitím přečteného MAN|Cand_U[J] [0][i], průměrného LSF parametru AV[i] (i=l ,.,.,Ν) přečteného z jednotky 323 pro ukládání průměrného LSF, XNicand k[j] odpovídajícího Nlcand_k[J] kvantizačního cílového vektoru poskytovaného z předpovídací zbytkové výpočetní jednotky 304 a Cqd[i] (i=l,...,N) poskytovaného z předpovídací zbytkové dekódovací jednotky 315, podle Rovnice (10). Je-li dekódovaný LSF parametr dále převáděn na dekódovaný LPC koeficient, je možné poskytovat krok obsahující stejné funkce jako má převodní jednotka 317 LSF/LPC koeficientů po výše popsaném kroku vygenerování dekódovaného LSF vektoru.
Jsou-li LSF parametry vektorově kvantifikovány, vektorové kvantizační zařízení s dvou-stavovou rozdělenou strukturou používající MA předpovídání třetího řádu, které již bylo detailně popsáno, předběžně vybírá kódy použitím váhového Euklidova zkreslení jako měřítka, a může tak vybírat optimální kódy pro zbývající kandidáty po předvolbě použitím CD (Cepstral Distortion - Cepstrální Zkreslení) jako referenčního měřítka.
Použití vektorového kvantizačního zařízení podle výše uvedeného provedení proto může vyřešit problém konvenční technologie (problém spočívající vtom, že LPC kód vybraný vektorovým kvantizačním zařízením nesouhlasí s indexem kódového vektoru, který minimalizuje CD) bez drastického zvýšení množství výpočtů požadovaných pro vyhledávání v LPC kódovém seznamu, a může zvýšit výkon vektorového kvantizačního zařízení LPC parametru.
Ve vektorovém kvantizačním zařízení podle předloženého vynálezu VQ předvolbová jednotka 307 prvního stavu řídí počet kódových vektorů, které máji být předběžně vybrány, a tím může volně řídit zvyšování množství výpočtů požadovaných pro vyhledávání v LPC kódovém seznamu obdobně jako v případě Provedení 1. To znamená, předložený vynález může zvýšit výkon vektorového kvantifikátoru, přičemž bere v úvahu množství výpočtů požadovaných pro vyhledávání v LPC kódovém seznamu.
Toto provedení dále popisuje případ, ve kterém je počet kandidátů kódových vektorů NI vybraných VQ předvolbovou jednotkou 307 prvního stavu předdefinován (NI je často nastaveno pomocí experimentů nebo empiricky na hodnoty jako je 8, 16, 32 a 64), aleje také možné používat jiné způsoby předvolby, například nastavení prahové hodnoty jako váhového Euklidova zkreslení a ponechání kandidátů, jejichž váhové Euklidovo zkreslení je menší než nastavená prahová hodnota, jako kandidátů po provedení předvolby, a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ, ve kterém VQ předvolbová jednotka 307 prvního stavu předběžně vybírá kódové vektory použitím váhového Euklidova zkreslení podle výše uvedené Rovnice (2) jako měřítka, ale předložený vynález může být také realizován, je-li použito váhové Euklidovo zkreslení, jehož matematické vyjádření se liší od výše uvedené Rovnice (2), jako
- 18CZ 304196 B6 například Rovnice (8) nebo Rovnice (10) ve výše uvedeném Dokumentu 4, a v takovém případě může být také dosaženo podobného účinku/funkce jako v tomto provedení.
S odkazem na „váhové“ ve váhovém Euklidově zkreslení byly doposud navrženy různé způsoby výpočtů (například způsob vykonávání vážení podle zkreslení mezi sousedními prvky LSF parametrů popsaný v Dokumentu 5, nebo způsob vykonávání vážení podle výkonového spektra kvantizačního cíle popsaný v Dokumentu 6), ale předložený vynález je aplikovatelný nezávisle na způsobu výpočtu „váhy“ a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ, ve kterém je vstupním vektorem LSF vektor, ale toto provedení je také aplikovatelné na případy, ve kterých jsou vektorově kvantifikovány jiné parametry vyjadřující krátkodobé spektrální obálkové informace signálu řeči, jako například LPS vektor, PARCOR koeficienty nebo LPC vektor, a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ, ve kterém jednotka pro konečné vyhledávání LPC kódu 321 specifikuje konečný LPC kód použitím CD (Cepstral Distortion - Cepstrální Zkreslení) jako měřítka, ale je také možné nahradit LPC koeficient/LPC cepstrum převodní jednotky 318 a 320 LPC koeficient/FFT výkonové spektrum výpočetní jednotkou, která má funkci vypočítávání FFT výkonového spektra z LPC koeficientu, a dále změnit výpočtovou rovnici vykonávanou jednotkou 321 pro konečné vyhledávání LPC kódu z výše uvedené Rovnice (11) na výpočtovou rovnici obsaženou v části druhé mocniny výše uvedené Rovnice (4) pro použití SD (Spectral Distortion Spektrální Zkreslení) jako konečného měřítka jednotky pro vyhledávání LPC kódu, a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ vektorového kvantifikátoru majícího pro zjednodušení vysvětlení specifickou strukturu nazývanou „Dvou-stavová rozdělená struktura používající MA předpovídání třetího řádu“, ale toto provedení je také aplikovatelné na vektorové kvantizační zařízení LPC parametru mající jinou strukturu než v tomto příkladě a v takovém případě může být také dosaženo stejného účinku/funkce.
Toto výše uvedené provedení je přednostně aplikovatelné na kódování/dekódování krátkodobých spektrálních obálkových informací signálu řeči v kodéru/dekodéru řeči založeném na CELP systému nebo na Vocoder systému.
Provedení 3
Obr. 6 je blokový diagram ukazující konfiguraci vektorového kvantizačního zařízení podle Provedení 3 předloženého vynálezu. Prvky vektorového kvantizačního zařízení zobrazené na obr. 6 shodné s prvky na obr. 5 vysvětlenými v Provedení 2 mají přiřazeny stejné odkazové značky a jejich detailní popis zde bude vynechán.
Vektorové kvantizační zařízení zobrazené na obr. 6 přebírá konfiguraci, ve které jsou k vektorovému kvantizačnímu zařízení podle obr. 5 přidány kódový seznam 350 váhových faktorů s nižší frekvencí a kódový seznam 360 váhových faktorů s vyšší frekvencí. Prvky 301 až 306 a 316 až 323 jsou na obr. 6 pro zlepšení přehlednosti obrázku vynechány.
Stejně jako v případě Provedení 2 je konfigurace vektorového kvantizačního zařízení silně závislá na bitové rychlosti celého kodéru/dekodéru řeči a na počtu bitů přiřazených vektorovému kvantizačnímu zařízení LPC parametru. V tomto případě předpokládáme pro zjednodušení vysvětlení, že jsou přiřazeny informace s 21 bity na zpracovávanou stránku o časovém intervalu 20 ms.
Dále předpokládáme, že vektorové kvantizační zařízení, které bude vysvětleno v tomto provedení, také používá MA (Mooving Avarage - Pohyblivý Průměr) předpovídací technologii třetího
- 19CZ 304196 B6 řádu a používá 4 sady (2 bity jsou požadovány jako přepínací informace) MA předpovídacích koeficientů na zpracovávanou stránku. Dále předpokládáme, že vektorové kvantizační zařízení, které bude vysvětleno v tomto provedení, používá dvou-stavovou vektorovou kvantizační technologii. Dále předpokládáme, že vektorové kvantizační zařízení, které bude vysvětleno v tomto provedeni, používá rozdělenou vektorovou kvantizační technologii pro druhý stav dvou-stavového vektorového kvantizačního zařízení. Předpokládáme, že vektorovému kvantifikátoru prvního stavu, složce vektorového kvantifikátoru druhého stavu s nižší frekvencí a složce vektorového kvantifikátoru druhého stavu s vyšší frekvencí je přiřazeno příslušných 7 bitů, 6 bitů a 6 bitů.
Vektorové kvantizační zařízení na obr. 6 vykonává zpracování po přijmutí LSF parametru na vstupu až do získání cílového vektoru vektorového kvantifikátoru prvního stavu (zpracování odpovídající váhové výpočetní jednotce 301, kódovému seznamu 302 předpovídacích koeficientů, MA předpovídací jednotce 303 a předpovídací zbytkové výpočetní jednotce 304). Detaily zpracování jsou shodné jako v případě zpracování v odpovídajících jednotkách v Provedení 2 a vysvětlení bude z tohoto důvodu v tomto provedení vynecháno.
Poté vektorové kvantizační zařízení na obr. 6 vykonává zpracování pomocí vektorového kvantifikátoru prvního stavu dvou-stavového vektorového kvantifikátoru (zpracování odpovídající kódovému seznamu 305 prvního stavu, jednotce 306 pro výpočet zkreslení prvního stavu, VQ předvolbové jednotce 307 prvního stavu a jednotce 308 pro VQ zbytkový výpočet prvního stavu).
Níže bude popsáno zpracování vektorového kvantifikátoru prvního stavu pomocí dvou-stavového vektorového kvantifikátoru vektorového kvantizačního zařízení podle tohoto provedení.
Kódová jednotka 305 prvního stavu ukládá 128 vstupů předpovídacích zbytkových kódových vektorů. Těchto 128 vstupů předpovídacích zbytkových kódových vektorů je získáno předem vykonáním sérií výše popsaných zpracování až do okamžiku, kdy je vypočten kvantizační cíl signálu řeči ve velkém počtu zpracovávaných stránek, získáním velkého počtu předpovídacích zbytkových vektorů, aplikováním LBG algoritmu na získaný velký počet předpovídacích zbytkových vektorů, vybráním 128 vstupů typických vzorků předpovídacích zbytkových vektorů a aplikací zobecněného Lloydova algoritmu popsaného ve výše uvedeném Dokumentu 8, atd., na vybraných 128 vstupů typických vektorů.
Jednotka 306 pro výpočet zkreslení prvního stavu vypočítává váhové Euklidovo zkreslení mezi cílovým vektorem (XK[i], i=l,...,N) vektorového kvantifikátoru prvního stavu poskytovaném z předpovídací zbytkové výpočetní jednotky 304 a vektorem (MAk[0][i]*Cm[i], i=l,...,N) získaným vynásobením předpovídacího zbytkového vektoru (Cm[i],i=l ,.,.,Ν) s indexem m přečteným z kódového seznamu 305 prvního stavu aktuálním prvkem zpracovávané stránky MA předpovídacího koeficientu (MAk[0][i], i=l,...,N) podle Rovnice (6) a předává hodnotu vypočteného zkreslení do VQ předvolbové jednotky prvního stavu 307. Váhové Euklidovo zkreslení je vypočteno v jednotce pro výpočet zkreslení prvního stavu 306 stejným způsobem jako v případě Provedení 2, to znamená, je vykonán výpočet všech kombinací (512=128*4) čtyř sad (k=l,...,4) MA předpovídacích koeficientů používaných pro vygenerování 128 vstupů (m=l,...,128) předpovídacích zbytkových kódových vektorů (Cm[i], i= 1 ,.,.,Ν) uložených v kódovém seznamu prvního stavu 305 a cílových vektorů (Χκ[>], i=l,-..,N) poskytovaných z předpovídací zbytkové výpočetní jednotky 304. Z jednotky pro výpočet zkreslení prvn ího stavu 306 je proto v tomto provedení také předáváno celkem 512 zkreslení dkm (k=l,...,4, m=l,..,128) do VQ předvolbové jednotky prvního stavu 307.
VQ předvolbová jednotka 307 prvního stavu porovnává výše uvedených 512 zkreslení dkll1 (k=l,...,4, m=l,...,128) poskytovaných zjednotky 306 pro výpočet zkreslení prvního stavu, vybírá NI typů kombinovaných informací k (kterému odpovídá sada MA předpovídacích koeficientů třetího řádu ze čtyř sad MA předpovídacích koeficientů třetího řádu) a m (kterému odpovídá kódový vektor ze 128 vstupů kódových vektorů kódového seznamu 305 prvního stavu), a zaznamenává vybraná k a m do příslušných Nlcand kjj] a do Nlcand_m[j], a předává zaznamenané
-20CZ 304196 B6
Nlcand_k[j] a Nlcand_m[j] (j=T,...,Nl) do jednotky 308 pro VQ zbytkový výpočet prvního stavu, do předpovídací zbytkové dekódovací jednotky 315 a do jednotky 316 pro generování dekódovaného LSF.
Podle tohoto provedení VQ předvolbová jednotka 307 prvního stavu dále předává Nlcand m[j | (j=l,.,.,Ν 1) do kódového seznamu 350 váhových faktorů s nižší frekvencí a do kódového seznamu 360 váhových faktorů s vyšší frekvencí.
Jednotka 308 pro VQ zbytkový výpočet prvního stavu vypočítává NI zbytkových vektorů prvního stavu X/2)[i] (i=l,.,.,Ν, j=l,...,N 1), které zbývají po předvolbovém zpracování, použitím sady předpovídacích koeficientů třetího řádu (přečtených z kódového seznamu 302 předpovídacích koeficientů) odpovídající informacím o NI kombinacích Nlcand_k[j] a Nlcand_m[j] (j=l,.,.,Ν 1), poskytovaných z VQ předvolbové jednotky 307 prvního stavu a kódových vektorů (přečtených z kódového seznamu 305 prvního stavu) v kódovém seznamu prvního stavu podle Rovnice (7) a předává vypočtených N1 vektorů do jednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a do jednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí.
Stejně jako v Provedení 2 předpokládáme, že vektorový kvantifikátor druhého stavu podle tohoto provedení má také rozdělenou strukturu, rozkládající (rozdělující) VQ zbytkový vektor prvního stavu na složky s nižší frekvencí (i=l,...,NL) a na složky s vyšší frekvencí (i=NL+l,..,N) a vektorově-kvantifikující příslušné vektory odděleně.
Vektor X/2)[i] (i=l,...,N, j=l,...,Nl) vypočtený jednotkou 308 pro VQ zbytkový výpočet prvního stavuje proto předáván do jednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a do jednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí v souladu s konfigurací vektorového kvantifikátoru druhého stavu. Přesněji, Χ/2)[ί] (i=l,...,NL, j=l,...,N 1) je předáván do jednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a Xj(2)[i] (i=NL+l,...,N, j=l ,.,.,Ν 1) je předáván do jednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí.
Toto je vysvětlení zpracování pomocí vektorového kvantifikátoru prvního stavu dvou-stavového vektorového kvantifikátoru.
Vektorové kvantizační zařízení na obr. 6 dále vykonává zpracování vektorového kvantifikátoru druhého stavu dvoustavového vektorového kvantifikátoru (zpracování odpovídající kódovému seznamu 309 druhého stavu s nižší frekvencí, kódovému seznamu 350 váhových faktorů s nižší frekvencí, jednotce 310 pro výpočet zkreslení druhého stavu s nižší frekvencí, jednotce 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí, kódovému seznamu váhových faktorů s vyšší frekvencí 360, kódovému seznamu 312 druhého stavu s vyšší frekvencí, jednotce pro vyhledávání v kódovém seznamu 313 druhého stavu s nižší frekvencí a jednotce pro vyhledávání v kódovém seznamu 314 druhého stavu s vyšší frekvencí). Toto provedení bude proto také detailně vysvětlovat níže uvedené zpracování pomocí výše uvedeného vektorového kvantifikátoru druhého stavu dvoustavového vektorového kvantifikátoru.
Předpokládáme, že kódový seznam 309 druhého stavu s nižší frekvencí ukládá 64 vstupů kódových vektorů druhého stavu s nižší frekvencí (C2Lit12l[í], i=l,...,NL, m2L=l,...,64) a kódový seznam 312 druhého stavu s vyšší frekvencí ukládá 64 vstupů kódových vektorů druhého stavu s vyšší frekvencí (C2Hm2H[i], i=NL+l,...,N, m2H=l,...,64).
Kódový seznam 350 váhových faktorů s nižší frekvencí má funkci ukládání takového počtu (v tomto provedení 128 vstupů) váhových faktorů s nižší frekvencí (SF_low[j], j=l, 2,...,N1) jako je počet předpovídacích zbytkových kódových vektorů uložených v kódovém seznamu 305 prvního stavu a funkci předávání váhových faktorů s nižší frekvencí (SF_low[Nlcand_m[j]]) odpovídajících Nlcand_m[j] dodávaným zVQ předvolbové jednotky 307 prvního stavu do jednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí a do předpovídací zbytkové dekódovací jednotky 315. Kódový seznam 360 váhových faktorů s vyšší frekvencí má funkci ukládání tako-21 CZ 304196 B6 vého počtu (v tomto provedení 128 vstupů) váhových faktorů s vyšší frekvencí (SF_high[j], j=l, 2,...,N1) jako je počet předpovídacích zbytkových kódových vektorů uložených v kódovém seznamu 305 prvního stavu a funkci předávání váhových faktorů s vyšší frekvencí (SFhigh|Nlcand_m(j]) odpovídajících Nlcand_m[j] dodávaným zVQ předvolbové jednotky 307 prvního stavu do jednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí a do předpovídací zbytkové dekódovací jednotky 315. Předpokládáme, že váhové faktory s nižší frekvencí (SFJowfj], j=l, 2,...,N 1) a váhové faktory s vyšší frekvencí (SF_high[j], j=l, 2,...NI) ukládají hodnoty v rozsahu 0,5 až 2,0 získané předem pomocí cvičení skládajících se z LBG algoritmu a zobecněného Lloydova algoritmu.
Jednotka 310 pro výpočet zkreslení druhého stavu s nižší frekvencí vypočítává váhové Euklidovo zkreslení mezi prvkem s nižší frekvencí Χ?2)[ί](ΐ=1 ,...,NL, j=l,...,Nl) VQ zbytkového vektoru prvního stavu dodávaného z jednotky 308 pro VQ zbytkový výpočet prvního stavu a vektorem (MAN,cand kL|][0][i]*SFJow[Nlcand_m[j]]*C2Lm2L[i],iz:=l,...,NL) získaným vynásobením kódového vektoru druhého stavu s nižší frekvencí (C2Lm2L[i], i=l,...,NL) s indexem m2L přečteným z kódového seznamu druhého stavu s nižší frekvencí 309, váhovým faktorem SF low[N lcand mfj lJ dodávaným z kódového seznamu 350 váhových faktorů s nižší frekvencí a prvkem aktuálně zpracovávané stránky (MAN]Cand k[j][O][i], i=l,...,NL) MA předpovídacích koeficientu podle mze uvedene Rovnice (12) a predava vypočtenou hodnotu zkresleni d2Lj|tl2L do jednotky pro vyhledávání v kódovém seznamu druhého stavu s nižší frekvencí 313.
NL d2Llm2L=£{w[i]*(X®[i]-MANk-lu|[0][i]«SF,o„[Nlcand_m[j]]*C2L^[i])}\ i=l j = l,...,Nl, m2L = l,...,64
Rovnice (12) kde w[i] v Rovnici (12) představuje stejnou „váhu“ jako v Rovnici (6).
Předpokládáme, že jednotka 310 pro výpočet zkreslení druhého stavu s nižší frekvencí vykonává výpočet zkreslení podle výše uvedené Rovnice (12) pro 64 vstupů kódových vektorů uložených v kódovém seznamu 309 druhého stavu s nižší frekvencí pro každých NI částí j specifikovaných VQ předvolbovou jednotkou 307 prvního stavu a předává všechna vypočtená váhová Euklidova zkreslení d2Lj>m2L (j=l,...,N 1, m2L=l,...,64) do jednotky 313 pro vyhledávání v kódovém seznamu druhého stavu s nižší frekvencí (celkem je předáváno N1 *64 d2Lj m2[ ).
Jednotka 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí vypočítává váhové Euklidovo zkreslení mezi prvkem s vyšší frekvencí Xj(2)[i](i=NL+l,...,N, j=l,...,Nl) VQ zbytkových vektorů prvního stavu dodávaných z jednotky 308 pro VQ zbytkový výpočet prvního stavu a vektorem (MA^ican<i k|j|LO][iJ*SF high|Nlcand_m|jJj*C2Hn,2H[iJ. i=NL+l,...,N) získaným vynásobením kódového vektoru druhého stavu s vyšší frekvencí (C2Hm2H[i], i=NL+l,...,N) s indexem m2H přečteným z kódového seznamu 312 druhého stavu s vyšší frekvencí, váhovým faktorem SF_high[Nlcand_m[j]] dodávaným z kódového seznamu 360 váhových faktorů s vyšší frekvencí a prvkem aktuálně zpracovávané stránky (MAN| cand_k(jj[O][i], i=NL+1 ,.,.,Ν) MA předpovídacích koeficientů podle níže uvedené Rovnice (13) a předává vypočtenou hodnotu zkreslení d2Hj m2Hdo jednotky pro vyhledávání v kódovém seznamu druhého stavu s vyšší frekvencí 314.
d2Hllnl„ . XíwlÍlAXflíl-MA.^ tl||[0][i]»SFw,[Nlcand_mD]l‘C2Hml„[i])i!, i = NL+l j = l,...,Nl, m2H = 1,...,64
Rovnice (13) kde w[i] v Rovnici (13) představuje stejnou „váhu“ jako v Rovnici (6).
-22CZ 304196 B6
Jednotka 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí vykonává výpočet zkreslení podle výše uvedené Rovnice (13) pro 64 vstupů kódových vektorů uložených v kódovém seznamu 312 druhého stavu s vyšší frekvencí pro každých NI částí j specifikovaných VQ předvolbovou jednotkou 307 prvního stavu a předává všechna vypočtená váhová Euklidova zkreslení d2H, m2H 0-1,..., NI, m2H-l,...,64) do jednotky 314 pro vyhledávání v kódovém seznamu druhého stavu s vyšší frekvencí (celkem je předáváno N1 *64 d2Hj ,m2H)·
Jednotka pro vyhledávání v kódovém seznamu 313 druhého stavu s nižší frekvencí specifikuje jeden index m2L, který minimalizuje zkreslení pro každé j pro váhové Euklidovo zkreslení d2Lj ,m2L Ο-b···,NI, m2L-l,...,64) dodávané zjednotky 310 pro výpočet zkreslení druhého stavu s nižší frekvencí, zaznamenává specifikované N1 0=1,···,NI) indexy doN2Lcand[j] (j=l,...,Nl) a předává zaznamenaných NI částí N2Lcand[j] (j=l,...,Nl) do předpovídací zbytkové dekódovací jednotky 315.
Jednotka pro vyhledávání v kódovém seznamu 314 druhého stavu s vyšší frekvencí specifikuje jeden index m2H, který minimalizuje zkreslení pro každé j pro váhové Euklidovo zkreslení d2Hjni2H (j=l,...,N 1, m2H=l,...,64) dodávané zjednotky 311 pro výpočet zkreslení druhého stavu s vyšší frekvencí, zaznamenává specifikované NI (j=l,.,.,Ν 1) indexy do příslušných N2Hcand[j] (j=l,.,.,Ν 1) a předává zaznamenaných N1 částí N2Hcand[j] (j=l ,.,.,Ν 1) do předpovídací zbytkové dekódovací jednotky 315.
Toto je vysvětlení zpracování vektorového kvantifikátoru druhého stavu dvou-stavového vektorového kvantifikátoru. V okamžiku, kdy je zpracování výše uvedeného vektorového kvantifikátoru druhého stavu hotovo, do předpovídací zbytkové dekódovací jednotky 315 je dodáno NI (j=l,...,Nl) částí kombinovaných informací s následujícími čtyřmi informačními položkami:
(1) Nlcand_k[j]: Která ze čtyř sad MA předpovídacích koeficientů je předběžně vybrána (2) Nlcand_m[j]: Který ze 128 vstupů kódových vektorů prvního stavuje předběžně vybrán (3) N2Lcand[j]: Který ze 64 vstupů kódových vektorů druhého stavu s nižší frekvencí je předběžně vybrán (4) N2Hcand[j]: Který ze 64 vstupů kódových vektorů druhého stavu s vyšší frekvencí je předběžně vybrán.
Následující popis tohoto provedení se bude detailně zabývat zpracováním pro specifikaci čísla kombinace kombinačních informací, které minimalizuje CD, z NI částí kombinačních informací dodaných do předpovídací zbytkové dekódovací jednotky 315 (zpracování odpovídající předpovídací zbytkové dekódovací jednotce 315, jednotce 316 pro generování dekódovaného LSF, převodním jednotkám 317 a 319 LSF/LPC koeficientů, převodním jednotkám 318 a 320 LPC koeficient/LPC cepstrum a jednotce 321 pro konečné vyhledávání LPC kódu).
Předpovídací zbytková dekódovací jednotka 315 čte kódový vektor prvního stavu CNlcan(j m[j], váhový faktor s nižší frekvencí SF_low[Nlcand_m[j]] a váhový faktor s vyšší frekvencí SF_high[Nlcand_m[j]] z příslušného kódového seznamu 305 prvního stavu, z kódového seznamu 350 váhových faktorů s nižší frekvencí a z kódového seznamu 360 váhových faktorů s vyšší frekvencí, na základě dodaných indexových informací Nlcand_m[j] a dále čte kódový vektor druhého stavu s nižší frekvencí C2LN2LcandU] z kódového seznamu 309 druhého stavu s nižší frekvencí na základě dodaných indexových informací N2Lcand[j], dále čte kódový vektor druhého stavu s vyšší frekvencí C2HN2HcandU] z kódového seznamu 312 druhého stavu s vyšší frekvencí na základě dodaných indexových informací N2Hcand[j], a vypočítává NI (J=l,.,.,Ν 1) dekódovaných předpovídacích zbytkových vektorů Cqj[i] (i=l ,.,.,Ν) podle níže uvedené Rovnice (14) použitím těchto kódových vektorů, zaznamenává/zachovává vypočtené dekódované předpovídací zbytkové vektory a předává je do jednotky 316 pro generování dekódovaného LSF.
-23 CZ 304196 B6
Cqji] =CNICd,<B|[i]+SFJ„[Nlcand_mDll’C2LNM,[i] + SFw[Nlcand_mD]]*C2HNMt|[i], j = l,...,Nl, i = 1,...,N
Rovnice (14) kde v Rovnici (14) C2LN2Lcand[j] [i]=0.0 (1=NL+1,...,N), C2HN2Hcand[j] [i]=0-0 (i=l,...,NL).
Předpovídací zbytková dekódovací jednotka 315 předává do jednotky 316 pro generování dekódovaného LSF také Nlcand kjj] (j=l,...,Nl).
Jednotka 316 pro generování dekódovaného LSF čte MANicand k[j] [θ][ί] odpovídající Nlcand_k[j] (j= 1 ,.,.,Ν 1) dodávanému z předpovídací zbytkové dekódovací jednotky 315 z kódového seznamu 302 předpovídacích koeficientů, vypočítává NI (j=l,...,Nl) dekódovaných LSF parametrů (zde nadále označované jako ,,LSFqj[i], j=l,...,Nl, i=l,...,N) podle Rovnice (10) použitím přečteného MAN|cand k|j] [0][i], průměrného LSF parametru AV[i] (i=l,...,N) přečteného zjednotky 323 pro ukládání průměrného LSF, XNiCand_kDi [i] odpovídajícího Nlcand kjj] kvantizačního cílového vektoru dodávaného z předpovídací zbytkové výpočetní jednotky 304 a Cqj[i] (i=l,...,N) dodávaného z předpovídací zbytkové dekódovací jednotky 315 a předává vypočtené dekódované LSF parametry do převodní jednotky 317 LSF/LPC koeficientů.
Převodní jednotka 317 LSF/LPC koeficientů převádí NI (j=l,.,.,Ν 1) dekódovaných LSF parametrů (LSFqj[i], j=l,...,Nl, i=l,...,Nl) dekódovaných LSF parametrů (LSFqjfi], j=l,...,Nl, i=l,...,N) dodávaných zjednotky 316 pro generování dekódovaného LSF na dekódované LPC koeficienty (zde nadále označované jako ,,LPCqj[i], j=l,...,Nl, i=l ,...,N), a předává dekódované LPC koeficienty do převodní jednotky 318 LPC koeficient/LPC cepstrum.
Stejně jako v případě Provedení 2, převodní jednotka 318 LPC koeficient/LPC cepstrum převádí NI (j=l,.,.,Ν 1) dekódovaných LPC koeficientů (LPCqj[i], i=l,...,N) dodávaných z převodní jednotky 317 LSF/LPC koeficientů na dekódovaná LPC cepstra (zde nadále označovaná jako ,,QCEPj[i], i=l,...,Nc, j=l,...,Nl) a předává dekódovaná LPC cepstra do jednotky 321 pro konečné vyhledávání LPC kódu.
Převodní jednotka 319 LSF/LPC koeficientů převádí LSF parametry na LPC koeficienty a předává LPC koeficienty do převodní jednotky 320 LPC koeficient/LPC cepstrum. Převodní jednotka LPC koeficient/LPC cepstrum 320 převádí LPC koeficienty dodávané z převodní jednotky 319 LSF/LPC koeficientů na LPC cepstra (zde nadále označovaná jako ,,CEPt[i], i=l ,...,Nc) a předává LPC cepstra do jednotky 321 pro konečné vyhledávání LPC kódu.
Jednotka 321 pro konečné vyhledávání LPC kódu nejprve vypočítává zkreslení DISj (j=l,.,.,Ν 1) mezí LPC cepstrem (CEP,[i], i=l,...,Nc) dodávaným z převodní jednotky 320 LPC koeficient/LPC cepstrum a NI (j=l,...,Nl) dekódovanými LPC cepstry (QCEPj[i], i=l,...,Nc, j=l,...,Nl) dodávanými z převodní jednotky 318 LPC koeficient/LPC cepstrum podle Rovnice (11), porovnává velikosti vypočtených NI částí DIS,, specifikuje jeden index J, který minimalizuje DISj, a předává 21-bitové informace kombinující následující čtyři položky informací odpovídající specifikovanému indexu „J“, to znamená:
(1) Nlcand_k[J]: Která ze čtyř sad MA předpovídacích koeficientů je optimální (používá 2 bity) (2) Nlcand_m[J]: Který ze 128 vstupů kódových vektorů prvního stavuje optimální (používá 7 bitů) (3) N2Lcand[J]: Který ze 64 vstupů kódových vektorů druhého stavu s nižší frekvencí je optimální (používá 6 bitů) (4) N2Hcand[J]: Který ze 64 vstupů kódových vektorů druhého stavu s vyšší frekvencí je optimální (používá 6 bitů)
-24CZ 304196 B6 jako LPC kód relevantní zpracovávané stránky (kód pro vyjádření spektrálních obálkových informací v jednotce pro zpracování stránky).
Stejně jako v Provedení 2, jednotka 321 pro konečné vyhledávání LPC kódu také dodává index J, který minimalizuje DISj, do předpovídací zbytkové dekódovací jednotky 315.
Poté předpovídací zbytková dekódovací jednotka 315 vybírá vektory Cqd[i] (i=l ,.,.,Ν) odpovídající indexu J zNl (j=l,.,.,Ν 1) zachovaných/uložených dekódovaných předpovídacích zbytkových vektorů Cqj[i] (i= 1 ,.,.,Ν) a předává vektory do jednotky 322 pro ukládání dekódovaného předpovídacího zbytku.
Jednotka pro ukládání dekódovaného předpovídacího zbytku 322 vymazává nej starší dekódovaný předpovídací zbytkový vektor z dekódovaných předpovídacích zbytkových vektorů odpovídajících skupině v minulosti uložených stránek (protože toto provedení vykonává MA předpovídání třetího řádu, jsou uloženy dekódované předpovídací zbytkové vektory odpovídající poslední třem stránkám) a nově zachovává Cqj[i] (i=l,.,.,Ν) nově dodaný z předpovídací zbytkové dekódovací jednotky 315 pro MA předpovídání v následující zpracovávané stránce.
Výklad dosud popisoval obsah sérií zpracování po přivedení LSF parametru na vstup vektorového kvantizačního zařízení až do předání LPC kódů.
Na druhou stranu, dekodér LSF parametrů předávaných z vektorového kvantizačního zařízení (také dekodér LPC koeficientů získaných převodem LSF parametrů) může obsahovat krok rozkládání LPC kódu na čtyři části indexových informací (Nlcand_k[J], Nlcand_m[J], N2Lcand[J] a N2Hcand[J]), krok výpočtu dekódovaných předpovídacích zbytkových vektorů na základě každé části indexových informací získaných v kroku rozkládání LPC kódu a krok vygenerování dekódovaných LSF vektorů na základě dekódovaných předpovídacích zbytkových vektorů získaných v kroku vypočítávání dekódovaných předpovídacích zbytkových vektorů. Přesněji, v kroku rozkládání LPC kódu je LPC kód nejprve rozkládán na čtyři části indexových informací (Nlcand_k[J], Nlcand_m[J], N2Lcand[J] a N2Hcand[J]). Poté je možno v kroku vypočítávání dekódovaných předpovídacích zbytkových vektorů získat dekódovaný předpovídací zbytkový vektor Cqj[i] (i=l,...,N) odpovídající LPC kódu přečtením kódového vektoru prvního stavu Cicaná mUL váhového faktoru s nižší frekvencí SF_Iow[Nlcand_m[j]] a váhového faktoru s vyšší frekvencí SF_high[Nlcand_m[j]] z kódového seznamu 305 prvního stavu, z kódového seznamu 350 váhových faktorů s nižší frekvencí a z kódového seznamu 360 váhových faktorů s vyšší frekvencí na základě indexových informací Nlcand_m[J], poté přečtením kódového vektoru druhého stavu s nižší frekvencí C2LN2Lcand[j] 2 kódového seznamu 309 druhého stavu s nižší frekvencí na základě indexových informací N2Lcand[J], dále přečtením kódového vektoru druhého stavu s vyšší frekvencí C2HN2Hcand[j] z kódového seznamu 312 druhého stavu s vyšší frekvencí na základě indexových informací N2Hcand[J] a použitím přečtených tří vstupů vektorů a dvou vstupů váhových faktorů pro vykonání součtu produktů zpracování podle Rovnice (14). Poté je možno získat konečný dekódovaný LSF parametr (zde nadále označovaný jako ,,LSFqj[i], i=l,...,N) přečtením MAN|Cand k[J] [0][i] odpovídajícího indexovým informacím Nlcand_k[J] z kódového seznamu 302 předpovídacích koeficientů a použitím přečteného MAN|cand yp][0][i], průměrného LSF parametru AV[i] (i=l ,.,.,Ν) přečteného z jednotky 323 pro ukládání průměrného LSF, XNicand k[j] odpovídajícího Nlcand_k[j] kvantizačního cílového vektoru poskytovaného z předpovídací zbytkové výpočetní jednotky 304 a Cqj[i] (i=l,...,N) poskytovaného z předpovídací zbytkové dekódovací jednotky 315, podle Rovnice (10). Je-li dekódovaný LSF parametr dále převáděn na dekódovaný LPC koeficient, je možno dále poskytovat krok obsahující stejné funkce jako má převodní jednotka 317 LSF/LPC koeficientů po výše popsaném kroku vygenerování dekódovaného LSF vektoru.
Použitím vektorového kvantizačního zařízení obsahujícího dvou-stavovou rozdělenou strukturu používající MA předpovídání třetího řádu a dále vybaveného kódovým seznamem 350 váhových faktorů s nižší frekvencí a kódovým seznamem 360 váhových faktorů s vyšší frekvencí popsa-25 CZ 304196 B6 nými detailně výše, je možno přizpůsobit rozdělení kódového vektoru druhého stavu v celém dekódovaném vektoru kódovému vektoru CNlcand m|j] (ve skutečnosti index Nlcand_m[j]) odpovídajícímu kódovému vektoru CN|Cand ιηϋ] vybranému při kvantizačním zpracování vektoru prvního stavu a řídit jej, a tím snížit kvantizační zkreslení, vykonávat předvolbu kódu použitím váhového Euklidova zkreslení jako měřítka a vybírat optimální kód použitím CD (Cepstral Distortion - Cepstrální Zkreslení) jako referenčního měřítka pro kandidáty zbývající po předvolbě, což umožňuje vektorové kvantifikování LSF parametru s vysokou přesností v porovnání s konvenčním vektorovým kvantizačním zařízením.
Použitím vektorového kvantizačního zařízení podle tohoto provedení, stejně jako v případě Provedení 2, je možné volně řídit přírůstek množství výpočtů požadovaných pro vyhledávání v LPC kódovém seznamu řízením počtu kódových vektorů, které mají být předběžně vybrány pomocí VQ předvolbové jednotky 307 prvního stavu. To znamená, toto provedení umožňuje zvýšení výkonu vektorového kvantifikátoru, přičemž bere v úvahu přírůstek množství výpočtů požadovaných pro vyhledávání v LPC kódovém seznamu.
Toto provedení dále popisuje případ, ve kterém je počet kandidátů kódových vektorů NI vybraných VQ předvolbovou jednotkou 307 prvního stavu předdefinován (NI je často nastaveno pomocí experimentů nebo empiricky na hodnoty jako je 8, 16, 32 a 64), aleje také možné používat jiné způsoby předvolby, jako je například nastavení prahové hodnoty pro váhového Euklidovo zkreslení a ponechání kandidátů, jejichž váhové Euklidovo zkreslení je menší než nastavená prahová hodnota, jako kandidáty po provedení předvolby, a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ, ve kterém VQ předvolbová jednotka 307 prvního stavu předběžně vybírá kódové vektory použitím váhového Euklidova zkreslení podle Rovnice (2) jako měřítka, ale toto provedení může být také realizováno, je-li použito váhové Euklidovo zkreslení podle rovnic odlišných od Rovnice (8) nebo Rovnice (10) ve výše uvedeném Dokumentu 4, a v takovém případě může být také dosaženo podobného účinku/funkce jako v tomto provedení.
S odkazem na „váhové“ ve váhovém Euklidově zkreslení byly doposud navrženy různé způsoby výpočtů (například způsob vykonávání vážení podle zkreslení mezi sousedními prvky LSF parametrů popsaný v Dokumentu 5 nebo způsob vykonávání vážení podle výkonového spektra kvantizačního cíle popsaný v Dokumentu 6), ale předložený vynález je aplikovatelný nezávisle na způsobu výpočtu „váhy“ a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ, ve kterém jsou vstupními vektory LSF parametry, ale toto provedení je také aplikovatelné na případ, ve kterých jsou vektorově kvantifikovány jiné parametry vyjadřující krátkodobé spektrální obálkové informace signálu řeči, jako například LSP parametr, PARCOR koeficient nebo LPC koeficient, a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje případ, ve kterém jednotka 321 pro konečné vyhledávání LPC kódu specifikuje konečný LPC kód použitím CD (Cepstral Distortion - Cepstrální Zkreslení) jako měřítka, aleje také možné nahradit LPC koeficient/LPC cepstrum převodní jednotky 318 a 320 LPC koeficient/FFT výkonové spektrum výpočetní jednotkou, která má funkci vypočítávání FFT výkonového spektra z LPC koeficientů, a dále změnit výpočtovou rovnici používanou v jednotce 321 pro konečné vyhledávání LPC kódu z Rovnice (11) na výpočtovou rovnici obsaženou v části druhé mocniny Rovnice (4) pro použití SD (Spectral Distortion - Spektrální Zkreslení) jako konečného měřítka jednotky pro vyhledávání LPC kódu, a v tomto případě může být také dosaženo stejného účinku/funkce.
Toto provedení dále popisuje vektorový kvantifikátor mající specifickou strukturu nazývanou například „dvou-stavová rozdělená struktura používající MA předpovídání třetího řádu doplněna váhovými faktory“, ale toto provedení je také aplikovatelné na vektorové kvantizační zařízení
-26CZ 304196 B6
LPC parametru mající jinou strukturu než v tomto příkladě a v takovém případě může být také dosaženo stejného účinku/funkce.
Toto výše popsané provedení je přednostně aplikovatelné na kódování/dekódování krátkodobých spektrálních obálkových informací signálů řeči v kodéru/dekodéru řeči založeném na CELP systému nebo na Vocoder systému.
Provedení 4
Obr. 7 je blokový diagram ukazující konfiguraci vysílacího zařízení signálu řeči a přijímacího zařízení signálu řeči podle Provedení 4 předloženého vynálezu. Na obr. 7 je signál řeči převáděn na elektrický signál pomocí vstupního zařízení 401 vysílacího zařízení a je předáván do A/D převodního zařízení 402. A/D převodní zařízení 402 převádí (analogový) signál řeči předávaný ze vstupního zařízení 401 na digitální signál a předává tento signál do kodéru 403 řeči.
Kodér 403 řeči kóduje digitální signál řeči předávaný z A/D převodního zařízení 402 použitím způsobu kódování řeči, který bude popsán později, a předává kódované informace do RF modulačního zařízení 404. RF modulační zařízení 404 převádí kódované informace řeči předávané z kodéru 403 řeči na signál určený k přenosu v přenosovém médiu, jako například v rádiovém frekvenčním pásmu, a předává signál do vysílací antény 405. Vysílací anténa 405 vysílá výstupní signál předávaný z RF modulačního zařízení 404 jako rádiový signál (RF signál).
RF signál vysílaný z vysílacího zařízení je přijímán pomocí přijímací antény 406 přijímacího zařízení aje předáván do RF demodulačního zařízení 407. RF demodulační zařízení 407 demoduluje kódované informace řeči z RF signálu předávaného z přijímací antény 406 a předává je do dekodéru 408 řeči.
Dekodér 408 řeči dekóduje signál řeči podle způsobu dekódování řeči, který bude popsán později, použitím kódovaných informací řeči předávaných z RF demodulačního zařízení 407 a předává jej do D/A převodního zařízení 409. D/A převodní zařízení 409 převádí digitální signál řeči předávaný z dekodéru řeči 408 na analogový elektrický signál a předává jej do výstupního zařízení 410. Výstupní zařízení 410 převádí elektrický signál na vibrace vzduchu a přenáší jej jako zvukovou vlnu slyšitelnou lidským uchem.
Poskytováním alespoň jednoho z vysílacího zařízení signálu řeči a přijímacího zařízení signálu řeči ve výše popsané konfiguraci je možno vytvořit zařízení pro základnovou stanici a komunikační koncové zařízení v mobilním komunikačním systému.
Výše popsané vysílací zařízení signálu řeči se vyznačuje kodérem řeči 403. Obr. 8 je blokový diagram ukazující konfiguraci kodéru řeči 403. Na obr. 8 je vstupním signálem řeči signál předávaný z A/D převodního zařízení 402 na obr. 7 a tento signál je přiváděn na vstup předzpracovávací jednotky 501. Předzpracovávám' jednotka 501 vykonává vysokofrekvenční filtrovací zpracování pro odstranění stejnosměrných složek, zpracování pro tvarování průběhu vlny a předzesilovací zpracování, které povede ke zvýšení výkonu následujícího kódovacího zpracování vstupního signálu řeči, a předává zpracovaný signál do jednotky 502 pro LPC analýzu, do sčítače 505 a do jednotky 513 pro určování parametru (Xin).
Jednotka pro LPC analýzu 502 vykonává lineární předpovídám' analýzu použitím Xin a předává výsledek (LPC vektor/LPC koeficienty) do kvantizačního zařízení 503 LPC parametru, která je v zobrazeném příkladě provedení tvořena LPC kvantizační jednotkou. Kvantizační zařízení 503 LPC parametru převádí LPC vektor předávaný z jednotky 502 pro LPC analýzu na LSF parametr a vektorově-kvantifikuje LSF vektor získaný pomocí převodu použitím způsobu zobrazeného v Provedeních 1, 2 a 3, a předává LPC kód (L) získaný vektorovou kvantifikací do multiplexovacíjednotky 514.
-27CZ 304196 B6
Kvantizační zařízení 503 LPC parametru dále získává dekódovaný LPC vektor v LSF doméně použitím dekódovacího způsobu LPC vektoru zobrazeného v Provedeních 1, 2 a 3, převádí získaný dekódovaný LPC (LSF) vektor na dekódované LPC koeficienty a předává dekódované LPC koeficienty získané převodem do syntetizačního filtru 504.
Syntetizační filtr 504 vykonává filtrovací syntézu použitím dekódovaných LPC koeficientů a excitačního vektoru předávaného ze sčítače 511 a předává syntetizovaný signál do sčítače 505. Sčítač 505 vypočítává chybový signál mezi Xin a syntetizovaným signálem a předává chybový signál do perceptuální váhové jednotky 512.
Perceptuáiní váhová jednotka 512 vykonává perceptuální vážení chybového signálu předávaného ze sčítače 505, vypočítává zkreslení mezi Xin a syntetizovaným signálem v perceptuální váhové doméně a předává jej do jednotky 513 pro určení výstupu z pevného budicího kódového seznamu a adaptivního budicího kódového seznamu, kteráje v zobrazeném příkladě tvořena jednotkou pro určování parametru. Jednotka 513 určuje signál, který má být vygenerován z adaptivního budicího kódového seznamu 506, zpěvného budicího kódového seznamu 508 a z jednotky 507 pro generování kvantizačního zesílení tak, aby kódovací zkreslení předávané z perceptuální váhové jednotky 512 bylo minimalizováno.
Kódovací výkon je také možno dále zvýšit nejenom pomocí minimalizace kódovacího zkreslení předávaného z perceptuální váhové jednotky 512, ale také pomocí určování signálu, který má být vygenerován ze zmíněných tří prostředků využitím jiného kódovacího zkreslení používajícího Xin.
Adaptivní budicí kódový seznam 506 ukládá do vyrovnávací paměti excitační signály předávané v minulosti ze sčítače 511, získává adaptivní excitační vektory z pozice specifikované signálem (A) předávaným z jednotky 513 a předává je do násobiče 509. Pevný budicí kódový seznam 508 předává vektory mající tvar specifikovaný signálem (F) předávaným z jednotky 513 do násobiče 510.
Jednotka 507 pro generování kvantizačního zesílení předává adaptivní excitační zesílení a pevné excitační zesílení specifikované signálem (G) předávaným z jednotky 513 do příslušných násobičů 509 a 510.
Násobič 509 násobí adaptivní excitační vektor předávaný z adaptivního budicího kódového seznam 506 kvantizovaných adaptivním budicím zesílením předávaným z jednotky 507 pro generování kvantizovaného zesílení a předává výsledek vynásobení do sčítače 511. Násobič 510 násobí pevný budicí vektor předávaný z pevného budícího kódového seznamu 508 pevným excitačním zesílením předávaným z jednotky 507 pro generování kvantizovaného zesílení a předává výsledek vynásobení do sčítače 511.
Sčítač 511 získává na vstupu adaptivní excitační vektor a pevný excitační vektor po vynásobení zesílením z příslušných násobičů 509 a 510, vykonává vektorové sčítání a předává výsledek součtu do syntetizačního filtru 504 a do adaptivního budicího kódového seznamu 506.
Konečně multiplexovací jednotka 514 získává na vstupu kód L reprezentující kvantifikovaný LPC kód z kvantizačního zařízení 503 LPC parametru, kód A reprezentující adaptivní excitační vektor, kód F reprezentující pevný excitační vektor a kód G reprezentující kvantifikované zesílení z jednotky 513 a multiplexuje tyto části informací a předává multiplexované informace jako kódované informace do přenosové cesty.
Obr. 9 je blokový diagram ukazující konfiguraci dekodéru 408 řeči na obr. 7. Na obr. 9 jsou multiplexované kódované informace předávané z RF demodulační jednotky 407 demultiplexovány na jednotlivé části kódovaných informací v demultiplexovací jednotce 601.
-28CZ 304196 B6
Demultiplexovaný LPC kód L je předáván do LPC dekódovací jednotky 602, kód A demultiplexovaného adaptivního excitačního vektoru je předáván do adaptivního excitačního kódového seznamu 605, kód G demultiplexovaného excitačního zesílení je předáván do jednotky 606 pro generování kvantifikovaného zesílení a kód F demultiplexovaného pevného excitačního vektoru je předáván do pevného excitačního kódového seznamu 607.
LPC dekódovací jednotka 602 získává dekódovaný LPC vektor z kódu L (který odpovídá LPC kódu v Provedeních 1, 2 a 3) předávaného z demultiplexovací jednotky 601 použitím způsobu generování LPC vektoru zobrazeného v Provedeních 1, 2 a 3, převádí získaný dekódovaný LPC vektor na dekódované LPC koeficienty a předává dekódované LPC koeficienty získané převodem do syntetizačního filtru 603.
Adaptivní excitační kódový seznam 605 získává adaptivní excitační vektor z pozice specifikované kódem A předávaným z demultiplexovací jednotky 601 a předává jej do násobiče 608. Pevný excitační kódový seznam 607 generuje pevný excitační vektor specifikovaný kódem F předávaným z demultiplexovací jednotky 601 a předává jej do násobiče 609.
Jednotka 606 pro generování kvantifikovaného zesílení dekóduje adaptivní excitační vektorové zesílení a pevné excitační vektorové zesílení specifikovaného kódem G excitačního zesílení předávaným z demultiplexovací jednotky 601 a předává zesílení do příslušných násobičů 608 a 609. Násobič 608 násobí adaptivní kódový vektor zesílením adaptivního kódového vektoru a předává výsledek vynásobení do sčítače 610. Násobič 609 násobí pevný kódový vektor zesílením pevného kódového vektoru a předává výsledek vynásobení do sčítače 610.
Sčítač 610 sčítá adaptivní excitační vektor a pevný excitační vektor po vynásobení zesílením předávané z násobičů 608 a 609 a předává výsledek součtu do syntetizačního filtru 603. Syntetizační filtr 603 vykonává filtrovací syntézu použitím excitačního vektoru předávaného ze sčítače 610 jako signálu zvukového zdroje a použitím syntetizačního filtru vytvořeného pomocí dekódovaných LPC koeficientů dodávaných z LPC dekódovací jednotky 602 jako filtrovacího koeficientu, a předává syntetizovaný signál do jednotky 604 následného zpracování.
Jednotka 604 následného zpracování vykonává zpracování pro zlepšení subjektivní kvality řeči jako je například formantní zvýraznění a/nebo krokové zvýraznění, a zpracování pro zlepšení subjektivní kvality řeči segmentů stacionárního šumu, atd., a předává zpracovaný signál jako konečný dekódovaný signál řeči.
Aplikací LPC vektorového kvantizačního zařízení podle předloženého vynálezu na kodér/dekodér řeči je tak možno získat syntetizovanou řeč s vyšší kvalitou než v případě kodéru/dekodéru používaného v konvenčním vektorovém kvantizačním zařízení.
Výše popsaný kodér/dekodér je dále aplikovatelný také na komunikační zařízení jako je například zařízení základnové stanice a mobilní stanice v digitálním rádiovém komunikačním systému. To umožňuje získání syntetizované řeči s vyšší kvalitou než v případě použití konvenčního vektorového kvantizačního zařízení v digitálním rádiovém komunikačním systému.
Předložený vynález není omezen výše uvedenými Provedeními 1 až 3, ale může být také realizován jejich modifikacemi různými způsoby. Vektorové kvantifikování/dekódování LPC vektoru podle Provedení 1, 2 a 3 bylo například vysvětleno jako vektorové kvantizační zařízení nebo kodér řeči/dekodér řeči, ale vektorové kvantifikování/dekódování LPC vektoru může být také realizováno pomocí software. Výše popsaný LPC vektorový kvantizační/dekódovací program je například možno uložit do ROM a program je možno spouštět pomocí příkazů z CPU. Dále je možno ukládat LPC vektorový kvantizační/dekódovací program na paměťové médium čitelné počítačem, nahrávat LPC vektorový kvantizační/dekódovací program z tohoto média do paměti RAM počítače a spouštět jej podle vektorového kvantizačního programu. V tomto případě může být také dosaženo podobného účinku/funkce jako v Provedeních 1,2 a 3.
-29CZ 304196 B6
Jak je zřejmé zvýše uvedených vysvětlení, jsou-li LPC parametry reprezentující krátkodobé spektrální obálkové informace signálu řeči vektorově kvantifikovány, předložený vynález může předběžně vybírat malé množství kódových vektorů použitím (váhového) Euklidova zkreslení jako měřítka, vykonávat vyhledávání v kódovém seznamu (specifikaci konečného LPC kódu) použitím hodnot zkreslení spektrálního prostoru jako například CD (Cepstral Distortion - Cepstrální Zkreslení) nebo SD (Spectral Distortion - Spektrální Zkreslení) jako referenčního měřítka, a následně poskytovat vektorový kvantifikátor s vyšším výkonem než v případě konvenčního vektorového kvantizačního zařízení používajícího pouze (váhové) Euklidovo měřítko jako referenční měřítko pro vyhledávání v kódovém seznamu (zkreslení ve spektrálním prostoru jako například CD a SD je menší než v konvenčním případě).
Aplikace LPC vektorového kvantizačního zařízení podle předloženého vynálezu na kodér/dekodér řeči dále umožňuje získávat syntetizovanou řeč s vyšší kvalitou než v případě kodéru/dekodéru používaném v konvenčním vektorovém kvantizaěním zařízení.
Přihláška je založena na Japonské Patentové Přihlášce č. 2000-366191 podané 30. listopadu 2000, jejíž celý obsah je zde výslovně uveden jako odkaz.
Průmyslová využitelnost
Předložený vynález je přednostně aplikovatelný na kodér/dekodér řeči používaný pro zlepšení účinnosti vysílání signálu řeči v oblasti paketového komunikačního systému reprezentovaného Internetovou komunikací a mobilním komunikačním systémem, atd.

Claims (21)

1. Vektorové kvantizační zařízení LPC parametru obsahující:
první výpočetní jednotku (102) pro vypočtení zkreslení (dm) mezi souborem kódových vektorů (LSFm[ij) postupně přečtených z kódového seznamu (101) pro uložení početného souboru kódových vektorů (LSFm[ij), a kvantizaěním cílem (LSFT[ij) za použití prvního měřítka pro vyhodnocení zkreslení;
předvolbovou jednotku (103) pro předběžné zvolení kódových vektorů (LSFNcand[j)[i])> které zmenšují velikost zkreslení (dm), z uvedeného početného souboru kódových vektorů (LSFm[i]) podle uvedeného prvního měřítka pro vyhodnocení zkreslení;
druhou výpočetní jednotku (108) pro vypočtení zkreslení (Dj) mezi předběžně zvolenými kódovými vektory (CEPNcand[j][i]) a uvedeným kvantizaěním cílem (CEPr[ij) za použití druhého měřítka pro vyhodnocení zkreslení, které je odlišné od prvního měřítka pro vyhodnocení zkreslení, a pro specifikování kódového vektoru (Ncand[Jj), který minimalizuje velikost zkreslení (Dj), z předběžně zvolených kódových vektorů (CEPNcand|j][i]) podle druhého měřítka pro vyhodnocení zkreslení a pro výstup indexové informace (J) specifikovaného kódového vektoru (Ncand[Jj), vyznačené tím, že předvolbová jednotka (103) je uspořádána pro předběžné nastavení prahové hodnoty, což je velikost zkreslení podle prvního měřítka pro vyhodnocení zkreslení, a pro předběžné zvolení kódových vektorů, přičemž velikost zkreslení podle prvního měřítka pro vyhodnocení zkreslení je mešní než uvedená nastavená prahová hodnota.
2. Vektorové kvantizační zařízení LPC parametru podle nároku 1, vyznačené tím, že kvantizaěním cílem (LSFT[ij) je LPC parametr, který reprezentuje krátkodobou spektrální obálkovou informaci signálu řeči.
-30CZ 304196 B6
3. Vektorové kvantizační zařízení LPC parametru podle nároku 1 nebo 2, vyznačené tím, že LPC parametrem je LPC koeficient získaný provedením lineární prediktivní analýzy signálu řeči ve zpracovatelské rámcové sekci.
4. Vektorové kvantizační zařízení LPC parametru podle jednoho z nároků 1 až 3, vyznačené tím, že LPC parametrem je parametr získaný převodem LPC koeficientu, získaného provedením lineární prediktivní analýzy signálu řeči ve zpracovatelské rámcové sekci, na parametr ve frekvenční oblasti.
5. Vektorové kvantizační zařízení LPC parametru podle jednoho z nároků 1 až 4, vyznačené tím, že LPC parametrem je LSF parametr získaný převodem LPC koeficientu, získaného provedením lineární prediktivní analýzy signálu řeči ve zpracovatelské rámcové sekci.
6. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 4, vyznačené tím, že LPC parametrem je LSP parametr získaný převodem LPC koeficientu, získaného provedením lineární prediktivní analýzy signálu řeči ve zpracovatelské rámcové sekci.
7. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 6, vyznačené tím, že prvním měřítkem pro vyhodnocení zkreslení použitým pro výpočet zkreslení (dm) mezi kódovými vektory (LSFm[ij), postupně přečtenými z kódového seznamu (101), a kvantizačním cílem (LSFT[ij) je Euklidovo zkreslení.
8. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 7, vy z n ač e n é tím, že prvním měřítkem pro vyhodnocení zkreslení použitým pro výpočet zkreslení mezi kódovými vektory (LSFm[ij), postupně přečtenými z kódového seznamu (101), a kvantizačním cílem je vážené Euklidovo zkreslení.
9. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 8, vyznačené t í m , že druhým měřítkem pro vyhodnocení zkreslení použitým pro vypočtení zkreslení (Dj) mezi předběžně zvolenými kódovými vektory (CEPNcand|j][i]) a kvantizačním cílem (CEPT[i]) je měřítko pro vyhodnocení velikosti zkreslení ve frekvenčním spektrálním prostoru.
10. Vektorové kvantizační zařízení LPC parametru podle nároku 9, vyznačené tím, že druhým měřítkem pro vyhodnocení zkreslení použitým pro výpočet zkreslení (Dj) mezi předběžně zvolenými kódovými vektory (CEPNcand|j][i]) a kvantizačním cílem (CEPT[ij) je cepstrální zkreslení (CD).
11. Vektorové kvantizační zařízení LPC parametru podle nároku 9, vyznačené tím, že druhým měřítkem pro vyhodnocení zkreslení použitým pro vypočtení zkreslení mezi předběžně zvolenými kódovými vektory (LSFNcand[i]) a kvantizačním cílem (LSFT[i]) je spektrální zkreslení (SD).
12. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 11, v y z n a čené tím, že počet kódových vektorů předběžně zvolených v předvolbové jednotce (103) je předem specifikován.
13. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 12, vy z n a čené tím, že je uspořádáno pro provedení prediktivní vektorové kvantizace.
14. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 12, v y z n a čené tím, že je uspořádáno pro provedení rozdělené vektorové kvantizace.
-31 CZ 304196 B6
15. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 12, v y z n a č e n é tím, že je uspořádáno pro provedení prediktivní vektorové kvantizace a rozdělené vektorovou kvantizací.
16. Vektorové kvantizační zařízení LPC parametru podle některého z nároků 1 až 15, vyznač e n é t í m , že je uspořádáno pro provedení MA prediktivní vektorové kvantizace třetího řádu, dvoustavové vektorové kvantizace a rozdělené vektorové kvantizace, pro vektorovou kvantizaci LPC parametru přivedeného na vstup jako kvantizační cíl a pro vyvedení LPC kódu na výstup.
17. Kodér řeči obsahující vektorové kvantizační zařízení (503) LPC parametru podle některého z nároků 1 až 16, vyznačené tím, že dále obsahuje:
adaptivní budicí kódový seznam (506), který reprezentuje periodickou složku vstupního signálu řeči;
pevný budicí kódový seznam (508);
jednotku (504) pro syntetizování syntetizovaného signálu řeči použitím budicích vektorů generovaných z pevného budicího kódového seznamu (508), a uvedených parametrů; a jednotku (513) pro určení výstupů zpěvného budicího kódového seznamu (508) a adaptivního budicího kódového seznamu (506) pro snížení zkreslení mezi vstupním signálem řeči a uvedeným syntetizovaným signálem.
18. Vysílací zařízení signálu řeči opatřené kodérem (403) řeči obsahujícím vektorové kvantizační zařízení (503) LPC parametru podle nároků 1 až 16, v y z n a č e n é t í m , že dále obsahuje:
adaptivní budicí kódový seznam (506), který zastupuje periodickou složku vstupního signálu řeči;
pevný budicí kódový seznam (508);
jednotku (504) pro syntetizování syntetizovaného signálu řeči použitím budicích vektorů generovaných z pevného budicího kódového seznamu (508) a adaptivního budicího kódového seznamu (506), a uvedeného parametru;
jednotku (513) pro určení výstupů zpěvného budicího kódového seznamu (508) a adaptivního budicího kódového seznamu (506) pro snížení zkreslení mezi vstupním signálem řeči a uvedeným syntetizovaným signálem řeči.
9 výkresů
Seznam vztahových značek:
11 - Jednotka pro LPC analýzu
12 - Adaptivní kódový seznam
13 - Pevný kódový seznam
14 - Jednotka pro generování excitačního vektoru
15 - LPC syntetizační filtr
16 - Porovnávací jednotka
17 - Jednotka pro kódování parametru
21 - Jednotka pro výpočet zkreslení
22 - LPC kódový seznam
23 - Jednotka pro vyhledávání v LPC kódovém seznamu
101 - Kódový seznam
102 - Výpočetní jednotka
103 - Předvolbová jednotka
104 - Převodní jednotka LSF/LPC koeficientů
105 - LPC koeficient/LPC cepstrum převodní jednotka
106 - Převodní jednotka LSF/LPC koeficientů
107 - LPC koeficient/LPC cepstrum převodní jednotka
108 - Jednotka pro konečné vyhledávání
201 - LSF kódový seznam
202 - Jednotka pro čtení kódového vektoru
301 - Váhová výpočetní jednotka (WC)
302 - Kódový seznam předpovídacích koeficientů (PCC)
303 - MA předpovídací jednotka (MP)
304 - Předpovídací zbytková výpočetní jednotka (PRC)
305 - Kódový seznam prvního stavu (FSC)
306 - Jednotka pro výpočet zkreslení prvního stavu (FSDCS)
307 - VQ předvolbová jednotka prvního stavu (FSVPS)
308 - Jednotka pro VQ zbytkový výpočet prvního stavu (FSVRC)
309 - Kódový seznam druhého stavu s nižší frekvencí (SSLFC)
310 - Jednotka pro výpočet zkreslení druhého stavu s nižší frekvencí (SSLFD)
311 - Jednotka pro výpočet zkreslení druhého stavu s vyšší frekvencí (SSHFD)
312 - Kódový seznam druhého stavu s vyšší frekvencí (SSHFC)
313 - Jednotka pro vyhledávání v kódovém seznamu druhého stavu s nižší frekvencí (SSLFC)
314 - Jednotka pro vyhledávání v kódovém seznamu druhého stavu s vyšší frekvencí (SSHFC)
315 - Předpovídací zbytková dekódovací jednotka (PRD)
316 - Jednotka pro generování dekódovaného LSF (DLG)
317 - Převodní jednotka LSF/LPC koeficientů (LSF/LPC)
318 - Převodní jednotka LPC koeficient/LPC cepstrum (LC/LC)
319 - Převodní jednotka LSF/LPC koeficientů (LSF/LPC)
320 - Převodní jednotka LPC koeficient/LPC cepstrum (LC/LC)
321 - Jednotka pro konečné vyhledávání LPC kódu (LCFS)
350 - Kódový seznam váhových faktorů s nižší frekvencí
360 - Kódový seznam váhových faktorů s vyšší frekvencí
401 - Vstupní zařízení
402 - A/D převodní zařízení
403 - Kodér řeči
404 - RF modulační zařízení
405 - Vysílací anténa
406 - Přijímací anténa
407 - RF demodulační zařízení
408 - Dekodér řeči
409 - D/A převodní zařízení
410 - Výstupní zařízení
501 - Předzpracovávací jednotka
502 - Jednotka pro LPC analýzu
503 - Kvantizační zařízení LPC parametru
504 - Jednotka pro syntetizování syntetizovaného signálu
505 - Sčítač
506 - Adaptivní budicí kódový seznam
507 - Jednotka pro generování kvantifikovaného zesílení
508 - Pevný budicí kódový seznam
509 - Násobič
510 - Násobič
511 - Sčítač
512 - Perceptuální váhová jednotka
513 - Jednotka pro určení výstup zpěvného budicího kódového seznamu a adaptivního budicího kódového seznamu
514 - Multiplexovací jednotka
601 - Demultiplexovací jednotka
602 - LPC dekódovací jednotka
603 - Syntetizační filtr
604 - Jednotka následného zpracování
605 - Adaptivní excitační kódový seznam
606 - Jednotka pro generování kvantifikovaného zesílení
-33 CZ 304196 B6
607 - Pevný excitační kódový seznam
608 - Násobič
609 - Násobič
610 - Sčítač
CZ2003-1500A 2000-11-30 2001-11-29 Vektorové kvantizační zařízení LPC parametru, kodér řeči a přijímací zařízení signálu řeči CZ304196B6 (cs)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000366191 2000-11-30

Publications (2)

Publication Number Publication Date
CZ20031500A3 CZ20031500A3 (cs) 2003-10-15
CZ304196B6 true CZ304196B6 (cs) 2013-12-27

Family

ID=18836849

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ2003-1500A CZ304196B6 (cs) 2000-11-30 2001-11-29 Vektorové kvantizační zařízení LPC parametru, kodér řeči a přijímací zařízení signálu řeči

Country Status (9)

Country Link
US (1) US7392179B2 (cs)
EP (2) EP1339040B1 (cs)
KR (2) KR100872538B1 (cs)
CN (1) CN1200403C (cs)
AU (1) AU2002218501A1 (cs)
CA (2) CA2429832C (cs)
CZ (1) CZ304196B6 (cs)
DE (1) DE60137359D1 (cs)
WO (1) WO2002045077A1 (cs)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7453936B2 (en) * 2001-11-09 2008-11-18 Sony Corporation Transmitting apparatus and method, receiving apparatus and method, program and recording medium, and transmitting/receiving system
JP3887598B2 (ja) * 2002-11-14 2007-02-28 松下電器産業株式会社 確率的符号帳の音源の符号化方法及び復号化方法
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
WO2005112005A1 (ja) * 2004-04-27 2005-11-24 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
KR100647290B1 (ko) * 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
US7693921B2 (en) * 2005-08-18 2010-04-06 Texas Instruments Incorporated Reducing computational complexity in determining the distance from each of a set of input points to each of a set of fixed points
KR100735246B1 (ko) * 2005-09-12 2007-07-03 삼성전자주식회사 오디오 신호 전송 장치 및 방법
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
JPWO2008072732A1 (ja) * 2006-12-14 2010-04-02 パナソニック株式会社 音声符号化装置および音声符号化方法
CN101617363B (zh) * 2007-02-21 2012-09-05 艾利森电话股份有限公司 双端话音检测器
EP2202727B1 (en) * 2007-10-12 2018-01-10 III Holdings 12, LLC Vector quantizer, vector inverse quantizer, and the methods
US8306007B2 (en) * 2008-01-16 2012-11-06 Panasonic Corporation Vector quantizer, vector inverse quantizer, and methods therefor
CA2729751C (en) * 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
CN101630510B (zh) * 2008-07-18 2012-03-28 上海摩波彼克半导体有限公司 Amr语音编码中lsp系数量化的快速码本搜索的方法
CN101409075B (zh) * 2008-11-27 2011-05-11 杭州电子科技大学 一种g.729标准中线谱对系数转换及量化的改进方法
JP5335004B2 (ja) * 2009-02-13 2013-11-06 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
CN102906812B (zh) * 2010-04-08 2016-08-10 Lg电子株式会社 处理音频信号的方法和装置
US20110313756A1 (en) * 2010-06-21 2011-12-22 Connor Robert A Text sizer (TM)
WO2012035781A1 (ja) 2010-09-17 2012-03-22 パナソニック株式会社 量子化装置及び量子化方法
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
ES2745143T3 (es) * 2012-03-29 2020-02-27 Ericsson Telefon Ab L M Cuantificador vectorial
WO2014009775A1 (en) * 2012-07-12 2014-01-16 Nokia Corporation Vector quantization
CN104584123B (zh) * 2012-08-29 2018-02-13 日本电信电话株式会社 解码方法、以及解码装置
ES2716652T3 (es) * 2013-11-13 2019-06-13 Fraunhofer Ges Forschung Codificador para la codificación de una señal de audio, sistema de transmisión de audio y procedimiento para la determinación de valores de corrección
EP4095854A1 (en) * 2014-01-15 2022-11-30 Samsung Electronics Co., Ltd. Weight function determination device and method for quantizing linear prediction coding coefficient
TR201900472T4 (tr) * 2014-04-24 2019-02-21 Nippon Telegraph & Telephone Frekans alanı parametre dizisi oluşturma metodu, kodlama metodu, kod çözme metodu, frekans alanı parametre dizisi oluşturma aparatı, kodlama aparatı, kod çözme aparatı, programı ve kayıt ortamı.
ES2843300T3 (es) * 2014-05-01 2021-07-16 Nippon Telegraph & Telephone Codificación de una señal de sonido
KR102298767B1 (ko) * 2014-11-17 2021-09-06 삼성전자주식회사 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법
US10325609B2 (en) * 2015-04-13 2019-06-18 Nippon Telegraph And Telephone Corporation Coding and decoding a sound signal by adapting coefficients transformable to linear predictive coefficients and/or adapting a code book
EP3555886B1 (en) * 2016-12-16 2020-05-13 Telefonaktiebolaget LM Ericsson (PUBL) Methods, encoder and decoder for handling line spectral frequency coefficients
CN112669857B (zh) * 2021-03-17 2021-05-18 腾讯科技(深圳)有限公司 一种语音处理的方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5651026A (en) * 1992-06-01 1997-07-22 Hughes Electronics Robust vector quantization of line spectral frequencies
US6134520A (en) * 1993-10-08 2000-10-17 Comsat Corporation Split vector quantization using unequal subvectors
EP0684702B1 (en) * 1994-05-27 2002-10-30 Kabushiki Kaisha Toshiba Vector quantizing apparatus
EP0831457B1 (en) * 1996-09-24 2003-12-03 Sony Corporation Vector quantization method and speech encoding method and apparatus
EP1103953B1 (en) * 1999-11-23 2006-08-16 Texas Instruments Incorporated Method for concealing erased speech frames

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0650440B2 (ja) 1985-05-02 1994-06-29 日本電気株式会社 Lsp型パタンマツチングボコ−ダ
JP2562037B2 (ja) * 1987-10-07 1996-12-11 サカタインクス株式会社 プレス加工用被覆剤組成物
JP2702157B2 (ja) 1988-06-21 1998-01-21 三菱電機株式会社 最適音源ベクトル探索装置
JP3296363B2 (ja) 1991-04-30 2002-06-24 日本電信電話株式会社 音声の線形予測パラメータ符号化方法
US5495555A (en) 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5734789A (en) 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
CA2135629C (en) * 1993-03-26 2000-02-08 Ira A. Gerson Multi-segment vector quantizer for a speech coder suitable for use in a radiotelephone
JP3144194B2 (ja) 1993-12-27 2001-03-12 日本電気株式会社 音声符号化装置
JP3471889B2 (ja) 1994-04-01 2003-12-02 株式会社東芝 音声符号化方法及び装置
JP3179291B2 (ja) * 1994-08-11 2001-06-25 日本電気株式会社 音声符号化装置
JP3285072B2 (ja) 1994-12-28 2002-05-27 日本電信電話株式会社 重み付きベクトル量子化法
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JP3238063B2 (ja) 1996-01-31 2001-12-10 株式会社東芝 ベクトル量子化方法および音声符号化方法
EP0788091A3 (en) 1996-01-31 1999-02-24 Kabushiki Kaisha Toshiba Speech encoding and decoding method and apparatus therefor
JPH09234797A (ja) 1996-03-01 1997-09-09 Muto Kasei Kogyosho:Kk 密閉容器の成形方法
JPH1152994A (ja) 1997-08-05 1999-02-26 Kokusai Electric Co Ltd 音声符号化装置
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6389389B1 (en) * 1998-10-13 2002-05-14 Motorola, Inc. Speech recognition using unequally-weighted subvector error measures for determining a codebook vector index to represent plural speech parameters

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5651026A (en) * 1992-06-01 1997-07-22 Hughes Electronics Robust vector quantization of line spectral frequencies
US6134520A (en) * 1993-10-08 2000-10-17 Comsat Corporation Split vector quantization using unequal subvectors
EP0684702B1 (en) * 1994-05-27 2002-10-30 Kabushiki Kaisha Toshiba Vector quantizing apparatus
EP0831457B1 (en) * 1996-09-24 2003-12-03 Sony Corporation Vector quantization method and speech encoding method and apparatus
EP1103953B1 (en) * 1999-11-23 2006-08-16 Texas Instruments Incorporated Method for concealing erased speech frames

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XP009002521 MERAZKA F; BERKANI D: "VERY LOW BIT-RATE VECTOR QUANTIZATION OF LSP PARAMETERS"COMPUTATIONAL INTELLIGENCE FOR MODELLING, CONTROL AND AUTOMATION, 17.02.1999 *
XP010133482 Jianping Pan; Fischer T R: "Vector quantization-lattice vector quantization of speech LPC coefficients", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP). 19-22.08.1994 *
XP010520070 Erdmann C et al: "An adaptive multi rate wideband speech codec with adaptive gain re-quantization" Speech Coding, 2000. Proceedings. 2000 IEEE Workshop on September 17-20.2000, Piscataway, NJ, USA,IEEE *

Also Published As

Publication number Publication date
CN1200403C (zh) 2005-05-04
CA2429832C (en) 2011-05-17
CA2733453C (en) 2014-10-14
EP1339040B1 (en) 2009-01-07
EP1339040A1 (en) 2003-08-27
EP1860650A1 (en) 2007-11-28
US7392179B2 (en) 2008-06-24
CA2733453A1 (en) 2002-06-06
CN1488135A (zh) 2004-04-07
KR100872538B1 (ko) 2008-12-08
KR20030062361A (ko) 2003-07-23
AU2002218501A1 (en) 2002-06-11
CZ20031500A3 (cs) 2003-10-15
CA2429832A1 (en) 2002-06-06
WO2002045077A1 (en) 2002-06-06
KR20080074234A (ko) 2008-08-12
US20040015346A1 (en) 2004-01-22
DE60137359D1 (de) 2009-02-26
EP1339040A4 (en) 2005-09-14
KR100910282B1 (ko) 2009-08-03

Similar Documents

Publication Publication Date Title
CZ304196B6 (cs) Vektorové kvantizační zařízení LPC parametru, kodér řeči a přijímací zařízení signálu řeči
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
JP3151874B2 (ja) 音声パラメータ符号化方式および装置
US6122608A (en) Method for switched-predictive quantization
US5787391A (en) Speech coding by code-edited linear prediction
US6345255B1 (en) Apparatus and method for coding speech signals by making use of an adaptive codebook
WO1994023426A1 (en) Vector quantizer method and apparatus
JPH0990995A (ja) 音声符号化装置
CZ304212B6 (cs) Způsob kódování a dekódování akustického parametru, kódovací a dekódovací zařízení akustického parametru, a program pro provedení způsobu kódování a dekódování akustického parametru
JPH056199A (ja) 音声パラメータ符号化方式
US6889185B1 (en) Quantization of linear prediction coefficients using perceptual weighting
US7047188B2 (en) Method and apparatus for improvement coding of the subframe gain in a speech coding system
US6094630A (en) Sequential searching speech coding device
JPH08272395A (ja) 音声符号化装置
JPH06282298A (ja) 音声の符号化方法
JP3192051B2 (ja) 音声符号化装置
JP2808841B2 (ja) 音声符号化方式
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2002229597A (ja) Lpcパラメータのベクトル量子化装置

Legal Events

Date Code Title Description
MM4A Patent lapsed due to non-payment of fee

Effective date: 20161129