NO318595B1 - Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale - Google Patents

Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale Download PDF

Info

Publication number
NO318595B1
NO318595B1 NO19973472A NO973472A NO318595B1 NO 318595 B1 NO318595 B1 NO 318595B1 NO 19973472 A NO19973472 A NO 19973472A NO 973472 A NO973472 A NO 973472A NO 318595 B1 NO318595 B1 NO 318595B1
Authority
NO
Norway
Prior art keywords
amplitude
pulse
speech signal
positions
signal
Prior art date
Application number
NO19973472A
Other languages
English (en)
Other versions
NO973472L (no
NO973472D0 (no
Inventor
Jean-Pierre Adoul
Claude Laflamme
Original Assignee
Univerite De Sherbrooke
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27010408&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=NO318595(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Univerite De Sherbrooke filed Critical Univerite De Sherbrooke
Publication of NO973472D0 publication Critical patent/NO973472D0/no
Publication of NO973472L publication Critical patent/NO973472L/no
Publication of NO318595B1 publication Critical patent/NO318595B1/no

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

Foreliggende oppfinnelse angår en forbedret teknikk for digital koding av et lydsignal, spesielt, men ikke utelukkende, et talesignal, med det formål å transmittere og syntetisere dette lydsignalet.
Behovet for effektive digitale talekodingsteknikker med god subjektiv kvalitet i forhold til bithastighet, øker for en rekke anvendelser slik som stemmeoverføring via satellitt, landmobile digitale radio- eller pakkenettverk, talelagring, talerespons og trådløs telefoni.
En av de beste kjente teknikker, som er i stand til å gi god kvalitet i forhold til bithastighet, er den såkalte kodeeksiterte lineære prediksjon (CELP) teknikken. Ifølge denne teknikken, samples talesignalet og behandles i blokker av L-sampler (dvs. vektorer), hvor L er et forhåndsbestemt tall. CELP-teknikken gjør bruk av en kodebok.
En kodebok i CELP-sammenheng, er et indeksert sett av L-sampel lange sekvenser som vil re feres til som L-dimensjonale kodevektorer
(pulskombinasjoner som definerer L forskjellige posisjoner og som omfatter både null-amplitudepulser og ikke-null-amplitudepulser tilknyttet respektive posisjoner p=l, 2, ... L av kombinasjonen). Kodeboken omfatter en indeks k som går fra 1 til M, hvor M representerer størrelsen til kodeboken, noen ganger uttrykt som et antall bits b:
En kodebok kan lagres i et fysisk minne (f.eks. en oppslagstabell), eller kan referere til en mekanisme for å knytte indeksen til en tilhørende kodevektor (f.eks. en formel).
For å syntetisere tale ifølge CELP-teknikken, syntetiseres hver blokk av talesampler ved å filtrere den aktuelle kodevektor fra kodeboken gjennom tidsvarierende filtre som modellerer de spektrale karakteristikker til talesignalet. Ved innkodingen beregnes det syntetiske utsignal for alle eller et subsett av de aktuelle kodevektorer fra kodeboken (kodeboksøk). Den kodevektor som velges er den som produserer det syntetiske utsignal som er nærmest det originale talesignal ifølge et forvrengningsmål som er veid i forhold til menneskets oppfattelsesevne.
En første type kodebok er den såkalte "stokastiske"-kodebok. En ulempe med denne type kodebok er at den ofte krever stor fysisk lagringsplass. Den er stokastisk, dvs. tilfeldig i den betydning at veien fra indeksen til den tilhørende kodevektor involverer oppslagstabeller som er et resultat av tilfeldig genererte tall eller statistiske teknikker anvendt på store taletreningssett. Størrelsen på en stokastisk kodebok vil vanligvis være begrenset av lagrings- og/eller søkekompleksitet.
En annen type kodebok er algebraisk kodebok. 1 motsetning til stokastisk kodebok er algebraisk kodebok ikke tilfeldig og krever ingen lagring. En algebraisk kodebok er et sett av indekserte kodevektorer hvor amplituder og posisjoner for pulsene til kodevektor k kan utledes fra dens indeks k gjennom en regel som krever ingen eller minimal fysisk lagring. Derfor er størrelsen til en algebraisk kodebok ikke begrenset av lagringsbehov. En algebraisk kodebok kan også være konstruert for effektive søk.
WO 91/13432 angår koding av et talesignal på en måte som forbedrer eksitasjonskodeboken og søkeprosedyren til konvensjonelle CELP talekodere. Ved kodingen blir det gjort bruk av en dynamisk kodebok for å produsere et eksitasjonssignal som skal brukes av et lydsignalsyntesesfilter for å syntetisere talesignalet. Den dynamiske kodeboken er dannet av en algebraisk kodegenerator og et adaptivt forfilter. Generatoren bruker en spredt algebraisk kode for å produsere et kodeordsignal som respons på et indekssignal, og det adaptive forfilteret prosesserer det genererte kodeordsignalet for å produsere eksitasjonssignalet. Det adaptive forfilteret har en transferfunksjon som varierer i tid i relasjon til parametere som er representative for spektrale karakteristikker for lydsignalet for derved å forme frekvenskarakteristikkene til eksitasjonssignalet for å dempe frekvenser som merkbart irriterer det menneskelige øret. Søkekompleksiteten for å finne det beste kodeordet er mye redusert ved å bringe søket tilbake til det algebraiske kodeområdet, og derved tillate at den spredte algebraiske koden gjør de nødvendige beregningene raskere.
Et formål ved den foreliggende oppfinnelser er derfor å fremskaffe en fremgangsmåte og anordning for å drastisk redusere kompleksiteten til et kodeboksøk ved kodingen av et lydsignal, idet disse fremgangsmåte og anordninger er anvendbare til en stor klasse av kodebøker.
Et annet formål med foreliggende oppfinnelse er en fremgangsmåte og anordning som er istand til å velge a-priori et subsett av kodebok-pulskombinasjonene og begrense de kombinasjoner som gjennomsøkes til dette subsett med det formål å redusere kodebokens søkekompleksitet.
Et ytterligere formål med den foreliggende oppfinnelse er å øke størrelsen på en kodebok ved å tillate de individuelle ikke-null-aplitudepulsene til kodevektorene å anta i det minste én av q mulige amplituder uten å øke søkekompleksiteten.
Formålene ved oppfinnelsen løses ved hjelp av trekkene i de selvstendige patentkravene og de medfølgende uselvstendige patentkrav definerer ytterligere utførelsesformer av oppfinnelsen.
Mer spesielt, i overenstemmelse med den foreliggende oppfinnelse, er det fremskaffet en fremgangsmåte for å gjennomføre et søk i en kodebok med det formål å kode et lydsignal, idet kodeboken består av et sett av pulskombinasj oner og hver pulskombinasj on definerer et flertall forskjellige posisjoner og omfatter pulser tilknyttet respektive posisjoner av kombinasjonen, idet fremgangsmåten omfatter trinnene: -forhåndsvelge fra kodeboken et subsett av pulskombinasjoner i forhold til lydsignalet; og -søke bare gjennom subsettet av pulskombinasjoner med det formål å kode lydsignalet; -hvorved, ved bruk, kompleksiteten av søket reduseres siden bare et subsett av pulskombinasj onene til kodeboken gjennomsøkes.
Foreliggende oppfinnelse angår også en fremgangsmåte for å gjennomføre et søk i en kodebok for å kode et lydsignal, hvor kodeboken består av et sett av puls-amplitude/posisjon kombinasjoner, hvor hver puls-amplitude/posisjon kombinasjon definerer L forskjellige posisjoner og omfatter både null-amplitudepulser og ikke-null-amplitudepulser tilknyttet respektive posisjoner p=l, 2,... L av kombinasjonen, og hver ikke-null-amplitudepuls antar minst én av q mulige amplituder. Denne fremgangsmåte omfatter trinnene: -forhåndsvelge fra kodeboken et subsett av puls-amplitude/posisjon kombinasjoner i forhold til lydsignalet; og -søke gjennom bare subsettet av puls-amplitude/posisjon kombinasjoner for å kode lydsignalet.
Igjen, kompleksiteten av søket reduseres siden bare et subsett av pulsamplitude/posisjon kombinasjoner av kodeboken gjennomsøkes.
Fortsatt i overenstemmelse med den foreliggende oppfinnelse, er det fremskaffet en anordning for å gjennomføre et søk i en kodebok for å kode et lydsignal, hvor kodeboken består av et sett av pulskombinasjoner og hver pulskombinasjon definerer et flertall av forskjellige posisjoner og omfatter pulser tilknyttet respektive posisjoner av kombinasjonen, hvor anordningen omfatter: -midler for å forhåndsvelge fra kodeboken en subsett av pulskombinasjoner i forhold til lydsignalet; og -midler for å søke gjennom bare subsettet av pulskombinasjoner for å kode lydsignalet.
Ved drift reduseres kompleksiteten av søket siden bare et subsett av pulskombinasjonene til kodeboken gjennomsøkes.
Foreliggende oppfinnelse angår videre en anordning for å gjennomføre et søk i en kodebok for å kode et lydsignal, hvor kodeboken består av et sett av pulsamplitude, posisjon kombinasjoner, hver pulsamplitude/posisjon kombinasjon definerer L forskjellige posisjoner og omfatter både null-amplitudepulser og ikke-null-amplitudepulser tilknyttet respektive posisjoner p=l, 2,... L av kombinasjonen, og hver ikke-null-amplitudepuls antar minst én av q mulige amplituder. Denne anordningen omfatter midler for å forhåndsvelge fra kodeboken et subsett av puls-amplitude/posisjon kombinasjoner i forhold til lydsignalet, og midler for å søke gjennom bare subsettet av puls-amplitude/posisjon kombinasjonene for å kode lydsignalet, hvorved kompleksiteten av søket reduseres siden bare et subsett av pulsamplitude/posisjon kombinasjonene av kodeboken gjennomsøkes.
Fortsatt i overenstemmelse med den foreliggende oppfinnelse er det frembrakt et celledelt kommunikasjonssystem som skal dekke et stort geografisk område delt inn i et flertall av celler, omfattende: -mobile transportable celler/mottagerenheter; -basestasjoner plassert i hver respektive celle; -midler for å kontrollere kommunikasjon mellom basestasjonene i cellene; -et toveis trådløs kommunikasjonsundersystem mellom hver mobile enhet plassert i en celle og basestasjonen i cellen, idet det toveis trådløse kommunikasjonsundersystemet omfatter, i både den mobile enheten og i basestatsjonen i cellen (a) en sender som omfatter midler for koding av et
talesignal og midler for å sende det kodede talesignalet, og (b) en mottager som omfatter midler for å motta et sendt kodet talesignal og midler for å dekode det mottatte kodede talesignal;
hvor midlene for koding av talesignalet omfatter en anordning for å gjennomføre et søk i en kodebok for å kode talesignalet, hvor kodeboken omfatter et sett av pulskombinasjoner og hver pulskombinasj on definerer et flertall av forskjellig posisjoner og omfatter pulser tilknyttet respektive posisjoner av kombinasjonen, idet anordningen som utfører søket omfatter: -midler for forhåndsvalg fra kodeboken av et subsett av pulskombinasjoner i forhold til talesignalet; og -midler for å gjennomsøke kun subsettet av pulskombinasjoner for å kode talesignalet;
Ved drift er kompleksiteten til søket ytterligere redusert siden kun et subsett av pulskombinasjoner i kodeboken gjennomsøkes.
Tilslutt angår foreliggende oppfinnelse et celledelt kommunikasjonssystem for dekning av et stort geografisk område delt inn i et flertall av celler omfattende: -mobile transportable sender-/mottagerenheter; -basestasjoner plassert i hver respektive celle; -midler for å kontrollere kommunikasjon mellom de cellenes basestasjoner: -et toveis trådløst kommunikasjonsundersystem mellom hver mobile enhet som befinner seg i en celle og den basestasjonen i cellen, idet det toveis trådløse kommunikasjonsundersystem omfatter i både den mobile enhet og cellebasestasjonen (a) en sender som omfatter midler for koding av et talesignal og midler for å sende det kodede talesignal, og (b) en mottager som inkluderer midler for å motta et sendt kodet talesignal og midler for å dekode det mottatte kodede talesignal;
hvor midlene for koding av talesignalet omfatter en anordning for å gjennomføre et søk i en kodebok for å kode talesignalet, idet kodeboken omfatter et sett av puls-amplitude/posisjon kombinasjoner, idet hver puls-amplitude/posisjon kombinasjon definerer L forskjellige posisjoner og omfatter både null-amplitude pulser og ikke-null-amplitude pulser tilknyttet hver respektive posisjon p=l, 2, ... L av
kombinasjonen, og hver ikke-null-amplitude puls antar minst én av q mulige amplituder, idet anordningen som gjennomfører søket omfatter: -midler for forhåndsvalg fra kodeboken av et subsett av pulsamplitude/posisjon kombinasjoner i forhold til talesignalet; og -midler for å søke gjennom bare subsettet av pulsamplitude/posisjon kombinasjoner for å kode talesignalet.
Ved drift reduseres kompleksiteten til søket siden kun et subsett av pulsamplitude/posisjon kombinasjonene til kodeboken gjennomsøkes.
I overenstemmelse med en foretrukken utførelse av oppfinnelsen, (a) er subsettet av puls-amplitude/posisjon kombinasjoner forhåndsvalgt ved å forhåndsetablere, i forhold til lydsignalet, en funksjon Sp mellom de respektive posisjoner p=l, 2, ... L og de q mulige amplituder, og (b) gjennomsøkes kun de puls-amplitude/posisjon kombinasjoner av kodeboken som var ikke-null-amplitudepulser i forhold til den forhåndsetablerte funksjonen.
Fordelaktig vil funksjonen Sp være forhåndsetablert ved forhåndstilknytning, i forhold til lydsignalet, av en av de q mulige amplituder til hver posisjon p, og den forhåndsetablerte funksjonen er oppfylt når ikke-null-amplitudepulsene til en puls-amplitude/posisjon kombinasjon hver har en amplitude lik amplituden Sp forhåndstilknyttet til posisjonen p for ikke-null-amplitudepulsen.
Fordelaktig vil forhåndstilknyttingen av én av de q mulige amplituder til hver posisjon p omfatte trinnene: -å behandle lydsignalet for å frembringe et bakoverfiltrert målsignal D og et restsignal R<1> som har hoved frekvens en fjernet; -å beregne en amplitudeestimatvektor B som respons til det bakoverfiltrerte målsignalet D og til det hovedfrekvensfiltrerte restsignal R'; og -for hver av posisjonene p å kvantisere et amplitudeestimat Bp for vektoren B for å finne amplituden som skal velges for posisjonen p.
Beregning av amplitudeestimatvektoren B omfatter fordelaktig trinnene å summere det bakoverfiltrerte målsignalet D i normalisert form:
til det hovedfrekvensfiltrerte restsignal R' i normalisert form: for derved å oppnå en amplitudeestimat vektor B med formen:
hvor P er en fast konstant som fortrinnsvis har en verdi mellom 0 og 1.
Ifølge en ytterligere foretrukket utførelse av foreliggende oppfinnelse utføres kvantisering på et toppverdi-normalisert amplitudeestimat Bp av vektor B ved bruk av følgende uttrykk: hvor nevneren
er en normaliseringsfaktor som representerer toppamplituden til ikke-null-amplitudepulsene.
Pulskombinasj onene kan hver omfatte et antall N av ikke-null-amplitudepulser, og posisjonene p til ikke-null-amplitudepulsene er fordelaktig begrenset i overenstemmelse med minst én N-innfelt enkelpuls-permutasj onskode.
Søk i kodeboken omfatter fordelaktig en maksimering av et gitt forhold med nevner ak2 beregnet ved hjelp av N nestede løkker i overenstemmelse med følgende relasjon: hvor beregningen for hver løkke er skrevet inn i en separat linje fra en ytterste løkke til en innerste løkke av de N-nestede løkker, hvor pn er posisjonen til den n-te ikke-null-amplitude pulsen av kombinasjonen, og hvor U' (px, py) er en funksjon avhengig av amplituden SPi forhåndstilknyttet til en posisjon px blant posisjonene p og amplituden S forhåndstilknyttet til en posisjon py blant posisjonene p. I beregningen over kan idet minste den innerste løkken av de N nestede løkkene utelates når følgende ulikhet er sann:
hvor SPu er amplituden forhåndstilknyttet til posisjonen p„, DPn er den pn-te komponent av målvektoren D, og TD er en terskel knyttet til den bakoverfiltrerte målvektor D.
Formålene, fordelen og andre egenskaper ved den foreliggende oppfinnelse vil klargjøres ytterligere ved gjennomlesing av den følgende ikke-begrensende beskrivelse av en foretrukket utførelse, kun gitt som et eksempel og under henvisning til de vedlagte tegninger.
De vedlagte tegninger:
Figur 1 er et skjematisk blokkdiagram av en anordning for koding av et lydsignal omfattende en amplitudevelger og en optimaliseringskontroller i overenstemmelse med foreliggende opppfinnelse; Figur 2 er et skjematisk blokkdiagram av en dekodingsanordning for bruk med kodingsanordningen i figur 1; Figur 3a er en sekvens av grunnleggende operasjoner for det hurtige kodeboksøket i overenstemmelse med foreliggende oppfinnelse, basert på signalvalgte pulsamplituder; Figur 3b er en sekvens av operasjoner for forhåndstilknytning av én av de q amplituder til hver posisjon p av puls-amplitude/posisjon kombinasjonene; Figur 3c er en sekvens av operasjoner som inngår i det N-Iags løkkesøket hvor den innerste løkke hoppes over hver gang bidraget fra de første N-l pulser til nevneren DAkT ansees utilstrekkelig; Figur 4 er en skjematisk representasjon av de N-nestede løkker brukt ved kodeboksøket; og Figur 5 er et skjematisk blokkdiagram som illustrerer infrastrukturen til et typisk celledelt kommunikasjonssystem. Figur 5 illustrerer infrastrukturen til et typisk celledelt
kommunikasjonssystem 1.
Selv om anvendelsen av fremgangsmåte for gjennomføring av søket og anordningen ifølge oppfinnelsen ved et celledelt kommunikasjonssystem er beskrevet som et ikke-begrensende eksempel i den foreliggende beskrivelse, bør det huskes at disse fremgangsmåter og anordninger kan brukes med de samme fordeler i mange andre typer av kommunikasjonssystemer hvor lydsignalkoding er nødvendig. 1 et celledelt kommunikasjonssystem slik som 1, fremskaffes en telekommunikasjonstjeneste over et stort geografisk område ved å dele nevnte område inn i et antall mindre celler. Hver celle har en cellebasestasjon 2 (figur 5) for å fremskaffe radiosignaleringskanaler, og lyd og datakanaler. Radiosignaleringskanalene utnyttes for å anrope mobile radiotelefoner (mobile sender-/mottagerenheter) slik som 3 innenfor grensene for cellebasestasjonens dekningsområde (celle), og for å sette opp samtaler fra andre radiotelefoner enten innenfor eller utenfor basestasjonens celle, eller ut på et annet nett slik som det offentlige svitsjede telefonnett (PSTN) 4.
Så snart en radiotelefon 3 har lykkes i å sette opp eller motta en samtale, settes en lyd eller datakanal opp med den cellebasestasjonen 2 som tilsvarer den celle radiotelefonen 3 befinner seg i, og kommunikasjon mellom basestasjonen 2 og radiotelefonen 3 foregår over den lyd- eller datakanalen. Radiotelefonen 3 kan også motta kontroll eller tidsinformasjon over signaleringskanalen mens en samtale er i gang.
Hvis en radiotelefon 3 forlater en celle i løpet av en samtale og beveger seg inn i en annen celle, overlater radiotelefonen samtalen til en tilgjengelig lyd eller datakanal i den nye cellen. Tilsvarende, hvis ingen samtale pågår sendes en kontrollmelding over signaleringskanaler slik at radiotelefonen logger seg inn på basestasjonen 2 tilknyttet den nye cellen. På denne måten er mobil kommunikasjon over et stort geografisk område mulig.
Det celledelte kommunikasjonssystem 1 omfatter videre en terminal 5 for å kontrollere kommunikasjon mellom cellebasestasjonene 2 og det offentlige svitsjede telefonnett 4, f.eks. under kommunikasjons mellom en radiotelefon 3 og PSTN 4, eller mellom en radiotelefon 3 i en første celle og en radiotelefon 3 i en andre celle.
Selvfølgelig er et toveis trådløst radiokommunikasjonsundersystem nødvendig for å opprette kommunikasjon mellom hver radiotelefon 3 i en celle og cellebasestasjonen 2 i samme celle. Et slikt toveis trådløst radiokommunikasjonssystem omfatter typisk i både radiotelefonen 3 og cellebasestasjonen 2 (a) en sender for koding av talesignalet og for sending av det kodede talesignalet gjennom en antenne slik som 6 eller 7, og eller (b) en mottager for å motta et sendt kodet talesignal gjennom samme antenne 6 eller 7 og for dekoding av de motsatte kodede talesignal. Det er velkjent for de med kunnskaper innen teknikken at talekoding er nødvendig for å redusere båndbredden for å overføre tale via toveis trådløse radiokommunikasjonssystemer, dvs. mellom en radiotelefon 3 og en basestasjon 2.
Formålet med foreliggende oppfinnelse er å fremskaffe en effektiv digital talekodingsteknikk med god subjektiv kvalitet i forhold til bithastighet f.eks. for toveis overføring av talesignaler mellom en cellebasestasjon 2 og en radiotelefon 3 gjennom en lyd eller datakanal. Figur 1 er et skjematisk blokkdiagram av en digital talekodingsenhet egnet for å gjennomføre denne effektive teknikk.
Talekodingsanordningen i figur 1 er samme talekodingsanordning som illustrert i figur 1 i den opprinnelige US patentsøknad nr. 07/927,528 til hvilken en amplitudevelger 112 har blitt tilføyd i overensstemmelse med foreliggende oppfinnelse. Den opprinnelige US patentsøknad nr. 07/927,528 ble inngitt 10. september 1992 for en oppfinnelse med tittel "DYNAMISK
KODEBOK FOR EFFEKTIV TALEKODING BASERT PÅ ALGEBRAISKE KODER."
Det analoge talesignal samples og blokkbehandles. Det må forstås at foreliggende oppfinnelse ikke er begrenset til en anvendelse for talesignaler. Koding av andre typer lydsignaler kan også tenkes. 1 det illustrerte eksempel omfatter blokken for inngangssample tale S (Figur 1) L etterfølgende sampler. I CELP-litteraturen er L omtalt som "underramme"-lengden og er typisk i området mellom 20 og 80. Blokkene med L sampler refereres også til som L-dimensjonale vektorer. Forskjellige L-dimensjonale vektorer produseres under utførelsen av kodingsprosedyren. En liste over disse vektorer som fremgår i figurene 1 og 2, så vel som en liste over transmitterte parametere er angitt under:
Liste over de viktigste L- dimensionale vektorer:
S Inngangstalevektor;
R' Hovedfrekvensfiltrert restvektor;
X Målvektor;
D Bakoverfiltrert målvektor;
Ak Kodevektor med indeks k fra den algebraiske kodebok; og
Ck Innovasjonsvektor (filtrert kodevektor)
Liste over overførte parametre:
k Kodevektorindeks (inngangsverdi i den algebraiske kodebok);
g Forsterkning;
STP Korttidsprediksjonsparametre (definerer A (z)); og
LTP Langtidsprediksjonsparametre (definerer en hovedfreksvensforsterker b og en hovedfrekvensforsinkelse T).
Det er antatt fordelaktig først å beskrive taledekodingsanordningen fra figur 2 for å illustrere de forskjellige trinn utført mellom den digitale inngang (inngang på demultiplekser 205) og den avgitte samplede tale (utgang fra syntesefilter 204).
Demultiplekseren 205 utvinner fire forskjellige parametre fra den binære informasjon som mottas fra en digital inngangskanal, nemlig indeksen k, forsterkningen g; korttidsprediksjonsparametrene STP, og langtidsprediksjonsparametrene LTP. Den foreliggende L-dimensjonale vektor S av talesignalet syntetiseres på bakgrunn av disse fire parametre slik det vil forklares i den etterfølgende beskrivelse.
Taledekodingsanordningen i figur 2 omfatter en dynamisk kodebok 208 som er sammensatt av en algebraisk kodegenerator 201 og et adaptivt inngangsfilter 202, en forsterker 206, en summerer 207, en langtidsprediktor 203, og et syntesefilter 204.
I et første trinn produserer den algebraiske kodegenerator 201 en kodevektor Ak i respons til indeksen k.
I et andre trinn behandles kodevektoren Ak av et adaptivt forfilter 202 som forsynes med langstidsprediskjonsparametrene LTP for å produsere en utgangsinnovasjonsvektor Ck. Formålet med adaptive forfiltre 202 er å dynamisk kontrollere frekvensinnholdet i utgangsinnovasjonsvektoren Ck slik at talekvaliteten høynes, dvs. for å redusere den hørbare forvrengning forårsaket av frekvenser som virker irriterende på det menneskelig øre. Typisk overførings funksjon F (z) for de adaptive forfilter 202 er gitt under:
Fa (z) er et formant-forfilter hvor Q <yi <y2< \ & t konstanter. Dette forfilter fremhever formant-områdene og er svært effektivt, spesielt ved kodingshastigheter under 5 kbit/s.
Fb (z) er et hovedfrekvens-forfilter hvor T er den tidsvarierende hovedfrekvensforsinkelse og bo er enten konstant eller lik den kvantiserte langtidshovedfrekvens-prediksjonsparameter fra foreliggende eller tidligere underrammer. Fb (z) er svært effektiv for å fremheve hovedfrekvensharmoniske frekvenser ved alle hastigheter. Derfor inkluderer F (z) typisk et hovedfrekvens-forfilter noen ganger kombinert med et formant-forfilter, nemlig:
I overenstemmelse med CELP-teknikken finnes det samplede talesignal S på utgangen ved først å skalere innovasjons vektoren Ck fra kodeboken 208 med forsterkning g gjennom forsterkeren 206. Summereren 207 legger så til den skalerte bølgeformen gCk til utgangen E (langtidsprediksjonskomponenten av signaleksitasjonen av syntesefilteret 204) fra en langtidsprediktor 203 forsynt med LTP-parametrene, plassert i en tilbakekoblingssløyfe og med en
overføringsfunksjon B (z) definert som følger:
hvor b og T er respektive hovedfrekvensforsterkningen og -forsinkelsen definerte over.
Prediktoren 203 er et filter med en overføringsfunksjon i overensstemmelse med de sist mottatte LTP parametre b og T for å modellere hovedfrekvensperiodisiteten til tale. Den innfører den passende hovedfrekvensforsterkning b og forsinkelse T for samplene. Det sammensatte signalet E + gCk utgjør signaleksitasjonen for syntesefilteret 204 som har en overføringsfunksjon'1/A (z) (A (z) defineres i den etterfølgende beskrivelse). Filteret 204 frembringer den korrekte spektrumforming i overensstemmelse med de sist mottatte STP parametre. Mer spesifikt, filteret 204 modellerer resonansfrekvensene (formantene) for tale. Utgangsblokken S er det syntetiserte samplede talesignal som kan konverteres til et analogt signal med passende anti-aliasing filtrering i overenstemmelse med en teknikk som er velkjent.
En algebraisk kodegenerator 201 kan konstrueres på mange måter. En fordelaktig metode, beskrevet i den ovenfor nevnte US patentsøknad nr. 07/927,528, består i å bruke minst én N-innfelt enkelpuls-permitasjonskode.
Dette konsept vil illustreres ved hjelp av en enkel algebraisk kodegenerator 201.1 dette eksempelet er L = 40 og settet av 40-dimensjonale kodevektorer omfatter kun N = 5 ikke-null-amplitudepulser som vil kalles Spi, SP2, SP3, SP4, Sp5. I denne noe grundigere notasjon står p; for plasseringen av puls nummer i innenfor subrammen (dvs. p, går fra 0 til L-l). Anta at pulsen Spj er begrenset til åtte mulige posisjoner p] som følger:
Innenfor disse åtte posisjoner, som kan kalles "spor" #1, kan S og sju null-amplitude-pulser ombyttes fritt. Dette er en "enkelpulspermutasjonskode". La oss nå innfelle fem slike "enkelpulspermutasjonskoder" ved også å begrense posisjonene for de gjenværende pulser på tilsvarende måte (dvs. spor #2, spor #3, spor #4, og spor #5).
Legg merke til at heltallene mj = 0, 1, 7 definerer posisjonen p; til hver puls SPi fullstendig. På den måten kan en enkel posisjonsindeks kp finnes gjennom enkel multipleksing av nij-ene ved bruk av følgende relasjon:
Det skal pekes på at andre kodebøker kan utvikles ved bruk at de ovennevnte pulsspor. F.eks. kan kun 4 pulser brukes, hvor de tre første pulsene opptar posisjonene i de tre første sporene respektive, mens den fjerde pulsen opptar enten det fjerde og det femte sporet med en bit for å angi hvilket spor. Dette design gir opphav til en 13 bits posisjonskodebok.
I den kjente teknikk antas det at ikke-null-amplitudepulsene har en bestemt amplitude for alle praktiske formål av hensyn til kompleksiteten til kodevektorsøket. Faktisk, hvis puls SPi kan anta én av q mulige amplituder,
må så mange som q<N> pulsamplitudekombinasjoner måtte vurderes under søket. F.eks., hvis de fem pulsene i det første eksempelet tillates å anta én av q = 4 forskjellige amplituder, f.eks. SPi = +1, -1, +2, -2 isteden for en fast amplitude, øker størrelsen til algebraiske kodebok fra 15 til 15 + (5x2) bits = 25 bits; dvs. et søk tusen ganger mer komplisert.
Det er foreliggende oppfinnelses formål å avsløre det overraskende faktum at svært god virkning kan oppnås med q amplitudepulser uten å måtte betale en høy pris. Løsningen består i å begrense søket til et avgrenset subsett av kodevektorer. Metoden for å velge kodevektorer er knyttet til inngangstalesignalet slik det vil beskrives i den etterfølgende beskrivelse. Den praktiske fordel ved foreliggende oppfinnelse er muligheten for øke størrelsen på den dynamiske algebraiske kodebok 208 ved å tillate individuelle pulser og anta de forskjellige mulige amplituder uten å øke kompleksiteten til kodevektorsøket.
Det samplede talesignalet S kodes på en blokk for blokk basis ved kodesystemet i figur 1 som er delt opp i 11 moduler nummerert fra 102 til 112. Funksjonen og operasjonen for de fleste av disse modulene er uendrede med hensyn til beskrivelsen i den opprinnelige US patentsøknad nr. 07/927,528. Derfor, til tross for at den etterfølgende beskrivelse idet minste i korte trekk vil beskrive funksjonen og operasjonen av hver modul, vil den konsentreres om det som er nytt med hensyn til beskrivelsen i den opprinnelige US patentsøknad nr. 07/927,528.
For hver blokk med L sampler av talesignal, produseres et sett med lineær predektiv koding (LPC) parametre kalt korttidsprediksjon-(STP) parametre, i overensstemmelse med kjent teknikk ved hjelp av en LPC spektrum analysator 102. Mer spesifikt modellerer analysatoren 102 de spektrale karakteristikker for hver blokk S med L sampler.
Inngangsblokken S med L sampler hvites med et hvite-filter 103 med følgende overføringsfunksjon basert på de foreliggende verdier for STP parametrene:
hvor ao = 1, og z er den vanlige variable i den såkalte z-transformasjon. Som illustrert i figur 1 produserer hvite-filteret 103 en restvektor R.
En hovedfrekvensberegner 104 brukes for å beregne og kvantisere LTP parametrene, nemlig hovedfrekvensforsinkelsen T og
hovedfrekvensforsterkningen g. Den opprinnelige tilstand for beregneren 104 er også satt til en verdi FS fra en opprinnelig tilstandsberegner 110. En detaljert prosedyre for å beregne og kvantisere LTP parametrene er beskrevet i den opprinnelige US patentsøknad nr. 07/927,528 og antas å være vel kjent for de med noenlunde kunnskaper innen fagområdet. Den vil derfor ikke beskrives ytterligere i denne fremstilling.
En filterrespons-karakteriserer 105 (figur 1) forskynes med STP og LTP parametrene for å beregne en filterresponskarakteristikk FRC for bruk i de etterfølgende trinn. FRC informasjonen består av følgende tre komponenter hvor n = 1, 2, ... L.
• f (n): responsen til F (z)
legg merke til at F (z) typisk omfatter hovedfrekvensforfiltre
• h (n): responsen av ^--r- til f (n)
A(z7")
hvor y er en persepsjonsfaktor. Mer generelt er h (n) impulsresponsen til F (z) W (z) / A(z) som er kjeden av forfilter F (z), persepsjonsveiefilter W (z) og syntesefilter l/A (z). Legg merke til at F (z) og l/A (z) er de samme filtre som blir brukt i dekoderen på figur 2.
• U (i, j): autokorrellasjon for h (n) ifølge følgende uttrykk:
Langtidsprediktoren 106 forsynes med det foregående eksitasjonssignal (dvs. E + gCk av tidligere subramme) for å danne den nye E-komponent ved bruk av riktig hovedfrekvensforsinkelse T og forsterkning b.
Den opprinnelige tilstand for persepsjons filtre 107 settes til verdien FS levert fra den opprinnelige tilstandsberegner 110. Restvektoren med hovedfrekvensen fjernet R' = R-E beregnet av subtraktoren 121 (figur I) forsynes så til persepsjonsfiltre 107 for på utgangen av det sistnevnte filter å oppnå en målvektor X. Som illustrert på figur 1 er STP parametrene anvendt på filter 107 for å endre dets overføringsfunksjon med hensyn på disse parametre. I hovedsak er X = R' - P} hvor P representerer bidraget fra langstidsprediksjonen (LTP) inkludert "ringing" fra de foregående eksitasjoner. MSE-kriterier som gjelder for A kan nå uttrykkes i følgende matrisenotasjon;
hvor H er en L x L nedre triangulær Toeplitz matrise dannet fra h (n) responsen som følger. h(0) følger matrisediagonalen og h (1), h (2), ... h (L-1) fyller de respektive nedre diagonaler.
Et bakoverfiltreringstrinn utføres av filteret 108 på figur 1. Ved å sette den deriverte av likningen over med hensyn på forsterkningen g lik 0 finner vi den optimale forsterkningen som følger:
Med denne forsterkningen for g blir minimaliseringen:
Formålet er å finne den spesielle indeks k for hvilken minimaliseringen oppnås. Legg merke til at fordi \\ xf er en fast verdi kan samme indeks finnes ved å maksimalisere følgende verdi:
I bakoverfilteret 108 beregnes en bakoverfiltrert målvektor D = (XH). Betegnelsen "bakoverfilirering" for denne operasjonen kommer fra tolkningen av (XH) som filtreringen av tidsreversert X.
Kun én amplitudevelger 112 har blitt lagt til figur 1 fra den ovenfor nevnte opprinnelige US patentsøknad nr. 07/927,528. Funksjonen til amplitudevelgeren 112 er å begrense kodevektorene Ak som gjennomsøkes av optimaliser)ngskontrolleren 109 til de mest lovende kodevektorer Ak for derved å redusere kodevektorsøkets kompleksitet. Som beskrevet i den foregående beskrivelse, er hver kodevektor Ak en puls-amplitude/posisjon kombinasjon bølgeform som definerer L forskjellige posisjoner p og som omfatter både null-amplitudepulser og ikke-null-amplitudepulser knyttet til respektive posisjoner p = 1, 2, ... L av kombinasjonen, hvor hver ikke-null-amplitudepuls antar minst én av q forskjellig mulige amplituder.
Idet det nå vises til figur 3a, 3b og 3c er formålet med amplitudevelgeren 112 å forhåndsetablere en funksjon Sp mellom posisjonene p til kodevektorbølgeformen og de q mulige verdier av pulsamplituder. Den forhåndsetablerte funksjon Sp er avledet i relasjon til talesignalet før kodeboksøket. Mer spesifikt består forhåndsetableringen av denne funksjonen av forhåndstillcnytning, i relasjon til talesignalet, minst én av de q mulige amplituder til hver posisjon p for bølgeformen (trinn 301 i figur 3a).
For å forhåndstilknytte en av de q amplitudene til hver posisjon p for bølgeformen beregnes én amplitudeestimatvektor B som respons til den bakoverfiltrerte målvektor D og til restvektoren R' med fjernet hovedfrekvens. Mer spesifikt er amplitudeestimatvektoren B beregnet ved å summere (undertrinn 301- 1 på figur 3b) den bakoverfiltrerte målevektor D i normalisert form:
og restvektoren R<1> med hovedfrekvensen fjernet i normalisert form: for derved å oppnå en amplitude estimatvektor B av formen:
hvor p er en fast konstant med en typisk verdi på V2 (verdien av p velges mellom 0 og 1 avhengig av prosentandelen av ikke-null-amplitudepulser brukt i den algebraiske kode).
For hver posisjon p for bølgeformen finnes amplituden Sp som skal forhåndstilknyttes til posisjonen p ved å kvantisere et tilsvarende amplitudeestimat Bp av vektor B. Mer spesifikt kvantiseres et oppnormalisert amplitudeestimat Bp for vektoren B for hver posisjon p av bølgeformen (undertrinn 301-2 i figur 3b) ved bruk av følgende uttrykk: hvor Q ( .) er kvantiseringsfunksjonen og
er en normaliseringsfaktor som representerer en toppamplitude for ikke-null-amplitudepulsene.
I det viktig spesialtilfellet hvor:
q = 2, dvs. at pulsamplitudene kan anta bare to verdier (dvs.
sP< = ±i); og
-ikke-null-amplitude pulstettheten N/L er lavere enn eller lik 15 %; verdien av p kan være lik null; så kan amplitudeestimat vektoren B reduseres simpelthen til den bakoverfiltrerte målvektor D og som en konsekvens
Formålet med optimaliseringskontrolleren 109 er å velge den beste kodevektor Ak fra den algebraiske kodebok. Valgkriteriet er gitt i form av et forhold som skal beregnes for hver kodevektor Ak og som skal maksimaliseres over alle kodevektorer (trinn 303):
Siden Ak er en algebraisk kodevektor med n ikke-null-amplitudepulser av respektive amplituder S , er telleren kvadratet av og nevneren er et energi ledd som kan uttrykkes som:
hvor U (pj, pj) er korrelasjonen assosiert med to enhetsamplitudepulser, en ved posisjon pj og den andre ved posisjon pj. Denne matrisen beregnes i
overensstemmelse med likningen over i filterresponskarakterisereren 105 og inkluderes i settet av parametere som refereres til som FRC i blokkdiagrammet på figur 1.
En hurtig metod for å beregne denne nevneren (trinn 304) inkluderer de In-nestede løkker illustrert i figur 4, hvor notasjonen S(i) og SS(i,j) brukes istendefor de respektive størrelser " SPi" og " Sp Sp ". Beregningen av nevneren a*<2> er den mest tidkrevende prosessen. Beregningene som bidrar til ak2 som utføres i hver løkke i figur 4, kan skrives på separate linjer fra den ytterste løkke til den innerste løkke som følger:
hvor pi er posisjonen til den ikke-null-amplitudepuls nummer i. Legg merke til at de N-nestede løkker på figur 4 gjør det mulig å begrense ikke-null-amplitudepulsene i kodevektorene Ak i overensstemmelse med N-innfelte enkeltpuls permutasjonskoder.
I den foreliggende oppfinnelse begrenses søkekompleksiteten drastisk ved å begrense subsettet av kodevektorer Ak som gjennomsøkes til kodevektorer hvor de N ikke-null-amplitudepulsene oppfyller funksjonen forhåndsetablert i trinn 301 på figur 3a. Den forhåndsetablerte funksjonen oppfylles når de N ikke-null-amplitudepulsene i en kodevektor Ak hver har en amplitude lik amplituden forhåndstilknyttet til posisjonen p for ikke-null-amplitudepulsen.
Nevnte begrensning av subsettet av kodevektorer utføres ved først å kombinere den forhåndsetablerte funksjon Sp med verdien i matrisen U (i, j)
(trinn 302 i figur 3a). så ved å bruke de N-nestede løkker fra figur 4 hvor alle pulser S(i) antatt å være faste, positive og av enhetsamplitude (trinn'303). På denne måten reduseres søkekompleksiteten til det tilfelle at pulsamplitudene er faste, selv om amplitudene til ikke-null-pulsene kan anta en hvilken som helst av q mulige verdier i den algebraiske kodebok. Mer presist kombineres matrisen U (i, j) som forsynes av filterresponskarakteriseren 105, med den forhåndsetablerte funksjon i overensstemmelse med følgende relasjon (trinn
302):
hvor Sj resulterer fra velgemetoden for amplitudevelgeren 112, nemlig den at Sj er amplituden valgt for en individuell posisjon i etter kvantisering av det tilhørende amplitudeestimat.
Med denne nye matrisen kan beregningen for hver løkke av den hurtige algoritmen skrives på en separat linje fra den ytterste til den innerste løkken som følger:
hvor px er posisjonen til null-amplitudepuls nummer x av bølgeformen, og hvor U' (px, py) er en funksjon avhengig av amplituden Sp^ forhåndstilknyttet til posisjon px av posisjonene p og amplituden S forhåndstilknyttet en posisjon py av posisjonene p.
For ytterligere å redusere søkerkompleksiteten, kan man hoppe over (jf. figur 3c) spesielt, men ikke utelukkende, den innerste løkken hver gang følgende ulikhet er sann:
Hvor Sp er amplituden forhåndstilknyttet til posisjon pn, Dp er komponent pn for målvektor D, og Td er en terskel knyttet til den bakoverfiltrerte målvektor D.
Det globale eksitasjonssignal E + gCk beregnes av en adderer 120 (figur 1) fra signalet gCk fra kontroller 109 og utsignalet E fra prediktoren 106. Utgangstilstandsberegnermodulen 110, bestående av et persepsjonsfilter med overføringsfunksjon l/A (zY"<1>) som varierer i relasjon til STP parametrene, subtraherer eksitasjonssignalet E + gCk fra restsignalet R utelukkende for det formål å finne den endelige filtertilstand FS for bruk som utgangstilstand i filter 107 og hovedfrekvensberegner 104.
Settet av fire parametere k, g, LPT og STP konverteres til egnet digitalt kanal format av en multiplekser 111 som fullfører prosedyren for å kode en blokk S av sampler av talesignalet.
Selv om foreliggende oppfinnelse har blitt beskrevet i det foregående med referanse til foretrukne utførelser, kan disse utførelser modifiseres fritt innenfor omfanget av de vedføyde krav uten at foreliggende oppfinnelses ånd og natur forlates.

Claims (22)

1. Fremgangsmåte for å gjennomføre et søk i en kodebok med det formål å kode et lydsignal, karakterisert ved at fremgangsmåten omfatter trinnene: - ved koding av lydsignalet, blir koderelaterte signaler trukket ut fra nevnte lydsignal; - kodeboken omfatter et sett av puls- amplitude/posisjonskombinasjoner (Ak); - hver puls-ampiitude/posisjonskombinasj on (Ak) definerer L forskjellig posisjoner (p) og omfatter både null-amplitudepulser og ikke-null-amplitudepulser tilknyttet respektive posisjoner p = 1, 2, ...L av kombinasjonen; - hver ikke-null-amplitudepuls antar én av q mulige amplituder; og - nevnte fremgangsmåte for å gjennomføre søk i en kodebok omfatter trinn for: å begrense posisjonene p til ikke-null-amplitudepulsene til kombinasjonene (Ak) i kodeboken i henhold til et sett med spor av pulsposisjoner, hvor pulsposisjonene til hvert spor ligger mellom pulsposisjonene til de andre sporene; å forhåndsvelge fra nevnte kodebok et subsett av pulsamplitude/posisjonskombinasjoner (Ak) i forhold til en del av de koderelaterte signalene; og å søke gjennom bare nevnte subsett av puls- amplitude/posisjonskombinasjoner (Ak) for å kode lydsignalet hvorved kompleksiteten av søket reduseres siden bare et subsett av pulsamplitude/posisjonskombinasjoner av kodeboken gjennomsøkes; hvor trinnet for forhåndsvelging omfatter å forhåndsetablere, i forhold til nevnte del av de kodingsrelaterte signalene, en amplitude/posisjonsfunksjon (Sp) som forhåhdstilknytter til posisjonene p = 1,2, ...L gyldige amplituder fra nevnte q mulige amplituder, og hvor søketrinnet omfatter å søke gjennom bare puls-amplitude/posisjonskombinasjonene (Ak) til nevnte kodebok som har ikke-null-amplitudepulser som tilfredsstiller den forhåndsetablerte funksjonen (Sp).
2. Fremgangsmåten i henhold til krav 1, karakterisert ved at trinnet for å forhåndsetablere funksjonen omfatter å forhåndstilknytte, ved hjelp av den forhåndsetablerte funksjonen (Sp), én av de q mulige amplitudene som gyldig amplitude til hver posisjon p, og at den forhåndsetablerte funksjonen (Sp) er tilfredsstilt når ikke-null-amplitudepulsene til en puls-amplitude/posisjonskombinasjon (Ak) hver har en amplitude lik amplituden forhåndstilknyttet av den forhåndsetablerte funksjonen (Sp) til posisjonen p til nevnte ikke-null-amplitudepuls.
3. Fremgangsmåten i henhold til krav 2, karakterisert ved at nevnte del av koderelaterte signaler trukket ut fra lydsignalet ved koding av nevnte lydsignal omfatter et bakovérfiltrert målsignal D og et hovedfrekvensfiltrert restsignal R', og at trinnet for forhåndstilknytting av én av de q mulige amplitudene til hver posisjon p omfatter trinn for: å beregne en amplitudeestimatvektor B som respons til det bakoverfiltrerte målsignalet D og til det hovedfrekvensfiltrerte restsignalet R': og for hver av posisjonene p, å kvantisere et amplitudeestimat Bp for nevnte vektor B for å finne amplituden som skal velges for nevnte posisjon p.
4. Fremgangsmåte i henhold til krav 3, karakterisert ved at trinnet å beregne amplitudeestimatvektoren B omfatter trinnet å summere det bakoverfiltrerte målsignalet D i normalisert form: til det hovedfrekvensfiltrerte restsignal R' i normalisert fonn: for derved å oppnå en amplitudeestimat vektor B med formen: hvor p er en fast konstant.
5. Fremgangsmåte i henhold til krav 4, karakterisert ved at |3 er en fast konstant med verdi mellom 0 og 1.
6. Fremgangsmåten i henhold til krav 3-5, karakterisert ved at for hver av posisjonene p omfatter kvantiseringstrinnet å kvantisere et toppverdi-normalisert amplitudeestimat Bp av nevnte vektor B ved bruk av følgende uttrykk: hvor nevneren er en normaliseringsfaktor som representerer toppamplituden til ikke-null-amplitudepulsene.
7. Fremgangsmåte i henhold til et av kravene 1-6, karakterisertvedat: - nevnte pulskombinasjoner (Ak) hver omfatter et antall N av ikke-null-amplitudepulser; - settet av spor omfatter N spor med pulsposisjoner respektivt tilknyttet til de N ikke-null-amplitudepulsene; - pulsposisjonene for hvert spor er mellom pulsposisjonene til de N-l andre sporene; og - trinnet å begrense omfatter å begrense pulsposisjonene for hver ikke-null-amplitudepuls til posisjonene til det tilknyttede sporet.
8. Fremgangsmåte i henhold til et av kravene 1-6, karakterisert ved at nevnte pulsamplitude/posisjonskombinasjoner (Ak) hver omfatter et antall N ikke-null-amplitudepulser, og hvor trinnet å søke omfatter trinnet å maksimalisere et gitt forhold som har nevner o^2 beregnet ved hjelp av N nestede løkker i overenstemmelse med følgende relasjon: hvor beregningen for hver løkke er skrevet i en separat linje fra en ytterste løkke til en innerste løkke av de N nestede løkker, hvor pn er posisjonen til den n'te ikke-null-amplitudepuls av kombinasjonen, og hvor U' (px, py) er en funksjon avhengig av amplituden S forhåndstilknyttet til en posisjon px blant posisjonene p og amplituden Sp forhåndstilknyttet til en posisjon py blant posisjonene p.
9. Fremgangsmåten i henhold til krav 8, karakterisert ved at trinnet å maksimalisere nevnte forhold omfatter trinnet å utelate i det minste den innerste løkken av de N nestede løkkene når følgende ulikhet er sann: hvor S er amplituden forhåndstilknyttet til posisjonen pn, DPn er den pn-te komponenten av målvektoren D, og Td er en terskel knyttet til den bakoverfiltrerte målvektor D.
10. Anordning for å gjennomføre et søk i en kodebok for å kode et lydsignal ved hvor: koding av lydsignalet, blir koderelaterte signaler trukket ut fra nevnte lydsignal; - nevnte kodebok består av et sett puls amplitude/posisjonskombinasjoner (Ak); - hver puls-amplitude/posisjonskombinasjon (Ak) definerer L forskjellige posisjoner (p) og omfatter både null-amolitudepulser og ikke-null-amplitudepulser tilknyttet respektive posisjoner p = 1,2, ...L av kombinasjonen; - hver ikke-null-amplitudepuls antar en av q mulige amplituder, karakterisert ved at nevnte anordning for å gjennnomføre et søk i en kodebok omfatter: midler for å begrense posisjonene p til ikke-null-amplitudepulsene til kombinasjonene (Ak) til kodeboken i overenstemmelse med et sett med spor av pulsposisjoner, hvor pulsposisjonene for hvert spor er mellom pulsposisjonene til de andre sporene; midler for å forhåndsvelge fra nevnte kodebok et subsett av pulsamplitude/posisjonskombinasjoner i forhold til en del av de koderelaterte signalene; og midler for å søke bare nevnte subsett av puls-amplitudekombinasjoner (Ak) for å kode lydsignalet hvorved kompleksiteten til søket reduseres siden bare ett subsett av puls-amplitude/posisjonskombinasjonene av kodeboken gjennomsøkes; hvor midlene for å forhåndsvelge omfatter midler for å forhåndsetablere, i forhold til nevnte del av koderelaterte signaler, en amplitude/posisjonsfunksjon (Sp) som forhåndstilknytter til posisjonene p = I, 2, ...L gyldige amplituder av nevnte q mulige amplituder, og hvor midlene for å søke omfatter midler for å begrense søket til de pulsamplitude/posisjonskombinasjoner (Ak) av kodeboken som har ikke-null-amplitudepulser som tilfredsstiller den forhåndsetablerte funksjonen (Sp).
II. Anordning i henhold til krav 10, karakterisert ved at midlene for å forhåndsetablere en funksjon omfatter midler for å forhåndstilknytte, ved hjelp av den forhåndsetablerte funksjonen (Sp), én av de q mulige amplitudene som gyldig amplitude for hver posisjon p, og hvor den forhåndsetablerte funksjonen (Sp) er tilfredsstilt når ikke-null-amplitudepulsene til en puls-amplitude/posisjonskombinasjon (Ak) hver har en amplitude lik amplituden forhåndstilknyttet av den forhåndsetablerte funksjonen (Sp) til posisjonen p for nevnte ikke-null-amplitudepuls.
12. Anordning i henhold til krav 11, karakterisert ved at nevnte del av de koderelaterte signalene trukket ut fra lydsignalet ved koding av nevnte lydsignal omfatter et bakoverfiltrert målsignal D og et hovedfrekvensfiltrert restsignal R', og hvor midlene for å forhåndstilknytte én av de q mulige amplitudene til hver posisjon p omfatter: midler for å beregne en amplitudeestimatsektor B som respons til det bakoverfiltrerte målsignalet D og til det hovedfrekvensfiltrerte restsignalet R'; og midler for å kvantisere, for hver av de nevnte posisjonene p, et amplitudeestimat Bp for nevnte vektor B for å oppnå amplituden som skal velges for posisjonen p.
13. Anordning i henhold til krav 12, karakterisert ved at midlene forå beregne amplitudeestimatvektoren B omfatter midler for å summere det bakoverfiltrerte målsignalet D i normalisert form: til det hovedfrekvensfiltrerte restsignal R' i normalisert form: for derved å oppnå en amplitudeestimat vektor B med formen": hvor p er en fast konstant.
14. Anordning i henhold til krav 13, karakterisert ved at P er en fast konstant med verdi mellom 0 og 1.
15. Anordning i henhold til et av kravene 12-14, karakterisert ved at kvantiseringsmidlene omfatter midler for å kvantisere, for hver av posisjonene p, et toppverdi-normalisert amplitudeestimat Bp av nevnte vektor B ved bruk av følgende uttrykk: hvor nevneren er en normaliseringsfaktor som representerer toppamplituden til ikke-null-amplitudepulsene.
16. Anordning i henhold til et av kravene 10-15, karakterisert ved at - nevnte pulskombinasjoner (Ak) hver omfatter et antall N av ikke-null-amplitudepulser; - settet med spor omfatter N spor av pulsposisjoner tilknyttet til de respektive N ikke-null-amplitudepulser; - pulsposisjoner for hvert spor er mellom pulsposisjonene til de N-l andre spor; og - midler for å begrense omfatter en struktur for å begrense pulsposisjonene for hver ikke-null-amplitudepuls til posisjonene til det tilknyttede sporet.
17. Anordning i henhold til et av kravene 10-15, karakterisert ved at nevnte puls-amplitude/posisjon kombinasjoner hver omfatter et antall ikke-null-amplitudepulser, og hvor midlene for å søke i kodeboken omfatter midler for å maksimalisere et gitt forhold med nevner ak beregnet ved hjelp av N nestede løkker i overenstemmelse med følgende relasjon: hvor beregningen for hver løkke er skrevet inn i en separat linje fra en ytterste løkke til en innerste løkke av de N-nestede løkker, hvor pn er posisjonen til den n-te ikke-null-amplitude pulsen av kombinasjonen, og hvor U' (Px, Py) er en funksjon avhengig av amplituden SPi forhåndstilknyttet til en posisjon px blant posisjonene p og amplituden Sp forhåndstilknyttet til en posisjon py blant posisjonene p.
18. Anordning i henhold til krav 17, karakterisert ved at midlene for å beregne nevneren ak<2 >omfatter midler for å utelate i det minste den innerste løkken av de N nestede løkkene når følgende ulikhet er sann: hvor 5ft er amplituden forhåndstilknyttet til posisjonen pn, DPm er den pn-te komponenten av målvektoren D, og TD er en terskel knyttet til den bakoverfiltrerte målvektor D.
19. Et celledelt kommunikasjonssystem for dekning av et stort geografisk område delt inn i et flertall av celler, omfattende: mobile sender/mottakerenheter (3); cellebasestasjoner (2) plassert i hver respektive celle; midler (5) for å kontrollere kommunikasjon mellom basestasjonene i cellene (2); et toveis trådløst kommunikasjonsundersystem mellom hver mobile enhet (3) plassert i en celle og basestasjonen i cellen (2), hvor nevnte toveis trådløse kommunikasjonsundersystem omfatter i begge de mobile enhetene (3) og i cellebasestasjonen (2) (a) en sender som omfatter midler for å kode et talesignal og midler for å sende det kodede talesignalet, og (b) en mottaker som omfatter midler for å motta et sendt kodet talesignal og midler for å dekode det mottatte kodede talesignal; karakterisert ved at nevnte midler for å kode talesignalet omfatter midler som gir respons på talesignalet for å danne talesignalkodeparametere, og hvor nevnte midler for å danne talesignalkodeparametere omfatter en anordning som nevnt i ett av kravene 10-18, for å utføre et søk i en kodebok for å produsere minst ett av nevnte talesignalkodeparameter, hvor talesignalet utgjør nevnte lydsignal.
20. Et celledelt nettverkselement (2) omfattende (a) en sender som omfatter midler for å kode et talesignal og midler for å sende det kodede talesignalet, og (b) en mottaker som omfatter midler for å motta et sendt kodet talesignal og midler for å dekode det mottatte kodede talesignalet, karakterisert ved at - nevnte midler for å kode talesignalet omfatter midler som gir respons på talesignalet for å danne talesignalkodeparametere, og hvor nevnte midler for å danne nevnte talesignalkodeparametere omfatter en anordning som beskrevet i et av kravene 10-18 for å utføre et søk i en kodebok for å produsere minst én av nevnte talesignalkodeparametere, hvor talesignalet utgjør nevnte lydsignal.
21. En celledelt mobil sender/mottakerenhet (3) omfatter (a) en sender som omfatter midler for å kode et talesignal og midler for å sende det kodede talesignalet. og (b) en mottaker som omfatter midler for å motta et kodet talesignal og midler for å dekode det motsatte kodede talesignalet; hvor nevnte midler for å kode talesignalet omfatter midler som gir respons på talesignalet for å danne talesignalkodeparametere, og hvor nevnte midler for å produsere talesignalkodeparametere omfatter en anordning som beskrevet i et av kravene 10-18 for å utføre et søk i en kodebok for å produsere minst én av nevnte talesignalkodeparametere, hvor talesignalet utgjør nevnte lydsignal.
22. I et celledelt kommunikasjonssystem for å dekke et stort geografisk område delt i et flertall celler og som omfatter: - mobile sender/mottakerenheter (3); cellebasestasjoner (2) plassert i hver respektive celle; og midler (5) for å kontrollere kommunikasjon mellom cellebasestasjonene (2); - et toveis trådløst kommunikasjonsundersystem mellom hver mobile enhet (3) plassert i en celle og cellebasestasjonen (2) til nevnte celle, hvor nevnte toveis trådløs kommunikasjonsundersystem omfatter i både den mobile enheten (3) og cellebasestasjonen (2) (a) en sender som omfatter midler for å kode talesignal og midler for å sende det kodede talesignalet, (b) en mottaker som omfatter midler for å motta et sendt kodet talesignal og midler for å dekode det mottatte kodede talesignalet, karakterisert ved at nevnte midler for å kode talesignalet omfatter midler som gir respons til talesignalet for å danne talesignalkodeparametere, og hvor nevnte midler for å produsere talesignalparametere omfatter en anordning som beskrevet i et av kravene 10-18 for å utføre et søk i en kodebok for å produsere minst én av nevnte talesignalkodeparametere, hvor talesignalet utgjør nevnte lydsignal.
NO19973472A 1995-02-06 1997-07-28 Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale NO318595B1 (no)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38396895A 1995-02-06 1995-02-06
US08/508,801 US5754976A (en) 1990-02-23 1995-07-28 Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
PCT/CA1996/000069 WO1996024925A1 (en) 1995-02-06 1996-02-02 Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech

Publications (3)

Publication Number Publication Date
NO973472D0 NO973472D0 (no) 1997-07-28
NO973472L NO973472L (no) 1997-10-06
NO318595B1 true NO318595B1 (no) 2005-04-18

Family

ID=27010408

Family Applications (1)

Application Number Title Priority Date Filing Date
NO19973472A NO318595B1 (no) 1995-02-06 1997-07-28 Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale

Country Status (26)

Country Link
US (1) US5754976A (no)
EP (2) EP0808496B1 (no)
JP (2) JP3430175B2 (no)
KR (2) KR100388751B1 (no)
CN (2) CN1198262C (no)
AR (1) AR000871A1 (no)
AT (2) ATE248423T1 (no)
AU (1) AU708392C (no)
BR (1) BR9607026A (no)
CA (1) CA2210765C (no)
DE (1) DE19604273C5 (no)
DK (2) DK1225568T3 (no)
ES (1) ES2112807B1 (no)
FI (2) FI117994B (no)
FR (1) FR2730336B1 (no)
GB (1) GB2297671B (no)
HK (2) HK1002492A1 (no)
IN (1) IN187453B (no)
IT (1) IT1305724B1 (no)
MX (1) MX9705997A (no)
MY (2) MY119038A (no)
NO (1) NO318595B1 (no)
PT (1) PT1225568E (no)
RU (1) RU2142166C1 (no)
SE (1) SE520553C2 (no)
WO (1) WO1996024925A1 (no)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
US6393391B1 (en) * 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
TW317051B (no) * 1996-02-15 1997-10-01 Philips Electronics Nv
CN1252679C (zh) * 1997-03-12 2006-04-19 三菱电机株式会社 声音编码装置、声音编码译码装置、以及声音编码方法
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
EP1686563A3 (en) * 1997-12-24 2007-02-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for speech decoding
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP3180762B2 (ja) * 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
WO2000016501A1 (en) * 1998-09-11 2000-03-23 Motorola Inc. Method and apparatus for coding an information signal
SE521225C2 (sv) * 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
US6295520B1 (en) 1999-03-15 2001-09-25 Tritech Microelectronics Ltd. Multi-pulse synthesis simplification in analysis-by-synthesis coders
JP2001075600A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 音声符号化装置および音声復号化装置
US7272553B1 (en) * 1999-09-08 2007-09-18 8X8, Inc. Varying pulse amplitude multi-pulse analysis speech processor and method
JP4005359B2 (ja) 1999-09-14 2007-11-07 富士通株式会社 音声符号化及び音声復号化装置
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
US6728669B1 (en) 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
KR100438175B1 (ko) * 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US7236928B2 (en) * 2001-12-19 2007-06-26 Ntt Docomo, Inc. Joint optimization of speech excitation and filter parameters
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
KR100503414B1 (ko) * 2002-11-14 2005-07-22 한국전자통신연구원 고정 코드북의 집중 검색 방법 및 장치
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
CN100416652C (zh) * 2005-10-31 2008-09-03 连展科技(天津)有限公司 增强的amr编码器快速固定码本搜索方法
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
US20080120098A1 (en) * 2006-11-21 2008-05-22 Nokia Corporation Complexity Adjustment for a Signal Encoder
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
CN101286321B (zh) * 2006-12-26 2013-01-09 华为技术有限公司 双脉冲激励的线性测编码
EP2827327B1 (en) 2007-04-29 2020-07-29 Huawei Technologies Co., Ltd. Method for Excitation Pulse Coding
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
WO2009033288A1 (en) * 2007-09-11 2009-03-19 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
EP2227806A4 (en) * 2007-12-21 2013-08-07 Nvoq Inc DISTRIBUTED DICTÉE / TRANSCRIPTION SYSTEM
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
DK2242045T3 (da) * 2009-04-16 2012-09-24 Univ Mons Talesyntese og kodningsfremgangsmåder
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
CN102623012B (zh) * 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
US8880404B2 (en) * 2011-02-07 2014-11-04 Qualcomm Incorporated Devices for adaptively encoding and decoding a watermarked signal
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
US9070356B2 (en) 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US20140334564A1 (en) * 2013-05-09 2014-11-13 Samsung Electronics Co., Ltd Method and system for providing low-complexity hybrid precoding in wireless communication systems

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
CA1164569A (en) * 1981-03-17 1984-03-27 Katsunobu Fushikida System for extraction of pole/zero parameter values
US4710959A (en) * 1982-04-29 1987-12-01 Massachusetts Institute Of Technology Voice encoder and synthesizer
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
JPS5922165A (ja) * 1982-07-28 1984-02-04 Nippon Telegr & Teleph Corp <Ntt> アドレス制御回路
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
US4764963A (en) * 1983-04-12 1988-08-16 American Telephone And Telegraph Company, At&T Bell Laboratories Speech pattern compression arrangement utilizing speech event identification
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
DE3335358A1 (de) * 1983-09-29 1985-04-11 Siemens AG, 1000 Berlin und 8000 München Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung
US4799261A (en) * 1983-11-03 1989-01-17 Texas Instruments Incorporated Low data rate speech encoding employing syllable duration patterns
CA1236922A (en) * 1983-11-30 1988-05-17 Paul Mermelstein Method and apparatus for coding digital signals
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
CA1226946A (en) * 1984-04-17 1987-09-15 Shigeru Ono Low bit-rate pattern coding with recursive orthogonal decision of parameters
US4680797A (en) * 1984-06-26 1987-07-14 The United States Of America As Represented By The Secretary Of The Air Force Secure digital speech communication
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4858115A (en) * 1985-07-31 1989-08-15 Unisys Corporation Loop control mechanism for scientific processor
IT1184023B (it) * 1985-12-17 1987-10-22 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4873723A (en) * 1986-09-18 1989-10-10 Nec Corporation Method and apparatus for multi-pulse speech coding
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
DE68922134T2 (de) * 1988-05-20 1995-11-30 Nippon Electric Co Überträgungssystem für codierte Sprache mit Codebüchern zur Synthetisierung von Komponenten mit niedriger Amplitude.
US5008965A (en) * 1988-07-11 1991-04-23 Kinetic Concepts, Inc. Fluidized bead bed
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JP3089769B2 (ja) * 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
DE4315313C2 (de) * 1993-05-07 2001-11-08 Bosch Gmbh Robert Vektorcodierverfahren insbesondere für Sprachsignale

Also Published As

Publication number Publication date
RU2142166C1 (ru) 1999-11-27
SE520553C2 (sv) 2003-07-22
FI973241A0 (fi) 1997-08-06
JPH10513571A (ja) 1998-12-22
CN1181150A (zh) 1998-05-06
ATE230888T1 (de) 2003-01-15
HK1002492A1 (en) 1998-08-28
JP2003308100A (ja) 2003-10-31
EP1225568B1 (en) 2003-08-27
AU4479696A (en) 1996-08-27
IN187453B (no) 2002-04-27
US5754976A (en) 1998-05-19
GB2297671A (en) 1996-08-07
IT1305724B1 (it) 2001-05-15
CN1410970A (zh) 2003-04-16
ES2112807A1 (es) 1998-04-01
HK1055007A1 (en) 2003-12-19
JP4187556B2 (ja) 2008-11-26
PT1225568E (pt) 2004-01-30
FI20020320A (fi) 2002-02-18
ITUD960012A1 (it) 1997-08-02
KR100388751B1 (ko) 2003-11-28
AU708392B2 (en) 1999-08-05
EP1225568A1 (en) 2002-07-24
BR9607026A (pt) 1997-11-04
EP0808496A1 (en) 1997-11-26
DE19604273C2 (de) 2000-06-29
DK0808496T3 (da) 2003-04-22
NO973472L (no) 1997-10-06
MX9705997A (es) 1997-11-29
GB2297671B (en) 2000-01-19
FI118396B (fi) 2007-10-31
ITUD960012A0 (it) 1996-02-02
FI117994B (fi) 2007-05-15
FR2730336A1 (fr) 1996-08-09
FI973241A (fi) 1997-10-06
NO973472D0 (no) 1997-07-28
MY130529A (en) 2007-06-29
GB9602391D0 (en) 1996-04-03
DE19604273A1 (de) 1996-08-29
CN1198262C (zh) 2005-04-20
MY119038A (en) 2005-03-31
AU708392C (en) 2003-01-09
ATE248423T1 (de) 2003-09-15
CN1220178C (zh) 2005-09-21
JP3430175B2 (ja) 2003-07-28
KR19980701975A (ko) 1998-06-25
FR2730336B1 (fr) 1997-08-14
EP0808496B1 (en) 2003-01-08
DE19604273C5 (de) 2004-05-27
WO1996024925A1 (en) 1996-08-15
KR100393910B1 (ko) 2003-08-02
AR000871A1 (es) 1997-08-06
CA2210765A1 (en) 1996-08-15
ES2112807B1 (es) 1999-04-16
SE9600437D0 (sv) 1996-02-06
DK1225568T3 (da) 2003-11-24
CA2210765C (en) 2001-08-21

Similar Documents

Publication Publication Date Title
NO318595B1 (no) Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale
KR100299408B1 (ko) 음성의고속코딩을위한심도우선대수코드북검색
US6055496A (en) Vector quantization in celp speech coder
US7249014B2 (en) Apparatus, methods and articles incorporating a fast algebraic codebook search technique
MXPA03004513A (es) Metodo y dispositivo para vincular posiciones y signos de pulso de vinculacion en libros de codigos algebraicos para codificacion eficiente de senales de banda ancha.
US5987406A (en) Instability eradication for analysis-by-synthesis speech codecs
US5943644A (en) Speech compression coding with discrete cosine transformation of stochastic elements
NO322594B1 (no) Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale
CA2618002C (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
CA2210765E (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
US5729654A (en) Vector encoding method, in particular for voice signals
KR960015861B1 (ko) 선 스펙트럼 주파수 벡터의 양자화 방법 및 양자화기
WO2000042601A1 (en) A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders
SE524905C2 (sv) Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal

Legal Events

Date Code Title Description
MK1K Patent expired