SE520553C2 - Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal - Google Patents
Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av talInfo
- Publication number
- SE520553C2 SE520553C2 SE9600437A SE9600437A SE520553C2 SE 520553 C2 SE520553 C2 SE 520553C2 SE 9600437 A SE9600437 A SE 9600437A SE 9600437 A SE9600437 A SE 9600437A SE 520553 C2 SE520553 C2 SE 520553C2
- Authority
- SE
- Sweden
- Prior art keywords
- amplitude
- pulse
- speech signal
- positions
- signal
- Prior art date
Links
- 239000013598 vector Substances 0.000 claims abstract description 82
- 230000005236 sound signal Effects 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000004891 communication Methods 0.000 claims description 24
- 230000006854 communication Effects 0.000 claims description 24
- 230000014509 gene expression Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002457 bidirectional effect Effects 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000007175 bidirectional communication Effects 0.000 claims 2
- 230000001413 cellular effect Effects 0.000 claims 2
- 101150086163 pup3 gene Proteins 0.000 claims 1
- 230000004044 response Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 22
- 230000007774 longterm Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 7
- 230000005284 excitation Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000004075 alteration Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000023402 cell communication Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
- G10L2019/0008—Algebraic codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
520 553 2 För att syntetisera tal enligt CELP-tekniken syntetiseras varje block av talsamp- lingar genom att filtrera den vederbörande kodvektorn från kodboken genom tidsvarierande filter, som modellerar talsignalens spektrala karakteristikor. På kodningssidan beräknas den syntetiska utsignalen för alla eller en undeïgrupp av kandidatkodvektorema från kodboken (kodbokssökning). Den valda kodvektorn är den som alstrar den syntetiska utsignal som ligger närmast den ursprungliga talsignalen enligt ett varseblivningsmässigt viktat distortionsmått.
En första typ av kodböcker är de s.k. "stokastiska" kodböckerna. En nackdel med sådana kodböcker är att de ofta innefattar stora fysiska lagringsmängder. De är stokastiska, dvs. slumpmässiga i den meningen, att vägen från index till till- hörande kodvektor innefattar uppslagstabeller, som är resultatet av slumpmässigt alstrade tal eller statistiska tekniker, tillämpade på stora talträningsuppsättningar.
Storleken på stokastiska kodböcker tenderar att begränsas av komplexiteten för lagring och/eller sökning.
En andra typ av kodböcker är de algebraiska kodböckerna. I motsats till de stokastiska kodböckema år algebraiska kodböcker icke slumpmässiga och fordrar ingen lagring. En algebraisk kodbok är en uppsättning av indexerade kodvektorer, där amplituderna och lägena för pulserna i den k-te kodvektorn kan härledas från dess index k genom en regel som fordrar ingen eller minimal fysisk lagring.
Följaktligen är en algebraisk kodboks storlek ej begränsad av lagringskrav.
Algebraiska kodböcker kan även konstrueras för effektiv sökning.
Syften med upgfinningen Ett syfte med föreliggande uppfinning är följaktligen att åstadkomma en metod och anordning för att drastiskt reducera komplexiteten för kodbokssökningen efter kodning av en ljudsignal, vilken metod och anordning skall vara tillämpbara för en stor klass av kodböcker. 520 553 3 Ett annat syfte med föreliggande uppfinning är att åstadkomma en metod och anordning, som förmår välja a-priori en undergrupp av kodbokspulskombinationer och begränsa kombinationerna som skall sökas till denna undergrupp för att _»- minska komplexíteten i kodbokssökningen.
Ett ytterligare syfte med föreliggande uppfinning år att öka storleken av en kodbok genom att låta de enskilda icke-noll-amplitudpulserna för kodvektorema anta minst en av q möjliga amplituder utan att öka sökkomplexiteten.
Sammanfattning av uppfinningen Närmare bestämt och i enlighet med föreliggande uppfinning åstadkommes en metod för att genomföra en sökning i en kodbok för att koda en ljudsignal, vilken kodbok består av en uppsättning av pulskombinationer och varje pulskombination definierar ett flertal olika positioner och omfattar pulser tillordnade respektive positioner i kombinationen, vilken metod omfattar följande steg: förval från kodboken av en undergrupp av pulskombinationer i förhållande till ljudsignalen; och sökning endast av denna undergrupp av pulskombinationer för att koda ljudsigna- len; -_ varvid komplexíteten av sökningen minskas eftersom bara en undergrupp av pulskombinationema i kodboken genomsökes.
Föreliggande uppfinning avser också en metod för att genomföra en sökning i en kodbok för att koda en ljudsignal, där kodboken består av en uppsättning av pulsamplitud/positionskombinationer, där varje pulsamplitud/positionskombination definierar L olika positioner och omfattar både nollamplitudpulser och icke- nollamplitudpulser, tillordnade respektive positioner p = 1, 2, ...L i kombinatio- nen, och varje icke-nollamplitudpuls antar minst en av q möjliga amplituder.
Denna metod omfattar följande steg: lO 520 555 4 förval från kodboken av en undergrupp av pulsamplitud/positionskombinationer i relation till ljudsignalen; och sökning endast i undergruppen av pulsamplitud/positionskombinationer för att koda ljudsignalen. f' Ånyo minskas komplexiteten i sökningen, eftersom bara en undergrupp av pulsamplitud/positionskombinationer i kodboken genomsökes.
I enlighet med föreliggande uppfinning ástadkommes en anordning för att utföra en sökning i en kodbok för att koda en ljudsignal, vilken kodbok består av en uppsättning av pulskombinationer och varje pulskombination definierar ett flertal olika positioner och omfattar pulser tillordnade respektive positioner i kom- binationen, vilken anordning omfattar: medel för förval ur kodboken av en undergrupp av pulskombinationer i för- hållande till ljudsignalen; och medel för sökning endast i undergruppen av pulskombinationer för att koda ljudsignalen.
Komplexiteten i sökningen minskas, eftersom bara en undergrupp av pulskom- binationerna i kodboken genomsökes. -_ Uppfinningen hänför sig även till en anordning för utförande av en sökning i en kodbok för att koda en ljudsignal, vilken kodbok består av en uppsättning av pulsamplitud/positionskombinationer, där varje pulsamplitud/positionskombination definierar L olika positioner och omfattar både nollamplitudpulser och icke- nollamplitudpulser, tillordnade till respektive positioner p = l, 2, ...L i kom- binationen, och varje icke-nollamplitudpuls antar minst en av q möjligaamplitu- der. Denna anordning omfattar medel för förval ur kodboken av en undergrupp av pulsamplitud/positionskombinationer i relation till ljudsignalen, och medel för sökning endast av undergruppen av pulsamplitud/positionskombinationen för att 520 553 koda ljudsignalen, varvid sökningens komplexitet förminskas, eftersom bara en undergrupp av pulsamplitud/positionskombinationerna i kodboken genomsökes.
I enlighet med uppfinningen åstadkommes också ett cellkommunikationssystem för betjäning av ett stort geografiskt område, uppdelat i ett flertal celler, -om- fattande: mobila bärbara sändar/mottagarenheter; cellbasstationer placerade i respektive celler; medel för styrning av kommunikation mellan cellbasstationerna; ett dubbelriktat radiokommunikationssubsystem mellan varje mobil enhet, placerad i en cell och cellbasstationen i samma cell, vilket dubbelriktade radio- kommunikationssubsystem omfattar, både i den mobila enheten och cellbasstatio- nen (a), en sändare, innefattande medel för kodning av en talsignal och medel för utsändning av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; vari talsignalkodningsmedlen omfattar en anordning för genomförande av en sökning i en kodbok för att koda talsignalen, vilken kodbok består av en upp- sättning av pulskombinationer och varje pulskombination definierar ett flertal olika positioner och omfattar pulser tillordnade respektive positioner i kom- binationen, och vilken sökgenomföringsanordning omfattar: medel för förval från kodboken av en undergrupp av pulskombinationer i relation till talsignalen; och medel för genomsökning av endast undergruppen av pulskombinationer för att koda talsignalen; varvid sökningens komplexitet fönninskas då endast en undergrupp av pulskom- binationerna i kodboken genomsökes. _,_ Slutligen avser uppfinningen ett cellkommunikationssystem för betjäning av ett stort geografiskt område, uppdelat i ett flertal celler, omfattande: mobila portabla sändarmottagarenheter; 520 553 6 cellbasstationer placerade i respektive celler; medel för styrning av kommunikationen mellan cellbasstationema; ett dubbelriktat radiokommunikationssubsystem mellan varje mobil enhet, placerad i en cell och cellbasstationen i denna cell, vilket dubbelriktade” radiokom- munikationssubsystem i både den mobila enheten och cellbasstationen (af-omfattar en sändare, innefattande medel för kodning av en talsignal och medel för överför- ing av den kodade talsignalen, och (b) en mottagare, innefattande medel för mottagning av en översänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid de talsignalkodande medlen omfattar en anordning för utförande av en sökning i en kodbok för att koda talsignalen, vilken kodbok består av en upp- sättning av pulsamplitud/positionskombinationer, där varje pulsamplitud/positions- kombination definierar L olika positioner och omfattar báde nollamplitudpulser och icke-nollamplitudpulser, tillordnade respektive Igen p = 1, 2, ...L i kom- binationen, och varje icke-nollamplitudpuls antar minst en av q möjliga amplitu- der, vilken sökgenomföringsanordning omfattar: b medel för förval från kodboken av en Undergrupp av pulsamplitud/positionskom- binationer i relation till talsignalen; och medel för genomsökning av endast undergruppen av pulsamplitud/positionskom- binationer för att koda talsignalen, -_ Under drift minskas komplexiteten i sökningen, eftersom bara en undergurpp av pulsamplitud/positionskombinationema i kodboken genomsökes.
I enlighet med ett föredraget utförande av uppfinningen (a) förväljes under- gruppen av pulsamplitud/positionskombinationer genom att i förväg bestämma, i relation till ljudsignalen, en funktion Sp mellan respektive lägen p = 1,_,_2, ...L och de q möjliga amplituderna, och (b) endast de pulsamplitud/positionskom- binationer i kodboken som har icke-nollamplitudpulser som uppfyller den i förväg upprättade funktionen, genomsökes. 520 553 7 Lämpligen förutbestämmes funktionen Sp genom att i förväg tillordna, i relation till ljudsignalen, en av de q möjliga amplituderna till varje läge p, och den förbestämda funktionen är uppfylld när icke-nollamplitudpulserna i en pulsampli- tud/positionskombination vardera har en amplitud, som är lika med deiï amplitud Sp, som är förutbestämd för positionen p för icke-nollamplitudpulsen. i __ Företrädesvis omfattar förutbestämning av en av de q möjliga amplituderna för varje läge p följande steg: att ljudsignalen behandlas för att alstra en bakåtfiltrerad mälsignal D och en tonhöjdseliminerad residual signal R'; beräkning av en amplituduppskattningsvektor B i motsvarighet till den bakåt- filtrerade málsignalen D och den tonhöjdseliminerade residualsignalen R'; och för var och en av positionerna p kvantisering av en amplituduppskattning Bp för vektorn B för att erhålla den amplitud som skall väljas för positionen p.
Beräkningen av amplituduppskattningsvektom omfattar lämpligen steget att summera den bakåtfiltrerade målsignalen D i normaliserad form: D ”- “lm med den tonhöjdseliminerade residualsignalen R' i normaliserad formzt ß R' .ja/j in, för att därigenom erhålla en amplituduppskattningsvektor B med formen: -=' - .A+ R 3 “l ß) nun ßtæw där ß är en fast konstant, företrädesvis med ett värde mellan O och 1. __ I enlighet med ett ytterligare föredraget utförande av uppfinningen utföres kvantiseringen på en toppnormaliserad amplituduppskattning B p av vektom B med användning av följande uttryck: 520 553 s Bp/ max I B nl där nämnaren rnax|8n| A1 är en normaliseringsfaktor, som representerar en toppamplitud för icke-nollampli- tudpulsema.
Pulskombinationerna kan vardera omfatta ett antal N av icke-nollamplitudpulser, och positionerna p för icke-nollamplitudpulsema är lämpligen begränsade i enlighet med minst en N-intervävd enkel-puls-permutationskod.
Sökningen av kodboken omfattar företrädesvis maximering av en given kvot med 2 en nämnare ak , beräknad medelst N i varandra kopplade slingor i enlighet med följande uttryck: <=ï = rfl +U'(z>,,.r=;) + 2U' +Uf(p,,p,> + 2u'(p1.p3)+ zU/(pwpp »-rr'<_p.,,p,,) + zU'(p1.p,,) + 2rrf<¿_»,_,¿_~,) +. . _» an/(prkuplv) där beräkningen för varje slinga är skriven i en separat linje från en yttersta slinga till en innersta slinga av de N i varandra lagda slingorna, där pn är positionen för den n-te icke-nollamplitudpulsen i kombinationen och där U'(px, py) är en funktion, som beror av den amplitud S X, som är förtillordnad till en P position px bland positionerna p, och amplituden Spy som är förtillordnad till en position py bland positionerna p. Vid den ovanstående beräkningen kan åtminsto- ne den innersta slingan av de N i varandra lagda slingorna överhoppas så snart följande olikhet är uppfylld: 520 553 9 där Spn är den amplitud som är förtillordnad till positionen pn Dpn är den pIHe komponenten i mälvektom D, och TD är ett tröskelvärde, som är relaterat till den bakâtfiltrerade målvektorn D.
Syften, fördelar och andra särdrag enligt föreliggande uppfinning kommer att framgå tydligare genom läsning av den följande icke-begränsande beskrivningen av ett föredraget utföringsexempel därav, som alltså bara är ett exempel, med hänvisning till ritningarna.
Kort flgurbeskrivning Fig. 1 är ett schematiskt blockschema över en ljudsignalkodande anordning, omfattande en amplitudväljare och en optimiseringsstyrare i enlighet med upp- finningen; fig. 2 är ett schematiskt blockschema över en avkodningsanordning, samverkande med kodningsanordningen i fig. 1; fig. 3a är en följd av grundoperationer för den snabba kodboksgenomsökningen i enlighet med uppfinningen, baserat på signalvalda pulsamplituder; fig. 3b är en följd av operationer för förbestämning av en av de q amplituderna för varje position p i pulsamplitud/positionskombinationerna; ~ fig. 3c är en följd av operationer, ingående i den N-inbäddade slingsökning, där den innersta slingan överhoppas sâ snart bidraget från de första N-1 pulsema till täljaren DAkT bedömes otillräckligt; fig. 4 är en schematisk representation av de N-innästade slingorna, som används i kodbokssökningen; och fig. 5 är ett schematiskt blockschema, som visar infrastrukturen för ett typiskt kommunikationssystem av celltyp.
Detaljerad beskrivning av det föredragna utföringsexemplet Fig. 5 visar infrastrukturen för ett typiskt kommunikationssystem 1 av celltyp. 520 553 Ehuru tillämpningen av metoden för sökgenomförande och anordningen enligt uppfinningen vid ett kommunikationssystem av celltyp visas som ett icke be- gränsande exempel i den här föreliggande beskrivning, bör hållas i minnet att metoden och anordningen kan användas med samma fördelar i många 'andra typer av kommunikationssystem, där ljudsignalskodning krävs.
Vid ett kommunikationssystem av celltyp, såsom l, tillhandahålles en telekommu- nikationstjänst över ett stort geografiskt omrâde genom att uppdela detta stora område i ett antal mindre celler. Varje cell har en cellbasstation 2 (fig. 5) för att åstadkomma radiosignalneringskanaler och audio- och datakanaler.
Radiosignaleringskanalema användes för att kalla mobila radiotelefoner (mobila sändarmottagarenheter) såsom 3 inom gränserna för cellbasstationens täckningsyta (cellen), och att placera anrop till andra radiotelefoner antingen inom eller utom basstationens cell, eller till ett annat nät, såsom det allmänna telefonnätet (PSTN) 4.
Så snart en radiotelefon 3 framgångsrikt placerat eller mottagit ett anrop, upp- sättes en audio- eller datakanal till cellbasstationen 2, som svarar mot cellen, där radiotelefonen 3 befinner sig, och kommunikation mellan basstationen 2 och radiotelefonen 3 sker över denna audio- eller datakanal. Radiotelefonen 3 kan även motta styr- eller tidsgivningsinformation via signalkanalen medan ett samtal pågår.
Om en radiotelefon 3 lämnar en cell under ett samtal och kommer in i en annan cell, så överlämnar radiotelefonen samtalet till en tillgänglig audio- eller datakanal i den nya cellen (handover). Likaså, och om inget samtal pågår, sändesett styrmeddelande via signalkanalen, så att radiotelefonen loggar mot basstationen 2, som tillhör den nya cellen. På detta sätt är mobilkommunikation möjlig över ett stort geografiskt område. 520 553 11 Cellkommunikationssystemet 1 omfattar vidare en terminal 5 för att styra kommu- nikationen mellan cellbasstationema 2 och allmänna telefonnätet 4, exempelvis under en kommunikation mellan en radiotelefon 3 och nätet 4, eller mellan en radiotelefon 3 i en första cell och en radiotelefon 3 i en andra cell.
Givetvis erfordras ett dubbelriktat trådlöst radiokommunikations-undersystem för att upprätta kommunikation mellan varje radiotelefon 3, som finns i en cell och cellbasstationen 2 i denna cell. Ett dylikt dubbelriktat trådlöst radiokommunika- tionssystem omfattar typiskt i både radiotelefonen 3 och cellbasstationen 2 (a) en sändare för att koda talsignalen och sända den kodade talsignalen genom en antenn såsom 6 eller 7 och (b) en mottagare för mottagning av en utsänd kodad talsignal genom samma antenn 6 eller 7 och för att avkoda den mottagna kodade talsignalen. Som är väl bekant för fackmannen, erfordras talkodning för att minska den nödvändiga bandbredden för att överföra tal .via det dubbelriktade trådlösa radiokommunikationssystemet, dvs. mellan en radiotelefon 3 och en basstation 2.
Syftet med föreliggande uppfinning är att åstadkomma en effektiv digital talkod- ningsteknik med hög kvot mellan subjektiv kvalitet och bithastighet, exempelvis för dubbelriktad transmission av talsignaler mellan en cellbasstation 2 och en radiotelefon 3 via en audio- eller datakanal. Fig. 1 är ett schematiskt blockschema över en digital talkodningsanordning, lämplig för att utföra denna effektiva teknik.
Talkodningsanordníngen i fig. 1 är samma kodningsanordning som visas i fig. 1 i den amerikanska stamansökan nr 07/927 528, till vilken en amplitudväljare l 12 i enlighet med föreliggande uppfinning har tillagts. Den amerikanska stamansökan nr 07/927 528 ingavs den 10 september 1992 för en uppfinningen medïtiteln: "Dynamic Codebook for Efficient Speech Coding Based on Algebraic Codes". 520 553 12 Den analoga talsignalen samplas och blockbehandlas. Man bör inse att före- liggande uppfinning ej är begränsad till en tillämpning på talsignaler. Kodning av andra typer av ljudsignaler kan även övervägas.
I det visade exemplet omfattar blocket för ingående samplat tal S (fig. på varandra följande samplingar. I CELP-litteraturen betecknas L som "subframe"- längden (längden för underramen) och ligger typiskt mellan 20 och 80. Likaså betecknas blocken av L samplingar som L-dimensionella vektorer. Olika L- dimensionella vektorer alstras under gängen av kodningsproceduren. En lista av dessa vektorer, som föreligger i fig. 1 och 2, jämte en lista av överförda paramet- rar lämnas nedan: Lista över de huvudsakliga L-dimensionella vektorerna: S ingående talvektor; R' frekvenseliminerad residualvektor; X målvektor; D bakåtfiltrerad mâlvektor; Ak kodvektor med index k från den algebraiska kodboken; och Ck innovationsvektor (filtrerad kodvektor).
Lista över översända parametrar: k kodvektorindex (ingång till den algebraiska kodboken); g förstärkning; STP kortsiktiga förutsägelseparametrar (definierande A(z)); och LTP långsiktiga förutsägelseparametrar (definierande en sekvensförstärk ning b och en frekvensfördröjning T).
Avkodningsprincip: Det förmodas vara att föredraga att först beskriva talavkodningsanordningen i fig. 2, som visar de olika steg som utföres mellan den digitala ingången (ingången till 520 553 13 avmultiplexeraren 205) och det utkommande samplade talet (utgången på syntes- filtret 204).
Avmultiplexeraren 205 uttar fyra olika parametrar ur den binära information som mottages från en digital ingångskanal, nämligen index k, förstärkningen g, de kortsiktiga förutsägelseparametrarna STP och de långsiktiga förutsägelseparamet- rarna LTP. Den föreliggande L-dimensionella vektorn Sfrån talsignalen syntetise- ras på basis av dessa fyra parametrar, på sätt som kommer att förklaras i den fortsatta beskrivningen.
Talavkodningsanordningen i fig. 2 omfattar en dynamisk kodbok 208, sammansatt av en algebraisk kodgenerator 201 och ett adaptivt förfilter 202, en förstärkare 206, en adderare 207, en långsiktprediktor 203 och ett syntesfilter 204.
Vid ett första steg alstrar den algebraiska kodgeneratorn 201 en kodvektor Ak i motsvarighet till index k.
Vid ett andra steg behandlas kodvektorn Ak av ett adaptivt förfilter 202, som försörjes med långsiktsförutsägelseparametrarna LTP för. att alstra en utgående innovationsvektor Ck. Ändamålet med det adaptiva förfiltret 202 är att-dynamiskt styra frekvensinnehållet för den utgående innovationsvektom Ck för att öka talkvaliteten, dvs. minska den hörbara distortíon som orsakas av frekvenser som stör det mänskliga örat. Typiska överföringsfunktioner F(z) för det adaptiva förfiltret 202 lämnas här: _ A(z/Y,) F,(z) Luz/vä] Fb(z) = 1 520 553 f* *i 14 Fa(z) är ett forniant-förfilter, i vilket 9 < 71 <72 < 1 är konstanter. Detta förfilter betonar formantområdena och arbetar mycket effektivt speciellt vid kodhastigheter under 5 kbit/s.
Fb(z) är ett tonhöjdsförfilter, där T är den tidsvarierande tonhöjdsfördröjiiingen och bO är antingen konstant eller lika med den kvantiserade långsiktiga tonhöjds- förutsägelseparametern ur närvarande eller tidigare underramar. Fb(z) är mycket effektiv för att framhålla tonhöjdens harmoniska frekvenser vid alla bithastigheter.
Följaktligen innefattar F(z) typiskt ett tonhöjdsförfilter, ibland kombinerat med ett formantförfilter, nämligen: I F(z) = Fa1=b I enlighet med CELP-tekniken erhålles den utgående samplade talsignalen S genom att skala innovationsvektorn Ck ur kodboken 208 med förstärkning g genom förstärkaren 206. Adderaren 207 adderar sedan den skalade vågformen gCk till utsignalen E (långsiktsförutsägelsekomponenten för signalenexcitationen på syntesfiltret 204) med en lângsiktsprediktor 203, som levereras med LTP- parametrarna, placeras i en återkopplingsslinga och med en överföringsfunktion B(z), definierad enligt följande: - m) = bíT där b och T är ovan definierade tonhöjdsförstärkning respektive fördröjning.
Prediktorn 203 är ett filter med en överföringsfunktion, som står i överensstäm- melse med senast mottagna LTP-parametrar b och T för att modellbygga ton- höjdsperiodiciteten i tal. Den tillför lämplig tonhöjdsförstärkning b och' för- dröjning T i samplingar. Den sammansatta signalen E + gCk utgör signal- excitationen för syntesfiltret 204, som har en överföringsfunktion 1/A(z) (varvid A(z) är definierat i den följande beskrivningen). Filtret 204 levererar korrekt 520 553 spektrumformning i enlighet med senast mottagna STP-parametrar. Närmare bestämt modellerar filtret 204 de resonanta frekvenserna (formantema) i tal.
Utgångsblocket S år den syntetiserade samplade talsignal som kan omvandlas till en analog signal med rätt anti-aliaserande filtrering i enlighet med en tëknik, som är välkänd för fackmannen.
Det finns många sätt att konstruera en algebraisk kodgenerator 201. En lämplig metod, beskriven i den ovan nämnda amerikanska patentansökan nr 07/927 528, består av att använda minst en N-mellanlagd enkelpuls permutationskod.
Detta begrepp kommer att illustreras genom en enkel algebraisk kodgenerator 201. Vid detta exempel är L = 40, och uppsättningen av 40-dimensionella kodvektorer innehåller bara N = 5 pulser med amplituder skild från noll, som kommer att betecknas S Spz, Sp3, Sp4, SPS. Vid denna mera genomförda notation står pi för placgrlingen av den i-te pulsen inom underramen (dvs. pi går från 0 till L-1). Antag att pulsen Spl är begränsad till åtta möjliga positioner pl enligt följande: pl = 0,5,l0,l5,20,25,30,35 = 0+8m1; m1 = O,l...7.
Inom dessa åtta positioner, som kan beteckans "banan" #1, kan S och sju pi nollamplitudpulser fritt permutera. Detta är en “enkelpulsperinutationskod". Låt oss nu sammanväva fem sådana "enkelpulspermutationskoder" genom att också lägga tvångsvillkor på positionerna för de övriga pulscrna på liknande sätt (dvs. bana #2, bana #3, bana #4 och bana #5). i p, = o,s,1o,1s,2o,2s,3o,3s = o+sm._ 1,6,11,1s,z1,zs,31,3s = hem, p, = 2,7,12,17,22,27,32,37 = 2+sm, p, = 3,a,13,1a,23,2s,33,3s = 3+sm, p, = 4,9,14,1s,24,29,34,39 = hem, 'o Il 520 553 16 Lägg märke till att heltalen mi = O, 1, ..., 7 helt definierar positionen pi för varje puls Spi.
Sålunda kan ett enkelt positionsindex kp härledas genom enkel multiplexering av mi-na med användning av följande uttryck: k,=4096m,+5l2m,_+64m_,+sm,+mb Det bör framhållas att andra kodböcker kan härledas genom användning av de ovannämnda pulsbanorna. Exempelvis kan man använda bara fyra pulser, där de första tre pulserna upptar positionerna i de första tre banorna, under det att den fjärde pulsen upptar antingen den fiärde eller den femte banan med en bit för att specificera vilken bana. Denna konstruktion ger upphov till en 13-bitpositions kodbok.
Vid tidigare känd teknik antogs pulserna med amplitud skild från noll ha fast amplitud för alla praktiska ändamål av orsaker som har att göra med komplexite- ten för kodvektorsökningen. Om sålunda pulsen Spi kan anta en av q möjliga amplituder, så måste så många som qN pulsamplitudkombinationer tagas hänsyn till under sökningen. Om exempelvis de fem pulserna i det första exemplet tillåtes pi = +l, -1, +2, -2, i stället för en fast amplitud, så stegras storleken av den algebraiska kodboken från 15 till anta en av q = 4 möjliga amplituder, exempelvis S +(5x2) bitar = 25 bitar, innebärande en sökning som är tusen gånger mera komplex.
Det är syftet med föreliggande uppfinning att avslöja det överraskande faktum att mycket goda egenskaper kan uppnås med q-amplitudpulser utan att betala ett högt pris därför. Lösningen består i att begränsa sökningen till en begränsad under- grupp av kodvektorer. Metoden för val av kodvektorerna är relaterad till den ingående talsignalen, som kommer att beskrivas i den följande beskrivningen. 520 553 17 Den praktiska nyttan med föreliggande uppfinning är att möjliggöra en ökning av storleken av den dynamiska algebraiska kodboken 208 genom att tillåta enskilda pulser att antaga olika möjliga amplituder utan att öka komplexiteten av kodvek- f; torsökningen.
Kodningsprincip Den samplade talsignalen S kodas genom en block-för-block-basis genom kod- ningssystemet i fig. 1, som är uppbruten i elva moduler, betecknade frân 102 till 112. Funktionen och operationen för de flesta av dessa moduler är oförändrade i förhållande till beskrivningen i amerikanska stampatentansökan nr 07/927 528.
Ehuru sålunda den följande beskrivningen kommer att åtminstone i korthet förklara funktionen och operationen för varje modul, kommer beskrivningen att koncentreras på det som är nytt i förhållande till det beskrivna i den amerikanska patentansökan nr 07/927 528.
För varje block av L samplingar av talsignal alstras en uppsättning av linjära förutsägningskodnings-(LPC)-parametrar, betecknade kortsiktsprediktions-(STH- parametrar, i enlighet med en tidigare känd teknik genom en LFC-spektrum analyserare 102. Närmare bestämt modulerar analyseraren 102 de speletrala egenskaperna för varje block S av L samplingar.
Ingångsblocket S av L-samplingar vitgöres genom ett vitningsfilter 103, som har följande överföringsfunlction, baserat på föreliggande värden på STP-parametrar- IlaI M All) = Eaizix i-O där ai = 1 och z är den vanliga variabeln i den s.k. z-transformen. Som framgår i fig. 1, alstrar vitfiltret 103 en residual vektor R. 520 555 18 En tonhöjdsextraktor 104 användes för att beräkna och kvantifiera LTP-paramet- rama, nämligen tonhöjdsfördröjningen T och tonhöjdsförstärkriingen g. Det ursprungliga tillståndet för extraktom 104 är också inställt till ett värde FS ur en urtillståndsextraktor 110. En detaljerad procedur för beräkning och kvàiitisering av LTP-parametrarna beskrives i den amerikanska stampatentansökan 07/927 528 och förmodas vara välkänd för vanliga fackmän på området. Följaktligen kommer den inte att beskrivas ytterligare i föreliggande beskrivning.
En filtersvarkännetecknare 105 (fig. 1) förses med STP- och LTP-parametrama för att beräkna en filtersvarkänneteckning FRC för användning i de senare stegen.
FRC-informationen består av följande tre komponenter, där n = 1, 2, ...L. 0 f(n): svaret för F(z) lägg märke till att F(z) typiskt innefattar tonhöjdsförfiltret.
O h(n): svaret på L på f(n) A där 7 är en perceptionsfaktor. Allmännare sett är h(n) pulssvaret på F(z)W(z)/A(z), vilket är kaskaden av förfiltret F(z), perceptualvikt- filtret W(z) och syntesfiltret 1/A(z). Man kan lägga märke~till att F(z) och l/A(z) är samma filter som användes i avkodaren i fig. 2. 0 U(i,j): autokorrelationen för h(n) i enlighet med följande uttryck: L u= X hh k=l för lSisL och isjsL; h(n)=0för n< 1.
Långtidsprediktorn 106 förses med föregående excitationssignal (dvs. É + gCk för föregående underram) för att bilda den nya E-komponenten med användning av rätt tonhöjdsfördröjning T och -förstärkning b. 520 553 19 Det ursprungliga tillståndet för perceptionsfiltret 107 inställes till det värde FS som levereras från initialtillständsexuaktorn 110. Den tonhöjdsbefriade residual- vektorn R' = R-E, beräknad genom en subtraherare 121 (fig. 1) levereras sedan till perceptualfiltret 107 för att på dess utgång erhålla en målvektor X. Som framgår av fig. l, pålägges STP-parametrarna på filtret 107 för att varieçra..dess överföringsfunktion i förhållande till dessa parametrar. Väsentligen gäller X = R'- P, där P representerar bidraget från längsiktsförutsägelsen (LTP), inklusive "ringning" från föregående excitationer. MSE-kriteriet som gäller för A kan nu fastställas i följande matrisnotationer: mtnlal* = míntsf--rvll = manL-sßtp-gaß -ï l”- J: - mtïrux-gaku 'F där H är en L x L undertriangulär Toeplitz-matris, bildad av h(n)-svaret enligt följande. Termen h(0) upptar matrisdiagonalen och h(1), h(2), ...h(L-l) upptar respektive nedre diagonaler.
Ett bakåtfiltrerande steg utföres av filtret 108 i fig. 1. Genom att sätta till noll derívatan med avseende pá g i ovanstående ekvation erhålles optimal förstärkning enligt följande: Med detta värde på g blir rninimiseringen: _ 2 , lxtA HT) f) 2 minlßl min {|XI*-_-.ÉH_I._I_Z__I Syftet är att finna det särskilda index k, för vilket minimeringen uppnås. Lägg märke till att eftersom 1 [XI Iz är en fast kvantitet, så kan samma index finnas genom att maximera följande kvantitet: 520 555 ax ffïlflrHrlflz g may HXHLAkTF __ __ (nakffl ~ plana i" .L = m°^_"';*~ A k lt “k där D = (XH) och *If = IAJJITIIZ.
I bakátfiltret 108 beräknas en bakåtfiltrerad målvektor D = (XH). Termen "bakåtfiltrering" för denna operation kommer ur tolkningen av (XH) som filtre- ringen av tidsreverserade X.
Endast en amplitudväljare 112 har tillagts till fig. 1 i ovan nämnda amerikanska stampatentansökan nr 07/927 528. Funktionen för amplitudselektorn 112 är att begränsa så att kodvektorema Ak avsökes av optimeringsstyraren 109 till de mest lovande kodvektorerna Ak för att därvid reducera komplexiteten av kodvektorsök- ningen. Som beskrivits i föregående beskrivning, är varje kodvektor Ak en pulsamplitud/positoinskombinationsvâgform, som definierar L olika positioner p och omfattar både nollamplitudpulser och från noll skilda amplitudpulser, till- ordnade till respektive positioner p = 1, 2, ...L i kombinationen, varvid varje från noll skild amplitudpuls antar minst en av q olika möjliga amplituder.
Med hänvisning till fig. 3a, 3b och 3c är ändamålet med amplitudselektorn 112 att förutbestämma en funktion Sp mellan positionerna p för kodvektorvâgformen och de q möjliga värdena för pulsamplituderna. Den förutupprättade funktionen Sp härledes i relation till talsignalen före kodbokssökningen. Närmare bestämt består förutupprättandet av denna funktion av ett förutval, i relation till talsigna- len, av minst en av de q möjliga amplituderna för varje position p i vágformen (steg 301 i fig. 3a).
För att förvälja en av de q amplitudema till varje positoin p i vågfonnen beräknas en amplituduppskattningsvektor B i motsvarighet till den baklängesfiltrerade målvektorn D och den tonhöjdseliminerade residualvektorn R”. Närmare bestämt 520 553 21 beräknas amplituduppskattningsvektorn B genom att summera (understeget 301-1 i fig. 3b) den baklängesfiltrerade málvektorn D i normaliserad form: D ( l 'ßl -lñ och den tonhöjdseliminerade residualvektom R' i normaliserad form: _13”. uR/a för att därvid erhålla en amplituduppskattningsvektor B av formen: D + R' Bzu-NTD-l BW! där ß är en fast konstant med typiskt värde 1/2 (värdet på ß väljes mellan 0 och 1, beroende på procentsatsen av de från noll skilda amplitudpulsema, som användes i den algebraiska koden).
För varje position p i vágformen erhålles den amplitud Sp som skall förutbe- stämmas till denna position p genom att kvantisera ett motsvarande amplitudupp- skattningsvärdc BP för vektom B. Närmare bestämt kvantiseras för varje position p i vågformen ett toppnormaliserat amplituduppskattningsvärde Bp för vektorn B (understeget 301-2 i fig. 3b) med använding av följande uttryck: gp = Q(Bp/rnax|Bn|) där Q (.) är kvantiseringsfunktionen och maxi-Enl är en normaliseringsfaktor, som representerar en toppamplitud för de från noll skilda pulsema.
I det viktiga specialfall, där: - q = 2, dvs. då pulsamplituderna bara kan anta tvâ värden (dvs. Spi = i ); och 520 553 ~*¥*š*Fïiï§@ïÄ 22 ~ densiteten för från noll skilda pulser N/L är lägre än eller lika med % ; sä kan värdet pâ ß vara lika med noll; i så fall reduceras amplituduppskattnings- vektorn B helt enkelt till den bakåtfiltrerade målvektorn D, och följaktligen gäller Sp = sign(Dp). Ändamålet med optimeringskontrollen 109 är att välja den bästas kodvektorn Ak ur den algebraiska kodboken. Valkriteriet är bestämt i form av en kvot som skall beräknas för varje kodvektor Ak och maximeras över alla kodvektorer (steg 303): (LIA, f) *1 IIlâX 2 k G y, där D = (XH) och “f- = Iflßfv Eftersom Ak är en algebraisk kodvektor med N från noll skilda amplitudpulser med respektive amplituder Spi så blir täljaren kvadraten pá :I r _ 114,, _ nwspi och nämnaren är en energitenn, som kan uttryckas såsom: 2 _ N .n "ü N di, - b,¶U(p¿-,p_,) +22 å: 1:1 _, SHSP: mpf ' pi) 1 där U(pi, pj) är den korrelation som hör ihop med tvâ pulser med amplituden 1, den ena i position pi och den andra vid positionen pj. Denna matris beräknas i enlighet med ovanstående ekvation i filtersvarskarakteriseraren 105 och ingår i uppsättningen av parametrar som beteckans som FRC i blockschemat i fig. 1.
En snabb metod för att beräkna denna nämnare (steg 304) innefattar de N- nätlagda slingor som visas i fig. 4, där notationen S(i) och SS(i,j) användes i stället för respektive kvantiteter "Spi" och "SSpiSpJ-'É Beräkningen av nämnaren akz är den mest tidskrävande processen. De beräkningar som bidrar till akz, som 520 553 23 utföres i varje slinga i fig. 4, kan skrivas på separata rader från den yttersta slingan till den innersta slingan enligt följande: a: = Sp12U(p1/p1) f~ +$p22U(p2,p2)+ 2$pxSpzUipvpzl f--' +SP3ZUU>BI P3) + 2 [sp1sp3U(Pl, P3) æpzspampz, P91 +5pfU där pi är positionen för den i-te från noll skilda amplitudpulsen. Man kan lägga märke till att de N-nätlagda slingoma i fig. 4 möjliggör en begränsning av de från noll skilda amplitudpulsema i kodvektorerna Ak i enlighet med N sammanvävda enkelpulspermutationskoder.
Vid föreliggande uppfinning reduceras sökkomplexiteten drastiskt genom att begränsa den undergmpp av kodvektorer Ak till kodvektorer, där de N från noll skilda amplitudpulserna respekterar den funktion som förut upprättats i steget 301 i fig. 3a. Den förut upprättade funktionen är respekterad när de N från noll skilda amplitudpulserna i en kodvektor Ak vardera har en amplitud, som är lika med den amplitud som förut tillordnats till positionen p för de från noll slcilda ampli- tudpulsema. - Denna begränsning av undergruppen av kodvektorer förformas genom att först kombinera den förut upprättade funktionen S med elementen i matrisen U(i,j) (steg 302 i fig. 3a), och sedan genom användpning av de N-nâtlagda slingorna i fig. 4 med alla pulser S(i) antagna att vara fixerade, positiva och med enhets- amplitud (steg 303). Även om alltså amplituden för från noll skilda pulser kan anta vilket som helst av q möjliga värden i den algebraiska kodboken, sá_ för- minskas sökkomplexiteten till fallet med fasta pulsamplituder. Närmare bestämt kombineras matrisen U(i,j) som ástadkommes genom ñlterresponsekarakterisera- ren 105, med den förut upprättade funktionen i enlighet med följande uttryck (steg 302): 520 553 24 “lan = sisj var) där Si resulterar från valmetoden för amplitudväljaren 112, nämligen så att Si är den amplitud som är vald för en enskild position i, efter kvantisering av motsva- ,- rande amplituduppskattning.
Med denna nya matris kan beräkningen för varje slinga i den snabba algoritmen skrivas på en separat rad, från den yttersta till den innersta slingan, enligt följande: ° E17 _32) ° (y_rpz) - J (pypl) « 2U“(p._,p,)+ 2U'(p2,p,) .ÄÜ/(pwpy) ~ 2U“+ 2u' där px är positionen för den x-te, frän noll skilda amplitudpulsen i vågformen, px, som förut tillordnats till en position px bland positionerna p och amplituden Spy som är och där U'(px,py) är en funktion, som beror av den amplitud S förut tillordnad till en position py bland positionerna p.
För att ytterligare minska sökkomplexiteten kan man hoppa över (se fiš. 3c) i synnerhet, men ej uteslutande, den innersta slingan sä snart följande olikhet är uppfylld: AH E SPPP, < TD 12' = l där Spn är den amplitud som är förut tillordnad till positionen pn, pn te i målvelç tom D, och TD är ett tröskelvärde, som är relaterat till den bakåtfiltrerade i målvektorn D. J” Den globala signalexcitationssignalen E + gCk beräknas genom en adderare 120 (fig. l) ur signalen gCk från styranordningen 109 och utsignalen E från predik- 520 553 torn 106. Ursprungstillståndsextralctorrnodulen 110, som utgöres av ett per- ceptionsfilter med en överförignsfunktion l/A(z-y'1) som varierar i förhållande till STP-parametrarna, subtraherar från residualsignalen R signalexcitationssignalen E + gCk för det uteslutande ändamålet att erhålla det slutliga filtertillšfåndet FS för användning som initialtillstånd i filtret 107 och tonhöjdsuttagaren 104: Uppsättningen av fyra parametrar k, g, LTP och STP omvandlas till det riktiga digitalkanalsformatet genom en multiplexerare lll, som kompletterar proceduren för att koda ett block S av samplingar av talsignal.
Ehuru föreliggande uppfinning har beskrivits ovan med hänvisning till föredragna utföranden därav, så kan dessa utföranden modifieras godtyckligt, inom ramen för bifogade patentkrav, utan att frångå anda och natur hos föreliggande uppfinning.
Claims (22)
1. Metod för utförande av sökning i en kodbok för att koda en ljudsignal, vari: - under kodning av ljudsignalen kodrelaterade signaler (R, R°, X, D. . .) extraheras från nämnda ljudsignal; - kodboken består av en uppsättning av pulsamplitud/position kombinationer (Ak); - varje kombination pulsamplitud/position (Ak) definierar L olika positioner (p) och omfattar både nollamplitudpulser och icke-nollamplitudpulser, tillordnade till var sina positioner p = 1, 2, ...L i kombinationen; - var och en av icke-nollamplitudpulsema antar minst en av q möjliga amplituder; och nämnda kodbokssökningsutförandemetod omfattar följ ande steg: I begränsa (303-1) positionerna p för icke-nollamplitudpulserna för kodbokens kombinationer (Ak) i enlighet med en grupp pulspositionsspår, vari pulspositionen för varje spår intersekvenseras med pulspositionerna för de andra spåren; från kodboken förvälja (301) en undergrupp av pulsamplitud/positionskombinationer (Ak) i förhållande till en del (R', D) av de kodrelaterade signalerna; och att endast denna undergrupp av pulsamplitud/positionskombinationer (Ak) genomsökes (303, 304) för att koda ljudsignalen varvid sökningens komplexitet reduceras, eftersom bara en undergrupp av pulsamplitud/positionskombinationer i kodboken genomsökes; vari förvalssteget omfattar att förutbestämma (301-1, 301-2), i förhållande till nämnda del (R”, D) av de kodrelaterade signalerna, en funktion (Sp) mellan positionerna p = 1, 2, ...L och de q möjliga amplitudema, där nämnda funktion (Sp) har en struktur som på förhand tillordnar amplituden för att på förhand tillordna till positionerna p = 1, 2, ...L gällande amplituder utav de q möjliga amplituderna, och vari söksteget omfattar en sökning (303, 304) av endast de pulsamplitud/positionskombinationer (Ak) i kodboken, som har icke-nollamplitudpulser vilka satisfierar den på förhand upprättade funktionen (Sp). 10 15 20 25 520 553 N
2. Metod enligt krav 1, kännetecknad av att det på förhand upprättande funktionssteget omfattar steget att på förhand tillordna (301-1, 301-2), med hjälp av den på förhand upprättade funktionen (Sp), en av de q möjliga amplituderna som gällande amplitud till varje position p och där den på förhand upprättade funktionen (Sp) satisfieras när icke-nollamplitudpulserna i en pulsamplitud/positionskombination (Ak) vardera har en amplitud, som är lika med den amplitud som på förhand tillordnats av den på förhand upprättade funktionen (Sp) till positionen p för nämnda icke- nollamplitudpuls.
3. Metod enligt krav 2, kännetecknad av att nämnda del av de kodrelaterade signalerna extraherade från ljudsignalen under kodningen av nämnda ljudsignal innefattar en bakåtfiltrerad målsignal D och en tonhöjdseliminerad residualsignal R', och vari steget att på förhand tillordna en av de q möjliga amplituderna till varje position p innefattar stegen: att en amplituduppskattningsvektor B beräknas (301-1) i motsvarighet till den bakåtfiltrerade målsignalen D och den tonhöjdseliminerade residualsignalen R'; och för var och en av de nämnda positionerna p kvantiseras (301-2) en amplituduppskattning Bp för den nämnda vektorn B för att erhålla den amplitud som skall väljas för nämnda position p.
4. Metod enligt krav 3, kännetecknad av att steget att beräkna en amplituduppskattningsvektor B omfattar steget att summera (301-1) den bakåtfiltrerade målsignalen D i normaliserad form: D <1- ß) - IIDII med den tonhöjdseliminerade residualsignalen R' i normaliserad form: RI ß *T NR ll för att därvid erhålla en amplituduppskattningsvektor B med formen: lO 15 20 25 520 553 zs å. D B=<1-ß>- ß , nßl* HRM där ß är en fast konstant.
5. Metod enligt krav 4, kännetecknad av att ß är en fast konstant med ett värde liggande mellan O och l.
6. Metod enligt något av kraven 3 till 5, kännetecknad av att för var och en av de nämnda positionerna p kvantiseringssteget omfattar kvantisering (301-2) av en toppnormaliserad amplituduppskattning B för den nämnda vektorn B med P användning av följ ande uttryck: B p / max B" där nämnaren max B" är en normaliseringsfaktor, som representerar en toppamplitud för icke-nollampli- tudpulsema.
7. Metod enligt något av kraven l till 6, kännetecknad av att - nämnda pulskombinationer (Ak) vardera omfattar ett antal N icke-nollampli- tudpulser; - gruppen av spår innefattar N pulspositionsspår var för sig förbundna till de N icke- nollamplitudpulsema; - varje spårs pulspositioner intersekvenseras med de N-1 andra spårens pulspositioner; och - det begränsande steget innefattar begränsning (303-1) av varje icke- nollamplitudpuls pulspositioner till det förbundna spårets positioner. 10 15 20 25 520 553 29
8. Metod enligt något av kraven 1 till 6, kännetecknad av att nämnda pulsamplitud/positionskombinationer (Ak) vardera omfattar ett antal N icke- nollamplitudpulser, och varvid söksteget omfattar steget att maximera (303, 303-3, 303-4) en given kvot med en nämnare akz beräknad med hjälp av N sammanvävda slingor (304)i enlighet med följande uttryck: al? = Uxpißpi) +U'(122»P2)+2U'(pnp2) +U'(PQ,PB)+2U'(PUP3)+2U'(p2,1>3) +UI(PN>.ÛN)+2U'(I7i=p1v)+2U'(p2>pN)+---+2U'(PN-1>PN) där beräkningen för varje slinga är skriven på en separat rad från en yttersta slinga till en innersta slinga av de N sammanvävda slingoma, där pn är positionen för den n-te icke-nollamplitudpulsen i kombinationen, och där U'(px, py) är en funktion, som beror av amplituden S som på förhand tillordnats till en position px bland positionerna p, pX och amplituden S som på förhand är tillordnad till en position py bland positionema PY p.
9. Metod enligt krav 8, kännetecknad av stegen att maximera den nämnda kvoten omfattar steget att överhoppa (303-2) åtminstone den innersta slingan av de N sammanvävda slingorna, så snart följande olikhet är uppfylld: N-l 2 Sp" Dp" < TD n=l där Spn är den amplitud som på förhand är tillordnad till positionen pn, Dpn te komponenten i målvektom D, och Td är ett tröskelvärde, som hör ihop med den bakåtfiltrerade målvektom D.
10. Anordning för genomförande av en sökning i en kodbok för att koda en ljudsignal, vari: är den pn- 10 15 20 25 30 520 553 30 - under kodning av ljudsignalen extraheras kodrelaterade signaler (R, R”, X, D. . .) från nämnda ljudsignal; - nämnda kodbok består av en serie av pulsamplitud/positionskombinationer (Ak); - och varje pulsamplitud/positionskombination (Ak) definierar L olika positioner (p) och omfattar både nollamplitudpulser och icke-nollamplitudpulser tillordnade till respektive positioner p = 1, 2, ...L i kombinationen; - varje icke-nollamplitudpuls antar en av q möjliga amplituder; och nämnda kodbokssökningsutförandeanordning innefattar: medel (109, 303-1) för begränsa icke-nollamplitudpulsernas positioner p för kodbokens kombinationer (Ak) i överensstämmelse med en grupp av spår av pulspositioner, vari varje spårs pulspositioner intersekvenseras med de andra spårens pulspositioner; medel (112, 301) för förval ur kodboken av en undergrupp av pulskombinationer i förhållande till en del (R°, D) av de kodrelaterade signalerna; och medel (109, 303, 304) för genomsökning av endast denna undergmpp av pulsamplitud/positionskombinationer (Ak) för att koda ljudsignalen varvid sökningens komplexitet reduceras eftersom endast en undergrupp av kodbokens pulsamplitud/positionskombinationer genomsökes; vari medlen (112) för förval omfattar medel (301-1, 301-2) för att på förhand upprätta, i förhållande till nämnda del (R°, D) av de kodrelaterade signalerna, en funktion (Sp) mellan positionerna p = 1, 2, ...L och de q möjliga amplitudema, där nämnda funktion (Sp) har en struktur som på förhand tillordnar amplituden för att på förhand tillordna till positionema p = 1, 2, ...L gällande amplituder utav de q möjliga amplitudema, och vari sökmedlen (303, 304) omfattar medel (303, 304) för att begränsa sökningen till pulsamplitud/positionskombinationema (Ak) i kodboken, som har icke- nollamplitudpulser vilka satisfierar den på förhand upprättade funktionen (Sp).
11. Anordning enligt krav 10 kännetecknad av att de på förhand upprättande funktionsmedlen omfattar medel (301-1, 301-2) att på förhand tillordna, med hjälp av den på förhand upprättade funktionen (Sp), en av de q möjliga amplituderna som gällande amplitud till varje position p och där den på förhand upprättade funktionen 10 15 20 25 520 553 31 (Sp) satisfieras när icke-nollamplitudpulsema i en pulsamplitud/positionskombination (Ak) vardera har en amplitud, som är lika med den amplitud som på förhand tillordnats av den på förhand upprättade funktionen (Sp) till positionen p för nämnda icke- nollamplitudpuls.
12. Anordning enligt krav 11 kännetecknad av att nämnda del av de kodrelaterade signalerna extraherade från ljudsignalen (S) under kodningen av nämnda ljudsignal innefattar en bakåtfiltrerad målsignal D och en tonhöj dseliminerad residualsignal R', och vari medlen att på förhand tillordna en av de q möjliga amplituderna till varje position p innefattar: medel (301-1) för att beräkna en amplituduppskattningsvektor B i motsvarighet till den bakåtfiltrerade målsignalen D och den tonhöjdseliminerade residualsignalen R'; och medel (301-2) för att kvantisera, för var och en av de nämnda positionerna p, en amplituduppskattning Bp för den nämnda vektom B för att erhålla den amplitud som skall väljas för nämnda position p.
13. Anordning enligt krav 12, kännetecknad av att medlen att beräkna en amplituduppskattningsvektor B omfattar medel (301-1) att summera den bakåtfiltrerade målsignalen D i normaliserad form: med den tonhöjdselirninerade residualsignalen R' i normaliserad form: RI ßii för att därvid erhålla en amplituduppskattningsvektor B med formen: D _ + B=u-ß) IIDII RI ß-'T IWH där ß är en fast konstant. 10 15 20 25 30 520 555
14. Anordning enligt krav 13, kännetecknad av att ß är en fast konstant med ett värde liggande mellan 0 och l.
15. Anordning enligt något av kraven 12 till 14, kännetecknad av att kvantiseringsmedlen omfattar medel (301-2) for kvantisering, för var och en av de nämnda positionerna p, av en toppnorrnaliserad amplituduppskattning B för den P nämnda vektorn B med användning av följande uttryck: B p /max B” där nämnaren max B" är en nonnaliseringsfaktor, som representerar en toppamplitud för icke-nollamplitud- pulsema.
16. Anordning enligt något av kraven 10 till 15, kännetecknad av att nämnda pulskombinationer (Ak) vardera omfattar ett antal N icke- nollamplitudpulser; - gruppen av spår innefattar N pulspositionsspår var för sig förbundna till de N icke- nollamplitudpulserna; - varje spårs pulspositioner intersekvenseras med de N-1 andra spårens pulspositioner; och - det begränsande medlen innefattar en struktur (303-1) för begränsning av varje icke-nollamplitudpuls pulspositioner till det förbundna spårets positioner.
17. Anordning enligt något av kraven 10 till 15, kännetecknad av att nämnda pulsamplitud/positionskombinationer vardera omfattar ett antal Nicke- nollamplitudpulser, och vari sökmedlen omfattar medel (303, 303-3, 303-4) för maximering av en given kvot med en nämnare ozkz och medel (304) för beräkning av 10 15 20 25 520 55533 nämnda nämnare akz medelst N i varandra anordnade slingor i enlighet med följande uttryck: af =U'(P1,P1) +U'(PZ,P2)+2U'(P,,PZ) +U'(ß3,P3)+2U'(P,,PB)+2U'(P2,P@) +UI(PN>PN)+2UI(P1fPN)+2U'(P2fPN) +---+2U'(P1v-1»PN) där beräkningen för varje slinga är skriven på en separat rad från en yttersta slinga till en innersta slinga av de N sammanvävda slingoma, där pn är positionen för den n-te icke-nollamplitudpulsen i kombinationen, och där U'(px, py) är en funktion, som beror av amplituden S som på förhand tillordnats till en position px bland positionerna p, px och amplituden Spy som på förhand är tillordnad till en position py bland positionerna p.
18. Anordning enligt krav 17, kännetecknad av att nämnda medel för beräkning av nämnaren akz omfattar medel (303-2) för överhoppning av åtminstone den innersta slingan av de N i varandra liggande slingorna, så snart följ ande olikhet är uppfylld: N-i Z SP” Dm < TD n=l pfl te komponenten i målvektom D, och Td är ett tröskelvärde, som hör ihop med den där Spn är den amplitud som på förhand är tillordnad till positionen pn, D bakåtfiltrerade målvektorn D.
19. Kommunikationssystem av celltyp för betjäning av ett stort geografiskt område, uppdelati ett flertal celler, omfattande: bärbara sändar/mottagarenheter (3); cellbasstationer (2), anordnade i respektive cell; medel (5) för styming av kommunikationerna mellan cellbasstationema (2); är den pn- 10 15 20 25 30 520 555% ett dubbelriktat trådlöst kommunikationsundersystem mellan varje mobil enhet (3), som finns i en cell och cellbasstationen (2) för denna cell, vilket dubbelriktade kommunikationsundersystem omfattar, i både den mobila enheten (3) och cellbasstationen (2) (a) en sändare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid talsignalkodningsmedlen omfattar medel mottagliga för talsignalen för att producera talsignalkodparametrar, och vari de nämnda talsignalkodparameterproducerande medlen innefattar en anordning reciterad i något av kraven 10 till 18, för att genomföra en sökning i en kodbok för att producera åtminstone en av nämnda talsignalkodparametrar, vari talsignalen utgör nämnda ljudsignal.
20. Ett cellnätverkselement (2) som omfattar (a) en sändare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid talsignalkodningsmedlen omfattar medel mottagliga för talsignalen for att producera talsignalkodparametrar, och vari de nämnda talsignalkodparameterproducerande medlen innefattar en anordning reciterad i något av kraven 10 till 18, för att genomföra en sökning i en kodbok för att producera åtminstone en av nämnda talsignalkodparametrar, vari talsignalen utgör nämnda ljudsignal.
21. En mobil sändar/mottagarenhet (3) av celltyp som omfattar (a) en sändare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid talsignalkodningsmedlen omfattar medel mottagliga för talsignalen för att producera talsignalkodparametrar, och vari de nämnda 10 15 20 520 555 35 talsignalkodparameterproducerande medlen innefattar en anordning reciterad i något av kraven 10 till 18, for att genomföra en sökning i en kodbok för att producera åtminstone en av nämnda talsignalkodparametrar, vari talsignalen utgör nämnda lj udsignal.
22. Ett kommunikationssystem av celltyp för betj äning av ett stort geografiskt område, uppdelat i ett flertal celler, omfattande: mobila portabla sändarmottagarenheter (3); cellbasstationer (2) anordnade i var sina celler; medel (5) för styrning av kommunikationen mellan cellbasstationerna (2); ett dubbelriktat trådlöst kommunikationsundersystem mellan varje mobil enhet (3), som finns i en cell och cellbasstationen (2) för denna cell, vilket dubbelriktade kommunikationsundersystem omfattar, i både den mobila enheten (3) och cellbasstationen (2) (a) en sändare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid talsignalkodningsmedlen omfattar medel mottagliga för talsignalen för att producera talsignalkodparametrar, och vari de nämnda talsignalkodparameterproducerande medlen innefattar en anordning reciterad i något av kraven 10 till 18,, för att genomföra en sökning i en kodbok för att producera åtminstone en av nämnda talsignalkodparametrar, vari talsignalen utgör nämnda ljudsignal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0200785A SE524905C2 (sv) | 1995-02-06 | 2002-03-15 | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38396895A | 1995-02-06 | 1995-02-06 | |
US08/508,801 US5754976A (en) | 1990-02-23 | 1995-07-28 | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
Publications (2)
Publication Number | Publication Date |
---|---|
SE9600437D0 SE9600437D0 (sv) | 1996-02-06 |
SE520553C2 true SE520553C2 (sv) | 2003-07-22 |
Family
ID=27010408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SE9600437A SE520553C2 (sv) | 1995-02-06 | 1996-02-06 | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal |
Country Status (26)
Country | Link |
---|---|
US (1) | US5754976A (sv) |
EP (2) | EP1225568B1 (sv) |
JP (2) | JP3430175B2 (sv) |
KR (2) | KR100388751B1 (sv) |
CN (2) | CN1198262C (sv) |
AR (1) | AR000871A1 (sv) |
AT (2) | ATE230888T1 (sv) |
AU (1) | AU708392C (sv) |
BR (1) | BR9607026A (sv) |
CA (1) | CA2210765C (sv) |
DE (1) | DE19604273C5 (sv) |
DK (2) | DK0808496T3 (sv) |
ES (1) | ES2112807B1 (sv) |
FI (2) | FI117994B (sv) |
FR (1) | FR2730336B1 (sv) |
GB (1) | GB2297671B (sv) |
HK (2) | HK1002492A1 (sv) |
IN (1) | IN187453B (sv) |
IT (1) | IT1305724B1 (sv) |
MX (1) | MX9705997A (sv) |
MY (2) | MY130529A (sv) |
NO (1) | NO318595B1 (sv) |
PT (1) | PT1225568E (sv) |
RU (1) | RU2142166C1 (sv) |
SE (1) | SE520553C2 (sv) |
WO (1) | WO1996024925A1 (sv) |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE508788C2 (sv) * | 1995-04-12 | 1998-11-02 | Ericsson Telefon Ab L M | Förfarande att bestämma positionerna inom en talram för excitationspulser |
US5822724A (en) * | 1995-06-14 | 1998-10-13 | Nahumi; Dror | Optimized pulse location in codebook searching techniques for speech processing |
US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
TW317051B (sv) * | 1996-02-15 | 1997-10-01 | Philips Electronics Nv | |
JP3523649B2 (ja) * | 1997-03-12 | 2004-04-26 | 三菱電機株式会社 | 音声符号化装置、音声復号装置及び音声符号化復号装置、及び、音声符号化方法、音声復号方法及び音声符号化復号方法 |
FI114248B (sv) * | 1997-03-14 | 2004-09-15 | Nokia Corp | Förfarande och anordning för audiokodning och audioavkodning |
CN1494055A (zh) * | 1997-12-24 | 2004-05-05 | ������������ʽ���� | 声音编码方法和声音译码方法以及声音编码装置和声音译码装置 |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
FI113571B (sv) | 1998-03-09 | 2004-05-14 | Nokia Corp | Talkodning |
JP3180762B2 (ja) * | 1998-05-11 | 2001-06-25 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
US6714907B2 (en) * | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
WO2000016501A1 (en) * | 1998-09-11 | 2000-03-23 | Motorola Inc. | Method and apparatus for coding an information signal |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
JP4173940B2 (ja) * | 1999-03-05 | 2008-10-29 | 松下電器産業株式会社 | 音声符号化装置及び音声符号化方法 |
US6295520B1 (en) | 1999-03-15 | 2001-09-25 | Tritech Microelectronics Ltd. | Multi-pulse synthesis simplification in analysis-by-synthesis coders |
JP2001075600A (ja) * | 1999-09-07 | 2001-03-23 | Mitsubishi Electric Corp | 音声符号化装置および音声復号化装置 |
US7272553B1 (en) * | 1999-09-08 | 2007-09-18 | 8X8, Inc. | Varying pulse amplitude multi-pulse analysis speech processor and method |
WO2001020595A1 (en) * | 1999-09-14 | 2001-03-22 | Fujitsu Limited | Voice encoder/decoder |
CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
KR100576024B1 (ko) * | 2000-04-12 | 2006-05-02 | 삼성전자주식회사 | 에이켈프 음성 압축기의 코드북 검색 장치 및 방법 |
US6728669B1 (en) * | 2000-08-07 | 2004-04-27 | Lucent Technologies Inc. | Relative pulse position in celp vocoding |
US7363219B2 (en) * | 2000-09-22 | 2008-04-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
KR100438175B1 (ko) * | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
US7236928B2 (en) * | 2001-12-19 | 2007-06-26 | Ntt Docomo, Inc. | Joint optimization of speech excitation and filter parameters |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP2003255976A (ja) * | 2002-02-28 | 2003-09-10 | Nec Corp | 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法 |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
US7054807B2 (en) * | 2002-11-08 | 2006-05-30 | Motorola, Inc. | Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters |
KR100503414B1 (ko) * | 2002-11-14 | 2005-07-22 | 한국전자통신연구원 | 고정 코드북의 집중 검색 방법 및 장치 |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
CN100416652C (zh) * | 2005-10-31 | 2008-09-03 | 连展科技(天津)有限公司 | 增强的amr编码器快速固定码本搜索方法 |
JP5159318B2 (ja) * | 2005-12-09 | 2013-03-06 | パナソニック株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
JP3981399B1 (ja) * | 2006-03-10 | 2007-09-26 | 松下電器産業株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
CN101286321B (zh) * | 2006-12-26 | 2013-01-09 | 华为技术有限公司 | 双脉冲激励的线性测编码 |
EP2157573B1 (en) | 2007-04-29 | 2014-11-26 | Huawei Technologies Co., Ltd. | An encoding and decoding method |
CN100530357C (zh) * | 2007-07-11 | 2009-08-19 | 华为技术有限公司 | 固定码书搜索方法及搜索器 |
US8566106B2 (en) * | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100578619C (zh) * | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
CN101903946B (zh) * | 2007-12-21 | 2012-09-26 | Nvoq股份有限公司 | 分布式听写/转录系统 |
US7889103B2 (en) * | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
DK2242045T3 (da) * | 2009-04-16 | 2012-09-24 | Univ Mons | Talesyntese og kodningsfremgangsmåder |
CN101931414B (zh) * | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
US8280729B2 (en) * | 2010-01-22 | 2012-10-02 | Research In Motion Limited | System and method for encoding and decoding pulse indices |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
CN102623012B (zh) * | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
US8880404B2 (en) * | 2011-02-07 | 2014-11-04 | Qualcomm Incorporated | Devices for adaptively encoding and decoding a watermarked signal |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9070356B2 (en) | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9263053B2 (en) | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
CN103456309B (zh) * | 2012-05-31 | 2016-04-20 | 展讯通信(上海)有限公司 | 语音编码器及其代数码表搜索方法和装置 |
US9728200B2 (en) * | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US20140334564A1 (en) * | 2013-05-09 | 2014-11-13 | Samsung Electronics Co., Ltd | Method and system for providing low-complexity hybrid precoding in wireless communication systems |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4401855A (en) * | 1980-11-28 | 1983-08-30 | The Regents Of The University Of California | Apparatus for the linear predictive coding of human speech |
CA1164569A (en) * | 1981-03-17 | 1984-03-27 | Katsunobu Fushikida | System for extraction of pole/zero parameter values |
WO1983003917A1 (en) * | 1982-04-29 | 1983-11-10 | Massachusetts Institute Of Technology | Voice encoder and synthesizer |
US4625286A (en) * | 1982-05-03 | 1986-11-25 | Texas Instruments Incorporated | Time encoding of LPC roots |
US4520499A (en) * | 1982-06-25 | 1985-05-28 | Milton Bradley Company | Combination speech synthesis and recognition apparatus |
JPS5922165A (ja) * | 1982-07-28 | 1984-02-04 | Nippon Telegr & Teleph Corp <Ntt> | アドレス制御回路 |
DE3276651D1 (en) * | 1982-11-26 | 1987-07-30 | Ibm | Speech signal coding method and apparatus |
US4764963A (en) * | 1983-04-12 | 1988-08-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech pattern compression arrangement utilizing speech event identification |
US4667340A (en) * | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
DE3335358A1 (de) * | 1983-09-29 | 1985-04-11 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung |
US4799261A (en) * | 1983-11-03 | 1989-01-17 | Texas Instruments Incorporated | Low data rate speech encoding employing syllable duration patterns |
CA1236922A (en) * | 1983-11-30 | 1988-05-17 | Paul Mermelstein | Method and apparatus for coding digital signals |
CA1223365A (en) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Method and apparatus for speech coding |
US4724535A (en) * | 1984-04-17 | 1988-02-09 | Nec Corporation | Low bit-rate pattern coding with recursive orthogonal decision of parameters |
US4680797A (en) * | 1984-06-26 | 1987-07-14 | The United States Of America As Represented By The Secretary Of The Air Force | Secure digital speech communication |
US4742550A (en) * | 1984-09-17 | 1988-05-03 | Motorola, Inc. | 4800 BPS interoperable relp system |
CA1252568A (en) * | 1984-12-24 | 1989-04-11 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
US4858115A (en) * | 1985-07-31 | 1989-08-15 | Unisys Corporation | Loop control mechanism for scientific processor |
IT1184023B (it) * | 1985-12-17 | 1987-10-22 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US4873723A (en) * | 1986-09-18 | 1989-10-10 | Nec Corporation | Method and apparatus for multi-pulse speech coding |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
US4815134A (en) * | 1987-09-08 | 1989-03-21 | Texas Instruments Incorporated | Very low rate speech encoder and decoder |
IL84902A (en) * | 1987-12-21 | 1991-12-15 | D S P Group Israel Ltd | Digital autocorrelation system for detecting speech in noisy audio signal |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
CA1321646C (en) * | 1988-05-20 | 1993-08-24 | Eisuke Hanada | Coded speech communication system having code books for synthesizing small-amplitude components |
US5008965A (en) * | 1988-07-11 | 1991-04-23 | Kinetic Concepts, Inc. | Fluidized bead bed |
IT1232084B (it) * | 1989-05-03 | 1992-01-23 | Cselt Centro Studi Lab Telecom | Sistema di codifica per segnali audio a banda allargata |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
US5097508A (en) * | 1989-08-31 | 1992-03-17 | Codex Corporation | Digital speech coder having improved long term lag parameter determination |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5144671A (en) * | 1990-03-15 | 1992-09-01 | Gte Laboratories Incorporated | Method for reducing the search complexity in analysis-by-synthesis coding |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JP3089769B2 (ja) * | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
DE4315313C2 (de) * | 1993-05-07 | 2001-11-08 | Bosch Gmbh Robert | Vektorcodierverfahren insbesondere für Sprachsignale |
-
1995
- 1995-07-28 US US08/508,801 patent/US5754976A/en not_active Expired - Lifetime
-
1996
- 1996-01-27 MY MYPI20021290A patent/MY130529A/en unknown
- 1996-01-27 MY MYPI96000300A patent/MY119038A/en unknown
- 1996-02-02 MX MX9705997A patent/MX9705997A/es unknown
- 1996-02-02 EP EP02075797A patent/EP1225568B1/en not_active Expired - Lifetime
- 1996-02-02 KR KR1019970705372A patent/KR100388751B1/ko not_active IP Right Cessation
- 1996-02-02 IT IT1996UD000012A patent/IT1305724B1/it active
- 1996-02-02 EP EP96900816A patent/EP0808496B1/en not_active Expired - Lifetime
- 1996-02-02 BR BR9607026A patent/BR9607026A/pt not_active Application Discontinuation
- 1996-02-02 CA CA002210765A patent/CA2210765C/en not_active Expired - Lifetime
- 1996-02-02 CN CNB961930950A patent/CN1198262C/zh not_active Expired - Lifetime
- 1996-02-02 AT AT96900816T patent/ATE230888T1/de active
- 1996-02-02 PT PT02075797T patent/PT1225568E/pt unknown
- 1996-02-02 DK DK96900816T patent/DK0808496T3/da active
- 1996-02-02 RU RU97114804A patent/RU2142166C1/ru active
- 1996-02-02 WO PCT/CA1996/000069 patent/WO1996024925A1/en active IP Right Grant
- 1996-02-02 JP JP52385296A patent/JP3430175B2/ja not_active Expired - Lifetime
- 1996-02-02 AU AU44796/96A patent/AU708392C/en not_active Expired
- 1996-02-02 AT AT02075797T patent/ATE248423T1/de active
- 1996-02-02 DK DK02075797T patent/DK1225568T3/da active
- 1996-02-05 IN IN198CA1996 patent/IN187453B/en unknown
- 1996-02-05 AR ARP960101276A patent/AR000871A1/es unknown
- 1996-02-06 DE DE19604273A patent/DE19604273C5/de not_active Expired - Lifetime
- 1996-02-06 FR FR9601426A patent/FR2730336B1/fr not_active Expired - Lifetime
- 1996-02-06 SE SE9600437A patent/SE520553C2/sv not_active IP Right Cessation
- 1996-02-06 GB GB9602391A patent/GB2297671B/en not_active Expired - Lifetime
- 1996-08-15 ES ES09650025A patent/ES2112807B1/es not_active Expired - Fee Related
-
1997
- 1997-07-28 NO NO19973472A patent/NO318595B1/no not_active IP Right Cessation
- 1997-08-06 FI FI973241A patent/FI117994B/sv not_active IP Right Cessation
-
1998
- 1998-02-24 HK HK98101406A patent/HK1002492A1/xx not_active IP Right Cessation
-
2002
- 2002-02-18 FI FI20020320A patent/FI118396B/sv not_active IP Right Cessation
- 2002-03-21 CN CNB021079072A patent/CN1220178C/zh not_active Expired - Lifetime
- 2002-05-02 KR KR1020020024078A patent/KR100393910B1/ko not_active IP Right Cessation
-
2003
- 2003-03-26 JP JP2003085959A patent/JP4187556B2/ja not_active Expired - Lifetime
- 2003-10-13 HK HK03107310A patent/HK1055007A1/xx not_active IP Right Cessation
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
SE520553C2 (sv) | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal | |
KR100299408B1 (ko) | 음성의고속코딩을위한심도우선대수코드북검색 | |
ZA200205695B (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals. | |
CN1200404C (zh) | 具有脉冲序列约束的码激励线性预测语音编码器译码器 | |
JP3063668B2 (ja) | 音声符号化装置及び復号装置 | |
US20040049382A1 (en) | Voice encoding system, and voice encoding method | |
SE524905C2 (sv) | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal | |
CA2210765E (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
CA2618002C (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
MXPA97005997A (en) | Algebraic coding book with amplitude signal deimpulse selected for a rapidacodification of | |
NO322594B1 (no) | Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale | |
CA2485547A1 (en) | Device, method, and program for encoding/decoding of speech with function of encoding silent period | |
CN1239796A (zh) | 具有高效、容错、激励向量编码的声码器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
NUG | Patent has lapsed |