SE506341C2 - Metod och anordning för rekonstruktion av en mottagen talsignal - Google Patents
Metod och anordning för rekonstruktion av en mottagen talsignalInfo
- Publication number
- SE506341C2 SE506341C2 SE9601351A SE9601351A SE506341C2 SE 506341 C2 SE506341 C2 SE 506341C2 SE 9601351 A SE9601351 A SE 9601351A SE 9601351 A SE9601351 A SE 9601351A SE 506341 C2 SE506341 C2 SE 506341C2
- Authority
- SE
- Sweden
- Prior art keywords
- signal
- received
- received signal
- speech
- speech signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000002452 interceptive effect Effects 0.000 claims abstract description 3
- 230000005284 excitation Effects 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 230000007704 transition Effects 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 11
- 230000007774 longterm Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 230000002829 reductive effect Effects 0.000 claims description 4
- 230000001052 transient effect Effects 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims 2
- 238000005562 fading Methods 0.000 abstract description 8
- 230000000694 effects Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 22
- 238000001228 spectrum Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 3
- 230000001066 destructive effect Effects 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 210000003437 trachea Anatomy 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 102000003712 Complement factor B Human genes 0.000 description 1
- 108090000056 Complement factor B Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000009958 sewing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mobile Radio Communication Systems (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
10
15
20
25
30
506 341 f
kodning möjliggör för mottagaren av en
talsignal, vilken
exempelvis har överförts via radio, att korrigera vissa typer av
fel som uppstått vid överföringen samt att dölja andra typer av
fel. Som exempel på åtgärder av detta slag kan nämnas de metoder
för ramersättning och felundertryckning som beskrivs i Draft GSM
EFR 06.61, “Substitution and muting of lost frames for enhanched
full rate speech traffic channels”, ETSI, 1996 och ITU Study
Group 15 Contribution to question 5/15, “G.728 Decoder
Modifications for Frame Erasure Concealment”, AT&T, February
1995, vilken baseras på standarden G.728, “Coding of speech at
16 kbps using Low Delay - Code Excited Linear Prediction (LD-
CELP)", ITU, Génève, 1992. I exempelvis den amerikanska
patentskriften US, A, 5233660 redogörs för en digital talkodare
och talavkodare, vilka opererar enligt LD-CELP-principen.
Då talinformation kodas enligt alternativa kodningsalgoritmer,
såsom exempelvis pulskodmodulation PCM (PCM = Pulse Code
Modulation) är det känt att vid fel i ett visst dataord repetera
det föregående dataordet. I artikeln “Waveform Substitution
Techniques for Recovering Missing Speech Segments in Packet
Voice Communications", IEEE 'Transactions on. Acoustics, Speech
and Signal Processing, vol. ASSP-34, No. 6, Dec. 1986, sid.
1440-1447 av David J. Goodman et al beskrivs hur talinformation,
som förlorats vid PCM-överföring mellan en sändare och en
information, vilken
mottagare, på mottagarsidan ersätts med
extraherats ur tidigare mottagen information.
För ~system där talinformationen är adaptivt differentiellt
pulskodmodulerad ADPCM (ADPCM = Adaptive Differential Pulse Code
Modulation) finns det flera kända metoder för felundertryckning
samt begränsning av stora signalamplituder, varvid tillstànd i
Suzuki och S.
avkodningsfilter modifieras. M. Kubota redogör i
10
15
20
25
506 341
artikeln “A Vbice Transmission Quality Improvement Scheme for
Personal Communication Systems - Super Mute Scheme", NTT
Wireless Systems Laboratories, vol. 4, 1995, sid. 713-717 för en
metod att vid ADPCM-överföring av talinformation dämpa den
mottagna signalen då data överförts felaktigt.
nEnosöRELss FÖR UPPFINNINGEN
Föreliggande uppfinning presenterar en lösning på de problem som
orsakas i analoga radiokommunikationssystem och i vissa digitala
trådlösa telefonsystem, såsom exempelvis DECT (DECT = Digital
European Cordless Telecommunications), då radiosignalen utsätts
för störningar. Ett sådant problem är de sprakljud som uppstår
då en mottagen analog radiosignal, exempelvis på grund av
fädning, blir för svag och drânks i brus.
Ett annat problem âr de klick- och missljud som alstras då ett
föregående dataord i en digitaliserad talsignal repeteras, på
grund av att fel har registrerats i det dataord som senast
mottogs.
Ytterligare ett problen1 är det avbrott som uppkommer då en
mottagen digitaliserad talsignal undertrycks, på grund av att
felhalten i de mottagna dataorden är allt för hög.
Ett ändamål med föreliggande uppfinning är' därför att ur en
mottagen talsignal, vilken under överföring från en sändare till
en uwttagare eventuellt har utsatts för störningar, skapa en
talsignal hos vilken effekterna av dessa störningars inverkan
minimeras. De störningar som avses kan exempelvis vara orsakade
av brus, interferens eller fädning.
10
15
20
25
506 341
Detta ástadkommes enligt den föreslagna uppfinningen genom att
ur den mottagna talsignalen bildas medelst signalmodellering en
skattad signal, vilken är beroende av en kvalitetsparameter, som
anger kvaliteten hos den mottagna talsignalen. Den mottagna och
skattade
den talsignalen kombineras därefter enligt ett
variabelt förhållande, som likaledes beror av nämnda kvalitets-
parameter, och bildar en rekonstruerad
talsignal. Om
mottagningsförhållandena gör att talkvaliteten hos den mottagna
talsignalen förändras, ändras nämnda förhållande och kvaliteten
hos den rekonstruerade talsignalen àterställs, varigenom en i
huvudsak jämn eller konstant kvalitet uppnås. Metoden enligt
uppfinningen är därvid kännetecknad så som det framgår av
patentkrav 1.
En föreslagen anordning rekonstruerar en talsignal från en
mottagen talsignal. Anordningen innefattar en signalmodel-
leringsenhet, i vilken en skattad talsignal motsvarande
förväntade framtida värden hos den mottagna talsignalen tas fram
och en signalkombineringsenhet, i vilken den mottagna och den
skattade talsignalen kombineras enligt ett variabelt
förhållande, som bestäms av en kvalitetsparameter. Den
föreslagna anordningen är därvid kännetecknad så som det framgår
av patentkrav 20.
Genom rekonstruktion av en mottagen analog eller digitaliserad
talsignal, varvid statistiska egenskaper hos talsignalen
utnyttjas, kan den talkvalitet som mottagaren upplever
förbättras avsevärt jämfört med den talkvalitet, som hittills
har kunnat åstadkommas med hjälp av de förut kända lösningarna i
analoga system respektive digitala system, vilka utnyttjar PCM-
eller ADPCM-överföring.
10
15
20
25
506 341
Genom att vid rekonstruktionen av den mottagna talsignalen ta
hänsyn till talsignalens statistiska egenskaper kan. man även
undvika de klick- och missljud, som alstras vid exempelvis PCM-
och ADPCM-överföring, dåd föregående dataord i talsignalen
repeteras på grund av att fel har registrerats i det dataord som
senast mottogs.
Dessutom kan de avbrott som
uppkommer då en nmttagen
digitaliserad talsignal undertrycks, på grund av att felhalten i
de mottagna dataorden är allt för hög, undvikas om man vid dessa
tillfällen istället endast utnyttjar den skattade talsignal som
tillhandahálles genom den föreslagna metoden.
FIGURBESKRIVNING
Figur 1 visar hur talinformation kodas och avkodas med hjälp
av linjärt prediktiv kodning (LPC) på ett förut känt
Sätt;
Figur 2 visar principiellt hur talinformation sänds, mottages
och rekonstrueras enligt den föreslagna metoden;
Figur 3 illustrerar ett exempel på en kanalmodell som kan
utnyttjas av den uppfinningsenliga metoden;
Figur 4 visar ett blockschema över signalrekonstruktions-
enheten i figur 2;
Figur 5 visar ett blockschema över den föreslagna signal-
modelleringsenheten i figur 4;
Figur 6 visar ett blockschema över excitationsgenererings-
enheten i figur 5;
10
15
20
25
506 341
Figur
Figur
Figur
Figur
Figur
Figur
Figur
Figur
Figur
10
ll
12
13
14
15
visar ett blockschema över den föreslagna signal-
kombineringsenheten i figur 4;
visar ett flödesdiagram över en första utföringsform
av den uppfinningsenliga signalkombineringsmetoden,
vilken tillämpas av signalkombineringsenheten i figur
7;
illustrerar ett exempel pá ett resultat som kan
erhållas då flödesdiagrammet i figur 8 genomlöpes;
visar ett flödesdiagram över en andra utföringsform
av den uppfinningsenliga signalkombineringsmetoden,
vilken tillämpas av signalkombineringsenheten i figur
7;
illustrerar ett exempel pà ett resultat som kan
erhållas då flödesdiagrammet i figur 10 genomlöpes;
visar i ett exempel pá hur en kvalitetsparameter för
en mottagen talsignal varierar över en sekvens av
mottagna talsampel;
visar ett diagram över signalamplituden hos den
mottagna talsignal, som avses i figur 12;
visar ett diagram över signalamplituden hos den i
figur 13 visade talsignalen, vilken rekonstruerats
enligt den föreslagna metoden;
visar ett blockschema över hur den uppfinningsenliga
signalrekonstruktionsenheten. kan appliceras i en
analog sändar/mottagarenhet;
10
15
20
25
506 341
Figur 16 visar ett blockschema över hur den uppfinningsenliga
signalrekonstruktionsenheten kan appliceras i en
sändar/mottagarenhet, vilken är ämnad att sända och
mottaga digitaliserad talinformation;
Uppfinningen kommer nu att beskrivas närmare med hjälp av
föredragna utföringsformer och med hänvisning till bifogade
ritningar.
FÖREDRAGNA Urrönmcsrommn
Figur 1 illustrerar hur mänskligt tal i form av talinformation S
kodas med hjälp av linjärt prediktiv kodning LPC pá förut känt
sätt. Den linjärt prediktiva kodningen LPC utgår från att
talsignalen S kan tänkas vara alstrad av en tongenerator 100,
vilken placerats i ett resonansrör 110. Tongeneratorn 100
motsvaras av de mänskliga stämbanden och luftstrupen utgör
tillsammans med munhålan resonansröret 110. Tongeneratorn 100
karakteriseras
av parametrarna intensitet och frekvens och
benämns i denna modell av talet excitering e och representeras
av' en källsignal K. Resonansröret 110 karakteriseras av' sina
resonansfrekvenser, de så kallade formanterna, vilka beskrivs av
korttidsspektrum 1/A.
Vid den linjärt prediktiva kodningen LPC analyseras talsignalen
S i en 'analysenhet 120 genom att dess bakomliggande
korttidsspektrum 1/A uppskattas och elimineras samt att
exciteringen e, det vill säga intensiteten och frekvensen, hos
den resterande
signalen beräknas. Eliminationen av
korttidsspektrum 1/A utförs i ett så kallat inversfilter 140,
med överföringsfunktion. A(z), vilket realiseras med hjälp av
10
15
20
25
30
506 341
koefficienter i en
vektor a, som med utgängpunkt fràn
talsignalen S framtagits i en LPC-analysenhet 180. Den
resterande signalen, det vill säga utsignalen från inversfiltret
140, benämns residual R. Koefficienter e(n) och en sidosignal c
som beskriver residualen R respektive korttidsspektrum 1/A
överförs till en syntesenhet 130. Talsignalen S rekonstrueras i
syntesenheten 130 genom en omvänd process mot den som utnyttjats
vid kodningen. i analysenheten 120. Excitationen e(n), vilken
erhållits vid analys i en excitationsanalysenhet 150, används
för att i en exciteringsenhet 160, ê, alstra en estimerad
kållsignal É. Korttidsspektrum 1/A, vilket beskrivs av
koeffecienterna i vektorn a, tas fram i en LPC-syntesenhet 190
med hjälp av information ur sidosignalen c. Vektorn a används
sedan för att skapa ett syntesfilter 170, med överförings-
funktion 1/A(z), representerande resonansröret 110, genom vilket
den estimerade källsignalen É sänds och varvid den
rekonstruerade talsignalen S genereras. Eftersom talsignalens S
karaktäristik varierar med tiden måste den ovan beskrivna
processen repeteras mellan 30 och 50 gånger per sekund för att
en acceptabel talkvalitet och en god kompression ska kunna
uppnås.
Det grundläggande problemet i den linjärt prediktiva kodningen
LPC är att bestämma korttidsspektrum 1/A, ur talsignalen S.
Problemet löses genom en differensekvation, som för varje sampel
av talsignalen S, uttrycker det aktuella samplet som en
linjärkombination av föregående sampel. Det är av denna
anledning som metoden kallas just linjärt prediktiv kodning LPC.
Koefficienterna a i differensekvationen, vilka beskriver
korttidsspektrum 1/A, måste estimeras vid den linjärt prediktiva
analysen, vilken utförs LPC-analysenheten 180. Estimationen sker
10
15
20
25
30
506 341
genom att det kvadratiska medelvärdet av skillnaden 58 nællan
verklig talsignal S och predikterad talsignal š minimeras.
Minimeringsproblemet löses genom följande två steg. Först
beräknas en matris av koefficientvärden. Därefter löses en
uppsättning linjära ekvationer, så kallade prediktorekvationer,
enligt en metod som garanterar konvergens och en unik lösning.
Dä vokalljud alstras låter sig luftstrupen och. munhålan väl
representeras av ett resonansrör 110, men vid nasala ljud bildar
näsan en sidokavitet, vilken inte kan. modelleras in i detta
resonansrör 110. Vissa delar av dessa ljud kan emellertid fångas
upp av residualen R, övriga kan inte överföras korrekt med hjälp
av enkel linjärt prediktiv kodning LPC.
Vissa konsonantljud produceras av ett turbulent luftflöde,
vilket ger ett visslande ljud. Även detta ljud kan representeras
i prediktorekvationenerna, men eftersom ljudet till skillnad
från vokalljud inte är periodiskt blir representationen något
annorlunda. Därför måste algoritmen LPC för varje talram avgöra
huruvida ljudet är tonande, vilket det oftast är vid vokalljud,
eller tonlöst, som för vissa konsonanter.
Cm1 ett givet ljud
bedöms vara tonande estimeras dess frekvens och intensitet och
om ljudet bedöms vara tonlöst estimeras endast intensiteten.
Normalt anges frekvensen av ett siffervärde, intensiteten av ett
annat siffervärde och uppgift om tvp av ljud anges med hjälp av
en informationsbit, vilken exempelvis sätts till ett om ljudet
är tonande och noll om det är tonlöst. Dessa
uppgifter
inkluderas i sidosignalen c, vilken alstras av LPC-analysenheten
180. Andra uppgifter som kan tas fram i LPC-analysenheten 180
och inkluderas i sidosignalen c är koefficienter som anger
korttidskorrelationen STP (STP = Short-Term Prediction)
respektive lángtidskorrelationen LTP (LTP = Long-Term
10
15
20
25
30
506 341
10
Prediction) hos talsignalen S, förstärkningsvärden som relaterar
till tidigare Överförd information, uppgift om talljud
respektive ljud av icke-tal-typ och information beträffande
lokal stationaritet eller lokala transienter.
Talljud som består av en kombination av tonande och tonlösa ljud
kan inte representeras adekvat vid enkel linjärt prediktiv
kodning LPC. Dessa ljud kommer därför att återges något
felaktigt vid rekonstruktionen av talsignalen É.
De fel som oundvikligen alltid uppstår då korttidsspektrum 1/A
bestäms ur talsignalen S föranleder att mer information än vad
som är teoretiskt nödvändigt kodas in i residualen R. Exempelvis
kommer de tidigare nämnda nasala ljuden att representeras av
residualen R. Detta leder i sin tur till residualen R innehåller
i högsta grad väsentlig information om hur talljudet ska låta.
Linjärt prediktiv talsyntes skulle utan dessa uppgifter ge ett
otillfredsställande resultat. För uppnàende av hög talkvalitet
måste således residualen R överföras. Vanligtvis sker detta med
hjälp av en så kallad kodbok, vilken innefattar en tabell över
de mest typiska residualsignalerna R. Vid kodningen jämförs
varje erhållen residual R med alla de värden som förekommer i
kodboken och det värde väljs, vilket ligger närmast det
beräknade värdet. Mottagaren har en identisk kodbok med den som
sändaren utnyttjar, varför endast den kod. VQ som anger den
aktuella residualen R behöver överföras. Vid mottagningen hämtas
ur mottagarens kodbok det residualvärde R som koden VQ anger och
motsvarande syntesfilter 1/A(z) tas fram. Denna typ av
talöverföring benämns kodexciterad linjär prediktion CELP (CELP
= Code Excited Linear Prediction). Nämnda kodbok måste vara stor
nog att omfatta alla väsentliga varianter av residualer R
som den ska vara så liten eftersom
samtidigt som möjligt,
10
15
20
25
30
11 506 341
söktiden i kodboken då minimeras och själva koderna blir korta.
Genom att använda två små kodböcker, av vilka den ena är fix och
den andra är adaptiv, kan man erhålla ^många koder som det
dessutom går snabbt att genomsöka. Den fixa kodboken innehåller
ett antal typiska residualvärden R och kan därmed göras relativt
liten. Den adaptiva kodboken är ursprunligen tom och fylls under
hand med kopior av tidigare residualer R, vilka fördröjs olika
lång tid. Den adaptiva kodboken kommer sålunda att fungera som
ett skiftregister och nämnda storlek
fördröjnings avgör
tonhöjden på det ljud som alstras.
Figur 2 visar hur talinformation S sänds, mottages och
rekonstrueras rnc enligt den föreslagna metoden. En inkommande
talsignal S nwduleras i en moduleringsenhet 210 i en sändare
200. Därefter sänds en modulerad signal &wd över exempelvis ett
radiogrânssnitt till en mottagare 220. Den modulerade signalen
gmâ kommer emellertid vid överföringen med stor sannolikhet att
utsättas för olika slags störningar I) i form av bland annat
brus, interferens och fädning. Därför kommer den signal S'
som mottages vid mottagaren 220 att skilja sig från den signal
fid, vilken sändes ut från sändaren 200. Den mottagna signalen
Sflmd demoduleras i en demoduleringsenhet 230, varvid en mottagen
talsignal r genereras. Demoduleringsenheten 230 alstrar även en
kvalitetsparameter q, vilken anger kvaliteten hos den mottagna
signalen Sflmd och därmed indirekt förväntad talkvalitet hos den
mottagna talsignalen r. En signalrekonstruktionsenhet 240 bildar
med utgångspunkt från den mottagna talsignalen r och
kvalitetsparametern q en rekonstruerad talsignal rmc, vilken i
huvudsak är av jämn eller konstant kvalitet.
Den modulerade signalen Smfi kan vara en radiofrekvensmodulerad
signal, vilken antingen är helt analogt modulerad med exempelvis
rmw
10
15
20
25
30
506 541
12
FM (FM = FrekvensModulering) eller är digitalt modulerad enligt
någon av principerna FSK (FSK = Fïequency Shift Keying), PSK
(PSK = Phase Shift Keying), MSK (MSK = Minimum Shift Keying)
eller liknande. Vidare kan såväl sändaren som mottagaren utgöras
av en mobil station som en basstation.
De störningar D som en radiokanal utsätts för har ofta sitt
ursprung i så kallad flervägsutbredning av radiosignalen.
Flervägsutbredning leder till att signalstyrkan i en given punkt
utgörs av summan av två eller flera radiostrålar,
från
vilka har
färdats olika lång väg sändaren och därför är
tidsförskjutna i förhållande till varandra. Radiostrålarna kan
beroende pà tidsförskjutningen adderas
destruktivt.
konstruktivt eller
Vid konstruktiv addition förstärks radiosignalen
och vid destruktiv addition försvagas radiosignalen, varvid den
i värsta fall släcks ut helt. Den kanalmodell son\ beskriver
denna typ av radiomiljö kallas Rayleigh-modellen och illustreras
i figur 3. Längs diagrammets vertikala axel anges signalstyrka y
i en logaritmisk skala och längs den horisontella axeln anges
tiden t i en linjär skala. Värdet 70 anger långtidsmedelvärdet
av signalstyrkan. y och 'R anger den signalnivå, vid vilken
signalstyrkan y är så låg att den överförda talsignalen kommer
att vara störd. Under tidsintervall tA respektive tg befinner
sig mottagaren i en. punkt där två eller flera radiostrålar
adderas destruktivt och radiosignalen drabbas av en så kallad
fädningssvacka. Det är bland annat under dessa tidsintervall som
det är aktuellt att vid rekonstruktion av den mottagna
talsignalen enligt den uppfinningsenliga metoden utnyttja en
skattad version av den mottagna talsignalen. Om mottagaren rör
sig med konstant hastighet genom en statisk radiomiljö kommer
avståndet At mellan två närliggande fädningssvackor tA och tg
10
15
20
25
506 341
13
att vara ungefär konstant och tA kommer att vara av samma
Såväl At
storleksordning som ts. beror av
som th och ta
mottagarens hastighet och radiosignalens våglängd. Avståndet
mellan två fädningssvackor är normalt en halv våglängd, det vill
säga cirka 17 centimeter vid en bärfrekvens på 900 IVII-Iz. Om
mottagaren rör sig med en hastighet av 1 m/s blir i detta fall
At s 0,17 sekunder och en fädningssvacka blir sällan längre än
20 millisekunder.
I figur 4 visas generellt hur signalrekonstruktionsenheten 240 i
figur 2 genererar en rekonstruerad talsignal rn: den föreslagna
metoden. En mottagen talsignal r tas in i en signalmodel-
leringsenhet S00, i vilken en skattad talsignal i' genereras.
Den mottagna talsignalen r och den skattade talsignalen f tas
emot av en signalkombineringsenhet 700, där signalerna r och f
kombineras enligt ett variabelt förhållande. Det förhållande
enligt vilket kombinationen sker avgörs av en kvalitetsparameter
också tas in i
q, vilken signalkombineringsenheten 700.
Kvalitetsparametern q utnyttjas även av signalmodel-
leringsenheten 500, där den styr det sätt pá vilket den skattade
talsignalen r bildas. Kvalitetsparametern q kan vara baserad på
uppmätt effektnivå RSS (RSS =_Received Signal Strength) hos den
ett estimat av
(C =
mottagna radiosignalen, signalnivån hos den
önskade radiosignalen C Carrier) i förhållande C/I till
signalniván hos en störsignal I (I = Interferer) eller en
bitfelshaltssignal alternativt ramfelssignal, vilken tagits fram
ur den mottagna radiosignalen. Från signalkombineringsenheten
700 levereras den rekonstruerade talsignalen ræc som summan av
ett viktat värde av den mottagna talsignalen r och ett viktat
värde av den skattade talsignalen r, där vikterna för r
10
15
20
25
30
506 341
14
respektive r kan varieras så att den rekonstruerade talsignalen
r¿u,helt kan utgöras av endera av signalerna r eller f.
I figur 5 visas ett blockschema över signalmodelleringsenheten
500 i figur 4. Den mottagna talsignalen r tas in i ett
inversfilter 510, där signalen r inversfiltreras enligt en
överföringsfunktion A(z), varvid korttidsspektrum 1/A elimineras
och residualen R genereras. Filterkoefficienter a till
inversfiltret 510 genereras med utgångspunkt fràn den mottagna
talsignalen r i en LPC/LTP-analysenhet 520. Filter-
koefficienterna a levereras även till ett syntesfilter 580 med
överföringsfunktion 1/A(z). LPC/LTP-analysenheten 520 analyserar
den Inottagna talsignalen r och alstrar en sidosignal c samt
värden b och L,
vilka anger karakteristika hos signalen r
respektive utgör styrparametrar till en excitations-
genereringsenhet 530. Sidosignalen c, vilken innefattar uppgift
om korttids- STP respektive långtidsprediktion LTP av signalen
r, lämpliga förstärkningsvärden för styrparametern b, uppgift om
talljud respektive ljud av icke-tal-typ samt information
huruvida signalen r är lokalt stationär eller transient, förs
till en tillstàndsmaskin 540 och värdena b och L sänds till
excitationsgenereringsenheten 530, där en estimerad källsignal
Iz genereras .
LPC/LTP-analysenheten 520 och excitationsgenereringsenheten 530
styrs via styrsignaler sl respektive sz, s3 och s, av
tillstàndsmaskinen 540, vars utsignaler sl-se beror av
kvalitetsparametern q och sidosignalen c. Generellt styr
kvalitetsparametern q, via tillstàndsmaskinen 540 och
styrsignalerna sl-s,, LPC/LTP-analysenheten 520 och excitations-
genereringsenheten 530 så att lángtidsprediktionen LTP av
signalen r inte uppdateras om kvaliteten hos den mottagna
10
15
20
25
506 341
15
signalen r understiger ett bestämt värde och att amplituden hos
den estimerade källsignalen I^< är proportionell mot kvaliteten
Tillståndsmaskinen 540
till
hos signalen r. levererar även
vikt faktorer ss och ss
560, i
multipliceringsenheter 55 0
respektive vilka residualen R och den estimerade
källsignalen få viktas innan de summeras i en summeringsenhet
S70.
tillståndsmaskinen 540 och
förhållande
Kvalitetsparametern q styr, via
viktfaktorerna ss och ss, det enligt vilket
residualen R och den estimerade källsignalen É kombineras i
summeringsenheten 570 och bildar en summasignal C, så att ju
högre kvalitet hos den mottagna talsignalen r desto större
viktfaktor ss för residualen R och desto mindre viktfaktor ss
för den estimerade källsignalen Iz. Vid sjunkande kvalitet hos
den mottagna talsignalen r minskas viktfaktorn ss och
viktfaktorn ss ökas i motsvarande grad, så att summan av ss och
ss alltid är konstant. Summasignalen C, där C=ssR+ssÉ , filtreras
i syntesfiltret 580, varvid den skattade talsignalen i* bildas.
Signalen C återföres även till excitationsgenereringsenheten
530, där den lagras för att representera historiska värden av
exciteringen.
Då inversfiltret 510 och
syntesfiltret 580 innehar vissa
minnesegenskaper är det fördelaktigt om dessa filters
koefficienter inte uppdateras i enlighet med egenskaper hos den
mottagna talsignalen r under de perioder då kvaliteten hos denna
signal är alltför låg. En sådan uppdatering leder sannolikt till
en icke-optimal inställning av filterparametrarna a, vilket i
sin tur resulterar i att den skattade talsignalen i* kommer att
vara av låg kvalitet även en tid efter det att kvaliteten hos
10
15
20
25
30
506 341
16
den mottagna talsignalen r har antagit en. högre nivå. I en
förfinad variant av därför
uppfinningen skapar
tillståndsmaskinen 540, via en sjunde och en åttonde styrsignal,
viktade värden av den mottagna talsignalen r respektive den
skattade talsignalen f, vilka summeras och utnyttjas för att då
kvalitetsparametern q understiger ett förutbestämt värde qc i
ökande grad låta LPC/LPT-analysen baseras på den skattade
talsignalen r istället för på den mottagna talsignalen r och
då q överstiger värdet qc åter låta LPC/LPT-analysen baseras på
den mottagna talsignalen r. Då q ligger stabilt över qc sättes
alltid den sjunde styrsignalen till ett och den åttonde till
noll och då q ligger stabilt under qc sättes den sjunde
styrsignalen till noll medan den åttonde får vara ett. Under
övergångsperioder där emellan tilldelar tillståndsmaskinen 540
nämnda styrsignaler värden mellan noll och ett i förhållande
till kvalitetsparameterns q aktuella värde. Summan av nämnda
styrsignaler är dock alltid lika med ett.
Överföringsfunktionerna hos inversfiltret 510 och syntesfiltret
580 utgör alltid varandras inverser, A(z) respektive 1/A(z). I
en förenklad utföringsform av uppfinningen är inversfiltret 510
ett högpassfilter med fixa filterkoefficienter a och
syntesfiltret 580 ett lågpassfilter baserat på samma fixa
filterkoefficienter a. LPC/LTP-analysenheten 520 levererar i
denna förenklade 'variant av' uppfinningen alltså alltid samma
filterkoefficienter a, oavsett utseendet hos den mottagna
talsignalen r.
Figur 6 visar ett blockschema över excitationsgenererings-
enheten i figur 5. Värdena b och L tas in till en styrenhet 610,
vilken styrs av signalen sz från tillståndsmaskinen 540. Värdet
b anger en faktor, med vilken ett visst sampel ê(n+i) ur en
10
15
20
25
506 3-41
17
minnesbuffert 620 skall multipliceras och. värdet IJ anger en
förskjutning motsvarande L sampelsteg bakåt i exciterings-
historiken, från vilken en viss excitation ê(n) skall hämtas. I
minnesbufferten 620 lagras exciteringshistorik ê(n+1),
ê(n+2),..., ê(n+N) frán. signalen C. Minnesbufferten 620 har
åtminstone en lagringskapacitet motsvarande 150 sampel, det vill
säga N = 150 och information ur signalen C lagras enligt
skiftregisterprincipen, varvid den äldsta informationen skiftas
ut, det vill säga detta fall raderas, då ny information skiftas
in.
Om ett aktuellt ljud vid LPC/LTP-analysen bedöms vara tonande
ger styrsignalen sz styrenheten 610 klartecken att förmedla
värdena b och L till minnesbufferten 620. Värdet L, som
framtagits ur långtidsprediktionen LTP av talsignalen r, anger
periodiciteten hos talsignalen r och
värdet b utgör en
viktfaktor, med vilken ett givet sampel ê(n+i) ur exciterings-
historiken skall
multipliceras för att ge en estimerad
källsignal É, vilken via summasignalen C alstrar en optimal
skattad talsignal f. Värdena b och L styr således hur
information ur minnesbufferten 620 utläses och därigenom bildar
en signal HV.
Om ett aktuellt ljud vid LPC/LTP-analysen bedöms vara tonlöst
ger istället styrsignalen sz styrenheten 610 en impuls att sända
en signal n till en slumpgenerator 630, varvid denna genererar
en slumpsekvens Hu.
Signalen HV och slumpsekvensen Hu viktas i multiplicerings-
enheter 640 och 650 med faktorer s3 respektive s4 och summeras i
en summeringsenhet 660, varvid den estimerade källsignalen É
bildas enligt uttrycket fi=s¿g+s¿g. Om det aktuella talljudet
10
15
20
25
SUG 341 ia
är tonande sätts faktorn s, till ett och faktorn s4 till noll
och om det aktuella talljudet är tonlöst sätts faktorn S3 till
noll och faktorn s4 till ett.
Vid övergång från tonande till
tonlöst ljud reduceras sa under ett antal pà varandra följande
sampel och s4 ökas i motsvarande grad samt vid övergång frán
tonlöst till tonande ljud sker på analogt sätt reduktion av så
och stegring av sy
Summasignalen C förs till minnesbufferten 620 och. uppdaterar
härvid exciteringshistoriken ê(n) sampel för sampel.
Figur 7 visar signalkombineringsenheten 700 i figur 4, i vilken
den mottagna talsignalen r och den skattade talsignalen i
kombineras. Förutom dessa signaler tar signalkombineringsenheten
700 även emot kvalitetsparametern q. En processor 710 genererar
med utgångspunkt från kvalitetsparametern q viktfaktorer a och
ß, med vilka den mottagna talsignalen r respektive den skattade
talsignalen r multipliceras i multipliceringsenheter 720 och
730 innan de adderas i summeringsenhet 740 och bildar den
rekonstruerade talsignalen rmc. Viktfaktorerna a respektive B
varieras från sampel till sampel beroende på värdet av
kvalitetsparametern q. Vid ökande kvalitet hos den mottagna
talsignalen 1: ökas viktfaktorn <1 och viktfaktorn ß ndnskas i
motsvarande grad. Dá kvaliteten hos den mottagna talsignalen r
sjunker gäller det omvända förhållandet. Summan av a och ß är
dock alltid ett.
Flödesschemat i figur 8 visar hur den mottagna talsignalen r och
den skattade talsignalen f kombineras i signalkombinerings-
enheten 700 i figur' 7 enligt en första 'utföringsforvl av' den
metoden. I
uppfinningsenliga signalkombineringsenhetens 700
processor 710 finns en räknarvariabel n, som kan stegas mellan
10
15
20
25
30
talsignalen r .
506 341
19
värdena -1 och nt+1. anger det antal konsekutiva
Värdet nt
talsampel under vilka kvalitetsparametern q hos den mottagna
radiosignalen kan understiga
respektive överstiga _ en
förutbestämd kvalitetsnivá ym innan den rekonstruerade signalen
rm: kommer att vara identisk med den skattade talsignalen i'
respektive den mottagna talsignalen r och under vilka talsampel
som den rekonstruerade talsignalen rr” kommer att utgöras av en
kombination av den mottagna talsignalen r och den skattade
Ju större nt väljs, desto längre blir alltså
övergángsperioden tt mellan de båda signalerna r och r.
I steg 800 tilldelas râknarvariabeln n värdet nt/Z i syfte att
säkerställa att râknarvariabeln n har ett rimligt värde om
flödesschemat vid rekonstruktion av det första talsamplet skulle
hamna i steg 840. I steg 805 tar signalkombineringsenheten 700
emot ett första talsampel av den mottagna talsignalen r. I steg
810 undersökes om en given kvalitetsparameter q överstiger ett
förutbestämt värde. I detta exempel låter man mottagen
signalkvalitet representeras av den mottagna radiosignalens
effektnivå y. I steg 810 jämförs därför effektniván y med
effektnivà en Yo, vilken utgörs av längtidsmedelvärdet av den
mottagna radiosignalens effektnivá y. Om y är högre än yo, sättes
i steg 815 den rekonstruerade talsignalen rm: lika med den
mottagna talsignalen r, râknarvariabeln n sättes i steg 820 till
ett och flödesschemat återföres till steg 805. I annat fall
undersökes i steg 825 om effektniván y är högre än en
förutbestämd nivå yt, vilken motsvarar undre gränsen för en
acceptabel talkvalitet. Om y inte är högre än yt, sättes i steg
830 den rekonstruerade talsignalen rm, lika med den skattade
talsignalen f, râknarvariabeln n sättes i steg 835 till nt och
flödesschemat äterföres till steg 805. Om i steg 825 y skulle
10
15
20
25
506 341
20
visa sig vara högre än yt, beräknas i steg 840 den
rekonstruerade talsignalen rue som summan av en första faktor a
multiplicerad med den mottagna talsignalen r och en andra faktor
ß multiplicerad med den skattade talsignalen r. I detta exempel
är a=(nt-n)/nt och ß=n/nt, varför Ita: ges av uttrycket
Ilt-'Il n
I+_'
Il: Il:
rn== f. I steg 845 tas nästa talsampel av den mottagna
talsignalen in och i steg 850 undersökes om motsvarande
effektnivà 7 hos den mottagna radiosignalen är högre än nivån fiw
vilken anger det aritmetiska medelvärdet av yo och yt, det vill
säga nF(y@vh)/2, och om så är fallet räknas i
räknarvariabeln
steg 855
n ned ett steg och i steg 860 prövas om
räknarvariabeln n är mindre än noll. Om räknarvariabeln n i steg
860 skulle visa sig vara mindre än noll indikerar det att
effektnivàn 'y har överstigit värdet mn under rn konsekutiva
sampel och den rekonstruerade talsignalen rue kan därför sättas
lika med den mottagna talsignalen r. Flödesschemat föres således
till steg 815. Om räknarvariabeln ri i steg 860 är större än
eller lika med noll föres flödesschemat till steg 840, varvid en
ny rekonstruerad talsignal rmc
beräknas. Om i steg 850
effektnivàn y är lägre än eller lika med ym ökas i steg 865
räknarvariabeln 11 med ett. I steg' 870 undersökes därefter om
räknarvariabeln n är större än värdet nt och om så är fallet
indikerar det att signalnivån y har understigit värdet ym under
nt konsekutiva sampel och den rekonstruerade talsignalen ræc bör
därför sättas lika med den skattade talsignalen f.
Flödesschemat äterföres därför till steg 830. Annars föres
flödesschemat till steg 840, varvid en ny rekonstruerad
talsignal r¿fl,beräknas
10
15
20
25
21 sne s41
I figur 9 visas ett exempel pà ett resultat som kan erhållas då
flödesschemat i figur 8 genomlöpes. I exemplet har nt satts till
10. Den mottagna radiosignalens effektnivá y överstiger
lángtidsmedelvârdet yo under de fyra först mottagna talsamplen
1-4. Under sampeln 2-5 kommer därför räknarvariabeln n att vara
lika med ett, eftersom flödesschemat i figur 8 endast genomlöper
steg 800-820. Den rekonstruerade talsignalen rm, kommer således
under sampel 1-4 att vara identisk med den mottagna talsignalen
r. Under de tolv följande kommer den
talsamplen 5-16
rekonstruerade talsignalen rn: att utgöras av en kombination av
den mottagna talsignalen r och den skattade talsignalen f,
eftersom den mottagna radiosignalens effektnivà y för dessa
talsampel ligger under lángtidsmedelvärdet yo av den mottagna
radiosignalens effektnivå. Exempelvis kommer den rekonstruerade
talsignalen rr” för talsampel 5 att ges av uttrycket r
IBC
= 0,9r
+ 0,1r, ty n=l och för talsampel 14 av rue = 0,2r + 0,82, ty
n=8. För talsampel 17-23 kommer den rekonstruerade talsignalen
rm: vara identisk med den skattade talsignalen f, eftersom den
mottagna radiosignalens effektnivå 'y för de tio (nt=10) närmast
föregående samplen 7-16 har understigit värdet 'ym och
radiosignalens effektnivá y för sampel 17-22 är lägre än värdet
yn. Under de avslutande tvâ samplen 24 och 25 kommer återigen
den rekonstruerade talsignalen rm: att utgöras av en kombination
av den mottagna talsignalen r och den skattade talsignalen r,
eftersom den mottagna radiosignalens effektnivå y för talsampel
23 och 24 överstiger effektnivàn Ym, men understiger
làngtidsmedelvärdet yo. Som exempel kan nämnas att den
rekonstruerade talsignalen rnc för talsampel 25 ges av uttrycket
rn: = 0,1r + 0,9r, ty n=9.
10
15
20
25
30
506 341
22
Flödesschemat i figur 10 visar hur den mottagna talsignalen r
och den skattade talsignalen r kombineras i signalkombinerings-
enheten. 700 i figur 7 enligt en andra utföringsform av den
uppfinningsenliga metoden. Även i denna utföringsform kan en i
processorn 710 befintlig räknarvariabel n stegas mellan värdena
-1 och nt+1. Likaledes anger här värdet nt det antal konsekutiva
talsampel under vilka kvalitetsparametern. q[ hos den mottagna
radiosignalen kan understiga respektive överstiga en
förutbestämd kvalitetsnivá Bm innan den rekonstruerade signalen
rrec kommer att vara identisk med den skattade talsignalen r
respektive den mottagna talsignalen r och under vilka talsampel
som den rekonstruerade talsignalen rnc kommer att utgöras av en
kombination av den mottagna talsignalen r och den skattade
talsignalen r.
I steg 1000 tilldelas räknarvariabeln n värdet nt/2 i syfte att
säkerställa att räknarvariabeln n har ett rimligt värde om
flödesschemat vid rekonstruktion av det första talsamplet skulle
hamna i steg 1040. I steg 1005 tar signalkombineringsenheten 700
in ett första talsampel av den mottagna talsignalen r. I steg
1010 undersökes om kvalitetsparametern q, i detta exempel
representerad av bitfelshalten BER (BER = Bit Error Rate) för
ett dataord motsvarande ett visst talsampel, överstiger ett
visst värde, det vill säga bitfelshalten BER understiger ett
förutbestämt värde Bo. Bitfelshalten BER kan exempelvis beräknas
genom paritetskontroll av det mottagna dataord, vilket
representerar nämnda talsampel. Värdet Bo motsvarar en
bitfelshalt BER upp till vilken alla fel kan antingen rättas
eller döljas helt. I ett system, där felrättnig inte förekommer
och där fel inte kan döljas är alltså B0=1. I steg 1010 jâmföres
bitfelshalten BER med nivån Bo. Om bitfelshalten BER är lägre än
10
15
20
25
30
506 341
23
Bo, sättes i steg 1015 den rekonstruerade talsignalen rn: lika
med den mottagna talsignalen r, räknarvariabeln n sättes i steg
1020 till ett och flödesschemat áterföres till steg 1005. I
annat fall undersökes i steg 1025 om bitfelshalten BER är högre
än en förutbestämd nivà Bt, vilken motsvarar övre gränsen för en
acceptabel talkvalitet. Om bitfelshalten BER är högre än Bt,
sättes i steg 1030 den rekonstruerade talsignalen rm, lika med
den skattade talsignalen f, räknarvariabeln n sättes i steg
1035 till nt och flödesschemat âterföres till steg 1005. Om i
steg 1025 bitfelshalten BER skulle visa sig vara lägre än eller
lika med Bt, beräknas i steg 1040 den rekonstruerade talsignalen
rnc som summan av en första faktor oc multiplicerad med den
mottagna talsignalen r och en andra faktor ß multiplicerad med
A
den skattade talsignalen r. I detta exempel är a=(n,._-n)/nt och
Ilt-Il HA
B=n/nc, varför rnc ges av uttrycket rm: r+-r I steg
Il: n:
1045 tas nästa talsampel av den mottagna talsignalen in och i
steg 1050 undersökas om motsvarande bitfelshalt BER hos den
mottagna datasignalen är lägre än en nivå Bm, vilken förslagsvis
anger det aritmetiska medelvärdet av Bo och Bt, det vill såga
Bm=(B°+B,,)/2, och om så är fallet räknas i steg 1055
räknarvariabeln n -ned ett steg och i steg 1060 prövas om
räknarvariabeln n är mindre än noll. Om räknarvariabeln n i steg
960 är mindre än noll indikerar det att bitfelshalten BER har
understigit värdet Bm under nt konsekutiva talsampel och den
rekonstruerade talsignalen rm, kan därför sättas lika med den
mottagna talsignalen r. Flödesschemat föres således till steg
1015. Om räknarvariabelnwn i steg 1060 är större än eller lika
med noll föres flödesschemat till
steg 1040, varvid en ny
rekonstruerad talsignal rrec beräknas. Om i steg 1050
bitfelshalten BER är högre än eller lika med Bm ökas i steg 1065
10
15
20
25
30
506 341
24
räknarvariabeln n med ett. I steg 1070 undersökes därefter om
räknarvariabeln n är större än värdet nt och om så är fallet
indikerar det att bitfelshalten BER har överstigit värdet Bm
under nt konsekutiva sampel och den rekonstruerade talsignalen
rttt bör därför sättas lika med den skattade talsignalen i.
Flödesschemat återföres därför till steg 1030. Annars föres
flödesschemat till steg 1040, varvid en ny rekonstruerad
talsignal rtet beräknas.
Ett specialfall av det ovan beskrivna fallet erhålles om man
istället för att låta kvalitetsparametern q ange bitfelshalten
BER för varje dataord låter q utgöra en ramfelsindikator BFI
(BFI = Bad Frame Indicator) , vilken kan antaga två olika värden.
Om antalet fel i ett givet dataord överstiger ett förutbestämt
värde Bt indikeras detta genom att q sättes till ett första
värde, exempelvis ett, och om antalet fel är lägre än eller lika
med Bt sättes q till ett andra värde, exempelvis noll. En mjuk
övergång mellan den mottagna talsignalen r och den skattade
talsignalen r erhålles i detta fall genom signalerna r och i'
viktas ihop med förutbestämda viktfaktorer, a respektive ß,
under ett förutbestämt antal sampel nt. Exempelvis kan nt vara
fyra sampel under vilka a och ß stegas genom värdena 0.75, 0.50,
0.50,
0.25 och 0.00 respektive 0.25, 0.75 och 1.00 eller tvärt
Om.
I figur 11 visas ett exempel pà ett resultat som kan erhållas då
flödesschemat i figur 10 genomlöpes. I exemplet har nt satts
till lO. I figur 11 anges en mottagen datasignals bitfelshalt
BER längs diagrammets vertikala axel och längs dess horisontella
axel representeras sampel 1-25 av den mottagna datasignalen,
vilken överförts via en radiokanal och vilken representerar
talinformation. Bitfelshalten BER indelas i tre nivåer Bo, Bm
10
L5
20
25
30
506 341
25
och Bg. En första nivå Bo motsvarar en bitfelshalt BER, vilken
resulterar i en perceptuellt sett felfri talsignal. Det vill
säga systemet klarar av att antingen rätta och/eller dölja upp
till Bo-l bitfel per mottaget dataord. En andra nivå B, anger en
bitfelshalt BER som är så hög att motsvarande talsignal är av en
oacceptabelt låg kvalitet. En tredje
nivå Bm utgör det
aritmetiska medelvärdet Bm=(Bt+B0)/2 av B: och Bo;
Den mottagna datasignalens bitfelshalt BER understiger nivån BO
under de fyra först mottagna talsamplen 1-4. Under sampeln 2-5
kommer därför räknarvariabeln n att vara lika med ett och den
rekonstruerade talsignalen rrec är identisk med den mottagna
talsignalen r. Under de tolv följande talsamplen 5-16 kommer den
rekonstruerade talsignalen rnc att utgöras av en kombination av
den mottagna talsignalen r och den skattade talsignalen f,
eftersom den mottagna datasignalens bitfelshalt BER för dessa
talsampel ligger över Bo. För talsampel 17-23 kommer den
rekonstruerade talsignalen rm, vara identisk med den skattade
talsignalen f, eftersom den mottagna datasignalens bitfelshalt
BER för de tio (nt=l0) närmast föregående samplen 7-16 har
överstigit värdet Bm och bitfelshalten för sampel 17-22 är högre
än värdet Bm. Under de avslutande två samplen 24 och 25 kommer
återigen den rekonstruerade talsignalen rrec att utgöras av en
kombination av den mottagna talsignalen r och den skattade
talsignalen f, eftersom den mottagna datasignalens bitfelshalt
BER för talsampel 23 och 24 understiger nivån Bm, men överstiger
nivån Bo .
I en första och en andra utföringsform av uppfinningen har
kvalitetsparametern q varit baserad på uppmätt effektnivå y hos
den mottagna radiosignalen respektive en beräknad bitfelshalt
BER hos en datasignal, vilken har överförts via en viss
10
15
20
25
506 541
26
radiokanal och vilken representerar den mottagna talsignalen r.
Kvalitetsparametern q kan givetvis i en tredje utföringsform av
uppfinningen vara baserad på ett estimat av signalnivån hos den
önskade radiosignalen C i förhållande C/I till signalnivån hos
en störsignal I. Sambandet mellan förhållandet C/I och den
rekonstruerade talsignalen run kommer då närmast att likna det
samband som illustrerats i figur 8, det vill säga för sjunkande
C/I ökas faktorn B och faktorn a minskas i motsvarande grad och
vid ökande C/I ökas faktorn a pá bekostnad av faktorn ß.
Motsvarande flödesdiagram kommer principiellt att överensstämma
med figur 8. I steg 810 skulle det istället stå C/I > Co, i steg
825 C/I > Cn och i steg 850 C/I > Cn, men i övrigt skulle samma
villkor gälla.
Figur 12 åskådliggör i diagramform ett exempel på hur en
kvalitetsparametar q för en mottagen talsignal r kan variera
över en sekvens av mottagna talsampel rn. Längs diagrammets
vertikala axel visas värdet av kvalitetsparametern q och längs
diagrammets horisontella axel representeras talsampeln rn. För
talsampel rn mottagna 'under ett tidsintervall tn understiger
kvalitetsparametern q en förutbestämd nivå qn, vilken motsvarar
undre gränsen för en acceptabel talkvalitet. Den mottagna
talsignalen r kommer därför' under detta tidsintervall. tn att
utsättas för en störning.
I figur 13 visas ett diagram över hur signalamplituden A hos den
mottagna talsignal r, som avses i figur 12, varierar över en tid
t motsvarande talsampeln rn. Signalamplituden A visas längs
diagrammets vertikala axel och tiden t representeras längs
diagrammets horisontella axel. Under tidsintervallet tn utsättes
talsignalen r för en störning i form av ett kort brus- eller
10
15
20
25
30
506 341
27
sprakljud, vilket i diagrammet representeras av en förhöjd
signalamplitud A av icke-periodisk karaktär.
Figur 14 visar ett diagram över hur signalamplituden A varierar
över en tid t motsvarande talsampeln r¿, hos en enligt den
föreslagna metoden rekonstruerad version rn: av den i figur 13
.visade talsignalen r. Signalamplituden A visas längs diagrammets
vertikala axel och tiden t representeras längs diagrammets
horisontella axel. Under det tidsintervall tå då kvalitets-
Aparametern q understiger nivån qt, kommer den rekonstruerade
talsignalen helt eller delvis att bestå av en skattad talsignal
r, vilken erhållits genom linjär prediktion av en tidigare
mottagen talsignal r, vars kvalitetsparameter q har överstigit
q¿. Därför år den skattade talsignalen i sannolikt av högre
kvalitet än den aktuella mottagna talsignalen r. Den
rekonstruerade talsignalen rn, vilken består av en 'variabel
kombination av den mottagna talsignalen r och en skattad version
r av denna talsignal, kommer således att ha i. huvudsak jämn
eller konstant kvalitet, oavsett kvaliteten. hos den mottagna
talsignalen r.
I figur 15 visas hur den föreslagna signalrekonstruktionsenheten
240 utnyttjas i en analog sändar/mottagarenhet 1500, benämnd
TRX, i en basstaion eller en mobil station. En radiosignal RFR
tas från en antennenhet emot i en radiomottagare 1510, vilken
levererar en mottagen mellanfrekvenssignal IFR. Den
mellanfrekventa signalen IF; demoduleras i en demodulator 1520,
varvid en analog mottagen talsignal r¿ och en analog
kvalitetsparameter qA genereras. Dessa signaler, I; och qà,
samplas och kvantiseras i en samplings- och kvantiseringsenhet
1530, vilken levererar motsvarande digitala signaler r
respektive q, som utnyttjas av signalrekonstruktionsenheten 240
10
15
20
25
506 341
28
för att enligt den föreslagna metoden generera en rekonstruerad
talsignal ræc.
Vid sändning av en talsignal S moduleras denna i en modulator
1540, i. vilken en nællanfrekvent signal IFT alstras. Signalen
IFT radiofrekvensmoduleras och förstärks i en radiosändare 1550
och en radiosignal RFT levereras för sändning till en antenn-
enhet.
Figur 16 illustrerar hur den föreslagna signalrekonstruktions-
enheten 240 utnyttjas i en sändar/mottagarenhet 1600, benämnd
TRX, i en basstation eller en mobil station, vilken kommunicerar
ADPCM-kodad talinformation. En radiosignal RFR tas från en
antennenhet emot i en radiomottagare 1610, vilken levererar en
mottagen mellanfrekvenssignal IFR. Den mellanfrekventa signalen
IFR demoduleras i en demodulator 1620, vilken levererar en
ADPCM-kodad basbandssignal BR och en kvalitetsparameter q.
Signalen BR avkodas i en ADPCM-avkodare 1630, varvid en mottagen
talsignal r genereras. Kvalitetsparametern q tas in till ADPCM-
avkodaren 1630 för att möjliggöra återställning av avkodarens
tillstànd vid alltför låg kvalitet hos den mottagna
radiosignalen. RFR. Signalerna. r och. q utnyttjas slutligen av
signalrekonstruktionsenheten 240 för att enligt den föreslagna
metoden generera en rekonstruerad talsignal LHC.
Vid sändning av en talsignal S kodas denna i en ADPCM-kodare
1640, vars utsignal är en ADPCM-kodad basbandssignal BT. Denna
signal BT moduleras sedan i en modulator 1650, varvid .en
mellanfrekvent signal IFT alstras. Signalen IFT
radiofrekvensmoduleras och förstärks i en radiosändare 1660,
från vilken en radiosignal RFT levereras för sändning till en
antennenhet.
506 341
29
ADPCM-avkodaren 1630 och. ADPCM-kodaren 1640 kan naturligtvis
lika gärna 'utgöras av en logaritmisk PCM-avkodare respektive
logaritmisk PCM-kodare om det system, i vilket sändar/
mottagarenheten 1600 opererar, istället tillämpar denna
talkodningsform.
Claims (44)
1. Metod för rekonstruktion av en talsignal från en mottagen signal (r), varvid en signalmodell (500) och en kvalitets- parameter (q) utnyttjas, k ä n n e t e c k n a d av att en skattad signal (f) motsvarande förväntade framtida värden hos den mottagna signalen (r) tas fram genonx nämnda signalmodell (500), att nämnda mottagna signal (r) och nämnda skattade signal (r) kombineras och bildar en rekonstruerad talsignal (rmc) samt att nämnda kvalitetsparameter (q) bestämmer det förhållande (a, ß) enligt vilket kombinationen sker.
2. Metod enligt krav 1, k ä n n e t e c k n a d av att nämnda kvalitetsparameter (q) baseras på en uppmätt effektnivà (RSS, 7) hos nämnda mottagna signal (r).
3. Metod enligt krav 1, k ä n n e t e c k n a d av att nämnda kvalitetsparameter (q) baseras på ett estimat av mottagen signalnivà (C) hos nämnda mottagna signal (r) i förhållande (C/I) till signalnivàn hos en störsignal (I).
4. Metod enligt krav 1, k ä n n e t e c k n a d av att nämnda kvalitetsparameter (q) baseras pá en bitfelshalt (BER), vilken beräknats ur en digital representation av nämnda signal (r).
5. Metod enligt krav 1, k ä n n e t e c k n a d av att nämnda kvalitetsparameter (q) baseras pà en ramfelsindikator (BFI), vilken beräknats ur en digital representation av nämnda signal (r).
6. Metod enligt något av kraven 1 - 5, k ä n n e t e c k n a d av att nämnda signalmodell (500) baseras på linjär prediktion (LPC/LTP) av nämnda mottagna signal (r). 10 15 20 25 506 341 31
7. Metod enligt krav 6, k ä n n e t e c k n a d av att nämnda linjära prediktion (LPC/LTP) genererar koefficienter, (STP) vilka anger en korttidsprediktion av nämnda mottagna signal (r).
8. Metod enligt krav 6 eller 7, k ä n n e t e c k n a d av att nämnda linjära prediktion (LPC/LTP) genererar koefficienter, (LTP) vilka anger en lángtidsprediktion av nämnda mottagna signal (r).
9. Metod enligt något av kraven 6 - 8, k ä n n e t e c k n a d av att nämnda linjära prediktion (LPC/LTP) genererar förstärkningsvärden (b), vilka relaterar till en historik (ê(n+1), ê(n+2),..., ê(n+N)) av nämnda skattade signal (r).
10. Metod enligt något av kraven 6 - 9, k ä n n e t e c k n a d av att nämnda linjära prediktion (LPC/LTP) innefattar information (c) om huruvida nämnda mottagna signal (r) antas representera talinformation eller information av icke-tal-typ. k ä n n e t e c k n a d (LPC/LTP)
ll. Metod enligt något av kraven 6 - 10, av att nämnda linjära prediktion innefattar information (c) om huruvida nämnda mottagna signal (r) antas representera ett tonande eller ett tonlöst ljud. k ä n n e t e c k n a d (LPC/LTP)
12. Metod enligt något av kraven 6 - 11, av att nämnda linjära prediktion innefattar information (c) om huruvida nämnda mottagna signal (r) antas vara lokalt stationär eller lokalt transient.
13. Metod enligt något av kraven 1 - 12, k ä n n e t e c k n a d av att nämnda mottagna signal (r) är en samplad och kvantiserad analogt modulerad och Överförd talsignal. 10 1.5 20 25 506 341 32
14. Metod enligt något av kraven 1 - 12, k ä n n e t e c k n a d av att nämnda mottagna signal (r) är en digitalt modulerad och överförd kodad signal.
15. Metod enligt något av kraven 1 - 12, k ä n n e t e c k n a d av att nämnda mottagna signal (r) är bildad genom avkodning av en adaptivt differentiellt pulskodmodulerad (ADPCM) signal.
16. Metod enligt något av kraven 1 - 12, k ä n n e t e c k n a d (r) en logaritmisk pulskodmodulerad (PCM) signal. av att nämnda mottagna signal är bildad genom avkodning av
17. Metod enligt krav 1, k ä n n e t e c k n a d av att nämnda (a, B) mottagna signal (r) förhållande är' variabelt från. att endast ange nämnda till endast att endast ange nämnda skattade signal (r).
18. Metod enligt krav 17, k ä n n e t e c k n a d av att övergång från endast nämnda mottagna signal (r) till endast nämnda skattade signal (r) sker under en övergångsperiod (tt) av åtminstone ett antal (nt) konsekutiva sampel av nämnda mottagna (r) mottagna signal signal under vilken kvalitetsparametern (q) för nämnda (r) understiger ett förutbestämt kvalitetsvärde (Ye) -
19. Metod enligt krav 17, k ä n n e t e c k n a d av att övergång från endast nämnda skattade signal (r) till endast nämnda mottagna signal (r) sker under en övergångsperiod (tg) av åtminstone ett antal (nt) konsekutiva sampel av nämnda mottagna (r) (q) för nämnda överskrider ett förutbestämt kvalitetsvärde signal under vilken kvalitetsparametern mottagna signal (r) (vt). 10 15 20 25 506 341 33
20. Metod enligt krav 17, k ä n n e t e c k n a d av att längden av nämnda övergångsperiod (tt) avgörs av ett förutbestämt, men varierbart övergàngsvärde (nt).
21. Anordning för rekonstruktion av en talsignal frán en mottagen signal (r), vilken innefattar' en signalmodellerings- enhet (500) k ä n n e t e c k n a d av att nämnda signal- modelleringsenhet (500) tar fram en skattad signal (r) motsvarande förväntade framtida värden hos nämnda mottagna signal '(r), att en signalkombineringsenhet (700) kombinerar (f), bildas samt att en nämnda mottagna signal (r) och nämnda skattade signal varvid en rekonstruerad talsignal (rue) kvalitetsparameter (q) bestämmer det förhållande (a, ß) enligt vilket kombinationen sker.
22. Anordning enligt krav 21, k ä n n e t e c k n a d av att en processor (710) i nämnda signalkombineringsenhet (700) utifrån värdet av nämnda kvalitetsparameter (q) för varje sampel av nämnda mottagna signal (r) anger en första viktfaktor (a) och en andra viktfaktor (ß).
23. Anordning enligt krav 22, k ä n n e t e c k n a d av att nämnda signalkombineringsenhet (700) bildar* ett första viktat värde (ar) av nämnda mottagna signal (r) genom att i en första multipliceringsenhet (720) multiplicera nämnda mottagna signal (r) med nämnda första viktfaktor (a) och ett andra viktat värde (Br) multipliceringsenhet av nämnda skattade (730) signal (r) genom att i en andra multiplicera nämnda skattade signal (r) med nämnda andra viktfaktor (B) samt att nämnda första (ar) och andra (Br) viktade värde enligt nämnda förhållande (a, B) 10 15 20 25 506 341 34 kombineras i en första summeringsenhet (740), varvid nämnda rekonstruerade signal (rnc) bildas som en första summasignal.
24. Anordning enligt krav 23, k ä n n e t e c k n a d av att ett i. nämnda processor (710) lagrat övergàngsvärde (nt) anger ett minsta antal konsekutiva sampel av nämnda mottagna signal (r) under vilka nämnda första viktfaktor (a) stegvis kan minskas från ett högsta värde till ett lägsta värde och nämnda andra viktfaktor (B) stegvis kan ökas från ett lägsta värde till ett högsta värde.
25. Anordning enligt krav 23, k ä n n e t e c k n a d av att ett i. nämnda processor (710) lagrat övergångsvärde (nt) anger ett minsta antal konsekutiva sampel av nämnda mottagna signal (r) under vilka nämnda första viktfaktor (a) stegvis kan ökas fràn ett lägsta värde till ett högsta värde och nämnda andra viktfaktor (B) stegvis kan minskas från ett högsta värde till ett lägsta värde.
26. Anordning enligt krav 24 eller 25, k ä n n e t e c k n a d av att nämnda högsta värde är lika med ett och att nämnda lägsta värde är lika med noll samt att summan (a+ß) av nämnda första (a) och andra (ß) viktfaktor är lika med ett.
27. Anordning enligt något av kraven 21 - 26, k ä n n e t e c k n a d av att nämnda signalmodelleringsenhet (500) innefattar en analysenhet (520), vilken enligt en linjärt prediktiv signalmodell (LPC/LTP) tar fram parametrar (a, b, c, L), (r). som beror av vissa egenskaper hos nämnda mottagna signal 10 15 20 25 506 341 35
28. Anordning enligt krav 27, k ä n n e t e c k n a d av att nämnda parametrar (a, b, c, L) innefattar filter- koefficienter' (a) till ett första (510) och. ett andra (580) digitalt filter, vars respektive överföringsfunktioner (A(z), 1/A(z)) utgör varandras inverser.
29. Anordning enligt krav 28, k ä n n e t e c k n a d av att nämnda första digitala filter (510) är ett inversfilter (A(z)) och att nämnda andra digitala filter (580) är ett syntesfilter (1/A(z)).
30. Anordning enligt något av kraven 21 - 26, k ä n n e t e c k n a d av att nämnda signalmodelleringsenhet (500) innefattar ett första (510) och ett andra (580) digitalt filter, vars respektive överföringsfunktioner (A(z), 1/A(z)) utgör varandras inverser.
31. Anordning enligt krav 30, k ä n n e t e c k n a d av att nämnda första digitala filter (510) har högpassfiltrerande karaktär och nämnda andra digitala filter (580) har làgpassfiltrerande karaktär.
32. Anordning enligt något av kraven 28 - 31, k ä n n e t e c k n a d av att nämnda första digitala filter (510) filtrerar nämnda mottagna signal (r), varvid en residualsignal (R) genereras.
33. Anordning enligt krav 32, k ä n n e t e c k n a d av att nämnda signalmodelleringsenhet (530), (500) innefattar en excitationsgenererande enhet vilken genererar en estimerad signal (É), som baseras pà tre av nämnda parametrar (b, c, L) samt en andra summasignal (C) och en tillstándsmaskin 10 15 20 25 506 341 36 (540), vilken genererar styrsignaler (sl - ss), som baseras på nämnda kvalitetsparameter (q) och en av nämnda parametrar (c).
34. Anordning enligt krav 33, k ä n n e t e c k n a d av att nämnda signalmodelleringsenhet (500) innefattar en andra summeringsenhet (570), vilken kombinerar ett tredje viktat värde (s5R) av nämnda residualsignal (R) med ett fjärde viktat värde (ssfi) av nämnda estimerade signal (É), varvid nämnda andra summasignal (C) bildas.
35. Anordning enligt krav 34, k ä n n e t e c k n a d av att nämnda andra digitala filter (580) filtrerar nämnda andra summasignal (C), varvid nämnda skattade signal (E) genereras.
36. Anordning enligt något av kraven 34 - 35, k ä n n e t e c k n a d av nämnda excitationsgenererande enhet (530) innefattar en minnesbuffert (620) och en slumpgenerator (630).
37. Anordning enligt krav 36, k ä n n e t e c k n a d av nämnda. minnesbuffert (620) lagrar historiska värden (ê(n+1), ê(n+2),..., ê(n+N)) av nämnda andra summasignal (C).
38. Anordning enligt krav 37, k ä n n e t e c k n a d av att nämnda minnesbuffert (620) utifrån två av nämnda parametrar (b, L) genererar en första signal (HV), vilken representerar ett tonande talljud.
39. Anordning enligt krav 38, k ä n n e t e c k n a d av (630) utifrân en av nämnda styrsignaler (Hu), nämnda slumpgenerator (sz) genererar en andra signal vilken representerar ett tonlöst talljud. 10 15 37 sne 341
40. Anordning enligt krav 39, k ä n n e t e c k n a d av att en tredje summeringsenhet (660) kombinerar ett tredje viktat värde (sfig) av nämnda första signal (HV) med ett fjärde viktat värde (sgg) av nämnda andra signal (Hg), varvid nämnda estimerade signal (É) bildas.
41. Anordning enligt något av kraven 21 - 40, k ä n n e t e c k n a d av att nämnda mottagna signal (r) är en samplad och kvantiserad analogt överförd talsignal.
42. Anordning enligt något av kraven 21 - 40, k ä n n e t e c k n a d av att nämnda mottagna signal (r) är en digitalt modulerad och Överförd kodad signal.
43. Anordning enligt krav 42, k ä n n e t e c k n a d avg att nämnda mottagna signal (r) är bildad genom avkodning av en adaptivt differentiellt pulskodmodulerad (ADPCM) signal.
44. Anordning enligt krav 42, k ä n n e t e c k n a d av att nämnda mottagna signal (r) är bildad genom avkodning av en logaritmisk pulskodmodulerad (PCM) signal.
Priority Applications (10)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SE9601351A SE506341C2 (sv) | 1996-04-10 | 1996-04-10 | Metod och anordning för rekonstruktion av en mottagen talsignal |
| TW086103606A TW322664B (sv) | 1996-04-10 | 1997-03-21 | |
| US08/826,798 US6122607A (en) | 1996-04-10 | 1997-03-25 | Method and arrangement for reconstruction of a received speech signal |
| EP97919828A EP0892974B1 (en) | 1996-04-10 | 1997-04-03 | Method and arrangement for reconstruction of a received speech signal |
| CA002248891A CA2248891A1 (en) | 1996-04-10 | 1997-04-03 | Method and arrangement for reconstruction of a received speech signal |
| JP53611697A JP4173198B2 (ja) | 1996-04-10 | 1997-04-03 | 受信音声信号の再構成方法および装置 |
| CN97193710A CN1121609C (zh) | 1996-04-10 | 1997-04-03 | 再现接收语音信号的方法和装置 |
| DE69718307T DE69718307T2 (de) | 1996-04-10 | 1997-04-03 | Verfahren und zusammenstellung zur wiederherstellung eines empfangenen sprachsignals |
| AU24170/97A AU717381B2 (en) | 1996-04-10 | 1997-04-03 | Method and arrangement for reconstruction of a received speech signal |
| PCT/SE1997/000569 WO1997038416A1 (en) | 1996-04-10 | 1997-04-03 | Method and arrangement for reconstruction of a received speech signal |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SE9601351A SE506341C2 (sv) | 1996-04-10 | 1996-04-10 | Metod och anordning för rekonstruktion av en mottagen talsignal |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| SE9601351D0 SE9601351D0 (sv) | 1996-04-10 |
| SE9601351L SE9601351L (sv) | 1997-10-11 |
| SE506341C2 true SE506341C2 (sv) | 1997-12-08 |
Family
ID=20402131
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| SE9601351A SE506341C2 (sv) | 1996-04-10 | 1996-04-10 | Metod och anordning för rekonstruktion av en mottagen talsignal |
Country Status (10)
| Country | Link |
|---|---|
| US (1) | US6122607A (sv) |
| EP (1) | EP0892974B1 (sv) |
| JP (1) | JP4173198B2 (sv) |
| CN (1) | CN1121609C (sv) |
| AU (1) | AU717381B2 (sv) |
| CA (1) | CA2248891A1 (sv) |
| DE (1) | DE69718307T2 (sv) |
| SE (1) | SE506341C2 (sv) |
| TW (1) | TW322664B (sv) |
| WO (1) | WO1997038416A1 (sv) |
Families Citing this family (31)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6754265B1 (en) * | 1999-02-05 | 2004-06-22 | Honeywell International Inc. | VOCODER capable modulator/demodulator |
| US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
| US7574351B2 (en) * | 1999-12-14 | 2009-08-11 | Texas Instruments Incorporated | Arranging CELP information of one frame in a second packet |
| SE519221C2 (sv) * | 1999-12-17 | 2003-02-04 | Ericsson Telefon Ab L M | Icke-transparent kommunikation där bara dataramar som detekterats som korrekta skickas vidare av basstationen |
| US7031926B2 (en) * | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
| DE10142846A1 (de) * | 2001-08-29 | 2003-03-20 | Deutsche Telekom Ag | Verfahren zur Korrektur von gemessenen Sprachqualitätswerten |
| US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
| US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
| US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
| US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
| US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
| US7177804B2 (en) | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
| US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
| US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
| US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| DE602006015328D1 (de) * | 2006-11-03 | 2010-08-19 | Psytechnics Ltd | Abtastfehlerkompensation |
| GB0704622D0 (en) | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
| US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
| US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
| US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
| US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
| JP6147744B2 (ja) * | 2011-07-29 | 2017-06-14 | ディーティーエス・エルエルシーDts Llc | 適応音声了解度処理システムおよび方法 |
| US8725498B1 (en) * | 2012-06-20 | 2014-05-13 | Google Inc. | Mobile speech recognition with explicit tone features |
| KR101987894B1 (ko) * | 2013-02-12 | 2019-06-11 | 삼성전자주식회사 | 보코더 잡음 억제 방법 및 장치 |
| US11295753B2 (en) | 2015-03-03 | 2022-04-05 | Continental Automotive Systems, Inc. | Speech quality under heavy noise conditions in hands-free communication |
| CN105355199B (zh) * | 2015-10-20 | 2019-03-12 | 河海大学 | 一种基于gmm噪声估计的模型组合语音识别方法 |
| EP3217557B1 (en) * | 2016-03-11 | 2019-01-23 | Intel IP Corporation | Circuit, apparatus, digital phase locked loop, receiver, transceiver, mobile device, method and computer program to reduce noise in a phase signal |
| FR3095100B1 (fr) * | 2019-04-15 | 2021-09-03 | Continental Automotive | Procédé de prédiction d’une qualité de signal et/ou de service et dispositif associé |
| US20230059691A1 (en) * | 2020-02-11 | 2023-02-23 | Philip R. Kennedy | Silent Speech and Silent Listening System |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4831624A (en) * | 1987-06-04 | 1989-05-16 | Motorola, Inc. | Error detection method for sub-band coding |
| US5226108A (en) * | 1990-09-20 | 1993-07-06 | Digital Voice Systems, Inc. | Processing a speech signal with estimated pitch |
| DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
| US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
| SE470372B (sv) * | 1992-06-23 | 1994-01-31 | Ericsson Telefon Ab L M | Metod jämte anordning att uppskatta kvaliten vid ramfelsdetektering i mottagaren hos ett radiokommunikationssystem |
| CA2131136A1 (en) * | 1993-09-29 | 1995-03-30 | David Marlin Embree | Analog radio communicator with fade compensation |
| US5502713A (en) * | 1993-12-07 | 1996-03-26 | Telefonaktiebolaget Lm Ericsson | Soft error concealment in a TDMA radio system |
| FI98163C (sv) * | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Kodningssystem för parametrisk talkodning |
| DE69517325T2 (de) * | 1994-08-18 | 2000-12-28 | British Telecommunications P.L.C., London | Tonqualitätsanalyse |
| EP0712218B1 (en) * | 1994-11-10 | 1999-07-14 | Telefonaktiebolaget Lm Ericsson | A method and an arrangement for sound reconstruction during erasures |
-
1996
- 1996-04-10 SE SE9601351A patent/SE506341C2/sv not_active IP Right Cessation
-
1997
- 1997-03-21 TW TW086103606A patent/TW322664B/zh active
- 1997-03-25 US US08/826,798 patent/US6122607A/en not_active Expired - Lifetime
- 1997-04-03 DE DE69718307T patent/DE69718307T2/de not_active Expired - Lifetime
- 1997-04-03 CA CA002248891A patent/CA2248891A1/en not_active Abandoned
- 1997-04-03 WO PCT/SE1997/000569 patent/WO1997038416A1/en not_active Ceased
- 1997-04-03 EP EP97919828A patent/EP0892974B1/en not_active Expired - Lifetime
- 1997-04-03 JP JP53611697A patent/JP4173198B2/ja not_active Expired - Lifetime
- 1997-04-03 CN CN97193710A patent/CN1121609C/zh not_active Expired - Fee Related
- 1997-04-03 AU AU24170/97A patent/AU717381B2/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| AU717381B2 (en) | 2000-03-23 |
| SE9601351L (sv) | 1997-10-11 |
| WO1997038416A1 (en) | 1997-10-16 |
| CN1121609C (zh) | 2003-09-17 |
| JP2000512025A (ja) | 2000-09-12 |
| EP0892974A1 (en) | 1999-01-27 |
| US6122607A (en) | 2000-09-19 |
| CA2248891A1 (en) | 1997-10-16 |
| JP4173198B2 (ja) | 2008-10-29 |
| AU2417097A (en) | 1997-10-29 |
| EP0892974B1 (en) | 2003-01-08 |
| DE69718307D1 (de) | 2003-02-13 |
| DE69718307T2 (de) | 2003-08-21 |
| TW322664B (sv) | 1997-12-11 |
| CN1215490A (zh) | 1999-04-28 |
| SE9601351D0 (sv) | 1996-04-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| SE506341C2 (sv) | Metod och anordning för rekonstruktion av en mottagen talsignal | |
| EP0848374B1 (en) | A method and a device for speech encoding | |
| KR101032119B1 (ko) | 선형 예측 기반 음성 코덱에서 효율적인 프레임 소거 은폐방법 및 장치 | |
| US7596489B2 (en) | Transmission error concealment in an audio signal | |
| US8401843B2 (en) | Method and device for coding transition frames in speech signals | |
| EP2535893B1 (en) | Device and method for lost frame concealment | |
| EP1598811B1 (en) | Decoding apparatus and method | |
| US6691085B1 (en) | Method and system for estimating artificial high band signal in speech codec using voice activity information | |
| JPH03175830A (ja) | 多重パルス音声符号器を保護する方法と多重パルス音声符号・復号装置 | |
| US6192335B1 (en) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals | |
| US6205423B1 (en) | Method for coding speech containing noise-like speech periods and/or having background noise | |
| US6804639B1 (en) | Celp voice encoder | |
| CN1113586A (zh) | 从基于celp的语音编码器中去除回旋噪声的系统和方法 | |
| US7089180B2 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
| KR100441612B1 (ko) | 수신된음성신호의재구성을위한방법및장치 | |
| Miki et al. | Pitch synchronous innovation code excited linear prediction (PSI‐CELP) | |
| Cox | 2000 CRC Press LLC.< http://www. engnetbase. com>. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| NUG | Patent has lapsed |