NO305188B1 - FremgangsmÕte og anordning for koding og dekoding av analoge signaler - Google Patents
FremgangsmÕte og anordning for koding og dekoding av analoge signaler Download PDFInfo
- Publication number
- NO305188B1 NO305188B1 NO914105A NO914105A NO305188B1 NO 305188 B1 NO305188 B1 NO 305188B1 NO 914105 A NO914105 A NO 914105A NO 914105 A NO914105 A NO 914105A NO 305188 B1 NO305188 B1 NO 305188B1
- Authority
- NO
- Norway
- Prior art keywords
- term prediction
- signal
- amplitudes
- combined
- information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000009466 transformation Effects 0.000 claims abstract description 10
- 230000007774 longterm Effects 0.000 claims description 16
- 230000000737 periodic effect Effects 0.000 claims description 5
- 238000011002 quantification Methods 0.000 claims description 2
- 238000012546 transfer Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims 1
- 238000001914 filtration Methods 0.000 abstract description 2
- 238000001228 spectrum Methods 0.000 abstract 2
- 230000006870 function Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Electrically Operated Instructional Devices (AREA)
- Analogue/Digital Conversion (AREA)
Description
Den foreliggende oppfinnelse vedrører en fremgangsmåte for koding av et samplet analogt signal med periodisk forløp, av den art som er angitt i den innledende del av det ved-føyde patentkrav 1.
Oppfinnelsen vedrører også en fremgangsmåte for dekoding av et signal som er kodet ved hjelp av en fremgangsmåte ifølge nevnte patentkrav 1.
Oppfinnelsen vedrører også en anordning for koding av et samplet analogt signal med periodisk forløp, av den art som er angitt i den innledende del av det vedføyde patentkrav 9, samt en anordning for dekoding av denne type signaler, i henhold til patentkrav 1.
En slik angitt fremgangsmåte er kjent fra "An error pro-tected tranform coder for cellular mobile radio", en publikasjon forfattet av H. Suda et al. og presentert under IEEE Workshop on speech coding, "Advances in speech coding", Vancouver, CA, 5-8 september 1989, side 81-86. Denne publikasjon viser på figur 1 en koder der korttidsprediksjonsanalyse og langtidsprediksjonsanalyse blir utført. Koderen omfatter et korttidsprediksjonsfilter for generering av et restsignal og omfatter en multiplekseringsenhet for multipleksering og deretter overføring (etter koding) av informasjon som finnes i restsignalet, informasjon som blir bestemt i korttidsprediksjonsanalysen, samt informasjon som er bestemt ved nevnte langtidsprediksjonsanalyse.
Denne kjente fremgangsmåte er imidlertid beheftet med u-lemper, bl.a. fordi den overfører informasjon på en ikke effektiv måte, dvs. med et stort antall av biter/sekund.
Et formål med den foreliggende oppfinnelse er bl.a. å skaffe en fremgangsmåte for på en svært effektiv måte å overføre informasjonen, dvs. med et lite antall av biter/sekund, uten at den kvalitet som oppfattes av den som lytter til den tale som er rekonstruert ved mottagersiden, oppfattes som forringet.
For oppnåelse av dette formål er fremgangsmåte av den innledningsvis angitte artkarakterisert vedde trekk som fremgår av den karakteriserende del av det vedføyde patentkrav 1.
Ifølge den foreliggende oppfinnelse blir restsignalet kodet av hensyn til mottak, hvilket betyr at kun den informasjon som er relevant for ulikheter i det dekodede mottatte signal som kan oppfanges av det menneskelige øre, blir overført.
For dette formål blir det kjente faktum at det menneskelige øre ikke er følsomt overfor absolutte faseverdier, men kun overfor faseforhold, utnyttet, slik at det i prinsipp ikke er nødvendig å overføre faseinformasjon fra det restsignal som skal kodes, kun gitt at det er mulig å rekonstruere de opprinnelige faseforhold ved-mottakersiden.
I tillegg utnytter foreliggende oppfinnelse den innsikt som har være kjent over noe tid og som går ut på at det menneskelige øre fungerer som en kjede som består av et antall av filtre med tilstøtende frekvensbånd, men med forskjellige båndbredder, de såkalte kritiske bånd eller "Barks", idet båndbredden for slike kritiske bånd er mye mindre for lave frekvenser enn for høye frekvenser. En frekvensskala som er formet i samsvar med denne innsikt, omtales som en lineær Bark-skala. For ytterligere forklaring av prinsippet bak en Bark-skala, henvises det til B. Scharf og S. Buus, "Stimulus, Physiology, Thresholds" i L. Kaufman, K.R. Boff og J.P. Thomas, editors, "Handbook of Perception and Human Performance", kapittel 14, sidene 1-43, Wiley, New York, 1986.
Det blir også understreket at prinsippet med å først transformere et restsignal for overføring i talekode til frekvensområdet, og deretter overføre den tilgjengelige informasjon etter at denne transformasjonen tidligere allerede er blitt gjennomført. For dette formål kan det henvises f.eks. til publikasjonen med tittelen "Fourier Transform Vector Quantisation for Speech Coding" av P. Chang et al. i IEEE Transactions on Communications, volum COM 35, nr. 10, sidene 1059-1068.
Ifølge denne publikasjonen blir det midlertid etter transformasjon benyttet vektorkvantifisering, og overføring av ren amplitudeinformasjon er ikke nevnt.
Som nevnt tidligere, vedrører oppfinnelsen også en fremgangsmåte for dekoding av et signal som kodes ifølge den allerede omtalte fremgangsmåte, og det karakteristiske ved denne oppfinneriske dekodingsteknikk, fremgår av den karakteriserende del av det vedføyde patentkrav 2.
Hva angår anordningen for koding av et samplet analogt signal, som angitt innledningsvis, så er de spesielle trekk ved denne anordning ifølge oppfinnelsen som angitt i den karakteriserende del av det vedføyde patentkrav 9.
Den omtalte anordning for dekoding av et signal som er kodet ved fremgangsmåten ifølge patentkrav 1, er kjenneteg-net ved de trekk som fremgår av det vedføyde patentkrav 10.
Det skal noteres at det er kjent at analoge signaler med sterke periodiske forløp slik som f.eks. talesignaler, effektivt kan kodes etter sampling ved å utføre et antall forskjellige transformasjoner på påfølgende segmenter av signalet, idet hvert segment er av en bestemt varighet. En av de kjente transformasjoner for dette formål er lineær prediktiv koding (LPK), og for en forklaring av denne fremgangsmåten henvises det til boken med tittelen "Digi tal Processing of Speech Signals" av L.R. Rabiner og R.W. Schafer, Prentice Hall, New Jersey, kapittel 8. Som nevnte blir LPK alltid benyttet for signalsegmenter av en bestemt varighet, i tilfelle av talesignaler f.eks. 20 ms, og an-ses for å være en korttidskoding. Det er også kjent å be-nytte ikke bare en korttidsprediksjon, men også en lang-tidsprediks jon (LTP), i hvilken en svært effektiv koding oppnås ved å kombinere disse to teknikkene. Prinsippene for LTP er beskrevet i Frequenz (Frequency), volum 42, nr. 2-3, 1988, sidene 85-93, P. Vary et al.:"Sprachcodec fur das Europåische Funkfernsprechnetz" ("Talekoder/-dekoder for det europeiske radiotelefonnettverk"), mens en forbed-ret versjon av LTP-prinsippet er omtalt i NL patentsøknad 9001985 .
Oppfinnelsen vil nå forklares i ytterligere detalj med ut-gangspunkt i en eksemplifiserende utførelsesform under henvisning til tegningen, hvor
figur 1 viser et blokkdiagram for en eksemplifiserende ut-førelsesform av en koderenhet i anordningen ifølge oppfinnelsen,
figur lb viser et blokkdiagram for en eksemplifiserende utførelsesform av en dekoderenhet i anordningen ifølge oppfinnelsen.
Et analogt signal fremskaffet av en mikrofon 1 begrenses i båndbredde av et lavpassfilter 2 og omdannes i en analog til digital omdanner 3 til en amplitudeserie og tidsdis-kréte samplinger som representerer det analoge signalet. Utgangssignalet fra omdanneren 3 mates til inngangen av en korttidsanalyseenhet 4 og til inngangen av et korttidsprediksjonsfilter 5. Disse to enhetene besørger den ovenfor nevnte korttidsprediksjon (KTP) av segmentene til f.eks. 160 sampler, og analyseenheten 4 fremskaffer et utgangs-signal i form av koeffisienter for korttidsprediksjonsfil-teret, hvilke koeffisitenter er kvantifisert, kodet og overført til dekoderenheten vist på figur lb. Strukturen av og funksjonen til filteret 5 og enheten 4 er velkjent for fagmannen innen talekoding og er ikke av ytterligere betydning for kjernen i foreliggende oppfinnelse, slik at en ytterligere forklaring kan utelates.
Det KTP-filtrerte signalet mates til en langtidspredik-sjonsanalyseenhet 6 (LTP). I denne analyseenheten blir en LTP-analyse anvendt to ganger per segment bestående av 160 samplinger, på en måte som beskrevet i f.eks. NL patent-søknad 9001985. For at et signalsegment skal kodes i en slik LTP-analyse, blir det alltid utført et søk ifølge en bestemt søkestrategi etter et segment som er så lik som mulig over en signalperiode som er av en bestemt lengde og som er forut for nevnte segment, og det blir overført et signal i kodet form som er representativt for antallet samplinger D i tidsrommet mellom starttidspunktet for det segment som ble funnet og starttidspunktet for det segment som skal kodes.
Utgangssignalet fra KTP-filterenheten henvises til som restsignalet, og ifølge oppfinnelsen blir nevnte restsignal overført i kodet form på en slik måte at kun den informasjon som, av hensyn til mottakelse, er relevant, blir overført. For dette formål blir segmentene bestående av 160 samplinger i nevnte restsignal delt opp i 8 subsegmenter bestående av 30 samplinger i kretsen 7. Dette gjøres ved å først dele det fremførte segment opp i åtte subsegmenter bestående av 2 0 samplinger, og deretter utfylles disse ved forkanten ("the leading edge") med de ti siste samplinger fra det tidligere subsegmentet. Dette betyr at de ti siste samplinger i hvert segment må lagres for at det første subsegmentet av de påfølgende segmenter skal kunne utfylles. Deretter blir hvert subsegment bestående av 30 samplinger, multiplisert i en krets 8 med en vindusfunksjon, slik som f.eks. en cosinusfunksjon. Vindusfunksjonen velges slik at for hvert sampel i de overlappende delene av subsegmentene, blir summen av kvadratene til de to multiplikasjonsfaktorene lik 1. Årsaken til at dette må være tilfelle for kvadratene er at multiplikasjon av vindusfunksjonen finner sted både i kodeenheten og i dekode-enheten vist på figur lb. En diskrét Fourier transformasjon (DFT) utføres på resultatet av multiplikasjonen 8 i en krets 9, hvilket medfører at 16 forskjellige frekvenskomponenter fremkommer for hvert subsegment. Av disse 16 frekvenskomponentene, blir amplitudene A for komponentene 1 til 13 inklusive beregnet i en krets 10. Komponentene 0,
14 og 15 kan ignoreres fordi de befinner seg utenfor fre-kvensbåndet fra 300 til 3400 Hz som er valgt for talekom-munikasjon. Dersom et større eller et mindre frekvensbånd er relevant, kan antallet aktuelle amplitudekomponenter justeres i samsvar med dette. Ved å starte med nevnte 13 komponeter, blir 4 såkalte Bark-amplitudekomponenter beregnet i en krets 11. Dette er amplituder som assosieres med frekvenser som er plassert med like mellomrom langs en lineær Bark-skala. Bark-amplitudekomponentene Bxtil B4inklusive, kan f.eks. beregnes som følger ut fra DFT amplitudene A1til A13inklusive:
Dersom ønskelig, kan en forsterkningsfaktor G beregnes som en skaleringsverdi i kretsen 12 utfra de fire Bark-amplitudekomponentene ifølge:
Anvendelsen av skaleringsverdien G har den fordel at de skalerte amplitudene kan kodes mer effektivt. Verdien av G blir kvantifisert i en krets 13 og deretter overført til dekoderenheten. Dersom skaleringsfaktoren G er blitt beregnet, blir hver Bark-komponent dividert med den kvantifiserte forsterkningsfaktoren G i en krets 14. Resultatet av denne divisjonen blir kvantifisert i en krets 15, kodet og deretter også overført til dekoderenheten.
Dersom det ikke benyttes en slik skaleringsverdi, kan kretsene 12, 13 og 14 utlates og de fire beregnede verdiene for Bark-amplitudekomponentene kan overføres direkte etter kvantifisering i kretsen 15.
Etter dekoding i en krets 16 i dekoderenheten, blir de fi-re skalerte Bark-amplitudekomponentene multiplisert i en multiplikator 18 med forsterkningsfaktoren G, dekodet i en krets 17, hvilket resulterer i de rekonstruerte Bark-amplitudekomponentene Bjtil B4inklusive. Dette blir selvsagt ikke utført dersom det ikke er blitt benyttet en skaleringsfaktor i kodeenheten. I en krets 19 blir amplitudene i frekvensdomenet Å[til Å13inklusive (ekvidistant langs Hz-skalaen) beregnet ved hjelp av følgende formel For å være i stand til å transformere de 13 frekvenskomponentene fra koderen tilbake til tidsdomenet ved hjelp av en invers DFT (IDFT) i IDFT-kretsen, er både amplituder og faser nødvendige.
Fasene blir bestemt på følgende måte ved hjelp av LTP- informasjonen som er dekodet i en krets 23 og som består av samplingsavstanden D.
De 120 ferskeste samplingene av den rekonstruerte KTP-resten av den type som vil være til stede ved utgangen av kretsen 22 som skal forklares i ytterligere detalj neden-for, blir lagret i hvert tilfelle. Det subsegment som befinner seg i en avstand av D samplinger i fortiden i forhold til foreliggende subsegment, bestemmes i en krets 24, og dette subsegmentet multipliseres i en krets 25 med samme vindusfunksjon som ble benyttet i kretsen 8 i koderenheten. Deretter blir det anvendt en DFT på nevnte subsegment i en krets 26, etter hvilken fasene til de 13 aktuelle komponentene kan beregnes i en krets 27. Ved hjelp av fasene som er bestemt på denne måten og de allerede beregnede amplitudene, blir det utført en IDFT i kretsen 20 der amplitudene til Å0, Å14, Å15og Å16er satt lik null.
Ved utgangen av kretsen 2 0 vil det nå være tilgjengelig en rekonstruksjon av subsegmentet med en lengde på 30 samplinger, men dette subsegmentet har også blitt modifisert av den vindusfunksjon som er utført i koderenheten. Det rekonstruerte subsegment blir derfor multiplisert igjen med vindusfunksjonen i en krets 21. De ti første samplingene i subsegmentet som nå er multiplisert to ganger med vindusfunksjonen og de ti siste samplingene fra det foregående subsegmentet som er multiplisert to ganger med vin-dus f unksj onen, blir addert i en krets 22, der de sistnevn-te ti samplinger er lagret for dette formål. Som et resultat av dette blir summen av multiplikasjonsfaktorer i de
resulterende ti samplinger lik 1.
De siste ti samplinger i dette subsegmentet blir lagret. De tyve første samplingene danner en del av et segment av KTP-resten. Etter at åtte subsegmenter har blitt rekonstruert og kombinert, er det oppnådd et fullstendig rekonstruert segment av KTP-resten, og dette er plassert ti samplinger i fortiden i forhold til det segment på hvilket KTP-analysen er blitt utført i kodeenheten.
En invers KTP-filtrering blir utført på dette segmentet i en filterkrets 2 8 på en i og for seg kjent måte ved hjelp av de mottatte KTP-koeffisienter, der filterkoeffisientene fra det forrige segmentet blir benyttet for de ti første samplingene.
Utgangssignalet fra filteret 2 8 blir omdannet i en digital til analog omdanner 29 til et analogt signal som mates via et lavpassfilter 30 til en høyttaler 31 som gir en repro-duksjon med god gjengivelse av talesignalet som er frem-ført til mikrofonen 1, da det har vært mulig å overføre nevnte talesignal i kodet form med et lavt antall biter som følge av de trinn som er blitt gjennomgått ifølge oppfinnelsen .
Dersom ønskelig kan det inkluderes en krets 23' mellom kretsene 23 og 24 for å utsette verdien D mottatt fra dekoderen for ytterligere et antall operasjoner for derved å oppnå en optimal verdi for D for rekonstruksjon av talesignalet. Disse operasjonene kan være tre påfølgende ope-
rasjoner.
1) Dersom serien av verdier for mottatt D fremviser en trend, vil den foreliggende mottatte D dersom den faller på utsiden av nevnte trend med en bestemt margin, erstat-tes av en verdi som passer med nevnte trend. Algoritmer for å bestemme en trend i en serie av påfølgende verdier og for å bestemme en erstathingsverdi for et signal som faller utenfor nevnte trend er i og for seg velkjent for fagmannen. 2) Tre mellomliggende verdier (1^ I2og I3) blir beregnet mellom to påfølgende verdier for D (Dtog D2) ved hjelp av interpolasjon, muligens justert ved hjelp av en algoritme. Dette utføres f.eks. på følgende måte:
Interpolasjonen utføres på grunn av at avstanden D blir fastlagt i kodeenheten to ganger per segment. Uten interpolasjon, vil dekoding av fire påfølgende subsegmenter ut-føres med samme verdi av D. Dersom det ikke foreligger en fundamental regelmessighet i signalet i kodeenheten, blir det følgelig fremskaffet en feilaktig regularitet i dekoderen gjennom fire subsegmenter. Dette problemet løses ved hjelp av interpolasjonen.
Dersom det foreligger en fundamental regelmessighet i talesignalet, vil repetisjonsavstanden i signalet generelt variere langsomt. Som følge av interpolasjonen vil variasjonen av verdien for D også få et jevnt forløp i dekoderen..
3) Etter utjevning av verdiene for D ved hjelp av, dersom nødvendig, beregning av erstatningsverdi og etter interpolasjon, vil den beregnede avstand D i så høy grad som mulig tilsvare den virkelige repetisjonsavstand som er tilstede i signalet. Dersom nevnte avstand D er mindre enn 30, blir D multiplisert med et heltall som velges på en slik måte at resultatet er minst lik 30. Dette er nødven-dig på grunn av at alle samplingene av et subsegment med en avstand på mindre enn 30 med hensyn til foreliggende segment, ennå ikke er blitt rekonstruert, slik at de derfor ikke kan benyttes til beregning av fasene.
Årsaken til at avstandene D på mindre enn 30 likevel blir overført, er at dersom den fundamentale regelmessighet i signalet inneholder et antall samplinger som er mindre enn 30, vil dette forhindre den dekodede avstand D fra å anta verdier som innbyrdes er ulike multipler av den egentlige repetisjonsavstand. Som et resultat av dette, ville utjev-ningsalgoritmen ha en dårligere mulighet for å fastlegge en trend.
Claims (10)
1. Fremgangsmåte for koding av et samplet analogt signal med periodisk forløp, i hvilken fremgangsmåte det samplede signal deles opp i påfølgende segmenter som hvert inneholder et forhåndsbestemt antall samplinger, i hvilken fremgangsmåte en korttidsprediksjonsanalyse utføres på nevnte segmenter og i hvilken de koeffisienter som er fastlagt i nevnte korttidsprediksjonsanalyse, overføres og også blir matet til et korttidsprediksjonsfilter, i hvilket en lang-tidsprediks jonsanalyse utføres på et restsignal som foreligger ved en utgang fra nevnte filter og der den informasjon som blir bestemt i nevnte langtidsprediksjonsanalyse også overføres, og der den informasjon som foreligger i restsignalet kodes og overføres,karakterisert vedat restsignalet transformeres til frekvensområdet, ved at amplitudene til i det minste et antall av frekvenskomponentene som er oppnådd under transformasjonen til frekvensområdet, blir kombinert til å danne et mindre antall av frekvenskomponenter på en slik måte at de frekvenser som assosieres med de kombinerte amplitudene, er plassert ekvidistant langs en lineær Bark-skala, og ved at det blir overført et signal som er representativt for nevnte kombinerte amplituder.
2. Fremgangsmåte for dekoding av et signal som er kodet ved hjelp av fremgangsmåte ifølge krav 1, i hvilken den informasjon som er mottatt ifølge langtidsprediksjonsanalysen og den andre informasjonen som er mottatt fra restsignalet, kombineres, og det kombinerte signal sammen med de mottatte korttidsprediksjonsanalysekoeffisienter mates til et inverst korttidsprediksjonsfilter ved hvis utgang en serie av samplinger fremskaffes, hvilke samplinger er representative for det samplede analoge signal,karakterisert vedat de originale amplitudene i frekvensområdet blir rekonstruert fra de mottatte kombinerte amplitudeverdier som blir kombinert i henhold til krav 1, ved at den informasjon som overføres som et resultat av nevnte langtidsprediksjonsanalyse, benyttes for å beregne faseverdiene assosiert med nevnte amplituder, og ved at de beregnede faseverdier sammen med de assosierte amplituder transformeres til tidsområdet.
3. Fremgangsmåte ifølge krav 1,karakterisert vedat amplitudene til de tretten frekvenskomponentene A1til A13inklusive, som er oppnådd gjennom transformasjonen til frekvensområdet, blir transformert til amplituder Bxtil B4inklusive, tilhørende fire frekvenskomponenter plassert ekvidistant langs en Bark-skala i samsvar med:
og ved at disse verdiene for B overføres etter kvantifisering .
4. Fremgangsmåte ifølge krav 3,karakterisert vedat en skaleringsfaktor G blir beregnet for de fire frekvenskomponentene B1til B4inklusive, som er plassert ekvidistant langs en Bark-skala i samsvar med:
ved at denne verdien for G blir kvantifisert, og ved at verdiene B^-B, iklusive blir dividert med den kvantifiserte skaleringsfaktor før de kvantifiseres.
5. Fremgangsmåte ifølge krav 2 og 3 eller 4,karakterisert vedat kombinerte amplitudeverdier B, til B4konstrueres fra den mottatte informasjon, ved at amplitudeverdiene Å, til A13inklusive oppnås fra dette i samsvar med:
og ved at den informasjon som overføres som et resultat av langtidsprediksjonsanalysen er representativ for antallet sampler D som er plassert mellom startøyeblikket for en gruppe av samplinger som er funnet ved hjelp av langtids-prediks jonsanalysen og overført tidligere, og startøye-blikket for en gruppe av samplinger som skal dekodes.
6. Fremgangsmåte ifølge krav 5,karakterisert vedat gruppen av tidligere overførte samplinger som er plassert med en avstand D med hensyn til en gruppe av samplinger som skal dekodes transformeres til frekvensområdet, ved at faseverdien bestemmes for i det minste et antall av frekvenskomponenter som er beregnet med nevnte transformasjon, ved at nevnte faseverdier kombineres med amplitudeverdiene Åj til Å3inklusive, og ved at disse kombinasjonene transformeres til tidsområdet.
7. Fremgangsmåte ifølge krav 5 eller 6,karakterisert vedat variasjonen i de mottatte verdier for D blir utjevnet ifølge en forhåndsbestemt algoritme ved å, dersom nødvendig, beregne en erstatningsverdi for en mottatt verdi av D, og ved at tre mellomliggende verdier blir beregnet for D mellom to på-følgende verdier av D ved hjelp av interpolasjon.
8. Fremgangsmåte ifølge krav 7,karakterisert vedat tre mellomliggende verdier Il7 I2og I3blir beregnet ut fra de kjente verdier D: og D2i samsvar med:
9. Anordning for koding av et samplet analogt signal med periodisk forløp, omfattende
oppdelingsorganer for oppdeling av det samplede signal til påfølgende segmenter som hvert inneholder et forhåndsbestemt antall av samplinger, korttidsprediksjonsorganer for å utføre en korttids-prediks jonsanalyse på nevnte segmenter og for å generere koeffisienter,
et korttidsprediksjonsfilter for å motta de koeffisienter som er fastlagt i nevnte korttidsprediksjonsanalyse, langtidsprediksjonsorganer for å utføre en langtids-prediks jonsanalyse på et restsignal som foreligger ved en utgang fra nevnte filter,
kodeorganer for koding av den informasjon som foreligger i restsignalet, idet denne informasjon skal overfø- res, samt
en utgang for overføring av koeffisientene, den informasjon som blir bestemt i nevnte langtidsprediksjonsanalyse og den informasjon som foreligger i restsignalet,karakterisert vedat anordningen omfatter : transformeringsorganer for å transformere restsignalet til frekvensområdet, kombinasjonsorganer for å kombinere amplitudene til i det minste et antall av frekvenskomponenter som er oppnådd under transformasjonen til frekvensområdet, til å danne et mindre antall av frekvenskomponenter på en slik måte at med de frekvenser som assosieres med de kombinerte amplituder, er plassert ekvidistant langs en lineær Bark-skala, idet et signal som er representativt for nevnte kombinerte amplituder, vil kunne overføres.
10. Anordning for dekoding av et signal som er kodet ved fremgangsmåten ifølge krav 1, omfattende
en inngang for å motta langtidsprediksj onsanalyse-inf ormas jon og annen informasjon som er mottatt fra restsignalet og korttidsprediksjonsanalyse-koeffisienter, kombinasjonsorganer for å kombinere langtidsprediksjonsanalyse-informasjonen og den andre informasjon som blir mottatt fra restsignalet, til et kombinert signal,
et inverst korttidsprediksjonsfilter for å motta det kombinerte signal og nevnte korttidsprediksjonsanalyse-koeffisienter og for generering ved sin utgang en serie av sampler som er representative for det samplede analoge signal,
karakterisert vedat anordningen omfatter : rekonstruksjonsorganer for å rekonstruere de originale amplituder i frekvensområdet fra de mottatte amplitudeverdier som er kombinert i henhold til krav 1, beregningsorganer til bruk av den overførte informasjon som et resultat av langtidsprediksjonsanalysen for å beregne de faseverdier som er assosiert med nevnte amplituder , samt overføringsorganer for overføring av de beregnede faseverdier sammen med de assosierte amplituder, til tidsområdet.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL9002308A NL9002308A (nl) | 1990-10-23 | 1990-10-23 | Werkwijze voor het coderen en decoderen van een bemonsterd analoog signaal met een herhalend karakter en een inrichting voor het volgens deze werkwijze coderen en decoderen. |
Publications (3)
Publication Number | Publication Date |
---|---|
NO914105D0 NO914105D0 (no) | 1991-10-18 |
NO914105L NO914105L (no) | 1992-04-24 |
NO305188B1 true NO305188B1 (no) | 1999-04-12 |
Family
ID=19857866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO914105A NO305188B1 (no) | 1990-10-23 | 1991-10-18 | FremgangsmÕte og anordning for koding og dekoding av analoge signaler |
Country Status (11)
Country | Link |
---|---|
EP (1) | EP0482699B1 (no) |
JP (1) | JP2958726B2 (no) |
AT (1) | ATE157188T1 (no) |
CA (1) | CA2053133C (no) |
DE (1) | DE69127339T2 (no) |
DK (1) | DK0482699T3 (no) |
ES (1) | ES2106051T3 (no) |
FI (1) | FI105623B (no) |
NL (1) | NL9002308A (no) |
NO (1) | NO305188B1 (no) |
PT (1) | PT99294A (no) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07261797A (ja) * | 1994-03-18 | 1995-10-13 | Mitsubishi Electric Corp | 信号符号化装置及び信号復号化装置 |
JPH09127995A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号復号化方法及び信号復号化装置 |
JP2000165251A (ja) * | 1998-11-27 | 2000-06-16 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置及びそれを実現したマイクロホン |
FI116992B (fi) | 1999-07-05 | 2006-04-28 | Nokia Corp | Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi |
EP1113432B1 (en) * | 1999-12-24 | 2011-03-30 | International Business Machines Corporation | Method and system for detecting identical digital data |
CN114519996B (zh) * | 2022-04-20 | 2022-07-08 | 北京远鉴信息技术有限公司 | 一种语音合成类型的确定方法、装置、设备以及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5650398A (en) * | 1979-10-01 | 1981-05-07 | Hitachi Ltd | Sound synthesizer |
US4742550A (en) * | 1984-09-17 | 1988-05-03 | Motorola, Inc. | 4800 BPS interoperable relp system |
JP2892462B2 (ja) * | 1990-08-27 | 1999-05-17 | 沖電気工業株式会社 | コード励振線形予測符号化器 |
-
1990
- 1990-10-23 NL NL9002308A patent/NL9002308A/nl not_active Application Discontinuation
-
1991
- 1991-10-10 CA CA002053133A patent/CA2053133C/en not_active Expired - Lifetime
- 1991-10-16 AT AT91202675T patent/ATE157188T1/de not_active IP Right Cessation
- 1991-10-16 EP EP91202675A patent/EP0482699B1/en not_active Expired - Lifetime
- 1991-10-16 DE DE69127339T patent/DE69127339T2/de not_active Expired - Lifetime
- 1991-10-16 DK DK91202675.4T patent/DK0482699T3/da active
- 1991-10-16 ES ES91202675T patent/ES2106051T3/es not_active Expired - Lifetime
- 1991-10-17 JP JP3332967A patent/JP2958726B2/ja not_active Expired - Lifetime
- 1991-10-18 NO NO914105A patent/NO305188B1/no not_active IP Right Cessation
- 1991-10-22 PT PT99294A patent/PT99294A/pt not_active Application Discontinuation
- 1991-10-23 FI FI914993A patent/FI105623B/fi not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
ES2106051T3 (es) | 1997-11-01 |
NO914105D0 (no) | 1991-10-18 |
DE69127339T2 (de) | 1998-01-29 |
FI914993A0 (fi) | 1991-10-23 |
CA2053133A1 (en) | 1992-04-24 |
EP0482699A2 (en) | 1992-04-29 |
DE69127339D1 (de) | 1997-09-25 |
EP0482699B1 (en) | 1997-08-20 |
JP2958726B2 (ja) | 1999-10-06 |
NL9002308A (nl) | 1992-05-18 |
PT99294A (pt) | 1994-01-31 |
CA2053133C (en) | 1996-05-21 |
JPH05268098A (ja) | 1993-10-15 |
EP0482699A3 (en) | 1992-08-19 |
DK0482699T3 (da) | 1998-03-30 |
NO914105L (no) | 1992-04-24 |
FI105623B (fi) | 2000-09-15 |
FI914993A (fi) | 1992-04-24 |
ATE157188T1 (de) | 1997-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4907277A (en) | Method of reconstructing lost data in a digital voice transmission system and transmission system using said method | |
US4216354A (en) | Process for compressing data relative to voice signals and device applying said process | |
KR100361236B1 (ko) | 차분코딩원리를구현하는전송시스템 | |
US4672670A (en) | Apparatus and methods for coding, decoding, analyzing and synthesizing a signal | |
KR970007661B1 (ko) | 스테레오포닉 오디오 신호의 입력세트 코딩방법 | |
RU2214048C2 (ru) | Способ кодирования речи (варианты), кодирующее и декодирующее устройство | |
JP4142292B2 (ja) | オーディオ信号の符号化効率を向上させる方法 | |
JPS6326947B2 (no) | ||
KR100419545B1 (ko) | 다른코딩원리들을이용한전송시스템 | |
JP4296753B2 (ja) | 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体 | |
KR20060022236A (ko) | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 | |
JP3237089B2 (ja) | 音響信号符号化復号方法 | |
US4038495A (en) | Speech analyzer/synthesizer using recursive filters | |
US3471648A (en) | Vocoder utilizing companding to reduce background noise caused by quantizing errors | |
JPH02308632A (ja) | 音信号を伝送しまたは記憶する方法 | |
KR100352351B1 (ko) | 정보부호화방법및장치와정보복호화방법및장치 | |
US6032113A (en) | N-stage predictive feedback-based compression and decompression of spectra of stochastic data using convergent incomplete autoregressive models | |
EP0396121B1 (en) | A system for coding wide-band audio signals | |
US5687281A (en) | Bark amplitude component coder for a sampled analog signal and decoder for the coded signal | |
NO305188B1 (no) | FremgangsmÕte og anordning for koding og dekoding av analoge signaler | |
US5588089A (en) | Bark amplitude component coder for a sampled analog signal and decoder for the coded signal | |
KR100215342B1 (ko) | 전송시스템 및 그 전송 시스템에서 사용되는 수신기 | |
AU751077B2 (en) | Audio coder utilising repeated transmission of packet portion | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JP3827720B2 (ja) | 差分コーディング原理を用いる送信システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MK1K | Patent expired |