NO343207B1 - Adaptiv gruppering av parametere for forbedret kodingseffektivitet - Google Patents
Adaptiv gruppering av parametere for forbedret kodingseffektivitet Download PDFInfo
- Publication number
- NO343207B1 NO343207B1 NO20075796A NO20075796A NO343207B1 NO 343207 B1 NO343207 B1 NO 343207B1 NO 20075796 A NO20075796 A NO 20075796A NO 20075796 A NO20075796 A NO 20075796A NO 343207 B1 NO343207 B1 NO 343207B1
- Authority
- NO
- Norway
- Prior art keywords
- parameters
- tuples
- representation
- sequence
- tuple
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 title description 13
- 238000000034 method Methods 0.000 claims description 36
- 230000006835 compression Effects 0.000 claims description 33
- 238000007906 compression Methods 0.000 claims description 33
- 230000003595 spectral effect Effects 0.000 claims description 21
- 230000011664 signaling Effects 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000006837 decompression Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000009432 framing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 2
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Foreliggende oppfinnelse er basert på det funn at parametere omfattende et første sett av parametere (130a) med en representasjon av en første del av et opprinnelig signal, og omfattende et andre sett av parametere (130b) med en representasjon av en andre del av det opprinnelige signal kan effektivt kodes når parametrene er arrangert i en første sekvens av tupler (134a, 134b) og i en andre sekvens av tupler (136a, 136b), der den første sekvens av tupler omfatter tupler av parametere med to parametere fra en enkelt del av det opprinnelige signal, og der den andre sekvens av tupler omfatter tupler av parametere med en parameter fra den første del og en parameter fra den andre del av det opprinnelige signal. En effektiv koding kan oppn'as ved å anvende en bit-estimerer for å estimere antallet nødvendige bits for å kode den første og den andre sekvens av tupler, der bare den sekvensen av tupler som gir det laveste antall bits kodes.
Description
Foreliggende oppfinnelse angår tapsfri koding av parametere, og mer spesielt generering og anvendelse av en kodingsregel for effektiv komprimering av parametere.
I den senere tid har flerkanals audioreproduksjonsteknikker blitt viktigere og viktigere. Grunnen til dette kan være det faktum at audio-komprimerings/kodingsteknikker, slik som den velkjente MP3-teknikken, har gjort det mulig å distribuere audioopptak via internett eller andre transmisjonskanaler med begrenset båndbredde. MP3-kodingsteknikken har blitt så berømt på grunn av det faktum at den tillater distribusjon av alle opptak i et stereoformat, dvs. en digital representasjon av audioopptaket med en første, evt. venstre stereokanal, og en andre, evt. høyre stereokanal.
Det foreligger likevel grunnleggende ulemper ved konvensjonelle to-kanals lydsystemer. Av denne grunn er surround-teknikken blitt utviklet. En anbefalt flerkanals surround-representasjon omfatter, i tillegg til de to stereokanalene L og R, en ytterligere senterkanal C og to surround-kanaler Ls, Rs. Dette referanse-lydformatet refereres også til som 3/2-stereo, hvilket angir eksistensen av tre frontkanaler og to surround-kanaler. Generelt kreves fem transmisjonskanaler. I et avspillingsmiljø vil det være nødvendig med i det minste fem høyttalere på fem passende steder for å oppnå en optimal lytteposisjon (engelsk: ”sweet spot”) i en bestemt avstand fra fem velplasserte høyttalere.
Det foreligger flere kjente teknikker for å redusere den krevde datamengde ved transmisjon av et flerkanals audiosignal. Slike teknikker kalles ”felles stereoteknikker”. I denne forbindelse refereres det til fig. 9 som viser en felles stereoinnretning 60. Denne innretningen kan være en innretning som implementerer for eksempel intensitetsstereo (IS) eller binaural signaliserende koding (engelsk: ”binaural cue coding”, BCC). En slik innretning vil generelt motta som inngangsdata minst to kanaler (CH1, CH2, ... CHn), og utmater i det minste en enkelt bærekanal og parametriske data. De parametriske data defineres slik at en tilnærming av en opprinnelig kanal (CH1, CH2, ... CHn) kan beregnes i en dekoder.
Bærekanalen vil normalt omfatte subbåndsutvalg, spektralkoeffisienter, tidsområdeutvalg etc., hvilket vil tilveiebringe en forholdsvis fin representasjon av det underliggende signal, mens de parametriske data ikke vil omfatte slike utvalg av spektralkoeffisienter men omfatte styreparametere for styring av en bestemt rekonstruksjonsalgoritme slik som veiing ved multiplisering, tidsforskyvning, frekvensforskyvning, faseforskyvning, etc. De parametriske data vil derfor omfatte bare en forholdsvis grov representasjon av signalet eller den assosierte kanal. I tall vil omfanget av data som kreves av en bærekanal ligge i området 60-70 kbit per sekund, mens omfanget av data som kreves for parametrisk sideinformasjon for en kanal vil typisk ligge i området 1,5-2,5 kbit per sekund. Eksempler på parametriske data vil være de velkjente skaleringsfaktorer, intensitetsstereoinformasjon eller binaurale signaliserende parametere, hvilket vil bli beskrevet nedenfor.
BCC-teknikken er f.eks. beskrevet i artikkel nr. 5574, "Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, AES convention, mai 2002, Munchen, i IEEE WASPAA-artikkelen "Efficient representation of spatial audio using perceptual parameterization", oktober 2001, Mohonk, NY, i "Binaural cue coding applied to audio compression with flexible redering", C. Faller og F. Baumgarte, 113. AES Convention, Los Angeles, fortrykk 5686, oktober 2002 og i "Binaural cue coding - Part II: Schemes and applications", C. Faller og F. Baumgarte, "IEEE Trans. on Speech and Audio Proc., volume level. 11, no. 6, Nov. 2003".
Ved BCC-koding konverteres et antall audio-inngangskanaler til en spektral representasjon ved anvendelse av en DFT (diskret Fourier transformasjon)-basert transformasjon med overlappende vinduer. Det resulterende uniforme spektrum deles opp i ikke-overlappende partisjoner. Hver partisjon vil ha en båndbredde som vil omtrent være proporsjonal med den ekvivalente, rektangulære båndbredde (ERB). BCC-parametrene estimeres så mellom to kanaler for hver partisjon. Disse BCC-parametere vil normalt være gitt for hver kanal i forhold til en referansekanal, og de vil videre bli kvantisert. De sendte parametere vil endelig bli beregnet i samsvar med foreskrevede formler (kodet) som også kan avhenge av de spesifikke partisjoner av signalet som skal prosesseres.
Det foreligger flere BCC-parametere. ICLD-parameteren angir f.eks. differansen (raten) mellom energiene inneholdt i to sammenlignende kanaler. ICC-parameteren (interkanal-koherens/korrelasjon) angir korrelasjonen mellom de to kanaler, hvilket kan forstås som likheten mellom bølgeformene til de to kanaler. ICTD-parameteren (interkanal-tidsdifferans) angir en globalt tidsforskyvning mellom de to kanaler, mens IPD-parameteren (interkanals faseforskjell) angir det samme når det gjelder fasene til signalene.
Man må være klar over at ved en rammevis prosessering av et audiosignal vil også BCC-analysen bli utført rammevis, dvs. tidsvarierende og også frekvensvis. Dette betyr at BCC-parametrene vil bli fremskaffet individuelt for hvert spektralbånd. Dette betyr videre at når en audiofilterbank dekomponerer inngangssignalet i f.eks. 32 båndpassignaler vil en BCC-analyseblokk fremskaffe en mengde av BCC-parametere for hver av de 32 båndene.
En relatert teknikk, også kjent som parametrisk stereo, er beskrevet i J. Breebaart, S. vand de Par, A. Kohlrausch, E. Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates", AES 116. kongress, Berlin, forhåndstrykk 6072, mai 2004, og E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, "Low Complexity Parametric Stereo Coding", AES 116. kongress, Berlin, forhåndstrykk 7073, mai 2004.
Kort sagt vil nylige tilnærmingsmåter for parametrisk koding av flerkanals audiosignaler (romlig audiokoding, binaural signaliserende koding (BCC) etc.) representere et flerkanals audiosignal ved hjelp av et nedmikset signal (som kan være mono eller omfatte flere kanaler) og parametrisk sideinformasjon (romlige signaler) som karakteriserer dets opplevde, romlige lydfase. Det er ønskelig å kunne holde raten av sideinformasjon så lav som mulig for å kunne minimalisere administrasjonsinformasjon og bruke så mye som mulig av den tilgjengelige transmisjonskapasitet for kodingen av de nedmiksede signaler.
En måte å holde bit-raten til sideinformasjonen lav er å foreta en tapsfri koding av sideinformasjonen i et romlig audioskjema ved f.eks. å anvende entropikodingsalgoritmer på sideinformasjonen.
Tapsfri koding har vært i utstrakt bruk ved generell audiokoding for å kunne sikre en optimal kompakt representasjon for kvantiserte spektralkoeffisienter og annen sideinformasjon. Eksempler på passende kodings-skjemaer og -fremgangsmåter er gitt i ISO/IEC-standardene MPEG1 del 3, MPEG2 del 7 og MPEG4 del 3.
Disse standarder, og f.eks. også IEEE-artikkelen "Noiseless Coding of Quantized Spectral Coefficients in MPEG-2 Advanced Audio Coding", S. R. Quackenbush, J. D. Johnston, IEEE WASPAA, Mohonk, NY, oktober 1997, beskriver kjente teknikker som omfatter de følgende midler for tapsfri koding av kvantiserte parametere:
● Flerdimensjonal Huffman-koding av kvantiserte spektralkoeffisienter
● Anvendelse av en felles (flerdimensjonal) Huffman-kodebok for sett av koeffisienter
● Kode verdien enten som et hele eller kode fortegns-informasjon og størrelsesinformasjon separat (dvs. anvende kun Huffman-kodebokssymboler for en gitt absoluttverdi, hvilket vil redusere den nødvendige kodeboks-størrelse, dvs. størrelsen til "fortegns"- i forhold til "ikke-fortegns"-kodebøker)
● Anvende alternative kodebøker for forskjellige største absoluttverdier (engelsk:
”largest absolute values”, LAV), dvs. forskjellige, maksimale absoluttverdier i parametrene som skal kodes
● Anvende alternative kodebøker for forskjellige, statiske fordelinger for hver LAV
● Sende valget av Huffman-kodebok som sideinformasjon til dekoderen
● Anvende "seksjoner" for å definere anvendelsesområdet for hver valgte Huffman-kodebok
● Differensialkode skaleringsfaktorer over frekvens og påfølgende Huffmankoding av resultatet
En annen teknikk for tapsfri koding av grovt kvantiserte verdier til en enkelt PCM-kode er foreslått i MPEG1-audiostandarden (kalt gruppering innenfor standarden og anvendt for sjikt 2). Dette er forklart mer detaljert i ISO/IEC 11172-3:93.
Publikasjonen "Binaural cue coding - Part II: Schemes and applications", C. Faller og F. Baumgarte, IEEE Trans. on Speech and Audio Proc., volumnivå 11, nr. 6, november 2003, gir noe informasjon om koding av BCC-parametere. Det foreslås at kvantiserte ICLD-parametere kodes forskjellig
● over frekvens, og resultatet er deretter Huffman-kodet (med en én-dimensjonal Huffman kode)
● over tid, og resultatet er deretter Huffman-kodet (med en én-dimensjonal Huffman-kode),
og at den mest effektive av disse til slutt velges som representasjonen av det opprinnelige audiosignal.
Bosi M. et al.: "ISO/IEC MPEG-2 Advanced audio coding", "Journal of the Audio Engineering Society", vol. 45, no. 10, sidene 789-812, foreslår gruppering og sammenfletting av parametere før Huffman-kodingen av disse.
US patentsøknad US 5 528 628 angår koding med variabel ordlengde av inngangssymboler ved anvendelse av flere variabel-lengde-kodetabeller. Den samme sekvens av symboler kodes ved anvendelse av forskjellige variabel-lengde-kodere, eller Huffman-kodere med forskjellige kodetabeller. En avgjørelse av hvilken kodet representasjon som skal sendes tas til slutt avhengig av den resulterende kodelengde.
Europeisk patentsøknad 1 047 193 A3 foreslår en tilsvarende tilnærmingsmåte, der det i tillegg bare anvendes absoluttverdi-kodebøker.
Shen-Chuan Tai et al.: "An adaptive 3-D discrete cosine transform coder for medical image compression" "IEEE Transactions on Information Technology in Biomedicine", vol. 4, no. 3, sidene 259-263 foreslår en fremgangsmåte for koding av todimensjonale bildedata ved anvendelse av en kodingsalgoritme, opprinnelig utviklet for koding av tredimensjonal informasjon. Ved den foreslåtte fremgangsmåte anvendes en segmenteringsteknikk basert på den lokale energistørrelse, for å kunne segmentere underblokker av bildet i forskjellige energinivåer. Disse underblokker med samme energinivå samles så for å danne en tredimensjonal, rettviklet prisme. En tre-DCT anvendes så for å komprimere de tredimensjonale, rettvinklede prismer individuelt.
Faller C. et al.: "Binaural Cue Coding - Part II: Schemes and Applications", "IEEE Transactions on Speech and Audio Processing", Vol. 11, no. 6, den 6. oktober 2003, sidene 520-531 foreslår en differensiell koding i tids- og frekvens-retningen, før Huffman-koding. Endelig velges den differensielle representasjon som gir den laveste bit-rate.
Som nevnt ovenfor er det blitt foreslått å optimalisere komprimeringsytelsen ved å anvende differensiell koding over frekvens, og alternativt over tid, og så velge den mest effektive variant. Valget av variant signaleres så til en dekoder via sideinformasjon.
Det er blitt gjort anstrengelser for å forsøke å redusere størrelsen av en nedmikset audiokanal og den korresponderende sideinformasjon. Ikke desto mindre er de oppnåelige bit-rater fremdeles for høye til å kunne tillate enhver mulig applikasjon. Sanntidsoverføring av audio- og video-innhold til mobiltelefoner vil f.eks. kreve de minst mulige bit-rater, og således en mer effektiv koding av innholdet.
Det er et formål med foreliggende oppfinnelse å tilveiebringe et forbedret kodingskonsept som vil kunne oppnå en mer effektiv, tapsfri komprimering av parameterverdier.
I samsvar med det første aspekt ved foreliggende oppfinnelse oppnås dette formål gjennom en komprimeringsenhet for komprimering av parametere, der parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del, omfattende en forsyningsenhet for forsyning av et første tuppel og et andre tuppel, der hvert tuppel omfatter i det minste to parametere, der det første tuppel omfatter to parametere fra det første sett av parametere og det andre tuppel omfatter en parameter fra det første sett av parametere og en parameter fra det andre sett av parametere; en bit-estimerer for estimering av antallet bits som er nødvendig for å kode settene av parametere, ved å anvende en første sekvens av tupler inkludert det første tuppel, og å kode settene av parametere ved anvendelse av en andre sekvens av tupler inkludert det andre tuppel, basert på en kodingsregel; og en tilveiebringingsenhet for tilveiebringelse av kodede blokker, der tilveiebringingsenheten er funksjonsdyktig til å tilveiebringe de kodede blokker ved anvendelse av sekvensen av tupler som gir et lavere antall bits, og for tilveiebringelse av en sekvensindikasjon som indikerer den sekvensen av tupler fra hvilken de kodede blokker er fremskaffet.
I samsvar med det andre aspekt ved foreliggende oppfinnelse oppnås dette formål ved en dekoder for dekoding av kodede blokker av parametere, der parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del er tilgrensende den første del, og for prosessering av en sekvensindikasjon, omfattende en dekomprimerer, der dekomprimereren er funksjonsdyktig til å dekomprimere en kodet blokk av parametere ved anvendelse av en dekodingsregel som vil avhenge av en kodingsregel benyttet for kodingen av sekvensene av tupler, for således å fremskaffe en sekvens av tupler av parametere, der hvert tuppel omfatter i det minste to parametere; og en rammedanningsenhet for mottak av sekvensindikasjonen, der sekvensindikasjonen vil indikere den sekvensen av tupler som anvendes av et antall av forskjellige sekvenser underliggende den kodede blokk, og for dannelse av settene av parametere ved anvendelse av informasjonen om sekvensen av tupler som benyttes.
I samsvar med det tredje aspekt ved foreliggende oppfinnelse oppnås dette formål gjennom en fremgangsmåte for komprimering av parametere, der parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del.
I samsvar med et fjerde aspekt av foreliggende oppfinnelse oppnås dette formål gjennom et datamaskinprogram som implementerer fremgangsmåten nevnt ovenfor når det kjøres i en datamaskin.
I samsvar med det femte aspekt ved foreliggende oppfinnelse oppnås dette formål gjennom en fremgangsmåte for dekoding av kodede blokker av parametere, der parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del, og for prosessering av en sekvensindikasjon.
I samsvar med det sjette aspekt ved foreliggende oppfinnelse oppnås dette formål gjennom et datamaskinprogram som implementerer fremgangsmåten nevnt ovenfor når det kjøres i en datamaskin.
I samsvar med det sjuende aspekt ved foreliggende oppfinnelse oppnås dette formål gjennom en komprimert representasjon av parametere, der parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del av det opprinnelige signal, omfattende en kodet blokk av parametere som representerer en benyttet sekvens av tupler; og en sekvensindikasjon som vil indikere den benyttede sekvens av tupler, av en første eller en andre sekvens underliggende den kodede blokk av parametere, der den første sekvens omfatter et første tuppel med to parametere fra det første sett av parametere, og der den andre sekvens omfatter et andre tuppel med en parameter fra det første sett av parametere og en parameter fra det andre sett av parametere.
Foreliggende oppfinnelse er basert på det funn at parametere som omfatter et første sett av parametere for en representasjon av en første del av et opprinnelig signal og et andre sett av parametere for en representasjon av en andre del av det opprinnelige signal kan kodes effektivt når parametrene er innrettet i en første sekvens av tupler og i en andre sekvens av tupler, der den første sekvens av tupler omfatter tupler av parametere med to parametere fra en enkelt del av det opprinnelige signal, og der den andre sekvens av tupler omfatter tupler av parametere med en parameter fra den første del og en parameter fra den andre del av det opprinnelige signal. En effektiv koding kan oppnås ved å benytte en bit-estimerer for å estimere antallet bits som vil være nødvendig for å kode den første og den andre sekvens av tupler, der bare den sekvensen av tupler som gir det laveste antall bits kodes.
Det grunnleggende prinsipp vil derfor være at parametrene som skal kodes omarrangeres, f.eks. i tid og i frekvens, og at det ene arrangement (sekvens av tupler) av parametrene som gir det laveste antall bits for de komprimerte parametere til slutt velges for komprimering.
I en utførelsesform av foreliggende oppfinnelse vil to sett av spektralparametere som beskriver den spektrale representasjon av to påfølgende tidsdeler av et opprinnelig signal bli adaptivt gruppert i par av to parametere, for å forbedre kodingseffektiviteten. På den ene side vil det derfor bli generert en sekvens av tupler ved å anvende tupler av parametere som består av to tilgrensende frekvensparametere i den samme tidsdel. På den annen side vil det bli generert en andre sekvens av tupler ved anvendelse av tupler som er dannet ved bruk av en første parameter fra den første tidsdel og den korresponderende parameter fra den andre tidsdel i det opprinnelige signal. Deretter vil begge sekvensene av tupler bli kodet ved å benytte en todimensjonal Huffman-kode. Størrelsen til de to kodede sekvenser av tupler sammenlignes og det tuppelet som gir det laveste antall bits velges til slutt for sending. Informasjon om hvilke tupler som er blitt benyttet for dannelsen av de kodede data sendes til en dekoder som ytterligere sideinformasjon.
En fordel med den oppfinneriske koder tidligere beskrevet er at på grunn av grupperingen av parametere i tupler som består av to parametere vil en todimensjonal Huffman-kode kunne anvendes for komprimeringen, noe som generelt vil resultere i en lavere bit-rate.
En andre fordel er at den adaptive gruppering, dvs. konseptet med å dynamisk velge mellom to mulige grupperingsstrategier under kodingsprosessen, vil kunne gi en ytterligere reduksjon av bit-raten for sideinformasjonen.
Det å velge mellom de to grupperingsstrategiene bare en gang for et sett av to påfølgende rammer vil i tillegg redusere omfanget av påkrevd sideinformasjon, siden en indikasjon på hvilken grupperingsstrategi som er blitt benyttet under kodingen bare må sendes en gang for et sett av to fullstendige, påfølgende tidsrammer.
I en ytterligere utførelsesform av foreliggende oppfinnelse vil en oppfinnerisk komprimeringsenhet i tillegg omfatte en differensiell koder som på differensiell måte vil kode parametrene enten i tid eller i frekvens, før den adaptive gruppering. Denne differensielle koding sammen med den adaptive gruppering og en passende Huffmankodebok vil ytterligere redusere størrelsen av sideinformasjonen som må sendes. De to differensielle kodingsmulighetene sammen med de to grupperingsstrategiene vil gi et totalt antall av fire mulige kombinasjoner, noe som ytterligere vil øke sannsynligheten for å finne en koderegel, hvilket vil gi en lavere bit-rate for sideinformasjonen.
I en ytterligere utførelsesform av foreliggende oppfinnelse anvendes det oppfinneriske konsept i en dekomprimeringsenhet, for å tillate dekoding av kodede blokker av parametere, og å gjenopprette de opprinnelige rammer basert på sideinformasjon om grupperingsskjemaet som underligger de kodede blokker av parametere. I en fordelaktig modifikasjon vil den oppfinneriske dekoder også tillate dekoding av data som ikke er blitt adaptivt gruppert, og således vil det kunne oppnås kompatibilitet for den oppfinneriske dekoder i forhold til eksisterende utstyr.
Foretrukkede utførelsesformer av foreliggende oppfinnelse vil bli beskrevet i det følgende med referanse til de vedlagte tegninger, der:
Fig. 1 viser en oppfinnerisk komprimeringsenhet;
fig. 2 viser to muligheter for en adaptiv gruppering av parametere;
fig. 3 viser noen ytterligere muligheter for adaptiv gruppering av parametere; fig. 4 viser differensielle kodingsskjemaer;
fig. 5 viser en oppfinnerisk dekoder,
fig. 6 viser en flerkanals koder fra kjent teknikk.
Fig. 1 viser en oppfinnerisk komprimeringsenhet 90, omfattende en forsyningsenhet 100, en bit-estimerer 102 og en tilveiebringelsesenhet 104.
Forsyningsenheten 100 vil forsyne en første sekvens av tupler 106a og en andre sekvens av tupler 106b fra to datautganger. Tilveiebringelsesenheten 104 vil motta tuplene 106a og 106b ved to av dens datainnganger 108a og 108b. Bitestimereren vil motta de to tuplene ved sine datainnganger 110a og 110b.
Bit-estimereren 102 vil estimere antallet bits ved anvendelse av en kodingsregel for de to tuplene 106a og 106b. Bit-estimereren 102 vil velge det tuppelet som gir det laveste antall bits og signalere gjennom en signaleringsutgang 112a hvilken av tuplene 106a og 106b som gir det laveste antall bits.
Basert på valget foretatt i bit-estimereren 102 vil tuppelet som gir det laveste antall bits til slutt bli kodet til kodede blokker 118 som tilveiebringes gjennom utgangen 120a i tilveiebringelsesenheten 104, der tilveiebringelsesenheten videre vil signalere en sekvensindikasjon gjennom sin signaleringslinje 120b, for å indikere hvilken av de opprinnelige sekvenser av tupler (106a eller 106b) som ble kodet for å fremskaffe de kodede blokker 118.
I en alternativ utførelsesform kan den samme funksjonalitet oppnås med de stiplede forbindelser 122a og 122b mellom forsyningsenheten 100 og tilveiebringelsesenheten 104 utelatt. I et slikt alternativt scenario ville bit-estimereren 102 kode sekvensen av tupler 106a og 106b og overføre to forskjellige kodede blokker 124a og 124b til tilveiebringelsesenheten 104, der tilveiebringelsesenheten i tillegg vil signalere hvilke de opprinnelige sekvenser av tupler 106a og 106b de kodede blokker 124a og 124b er fremskaffet fra. Signaleringsutgangen 112a i bit-estimereren 102 kan benyttes for dette formål, eller signaleringen kan implisitt oppnås gjennom tilveiebringelsesenheten 104.
I denne alternative utførelsesform vil tilveiebringelsesenheten 104 rett og slett sende videre den kodede blokk med det laveste antall bits til dens utgang 120a, og i tillegg tilveiebringe sekvensindikasjonen.
Fig. 2 viser et eksempel på to adaptive grupperingsskjemaer som benyttes for å fremskaffe en sekvens av tupler som skal kodes. For å forklare prinsippet ved den oppfinneriske, adaptive gruppering er det vist fire påfølgende tidsrammer 130a til 130d i et opprinnelig signal, der hver av rammene omfatter en mengde av fem spektralparametere 132a til 132e.
I samsvar med foreliggende oppfinnelse vil spektralparametrene for to påfølgende rammer være gruppert enten i frekvens, slik som illustrert ved tuplene 134a og 134b, eller i tid, slik som illustrert ved tuplene 136a og 136b, for å danne sekvensene av tupler. Grupperingen i tid vil gi en første sekvens av tupler 138, mens grupperingen i frekvens vil gi den andre sekvens av tupler 140.
Sekvensene av tupler 138 og 140 kodes ved anvendelse av f.eks. en Huffmankodebok, noe som vil gi to forskjellige sekvenser av kodeord 142 og 144. I samsvar med foreliggende oppfinnelse vil den sekvensen av kodeord som krever færrest antall bits til slutt bli sendt til en dekoder, som i tillegg må motta en sekvensindikasjon som signalerer om en tidsgruppering eller en frekvensgruppering er grunnlag for sekvensen av kodeord. Som vist i fig. 2 kan sekvensindikasjonen for det angitte eksempel av en adaptiv gruppering av par av parametere (todimensjonal) bare bestå av et enkelt bit.
Fig. 3 viser noen alternative grupperingsstrategier som kan anvendes for å implementere den oppfinneriske, adaptive gruppering, der Huffman-koder med dimensjoner større enn 2 tillates.
Fig. 3 viser en grupperingsstrategi for en todimensjonal Huffman-kode 146a, for en tredimensjonal Huffman-kode 146b og for en firedimensjonal Huffman-kode 146c. For hver av strategiene er det illustrert to påfølgende tidsrammer, der parametrene som tilhører det samme tuppel er representert ved de samme, store bokstaver.
I tilfellet av en todimensjonal Huffman-kode foretas grupperingen slik som allerede illustrert i forbindelse med fig. 2, der det dannes todimensjonale tupler i frekvens 108a og i tid 108b. Når det dannes tupler som består av tre parametere vil frekvenstuplene 58a være slik at tre tilgrensende frekvensparametere i en ramme grupperes sammen for å danne et tuppel. Tidstuplene 150b kan dannes slik at to tilgrensende parametere fra en ramme kombineres med en parameter fra den andre ramme, slik som vist i fig. 3.
Firedimensjonale, frekvensgrupperte tupler 152a dannes på tilsvarende måte som de andre frekvenstuplene ved å gruppere fire tilgrensende parametere fra en ramme i et tuppel. Tidsgrupperingstuplene 152b dannes slik at to tilgrensende parametere fra en ramme kombineres med to tilgrensende parametere fra den andre ramme, der parameterparene fra hver av rammen vil beskrive den samme spektralegenskap for de to påfølgende tidsrammer.
Ved å tillate forskjellige grupperingsskjemaer slik som illustrert i fig. 3 kan bitraten for sideinformasjonen i vesentlig grad reduseres, slik at dersom det f.eks. anvendes mange forskjellige, forhåndsdefinerte Huffman-kodebøker med forskjellige dimensjoner vil dimensjonen for grupperingen kunne varieres under kodingsprosessen, slik at den representasjonen som gir den laveste bitrate til enhver tid kan anvendes under kodingsprosessen.
Fig. 4 viser hvordan en oppfinnerisk komprimeringsenhet, som i tillegg omfatter en differensiell koder, kan anvendes for ytterligere å redusere sideinformasjonen, ved å anvende en differensiell koding før Huffmankodingsprosessen.
For å illustrere den differensielle koding i tid og frekvens, eller i både tid og frekvens, vil den samme absolutte representasjon av parametere 160 allerede vist i fig.
2 bli anvendt som grunnlag for de forskjellige, differensielle kodingstrinn. Den første mulighet er å differensielt kode parametrene i den absolutte representasjon 160 i frekvens, hvilket vil resultere i de differensielt kodede parametere 162. For å differensielt kode den absolutte representasjon 160 vil den første parameter i hver ramme forbli uendret, slik som vist i fig. 4, mens den andre parameter erstattes av differansen mellom den andre parameter og den første parameter i den absolutte representasjon 160. De andre parametere i den differensielt kodede representasjon dannes ved å benytte samme regel.
En annen mulighet er den differensielle koding i tid, noe som vil gi representasjonen 164. Denne representasjon dannes ved å la hele første ramme forbli uendret, mens parametrene i de påfølgende rammer erstattes av differansen mellom parameteren i den absolutte representasjon og den samme parameter i den foregående ramme, slik som vist i fig. 4.
En tredje mulighet er å først kode differensielt i frekvens etterfulgt av en differensiell koding i tid, eller omvendt, der begge vil gi den samme kodede representasjon 166 som differensielt kodes i tid og frekvens.
Det skal bemerkes at de fire forskjellige representasjonene av det opprinnelige signal kan anvendes ved den adaptive gruppering. Når de forskjellige representasjonene 160 til 166 for det angitte eksempel på parametere betraktes kan det klart ses hvordan den differensielle koding påvirker den sendte rate av sideinformasjon. Når den absolutte representasjon 160 betraktes vil det ses at verken en gruppering i tid eller i frekvens vil gi tupler med samme innhold. Derfor vil en Huffman-kodebok som tildeler de tuplene som forekommer oftest de korteste kodeordene ikke være konstruktiv.
Dette vil være forskjellig for representasjonen 162 kodet differensielt i frekvens, der det kan konstrueres en Huffman-kodebok som bare vil trenge fire elementer for å dekke hele representasjonen, og der enten tuppelet (1, 1) eller tuppelet (2, 2) ville bli tildelt kodeordet med den minste lengde, for å oppnå en kompakt sideinformasjon.
Denne fordel er mindre opplagt for representasjonen 164 som kodes differensielt i tid. Ved å gruppere i frekvens og benytte tuplene (5, 5) og (10, 10) vil det ikke desto mindre også her oppnås fordeler.
For representasjonen 166 som kodes differensielt i både tid og frekvens ville det til og med kunne oppnås en ytterligere reduksjon av bit-raten for sideinformasjonen i forhold til representasjonen 162, siden en gruppering i tid ville resultere i en høyere multiplisitet for tuppelet (1, 0), slik som angitt i figuren, for dermed å tillate konstruksjon av en Huffman-kodebok som ville tildele det korteste kodeord til det foregående tuppel.
Som klart kan ses i fig. 4 vil den høye fleksibilitet for det oppfinneriske konsept som anvender adaptiv gruppering og differensiell koding tillate valg av den strategi som passer det opprinnelige audiosignal best, for således å tillate at bit-raten for sideinformasjonen holdes lav.
Kort sagt vil de kvantiserte parameterverdier i en foretrukket utførelsesform først bli differensielt kodet over tid (variant 1) og differensielt over frekvens (variant 2). De resulterende parametere kan så grupperes adaptivt over tid (variant a) og frekvens (variant b). Følgelig vil fire kombinasjoner være tilgjengelige (1a, 1b, 2a, 2b), fra hvilke den beste velges og signaleres til dekoderen. Dette kan gjøres gjennom bare en 2-bit-informasjon for representasjonen av variantene 1a, 1b, 2a og 2b, f.eks. bitkombinasjonen 00, 01, 10 og 11.
Fig. 5 viser en dekoder i samsvar med foreliggende oppfinnelse for dekoding av kodede blokker av parametere, der en blokk av parametere vil omfatte en første ramme med et første sett av spektralparametere og en andre ramme med et andre sett av spektralparametere.
Dekoderen 200 omfatter en dekomprimeringsenhet 202 og en rammedanningsenhet 204. Dekomprimeringsenheten vil i en inngang motta en kodet blokk av parametere 206. Dekomprimeringsenheten vil ved anvendelse av en dekodingsregel fremskaffe en sekvens av tupler av parametere 208 fra den kodede blokk av parametere 206. Denne sekvens av tupler av parametere 208 avgis til rammedanningsenheten 204.
Rammedanningsenheten vil i tillegg motta en sekvensindikasjon 210 som vil indikere hvilken sekvens av tupler som er blitt benyttet av koderen for å danne den kodede blokk av parametere.
Rammedanningsenheten 204 vil så omorganisere sekvensen av tupler 208 styrt av sekvensindikasjonen 210, for å rekonstruere den første ramme 112a og den andre ramme 112b fra sekvensen av tupler av parametere 208.
Foretrukkede utførelsesformer av foreliggende oppfinnelse beskrevet ovenfor vil oppnå en ytterligere forbedring av kodingseffektiviteten ved å innføre en adaptiv gruppering av verdier som skal kodes ved anvendelse av en flerdimensjonal Huffmankode. F.eks. kan det utføres både en todimensjonal gruppering av verdier over frekvens og en todimensjonal gruppering av verdier over tid. Kodingsskjemaet ville da utføre begge kodingstyper, og så velge den mest fordelaktige (dvs. den varianten som krever færrest bits). Dette valg signaleres til dekoderen gjennom sideinformasjonen.
Ifølge ytterligere eksempler illustrert i fig. 3 vil det også være mulig å danne Huffman-koder av høyere dimensjoner, ved å anvende forskjellige grupperingsstrategier for å danne tupplene. De gitte eksempler viser grupperingsstrategier som danner tuplene ved å bare gruppere sammen parametere fra to påfølgende rammer. Det vil også være mulig å utføre grupperingen ved å benytte parametere fra tre eller flere påfølgende rammer, der grupperingen da utføres på en direkte måte.
Ved en modifikasjon av den oppfinneriske koder vil det også være mulig å kombinere den differensielle gruppering og de differensielle kodingsstrategier ved å anvende forskjellige Huffman-kodebøker, for å fremskaffe den kortest mulig representasjon av sideinformasjonen. Dette ville kunne ytterligere redusere bit-raten for sideinformasjonen for et kodet audiosignal på bekostning av ytterligere sideinformasjonsparametere for signalering av Huffman-kodeboken benyttet for kodingen.
De beskrevne, foretrukkede utførelsesformer av foreliggende oppfinnelse viser det oppfinneriske konsept for eksempelet der grupperingsstrategien ikke vil endre seg under to påfølgende tidsrammer. Ved en modifikasjon av foreliggende oppfinnelse vil det selvsagt også være mulig å gjennomføre flere endringer for grupperingen i tid og i frekvens innenfor en mengde som omfatter to rammer, hvilket kunne medføre at også en sekvensindikasjon ville være innført i disse rammene, for således å kunne signalere endringen i grupperingsstrategi.
I de gitte eksempler kodes parametrene differensielt før de Huffman-kodes. Enhver annen tapsfri kodingsregel ville selvsagt også være mulig før Huffmankodingen av parametrene, da formålet med denne kodingen er å fremskaffe så mange tupler som mulig med det samme innhold.
I fig. 4 er det angitt fire forskjellige muligheter for parameterrepresentasjoner, nemlig den absolutte representasjon, den differensielle representasjon i frekvens, den differensielle representasjon i tid og den differensielle representasjon i tid og frekvens. For å kunne velge mellom disse fire representasjoner må sideinformasjonen som signalerer hvilken representasjon som er blitt benyttet ha en størrelse på minst 2 bit, slik som indikert i fig. 4. For å balansere en mulig effektivitetsgevinst for kodingen i forhold til den ytterligere spektralrepresentasjonsindikasjon kunne det selvsagt også avgjøres å prinsipielt bare tillate to mulige representasjoner for således å redusere spektralrepresentasjonsindikasjonen til en lengde av et enkelt bit.
Som et eksempel på en oppfinnerisk dekoder viser fig. 5 en dekoder 200 som i tillegg til den kodede blokk av parametere 206 også mottar noe sideinformasjon. Sideinformasjonen som styrer rammedanningsenheten 204 vil i det gitte eksempel bare omfatte en sekvensindikasjon 210. En dekoder i samsvar med foreliggende oppfinnelse kan selvsagt prosessere en hvilken som helst annen type sideinformasjon som måtte være nødvendig, mer spesielt en spektralrepresentasjonsindikasjon som ville indikere spektralrepresentasjonen som er blitt benyttet for å kode de opprinnelige rammer.
Avhengig av de gitte implementeringskrav for de oppfinneriske fremgangsmåter kan disse implementeres i maskinvare eller i programvare. Implementeringen kan gjennomføres ved å benytte et digitalt lagringsmedium, mer spesifikt en disk, en DVD eller en CD der elektronisk lesbare styresignaler vil være lagret, som ville samvirke med et programmerbart datamaskinsystem slik at de oppfinneriske fremgangsmåter kan gjennomføres. Foreliggende oppfinnelse vil derfor generelt være et datamaskinprodukt med en programkode lagret i en maskinlesbar bærer, der programkoden er funksjonsdyktig til å utføre de oppfinneriske fremgangsmåter når datamaskinprogramproduktet kjøres i en datamaskin. De oppfinneriske fremgangsmåter vil derfor med andre ord være et datamaskinprogram med en programkode for utførelse av i det minste en av de oppfinneriske fremgangsmåter når datamaskinprogrammet kjøres i en datamaskin.
Selv om det foregående er blitt spesifikt vist og beskrevet med referanse til spesifikke utførelsesformer vil fagmenn på området forstå at forskjellige andre endringer i form og detaljer kan utføres uten at ånden og omfanget av disse forlates. Det skal forstås at forskjellige endringer kan foretas ved tilpasning til forskjellige utførelsesformer uten at de generelle konsepter som her er utlagt og som vil være omfattet av de følgende patentkrav forlates.
Claims (34)
1. Komprimeringsenhet for komprimering av parametere, karakterisert ved at parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, og der den andre del er tilgrensende den første del, og hvor komprimeringsenheten omfatter en forsyningsenhet for forsyning av et første tuppel og et andre tuppel med lik lengde, der hvert tuppel omfatter i det minste to parametere, det første tuppel omfatter to parametere fra det første sett av parametere og det andre tuppel omfatter en parameter fra det første sett av parametere og en parameter fra det andre sett av parametere, der det første tuppel bare omfatter parametere fra det første sett av parametere; en bit-estimerer for estimering av antallet bits som ville være nødvendig for å kode settene av parametere ved anvendelse av en første sekvens av tupler omfattende det første tuppel, og for å kode settene av parametere ved anvendelse av en andre sekvens av tupler omfattende det andre tuppel, basert på en kodingsregel; og en tilveiebringelsesenhet for tilveiebringelse av kodede blokker, der tilveiebringelsesenheten er funksjonsdyktig til å tilveiebringe de kodede blokker som benytter den sekvens av tupler som gir det laveste antall bits, og for å tilveiebringe en sekvensindikasjon som vil indikere sekvensen av tupler fra hvilken de kodede blokker er fremskaffet.
2. Komprimeringsenhet ifølge krav 1, karakterisert ved at det første og det andre sett av parametere omfatter en spektralrepresentasjon av den første og den andre del av det opprinnelige signal som representasjon.
3. Komprimeringsenhet ifølge krav 1, karakterisert ved at den første del og den andre del av det opprinnelige signal er tilgrensende i tid eller i rom.
4. Komprimeringsenhet ifølge krav 1, karakterisert ved at det første sett av parametere omfatter en representasjon av en første ramme av et opprinnelige audioeller video-signal, og at det andre sett av parametere omfatter en representasjon av en andre ramme av det opprinnelige audio- eller video-signal.
5. Komprimeringsenhet ifølge krav 1, karakterisert ved at forsyningsenheten er funksjonsdyktig til å forsyne det første tuppel og alle gjenværende tupler i den første sekvens av tupler ved å bare benytte tupler med parametere fra et enkelt sett av parametere, og til å forsyne det første tuppel og alle gjenværende tupler i den andre sekvens av tupler ved å bare benytte tupler med i det minste én parameter fra det første sett av parametere og i det minste én parameter fra det andre sett av parametere; og der tilveiebringelsesenheten er funksjonsdyktig til å tilveiebringe en enkelt sekvensindikasjon for én kodet blokk.
6. Komprimeringsenhet ifølge krav 1, karakterisert ved at forsyningsenheten er funksjonsdyktig til å forsyne det første tuppel bestående av to parametere fra et enkelt sett av parametere, der de to parametere vil være tilgrensende parametere i representasjonen av det opprinnelige signal; og der det andre tuppel består av en første parameter fra det første sett av parametere og en andre parameter fra det andre sett av parametere, der den første og den andre parameter beskriver en identisk egenskap for det opprinnelige signal i representasjonen.
7. Komprimeringsenhet ifølge krav 1, karakterisert ved at forsyningsenheten er funksjonsdyktig til å forsyne det første tuppel bestående av et heltallmultippel av to parametere fra et enkelt sett av parametere, der parametrene vil være tilgrensende parametere i representasjonen av det opprinnelige signal; og der det andre tuppel består av to eller flere parametere fra det første sett av parametere, der parametrene vil være tilgrensende i representasjonen av det opprinnelige signal og av det samme antall av parametere fra det andre sett av parametere, der parametrene vil være tilgrensende i representasjonen av det opprinnelige signal, og der parametrene fra det første og det andre sett av parametere beskriver en identisk egenskap for det opprinnelige signal i representasjonen.
8. Komprimeringsenhet ifølge krav 1, karakterisert ved at forsyningsenheten er funksjonsdyktig til å forsyne det første tuppel bestående av et odde antall tilgrensende parametere i representasjonen av det opprinnelige signal fra ett sett av parametere; og det andre tuppel omfatter et flertall av tilgrensende parametere i representasjonen av det opprinnelige signal fra et sett av parametere, og av et av et mindretall av tilgrensende parametere i representasjonen av det opprinnelige signal fra det andre sett av parametere, der flertallet av parametere er vekselvis tatt fra det første og det andre sett av parametere for konsekutive tupler av den andre sekvens av tupler.
9. Komprimeringsenhet ifølge krav 1, karakterisert ved at bit-estimereren er funksjonsdyktig til å kode, ved å benytte kodingsregelen, den første sekvens av tupler for å fremskaffe en første kodet blokk, og til å kode den andre sekvens av tupler for å fremskaffe en andre kodet blokk, og til å estimere det nødvendige antall bits ved å telle bits i den første og den andre kodede blokk; og ved at tilveiebringelsesenheten er funksjonsdyktig til å videresende den første eller den andre kodede blokk, der blokken med færrest antall bits velges.
10. Komprimeringsenhet ifølge krav 1, karakterisert ved at bit-estimereren er funksjonsdyktig til å estimere antall bits som vil være nødvendig for å kode sekvensene av tupler i samsvar med kodingsregelen; og der tilveiebringelsesenheten er funksjonsdyktig til å kode sekvensen av tupler ved å tilveiebringe den kodede blokk med det laveste antall bits.
11. Komprimeringsenhet ifølge krav 1, karakterisert ved at settene av parametere omfatter en parametrisk representasjon av et videosignal eller av et audiosignal.
12. Komprimeringsenhet ifølge krav 1, karakterisert ved at kodingsregelen er slik at kodingstuplene med samme lengde men forskjellige parametere kan resultere i kodeord med forskjellig lengde.
13. Komprimeringsenhet ifølge krav 1, karakterisert ved at parametrene omfatter BCC-parametere som beskriver en romlig sammenheng mellom en første og en andre opprinnelige audiokanal, og der BCC-parametrene velges fra følgende liste av BCC-parametere:
interkanal koherens/korrelasjon (ICC),
interkanalnivådifferanse (ICLD),
interkanaltidsdifferanse (ICTD), og
interkanalfasedifferanse (IPD).
14. Komprimeringsenhet ifølge krav 1, karakterisert ved at den videre omfatter en differensiell koder for prosessering av det opprinnelige signal slik at det første sett av parametere og det andre sett av parametere omfatter en differensiell representasjon, der differansen vil være en differanse i tid, i frekvens eller i både tid og i frekvens.
15. Komprimeringsenhet ifølge krav 14, karakterisert ved at forsyningsenheten er funksjonsdyktig til å forsyne en første gruppe av tupler og en andre gruppe av tupler, der tuplene i gruppene av tupler omfatter parametere fra en av de følgende representasjoner, en differensiell representasjon i tid, en differensiell representasjon i frekvens, en differensiell representasjon i tid og i frekvens, og en absolutt representasjon, der den første gruppe av tupler omfatter tupler med to parametere fra det første sett av parametere, og der den andre gruppe av tupler omfatter én parameter fra det første og én parameter fra det andre sett av parametere; og der bitestimereren er funksjonsdyktig til å estimere antallet bits som vil være nødvendig for å kode sekvenser av tupler for i det minste åtte sekvenser av tupler, der hver sekvens omfatter ett av tuplene i gruppene av tupler; og der tilveiebringelsesenheten er funksjonsdyktig til å i tillegg til sekvensindikasjonen, kunne signalere en kodet representasjonsindikasjon som vil indikere representasjonen som gir det laveste antall bits.
16. Komprimeringsenhet ifølge krav 15, karakterisert ved at tilveiebringelsesenheten er funksjonsdyktig til å signalere sekvensindikasjonen og den kodede representasjonsindikasjon ved å benytte et binært dataord med i det minste tre bits.
17. Komprimeringsenhet ifølge krav 1, karakterisert ved at kodingsregelen er slik at hvert tuppel er tilordnet et enkelt kodeord fra en gruppe av forskjellige kodeord.
18. Komprimeringsenhet ifølge krav 1, karakterisert ved at kodingsregelen omfatter en Huffman-kodebok.
19. Dekoder for dekoding av kodede blokker av parametere, karakterisert ved at parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del, og for prosessering av en sekvensindikasjon, omfatter: en dekomprimeringsenhet, der dekomprimeringsenheten er funksjonsdyktig til å dekomprimere ved anvendelse av en dekodingsregel som vil avhenge av en kodingsregel benyttet for koding av sekvenser av tupler, en kodet blokk av parametere for å fremskaffe en sekvens av tupler av parametere, der hvert tuppel vil ha samme lengde og i det minste to parametere; og en rammedanningsenhet for mottak av sekvensindikasjonen, der sekvensindikasjonen vil indikere en benyttet sekvens av tupler fra et antall av forskjellige sekvenser underliggende den kodede blokk, og for danning av settene av parametere ved anvendelse av informasjonen om den benyttede sekvens av tupler.
20. Dekoder ifølge krav 19, karakterisert ved at det første og det andre sett av parametere omfatter en spektralrepresentasjon av den første og den andre del av det opprinnelige signal som representasjon.
21. Dekoder ifølge krav 19, karakterisert ved at den første del og den andre del av det opprinnelige signal er tilgrensende i tid eller i rom.
22. Dekoder ifølge krav 19, karakterisert ved at det første sett av parametere omfatter en representasjon av en første ramme av et opprinnelig audio- eller videosignal, og at det andre sett av parametere omfatter en representasjon av en andre ramme av det opprinnelige audio- eller video-signal.
23. Dekoder ifølge krav 19, karakterisert ved at rammedanningsenheten er funksjonsdyktig til å motta en enkelt sekvensindikasjon for en kodet blokk av parametere, og til å danne settene av parametrene ved å benytte en sekvens av tupler som omfatter kun tupler av den type som indikeres gjennom sekvensindikasjonen.
24. Dekoder ifølge krav 19, karakterisert ved at rammedanningsenheten er funksjonsdyktig til å danne sett av parametere omfattende en parametrisk representasjon av et videosignal eller et audiosignal.
25. Dekoder ifølge krav 19, karakterisert ved at rammedanningsenheten er funksjonsdyktig til å danne sett av parametere omfattende BCC-parametere som beskriver en romlig sammenheng mellom en første og en andre audiokanal, og der BCC-parametrene velges fra følgende liste av BCC-parametere,
interkanal-koherens/korrelasjon (ICC),
interkanal-nivådifferanse (ICLD),
interkanal-tidsdifferanse (ICTD), og
interkanal-fasedifferanse (IPD).
26. Dekoder ifølge krav 19, karakterisert ved at den videre omfatter en differensiell dekoder for mottak av en representasjonsindikasjon, og for prosessering av settene av parametere slik at parametrene fremskaffes fra en differensiell spektralrepresentasjon, der differansen vil være en differanse i tid, i frekvens eller i tid og i frekvens, der den differensielle dekoder er funksjonsdyktig til å prosessere det første og det andre sett av parametere avhengig av representasjonsindikasjonen.
27. Dekoder ifølge krav 26, karakterisert ved at rammedanningsenheten og den differensielle dekoder er funksjonsdyktig til å motta en sekvensindikasjon og en representasjonsindikasjon som et binært dataord med minst tre bits.
28. Dekoder ifølge krav 19, karakterisert ved at dekodingsregelen er slik at hvert kodeord i den kodede blokk av parametere vil ha tilordnet et enkelt tuppel fra en gruppe av forskjellige tupler.
29. Fremgangsmåte for komprimering av parametere, karakterisert ved at parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del, hvor fremgangsmåten omfatter å forsyne et første tuppel og et andre tuppel med lik lengde, der hvert tuppel omfatter i det minste to parametere, der det første tuppel omfatter to parametere fra det første sett av parametere og det andre tuppel omfatter en parameter fra det første sett av parametere og en parameter fra det andre sett av parametere, og der det første tuppel bare omfatter parametere fra det første sett av parametere; å estimere antall bits som vil være nødvendig for å kode settene av parametere ved anvendelse av en første sekvens av tupler omfattende det første tuppel, og til å kode rammene ved anvendelse av en andre sekvens av tupler omfattende det andre tuppel, basert på en kodingsregel; å tilveiebringe kodede blokker ved å anvende den sekvens av tupler som gir det laveste antall bits; og å tilveiebringe en sekvensindikasjon som vil indikere sekvensen av tupler fra hvilken de kodede blokker er fremskaffet.
30. Fremgangsmåte for dekoding av kodede blokker av parametere, karakterisert ved at parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del, og for prosessering av en sekvensindikasjon, hvor fremgangsmåten omfatter å dekomprimere, ved anvendelse av en dekodingsregel som vil avhenge av en kodingsregel benyttet for koding av sekvenser av tupler, den kodede blokk av parametere for å fremskaffe en sekvens av tupler av parametere, der hvert tuppel vil ha samme lengde og minst to parametere; å motta sekvensindikasjonen som vil indikere en benyttet sekvens av tupler fra et antall av forskjellige sekvenser underliggende den kodede blokk; og å danne settene av parametere ved anvendelse av informasjonen om den benyttede sekvens av tupler.
31. Datamaskinprogram som, når det kjøres i en datamaskin, vil ha en programkode for utførelse av en fremgangsmåte for komprimering av parametere, karakterisert ved at parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del, hvor fremgangsmåten omfatter å forsyne et første tuppel og et andre tuppel med samme lengde, hvor hvert tuppel omfatter minst to parametere, det første tuppel omfatter to parametere fra det første sett av parametere og det andre tuppel omfatter en parameter fra det første sett av parametere og en parameter fra det andre sett av parametere, der det første tuppel bare vil omfatte parametere fra det første sett av parametere; å estimere antallet bits som vil være nødvendig for å kode settene av parametere ved anvendelse av en første sekvens av tupler omfattende det første tuppel, og å kode rammene ved anvendelse av en andre sekvens av tupler omfattende det andre tuppel, basert på en kodingsregel; å tilveiebringe kodede blokker ved anvendelse av den sekvens av tupler som gir det laveste antall bits; og å tilveiebringe en sekvensindikasjon som vil indikere sekvensen av tupler fra hvilken de kodede blokker er fremskaffet.
32. Datamaskinprogram som, når det kjøres i en datamaskin, vil ha en programkode for utførelse av en fremgangsmåte for dekoding av kodede blokker av parametere, karakterisert ved at parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del, og for prosessering av en sekvensindikasjon, hvor fremgangsmåten omfatter å dekomprimere, ved anvendelse av en dekodingsregel som vil avhenge av en kodingsregel benyttet for koding av sekvenser av tupler, den kodede blokk av parametere for å fremskaffe en sekvens av tupler av parametere, der hvert tuppel har samme lengde og i det minste to parametere; å motta sekvensindikasjonen, der sekvensindikasjonen vil indikere en benyttet sekvens av tupler fra et antall av forskjellige sekvenser underliggende den kodede blokk; og å danne settene av parametere ved anvendelse av informasjon om den benyttede sekvens av tupler.
33. Komprimert representasjon av parametere, karakterisert ved at parametrene omfatter et første sett av parametere omfattende en representasjon av en første del av et opprinnelig signal, der parametrene videre omfatter et andre sett av parametere omfattende en representasjon av en andre del av det opprinnelige signal, der den andre del vil være tilgrensende den første del i det opprinnelige signal, omfattende en kodet blokk av parametere som representerer en benyttet sekvens av tupler med samme lengde; og en sekvensindikasjon som vil indikere den benyttede sekvens av tupler av en første eller en andre sekvens underliggende den kodede blokk av parametere, hvor den første sekvens omfatter et første tuppel med to parametere fra det første sett av parametere, og hvor den andre sekvens omfatter et andre tuppel med én parameter fra det første sett av parametere og én parameter fra det andre sett av parametere, der det første tuppel bare omfatter parametere fra det første sett av parametere.
34. Komprimert representasjon av parametere ifølge krav 33, karakterisert ved at den er lagret i et datamaskinlesbart medium.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67099305P | 2005-04-13 | 2005-04-13 | |
US11/243,915 US7991610B2 (en) | 2005-04-13 | 2005-10-05 | Adaptive grouping of parameters for enhanced coding efficiency |
PCT/EP2006/001295 WO2006108464A1 (en) | 2005-04-13 | 2006-02-13 | Adaptive grouping of parameters for enhanced coding efficiency |
Publications (2)
Publication Number | Publication Date |
---|---|
NO20075796L NO20075796L (no) | 2008-01-03 |
NO343207B1 true NO343207B1 (no) | 2018-12-03 |
Family
ID=36581385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20075796A NO343207B1 (no) | 2005-04-13 | 2007-11-12 | Adaptiv gruppering av parametere for forbedret kodingseffektivitet |
Country Status (18)
Country | Link |
---|---|
US (2) | US7991610B2 (no) |
EP (2) | EP1869774B1 (no) |
JP (1) | JP5027799B2 (no) |
KR (1) | KR100954181B1 (no) |
CN (1) | CN101160726B (no) |
AU (1) | AU2006233512C1 (no) |
BR (3) | BR122019014628B1 (no) |
CA (1) | CA2607460C (no) |
ES (1) | ES2739531T3 (no) |
IL (1) | IL186315A (no) |
MX (1) | MX2007012663A (no) |
MY (1) | MY141958A (no) |
NO (1) | NO343207B1 (no) |
PL (1) | PL1869774T3 (no) |
PT (1) | PT1869774T (no) |
RU (1) | RU2368074C2 (no) |
TW (1) | TWI321316B (no) |
WO (1) | WO2006108464A1 (no) |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8170883B2 (en) | 2005-05-26 | 2012-05-01 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
US8494667B2 (en) | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
CA2613731C (en) | 2005-06-30 | 2012-09-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
EP1908057B1 (en) | 2005-06-30 | 2012-06-20 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
ATE455348T1 (de) | 2005-08-30 | 2010-01-15 | Lg Electronics Inc | Vorrichtung und verfahren zur dekodierung eines audiosignals |
JP4859925B2 (ja) | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
JP4568363B2 (ja) | 2005-08-30 | 2010-10-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US7788107B2 (en) | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
US7646319B2 (en) | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR100878833B1 (ko) | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7672379B2 (en) | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
CN101283249B (zh) | 2005-10-05 | 2013-12-04 | Lg电子株式会社 | 信号处理的方法和装置以及编码和解码方法及其装置 |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7653533B2 (en) | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US7752053B2 (en) | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
US20080004729A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Direct encoding into a directional audio coding format |
JP5337941B2 (ja) * | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
SG175632A1 (en) * | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US9760677B2 (en) | 2009-04-29 | 2017-09-12 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
US9171344B2 (en) | 2007-10-30 | 2015-10-27 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
US8065166B2 (en) | 2007-10-30 | 2011-11-22 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
CN101960865A (zh) * | 2008-03-03 | 2011-01-26 | 诺基亚公司 | 用于捕获和呈现多个音频声道的装置 |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
FI3573056T3 (fi) * | 2008-07-11 | 2022-11-30 | Audiokooderi ja audiodekooderi | |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN102656628B (zh) * | 2009-10-15 | 2014-08-13 | 法国电信公司 | 优化的低吞吐量参数编码/解码 |
BR122021008583B1 (pt) * | 2010-01-12 | 2022-03-22 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo |
JP2013005204A (ja) * | 2011-06-16 | 2013-01-07 | Sony Corp | ビデオ送信装置、ビデオ受信装置、およびビデオ送信方法 |
US8669889B2 (en) | 2011-07-21 | 2014-03-11 | International Business Machines Corporation | Using variable length code tables to compress an input data stream to a compressed output data stream |
US8400335B2 (en) | 2011-07-21 | 2013-03-19 | International Business Machines Corporation | Using variable length code tables to compress an input data stream to a compressed output data stream |
US8692696B2 (en) | 2012-01-03 | 2014-04-08 | International Business Machines Corporation | Generating a code alphabet of symbols to generate codewords for words used with a program |
US9743116B2 (en) | 2012-01-19 | 2017-08-22 | Huawei Technologies Co., Ltd. | High throughput coding for CABAC in HEVC |
US9654139B2 (en) | 2012-01-19 | 2017-05-16 | Huawei Technologies Co., Ltd. | High throughput binarization (HTB) method for CABAC in HEVC |
US10616581B2 (en) | 2012-01-19 | 2020-04-07 | Huawei Technologies Co., Ltd. | Modified coding for a transform skipped block for CABAC in HEVC |
US8581753B2 (en) | 2012-01-19 | 2013-11-12 | Sharp Laboratories Of America, Inc. | Lossless coding technique for CABAC in HEVC |
US20130188736A1 (en) | 2012-01-19 | 2013-07-25 | Sharp Laboratories Of America, Inc. | High throughput significance map processing for cabac in hevc |
US8552890B2 (en) * | 2012-01-19 | 2013-10-08 | Sharp Laboratories Of America, Inc. | Lossless coding with different parameter selection technique for CABAC in HEVC |
US9860527B2 (en) | 2012-01-19 | 2018-01-02 | Huawei Technologies Co., Ltd. | High throughput residual coding for a transform skipped block for CABAC in HEVC |
EP2888882A4 (en) * | 2012-08-21 | 2016-07-27 | Emc Corp | LOSS-FREE COMPRESSION OF FRAGMENTED IMAGE DATA |
US9659569B2 (en) | 2013-04-26 | 2017-05-23 | Nokia Technologies Oy | Audio signal encoder |
CN105474308A (zh) * | 2013-05-28 | 2016-04-06 | 诺基亚技术有限公司 | 音频信号编码器 |
CN105659320B (zh) * | 2013-10-21 | 2019-07-12 | 杜比国际公司 | 音频编码器和解码器 |
KR101841380B1 (ko) | 2014-01-13 | 2018-03-22 | 노키아 테크놀로지스 오와이 | 다중-채널 오디오 신호 분류기 |
SG11201607940WA (en) * | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
GB2567427B (en) | 2017-10-06 | 2020-10-07 | Imagination Tech Ltd | Data compression |
GB2576769A (en) | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
GB2585187A (en) * | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
EP4018584A4 (en) * | 2019-08-23 | 2023-05-03 | Lenovo (Beijing) Limited | METHOD AND APPARATUS FOR DETERMINING A HARQ-ACK CODEBOOK |
WO2022129672A1 (en) * | 2020-12-15 | 2022-06-23 | Nokia Technologies Oy | Quantizing spatial audio parameters |
GB2624874A (en) * | 2022-11-29 | 2024-06-05 | Nokia Technologies Oy | Parametric spatial audio encoding |
CN115865099B (zh) * | 2022-12-01 | 2024-04-16 | 河南大学 | 基于霍夫曼编码的多类型数据分段压缩方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5225904A (en) * | 1987-10-05 | 1993-07-06 | Intel Corporation | Adaptive digital video compression system |
US5528628A (en) * | 1994-11-26 | 1996-06-18 | Samsung Electronics Co., Ltd. | Apparatus for variable-length coding and variable-length-decoding using a plurality of Huffman coding tables |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63284974A (ja) | 1987-05-15 | 1988-11-22 | Matsushita Electric Works Ltd | 画像圧縮方式 |
SU1711331A1 (ru) | 1987-05-28 | 1992-02-07 | Всесоюзный научно-исследовательский институт радиовещательного приема и акустики им.А.С.Попова | Устройство кодировани и декодировани сигналов звукового вещани |
US5532694A (en) * | 1989-01-13 | 1996-07-02 | Stac Electronics, Inc. | Data compression apparatus and method using matching string searching and Huffman encoding |
JPH0773249B2 (ja) | 1989-06-29 | 1995-08-02 | 富士通株式会社 | 音声符号化・復号化伝送方式 |
US5325091A (en) * | 1992-08-13 | 1994-06-28 | Xerox Corporation | Text-compression technique using frequency-ordered array of word-number mappers |
US5550540A (en) * | 1992-11-12 | 1996-08-27 | Internatioal Business Machines Corporation | Distributed coding and prediction by use of contexts |
US5717394A (en) * | 1993-02-10 | 1998-02-10 | Ricoh Company Ltd. | Method and apparatus for encoding and decoding data |
JPH07203441A (ja) | 1993-12-28 | 1995-08-04 | Matsushita Graphic Commun Syst Inc | 符号化装置及び復号化装置 |
US5550541A (en) | 1994-04-01 | 1996-08-27 | Dolby Laboratories Licensing Corporation | Compact source coding tables for encoder/decoder system |
CA2156889C (en) | 1994-09-30 | 1999-11-02 | Edward L. Schwartz | Method and apparatus for encoding and decoding data |
JPH08179794A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | サブバンド符号化方法及び装置 |
US5721720A (en) * | 1994-12-28 | 1998-02-24 | Kabushiki Kaisha Toshiba | Optical recording medium recording pixel data as a compressed unit data block |
US5819215A (en) * | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
CN1158050A (zh) | 1995-12-27 | 1997-08-27 | 汤姆森消费电子有限公司 | 图像数据压缩系统和方法 |
US5870436A (en) | 1997-01-02 | 1999-02-09 | Raytheon Company | Uniform discrete fourier transform filter parameter encoder |
US6237496B1 (en) * | 1997-02-26 | 2001-05-29 | Northrop Grumman Corporation | GPS guided munition |
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
US6064954A (en) * | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
RU2214047C2 (ru) | 1997-11-19 | 2003-10-10 | Самсунг Электроникс Ко., Лтд. | Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов |
US6862278B1 (en) * | 1998-06-18 | 2005-03-01 | Microsoft Corporation | System and method using a packetized encoded bitstream for parallel compression and decompression |
US6166664A (en) * | 1998-08-26 | 2000-12-26 | Intel Corporation | Efficient data structure for entropy encoding used in a DWT-based high performance image compression |
US6546049B1 (en) * | 1998-10-05 | 2003-04-08 | Sarnoff Corporation | Parameterized quantization matrix adaptation for video encoding |
JP2000151413A (ja) * | 1998-11-10 | 2000-05-30 | Matsushita Electric Ind Co Ltd | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 |
US6624761B2 (en) | 1998-12-11 | 2003-09-23 | Realtime Data, Llc | Content independent data compression method and system |
SE9903552D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching |
JP3323175B2 (ja) | 1999-04-20 | 2002-09-09 | 松下電器産業株式会社 | 符号化装置 |
US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
SE9903191D0 (sv) | 1999-09-08 | 1999-09-08 | Pacesetter Ab | Compression and decompression coding scheme and apparatus |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
RU2159507C1 (ru) | 1999-10-29 | 2000-11-20 | Аликов Сергей Владимирович | Узел кодирования и/или декодирования информации, система передачи информации с уплотнением каналов, система передачи информации в телекоммуникационной сети |
JP2001151413A (ja) | 1999-11-29 | 2001-06-05 | Shinkawa Ltd | ワイヤボンダにおけるスプールホルダ構造 |
JP3609323B2 (ja) * | 2000-05-08 | 2005-01-12 | 日本電信電話株式会社 | 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体 |
JP2001339311A (ja) | 2000-05-26 | 2001-12-07 | Yamaha Corp | オーディオ信号圧縮回路および伸長回路 |
US6813438B1 (en) * | 2000-09-06 | 2004-11-02 | International Business Machines Corporation | Method to customize the playback of compact and digital versatile disks |
US6675148B2 (en) * | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
JP4125565B2 (ja) | 2001-08-31 | 2008-07-30 | 松下電器産業株式会社 | 画像符号化方法、画像復号化方法及びその装置 |
US20030081685A1 (en) * | 2001-10-31 | 2003-05-01 | Montgomery Dennis L. | Method and apparatus for determining patterns within adjacent blocks of data |
JP2005510925A (ja) * | 2001-11-30 | 2005-04-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号コード化 |
WO2003053066A1 (en) * | 2001-12-17 | 2003-06-26 | Microsoft Corporation | Skip macroblock coding |
KR101021079B1 (ko) * | 2002-04-22 | 2011-03-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 다채널 오디오 표현 |
US7039204B2 (en) * | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4369140B2 (ja) | 2003-02-17 | 2009-11-18 | パナソニック株式会社 | オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体 |
US7426462B2 (en) * | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
US7617166B2 (en) * | 2004-04-14 | 2009-11-10 | The Boeing Company | Neural network for aeroelastic analysis |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
DE602004028171D1 (de) * | 2004-05-28 | 2010-08-26 | Nokia Corp | Mehrkanalige audio-erweiterung |
DE102004063950B4 (de) * | 2004-08-07 | 2009-02-19 | Tropf, Hermann | Kanalcodiervorrichtung |
US7161507B2 (en) * | 2004-08-20 | 2007-01-09 | 1St Works Corporation | Fast, practically optimal entropy coding |
KR100878833B1 (ko) * | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
FI3573056T3 (fi) * | 2008-07-11 | 2022-11-30 | Audiokooderi ja audiodekooderi |
-
2005
- 2005-10-05 US US11/243,915 patent/US7991610B2/en active Active
-
2006
- 2006-02-13 EP EP06723036.7A patent/EP1869774B1/en active Active
- 2006-02-13 KR KR1020077022723A patent/KR100954181B1/ko active IP Right Grant
- 2006-02-13 PL PL06723036T patent/PL1869774T3/pl unknown
- 2006-02-13 BR BR122019014628-4A patent/BR122019014628B1/pt active IP Right Grant
- 2006-02-13 JP JP2008505744A patent/JP5027799B2/ja active Active
- 2006-02-13 BR BRPI0612356-2A patent/BRPI0612356B1/pt active IP Right Grant
- 2006-02-13 PT PT06723036T patent/PT1869774T/pt unknown
- 2006-02-13 RU RU2007141934/09A patent/RU2368074C2/ru active
- 2006-02-13 EP EP19156694.2A patent/EP3503409B1/en active Active
- 2006-02-13 ES ES06723036T patent/ES2739531T3/es active Active
- 2006-02-13 WO PCT/EP2006/001295 patent/WO2006108464A1/en active Application Filing
- 2006-02-13 CN CN2006800120933A patent/CN101160726B/zh active Active
- 2006-02-13 AU AU2006233512A patent/AU2006233512C1/en active Active
- 2006-02-13 CA CA2607460A patent/CA2607460C/en active Active
- 2006-02-13 BR BR122019014976-3A patent/BR122019014976B1/pt not_active IP Right Cessation
- 2006-02-13 MX MX2007012663A patent/MX2007012663A/es active IP Right Grant
- 2006-02-15 MY MYPI20060645A patent/MY141958A/en unknown
- 2006-04-11 TW TW095112773A patent/TWI321316B/zh active
-
2007
- 2007-09-25 IL IL186315A patent/IL186315A/en active IP Right Grant
- 2007-11-12 NO NO20075796A patent/NO343207B1/no unknown
-
2010
- 2010-11-17 US US12/948,417 patent/US9043200B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5225904A (en) * | 1987-10-05 | 1993-07-06 | Intel Corporation | Adaptive digital video compression system |
US5528628A (en) * | 1994-11-26 | 1996-06-18 | Samsung Electronics Co., Ltd. | Apparatus for variable-length coding and variable-length-decoding using a plurality of Huffman coding tables |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NO343207B1 (no) | Adaptiv gruppering av parametere for forbedret kodingseffektivitet | |
US7788106B2 (en) | Entropy coding with compact codebooks | |
KR100955361B1 (ko) | 적응 잔류 오디오 코딩 | |
CA2604521C (en) | Lossless encoding of information with guaranteed maximum bitrate | |
CA2601821A1 (en) | Planar multiband antenna |