NO334901B1 - Lydfilformatkonvertering - Google Patents
Lydfilformatkonvertering Download PDFInfo
- Publication number
- NO334901B1 NO334901B1 NO20060814A NO20060814A NO334901B1 NO 334901 B1 NO334901 B1 NO 334901B1 NO 20060814 A NO20060814 A NO 20060814A NO 20060814 A NO20060814 A NO 20060814A NO 334901 B1 NO334901 B1 NO 334901B1
- Authority
- NO
- Norway
- Prior art keywords
- audio data
- data
- block
- data stream
- blocks
- Prior art date
Links
- 238000006243 chemical reaction Methods 0.000 title description 10
- 238000000034 method Methods 0.000 claims description 43
- 230000005236 sound signal Effects 0.000 claims description 43
- 238000005070 sampling Methods 0.000 claims description 14
- 230000001427 coherent effect Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Manipuleringen av lyddata kan forenkels, så som f.eks. med henblikk på kombinasjon av individuelle lyddatastrømmer til multikanal-lyddatastrømmer eller generell manipulasjon av en lyddatastrøm, ved å modifisere (56) en datablokk i en lyddatastrøm (10) som er oppdelt i datablokker (10a, lOb) med bestemmelsesblokk (14, 16) og datablokklyddata (18), for eksempel ved komplettering hhv. tilføyelse eller erstatning av en del av den samme, slik at denne omfatter en lengdeangivelse som angir en datamengde henholdsvis en lenge av datablokklyddata eller en datamengde henholdsvis en lengde av datablokken for å oppnå en andre lyddatastrøm med modifiserte datablokker. Alternativt omformes eller konverteres en lyddatastrøm (10) med pekere i bestemmelsesblokker (14, 16) som peker på bestemmelsesblokklyddata som er knyttet til disse bestemmelsesblokker, men er fordelt blant forskjellige datablokker, til en lyddatastrøm, hvor bestemmelsesblokklyddata (44, 46) kombineres til sammenhengende bestemmelsesblokklyddata (48). De sammenhengende bestemmelsesblokklyddata (48) kan da være inneholdt i et selvstendig eller i seg selv lukket kanalelement (52a) sammen med sin bestemmelsesblokk (14,16)
Description
Oppfinnelsens fagområde
Oppfinnelsen angår lyddatastrømmer som koder lydsignaler, og mer spesielt en bedre håndterbarhet av lyddatastrømmer i et filformat hvor lyddataene som er knyttet til et tidsmerke, kan fordeles blant forskjellige datablokker, slik det eksempelvis er tilfelle i MP3-formatet.
Bakgrunn
MPEG-lydkompresjon er en spesielt effektiv måte for å lagre lydsignaler, så som musikk eller lyden for en film, i digital form, samtidig som det på den ene side kreves så lite lagerplass som mulig og lydkvaliteten på den annen side opprettholdes så god som mulig. I løpet av de siste år har MPEG-lydkompresjon vist seg å være en av de mest vellykkede løsninger på dette området.
Imidlertid eksisterer det forskjellige versjoner av MPEG-lydkompresjonsmetoder. Generelt avsøkes eller samples lydsignalet med en viss avsøkingshastighet, idet den resulterende sekvens av lydsampler knyttes til overlappende tidsavsnitt hhv. tidsmerker. Disse tidsmerker tilføres da individuelt til f.eks. en hybrid filterbank bestående av polyfase og en modifisert diskret kosinustransformasjon (MDCT) som undertrykker aliasing effekter. Den egentlige datakompresjon finner sted under kvantisering av MDCT-koeffisientene. De således kvantiserte MDCT-koefifsienter konverteres deretter til en Huffman-kode av Huffman-kodeord som frembringer en ytterligere kompresjon ved å tilknytte kortere kodeord til hyppigere opptredende koeffisienter. Således er MPEG-kompresjonene totalt sett tapsbeheftet, idet de "hørbare" tap imidlertid er begrenset, da psykoakustisk kunnskap er blitt innlemmet på måten med kvantisering av DCT-koeffisientene.
En vidt utbredt MPEG-standard er den såkalte MP3-standard, slik den er beskrevet i ISO/IEC 11172-3 og 13818-3. Denne standard tillater en tilpasning av det informasjonstap som frembringes av kompresjonen, til den bithastighet med hvilken lydinformasjonen skal overføres i sann tid. Også ved andre MPEG-standarder skal overføringen av det komprimerte datasignal kunne skje i en kanal med konstant bithastighet. For å sikre at hørekvaliteten ved den mottakende dekoder forblir tilstrekkelig, også ved lave bithastigheter, sørger MP3-standarden for en MP3-koder som har et såkalt bitreservoar. Dette betyr følgende. På grunn av den faste bithastighet skal MP3-koderen normalt kode hvert tidsmerke inn i en blokk av kodeord som har samme størrelse, og denne blokk kunne da overføres med gitt bithastighet i tidsperioden for tidsperioderepetisjonshastigheten. Dette ville imidlertid ikke ta hensyn til det tilfellet at noen deler av et lydsignal, så som de lyder som følger etter en meget høy lyd i et musikkstykke, krever en mindre nøyaktig kvantisering med konstant kvalitet sammenlignet med andre deler av lydsignalet, så som deler med et stort antall forskjellige instrumenter. En MP3-koder frembringer således ikke et enkelt bitstrømformat der hvor hvert tidsmerke er kodet i en ramme (overføringspulje) med samme rammelengde for alle rammer. En slik i seg selv lukket ramme ville bestå av en ramme-topptekst, sideinformasjon og hoveddata som er knyttet til det tidsmerket som er knyttet til rammen, nemlig de kodede MDCT-koeffisienter, hvor sideinformasjonen er informasjon for dekoderen om hvordan DCT-koeffisientene skal dekodes, f.eks. hvor mange fortløpende DCT-koeffisienter som er null, for å angi hvilke DCT-koeffisienter som er suksessivt inneholdt i hoveddataene. I stedet er det i sideinformasjonen eller i toppteksten inkludert en tilbakepeker (backpointer) som peker på en posisjon i hoveddatastrømmen i en av de foregående rammer. Denne posisjon er begynnelsen av de hoveddata som tilhører det tidsmerket til hvilket rammen er tilknyttet i hvilken den tilsvarende tilbakepeker er inkludert. Tilbakepekeren angir f.eks. det antall biter med hvilke begynnelsen på hoveddataene er forskjøvet i bitstrømmen. Slutten av disse hoveddata kan ligge i en hvilken som helst ramme, avhengig av hvor høy kompresjonstakten for dette tidsmerket er. Lengden av hoveddataene for de enkelte tidsmerker er således ikke lenger konstant. Det antall biter med hvilke en blokk kodes, kan således tilpasses til signalets egenskaper. På samme tid kan en konstant bithastighet oppnås. Denne teknikk kalles "bitreservoar". Generelt er bitreservoaret en buffer av biter som kan benyttes for å tilveiebringe flere biter for koding av en blokk av tidssampler enn hva som generelt ville tillates med den konstante utgangsdatahastighet. Teknikken med bitreservoar tar hensyn til det faktum at noen blokker av lydsampler kan kodes med færre biter enn det som spesifiseres av den konstante overføringshastighet, slik at disse blokker fyller bitreservoaret, mens andre blokker av lydsampler har psykoakustiske egenskaper som ikke tillater en slik høy kompresjon, slik at de tilgjengelige biter egentlig ikke ville være tilstrekkelige for forstyrrelseslav hhv. forstyrrelsesfri dekoding av disse blokker. De nødvendige overskytende biter tas fra bitreservoaret, slik at bitreservoaret tømmes ved slike blokker. Teknikken med bitreservoar er også beskrevet i det ovenfor angitte standard MPEG-lag 3.
Selv om MP3-formatet har fordeler på kodersiden ved tilveiebringelse av tilbakepekerne, finnes det ubestridelige ulemper på dekodersiden. Dersom f.eks. en dekoder mottar en MP3-bitstrøm ikke fra begynnelsen, men med start fra en viss ramme på midten, kan det kodede lydsignal ved det tidsmerket som er knyttet til denne ramme, bare avspilles øyeblikkelig når tilbakepekeren tilfeldigvis er 0, hvilket ville angi at begynnelsen av hoveddatastrømmen til denne ramme tilfeldigvis befinner seg umiddelbart etter toppteksten hhv. sideinformasjonen. Imidlertid er dette normalt ikke tilfelle. Avspilling av lydsignalet ved dette tidsmerket er således ikke mulig når tilbakepekeren for den først mottatte ramme peker på den foregående ramme som imidlertid (ennå) ikke er blitt mottatt. I dette tilfellet kan (nærmest) først den neste ramme avspilles.
Ytterligere problemer opptrer på mottakersiden når man beskjeftiger seg med rammer generelt som er sammenknyttet med hverandre ved hjelp av tilbakepekerne og således ikke er lukket i seg selv. Et ytterligere problem med bitstrømmer med retur-adresser for et bitreservoar er at når forskjellige kanaler for et lydsignal MP3-kodes individuelt, kan hoveddata som tilhører hverandre i de to bitstrømmer, da de er knyttet til det samme tidsmerket, være forskjøvet i forhold til hverandre, og med variabel forskyvning over sekvensen av rammer, slik at en kombinasjon av disse individuelle MP3-strømmer til en multikanal-lyddatastrøm, også her vanskeliggjøres.
Det er dessuten et behov for en enkel mulighet for å frembringe lettvint hånd-terbare MP3-føyelige multikanal-lyddatastrømmer. Multikanal-MP3-lyddatastrømmer ifølge ISO/TEC-standard 13818-3 krever matriseoperasjoner for å gjenvinne inngangs-kanalene fra det overførte kanaler på dekodersiden og anvendelse av flere tilbakepekere, og er således kompliserte å håndtere.
MPEG 1/2 lag 2-lyddatastrømmer svarer til MP3-lyddatastrømmene i sin sam-mensetning av på hverandre følgende rammer og i strukturen og arrangementet av ram-mene, nemlig strukturen med topptekst, sideinformasjon og hoveddatadel, og arrangementet med en kvasistatisk rammeavstand som er avhengig av samplingshastigheten og bithastigheten som er variabel fra ramme til ramme, men de er imidlertid forskjellige fra disse på grunn av mangelen på tilbakepekeren eller bitreservoar under koding. Kodingskostbare og kodingsbillige tidsperioder av lydsignalet kodes med samme rammelengde. De hoveddata som tilhører et tidsmerke, befinner seg i den respektive ramme sammen med den respektive topptekst.
Patentsøknad US2003/0009246A beskriver et system og en metode konvertering av en første lyddatastrøm til en andre lyddatastrøm, hvor den første lyddatastrømmen er oppdelt i datablokker som omfatter en bestemmelsesblokk og datablokklyddata, hvor bestemmelsesblokken inneholder pekere som peker på begynnelse og enden av datablokklyddataene i lyddatastrømmen som er knyttet til en neste datablokk, de blokklyddataene kombineres slik at det oppnås sammenhengende blokklyddata som utgjør en del av den andre lyddatastrømmen, og hvor deler av lyddatastrømmene danner kanelelementer.
Sammendrag
Det er et formål med oppfinnelsen å tilveiebringe fremgangsmåter og anordninger for omforming av en lyddatastrøm til en ytterligere lyddatastrøm eller omvendt, slik at manipuleringen med lyddataene gjøres lettere, f.eks. med hensyn til å kombinere indivi duelle lyddatastrømmer til multikanal-lyddatastrømmer eller håndteringen av en lyddata-strøm generelt.
Dette formål oppnås ved hjelp av fremgangsmåter ifølge kravene 1, 5 og 10 og anordninger ifølge krav 11 og 14 samt tilhørende uselvstendige krav. Krav 15 fremlegger et datamaskinprogram som tilsvarer fremgangsmåtekravene 1 og 10.
Håndteringen eller behandlingen av lyddata kan forenkles, så som f.eks. med henblikk på kombinasjon av individuelle lyddatastrømmer til multikanal-lyddatastrømmer eller den generelle håndtering av en lyddatastrøm, ved å modifisere en datablokk i en lyd-datastrøm som er oppdelt i datablokker med bestemmelsesblokk og datablokkdata, som f.eks. ved å komplettere eller tilføye eller erstatte en del av denne, slik at den inneholder en lengdeangivelse som angir en datamengde eller en lengde av datablokklyddata eller en datamengde eller lengde av datablokken, for å oppnå en andre lyddatastrøm med modifiserte datablokker. Alternativt konverteres en lyddatastrøm med pekere i bestemmelsesblokker, hvilke peker på bestemmelsesblokklyddata som er knyttet til disse bestemmelsesblokker, men er fordelt blant forskjellige datablokker, til en lyddatastrøm hvor bestemmelsesblokklyddataene er kombinert til sammenhengende bestemmelsesblokklyddata. De sammenhengende bestemmelsesblokklyddata kan da være inneholdt i et i seg selv lukket kanalelement sammen med sin bestemmelsesblokk.
Det er en erkjennelse ved den foreliggende oppfinnelse at en pekerbasert lyddata-strøm hvor en peker peker på begynnelsen av bestemmelsesblokklyddataene til den respektive datablokk er lettere å håndtere når denne lyddatastrøm manipuleres slik at alle bestemmelsesblokklyddata, dvs. lyddata som angår det samme tidsmerket eller koder lydverdiene for det samme lydmerket, kombineres til en sammenhengende blokk av sammenhengende bestemmelsesblokklyddata, og den respektive bestemmelsesblokk til hvilken de sammenhengende bestemmelsesblokklyddata er knyttet, tilføyes til disse. Etter anordning eller anbringelse ved siden av hverandre av de således oppnådde kanalelementer, resulterer disse i den nye lyddatastrøm hvor alle lyddata som tilhører et tidsmerke eller koder lydverdiene hhv. samplene for dette tidsmerket, også er kombinert i et kanalelement, slik at den nye lyddatastrøm er lettere å håndtere.
Ifølge en utførelse av oppfinnelsen modifiseres hver bestemmelsesblokk eller hvert kanalelement i den nye lyddatastrøm, f.eks. ved å tilføye eller erstatte en del for å oppnå en lengdeangivelse som angir lengden eller datamengden av kanalelementet eller de sammenhengende lyddata som er inneholdt i dette, for å lette dekoding av den nye lyd-datastrøm med kanalelementer med forskjellig lengde. Modifikasjonen utføres med fordel ved å erstatte en redundant del av disse bestemmelsesblokker som er identiske for alle bestemmelsesblokker av den innmatede lyddatastrøm, med den respektive lengdeangivelse. Med denne foranstaltning kan det oppnås at databithastigheten for den resulterende lyddatastrøm er lik databithastigheten for den opprinnelige lyddatastrøm på tross av den ytterligere lengdeangivelse sammenlignet med den opprinnelige pekerbaserte lyddata-strøm, og at den nå egentlig unødvendige tilbakepeker derved videre kan oppnås i den nye lyddatastrøm for å være i stand til å rekonstruere den opprinnelige lyddatastrøm ut fra den nye lyddatastrøm.
Den identiske, redundante del av disse bestemmelsesblokker kan plasseres foran den nye resulterende lyddatastrøm i en total bestemmelsesblokk. På mottakersiden kan den resulterende andre lyddatastrøm således rekonverteres til den opprinnelige lyddata-strøm for å benytte eksisterende dekodere som kun kan dekode lyddatastrømmer av det opprinnelige filformat, for dekoding av den resulterende lyddatastrøm i det pekerløse format.
Ifølge en ytterligere utførelse av oppfinnelsen benyttes en konvertering av en første lyddatastrøm til en andre lyddatastrøm i et annet filformat til å danne en multikanal-lyddatastrøm av flere lyddatastrømmer i det første filformat. En håndterbarhet på mottakersiden forbedres sammenlignet med den rene kombinasjon av de opprinnelige lyd-datastrømmer med peker, da alle kanalelementer i multikanal-lyddatastrømmen som tilhører et tidsmerke eller inneholder de sammenhengende bestemmelsesblokklyddata, og ble oppnådd ved koding av en samtidig tidsperiode av en kanal i et multikanallydsignal, dvs. ved koding av tidsperioder av forskjellige kanaler som tilhører tidsmerket, kan kombineres til tilgangsenheter. Dette er ikke mulig med pekerbaserte lyddataformater, da lyddataene for et tidsmerke der kan være fordelt blant forskjellige datablokker. Tilveiebringelse av datapakker i flere lyddatastrømmer til forskjellige kanaler med en lengdeangivelse tillater bedre parsing (syntaksanalyse) ved hjelp av tilgangsenhetene ved sammenfatning av lyddatastrømmene til en multikanaldatastrøm med tilgangsenheter.
Oppfinnelsen er videre et resultat av den erkjennelse at det er meget enkelt å rekonvertere de ovenfor omtalte, resulterende lyddatastrømmer til et opprinnelige filformat som da kan dekodes til lydsignalet ved hjelp av eksisterende dekodere. Selv om de resulterende kanalelementer har en forskjellig lengde og således i blant er noe lengre og i blant kortere enn den lengde som er tilgjengelig i datablokkene i den opprinnelige lyddatastrøm, er det ikke nødvendig å forskyve eller kombinere hoveddataene ifølge de eventuelt unødvendig oppnådde tilbakepekere for avspilling av lyddatastrømmen i et nytt filformat, men det er tilstrekkelig å øke en bithastighetsangivelse i bestemmelsesblokkene av lyddatastrømmen med det opprinnelige filformat som skal genereres. Virkningen av dette er at i overensstemmelse med denne bithastighetsangivelse, er selv de lengste av kanalelementene i lyddatastrømmen som skal dekodes, mindre eller like lang som den datablokklengde som datablokkene har i lyddatastrømmen i det første filformat. Tilbakepekerne innstilles på null og kanalelementene økes til den lengde som svarer til den økte bithastighetsangivelse ved å tilføye biter med upåaktede (don't care) verdier. Det oppstår således datablokker av en lyddatastrøm i det opprinnelige filformat, hvor de tilhørende data utelukkende er inneholdt i selve datablokken og ikke i noen annen. En på denne måte tilbakekonvertert lyddatastrøm med det første filformat kan da tilføres til en allerede bestående dekoder for lyddatastrømmer med det første filformat ved å benytte den bithastighet som er økt i overensstemmelse med den økte bitangivelse. Således bortfaller kostbare forskyvningsoperasjoner for rekonvertering, så vel som nødvendig-heten av å erstatte eksisterende dekodere med nye.
Ifølge en ytterligere utførelse er det på den annen side mulig å gjenvinne den opprinnelige datastrøm fra den resulterende lyddatastrøm ved å benytte den informasjon som er inneholdt i den totale bestemmelsesblokk av den resulterende lyddatastrøm over den identiske, redundante del av bestemmelsesblokkene, til å fremstille på nytt den del som er overskrevet av lengdeangivelsen.
Kort beskrivelse av tegningene
I det følgende skal foretrukne utførelser av oppfinnelsen beskrives med henvisning til de ledsagende tegninger, der
Fig. 1 viser en skjematisk tegning for å illustrere MP3-filformatet med tilbakepeker,
fig. 2 viser et blokkdiagram av en struktur for konvertering av en MP3-lyddata-strøm til en MPEG-4-lyddatastrøm,
fig. 3 viser et flytskjema av en fremgangsmåte for omforming av en MP3-lyddata-strøm til en MPEG-4-lyddatastrøm ifølge en utførelse av oppfinnelsen,
fig. 4 viser en skjematisk tegning for illustrasjon av trinnet med sammenfatning av sammenhørende lyddata ved tilføyelse av bestemmelsesblokkene, og trinnet med modifikasjon av bestemmelsesblokkene ved fremgangsmåten ifølge fig. 3,
fig. 5 viser en skjematisk tegning for illustrasjon av en fremgangsmåte for konvertering av flere MP3-lyddatastrømmer til en multikanal-MPEG-4-lyddatastrøm ifølge en ytterligere utførelse av oppfinnelsen,
fig. 6 viser et blokkskjema av en anordning for konvertering av en ifølge fig. 3 oppnådd MPEG-4-lyddatastrøm tilbake til en MP3-lyddatastrøm, for å kunne dekode den samme ved hjelp av eksisterende MP3-dekodere,
fig. 7 viser et flytskjema av en fremgangsmåte for rekonvertering av den ifølge fig. 3 oppnådde MPEG-4-lyddatastrøm til en eller flere lyddatastrømmer i MP3-format,
fig. 8 viser et flytskjema av en fremgangsmåte for rekonvertering av den ifølge fig. 3 oppnådde MPEG-4-lyddatastrøm til en eller flere lyddatastrømmer i MP3-format ifølge en ytterligere utførelse av oppfinnelsen, og
fig. 9 viser et flytskjema av en fremgangsmåte for omforming av en MP3-lyddata-strøm til en MPEG-4-lyddatastrøm ifølge en ytterligere utførelse av oppfinnelsen.
Detaljert beskrivelse av oppfinnelsen
Oppfinnelsen vil i det følgende bli diskutert med henvisning til tegninger som er basert på utførelser hvor den opprinnelige lyddatastrøm i et filformat hvor tilbakepekere benyttes i datablokkenes bestemmelsesblokker for å peke på begynnelsen av hoveddata som tilhører bestemmelsesblokken, bare er et eksempel på en MP3-lyddatastrøm, mens den resulterende lyddatastrøm som består av i seg selv lukkede eller selvstendige kanalelementer hvor hver av lyddataene som tilhører det respektive tidsmerket, kombineres, også bare er et eksempel på en MPEG-4-lyddatastrøm. MP3-formatet er beskrevet i standardene ISO/IEC 11172-3 og 13818-3 som er nevnt i beskrivelsens innledning, mens MPEG-4-filformatet er beskrevet i standarden ISO/IEC 14496-3.
Først skal MP3-formatet beskrives kortfattet med henvisning med fig. 1. Fig. 1 viser et utsnitt av en MP3-lyddatastrøm 10. Lyddatastrømmen 10 består av en sekvens av rammer eller datablokker av hvilke bare tre kan ses fullstendig på fig. 1, nemlig 10a, 10b og 10c. MP3-lyddatastrømmen 10 er blitt frembrakt av en MP3-koder ut fra et audio- eller lydsignal. Det av datastrømmen 10 kodede lydsignal er f.eks. musikk, tale, en blanding av disse eller lignende. Datablokkene 10a, 10b og 10c er hver knyttet til et av på hverandre følgende, eventuelt overlappende tidsavsnitt i hvilke lydsignalet er blitt oppdelt av MP3-koderen. Hvert tidsavsnitt eller hver tidsperiode svarer til et tidsmerke til lydsignalet, og i beskrivelsen benyttes således uttrykket tidsmerke ofte i stedet for tidsavsnitt/tidsperiode. Hvert tidsavsnitt er blitt kodet til hoveddata (main data) av MP3-koderen individuelt ved hjelp av f.eks. en hybridfilterbank bestående av en polyfase-filterbank og en modifisert, diskret kosinustransformasjon med etterfølgende entropikoding, så som Huffman-koding. De hoveddata som tilhører de suksessive tre tidsmerker, til hvilke datablokkene 10a-10c er tilknyttet, er vist på fig. 1 ved 12a, 12b og 12c som sammenhengende blokker ved siden av den egentlige lyddatastrøm 10.
Datablokkene 10a-10c i lyddatastrømmen 10 er ekvidistant anordnet i lyddata-strømmen 10. Dette betyr at hver datablokk 10a-10c har samme datablokklengde eller rammelengde. Rammelengden avhenger på sin side av den bithastighet med hvilken lyd-datastrømmen 10 skal i det minste avspilles i sann tid, og av den samplingshastighet som MP3-koderen har benyttet bare sampling av lydsignalet forutfor for den egentlige koding. Sammenhengen er at samplingshastigheten i forbindelse med det faste antall sampler per tidsmerke angir hvor langt et tidsmerke er, og at det kan beregnes ut fra bithastigheten og tidsmerkeperioden hvor mange biter som kan overføres i denne tidsperiode.
Begge parametere, dvs. bithastigheten og samplingshastigheten, er angitt i rammetopptekster 14 i datablokkene 10a-10c. Således har hver datablokk 10a-10c sin egen rammetopptekst 14. Generelt er all informasjon som er vesentlig for dekoding av lyddatastrømmen, lagret i hver ramme 10a-10c selv, slik at en dekoder kan begynne dekoding på midten av en MP3-lyddatastrøm 10.
Ved siden av ramme toppteksten 14, som befinner seg ved begynnelsen, har hver datablokk 10a-10c en sideinformasjonsdel 16 og en hoveddatadel 18 som inneholder datablokklyddata. Sideinformasjonsdelen 16 følger umiddelbart etter toppteksten 14. Denne inneholder informasjon som er vesentlig for dekoderen av lyddatastrømmen 10 for å finne de hoveddata eller bestemmelsesblokklyddata som er knyttet til den respektive datablokk, som jo bare er Huffman-kodeord som er anbrakt lineært i rekke, og å dekode disse på korrekt måte til DCT- eller MDCT-koeffisientene. Hoveddatadelen 18 danner slutten på hver datablokk.
Slik som nevnt i beskrivelsens innledning, understøtter MP3-standarden en reser-voarfunksjon. Dette muliggjøres ved hjelp av tilbakepekere som er inneholdt i sideinformasjonen innenfor sideinformasjonsdelen 16 og som på fig. 1 er betegnet med 20. Dersom en tilbakepeker er innstilt på 0, begynner hoveddataene for disse side informasjoner umiddelbart etter sideinformasjonsdelen 16. Forøvrig angir pekeren 20 (main data begin) begynnelsen av hoveddataene som koder det tidsmerket til hvilket den datablokk er tilknyttet i hvilken sideinformasjonen 16 som inneholder tilbakepekeren 20, er inneholdt i en foregående datablokk. På fig. 1 er f.eks. datablokken 10a knyttet til et tidsmerke som kodes av hoveddataene 12a. Tilbakepekeren 20 i sideinformasjonen 16 til denne datablokk 10a peker f.eks. på begynnelsen av hoveddataene 12a, hvilket er i en datablokk foran datablokken 10a i strømretningen 22, ved å angi en bit- eller byte-forskyvning målt fra begynnelsen av toppteksten 14 til datablokken 16a. Dette betyr at ved dette tidspunkt under koding av lydsignalet har bitreservoaret til MP3 -koderen som frembrakte MP3-lyd-datastrømmen 10, ikke vært fullt, men kunne lastes opp med høyden av tilbakepekeren. Fra den posisjon på hvilken tilbakepekeren 20 for datablokken 10a peker, og fremover, innføres hoveddataene 12a i hoveddatastrømmen 10 med på lik avstand anbrakt par av topptekster og sideinformasjon 14, 16.1 det foreliggende eksempel strekker hoveddataene 12a seg frem til like over halvparten av hoveddatadelen 18 av datablokken 10a. Tilbakepekeren 20 i sideinformasjonsdelen 16 i den etterfølgende datablokk 10a peker på en posisjon umiddelbart etter hoveddataene 12a i datablokken 10a. Det samme gjelder for tilbakepekeren 20 i sideinformasjonsdelen 16 i datablokken 10c.
Slik det kan innses, er det snarere en unntakelse i MP3-hoveddatastrømmen 10 når de hoveddata som tilhører et tidsmerke, faktisk befinner seg utelukkende i den datablokk som er knyttet til dette tidsmerke. Datablokkene er snarere for det meste fordelt blant en eller flere datablokker som kanskje ikke engang omfatter selve den tilsvarende datablokk, avhengig av størrelsen på bitreservoaret. Høyden av tilbakepekerverdien er begrenset av størrelsen av bitreservoaret.
Etter at strukturen av en MP3-lyddatastrøm er blitt beskrevet på grunnlag av fig. 1, skal det med henvisning til fig. 2 beskrives en anordning som er egnet til å konvertere en MP3-lyddatastrøm til en MPEG-4 lyddatastrøm, eller til å oppnå en MPEG-4-lyddata-strøm ut fra et lydsignal som lett kan konverteres eller omformes til et MP3-format.
Fig. 2 viser en MP3-koder 30 og en MP3-MPEG-4-omformer 32. MP3-koderen 30 omfatter en inngang hvor denne mottar et lydsignal som skal kodes, og en utgang hvor denne utmater en MP3-lyddatastrøm som koder lydsignalet på inngangen. MP3-koderen 30 arbeider i overensstemmelse med den forannevnte MP3-standard.
MP3-lyddatastrømmen hvis struktur er blitt beskrevet med henvisning til fig. 1, består som nevnt av rammer med en fast rammelengde som avhenger av en innstilt bithastighet og den underliggende samplingshastighet så vel som en padding- eller ut-fyllingsbyte som er innstilt eller ikke innstilt. MP3-MPEG-4-omformeren 32 mottar MP3-lyddatastrømmen på en inngang og utmater på en utgang en MPEG-4-lyddatastrøm hvis oppbygning fremkommer ut fra den senere beskrivelse av virkemåten til MP3-MPEG-4-omformeren 32. Hensikten med omformeren 32 er å omforme MP3-lyddatastrømmen fra MP3-formatet til MPEG-4-formatet. MPEG-4-dataformatet har den fordel at alle hoveddata som tilhører et visst tidsmerke, er inneholdt i en sammenhengende tilgangsenhet eller et kanalelement, slik at manipulering av sistnevnte lettes i betydelig grad.
Fig. 3 viser de enkelte fremgangsmåtetrinn under omforming av MP3-lyddata-strømmen til MPEG-4-lyddatastrømmen som utføres av omformeren 32. MP3-lyddata-strømmen mottas først i et trinn 40. Mottaking kan omfatte lagring av hele lyddata-strømmen eller bare en aktuell del av denne i et mellomlager (holdekrets). På tilsvarende måte kan de etterfølgende trinn under omforming enten utføres under mottakingsforløpet 40 i sann tid eller først etter dette.
Deretter, i et trinn 42, kombineres alle lyddata hhv. hoveddata som tilhører et tidsmerke, i en sammenhengende blokk, og dette utføres for alle tidsmerker. Trinnet 42 er skjematisk nærmere illustrert på fig. 4 hvor elementene i en MP3-lyddatastrøm som ligner på elementene som er vist på fig. 1, i denne fig. er forsynt med samme eller lignende henvisningstall, og en gjentatt beskrivelse av disse elementer er utelatt.
Slik det kan ses av datastrømretningen 22, når de deler av MP3-lyddatastrømmen 10 som er vist lengst til venstre på fig. 4, frem til omformeren 32 tidligere enn de høyre deler av denne. To datablokker 10a og 10b er vist fullstendig på fig. 4. Det tidsmerke som tilhører datablokken 10a, kodes ved hjelp av hoveddataene MDI som på fig. 4 som eksempel er inneholdt delvis i en datablokk foran datablokken 10a og delvis i datablokken 10a, og her spesielt i hoveddatadelen 18 av denne. De hoveddata som koder det tidsmerke til hvilket den etterfølgende datablokk 10b er tilknyttet, er utelukkende inneholdt i hoveddatadelen 18 av datablokken 10a og betegnet med MD2. De hoveddata MD3 som tilhører den datablokk som følger etter datablokken 10b, er fordelt over hoveddatadelene 18 i datablokkene 10a og 10b.
I trinnet 42 kombinerer omformeren 32 alle sammenhørende hoveddata, dvs. alle hoveddata som koder et og samme tidsmerke, til sammenhengende blokker. Det foran datablokken 10a tilstedeværende avsnitt 44 og det i hoveddatadelen 18 av datablokken 10a tilstedeværende avsnitt 46 av hoveddataene MDI gir således ved sammenføyning den sammenhengende blokk 48 etter trinnet 42. For de andre hoveddata MD2, MD3 ... går man frem på tilsvarende måte.
For utførelse av trinnet 42 leser omformeren 32 pekeren i sideinformasjonen 16 til en datablokk 10a, og deretter, basert på denne peker, den respektive første del 44 av bestemmelsesblokklyddataene 12a for denne blokk 10a som er inneholdt i feltet 18 i en foregående datablokk, med begynnelse i den ved hjelp av pekeren fastlagte posisjon frem til toppteksten for den aktuelle datablokk 10a. Deretter leser omformeren den andre del 46 av bestemmelsesblokklyddataene som er inneholdt i delen 18 av den aktuelle datablokk 10a og som omfatter slutten av bestemmelsesblokklyddataene for denne datablokk 10a med begynnelse fra slutten av sideinformasjonen 16 av den aktuelle lyddatablokk 10a frem til begynnelsen av de neste lyddata, her betegnet med MD2, til den neste datablokk 10b på hvilken pekeren i sideinformasjonen 16 til den etterfølgende datablokk 10b peker, som omformeren 32 også leser. Kombinasjon av de to deler 44 og 46 resulterer som nevnt i blokken 48.
I et trinn 50 tilføyer omformeren 32 den tilhørende topptekst 14 som omfatter den tilhørende sideinformasjon 16, til de sammenhengende blokker for til slutt å danne MP3-kanalelementer 52a, 52b og 52c. Hvert MP3-kanalelement 52a-52c består således av toppteksten 14 til en tilhørende MP3-datablokk, en etterfølgende sideinformasjonsdel 16 av den samme MP3-datablokk, og den sammenhengende blokk 48 av hoveddata som koder det tidsmerke som er tilordnet til den datablokk fra hvilken toppteksten og sideinformasjonen skriver seg.
MP3-kanalelementene som skriver seg fra trinnene 42 og 50, har forskjellige kanalelementlengder, slik som angitt ved doble piler 54a-54c. Man skal her minne om at datablokkene 10a, 10b i MP3-lyddatastrømmen 10 hadde en fast rammelengde 56, men at antallet av hoveddata for de individuelle tidsmerker varierer rundt en middelverdi på grunn av bitreservoarfunksjonen.
For å lette dekoding og spesielt parsing hhv. syntaktisk analyse av de enkelte MP3-kanalelementer 52a-52c på dekodersiden, modifiseres topptekstene 14 H1-H3 for å oppnå lengden av det respektive kanalelement 52a-52c, dvs. 54a-54c. Dette utføres i et trinn 56. Lengdeinnmatningen innskrives i en del som er identisk eller redundant for alle topptekster 14 av lyddatastrømmen 10.1 MP3-formatet mottar hver topptekst 14 i begynnelsen et fast synkroniseringsord (synkord) bestående av 12 biter. I et trinn 56 opptas dette synkord av lengden av det respektive kanalelement. De 12 biter av synkordet er tilstrekkelig til å representere lengden av det respektive kanalelement i binær form, slik at lengden av de resulterende MP3-kanalelementer 58a-58c med modifisert topptekst H1-H3 forblir den samme på tross av trinnet 56, dvs. lik 54a-54c. På denne måte kan lydinforma-sj onene også overføres med den samme bithastighet i sann tid og avspilles slik som den opprinnelige MP3-lyddatastrøm 10 etter kombinasjon av MP3-kanalelementene 58a-58c i overensstemmelse med rekkefølgen av de av disse kodede tidsmerker, på tross av til-føyelsen av lengdeinformasjonen, så lenge ingen ytterligere overhead (administrasjons-biter) tilføyes på grunn av ytterligere topptekster.
I et trinn 58 genereres en filtopptekst, eller for det tilfellet at datastrømmen som skal frembringes, ikke er en fil men "streaming", en datastrømtopptekst for den ønskede MPEG-4-audiodatastrøm (trinn 60). Da det ifølge den foreliggende utførelse skal frembringes en MPEG-4-konform lyddatastrøm, frembringes en filtopptekst ifølge MPEG-4-standarden, hvor filtoppteksten i dette tilfellet har en fast struktur på grunn av funksjonen AudioSpecificConfig, som er definert i den ovennevnte MPEG-4-standard. Grensesnittet til MPEG-4-systemet tilveiebringes av elementet ObjectTypelndication som innstilles med verdien 0x40, så vel som ved angivelsen av en AudioObjectType med nummeret 29. Den MPEG-4-spesifikke AudioSpecificConfig utvides som følger i overensstemmelse med sin opprinnelige definisjon i ISO/IEC 14496-3, hvorved i det foreliggende eksempel tas hensyn til bare det innhold av AudioSpecificConfig som er vesentlig for den foreliggende beskrivelse, og ikke hele innholdet:
1 AudioSpecificConfig() {
2 audioObjectType; 3 samplingFrequencylndex;
4 if (samplingFrequencyIndex= = Oxf)
5 samplingFrequency; 6 channelConfiguration;
7 if(audioObjectType= =29) {
8 MPEG_l_2_SpecificConfig(); 9 } 10 {
Den ovenstående opplisting av AudioSpecificConfig er en representasjon i vanlig notasjon for funksjonen AudioSpecificConfig som tjener til parsing eller lesing av oppkallsparametrene i filtoppteksten i dekoderen, nemlig samplingFrequencylndex, channelConfiguration og audioObjectType, eller angir instruksjonene for hvordan filtoppteksten skal dekodes eller parses (analyseres syntaktisk).
Slik det kan innses, begynner filtoppteksten som frembringes i trinn 60, med angivelsen av audioObjectType som innstilles eller settes på 29 (linje 2), slik som nevnt ovenfor. Parameteren audioObjectType angir for dekoderen på hvilken måte dataene er blitt kodet, og spesielt på hvilken måte ytterligere informasjon for koding av filtoppteksten kan uttrekkes, slik det skal beskrives nedenfor.
Deretter følger oppkallsparameter samplingFrequencylndex som peker på en viss posisjon i en normert tabell for samplingsfrekvenser (linje 3). Dersom indeksen er 0 (linje 4), følger angivelsen av samplingsfrekvensen uten å peke på en normert tabell (linje 5).
Deretter følger en angivelse av en kanalkonfigurasjon (linje 6) som angir på en måte som skal omtales nærmere nedenfor, hvor mange kanaler som er inkludert i den frembrakte MPEG-4-lyddatastrøm, hvor det også er mulig, til forskjell fra den foreliggende oppfinnelse, å kombinere mer enn en MP3-lyddatastrøm til en MPEG-4-lyd-datastrøm, slik det skal beskrives nedenfor med henvisning til fig. 5.
Deretter, dersom audioObjektType er 29, hvilket er tilfelle her, følger en del i filtoppteksten AudioSpecificConfig, som inneholder en redundant del av MP3-rammetoppteksten i lyddatastrømmen 10, dvs. den del som forblir den samme blant rammetopptekstene 14 (linje 8). Denne del er her betegnet med MPEG_l_2_SpecificConfig ( ), igjen en funksjon som definerer strukturen eller oppbygningen av denne del.
Selv om strukturen av MPEG_l_2_SpecificConfig også kan tas fra MP3-standarden, da den svarer til den faste del av en MP3-rammetopptekst som ikke endrer seg fra ramme til ramme, opplistes som eksempel strukturen av denne nedenfor:
1 MPEG_l_2_SpecificConfig (channelConfiguration) {
2 syncword
3 ID
4 layer
5 reserved
6 sampling_frequency
7 reserved
8 reserved
9 reserved
10 if (channelConfiguration= =0) {
11 kanalkonfigurasjonsbeskrivelse
12 } 13 }
I delen MPEG_l_2_SpecificConfig settes alle biter som er forskjellige fra rammetoppteksten til rammetoppteksten 14 i MP3-lyddatastrømmen, på 0. I hvert fall er den første parameter MPEG_l_2_SpecificConfig, nemlig det 12-bits synkroniseringsord syncword som tjener til synkronisering av en MP3-koder ved mottaking av en MP3-lyd-datastrøm (linje 2) den samme for hver rammetopptekst. Den etterfølgende parameter ID (linje 3) angir MPEG-versjonen, dvs. en eller to, ved hjelp av den tilsvarende standard ISO/IEC 13818-3 for versjon 2 og standarden ISO/IEC 11172-3 for versjon 1. Parameterlaget (linje 4) gir en henvisning til lag 3, hvilket svarer til MP3-standarden. Den etterfølgende bit er reservert (linje 5), da dens verdi kan endre seg fra ramme til ramme og overføres av MP3-kanalelementene. Denne bit viser eventuelt at toppteksten er etterfulgt av en CRC-variabel. Den neste variable sampling_frequency (linje 6) peker på en tabell med samplingshastigheter som er definert i MP3-standarden, og således angir den samplingshastighet som ligger til grunn for MP3-DCT-koeffisientene. Deretter, i linje 7, velger angivelsen av en bit for spesifikke anvendelser (reserved) og likeledes også i linjene 8 og 9. Deretter (i linjene 11, 12) velger den nøyaktige definisjon av kanalkonfigurasjonen når den parameter som er angitt i linje 6 for AudioSpecificConfig, ikke peker på en forhåndsdefinert kanalkonfigurasjon, men har verdien 0. Forøvrig gjelder kanalkonfigurasjonen fra 14496-3 underdel 1 tabell 1.11.
Ved hjelp av trinnet 60 og særlig ved tilveiebringelsen av elementet MPEG_l_2_SpecificConfig i filtoppteksten, hvilket inneholder alle redundante angivelser i rammetopptekstene 14 i den opprinnelige MP3-lyddatastrøm 10, sikres det at denne redundante del i rammetopptekstene ikke fører til ikke-gjenvinnbart tap av denne informasjon i MPEG-4-filen som skal genereres under innføringen av datalettende dekoding, så som i trinnet 56 ved innføring av kanalelementlengden, men at denne modifiserte del kan rekonstrueres basert på MPEG-4-filtoppteksten.
Deretter, i et trinn 62, utmates MPEG-4-lyddatastrømmen i rekkefølgen til den i trinn 60 genererte MPEG-4-filtopptekst og kanalelementene i rekkefølgen til deres tilhørende tidsmerker, hvor den fullstendige MPEG-4-lyddatastrøm da resulterer i en MPEG-4-fil eller overføres ved hjelp av MPEG-4-systemer. Den foregående beskrivelse angir konformingen av en MP3-lyddatastrøm til en MPEG-4-lyddatastrøm. Slik det kan innses med stiplede linjer på fig. 2, er det imidlertid også mulig å omforme to eller flere MP3-lyddatastrømmer fra to MP3-kodere, nemlig 30 og 30', til en MPEG-4-multikanal-lyddatastrøm. I dette tilfellet mottar MP3-MPEG-4-omformeren 32 MP3 -lyddatastrøm-men fra alle kodere 30 og 30' og utmater multikanal-lyddatastrømmen i MPEG-4-format.
I den øvre halvdel illustrerer flg. 5 i tilslutning til fremstilling på fig. 4 på hvilken måte multikanal-lyddatastrømmen ifølge MPEG-4 kan oppnås, hvorved omformingen igjen utføres av omformeren 32. Det er vist tre kanalelementsekvenser 70, 72 og 74 som er blitt generert i overensstemmelse med trinnene 40-56 ut fra et respektivt lydsignal ved hjelp av en MP3-koder 30 eller 30' (flg. 2). Av hver sekvens av kanalelementer 70, 72 og 74 er det vist to respektive kanalelementer, nemlig henholdsvis 70a, 70b, 72a, 72b og 74a, 74b. På fig. 5 er de over hverandre anbrakte kanalelementer, her henholdsvis 70a-74a eller 70b-74b, hver knyttet til det samme tidsmerke. Kanalelementene i sekvensen 70 koder f.eks. det lydsignal som ifølge en passende normering er blitt registrert foran venstre, høyre (front), mens sekvensene 72 og 74 koder lydsignaler som representerer en registrering av den samme lydkilde fra andre retninger eller med et annet frekvensspek-trum, så som den sentrale fronthøyttaler (sentrum) og bakfra høyre og venstre (surround).
Slik som angitt med piler 76, kombineres disse kanalelementer nå til enheter under utmatingen (kfr. trinn 62 på fig. 3) i MPEG-4 lyddatastrømmen, nedenfor omtalt som tilgangsenheter 78.1 MPEG-4-lyddatastrømmen angår således dataene i en tilgangsenhet 78 alltid et tidsmerke. Anordningen av MP3-kanalelementene 70a, 72a og 74a innenfor tilgangsenheten 78, er i rekkefølgen front-, senter- og surround-kanal, blir i filtoppteksten slik den frembringes for den MPEG-4-lyddatastrøm som skal genereres (kfr. trinn 60 på fig. 3), tatt i betraktning ved hjelp av tilsvarende innstilling av oppkallsparameteren kanalkonfigurasjon i AudioSpecificConfig, idet det igjen henvises til underdel 1 i ISO/IEC 14496-3. Tilgangsenhetene 78 anordnes igjen suksessivt i MPEG-4-strømmen i overensstemmelse med rekkefølgen av deres tidsmerker, og de foregås av MPEG-4-filtoppteksten. Parameteren channelConfiguration innstilles på passende måte i MPEG-4-filtoppteksten for å angi rekkefølgene av kanalelementene i tilgangsenhetene hhv. deres betydning på dekodersiden.
Slik den foregående beskrivelse av fig. 5 har vist, er det meget lett å kombinere MP3-lyddatastrømmer til multikanal-lyddatastrømmer når, slik som foreslått ifølge den foreliggende oppfinnelse, MP3-lyddatastrømmene manipuleres for å oppnå i seg selv lukkede eller selvstendige kanalelementer ut fra datablokkene, ved hvilke alle data for et tidsmerke er inneholdt i et kanalelement, hvorved disse kanalelementer i de enkelte kanaler da på enkel måte kan kombineres til tilgangsenheter.
Den foregående beskrivelse refererte til omforming av en eller flere MP3-lyddata-strømmer til en MPEG-4-lyddatastrøm. Det er imidlertid en vesentlig erkjennelse ved den foreliggende oppfinnelse at alle fordeler ved den resulterende MPEG-4-lyddatastrøm, så som forbedret håndterbarhet av de individuelle selvstendige MP3-kanalelementer med lik overføringshastighet og muligheten for multikanaloverføring kan utnyttes uten å måtte erstatte eksisterende MP3-kodere fullt ut med nye dekodere, men at rekonverteringen også kan utføres uproblematisk, slik at disse kan benyttes under dekoding av den foran beskrevne MPEG-4-lyddatastrøm.
På flg. 6 er det vist en anordning av en MP3-rekonstruerer 100 hvis funksjonsmåte skal beskrives nærmere nedenfor, og av MP3-dekodere 102, 102' .... En MP3-rekonstruerer mottar på sin inngang en MPEG-4-lyddatastrøm slik den er blitt generert ifølge en av de foregående utførelser, og utmater en eller, når det dreier seg om en multikanal-lyddatastrøm, flere MP3-lyddatastrømmer til en eller flere MP3-dekodere 102, 102' ..., som selv dekoder den respektive mottatte MP3-lyddatastrøm til et respektivt lydsignal og videresender dette til respektive høyttalere som er anbrakt i overensstemmelse med kanalkonfigurasjonen.
En særlig enkel måte for å rekonstruere de opprinnelige MP3-lyddatastrømmer av en MPEG-4-lyddatastrøm som er frembrakt ifølge fig. 5, skal beskrives med henvisning til fig. 5 nedenfor og fig. 7, hvor disse trinn utføres av MP3-rekonstruereren på fig. 6.
Først verifiserer MP3-rekonstruereren 100 i et trinn 110 at den MPEG-4-lyddata-strøm som mottas på inngangen, er en reformatert MP3-lyddatastrøm, idet denne ifølge AudioSpecificConfig kontrollerer oppkallsparameteren audioObjectType i filtoppteksten med hensyn til om denne inneholder verdien 29. Dersom dette er tilfellet (linje 7 i AudioSpecificConfig), går MP3-rekonstruereren 100 videre med parsing (syntaktisk analyse) av filtoppteksten i MPEG-4-lyddatastrømmen og leser den redundante del av alle rammetopptekster i den opprinnelige MP3-lyddatastrøm ut fra del-MPEG_l_2_ SpecificConfig fra hvilken MPEG-4-lyddatastrømmen er blitt oppnådd (trinn 112).
Etter evaluering av MPEG_l_2_SpecificConfig erstatter MP3-rekonstruereren 100 i et trinn 114 i hvert kanalelement 74a-74c i den respektive topptekst hF, hc, hsen eller flere deler av kanalelementene med komponenter av MPEG_l_2_SpecificConfig, særlig kanalelementlengdeangivelsen ved hjelp av synkroniseringsordet fra MPEG_1_ 2_ SpecificConfig, for på nytt å oppnå de opprinnelige MP3-lyddatastrøm-rammetopptekster hF, hcog hs, som angitt med piler 116. I et trinn 118 modifiserer MP3-rekonstruereren 100 sideinformasj onene Sf, Scog Ss i MPEG-4-lyddatastrømmen i hvert kanalelement. Spesielt settes tilbakepekeren på 0 for å oppnå nye sideinformasj oner S'F, S'c og S's. Manipuleringen ifølge trinn 118 er på flg. 5 angitt ved hjelp av piler 120. Deretter, i et trinn 122, setter eller innstiller MP3-rekonstruereren 100 bithastighetsindeksen i hvert kanalelement 74a-74c i rammetoppteksten HF, Hc, Hssom er tilveiebrakt i trinnet 114, med synkroniseringsordet i stedet for kanalelementlengdeangivelsen på den høyest tillatelige verdi. Som slutteffekt avviker følgelig de resulterende topptekster fra de opprinnelige, hvilket er angitt på flg. 5 med en apostrof, dvs. H'F, H'c og H's. Manipuleringen av kanalelementene ifølge trinn 122 er også angitt ved hjelp av pilen 116.
For å illustrere endringene ifølge trinnene 114-122 en gang til, er individuelle parametere opplistet på flg. 5 for toppteksten H'F og sideindeksdelen S'F. Individuelle parametere av toppteksten H'F er angitt med 124. Rammetoppteksten H'F begynner med parameteren syncword. Syncword settes på den opprinnelige verdi (trinn 114) slik det er tilfelle i hver MP3 -lyddatastrøm, nemlig på verdien OxFFF. Generelt er en ramme topptekst H'F, slik den fremkommer etter trinnene 114-122, forskjellig fra den opprinnelige MP3-rammetopptekst slik den var inneholdt i den opprinnelige MP3-lyddatastrøm 10, bare ved det faktum at bithastighetsindeksen innstilles på den høyeste tillatte verdi, hvilket er OxE ifølge MP3-standarden.
Hensikten med endring av bithastighetsindeksen er å oppnå en ny rammelengde eller datablokklengde for MP3-lyddatastrømmen som skal genereres på nytt, hvilken lengde er større enn lengden av den opprinnelige MP3-lyddatastrøm fra hvilken MPEG-4-lyddatastrømmen med tilgangsenheten 78 er blitt generert. Knepet eller trikset er her at rammelengden i bytes i MP3-format alltid avhenger av bithastigheten i overensstemmelse med følgende ligning:
for MPEG 1 layer3:
frame length [Bit] = 1152<*>bit rate[Bit/s] / sample rate [Bit/s] +
+ 8<*>paddingbit[Bit]
for MPEG21ayer3:
frame length [Bit] = 576<*>bit rate[Bit/s] / sample rate [Bit/s] +
+ 8<*>paddingbit[Bit]
Rammelengden av en MP3-lyddatastrøm ifølge standarden er med andre ord direkte proporsjonal med bithastigheten og indirekte proporsjonal med samplingshastigheten. Som tilleggsverdi tilføyes verdien av padding-bitene som er angitt i MP3-rammetopptekstene hF, hc, hs, og kan benyttes til å innstille bithastigheten nøyaktig. Samplingshastigheten er fast, da den bestemmer med hvilken hastighet det dekodede lydsignal avspilles. Omformingen av bithastigheten sammenlignet med den opprinnelige innstilling gjør det nå mulig å anbringe slike MP3-kanalelementer 74a-74c i en datablokklengde av MP3-lyddatastrømmen som skal genereres på nytt, hvilke er lengre enn de opprinnelige, da hoveddataene for generering av den opprinnelige lyddatastrøm er blitt generert ved å ta biter fra bitreservoaret.
Selv om bithastighetsindeksen i den foreliggende utførelse alltid innstilles på den høyest tillatelige verdi, vil det således videre være mulig å øke bithastighetsindeksen bare til en verdi som er tilstrekkelig til å resultere i en datablokklengde ifølge MP3-standarden, slik at selv de lengste MP3-kanalelementer 74a-74c ville passe inn fra sin lengde.
Ved 126 er det vist at tilbakepekeren main data begin er satt eller innstilt på 0 i de resulterende sideinformasj oner. Dette betyr bare at datablokkene i MP3-lyddata-strømmen som er generert i overensstemmelse med fremgangsmåten ifølge fig. 7, alltid er lukket i seg selv, slik at hoveddataene for en viss rammetopptekst og sideinformasj onene alltid begynner direkte etter sideinformasj onene og slutter innenfor den samme datablokk.
Trinnene 114, 118, 122 utføres på hvert kanalelement, idet hvert av disse uttrekkes fra sine tilgangsenheter, hvorved kanallengdeangivelsene er nyttige under uttrekkingen.
Deretter, i et trinn 128, tilføyes den mengde fylldata eller don't care-biter til hvert kanalelement 74a-74c for å øke lengden av alle MP3-kanalelementer enhetlig til MP3-datablokklengden, slik den er fastlagt av den nye bithastighetsindeks OxE. Disse fylldata er angitt ved 128 på fig. 5. Mengden av fylldata kan beregnes for hvert kanalelement, f.eks. ved evaluering av kanalelementlengdeangivelsen og paddingbiten.
Deretter, i et trinn 130, videreledes kanalelementene som er vist på fig. 5 ved 74a'-74c' som er modifisert ifølge de foregående trinn, til en respektiv MP3-dekoder eller en MP3-dekoderidentitet 134a-134c som datablokker i en MP3-lyddatastrøm i rekkefølgen til de kodede tidsmerker. MPEG-4-filtoppteksten utelates. De resulterende MP3-lyddatastrømmer er på fig. 5 generelt betegnet 132a, 132b og 132c. MP3-dekoderidentitetene 134a-134c er f.eks. blitt initialisert tidligere, og da det samme antall som kanalelementer er inneholdt i de enkelte tilgangsenheter.
MP3-rekonstruereren 100 vet hvilke kanalelementer 74a-74c i en tilgangsenhet 78 i MPEG-4-lyddatastrømmen som hører til hvilke av de MP3-lyddatastrømmer 132a-132c som skal genereres, ut fra en evaluering av oppkallsparameteren channelConfiguration i AudioSpecificConfig i MPEG-4-lyddatastrømmen. Den MP3-dekoderidentitet 134a som er tilkoplet til fronthøyttaleren, mottar således lyddatastrømmen 132a som svarer til frontkanalen, og tilsvarende mottar MP3-dekoderidentitetene 134b og 134c de lyddata-strømmer 132b og 132c som er knyttet til senter- og surround-kanalen, og utmater de resulterende lydsignaler til tilsvarende anordnede høytalere, f.eks. til en basshøytaler eller til høytalere som er anbrakt henholdsvis bakentil til venstre og bakentil til høyre.
For sanntidskoding av MPEG-4-lyddatatstrømmen ved hjelp av anordningen på fig. 6 med dekoderidentitetene 102, 102' eller 134a-134c er det riktignok nødvendig å overføre de nygenererte MP3-lyddatastrømmer 132a-132c med bithastigheten økt i trinn 122, hvilket er høyere enn i den opprinnelige lyddatastrøm 10, men dette er imidlertid ikke noe problem da anordningen mellom MP3-rekonstruereren 100 og MP3-dekoderne 102, 102' eller 134a-134c er fast, slik at overføringsbanene her er tilsvarende korte og kan utformes med tilsvarende høy datahastighet med lave omkostninger og anstrengelser.
Ifølge den utførelse som er beskrevet med henvisning til fig. 7, er en MPEG-4-multikanal-lyddatastrøm som er oppnådd ifølge fig. 5 ut fra opprinnelige lyddatastrømmer 10, ikke blitt rekonvertert nøyaktig til de opprinnelige MP3-lyddatastrømmer, men andre MP3-lyddatatstrømmer er blitt generert ut fra de samme, hvor alle tilbakepekere i mot-setning til de opprinnelige lyddatastrømmer er innstilt på 0 og bithastighetsindeksen er innstilt på den høyeste verdi. Datablokkene i disse nygenererte MP3-lyddatastrømmer er således også lukket i seg selv for så vidt som alle data som er knyttet til et visst tidsmerke, er inneholdt i den samme datablokk 74'a-74'c, og fylldata er blitt benyttet til å øke datablokklengden til en enhetlig verdi.
Fig. 8 viser en utførelse for en fremgangsmåte ifølge hvilken det er mulig å rekonvertere en MPEG-4-lyddatastrøm som er generert ifølge utførelsene på fig. 1-5, til de opprinnelige MP3-lydstrømmer hhv. den opprinnelige MP3-lyddatastrøm.
I dette tilfellet prøver MP3-rekonstruereren 100 i et trinn 150 nøyaktig slik som i trinnet 110, hvorvidt MPEG-4-lyddatastrømmen er en reformatert MP3-lyddatastrøm. De etterfølgende trinn 152 og 154 svarer også til trinnene 112 og 114 i prosessen ifølge fig. 7.
I stedet for å endre tilbakepekerne i sideinformasj onene og bithastighetsindeksen i rammetopptekstene, rekonstruerer MP3-rekonstruereren 100, ifølge fremgangsmåten på fig. 8, i et trinn 156 den opprinnelige datablokklengde i de opprinnelige MP3-lyddata-strømmer konvertert til MPEG-4-lyddatastrømmen, basert på samplingshastigheten, bithastigheten og paddingbiten. Samplingshastigheten og paddingangivelsen er angitt i MPEG_l_2_SpecificConfig, og bithastigheten i hvert kanalelement, dersom sistnevnte er forskjellig fra ramme til ramme.
Formelen for beregning av den opprinnelige rammelengde til den opprinnelige og til lyddatastrømmen som skal rekonstrueres, er igjen slik som angitt ovenfor:
for MPEG 1 layer3:
frame length [Bit] = 1152<*>bit rate[Bit/s] / sample rate [Bit/s] +
+ 8<*>paddingbit[Bit]
for MPEG21ayer3:
frame length [Bit] = 576<*>bit rate[Bit/s] / sample rate [Bit/s] +
+ 8<*>paddingbit[Bit]
MP3-lyddatastrømmen hhv. MP3-lyddatastrømmene genereres deretter ved å anordne de respektive rammetopptekster fra den respektive kanal i avstanden til den beregnede datablokklengde, og mellomrommene fylles opp ved å innføre lyddataene hhv. hoveddataene i den posisjon som er angitt av pekerne i sideinformasj onene. Til forskjell fra utførelsene ifølge fig. 7 eller 5 innføres de hoveddata som er knyttet til den respektive topptekst eller den respektive sideinformasj on i MP3-lyddatastrømmen ved begynnelsen av den posisjon som er angitt av tilbakepekeren. Eller uttrykt på en annen måte, begynnelsen av de dynamiske hoveddata forskyves i overensstemmelse med verdien av main data begin. MPEG-4-filtoppteksten utelates. Den resulterende MP3-lyddatastrøm hhv. de resulterende MP3-lyddatastrømmer svarer til de opprinnelige MP3-lyddatastrøm-mer på hvilke MPEG-4-lyddatastrømmen var basert. Disse MP3-lyddatastrømmer kunne således dekodes ved hjelp av konvensjonelle MP3-dekodere til lydsignaler, på samme måte som lyddatastrømmene på fig. 7.
Med henvisning til den foregående beskrivelse skal det bemerkes at MP3-lyddata-strømmene som var beskrevet som enkanal-MP3-lyddatastrømmer, på flere steder i virke-ligheten allerede var tokanal-MP3-lyddatastrømmer som var definert ifølge ISO/IEC - standarden 13818-3, idet beskrivelsen her ikke gikk i detalj om dette, da den ikke endrer noen ting med hensyn til forståelsen av den foreliggende oppfinnelse. Matriseoperasjoner ut fra de overførte kanaler for gjenvinning av inngangskanalen på dekodersiden og anvendelse av flere tilbakepekere i disse multikanalsignaler er ikke blitt diskutert, men det henvises til den respektive standard.
De foregående utførelser gjorde det mulig å lagre MP3-datablokker i endret form i MPEG-4-filformatet. MPEG-l/2-audio-layer-3, kort angitt MP3 eller brukerspesiflkke formater så som MPEG2.5 eller mp3PRO som er avledet fra disse, kan pakkes i en MPEG-4-fll basert på disse prosedyrer, slik at denne nye representasjon representerer en multikanalrepresentasjon av et vilkårlig antall kanaler på en enkel måte. Anvendelse av den kompliserte og lite benyttede metode ut fra standarden ISO/IEC 13818-3 er ikke nødvendig. Spesielt pakkes MP3-datablokkene slik at hver blokk - kanalelement eller tilgangsenhet - tilhører et definert tidsmerke.
I de foregående utførelser for endring av formatet av den digitale signalfremstilling ble deler av fremstillingen overskrevet med forskjellige data. Uttrykt på en annen måte blir de informasjoner som er nødvendige eller nyttige for dekoderen, skrevet over den del av MP3-datablokken som er konstant for forskjellige blokker innenfor en datastrøm.
Ved å pakke flere mono- eller stereo-datablokker inn i en tilgangsenhet av MPEG-4-filformatet, kan det også oppnås en multikanalfremstilling som er vesentlig lettere å håndtere sammenlignet med fremstillingen ut fra standarden ISO/IEC 13818-3.
I de foregående utførelser er fremstillingen av en MP3-datablokk blitt formatert på en slik forskjellig måte at alle data som tilhører et visst tidsmerke, også er inkludert i en tilgangsenhet. Dette er generelt ikke tilfelle i MP3-datablokker, da elementet main data begin eller tilbakepekeren i den opprinnelige MP3 -datablokk kan peke på tidligere datablokker.
Rekonstruksjonen av den opprinnelige datastrøm kan eventuelt også utføres (flg. 8). Dette betyr, som vist, at de gjenvunne datastrømmer kan behandles av enhver konform dekoder.
I tillegg til dette tillater de foregående utførelser koding eller dekoding av mer enn to kanaler. I de foregående utførelser må de ferdig kodede MP3-data videre bare reformateres ved hjelp av enkle operasjoner for å oppnå et multikanalformat. På kodersiden måtte på den annen side denne operasjon eller disse operasjoner gjøres tilbakegående (reverseres).
Selv om en MP3-datastrøm vanligvis inneholder datablokker med varierende lengder, buntet til foregående utførelser de dynamiske data direkte bak sideinformasj onene, på grunn av at de dynamiske data som angår en blokk, kan pakkes i foregående blokker. Den resulterende MPEG-4-lyddatastrøm hadde en konstant midlere bithastighet, men datablokker med varierende lengder. Elementet main data begin hhv. Tilbakepekeren overføres på uendret måte for å sikre reproduksjon av den opprinnelige datastrøm.
Videre, med henvisning til fig. 5, er det blitt beskrevet en utvidelse av MPEG-4-syntaksen for å pakke flere MP3-datablokker som MP3-kanalelementer til et multikanalformat innenfor en MPEG-4-fil. Alle MP3-kanalelementinnganger som tilhører et tidspunkt, ble pakket i en tilgangsenhet. I overensstemmelse med MPEG-4-standarden kan de passende informasjoner for konfigurasjon på kodersiden tas fra den såkalte AudioSpecificConfig. Denne inneholder i tillegg til audioObjectType, samplingshastigheten og kanalkonfigurasjon etc, en deskriptor eller databeskriver som er relevant for den respektive audioObjectType. Denne databeskriver er blitt beskrevet foran med hensyn til MPEG_l_2_SpecificConfig.
Ifølge de foregående utførelser er det 12-bits MPEG-1/2 syncword i toppteksten erstattet med lengden av det respektive MP3-kanalelement. Ifølge ISO/IEC 13818-3 er 12 biter tilstrekkelig for dette. Den gjenværende topptekst er ikke blitt modifisert ytterligere, hvilket imidlertid kan skje for å forkorte f.eks. rammetoppteksten og den resterende redundante del bortsett fra synkordet, for å redusere mengden av informasjon som skal overføres.
Forskjellige variasjoner av ovenstående utførelser kan lett utføres. Rekkefølgen av trinnene på flg. 3, 7, 8 kan således endres, særlig trinnene 42, 50, 56, 60 på flg. 3, 11, 114, 118, 122 og 128 på fig. 7, og 152, 154,156 på fig. 8.
Med hensyn til fig. 3, 7, 8 skal det videre bemerkes at de trinn som er vist der, ut-føres vha respektive særtrekk i henholdsvis omformeren og rekonstruereren på flg. 2 eller 6, hvilke eksempelvis kan være utført som en datamaskin eller en fastkoplet krets.
I utførelsen på flg. 7 ble manipuleringen av topptekstene hhv. sideinformasj onene (trinn 118, 122) utført for MP3 -dekoderne på mottaker- eller dekodersiden, på den i forhold til den opprinnelige MP3-datastrøm lett endrede MP3-datastrøm. I mange anvendelsestilfeller kan det være fordelaktig å utføre disse trinn på koder- eller sender-siden, da mottakeranordningene ofte er masseproduserte anordninger, slik at besparelser i elektronikk på mottakersiden tillater vesentlig høyere gevinster. Ifølge en alternativ utførelse kan det således være sørget for at disse trinn utføres allerede under MP3-MPEG-4-dataformatomforming. Trinnene ifølge denne alternative formatomformingsmetode er vist på flg. 9 hvor trinn som er identiske med trinnene på flg. 3, er forsynt med de samme henvisning stall og ikke skal beskrives på nytt for å unngå gjentagelser.
Først motta MP3-lyddatatstrømmen som skal omformes, i trinnet 42, og i trinnet 42 kombineres lyddataene som tilhører et tidsmerke hhv. representerer en koding av en tidsperiode av lydsignalet som skal kodes ved hjelp av MP3-lyddatastrømmen som tilhører det respektive tidsmerket, til en sammenhengende blokk, og dette for alle tidsmerker. Topptekstene tilføyes på nytt til de sammenhengende blokker for å oppnå kanalelementene (trinnet 50). Topptekstene blir imidlertid ikke modifisert ved å erstatte synkroniseringsordet med lengen av respektive kanalelement slik som i trinnet 56.1 stedet følger ytterligere modifikasjoner i trinn 180 og 182 svarende til trinnene 118 og 122 på fig. 7.1 trinnet 180 innstilles pekeren i sideinformasjonen for hvert kanalelement på null, og i trinnet 182 endres bithastighetsindeksen i toppteksten for hvert kanalelement slik at, slik som beskrevet foran, den av bithastigheten avhengige MP3-datablokklengde er tilstrekkelig til å omfatte alle lyddata til dette kanalelement hhv. det tilhørende tidsmerke sammen med størrelsen av toppteksten og sideinformasj onene. Trinnet 182 kan også omfatte omforming av paddingbitene i topptekstene til de suksessive kanalelementer for å frembringe en nøyaktig bithastighet senere når MPEG-4-lyddatastrømmen som dannes ved hjelp av fremgangsmåten ifølge krav 9, tilføres til en dekoder som arbeider i overensstemmelse med fremgangsmåten ifølge krav 7, men uten trinnene 118 og 122. Paddingen kan selvsagt også utføres på dekodersiden innenfor trinnet 128.
I trinnet 182 kan det være nyttig å innstille bithastighetsindeksen ikke på den høyest mulige verdi slik som beskrevet med hensyn til trinnet 122. Verdien kan også innstilles på minimumsverdien, hvilket er tilstrekkelig til å oppta alle lyddata, toppteksten og sideinformasj onene i et kanalelement i en beregnet MP3-rammelengde, hvilket også kan bety at bithastighetsindeksen reduseres i tilfelle av passasjer av det kodede lydstykket som kan kodes med en mindre mengde koeffisienter.
Etter disse modifikasjoner genereres bare filtoppteksten (AudioSpecificConfig) i trinnene 60 og 62, og den samme utmates sammen med MP3-kanalelementene som MPEG-4-lyddatastrøm. Slik som allerede nevnt, kan denne avspilles i overensstemmelse med fremgangsmåten ifølge fig. 7, hvor imidlertid trinnene 118 og 122 kan være utelatt, hvilket letter implementeringen på dekodersiden. Trinnene 42, 50, 56, 180, 182 og 60 kan imidlertid utføres i hvilken som helst rekkefølge.
Den foregående beskrivelse angikk utelukkende som eksempel MP3-datastrøm-mer med fast datablokkbitlengde. Riktignok kan MP3-datastrømmer med variabel datablokklengde behandles i overensstemmelse med de foregående utførelser, ved hvilke bithastighetsindeksen og således også datablokklengden endrer seg fra ramme til ramme.
Den foregående beskrivelse angikk MP3-lyddatastrømmer. I andre ikke-pekerbaserte lyddatastrømmer sørger en utførelse av oppfinnelsen for å modifisere topptekstene i datablokkene i eksempelvis en MPEG 1/2 lag 2-lyddatastrøm som ved siden av topptekstene inneholder de tilhørende sideinformasj oner og de tilhørende lyddata, og således allerede er selvstendig eller lukket i seg selv, for å generere en MPEG-4-lyddatastrøm. Modifikasjonen forsyner hver topptekst med en lengdeangivelse som angir datamengden i enten den respektive datablokk eller lyddataene i den respektive datablokk, slik at MPEG-4-datastrømmen kan dekodes lettere, særlig når denne sammensettes av flere MPEG 1/2 lag 2-lyddatastrømmer til en multikanal-lyddatastrøm, på lignende måte som i den foregående beskrivelse med hensyn til fig. 5. Modifikasjonen oppnås fortrinnsvis på lignende måte som den foran beskrevne måte ved å erstatte synkordene eller en annen redundant del av disse i topptekstene til MPEG 1/2 lag 2-datatrømmen med lengdeangivelsene. Den forutfor flg. 5 allerede foretatte pekerreformatering eller pekeroppløs-ning ved sammenfatning av lyddataene som tilhører et tidsmerke, bortfaller i lag 2-data-strømmer, da ingen tilbakepekere eksisterer der. Dekodingen av en MPEG-4-lyddatastrøm som er sammensatt av to MPEG 1/2 lag-lyddatastrømmer som representerer to kanaler av en multikanal-lyddatastrøm, kan lettvint utføres, idet lengdeangivelsene utleses og det på grunnlag av disse raskt skaffes tilgang til de enkelte kanalelementer i tilgangsenhetene. Disse kan da overføres til konvensjonelle MPEG 1/2 lag-konforme dekodere.
Videre er det for den foreliggende oppfinnelse ikke vesentlig hvor tilbakepekeren nøyaktig befinner seg i datablokkene i den pekerbaserte lyddatastrøm. Den kunne videre befinne seg direkte i rammetopptekstene for å definere en sammenhengende bestemmelsesblokk sammen med denne.
Videre skal det spesielt bemerkes at avhengig av omstendighetene kan systemet ifølge oppfinnelsen for fllformatkonvertering også implementeres i programvare. Implementeringen kan gjøres på et digitalt lagringsmedium, særlig på en diskett eller en CD med elektronisk lesbare styresignaler som kan samvirke med et programmerbart data-maskinsystem slik at den respektive fremgangsmåte utføres. Generelt består oppfinnelsen således også av et datamaskinprogramprodukt med en programkode som er lagret på en maskinlesbar bærer for utførelse av fremgangsmåten ifølge oppfinnelsen når datamaskin-programproduktet kjøres på en datamaskin. Oppfinnelsen kan med andre ord også realise-res som et datamaskinprogram med en programkode for utførelse av fremgangsmåten når datamaskinprogrammet kjøres på en datamaskin.
Claims (15)
1 Fremgangsmåte for å omforme en første lyddatastrøm (10) som representerer et kodet lydsignal som omfatter tidsavsnitt og som har et første filformat til en andre lyddatastrøm som representerer det kodede lydsignal og som har et andre filformat,karakterisert vedat en tidsperiode omfatter en rekke med lydverdier, og hvor, i henhold til det første filformat, den første lyddatastrømmen er oppdelt i påfølgende datablokker (lOa-lOc), hvor en datablokk omfatter en bestemmelsesblokk (14,16) og datablokklyddata (18), som omfatter trinnet: - å modifisere (56) én av datablokkene eller kanalelementer (54a-54c), som resulterer fra datablokkene ved å kombinere (42) bestemmelsesblokk-lyddata (44,46) tilknyttet en bestemmelsesblokk av minst to datablokker for å oppnå sammenhengende bestemmelsesblokk-lyddata (48) og å tilføye de sammenhengende bestemmelsesblokk-lyddata (48) til bestemmelsesblokken (14, 16) til hvilken bestemmelsesblokk-lyddata (44, 46) knyttes, fra hvilken de sammenhengende bestemmelsesblokk-lyddata fremskaffes, slik at den samme omfatter en lengdeangivelse som angir mengden med data av den ene av datablokkene og kanalelementet y (54a-54c) eller en mengde med data fra bestemmelsesblokk-lyddata eller sammenhengende bestemmelsesblokk-lyddata, henholdsvis, hvor trinnet med å modifisere omfatter å erstatte (56) en redundant del som er identisk for alle bestemmelsesblokker med lengdeangivelsen.
2 Fremgangsmåten ifølge krav 1,
karakterisert vedat bestemmelsesblokk-lyddata knyttes til bestemmelsesblokken (14, 16), som er fremskaffet ved å kode en tidsperiode, hvor bestemmelsesblokken omfatter en peker som peker til en start av de bestemmelsesblokk-lyddata (12a-12c), og hvor en slutt av de bestemmelsesblokk-lyddata (12a-12c) ligger før en start av bestemmelsesblokk-lyddata (12b, 12c) i lyddatastrømmen tilknyttet en neste datablokk, og fremgangsmåten omfatter - å kombinere (42) bestemmelsesblokk-lyddata (44, 46) tilknyttet en bestemmelsesblokk av minst to datablokker for å oppnå sammenhengende bestemmelsesblokk-lyddata (48) som danner del av den andre lyddatastrømmen; - å tilføye (50) de sammenhengende bestemmelsesblokk-lyddata (48) til bestemmelsesblokken (14, 16) til hvilken bestemmelsesblokk-lyddataene (44, 46) knyttes, fra hvilken de sammenhengende bestemmelsesblokk-lyddataene er fremskaffet, for å oppnå et kanalelement (52a); og - å arrangere kanalelementene for å oppnå den andre lyddatastrømmen, - hvor trinnet med å modifisere omfatter å modifisere (56) kanalelementet (54a-54c) slik at det samme omfatter en lengdeangivelse som angir mengden med data fra kanalelementet (54a-54c) eller en mengde med data fra de sammenhengende bestemmelsesblokk-lyddata, hvor trinnet med å modifisere omfatter å erstatte (56) en redundant del som er identisk for alle bestemmelsesblokker med lengdeangivelsen.
3 Fremgangsmåten ifølge krav 2, videre
karakterisert vedtrinnet: - å plassere (60, 62) en samlende bestemmelsesblokk foran den andre lyddata-strømmen, hvor den samlende bestemmelsesblokk har den redundante delen identisk for alle bestemmelsesblokker.
4 Fremgangsmåten ifølge krav 2 eller 3,
karakterisert vedat trinnet med å kombinere omfatter sub-trinnene med: - å lese pekeren i et bestemmelsesblokk; - å lese en første del av bestemmelsesblokk-lyddataene inkludert i datablokklyddata til én av de minst to datablokkene og som omfatter starten av bestemmelsesblokk-lyddataene til hvilken pekeren til bestemmelsesblokken peker; - å lese en andre del av bestemmelsesblokk-lyddataene inkludert i datablokklyddata til de øvrige av de minst to datablokkene og som omfatter slutten av bestemmelsesblokk-lyddataene; og - å kombinere de første og andre delene.
5 Fremgangsmåte for å kombinere en første lyddatastrøm som representerer et kodet første lydsignal og en andre lyddatastrøm som representerer et kodet andre lydsignal inn i en flerkanals lyddatastrøm, som omfatter trinnene med: - å omforme den første lyddatastrømmen til en første sub-lyddatastrøm ifølge fremgangsmåten til ett av kravene 1 til 4; og - å omforme den andre lyddatastrømmen til en andre sub-lyddatastrøm ifølge frem
gangsmåten til ett av kravene 1 til 4,
karakterisert vedat trinnene med å arrangere utføres slik at de to sub-lyddatastrøm-mene sammen danner flerkanals lyddatastrømmen, og at det i flerkanals lyddata-strømmen kanalelementene (70a) av den første sub-lyddatastrømmen og kanalelementene (72a) av den andre sub-lyddatastrømmen som inneholder sammenhengende bestemmelsesblokk-lyddata fremskaffet ved å kode tidsavsnitt like i tid er anordnet etter hverandre følgende i en sammenhengende tilgangsenhet (78).
6 Fremgangsmåten ifølge krav 5,
som videre omfatter trinnet med å legge en samlende bestemmelsesblokk foran den andre lyddatastrømmen, hvor den samlende bestemmelsesblokk omfatter en format-angivelse som angir i hvilken rekkefølge kanalelementene (70a) av den første sub-lyd-datastrøm og den andre sub-lyddatastrøm (70b) er anordnet i tilgangsenhetene (78).
7 Fremgangsmåten ifølge ett av de forutgående kravene,
karakterisert vedat datablokkene er datablokker med lik eller forhåndsbestemt variabel størrelse avhengig av en samplingsrateangivelse og en bitrateangivelse i bestemmelsesblokken av den samme.
8 Fremgangsmåten ifølge krav 1,
karakterisert vedat trinnet med å modifisere omfatter å modifisere datablokkene slik at de samme omfatter en lengdeangivelse som angir mengden med data fra datablokkene eller en mengde med data fra datablokklyddataene for å fremskaffe kanalelementer som danner den andre lyddatastrømmen fra datablokkene, hvor trinnet med å modifisere innbefatter å erstatte en redundant del som er identisk for alle bestemmelsesblokker med lengdeangivelsen.
9 Fremgangsmåten ifølge ett av kravene 2 til 4,
som videre omfatter trinnene: - å nullstille (180) pekerne i bestemmelsesblokkene, slik at den samme indikerer som en start av de bestemmelsesblokk-lyddata at bestemmelsesblokk-lyddataene begynner umiddelbart etter den respektive bestemmelsesblokken; og - å endre (182) bitrateangivelsene i bestemmelsesblokkene slik at en datablokklengde som er avhengig av en bitrateangivelse i henhold til det første er tilstrekkelig til å ta opp den respektive bestemmelsesblokk og de tilknyttede bestemmelsesblokk-lyddataene.
10 Fremgangsmåte for å dekode en andre lyddatastrøm som representerer et kodet lydsignal som omfatter tidsavsnitt og som har et andre filformat, basert på en dekoder, som er i stand til å dekode en første lyddatastrøm som representerer det kodede signal og som har et første filformat, til et lydsignal,
karakterisert vedat en tidsperiode omfatter en rekke med lydverdier, og hvor i henhold til det første filformatet, den første lyddatastrømmen er delt inn i suksessive datablokker (10a-10c), hvor en datablokk har en bestemmelsesblokk (14,16) og datablokklyddata (18), hvor bestemmelsesblokk-lyddataene, som er fremskaffet ved å kode en tidsperiode, knyttes til bestemmelsesblokken (14, 16), hvor bestemmelsesblokken omfatteren peker som peker til en start av bestemmelsesblokk-lyddataene (12a-12c), og hvor en slutt av bestemmelsesblokk-lyddataene (12a-12c) ligger foran en start av bestemmelsesblokk-lyddata (12a-12c) i lyddatastrømmen tilknyttet en neste datablokk, og
hvor den andre lyddatastrømmen er oppdelt i kanalelementer i henhold til det andre filformatet, hvor et kanalelement omfatter sammenhengende bestemmelsesblokk-lyddata (44, 46) fremskaffet ved å kombinere bestemmelsesblokk-lyddata tilknyttet en bestemmelsesblokk fra to datablokker, og den tilhørende bestemmelsesblokk, i en form hvor en tidligere redundant del, som er identisk for alle bestemmelsesblokker, modifisees for å være erstattet med en lengdeangivelse som angir mengden med data fra det respektive kanalelement eller en mengde med data fra de respektive sammenhengende bestemmelsesblokkdata, som omfatter trinnene med: - å danne en inngangsdatastrøm som representerer det kodede lydsignal og som har et første filformat, fra den andre lyddatastrømmen ved
o å parse den andre lyddatastrømmen ved å benytte lengdeindikasjonene;
o å nullstille pekerne i bestemmelsesblokkene av kanalelementene av den andre lyddatastrømmen, slik at den samme indikerer som en start av de bestemmelsesblokk-lyddata at bestemmelsesblokk-lyddataene begynner umiddelbart etter den respektive bestemmelsesblokk å fremskaffe nullstilte bestemmelsesblokker;
o å endre en bitrateangivelse i bestemmelsesblokkene av kanalelementene av den andre lyddatastrømmen slik at en datablokklengde som er avhengig av bitrateangivelse i henhold til det andre lydfilformat er tilstrekkelig til å ta opp den respektive bestemmelsesblokk og de tilknyttede bestemmelsesblokk-lyddataene for å fremskaffe bitrate-forandrede og nullstilte bestemmelsesblokker; og
o å sette inn bit mellom hvert kanalelement og det påfølgende kanalelement, slik at lengden til hvert kanalelement pluss de innsatte bit er tilpasset til den endrede bitrateangivelsen, og - mate inndatastrømmen til dekoderen i henhold til den endrede bitrateangivelsen for å oppnå lydsignalet.
11 Anordning for å omforme en første lyddatastrøm (10) som representerer et kodet lydsignal som omfatter tidsavsnitt og som har et første filformat, til en andre lyddatastrøm som representerer det kodede lydsignal og som har et andre filformat, hvor en tidsperiode omfatter en rekke med lydverdier, og hvor, i henhold til det første filformatet, den første lyddatastrømmen er delt inn i påfølgende datablokker (10a- 10c), hvor en datablokk omfatter en bestemmelsesblokk (14,16) og datablokklyddata (18),
karakterisert vedet middel for å modifisere (56) én av datablokkene eller kanalelementer (54a-54c), resulterende fra datablokkene ved å kombinere (42) bestemmelsesblokk-lyddataene (44, 46) tilknyttet en bestemmelsesblokk av minst to datablokker for å oppnå sammenhengende bestemmelsesblokk-lyddata (48) og å tilføye de sammenhengende bestemmelsesblokk-lyddataene (48) til bestemmelsesblokken (14,16) til hvilken bestemmelsesblokk-lyddataene (44, 46) knyttes, fra hvilken de sammenhengende bestemmelsesblokk-lyddata er fremskaffet, slik at den samme omfatter en lengdeangivelse som angir mengden med data fra den ene av datablokkene og kanalelementet y (54a-54c) eller en mengde med data fra bestemmelsesblokk-lyddataene eller sammenhengende bestemmelsesblokk-lyddata, henholdsvis, hvor trinnet med å modifisere omfatter å erstatte (56) en redundant del som er identisk for alle bestemmelsesblokker med lengdeangivelsen.
12 Anordningen i henhold til krav 11,
karakterisert vedat bestemmelsesblokk-lyddata knyttes til bestemmelsesblokken (14, 16), som er fremskaffet ved å kode en tidsperiode, hvor bestemmelsesblokken omfatter en peker som peker til en start av de bestemmelsesblokk-lyddata (12a-12c), og hvor en slutt av de bestemmelsesblokk-lyddataene (12a-12c) ligger foran en start av bestemmelsesblokk-lyddataene (12b, 12c) i lyddatastrømmen tilknyttet en neste datablokk, apparatet videre omfatter - et middel for å kombinere (42) bestemmelsesblokk-lyddata (44, 46) tilknyttet en bestemmelsesblokk av to datablokker for å fremskaffe sammenhengende bestemmelsesblokk-lyddata (48) som danner del av den andre lyddatastrømmen; - et middel for å tilføye (50) de sammenhengende bestemmelsesblokk-lyddata (48) til bestemmelsesblokken (14,16) til hvilken bestemmelsesblokk-lyddataene (44, 46) knyttes, fra hvilken de sammenhengende bestemmelsesblokk-lyddata er fremskaffet, for å fremskaffe et kanalelement (52a); - et middel for å arrangere kanalelementene for å oppnå den andre lyddatastrøm-
men,
hvor midlene for å modifisere er konfigurert til å modifisere (56) kanalelementet (54a-54c) slik at den samme omfatter en lengdeangivelse som angir mengden med data fra kanalelementet (54a-54c) eller en mengde med data fra de sammenhengende bestemmelsesblokk-lyddata, hvor trinnet med å modifisere omfatter å erstatte (56) en redundant del som er identisk for alle bestemmelsesblokker med lengdeangivelsen.
13 Anordningen i henhold til krav 11,
karakterisert vedat midlene for å modifisere er konfigurert til å modifisere datablokkene slik at de samme omfatter en lengdeangivelse som angir mengden med data fra datablokkene eller en mengde med data fra datablokklyddataene for å fremskaffe kanalelementer som danner den andre lyddatastrømmen fra datablokkene, hvor trinnet med å modifisere innbefatter å erstatte en redundant del, som er identisk for alle bestemmelsesblokker, med lengdeangivelsen.
14 En anordning for å dekode en andre lyddatastrøm som representerer et kodet lydsignal som omfatter tidsavsnitt og som har et andre filformat, basert på en dekoder, som er i stand til å dekode en første lyddatastrøm som representerer det kodede signalet og som har et første filformat, til et lydsignal,
karakterisert vedat en tidsperiode omfatter en rekke med lydverdier, og hvor i henhold til det første filformatet, den første lyddatastrømmen er delt inn i suksessive datablokker (10a-10c), hvor en datablokk har en bestemmelsesblokk (14,16) og datablokklyddata (18), hvor bestemmelsesblokk-lyddataene, som er fremskaffet ved å kode en tidsperiode, knyttes til bestemmelsesblokken (14, 16), hvor bestemmelsesblokken omfatteren peker som peker til en start av bestemmelsesblokk-lyddataene (12a-12c), og hvor en slutt av de bestemmelsesblokk-lyddataene (12a-12c) ligger foran en start av bestemmelsesblokk-lyddata (12a-12c) i lyddatastrømmen tilknyttet en neste datablokk, og hvor den andre lyddatastrømmen er delt opp i kanalelementer i henhold til det andre filformatet, hvor et kanalelement omfatter sammenhengende bestemmelsesblokk-lyddata (44,46) fremskaffet ved å kombinere bestemmelsesblokk-lyddata tilknyttet en bestemmelsesblokk fra to datablokker, og den tilhørende bestemmelsesblokk i en form hvor en tidligere redundant del, som er identisk for alle bestemmelsesblokker, modifiseres for å være erstattet med en lengdeangivelse som angir mengden med data fra det respektive kanalelement eller en mengde med data fra de respektive sammenhengende bestemmelsesblokkdata, som omfatter: - et middel for å danne en inngangsdatastrøm som representerer det kodede lydsignal og som har et første filformat, fra den andre lyddatastrømmen ved
o å parse den andre lyddatastrømmen ved å benytte lengdeangivelsene;
o å nullstille pekerne i bestemmelsesblokkene til kanalelementene av den andre lyddatastrømmen, slik at den samme indikerer som en start av de bestemmelsesblokk-lyddata at bestemmelsesblokk-lyddataene begynner umiddelbart etter den respektive bestemmelsesblokk for å fremskaffe nullstilte bestemmelsesblokker;
o å endre en bitrateangivelse i bestemmelsesblokkene til kanalelementene av den andre lyddatastrømmen slik at en datablokklengde som er avhengig av bitrate angivelsen i henhold til det andre lydfilformat er tilstrekkelig til å ta opp den respektive bestemmelsesblokken og de tilknyttede bestemmelsesblokk-lyddataene for å fremskaffe bitrate-forandrede og nullstilte bestemmelsesblokker; og
o å sette inn bit mellom hvert kanalelement og det påfølgende kanalelement, slik at lengden til hvert kanalelement pluss de innsatte bit er tilpasset til den endrede bitrateangivelsen, og - et middel for å mate inndatastrømmen til dekoderen i henhold til den endrede bitrateangivelsen for å oppnå lydsignalet.
15 Et datamaskinprogram med en programkode for å utføre fremgangsmåten ifølge ett av kravene 1 eller 10 når datamaskinprogrammet kjører på en datamaskin.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10333071 | 2003-07-21 | ||
DE10339498A DE10339498B4 (de) | 2003-07-21 | 2003-08-27 | Audiodateiformatumwandlung |
PCT/EP2004/007744 WO2005013491A2 (de) | 2003-07-21 | 2004-07-13 | Audiodateiformatumwandlung |
Publications (2)
Publication Number | Publication Date |
---|---|
NO20060814L NO20060814L (no) | 2006-04-20 |
NO334901B1 true NO334901B1 (no) | 2014-07-07 |
Family
ID=34117364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20060814A NO334901B1 (no) | 2003-07-21 | 2006-02-20 | Lydfilformatkonvertering |
Country Status (12)
Country | Link |
---|---|
US (1) | US7769477B2 (no) |
EP (1) | EP1647010B1 (no) |
JP (1) | JP4405510B2 (no) |
KR (1) | KR100717600B1 (no) |
AU (1) | AU2004301746B2 (no) |
BR (1) | BRPI0412889B1 (no) |
CA (1) | CA2533056C (no) |
MX (1) | MXPA06000750A (no) |
NO (1) | NO334901B1 (no) |
PL (1) | PL1647010T3 (no) |
RU (1) | RU2335022C2 (no) |
WO (1) | WO2005013491A2 (no) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1647010B1 (de) | 2003-07-21 | 2017-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodateiformatumwandlung |
US8170883B2 (en) | 2005-05-26 | 2012-05-01 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
KR100878766B1 (ko) * | 2006-01-11 | 2009-01-14 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 방법과 장치 |
CN101617360B (zh) | 2006-09-29 | 2012-08-22 | 韩国电子通信研究院 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
US7912894B2 (en) | 2007-05-15 | 2011-03-22 | Adams Phillip M | Computerized, copy-detection and discrimination apparatus and method |
US20090037459A1 (en) * | 2007-08-03 | 2009-02-05 | Theobald Dietmar C | Annotation data handlers for data stream processing |
US20090067550A1 (en) * | 2007-09-06 | 2009-03-12 | Arie Heiman | Method and system for redundancy-based decoding of audio content |
KR101531510B1 (ko) * | 2008-11-27 | 2015-06-26 | 엘지전자 주식회사 | 수신 시스템 및 오디오 데이터 처리 방법 |
KR101461685B1 (ko) * | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
EP2131590A1 (en) * | 2008-06-02 | 2009-12-09 | Deutsche Thomson OHG | Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
TWI384459B (zh) * | 2009-07-22 | 2013-02-01 | Mstar Semiconductor Inc | 音框檔頭之自動偵測方法 |
US9183842B2 (en) * | 2011-11-08 | 2015-11-10 | Vixs Systems Inc. | Transcoder with dynamic audio channel changing |
EP2600343A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
US9111524B2 (en) | 2011-12-20 | 2015-08-18 | Dolby International Ab | Seamless playback of successive multimedia files |
JP5814802B2 (ja) * | 2012-01-12 | 2015-11-17 | ルネサスエレクトロニクス株式会社 | オーディオ符号化装置 |
RU2610588C2 (ru) * | 2012-11-07 | 2017-02-13 | Долби Интернешнл Аб | Вычисление отношения сигнал-шум конвертора с уменьшенной сложностью |
KR101992274B1 (ko) * | 2013-01-02 | 2019-09-30 | 삼성전자주식회사 | 데이터 압축 방법과 상기 방법을 수행할 수 있는 장치들 |
EP3264644A1 (en) * | 2016-07-01 | 2018-01-03 | Nxp B.V. | Multiple source receiver |
US10535355B2 (en) * | 2016-11-18 | 2020-01-14 | Microsoft Technology Licensing, Llc | Frame coding for spatial audio data |
US10187443B2 (en) * | 2017-06-12 | 2019-01-22 | C-Hear, Inc. | System and method for encoding image data and other data types into one data format and decoding of same |
US11588872B2 (en) | 2017-06-12 | 2023-02-21 | C-Hear, Inc. | System and method for codec for combining disparate content |
EP3761654A1 (en) * | 2019-07-04 | 2021-01-06 | THEO Technologies | Media streaming |
CN110415716B (zh) * | 2019-07-05 | 2021-11-26 | 达闼机器人有限公司 | 音频混合方法、装置、存储介质及电子设备 |
CN112612668A (zh) * | 2020-12-24 | 2021-04-06 | 上海立可芯半导体科技有限公司 | 一种数据处理方法、装置和计算机可读介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5596564A (en) | 1993-10-08 | 1997-01-21 | Matsushita Electric Industrial Co., Ltd. | Information recording medium and apparatus and method for recording and reproducing information |
JPH07221716A (ja) | 1994-01-31 | 1995-08-18 | Sony Corp | 情報信号伝送方法及び装置 |
JP3645027B2 (ja) | 1995-09-20 | 2005-05-11 | 松下電器産業株式会社 | 可変長データ送受信装置 |
JP3359581B2 (ja) | 1998-11-25 | 2002-12-24 | パイオニア株式会社 | 情報再生装置 |
KR100441704B1 (ko) | 1999-12-03 | 2004-07-27 | 마츠시타 덴끼 산교 가부시키가이샤 | 데이터 적합화 장치, 데이터 적합화 방법, 기억 매체 및프로그램 |
US6466476B1 (en) | 2001-01-18 | 2002-10-15 | Multi Level Memory Technology | Data coding for multi-bit-per-cell memories having variable numbers of bits per memory cell |
JP2002279392A (ja) * | 2001-03-22 | 2002-09-27 | Kobe University | 進化戦略計算システム、その方法及び記録媒体 |
JP2004529450A (ja) * | 2001-04-20 | 2004-09-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | データストリームを編集する方法及び装置 |
KR100904626B1 (ko) * | 2001-04-20 | 2009-06-25 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | Mp3용 트릭 플레이 |
AU2002305012A1 (en) | 2001-05-24 | 2003-01-21 | Vixs Systems Inc. | Method and apparatus for managing resources and multiplexing a plurality of channels in a multimedia system |
JP2003337596A (ja) | 2002-05-20 | 2003-11-28 | Teac Corp | オ−ディオデータ処理方法及び装置 |
EP1420401A1 (en) * | 2002-11-14 | 2004-05-19 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for converting a compressed audio data stream with fixed frame length including a bit reservoir feature into a different-format data stream |
EP1647010B1 (de) | 2003-07-21 | 2017-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodateiformatumwandlung |
-
2004
- 2004-07-13 EP EP04763200.5A patent/EP1647010B1/de not_active Expired - Lifetime
- 2004-07-13 PL PL04763200T patent/PL1647010T3/pl unknown
- 2004-07-13 AU AU2004301746A patent/AU2004301746B2/en not_active Expired
- 2004-07-13 CA CA2533056A patent/CA2533056C/en not_active Expired - Lifetime
- 2004-07-13 WO PCT/EP2004/007744 patent/WO2005013491A2/de active Search and Examination
- 2004-07-13 RU RU2006105203/09A patent/RU2335022C2/ru active
- 2004-07-13 JP JP2006520732A patent/JP4405510B2/ja not_active Expired - Lifetime
- 2004-07-13 BR BRPI0412889A patent/BRPI0412889B1/pt active IP Right Grant
- 2004-07-13 KR KR1020067001445A patent/KR100717600B1/ko active IP Right Grant
- 2004-07-13 MX MXPA06000750A patent/MXPA06000750A/es active IP Right Grant
-
2006
- 2006-01-20 US US11/337,231 patent/US7769477B2/en active Active
- 2006-02-20 NO NO20060814A patent/NO334901B1/no unknown
Also Published As
Publication number | Publication date |
---|---|
JP2006528368A (ja) | 2006-12-14 |
US7769477B2 (en) | 2010-08-03 |
JP4405510B2 (ja) | 2010-01-27 |
AU2004301746B2 (en) | 2008-04-10 |
KR20060052854A (ko) | 2006-05-19 |
NO20060814L (no) | 2006-04-20 |
MXPA06000750A (es) | 2006-03-30 |
EP1647010A2 (de) | 2006-04-19 |
KR100717600B1 (ko) | 2007-05-15 |
PL1647010T3 (pl) | 2018-02-28 |
BRPI0412889B1 (pt) | 2019-09-10 |
RU2335022C2 (ru) | 2008-09-27 |
BRPI0412889A (pt) | 2006-10-03 |
EP1647010B1 (de) | 2017-09-06 |
CA2533056C (en) | 2012-04-17 |
CA2533056A1 (en) | 2005-02-10 |
RU2006105203A (ru) | 2006-06-27 |
AU2004301746A1 (en) | 2005-02-10 |
US20060259168A1 (en) | 2006-11-16 |
WO2005013491A2 (de) | 2005-02-10 |
WO2005013491A3 (de) | 2005-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NO334901B1 (no) | Lydfilformatkonvertering | |
JP4724452B2 (ja) | デジタルメディア汎用基本ストリーム | |
US7672743B2 (en) | Digital audio processing | |
JP4835638B2 (ja) | 音声符号化方法及び音声復号方法 | |
CN1826635B (zh) | 音频文件格式转换 | |
JP4244223B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP3606456B2 (ja) | 音声信号伝送方法及び音声復号方法 | |
JP4148260B2 (ja) | 音声符号化方法及び音声復号方法 | |
JPH0944194A (ja) | 音声符号化通信方式 | |
JP2006171777A (ja) | 音声符号化方法及び音声復号方法 | |
JP2006171780A (ja) | 音声符号化方法及び音声復号方法 | |
JP2006171772A (ja) | 音声符号化方法及び音声復号方法 | |
JP2006171775A (ja) | 音声符号化方法及び音声復号方法 | |
JP2005038592A (ja) | 音声信号伝送方法及び音声復号方法 | |
JP2006171778A (ja) | 音声符号化方法及び音声復号方法 |