NO20170986A1 - Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem - Google Patents

Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem Download PDF

Info

Publication number
NO20170986A1
NO20170986A1 NO20170986A NO20170986A NO20170986A1 NO 20170986 A1 NO20170986 A1 NO 20170986A1 NO 20170986 A NO20170986 A NO 20170986A NO 20170986 A NO20170986 A NO 20170986A NO 20170986 A1 NO20170986 A1 NO 20170986A1
Authority
NO
Norway
Prior art keywords
frame
samples
filter bank
window
windowed
Prior art date
Application number
NO20170986A
Other languages
English (en)
Other versions
NO342514B1 (no
Inventor
Ralf Geiger
Markus Schnell
Bernhard Grill
Gerhard Schuller
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Publication of NO20170986A1 publication Critical patent/NO20170986A1/no
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of NO342514B1 publication Critical patent/NO342514B1/no

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Facsimile Transmission Control (AREA)
  • Telephonic Communication Services (AREA)
  • Complex Calculations (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem.
Fagfelt
Den foreliggende oppfinnelse vedrører en analysefilterbank, en synteseiflterbank og systemer omfattende hvilke som helst av de foran nevnte filterbanker, som for eksempel kan bli realisert innen feltet av moderne audiokoding, audiodekoding eller andre anvendelser relatert til audio-overføring. Videre vedrører den foreliggende oppfinnelse også en blander og et konferansesystem.
Bakgrunn
Moderne digital audiobehandling er typisk basert på kodingsskjemaer som gjør en betydelig reduksjon innen bithastigheter, overføringsbåndbredder og lagringsvolum sammenliknet med en direkte overføring eller lagring av de tilsvarende audiodata. Dette blir oppnådd ved å kode audiodataene på senderstedet og dekode de kodete data på mottakerstedet for eksempel forut for for eksempel å gjøre de dekodete audiodata tilgjengelige for en lytter.
Slike digitale audiobehandlingssystemer kan bli realisert med hensyn til et bredt utvalg av parametre som omfatter en typisk lagringsplass for en typisk potensielt standardisert strøm av audiodata, bithastigheter, beregningsmessig kompleksitet, særlig innenfor en effektivitet av en realisering, oppnåelige kvaliteter som er hensiktsmessige for forskjellige anvendelser og innenfor forsinkelse forårsaket under både kodingen og dekodingen av henholdsvis audiodataene og de kodete audiodata. Med andre ord kan digitale audiosystemer bli benyttet i mange forskjellige felter av anvendelser som strekker seg fra en ultralavkvalitets overføring til en overføring av høy ende av kvalitet og lagring av audiodata (for eksempel for en høykvalitets musikklytteopplevelse).
I mange tilfeller kan imidlertid kompromisser måtte bli tatt innenfor de forskjellige parametre, slike som bithastigheten, den beregningsmessig kompleksitet, kvaliteten og forsinkelsen. For eksempel kan et digitalt audiosystem omfattende en lav forsinkelse kreve en høyere bithastighet av en overføringsbåndbredde sammenliknet med et audiosystem med en høyere forsinkelse ved et sammenliknbart kvalitetsnivå.
Oppsummering
En utførelse av en analyseiflterbank for å filtrere et flertall av inngangsrammer fra tidsdomene, hvor en inngangsramme omfatter et antall av ordnede inngangsprøver, ("-prøve" fra engelsk "sample") omfatter en innretning for vindusteknikk konstruert for å fremstille et flertall av med vindusteknikk behandlede rammer, hvor en med vindusteknikk behandlet ramme omfatter et flertall av med vindusteknikk behandlede prøver, hvor innretningen for vindusteknikk er konstruert for å behandle flertallet av inngangsrammer på en overlappende måte ved å benytte en prøvefremskrittsverdi, hvor prøvefremskrittsverdien er mindre enn antallet av ordnede inngangsprøver av en inngangsramme delt med to, og en tid/frekvens-omformer konstruert for å gjøre en utgangsramme omfattende et antall av utgangsverdier tilgjengelig, hvor en utgangsramme er en spektral representasjon av en med vindusteknikk behandlet ramme.
En utførelse av en syntesefilterbank for å filtrere et flertall av inngangsrammer, hvor hver inngangsramme omfatter et antall av ordnede inngangsverdier, omfatter en frekvens/tid-omformer konstruert for å gjøre et flertall av utgangsrammer tilgjengelige, hvor en utgangsramme omfatter et antall av ordnede utgangsprøver, hvor en utgangsramme er en tidsrepresentasjon av en inngangsramme, og en innretning for vindusteknikk konstruert for å fremstille et flertall av med vindusteknikk behandlede rammer. En med vindusteknikk behandlet ramme omfatter et flertall av med vindusteknikk behandlede prøver. Innretningen for vindusteknikk er videre konstruert for å gjøre tilgjengelig flertallet av med vindusteknikk behandlede prøver for en behandling på en overlappende måte basert på en prøvefremskrittsverdi. Utførelsen av syntesefilterbanken omfatter videre en overlapp-/adderer konstruert for å gjøre tilgjengelig en addert ramme omfattende en start seksjon og en restseksjon, hvor en addert ramme omfatter et flertall av adderte prøver ved å addere minst tre med vindusteknikk behandlede prøver fra minst tre med vindusteknikk behandlede rammer for en addert prøve i restseksjonen av en addert ramme, og ved å addere minst to med vindusteknikk behandlede prøver fra minst to forskjellige med vindusteknikk behandlede rammer for en addert prøve i startseksjonen. Antallet av med vindusteknikk behandlede prøver addert for å oppnå en addert prøve i restseksjonen er minst én prøve høyere sammenliknet med antallet av med vindusteknikk behandlede prøver addert for å oppnå en addert prøve i startseksjonen, eller innretningen for vindusteknikk er konstruert for å se bort fra i hvert fall den tidligste utgangsverdi ifølge rekkefølgen av de ordnede utgangsprøver eller å sette de korresponderende med vindusteknikk behandlede prøver til en forutbestemt verdi eller til minst til en verdi i et forutbestemt område for hver med vindusteknikk behandlede ramme av flertallet av med vindusteknikk behandlede rammer. Overlapp-/addereren 230 er konstruert for å gjøre tilgjengelig den addert prøve i restseksjonen av en addert ramme basert på minst tre med vindusteknikk behandlede prøver fra minst tre forskjellige med vindusteknikk behandlede rammer og en addert prøve i startseksjonen basert på minst to med vindusteknikk behandlede prøver fra minst to forskjellige med vindusteknikk behandlede rammer.
En utførelse av en synteseiflterbank for å filtrere et flertall av inngangsrammer, hvor hver inngangsramme omfatter M ordnede inngangsverdier yk(0), ..., yk(M-l), hvor M er et positivt heltall, og hvor k er et heltall for å indikere en rammeindeks, omfatter en invers type-IV, diskret cosinustransform frekvens/tid-omformer konstruert for å gjøre tilgjengelig et flertall av utgangsrammer, en utgangsramme omfattende 2M ordnede utgangsprøver xk(0), ..., xk(2M-l) basert på inngangsverdiene yk(0), ..., yk(M-l), en innretning for vindusteknikk konstruert for å fremstille et flertall av med vindusteknikk behandlede rammer, en med vindusteknikk behandlet ramme omfattende et flertall av med vindusteknikk behandlede prøver zk(0),..., zk(2M-l) basert på likningen
hvor n er et heltall for å indikere en prøveindeks, og hvor w(n) er en realverdi vindusfunksjonskoeffisient som korresponderer med prøveindeksen n, en overlapp-/adderer er konstruert for å gjøre tilgjengelig en mellomliggende ramme omfattende et flertall av mellomliggende prøver mk(0), ..., mk(M-l) basert på likningen og en løfter konstruert for å gjøre tilgjengelig en addert ramme omfattende et flertall av adderte prøver outk(0), ..., outk(M-l) basert på likningen
hvor 1(0), ..., l(M-l) er realverdi, løftende koeffisienter.
En utførelse av en koder omfatter en analyseiflterbank for å filtrere et flertall av inngangsrammer fra tidsdomene, hvor en inngangsramme omfatter et antall av ordnede inngangsprøver, omfatter en innretning for vindusteknikk konstruert for å fremstille et flertall av med vindusteknikk behandlede rammer, en med vindusteknikk behandlet ramme omfatter et flertall av med vindusteknikk behandlede prøver, hvor innretningen for vindusteknikk er konstruert for å behandle flertallet av inngangsrammer på en overlappende måte ved å bruke en prøvefremskrittsverdi, hvor prøvefremskrittsverdien er mindre enn antallet av ordnede inngangsprøver fra en inngangsramme delt med 2, og en tid/frekvens-omformer konstruert for å gjøre tilgjengelig en utgangsramme omfattende et antall av utgangsverdier, en utgangsramme er en spektral representasjon av en med vindusteknikk behandlet ramme.
En utførelse av en dekoder omfatter en syntesefilterbank for å filtrere et flertall av inngangsrammer, hvor hver inngangsramme omfatter et antall av ordnede inngangsverdier, omfattende en frekvens/tid-omformer konstruert for å gjøre tilgjengelig et flertall av utgangsrammer, en utgangsramme omfattende et antall av ordnede utgangsprøver, en utgangsprøve er en tidsrepresentasjon av en inngangsramme, innretning for vindusteknikk konstruert for å fremstille et flertall av med vindusteknikk behandlede rammer, en med vindusteknikk behandlet ramme omfattende et flertall av med vindusteknikk behandlede prøver, og hvor innretningen for vindusteknikk er konstruert for å gjøre tilgjengelig flertallet av med vindusteknikk behandlede prøver for en behandling på en overlappende måte basert på en prøvefremskrittsverdi, en overlapp-/adderer konstruert for å gjøre tilgjengelig en addert ramme omfattende en startseksjon og en restseksjon, en addert ramme omfattende et flertall av adderte prøver ved å addere minst tre med vindusteknikk behandlede prøver fra minst tre med vindusteknikk behandlede rammer for en addert prøve i restseksjonen av en addert ramme og ved å addere minst to med vindusteknikk behandlede prøver fra minst to forskjellige med vindusteknikk behandlede rammer for en addert prøve i startseksjonen, hvor antallet av med vindusteknikk behandlede prøver addert for å oppnå en addert prøve i restseksjonen er minst én prøve høyere sammenliknet med antallet av med vindusteknikk behandlede prøver addert for å oppnå en addert prøve i startseksjonen,
eller
hvor innretningen for vindusteknikk er konstruert for å se bort fra minst den tidligste utgangsverdi ifølge ordenen av de ordnede utgangsprøver eller å sette de korresponderende med vindusteknikk behandlede prøver til en forutbestemt verdi eller minst til en verdi i et forutbestemt område for hver med vindusteknikk behandlede ramme fra flertallet av med vindusteknikk behandlede rammer, og hvor overlapp-/addereren er konstruert for å gjøre tilgjengelig den adderte prøve i restseksjonen av en addert ramme basert på minst tre med vindusteknikk behandlede prøver fra minst tre forskjellige med vindusteknikk behandlede rammer og en addert prøve i startseksjonen basert på minst to med vindusteknikk behandlede prøver fra minst to forskjellige med vindusteknikk behandlede rammer.
En ytterligere utførelse av en dekoder omfatter en syntesefilterbank for å filtrere et flertall av inngangsrammer, hvor hver inngangsramme omfatter M ordnede inngangsverdier yk(0), ..., yk(M-l), hvor M er et positivt heltall, og hvor k er et heltall for å indikere en rammeindeks, omfatter en invers type-IV, diskret cosinustransform, frekvens/tid-omformer konstruert for å gjøre tilgjengelig et flertall av utgangsrammer, en utgangsramme omfatter 2M ordnede utgangsprøver xk(0), ..., xk(2M-l) basert på inngangsverdiene yk(0), ..., yk(M-l), en innretning for vindusteknikk konstruert for å fremstille et flertall av med vindusteknikk behandlede rammer, en med vindusteknikk behandlet ramme omfatter et flertall av med vindusteknikk behandlede prøver zk(0), ..., zk(2M-l) basert på likningen
hvor n er et heltall for å indikere en prøveindeks, og hvor w(n) er en realverdi vindusfunksjonskoeffisient korresponderende med prøveindeksen n, en overlapp-/adderer konstruert for å gjøre tilgjengelig en mellomliggende ramme omfattende et flertall av mellomliggende prøver mk(0), ..., mk(M-l) basert på likningen og en løfter konstruert for å gjøre tilgjengelig en addert ramme omfattende et flertall av adderte prøver outk(0), ..., outk(M-l) basert på likningen
hvor 1(0), ..., l(M-l) er realverdi, løftende koeffisienter.
En utførelse av en blander for å blande et flertall av inngangsrammer, hvor hver inngangsramme er en spektral representasjon av en korresponderende tidsdomeneramme og hver inngangsramme fra flertallet av inngangsrammer er gjort tilgjengelige fra forskjellige kilder, omfatter en entropidekoder konstruert for å entropidekode et flertall av inngangsrammer, en skalerer konstruert for å skalere flertallet av entropidekodete inngangsrammer i frekvensdomenet og konstruert for å oppnå et flertall av skalerte rammer i frekvensdomenet, hvor hver skalert ramme svarer til en entropikodet ramme, en adderer konstruert for å addere de skalerte rammer i frekvensdomenet for å fremstille en addert ramme i frekvensdomenet, og en entropikoder konstruert for å entropikode den adderte ramme for å oppnå en blandet ramme.
En utførelse av et konferansesystem omfatter en blander for å blande et flertall av inngangsrammer, hvor hver inngangsramme er en spektral representasjon av en tilsvarende ramme i tidsdomene og hver inngangsramme av flertallet av inngangsrammer er gjort tilgjengelig fra forskjellige kilder, omfatter en entropidekoder konstruert for å entropidekode flertallet av inngangsrammer, en skalerer konstruert for å skalere flertallet av entropidekodete inngangsrammer i frekvensdomenet og konstruert for å oppnå et flertall av skalerte rammer i frekvensdomenet, hver skalerte ramme svarer til en entropidekodet inngangsramme, en adderer konstruert for å addere opp de skalerte rammer i frekvensdomenet for å fremstille en addert ramme i frekvensdomenet, og en entropikoder konstruert for å entropikode den adderte ramme for å oppnå en blandet ramme.
Kort beskrivelse av tegningene
Utførelser av den foreliggende oppfinnelse blir her beskrevet under referanse til de vedlagte tegninger.
Figur 1 viser et blokkdiagram av en analysefilterbank,
figur 2 viser en skjematisk representasjon av inngangsrammer som blir behandlet
av en utførelse av en analysefilterbank,
figur 3 viser et blokkdiagram av en utførelse av en syntesefilterbank,
figur 4 viser en skjematisk representasjon av utgangsrammer innen rammeverket
av å bli behandlet av en utførelse av en syntesefilterbank,
figur 5 viser en skjematisk representasjon av en analysevindusfunksjon og en syntesevindusfunksjon av en utførelse av en analyseiflterbank og av en
syntesefilterbank,
figur 6 viser en sammenlikning av en analysevindusfunksjon og en
syntesevindusfunksjon sammenliknet med en fortegnsvindusfunksjon, figur 7 viser en ytterligere sammenlikning av forskjellige vindusfunksjoner, figur 8 viser en sammenlikning av en forhåndsekkoadferd for de tre forskjellige
vindusfunksjoner vist i figur 7,
figur 9 viser skjematisk den generelle tidsmessige maskeringsegenskap til det
menneskelige øre,
figur 10 viser en sammenligning av frekvensresponsen av et fortegnsvindu og et
lavforsinkelsesvindu,
figur 11 viser en sammenligning av en frekvensrespons av et sinusvindu og et
lavoverlappvindu,
figur 12 viser en utførelse av en koder,
figur 13 viser en utførelse av en dekoder,
figur 14a viser et system som omfatter en koder og en dekoder,
figur 14b viser forskjellige kilder for forsinkelser omfattet av systemet vist i figur
14a,
figur 15 viser en tabell som omfatter en sammenlikning av forsinkelser,
figur 16 viser en utførelse av et konferansesystem som omfatter en utførelse av en
blander,
figur 17 viser ytterligere en utførelse av et konferansesystem som en server eller en
mediakontrollenhet (engelsk: media control unit) (MCU),
figur 18 viser et blokkskjema av en mediakontrollenhet,
figur 19 viser en utførelse av en syntesefilterbank som en effektiv realisering,
figur 20 viser en tabell som omfatter en evaluering av en beregningsmessig
effektivitet av en utførelse av en synteseiflterbank eller en
analysefilterbank (AAC-ELD-kodek),
figur 21 viser en tabell som omfatter en evaluering av en beregningsmessig
effektivitet av en AAC-LD-kodek,
figur 22 viser en tabell omfattende en evaluering av en beregningsmessig
kompleksitet av en AAC-LC-kodek,
figur 23a og 23b viser tabeller omfattende en sammenlikning av en evaluering av en
minne-effektivitet av RAM og ROM for tre forskjellige kodeker, og
figur 24 viser en tabell omfattende en liste over benyttet kodeks for en MUSHRA-
prøve.
Detaljert beskrivelse av utførelsene
Figur 1 til 24 viser blokkskjemaer og ytterligere skjemaer som beskriver de
funksjonelle egenskaper og løsninger av forskjellige utførelser av en
analysefilterbank, en syntesefilterbank, en koder, en dekoder, en blander, et konferansesystem og andre utførelser av den foreliggende oppfinnelse. Imidlertid vil,
forut for å beskrive en utførelse av en syntesefilterbank med hensyn til figur 1 og 2, en utførelse av
Figur 1 viser en første utførelse av en analysefilterbank 100 omfattende en
innretning 110 for vindusteknikk og tid/frekvens-omformer 120. For å være mer nøyaktig er innretningen 110 for vindusteknikk konstruert for å motta et flertall av inngangsrammer fra tidsdomene, hver inngangsramme omfatter et antall av ordnede inngangsprøver ved en inngang 110i. Innretningen 110 for vindusteknikk er videre tilpasset for å fremstille et flertall av med vindusteknikk behandlede rammer, som er gjort tilgjengelige av innretningen for vindusteknikk ved utgangen 110o av innretningen 110 for vindusteknikk. Hver av de med vindusteknikk behandlede rammer omfatter et flertall av med vindusteknikk behandlede prøver, hvor
innretningen 110 for vindusteknikk videre er konstruert for å behandle flertallet av med vindusteknikk behandlede rammer på en overlappende måte ved å benytte en prøvefremskrittsverdi som vil bli forklart mer i detalj i sammenhengen med figur 2.
Tid/frekvens-omformeren 120 er i stand til å motta de med vindusteknikk
behandlede rammer som sendt ut av innretningen 110 for vindusteknikk og er konstruert for å gjøre tilgjengelig en utgangsramme omfattende et antall av utgangsverdier, slik at en utgangsramme er en spektral representasjon av en med vindusteknikk behandlet ramme.
For å illustrere og skissere de funksjonelle egenskaper og løsninger av en
utførelse av en analysefilterbank 100, viser figur 2 en skjematisk representasjon av fem inngangsrammer 130-(k-3), 130-(k-2), 130-(k-l), 130-k og 130-(k+l), som en funksjon av tid, som indikert ved en pil 140 ved bunnen av figur 2.
I det følgende vil virkemåten av en utførelse av en analyseiflterbank 100 bli beskrevet mer i detalj med henvisning til inngangsrammen 130-k, som indikert ved den stiplede linje i figur 2. Med hensyn til denne inngangsramme 130-k er inngangsrammen 130-(k+l) en fremtidig inngangsramme mens de tre inngangsrammer 130-(k-l), 130-(k-2) og 130-(k-3) er fortidige inngangsrammer. Med andre ord er k et heltall for å indikere en rammeindeks slik at jo større rammeindeksen er, dess lengre er den respektive inngangsramme lokalisert "inn i fremtiden". Følgelig: jo mindre indeksen k er, dess lengre er inngangsrammen lokalisert "inn i fortiden".
Hver av inngangsrammene 130 omfatter minst to underseksjoner 150 som er like lange. For å være mer nøyaktig omfatter, i tilfellet av en utførelse av en analysefilterbank 100, på hvilken den skjematiske representasjon vist i figur 2 er basert, inngangsrammen 130-k så vel som de andre inngangsrammer 130, underseksjoner 150-2, 150-3 og 150-4, som er like i lengde beskrevet i inngangsprøver. Hver av disse underseksjoner 150 av inngangsrammen 130 omfatter M inngangprøver, hvor M er et positivt heltall. Videre omfatter inngangsrammen 130 også en første underseksjon 150-1 som også kan omfatte M inngangsrammer. I dette tilfelle omfatter den første underseksjon 150-1 en innledende seksjon 160 av inngangsrammen 130 som kan omfatte inngangsprøver eller andre verdier, slik som vil bli forklart i mer detalj ved et senere trinn. Avhengig av den konkrete realisering av utførelsen av en analysefilterbank, er det imidlertid ikke nødvendig at den første underseksjon 150-1 omfatter en innledende seksjon 160 i det hele tatt. Med andre ord kan den første underseksjon 150-1 i prinsipp omfatte et lavere antall av inngangsprøver sammenliknet med de andre underseksjoner 150-2, 150-3 og 150-4. Eksempler for dette tilfelle vil også bli illustrert senere.
Valgbart omfatter ved siden av den første underseksjon 150-1 de andre underseksjoner 150-2, 150-3 og 150-4 typisk det samme antall av inngangsprøver M, som er lik den såkalte prøvefremskrittsverdi 170, som indikerer et antall av inngangsprøver ved hvilket to på hverandre følgende inngangsrammer 130 er flyttet med hensyn til tid og hverandre. Med andre ord er som indikert av en pil 170 i tilfellet av en utførelse av en analyseiflterbank 100 som illustrert i figur 1 og 2 prøvefremskrittsverdien M lik lengden av underseksjonene 150-2, 150-3 og 150-4, inngangsrammene 130 blir fremstilt og behandlet av innretningen 110 for vindusteknikk på en overlappende måte. Videre er prøvefremskrittsverdien M (pil 170) også identisk med lengden av underseksj onene 150-2 til 150-4.
Inngangsrammer 130-k og 130-(k+l) er dermed med hensyn til et betydelig antall av inngangsprøver lik i meningen at begge inngangsrammer omfatter disse inngangsprøver, mens de er skiftet med hensyn til de individuelle underseksjoner 150 av de to inngangsrammer 130. For å være mer nøyaktig er den tredje underseksjon 150-3 av inngangsrammen 130-k lik den fjerde underseksjon 150-4 av inngangsrammen 130-(k+l). Følgelig er den andre underseksjon 150-2 av inngangsramme 130-k identisk med den tredje underseksjon 150-3 av inngangsrammen 130-(k+l).
Med enda andre ord: de to inngangsrammer 130-k og 130-(k+l), som korresponderer med rammeindeksen k og (k+1) er med hensyn til de to underseksjoner 150 i tilfellet-av utførelsene vist i figur 2 identiske, bortsett fra det faktum at med hensyn til inngangsrammen med indeksrammen (k+1) er prøvene flyttet.
De to foran nevnte inngangsrammer 130-k og 130-(k+l) deler videre minst én prøve fra den første underseksjon 150-1 av inngangsrammen 130-k. For å være mer nøyaktig: i tilfellet av utførelsen vist i figur 2 opptrer alle inngangsprøver i den første underseksjon 150-1 av inngangsrammen 130-k, som ikke er del i den innledende seksjon 160, som del i den andre underseksjon 150-2 av inngangsrammen 130-(k+l). Imidlertid kan, men trenger ikke, inngangsprøvene av den andre underseksjon 150-2, som svarer til den innledende seksjon 160 av inngangsrammen 130-k foran, være basert på inngangsverdiene eller inngangsprøvene av den innledende seksjon 160 av den respektive inngangsramme 130, avhengig av den konkrete realisering av en utførelse av en analysefilterbank.
Tilfellet av den innledende seksjon 160 eksisterer slik at antallet av inngangsrammer i den første underseksjon 150-1 er lik antallet av inngangsprøver i de andre underseksjoner 150-2 til 150-4, i prinsippet må to forskjellige tilfeller bli tatt i betraktning, selv om også ytterligere tilfeller mellom disse to "yttertilfeller" som vil bli forklart, er mulige.
Hvis den innledende seksjon 160 omfatter "meningsfull", kodete inngangsprøver i meningen at inngangsprøvene i den innledende seksjon 160 representerer et audiosignal i tidsdomenet, vil disse inngangsprøver også være del av underseksjonen 150-2 av den følgende inngangsramme 130-(k+l). Imidlertid er dette tilfelle i mange anvendelser av en utførelse av en analysefilterbank, ikke en optimal realisering fordi denne valgmulighet kan forårsake tilleggsforsinkelse.
Imidlertid kan i tilfellet at den innledende seksjon 160 ikke omfatter "meningsfulle" inngangsprøver, hvilket i dette tilfelle også kan bli referert til som inngangsverdier, de korresponderende inngangsverdier av den innledende seksjon 160 omfatte tilfeldige verdier, en forhåndsvalgt, en fast, en tilpasningsbar eller en programmerbar verdi som for eksempel kan bli gjort tilgjengelig med hensyn til en algoritmisk beregning, avgjørelse eller annen fastsettelse ved en enhet eller en modul, som kan bli koplet til inngangen 11 Oi av innretningen 110 for vindusteknikk av utførelsen av analysefilterbanken. I dette tilfelle kreves imidlertid at denne modulen gjør tilgjengelig som inngangsrammen 130-(k+l), en inngangsramme som omfatter i den andre underseksjon 150-2 i området som tilsvarer den innledende seksjon 160 av inngangsrammen foran, "meningsfulle" inngangsprøver som korresponderer med det korresponderende audiosignal. Videre kreves typisk at enheten eller modulen koplet til inngangen 11 Oi av innretningen 110 for vindusteknikk, også gjør tilgjengelig meningsfulle inngangsprøver som svarer til audiosignalet innen rammeverket av den første underseksjon 150-1 av inngangsrammen 130-(k+l).
Med andre ord blir i dette tilfelle inngangsrammen 130-k, svarende til rammeindeks k, gjort tilgjengelig for utførelsen av en analysefilterbank 100 etter at tilstrekkelig inngangsprøver har blitt samlet, slik at underseksjonen 150-1 av denne inngangsramme kan bli fylt med disse inngangsprøver. Resten av den første underseksjon 150-1, nemlig den innledende seksjon 160 blir så fylt opp med inngangsprøver eller inngangsverdier som kan omfatte tilfeldige verdier eller hvilke som helst andre verdier, slike som en forutbestemt, en fast, en tilpasningsbar eller en programmerbar verdi eller hvilken som helst annen kombinasjon av verdier. Fordi dette i prinsippet kan bli gjort ved en veldig høy hastighet sammenliknet med en typisk samplingsfrekvens, krever ikke det å forsyne den innledende seksjon 160 av inngangsrammen 130-k med slike "meningsløse" inngangsprøver en betydelig tidsperiode i den viste målestokk presentert av en typisk samplingfrekvens, slik som en samplingfrekvens i området mellom noen få kHz og opp til mange 100 kHz.
Imidlertid fortsetter enheten eller modulen å samle inn inngangsprøver basert på audiosignalet for å innlemme disse inngangsprøver i den følgende inngangsramme 130-(k+l), svarende til rammeindeksen k+1. Med andre ord, selv om modulen eller enheten ikke fullførte å samle inn tilstrekkelig inngangsprøver for å forsyne inngangsrammen 130-k med hensyn til den første underseksjon 150-1 med tilstrekkelig inngangsprøver til helt å fylle opp den første underseksjon 150-1 av denne inngangsramme, men forsyner denne inngangsramme til utførelsen av analysefilterbanken 100 så snart som nok inngangsprøver er tilgjengelige, slik at den første underseksjon 150-1 kan bli fylt opp med inngangsprøver uten den innledende seksjon 160.
De følgende inngangsprøver vil bli brukt til å fylle opp de gjenværende inngangsprøver av den andre underseksjon 150-2 av den etterfølgende inngangsramme 130-(k+l) inntil nok inngangsprøver er samlet, slik at den første underseksjon 150-1 av denne neste inngangsramme også kan bli fylt inntil den innledende seksjon 160 av denne ramme begynner. Enda en gang vil så den innledende seksjon 160 bli fylt opp med tilfeldige tall eller andre "meningsløse" inngangsprøver eller inngangsverdier.
Følgelig, selv om prøvefremskrittverdien 170 som er lik lengden av underseksjonen 150-2 til 150-4 i tilfellet av utførelsen vist i figur 2 er indikert i figur 2 og feilen som representerer prøvefremskrittverdien 170 er vist i figur 2 fra begynnelsen av den innledende seksjon 160 av inngangsrammen 130-k inntil begynnelsen av den innledende seksjon 160 av den etterfølgende inngangsramme 130-(k+l).
Som en ytterligere følge vil en inngangsprøve som svarer til en hendelse i audiosignalet, korresponderende med den innledende seksjon 160 i de siste to tilfeller ikke være tilstede i de respektive inngangsrammer 130-k, men i den følgende inngangsramme 130—(k+1) innen rammen av den andre underseksjon 150-2.
Med andre ord kan mange utførelser av en analyseiflterbank 100 sørge for en utgangsramme med en redusert forsinkelse, mens inngangsprøver svarende til den innledende seksjon 160 ikke er del av den respektive inngangsramme 130-k, men bare vil ha innflytelse på den senere inngangsramme 130-(k+l). Med andre ord kan en utførelse av en analyseiflterbank i mange anvendelser og realiseringer tilby fordelen av å sørge for utgangsrammen basert på inngangsrammen tidligere, fordi den første underseksjon 150-1 ikke kreves å omfatte det samme antall av inngangsprøver som de andre underseksjoner 150-2 til 150-4. Informasjonen omfattet av den "manglende seksjon" er imidlertid omfattet av den neste inngangsramme 130 innen rammeverket av den andre underseksjon 150-2 av den respektive inngangsramme 130.
Som tidligere indikert kan det imidlertid også eksistere tilfellet der ingen av inngangsrammene 130 omfatter den innledende seksjon 160.1 dette tilfelle er ikke lengden av hver av inngangsrammene 130 lenger et heltallmultiplum av prøvefremskrittverdien 170 eller lengden av underseksjonen 150-2 til 150-4. For å være mer nøyaktig, i dette tilfelle avviker lengden av hver av inngangsrammene 130 fra de korresponderende heltallmultipler av prøvefremskrittverdien med antallet av inngangsprøver, som modulen eller enheten som forsyner innretningen 110 for vindusteknikk med de respektive inngangsrammer, stopper før den gjør tilgjengelig hele den første underseksjon 150-1. Med andre ord avviker den helhetlige lengde av slik en inngangsramme 130 fra det respektive heltallantall av prøvefremskrittverdier med forskjellen mellom lengden av den første underseksjon 150-1 sammenliknet med lengden av de andre underseksjoner 150-2 til 150-4.
Imidlertid kan i de to siste nevnte tilfeller modulen eller enheten, som for eksempel kan omfatte en punktprøver, et prøve- og holdetrinn, en prøve- og holder eller en kvantiserer begynne å gjøre tilgjengelig den korresponderende inngangsramme 130 før det er oppnådd et forutbestemt antall av inngangsprøver, slik at hver av inngangsrammene 130 kan bli gjort tilgjengelige for utførelsen av en analyseiflterbank 100 med en kortere forsinkelse sammenliknet med tilfellet der hele den første underseksjon 150-1 er fylt med korresponderende inngangsprøver.
Som allerede indikert kan slik en enhet eller modul som kan bli koplet til inngang 11 Oi av innretningen 110 for vindusteknikk for eksempel omfatte en sampler og/eller en kvantiserer slik som en analog/digital-omformer (A/D-omformer). Avhengig av den konkrete realisering kan imidlertid en slik modul eller enhet videre omfatte noe minne eller noen registre for å lagre inngangsprøvene som svarer til audiosignalet.
Videre kan en slik enhet eller modul forsyne hver av inngangsrammene på en overlappende måte basert på en prøvefremskrittsverdi M. Med andre ord omfatter en inngangsramme mer enn to ganger antallet av inngangsprøver sammenliknet med antallet av prøver samlet pr. ramme eller blokk. Slik en enhet eller modul er i mange utførelser tilpasset slik at to på hverandre følgende fremstilte inngangsrammer er basert på et flertall av prøver som blir skiftet (engelsk: shifted) med hensyn til tid med prøvefremskrittsverdien. I dette tilfelle blir den siste inngangsramme av de to på hverandre fremstilte inngangsrammer basert på minst én frisk utgangsprøve som den tidligste utgangsprøve og det foran nevnte flertall av prøver blir skiftet senere med prøvefremskrittsverdien i den tidligste inngangsramme av de to inngangsrammer.
Selv om en utførelse av en analysefilterbank 100 så langt har blitt beskrevet med hensyn til hver inngangsramme 130 som omfatter fire underseksjoner 150, hvor den første underseksjon 150 ikke trenger å omfatte det samme antall av inngangsprøver som de andre underseksjoner, trenger det ikke å være lik fire som i tilfellet vist i figur 2. For å være mer nøyaktig kan en inngangsramme 130 omfatte i prinsipp et vilkårlig antall av inngangsprøver, som er større enn to ganger størrelsen av prøvefremskrittverdien M (pil 170), hvor antallet av inngangsverdier av den innledende seksjon 160, hvis den er tilstede, kreves å være omfattet av dette antall, fordi det kan være til hjelp i betraktning av at noen realiseringer av en utførelse basert på et system som benytter rammer, hvor hver ramme omfatter et antall av prøver som er identiske med prøvefremskrittsverdien. Med andre ord kan hvilket som helst antall av underseksjoner, hver med en lengde identisk med prøvefremskrittsverdien M (pil 170) bli benyttet innen rammeverket av en utførelse av en analyseiflterbank 100, som er større eller lik tre i tilfellet av et rammebasert system. Hvis dette ikke er tilfellet, kan i prinsipp hvilket som helst antall av inngangsprøver pr. inngangsramme 130 bli benyttet som er større enn to ganger prøvefremskrittsverdien.
Innretningen 110 for vindusteknikk av en utførelse av en analysefilterbank 100, som vist i figur 1 er konstruert for å fremstille et flertall av med vindusteknikk behandlede rammer basert på de korresponderende inngangsrammer 130 på grunnlaget av prøvefremskrittsverdien M (pil 170) på en overlappende måte som tidligere forklart. For å være mer nøyaktig er, avhengig av den konkrete realisering av en innretning 110 for vindusteknikk, innretningen 110 for vindusteknikk konstruert for å fremstille den med vindusteknikk behandlede ramme, basert på en vektingsfunksjon som for eksempel omfatter en logaritmisk avhengighet for å modellere det menneskelige øres hørselskarakteristikk. Imidlertid kan andre vektingsfunksjoner også bli realisert, slike som en vektingsfunksjon som modellerer den psykoakustiske karakteristikken til det menneskelige øre. Imidlertid kan vindusteknikkfunksjonen realisert i en utførelse av en analysefilterbank for eksempel også bli realisert slik at hver av inngangsprøvene av en inngangsramme blir multiplisert med en realverdi vindusteknikkfunksjon omfattende realverdi prøvespesifikke vinduskoeffisienter.
Et eksempel på en slik realisering er vist i figur 2. For å være mer nøyaktig viser figur 2 en grov, skjematisk representasjon av en mulig vindusfunksjon eller en vindusteknikkfunksjon 180, ved hvilken innretningen 110 for vindusteknikk, som vist i figur 1 fremstiller de med vindusteknikk behandlede rammer basert på de korresponderende inngangsrammer 130. Avhengig av den konkrete realisering av en analyseiflterbank 100 kan innretningen 110 for vindusteknikk videre gjøre tilgjengelig med vindusteknikk behandlede rammer for tid/frekvens-omformeren 120 på en annen måte.
Basert på hver av inngangsrammene 130 er innretningen 110 for vindusteknikk konstruert for å fremstille en med vindusteknikk behandlet ramme, hvor hver av de med vindusteknikk behandlede rammer omfatter et flertall av med vindusteknikk behandlede prøver. For å være mer nøyaktig kan innretningen 110 for vindusteknikk være konstruert på forskjellige måter. Avhengig av lengden av en inngangsramme 130 og avhengig av lengden av den med vindusteknikk behandlede ramme som skal bli gjort tilgjengelig for tid/frekvens-omformeren 120, kan mange muligheter av hvordan innretningen 110 for vindusteknikk blir realisert for å fremstille de med vindusteknikk behandlede rammer bli realisert.
Hvis en inngangsramme 130 for eksempel omfatter en innledende seksjon 160, slik at i et tilfelle av en realisering vist i figur 2, den første underseksjon 150-1 av hver av inngangsrammene 130 omfatter så mange inngangsverdier eller inngangsprøver som de andre underseksjoner 150-2 til 150-4, kan innretningen 110 for vindusteknikk for eksempel være konstruert slik at den med vindusteknikk behandlede ramme også omfatter det samme antall av med vindusteknikk behandlede prøver som inngangsrammen 130 omfatter inngangsprøver av inngangsverdier. På grunn av strukturen av inngangsrammer 130 kan som før beskrevet, i dette tilfelle alle inngangsprøver av inngangsrammen bortsett fra inngangsverdier av inngangsrammene 130 i den innledende seksjon 160 bli behandlet av innretningen 110 for vindusteknikk basert på den vindusteknikkfunksjon eller vindusfunksjonen som tidligere er beskrevet. Inngangsverdiene av den innledende seksjon 160 kan i dette tilfelle bli satt til en forutbestemt verdi eller minst til én verdi i et forutbestemt område.
Den forutbestemte verdi kan for eksempel i en utførelse av en analysefilterbank 100 være lik verdien 0 (null), mens i andre utførelser kan andre verdier være ønskelige. For eksempel er det i prinsippet mulig å benytte hvilken som helst verdi med hensyn til den innledende seksjon 160 av inngangsrammene 130, som indikerer at de korresponderende verdier ikke er av betydning med hensyn til audiosignalet. For eksempel kan den forutbestemte verdi være en verdi som er utenfor et typisk område av inngangsprøver fra et audiosignal. Med vindusteknikk behandlede prøver innenfor en seksjon av den med vindusteknikk behandlede ramme, korresponderende med den innledende seksjon 160 av inngangsrammen 130 kan for eksempel bli satt til en verdi av to ganger eller mer av den maksimale amplityde av et inngangsaudiosignal, for å indikere at disse verdier ikke korresponderer med signaler som skal bli behandlet videre. Andre verdier, for eksempel negative verdier av en realiseringsspesifikk absoluttverdi, kan også bli brukt.
Videre kan i utførelser av en analysefilterbank 100, med vindusteknikk behandlede prøver av de med vindusteknikk behandlede rammer korresponderende med den innledende seksjon 160 av en inngangsramme 130 også bli satt til én eller flere verdier i et forutbestemt område. I prinsipp kan et slikt forutbestemt område for eksempel være et område av små verdier som med hensyn til en lydopplevelse er uten betydning, slik at resultatet ikke er hørbart skjelnbart eller slik at lytteopplevelsen ikke blir betydelig forstyrret. I dette tilfelle kan det forutbestemte område for eksempel være uttrykt som et sett av verdier med en absoluttverdi som er mindre eller lik en forhåndsbestemt, programmerbar, tilpasningsbar eller fast maksimal terskelverdi. Sli en terskelverdi kan for eksempel bli uttrykt som en potens av ti eller en potens av to som 10s eller 2S, hvor s er en heltallsverdi som avhenger av den konkrete realisering.
Imidlertid kan i prinsippet det forutbestemte område også omfatte verdier som er større enn noen meningsfulle verdier. For å være mer nøyaktig kan det forutbestemte område også omfatte verdier som omfatter en absoluttverdi som er større enn eller lik en programmerbar, forutbestemt eller fast minste terskelverdi. Slik en minste terskelverdi kan i prinsipp igjen bli uttrykt som en potens av to eller en potens av ti, som 2S eller 10s, hvor s igjen er et heltall som avhenger av den konkrete realisering av en utførelse av en analysefilterbank.
I tilfellet av en digital realisering, kan det forutbestemte område for eksempel omfatte verdier som kan uttrykkes ved å sette eller ikke sette det minst signifikante bit eller flertallet av minst signifikante bit i tilfellet av et forutbestemt område omfattede små verdier. Som tidligere forklart kan i tilfellet der det forutbestemte område omfatter større verdier, det forutbestemte området omfatte verdier som er representerbare ved å sette eller ikke sette de mest signifikante bit eller et flertall av mest signifikante bit. De forutbestemte verdier kan imidlertid så vel som de forutbestemte områder omfatte andre verdier som for eksempel kan være dannet basert på de foran nevnte verdier og terskler ved å multiplisere disse med en faktor.
Avhengig av den konkrete realisering av en utførelse av en analysefilterbank 100, kan innretningen 110 for vindusteknikk også bli tilpasset slik at de med vindusteknikk behandlede rammer som er gjort tilgjengelig ved utgangen 110o ikke omfatter med vindusteknikk behandlede prøver korresponderende med inngangsrammer fra de innledende seksjoner 160 av inngangsrammene 130.1 dette tilfelle kan for eksempel lengden av den med vindusteknikk behandlede ramme og lengden av de korresponderende inngangsrammer 130 være forskjellige fra lengden av den innledende seksjon 160. Med andre ord kan i dette tilfelle innretningen 110 for vindusteknikk være konstruert eller tilpasset til å se bort fra minst en seneste inngangsprøve ifølge ordningen av inngangsprøvene i tid, som tidligere beskrevet. Med andre ord kan i noen utførelser av en analyseiflterbank 100, innretningen 110 for vindusteknikk være konstruert slik at én, flere eller til og med alle inngangsverdier eller inngangsprøver av den innledende seksjon 160 av en inngangsramme 130 blir sett bort fra. I dette tilfelle er lengden av den med vindusteknikk behandlede ramme lik forskjellen mellom lengdene av inngangsrammen 130 og lengden av den innledende seksjon 160 av inngangsrammen 130.
Som en ytterligere valgmulighet trenger hver av inngangsrammene 130 ikke omfatte en innledende seksjon 160 i det hele tatt, som tidligere indikert. I dette tilfelle avviker den første underseksjon 150-1 med hensyn til lengdebeskrivelse av den respektive underseksjon 150, eller med hensyn til antall av inngangsprøver fra de andre underseksjoner 150-2 til 150-4.1 dette tilfelle kan, men trenger ikke, den med vindusteknikk behandlede ramme omfatte med vindusteknikk behandlede prøver eller med vindusteknikk behandlede verdier slik at en liknende første underseksjon av den med vindusteknikk behandlede ramme svarende til den første underseksjon 150-1 av inngangsrammen 130 omfatter det samme antall som med vindusteknikk behandlede prøver eller med vindusteknikk behandlede verdier, som de andre underseksjoner svarende til underseksj onene 150 av inngangsrammen 130.1 dette tilfelle kan de med vindusteknikk behandlede tilleggsprøver eller med vindusteknikk behandlede tilleggsverdier bli satt til en forutbestemt verdi eller minst til én verdi i det forutbestemte område, som tidligere indikert.
Videre kan innretningen 110 for vindusteknikk i realiseringer av en analyseiflterbank 100 være konstruert slik at både inngangsrammen 130 og den resulterende med vindusteknikk behandlede ramme omfatter det samme antall av verdier eller prøver, og hvor både inngangsrammen 130 og de resulterende, med vindusteknikk behandlede rammer ikke omfatter den innledende seksjon 160 eller prøver svarende til den innledende seksjon 160.1 dette tilfelle omfatter den første underseksjon 150-1 av inngangsramme 130 så vel som den korresponderende underseksjon av den med vindusteknikk behandlede ramme færre verdier eller prøver sammenliknet med de andre underseksjoner 150-2 til 150-4 av inngangsrammen 130 av de korresponderende underseksjoner av den med vindusteknikk behandlede ramme.
Det bør bemerkes at i prinsippet trenger den med vindusteknikk behandlede ramme ikke å svare verken til en lengde av en inngangsramme 130 omfattende en innledende seksjon 160, eller til en inngangsramme 130 som ikke omfatter en innledende seksjon 160.1 prinsippet kan innretningen 110 for vindusteknikk også være tilpasset slik at den med vindusteknikk behandlet ramme omfatter én eller flere verdier eller prøver svarende til verdier av den innledende seksjon 160 av en inngangsramme 130.
I denne sammenheng bør det også bemerkes at i noen utførelser av en analysefilterbank 100, representerer den innledende seksjon 160, eller i hvert fall omfatter et forbundet (engelsk: connected) underutvalg av prøveindekser n, som svarer til et forbundet underutvalg av inngangsverdier eller inngangsprøver fra en inngangsramme 130. Ved anvendelighet omfatter dermed også de med vindusteknikk behandlede rammer en korresponderende innledende seksjon som omfatter et forbundet underutvalg av prøveindeks n av med vindusteknikk behandlede prøver svarende til den tilhørende innledende seksjon av den med vindusteknikk behandlede ramme, som også blir referert til som den startende seksjon eller startseksjonen av den med vindusteknikk behandlede ramme. Resten av den med vindusteknikk behandlede ramme uten den innledende seksjon eller startseksjonen, som noen ganger også blir referert til som restseksjonen.
Som allerede tidligere indikert kan innretningen 110 for vindusteknikk i utførelser av en analysefilterbank 100 være tilpassert for å fremstille de med vindusteknikk behandlede prøver av med vindusteknikk behandlede verdier fra en med vindusteknikk behandlet ramme som ikke korresponderer med den innledende seksjon 160 av en inngangsramme 130, hvis i det hele tatt tilstede, basert på en vindusfunksjon som kan innlemme for eksempel psykoakustiske modeller i fremstillingen av de med vindusteknikk behandlete prøver basert på en logaritmisk beregning basert på de korresponderende inngangsprøver. Innretningen 110 for vindusteknikk kan imidlertid også være tilpasset i forskjellige utførelser av en analysefilterbank 100 slik at hver av de med vindusteknikk behandlede prøver blir fremstilt ved å multiplisere en korresponderende inngangsprøve med en prøvespesifikk, med vindusteknikk behandlet koeffisient av vindusfunksjonen definert over et definisjonssett.
I mange utførelser av en analysefilterbank 100 er den korresponderende innretning 110 for vindusteknikk tilpasset slik at vindusfunksjonen, som for eksempel beskrevet ved vinduskoefifsientene, er asymmetrisk over definisjonssettet med hensyn til et midtpunkt av definisjonssettet. Videre omfatter i mange utførelser av en analysefilterbank 100 vinduskoeffisientene av vindusfunksjonen en absoluttverdi fra mer enn 10 %, 20 %, 30 % eller 50 % av en maksimal absoluttverdi av alle vinduskoeffisienter av vindusfunksjonen i den første halvdel av definisjonssettet med hensyn til midtpunktet, hvor vindusfunksjonen omfatter færre vinduskoeffisienter med en absoluttverdi på mer enn den foran nevnte prosentdel av den maksimale absoluttverdi av vinduskoeffisientene i den andre halvdel av definisjonssettet med hensyn til midtpunktet. Slik en vindusfunksjon er vist skjematisk i sammenheng med hver av inngangsrammene 130 i figur 2 som vindusfunksjonen 180. Flere eksempler på vindusfunksjoner vil bli beskrevet i sammenhengen med figur 5 til 11, omfattende en kort drøfting av spektrale og andre egenskaper og muligheter tilbudt av noen utførelser av en analysefilterbank så vel som en syntesefilterbank, som realiserer vindusfunksjoner som vist i disse figurer og er beskrevet i deler av teksten.
Ved siden av innretningen 110 for vindusteknikk omfatter en utførelse av en analysefilterbank 100 også tid/frekvens-omformeren 120 som er forsynt med de med vindusteknikk behandlete rammer fra innretningen 110 for vindusteknikk. Tid/frekvens-omformeren 120 er i sin tur tilpasset for å fremstille en utgangsramme eller et flertall av utgangsrammer for hver av de med vindusteknikk behandlete rammer slik at utgangsrammen er en spektral representasjon av den korresponderende, med vindusteknikk behandlete ramme. Som vil bli forklart mer i detalj senere, er tid/frekvens-omformeren 120 tilpasset slik at utgangsrammen omfatter mindre enn halve antallet av utgangsverdier sammenliknet med antallet av inngangsprøver av en inngangsramme, eller sammenliknet med halve antallet av med vindusteknikk behandlede prøver av en med vindusteknikk behandlet ramme.
Videre kan tid/frekvens-omformeren 120 være realisert slik at den er basert på en diskret cosinustransform og/eller en diskret sinustransform slik at antallet av utgangsprøver av en utgangsramme er mindre enn halve antallet av inngangsprøver av en inngangsramme. Imidlertid vil flere realiseringsdetaljer av mulige utførelser av en analysefilterbank 100 om kort bli skissert.
I noen utførelser av en analyseiflterbank blir en tid/frekvens-omformer 120 konstruert slik at den gir ut et antall av utgangsprøver, som er lik antallet av inngangsprøver av en startseksjon 150-2, 150-3 eller 150-4, som ikke er startseksjonen av den første underseksjon 150-1 av inngangsrammen 130, eller som er identisk med prøvefremskrittsverdien 170. Med andre ord er i mange utførelser av en analysefilterbank 100, antallet av utgangsprøver lik heltallet M som representerer prøvefremskrittverdien av en lengde av den foran nevnte underseksjon 150 av inngangsrammen 130. Typiske verdier av prøvefremskrittverdien eller M er i mange utførelser 480 eller 512. Imidlertid bør det bemerkes at også andre heltall M lett kan bli realisert i utførelser av en analysefilterbank, slik som M = 360.
Videre bør det bemerkes at i noen utførelser av en analyseiflterbank er den innledende seksjon 160 av en inngangsramme 130 eller forskjellen mellom antallet av prøver i de andre underseksjoner 150-2, 150-3, 150-4 og den første underseksjon 150-1 av en inngangsramme 130 er lik M/4. Med andre ord er i tilfellet av en utførelse av en analysefilterbank 100, i hvilken M = 480 lengden av den innledende seksjon 160 eller den foran nevnte forskjell lik 120 (= M/4) prøver, mens i tilfellet av M = 512 er lengden av den innledende seksjon 160 av den foran nevnte forskjell lik 128 (= M/4) i noen utførelser av en analysefilterbank 100. Det bør imidlertid bemerkes at også i dette tilfelle kan andre lengder bli realisert og representerer ikke en begrensning med hensyn til en utførelse av en analyseiflterbank 100.
Som også indikert tidligere, fordi tid/frekvens-omformeren 120 for eksempel kan være basert på en diskret cosinustransform eller en diskret sinustransform blir utførelser av en analysefilterbank noen ganger også drøftet og forklart ut fra at parameter N = 2M representerer en lengde av en inngangsramme av en modifisert diskret cosinustransform (MDCT) -omformer. I de foran nevnte utførelser av en analyseiflterbank 100 er parameteren N derfor lik 960 (M = 480) og 1024 (M = 512).
Som vil bli forklart mer i detalj senere kan utførelser av en analyseiflterbank 100 tilby som en fordel en lavere forsinkelse av en digital audiobehandling uten å redusere audiokvaliteten i det hele tatt, eller noe betydelig. Med andre ord tilbyr en utførelse av en analyseiflterbank muligheten av å realisere en forbedret, lavforsinkelses kodemåte for eksempel innen rammeverket av en (audio-) kodek (kodek = koder/dekoder eller koding/dekoding), for å tilby en lavere forsinkelse ved minst en sammenliknbar frekvensrespons og en forbedret forhåndsekkoadferd sammenliknet med mange tilgjengelige kodeker. Videre vil, som vil bli forklart mer i detalj i sammenhengen med utførelsene av et konferansesystem, bare én enkelt vindusfunksjon for alle typer av signaler være i stand til å oppnå de foran nevnte fordeler i noen utførelser av en analyseiflterbank og utførelser av systemer omfattende en utførelse av en analyseiflterbank 100.
For å understreke: inngangsrammene av utførelser av en analyseiflterbank 100 trenger ikke omfatte de fire underseksjoner 150-1 til 150-4 som illustrert i figur 2. Dette representerer bare én mulighet som har blitt valgt for enkelhets skyld. Følgelig trenger heller ikke innretningen for vindusteknikk å være tilpasset slik at de med vindusteknikk behandlede rammer også omfatter fire korresponderende underseksjoner eller tid/frekvens-omformeren 120 å være tilpasset slik at den er i stand til å gjøre tilgjengelig utgangsrammen basert på en med vindusteknikk behandlet ramme omfattende fire underseksjoner. Dette har simpelthen blitt valgt i sammenhengen med figur 2 for å være mulig å forklare noen utførelser av en analyseiflterbank 100 på en sammenhengende og klar måte. Imidlertid kan påstander i sammenhengen med inngangsrammen med hensyn til lengden av inngangsrammene 130 også være overførbare til lengdene av de med vindusteknikk behandlete rammer som forklart i sammenhengen med de forskjellige valgmuligheter angående den innledende seksjon 160 og dens tilstedeværelse i inngangsrammene 130.
I det følgende vil en mulig realisering av en utførelse av en analysefilterbank
i lys av en feiltolerant, (engelsk: error resilient), (ER) avansert audiokodek, (engelsk: advanced audio codec), (AAC) lavforsinkelses- (engelsk: low delay), (LD) realisering (ER-AAC-LD) bli forklart med hensyn til modifikasjoner for å tilpasse analysefilterbanken av ER-AAC-LD-en for å komme frem til en utførelse av en analyseiflterbank 100 som noen ganger også refereres til som en lavforsinkelse (-s analysefilterbank). Med andre ord, for å oppnå en tilstrekkelig redusert eller lav forsinkelse, kan noen modifikasjoner av en standard koder i tilfellet av en ER-AAC-LD være nyttige, som definert i det følgende.
I dette tilfelle blir innretningen 110 for vindusteknikk av en utførelse av en analysefilterbank 100 konstruert for å fremstille de med vindusteknikk behandlete prøver zinbasert på likningen eller uttrykket
hvor i er et heltall for å indikere en rammeindeks eller en blokkindeks av en med vindusteknikk behandlet ramme og/eller av en inngangsramme, og hvor n er heltallet for å indikere en prøveindeks i området mellom -N og N-l.
Med andre ord er i utførelser omfattende en innledende sekvens 160 i rammeverket av utgangsrammene 130 vindusteknikken utvidet til sendingen ved å realisere uttrykket eller likningen over for prøveindeksen n = -N, ..., N-1, hvor w(n) er en vinduskoeffisient som korresponderer med en vindusfunksjon som vil bli forklart mer i detalj i sammenhengen med figur 5 til 11.1 sammenhengen med en utførelse av analysefilterbanken 100 blir syntesevindusfunksjonen w brukt som analysevindusfunksjonen ved å invertere rekkefølgen, som kan bli sett ved å sammenlikne argumentet av vindusfunksjonen w(n-l-n). Vindusfunksjonen for en utførelse av en syntesefilterbank som skissert i sammenhengen med figur 3 og 4 kan bli konstruert eller fremstilt basert på analyse vindusfunksjonen ved å speile (for eksempel i forhold til et midtpunkt av definisjonssettet) for å oppnå en speilet utgave. Med andre ord viser figur 5 en kurve fra de lavforsinkelses vindusfunksjoner, hvor analysevinduet simpelthen er en tidsreversert gjentakelse av syntesevinduet. I denne sammenheng bør det også bemerkes at x'i;I1 representerer en inngangsprøve eller inngangsverdi som korresponderer med blokkindeksen i og prøveindeksen n.
Sammenliknet med den foran nevnte ER-AAC-LD realisering (for eksempel i formen av en kodek), som er basert på en vinduslengde N av 1024 eller 960 verdier basert på sinusvinduet, er med andre ord vinduslengden av lavforsinkelsesvinduet omfattet av vinduet 110 av utførelsen av analysefilterbanken 100 2N (= 4M), ved å strekke vindusteknikken inn i fortiden.
Som vil bli forklart i mer detalj i sammenhengen med figur 5 til 11 kan vinduskoeffisientene w(n) for n = 0,..., 2N-1 oppfylle forbindelsene gitt i tabell 1 i vedlegget og tabell 3 i vedlegget for henholdsvis N = 960 og N = 1024 i noen utførelser. Videre kan vinduskoeffisientene omfatte verdiene gitt i tabell 2 og 4 i vedlegget for henholdsvis N = 960 og N = 1024 i tilfellet av noen utførelser.
For tid/frekvens-omformeren 120 er kjerne-MDCT-algoritmen (MDCT = Modified Discrete Cosine Transform) som realisert innen rammeverket av ER-AAC-LD-kodeken for det meste uendret, men omfatter det lengre vindu som forklart, slik at n nå løper fra -N til N-l istedenfor å løpe fra null til N-l. De spektrale koeffisienter eller utgangsverdier av utgangsrammen Xi k blir fremstilt basert på den følgende likning eller uttrykket:
hvor zi n er en med vindusteknikk behandlet prøve av en med vindusteknikk behandlet ramme eller en med vindusteknikk behandlet inngangssekvens fra en tid/frekvens-omformer 120 korresponderende til prøveindeksen n og blokkindeksen i som tidligere forklart. Videre er k et heltall for å indikere den spektrale koeffisientindeks og N er et heltall for å indikere to ganger antallet av utgangsverdier av en utgangsramme, eller som tidligere forklart vinduslengden av ett transformvindu basert på vindussekvensverdien som realisert i ER-AAC-LD-kodeken. Heltallet n0er en forskyvningsverdi og er gitt ved
Avhengig av den konkrete lengde av en inngangsramme 130 som forklart i sammenhengen med figur 2, kan tid/frekvens-omformeren bli realisert basert på en med vindusteknikk behandlet ramme omfattende med vindusteknikk behandlete prøver som korresponderer med den innledende seksjon 160 av inngangsrammen 130. I tilfellet av M = 480 eller N = 960 er med andre ord likningene over basert på med vindusteknikk behandlete rammer som omfatter en lengde av 1920 med vindusteknikk behandlete prøver. I tilfellet av en utførelse av en analyseiflterbank 100 i hvilken de med vindusteknikk behandlete rammer ikke omfatter med vindusteknikk behandlete prøver korresponderende med den innledende seksjon 160 av inngangsrammene 130, omfatter de med vindusteknikk behandlete rammer lengden 1800 av med vindusteknikk behandlete prøver i det foran nevnte tilfelle avM = 480.1 dette tilfelle kan likningene gitt over bli tilpasset slik at de korresponderende likninger blir utført. I tilfellet av innretningen 110 for vindusteknikk, kan dette for eksempel føre til at prøveindeksen n løper fra -N, ..., 7N/8-1 i tilfellet av M/4 = N/8 med vindusteknikk behandlete prøver manglende i den første underseksjon, sammenliknet med de andre underseksjoner av den med vindusteknikk behandlet ramme som tidligere forklart.
I tilfellet av en tid/frekvens-omformer 120 kan følgelig likningen gitt over lett bli tilpasset ved å modifisere summeringsindeksene deretter, for ikke å innlemme de med vindusteknikk behandlete prøver av den innledende seksjon eller startseksjonen av den med vindusteknikk behandlet ramme. Selvsagt kan ytterligere modifikasjoner tilsvarende lett bli oppnådd i tilfellet av en annen lengde av den innledende seksjon 160 av inngangsrammene 130 eller i tilfellet av forskjellen mellom lengden av den første underseksjon og de andre underseksjoner av den med vindusteknikk behandlet ramme, som også tidligere forklart.
Avhengig av den konkrete realisering av en utførelse av en analysefilterbank 100 trenger med andre ord ikke alle beregninger som indikert av utrykkene og likningene over å bli utført. Ytterligere utførelser av en analyseiflterbank kan også omfatte en realisering i hvilken i prinsippet antallet av beregninger kan bli enda mer redusert, noe som fører til en høyere beregningsmessig effektivitet. Et eksempel i tilfellet av syntesefilterbanken vil bli beskrevet i sammenhengen med figur 19.
Som også vil bli forklart i sammenheng med en utførelse av en syntesefilterbank, kan i særdeleshet en utførelse av en analyseiflterbank 100 bli realisert innen rammeverket av en såkalt feiltolerant, avansert audiokodek, forbedret lavforsinkelses (engelsk: enhanced low delay) (ELD) (ER-AAC-ELD) som er utledet fra den foran nevnte ER-AAC-LD-kodek. Som beskrevet er analysefilterbanken av ER-AAC-LD-kodeken modifisert for å komme frem til en utførelse av en analyseiflterbank 100 for å kunne tilpasse den lavforsinkelses filterbank som en utførelse av en analyseiflterbank 100. Som vil bli forklart mer i detalj gjør ER-AAC-ELD-kodeken, som omfatter en utførelse av en analyseiflterbank 100 og/eller en utførelse av en synteseiflterbank som vil bli forklart mer i detalj senere, tilgjengelig evnen til å utvide bruken av generisk lav bithastighet audiokoding til anvendelser som trenger en veldig lav forsinkelse koding/dekoding-kjeden. Eksempler kommer for eksempel fra feltene av fulldupleks, sanntids kommunikasjoner i hvilke forskjellige utførelser kan bli innlemmet, slike som utførelser av en analysefilterbank, en syntesefilterbank, en dekoder, en koder, en blander og et konferansesystem.
Forut for å beskrive ytterligere utførelser av den foreliggende oppfinnelse mer i detalj, bør det bemerkes at objekter, strukturer og komponenter med de samme eller liknende funksjonell egenskap er betegnet med de samme referansetegn. Der det ikke uttrykkelig er bemerket annerledes kan beskrivelsen med hensyn til objekter,
strukturer og komponenter med liknende eller like funksjonelle egenskaper og
løsninger bli byttet med hensyn til hverandre. Videre: i det følgende sammendrag vil referansetegn bli benyttet for objekter, strukturer eller komponenter som er identiske eller liknende i én utførelse eller i en vist struktur i én av figurene, der ikke egenskaper eller løsninger av et spesifikt objekt, en struktur eller en komponent blir drøftet. Som et eksempel: i sammenhengen av inngangsrammene 130 har sammenfattende referansetegn allerede blitt innlemmet. I beskrivelsen som vedrører inngangsrammene i figur 2, ble det spesifikke referansetegn av den spesifikke inngangsramme, for eksempel 130-k, benyttet hvis en spesifikk inngangsramme ble referert til, mens i tilfellet av alle inngangsrammer eller én inngangsramme refereres til som ikke er spesifikt skjelnet fra de andre blir referert til, har de sammenfattende referansetegn 130 blitt benyttet. Å benytte sammenfattende referansetegn muliggjør derved en mer kompakt og klarere beskrivelse av utførelser av den foreliggende oppfinnelse.
I denne sammenheng bør det videre bemerkes at innen rammeverket av den foreliggende anvendelse kan en første komponent som er koplet til en andre komponent bli direkte koplet eller koplet via et ytterligere kretsverk eller en ytterligere komponent til den andre komponent. Med andre ord kan innen rammeverket av den foreliggende søknad to komponenter som er tett ved hverandre omfatte de to alternativer av at komponentene blir koplet direkte til hverandre eller via et ytterligere kretsverk av en ytterligere komponent.
Figur 3 viser en utførelse av en synteseiflterbank 200 for å filtrere et flertall av inngangsrammer, hvor hver inngangsramme omfatter et antall av ordnede inngangsverdier. Utførelsen av syntesefilterbanken 200 omfatter en frekvens/tid-omformer 210, en innretning 220 for vindusteknikk og en overlapp-/adderer 230 koplet i serie.
Et flertall av inngangsrammer gjort tilgjengelige for utførelsen av syntesefilterbanken 200 vil bli behandlet først av frekvens/tid-omformeren 210. Den er i stand til å fremstille et flertall av utgangsrammer basert på inngangsrammene slik at hver utgangsramme er en tidsrepresentasjon av den korresponderende inngangsramme. Med andre ord utfører frekvens/tid-omformeren 210 en overgang for hver inngangsramme fra frekvensdomenet til tidsdomenet.
Innretningen 220 for vindusteknikk som er koplet til frekvens/tid-omformeren 210 er så i stand til å behandle hver utgangsramme som blir gjort tilgjengelig fra frekvens/tid-omformeren 210 for å fremstille en med vindusteknikk behandlet ramme basert på denne utgangsramme. I noen utførelser av en synteseiflterbank 200 er innretningen for vindusteknikk i stand til å fremstille de med vindusteknikk behandlete rammer ved å behandle hver av utgangsprøvene av hver av utgangsrammene, hvor hver med vindusteknikk behandlet ramme omfatter et flertall av med vindusteknikk behandlete prøver.
Avhengig av den konkrete realisering av en utførelse av en syntesefilterbank 200, er innretningen 220 for vindusteknikk i stand til å fremstille de med vindusteknikk behandlete rammer basert på utgangsrammene ved å vekte utgangsprøvene basert på en vektingsfunksjon. Som tidligere forklart i sammenhengen med innretningen 110 for vindusteknikk i figur 1, kan vektingsfunksjonen for eksempel være basert på en psykoakustisk modell som innlemmer hørselsevnene eller egenskaper ved det menneskelige øre, slike som den logaritmiske avhengighet av styrke av et audiosignal.
Som tillegg eller alternativ kan innretningen 220 for vindusteknikk også fremstille den med vindusteknikk behandlet ramme basert på utgangsrammen ved å multiplisere hver utgangsprøve av en utgangsramme med en prøvespesifikk verdi av et vindu, en vindusteknikkfunksjon eller en vindusfunksjon. Disse verdier blir også referert til som vinduskoeffisienter eller vindusteknikkkoeffisienter. Med andre ord kan innretningen 220 for vindusteknikk bli tilpasset minst i noen utførelser av en synteseiflterbank 200 for å fremstille de med vindusteknikk behandlede prøver av en med vindusteknikk behandlet ramme ved å multiplisere disse med en vindusfunksjon som tildeler en realverdi vinduskoeffisient til hver av et sett av elementer fra et definisjonssett.
Eksempler av slike vindusfunksjoner vil bli drøftet mer i detalj i sammenhengen med figur 5 til 11. Det bør videre bemerkes at disse vindusfunksjoner kan være asymmetriske eller ikke symmetriske i forhold til et midtpunkt av definisjonssettet, som i sin tur ikke selv trenger å være et element av definisjonssettet.
Innretningen 220 for vindusteknikk fremstiller videre flertallet av med vindusteknikk behandlede prøver for en videre behandling på en overlappende måte basert på en prøvefremskrittsverdi ved overlapp-/addereren 230, som vil bli forklart mer i detalj i sammenhengen med figur 4. Med andre ord omfatter hver av de med vindusteknikk behandlede rammer flere enn to ganger antallet av med vindusteknikk behandlede prøver sammenliknet med et antall av adderte prøver som er gjort tilgjengelige av overlapp-/addereren 230 koplet til en utgang av innretningen 220 for vindusteknikk. Som en følge er så overlapp-/addereren i stand til å fremstille en addert ramme på en overlappende måte ved å addere opp minst tre med vindusteknikk behandlede prøver fra minst tre forskjellige med vindusteknikk behandlede rammer for i hvert fall noen av de adderte prøver i utførelser av en syntesefilterbank 200.
Overlapp-/addereren 230 koplet til innretningen 220 for vindusteknikk blir så i stand til å fremstille eller gjøre tilgjengelig en addert ramme for hver nylig mottatte, med vindusteknikk behandlete ramme. Som tidligere nevnte virker imidlertid overlapp-/addereren 230 på de med vindusteknikk behandlede rammer på en overlappende måte for å fremstille én enkelt addert ramme.
Hver addert ramme omfatter en startseksjon og en restseksjon, noe som vil bli forklart mer i detalj i sammenhengen med figur 4, og omfatter videre et flertall av adderte prøver ved å addere minst tre med vindusteknikk behandlete prøver fra minst tre forskjellige med vindusteknikk behandlete rammer for en addert i restseksjonen av en addert ramme og ved å addere minst to med vindusteknikk behandlete prøver fra minst to forskjellige med vindusteknikk behandlete rammer for en addert prøve i startseksjonen. Avhengig av realiseringen kan antallet av med vindusteknikk behandlete prøver addert for å oppnå en addert prøve i restseksjonen være minst én prøve høyere sammenliknet med antallet av med vindusteknikk behandlete prøver addert for å oppnå en addert prøve i startseksjonen.
Alternativt eller i tillegg og avhengig av den konkrete realisering av en utførelse av en syntesefilterbank 200, kan innretningen 220 for vindusteknikk også være konstruert for å se bort fra de tidligste utgangsverdier ifølge ordenen av de ordnede utgangsprøver, for å sette de korresponderende, med vindusteknikk behandlede prøver til en forutbestemt verdi, eller minst til en verdi i det forutbestemte område for hver med vindusteknikk behandlet ramme av flertallet av med vindusteknikk behandlede rammer. Videre kan overlapp-/addereren 230 i dette tilfelle være i stand til å sørge for den adderte prøve i restseksjonen av en addert ramme, basert på minst tre med vindusteknikk behandlede prøver fra minst tre forskjellige med vindusteknikk behandlede rammer og en addert prøve i startseksjonen basert på minst to med vindusteknikk behandlede prøver fra minst to forskjellige med vindusteknikk behandlede rammer, som vil bli forklart i sammenhengen med figur 4.
Figur 4 viser en skjematisk representering av fem utgangsrammer 240 som korresponderer med rammeindeksverdiene k, k-1, k-2, k-3 og k+1, som er merket deretter. Liknende den skjematiske representasjon vist i figur 2, er de fem utgangsrammer 240 vist i figur 4 arrangert etter deres orden i forhold til tiden som indikert ved en pil 250. Med referanse til utgangsrammen 240-k, refererer utgangsrammene 240-(k-l), 240-(k-2) og 240-(k-3) til tidligere utgangsrammer 240. Følgelig er utgangsrammen 240-(k+l) med hensyn til utgangsrammen 240-k en etterfølgende eller en fremtidig utgangsramme.
Som allerede drøftet i sammenhengen med inngangsrammene 130 i figur 2, omfatter også utgangsrammene 240 vist i figur 4 i tilfellet av utførelsen vist i figur 4, fire undergrupper 260-1, 260-2, 260-3 og 260-4 hver. Avhengig av den konkrete realisering av utførelsen av en syntesefilterbank 200 kan, men trenger ikke, den første underseksjon 260-1 av hver av utgangsrammene 240 omfatte en innledende seksjon 270 som allerede ble drøftet innen rammeverket av figur 2 i sammenhengen med den innledende seksjon 160 av inngangsrammene 130. Som en følge kan den første underseksjon 260-1 være kortere sammenliknet med de andre underseksjoner 260-2, 260-3 og 260-4 i utførelsen illustrert i figur 4. De andre underseksjoner 260-2, 260-3 og 260-4 omfatter imidlertid hver et antall av utgangsprøver som er lik den foran nevnte prøvefremskrittsverdi M.
Som beskrevet i sammenhengen med figur 3, er frekvens/tid-omformeren 210 i utførelsen vist i figur 3 forsynt med et flertall av inngangsrammer, på grunnlag av disse fremstiller frekvens/tid-omformeren 210 et flertall av utgangsrammer. I noen utførelser av en synteseiflterbank 200 er lengden av hver av inngangsrammene identisk med prøvefremskrittsverdien M, hvor M enda en gang er et positivt heltall. Utgangsrammene som er fremstilt av frekvens/tid-omformeren 210 omfatter imidlertid mer enn to ganger antallet av inngangsverdier av en inngangsramme. For å være mer nøyaktig omfatter i en utførelse ifølge situasjonen vist i figur 4 utgangsrammene 240 til og med mer enn tre ganger antallet av utgangsprøver sammenliknet med antallet av inngangsverdier, hver av disse omfatter også i utførelser vedrørende den viste situasjon M inngangsverdier. Som en følge kan utgangsrammene bli delt inn i underseksjoner 260, hvor hver av underseksj onene 260 av utgangsrammene 240 (valgbart uten den første underseksjon 260-1, som tidligere drøftet) omfatter M utgangsprøver. Videre kan den innledende seksjon 270 i noen utførelser omfatte M/4 prøver. Med andre ord kan den innledende seksjon 270, hvis den i det hele tatt er tilstede, i tilfelle av M = 480 eller M = 512 omfatte 120 eller 128 prøver eller verdier.
Med ytterligere andre ord, er som tidligere forklart i sammenhengen med utførelsene av analysefilterbanken 100, prøvefremskrittsverdien M også identisk med lengdene av underseksj onene 260-2, 260-3 og 260-4 av utgangsrammene 240. Avhengig av den konkrete realisering av en utførelse av en synteseiflterbank 200 kan også den første underseksjon 260-1 av utgangsrammen 240 omfatte M utgangsprøver. Imidlertid er, hvis den innledende seksjon 270 ikke eksisterer, den første underseksjon 260-1 av hver av utgangsrammene 240 kortere enn de gjenværende underseksjoner 260-2 til 260-4 av utgangsrammen 240.
Som tidligere nevnt gjør frekvens/tid-omformeren 210 tilgjengelig for innretningen 220 for vindusteknikk et flertall av utgangsrammene 240, hvor hver av utgangsrammene omfatter et antall av utgangsprøver som er større enn to ganger prøvefremskrittsverdien M. Innretningen 220 for vindusteknikk blir så i stand til å fremstille med vindusteknikk behandlete rammer basert på den gjeldende utgangsramme 240, som gjort tilgjengelig av frekvens/tid-omformeren 210. Mer eksplisitt: hver av de med vindusteknikk behandlete rammer som korresponderer med en utgangsramme 240 blir fremstilt basert på den vektende funksjon som tidligere nevnt. I en utførelse basert på situasjonen vist i figur 4 er den vektende funksjon i sin tur basert på en vindusfunksjon 280, som er skjematisk vist over hver av utgangsrammene 240.1 denne sammenheng bør det bemerkes at vindusfunksjonen 280 ikke yter noe bidrag for utgangsprøver i den innledende seksjon 270 av utgangsrammen 240, når den er tilstede.
Som en følge må imidlertid, avhengig av de konkrete realiseringer av forskjellige utførelser av en synteseiflterbank 200, forskjellige tilfeller bli vurdert enda en gang. Avhengig av frekvens/tid-omformeren 210 kan innretningen 220 for vindusteknikk være tilpasset eller konstruert helt forskjellig.
På den annen side, hvis den innledende seksjon 270 av utgangsrammene 240 for eksempel er tilstede slik at også de første underseksjoner 260-1 av utgangsrammene 240 omfatter M utgangsprøver, kan innretningen 220 for vindusteknikk bli tilpasset slik at den kan, men ikke trenger, fremstille med vindusteknikk behandlede rammer basert på utgangsrammene omfattende det samme antall av med vindusteknikk behandlede prøver. Med andre ord kan innretningen 220 for vindusteknikk være realisert slik at den fremstiller med vindusteknikk behandlede rammer som også omfatter en innledende seksjon 270 som for eksempel kan være realisert ved å stille de korresponderende, med vindusteknikk behandlede prøver til en forutbestemt verdi (for eksempel: 0, to ganger en høyeste tillatt signalamplityde, etc.) eller til minst én verdi i et forutbestemt område, som tidligere drøftet i sammenhengen med figur 1 og 2.
I dette tilfelle kan både utgangsrammen 240 og den med vindusteknikk behandlede ramme basert på utgangsrammen 240 omfatte det samme antall av prøver eller verdier. De med vindusteknikk behandlede prøver i den innledende seksjon 270 av den med vindusteknikk behandlede ramme trenger imidlertid ikke nødvendigvis avhenge av de korresponderende utgangsprøver av utgangsrammen 240. Den første underseksjon 260-1 av den med vindusteknikk behandlede ramme er imidlertid i forhold til prøvene ikke i den innledende seksjon 270 basert på utgangsrammen 240 som gjort tilgjengelig av frekvens/tid-omformeren 210.
For å sammenfatte: hvis minst én utgangsprøve av den innledende seksjon 270 av en utgangsramme 240 er tilstede, kan den tilsvarende, med vindusteknikk behandlede prøve være satt til en forutbestemt verdi, eller til en verdi i et forutbestemt område, slik som ble forklart i sammenhengen med utførelsen av en analyseiflterbank illustrert i figur 1 og 2.1 tilfellet av at den innledende seksjon 270 omfatter mer enn én med vindusteknikk behandlet prøve, det samme kan også gjelde for dette eller disse andre med vindusteknikk behandlede prøver eller verdier av den innledende seksjon 270.
Videre kan innretningen 220 for vindusteknikk være tilpasset slik at de med vindusteknikk behandlede rammer ikke omfatter en innledende seksjon 270 i det hele tatt. I tilfellet av en slik utførelse av en synteseiflterbank 200 kan innretningen 220 for vindusteknikk være konstruert for å se bort fra utgangsprøvene av utgangsrammene 240 i den innledende seksjon 270 av utgangsrammen 240.
I hvilket som helst av disse tilfeller, avhengig av den konkrete realisering av en slik utførelse kan, men trenger ikke, den første underseksjon 260-1 av en med vindusteknikk behandlet ramme omfatte den innledende seksjon 270. Hvis en innledende seksjon av den med vindusteknikk behandlede ramme eksisterer, trenger ikke de med vindusteknikk behandlede prøver eller verdier av denne seksjon å avhenge av de korresponderende utgangsprøver av den respektive utgangsramme i det hele tatt.
På den annen side, hvis utgangsrammen 240 ikke omfatter den innledende seksjon 270, kan innretningen 220 for vindusteknikk også være konstruert for å fremstille en med vindusteknikk behandlet ramme basert på utgangsrammen 240 som selv omfatter eller ikke omfatter en innledende seksjon 270. Hvis antallet av utgangsprøver av den første underseksjon 260-1 er mindre enn prøvefremskrittsverdien M, kan innretningen for vindusteknikk i noen utførelser av en syntesefilterbank 200 være i stand til å sette de med vindusteknikk behandlede prøver som svarer til de "manglende utgangsprøver" av den innledende seksjon 270 av den med vindusteknikk behandlede ramme til den forutbestemte verdi eller minst til én verdi i det forutbestemte område. Med andre ord kan innretningen 220 for vindusteknikk i dette tilfelle være i stand til å fylle opp den med vindusteknikk behandlede ramme med den forutbestemte verdi eller minst én verdi i det forutbestemte område slik at den resulterende, med vindusteknikk behandlede ramme omfatter et antall av med vindusteknikk behandlede prøver, som er et heltallsmultiplum av prøvefremskrittverdien M, størrelsen av en inngangsramme eller lengden av en addert ramme.
Som en ytterligere valgmulighet som kan bli realisert trenger hverken utgangsrammene 240 eller de med vindusteknikk behandlede rammer omfatte en innledende seksjon i det hele tatt. I dette tilfelle kan innretningen 220 for vindusteknikk være konstruert for simpelthen å vekte minst noen av utgangsprøvene fra utgangsrammen for å oppnå den med vindusteknikk behandlede ramme. I tillegg eller alternativt kan innretningen 220 for vindusteknikk benytte en vindusfunksjon 280 eller liknende.
Som tidligere forklart i sammenhengen med utførelsen av analysefilterbanken 100 vist i figur 1 og 2, korresponderer den innledende seksjon 270 av utgangsrammene 240 med de tidligste prøver i utgangsrammen 250 i betydningen at disse verdier svarer til de "ferskeste" prøver med den minste prøveindeks. Med andre ord, alle utgangsprøver fra utgangsrammen 240 tatt i betraktning, refererer disse prøver til prøver svarende til at en minste mengde av tid har løpt under avspilling av en tilsvarende addert prøve som gjort tilgjengelig fra overlapp-/addereren 230, sammenliknet med de andre utgangsprøver av utgangsrammen 240. Med andre ord: inne i utgangsrammen 240 og inne i hver av underseksj onene 260 av utgangsrammen svarer de ferskeste utgangsprøver til en posisjon til venstre i den respektive utgangsramme 240 eller underseksjon 260. Med ytterligere andre ord: tiden som indikert ved pilen 250 svarer til sekvensen av utgangsrammer 240 og ikke til sekvensen av utgangsprøver inne i hver av utgangsrammene 240.
Før prosessen av overlapp-/addereren 230 for de med vindusteknikk behandlede rammer 240 beskrives mer i detalj, bør det imidlertid bemerkes at i mange utførelser av syntesefilterbanken 200 er frekvens/tid-omformeren 210 og/eller innretningen 220 for vindusteknikk tilpasset slik at den innledende seksjon 270 av utgangsrammen 240 og den med vindusteknikk behandlede ramme enten er helt tilstede eller ikke er tilstede i det hele tatt. I det første tilfelle er antallet av utgangsprøver eller med vindusteknikk behandlede prøver i den første underseksjon 260-1 følgelig lik antallet av utgangsprøver i en utgangsramme, som er lik M. Utførelser av en syntesefilterbank 200 kan også være realisert, i hvilken enten den ene eller begge av frekvens/tid-omformeren 210 og innretningen 220 for vindusteknikk kan være konstruert slik at den innledende seksjon 270 er tilstede, men antallet av prøver i den første underseksjon 260-1 er enda mindre enn antallet av utgangsprøver i en utgangsramme fra en frekvens/tid-omformer 210. Videre bør det bemerkes at i mange utførelser blir alle prøver eller alle verdier av hvilken som helst av rammene behandlet som sådan, selv om selvsagt bare én enkelt eller en brøkdel av de korresponderende verdier eller prøver kan bli benyttet.
Overlapp-/addereren 230 koplet til innretningen 220 for vindusteknikk er i stand til å sørge for en addert ramme 290, som vist ved bunnen av figur 4, som omfatter en startseksjon 300 og en restseksjon 310. Avhengig av den konkrete realisering av en utførelse av en syntesefilterbank 200, kan overlapp-/addereren 230 bli realisert slik at en addert prøve som omfattet i den adderte ramme i startseksjonen blir oppnådd ved å addere minst to med vindusteknikk behandlete prøver av minst to forskjellige med vindusteknikk behandlede rammer. For å være mer nøyaktig, fordi utførelsene vist i figur 4 er basert på fire underseksjoner 260-1 til 260-4 i det tilfelle at hver utgangsramme 240 og de korresponderende med vindusteknikk behandlede rammer, blir en addert prøve i startseksjonen 300 basert på tre eller fire med vindusteknikk behandlede prøver eller verdier fra henholdsvis minst tre eller fire forskjellige med vindusteknikk behandlede rammer, som indikert ved en pil 320. Spørsmålet om tre eller fire med vindusteknikk behandlede prøver vil bli benyttet i tilfellet av utførelsen benyttet i figur 4, avhenger av den konkrete realisering av utførelsen med hensyn til den innledende seksjon 270 av den med vindusteknikk behandlede ramme basert på den korresponderende utgangsramme 240-k.
I det følgende, med referanse til figur 4, kan man tenke seg utgangsrammene 240 som vist i figur 4 som de med vindusteknikk behandlede rammer som er gjort tilgjengelige av innretningen 220 for vindusteknikk basert på de respektive utgangsrammer 240, mens de med vindusteknikk behandlede rammer blir oppnådd i situasjonen illustrert i figur 4 ved å multiplisere minst utgangsprøvene av utgangsrammene 240 utenfor den innledende seksjon 270 med verdier utledet fra vindusfunksjonen 280. Dermed kan i det følgende, med hensyn til overlapp-/addereren 230, referansetegn 240 også bli benyttet for en med vindusteknikk behandlet ramme.
I tilfellet av at innretningen 220 for vindusteknikk er tilpasset slik at de med vindusteknikk behandlede prøver i en eksisterende innledende seksjon 270 er satt til en forutbestemt verdi, eller en verdi i det forutbestemte område, kan den med vindusteknikk behandlede prøve eller den med vindusteknikk behandlede verdi i den innledende seksjon 270 bli benyttet i å addere opp de gjenværende tre adderte prøver fra den andre underseksjon av den med vindusteknikk behandlede ramme 240-(k-l)
(korresponderende med utgangsrammen 240-(k-l)), den tredje underseksjon fra den med vindusteknikk behandlede ramme 240-(k-2) (korresponderende med utgangsrammen 240-(k-2)) og den fjerde underseksjon av den med vindusteknikk behandlede ramme 240-(k-3) (korresponderende med utgangsrammen 240-(k-3)), hvis den forutbestemte verdi eller det forutbestemte område er slik at å summere opp de med vindusteknikk behandlede prøver fra den innledende seksjon 270 av den med vindusteknikk behandlede ramme 240 - k (korresponderende med utgangsrammen 240 - k) ikke betydelig forstyrrer eller endrer utfallet.
I tilfellet at innretningen 220 for vindusteknikk er tilpasset slik at en innledende seksjon 270 ikke eksisterer i tilfellet av en med vindusteknikk behandlet ramme, blir normalt den korresponderende, adderte prøve i startseksjonen 300 oppnådd ved å addere de minst to med vindusteknikk behandlede prøver fra de minst to med vindusteknikk behandlede rammer. Fordi utførelsen vist i figur 4 er basert på en med vindusteknikk behandlet ramme omfattende fire underseksjoner 260 hver, blir imidlertid i dette tilfelle de adderte prøver i startseksjonen av den adderte ramme 290 oppnådd ved å addere opp de foran nevnte tre med vindusteknikk behandlete prøver fra de med vindusteknikk behandlete rammer 240-(k-l), 240-(k-2) og 240-(k-3).
Dette tilfelle kan for eksempel være forårsaket av at innretningen 220 for vindusteknikk er tilpasset slik at en korresponderende utgangsprøve av en utgangsramme blir sett bort fra av innretningen 220 for vindusteknikk. Videre bør det bemerkes at hvis den forutbestemte verdi eller det forutbestemte område omfatter verdier som ville føre til en forstyrrelse av den adderte prøve, kan overlapp-/addereren 230 være konstruert slik at den korresponderende, med vindusteknikk behandlete prøve ikke blir tatt til vurdering for å addere opp den respektive med vindusteknikk behandlete prøve for å oppnå den adderte prøve. I dette tilfelle kan med vindusteknikk behandlede prøver i den innledende seksjon 270 også bli vurdert å bli sett bort fra av overlapp-/addereren, fordi de korresponderende med vindusteknikk behandlete prøver ikke vil bli benyttet for å oppnå den adderte prøve i startseksjonen 300.
Med hensyn til en addert prøve i restseksjonen 310, som indikert ved pil 330 i figur 4, er overlapp-/addereren 230 tilpasset for å addere opp minst tre med vindusteknikk behandlede prøver fra minst tre forskjellige med vindusteknikk behandlede rammer 240 (korresponderende med tre forskjellige utgangsrammer 240). På grunn av det faktum at en med vindusteknikk behandlet ramme 240 i utførelsen vist i figur 4 omfatter fire underseksjoner 260, vil enda en gang en addert prøve i restseksjonen 310 bli fremstilt av overlapp-/addereren 230 ved å addere opp fire med vindusteknikk behandlete prøver fra fire forskjellige med vindusteknikk behandlede rammer 240. For å være mer nøyaktig: en addert prøve i restseksjonen 310 av den adderte ramme 290 blir oppnådd av overlapp-/addereren 230 ved å addere opp den korresponderende med vindusteknikk behandlet prøve fra den første seksjon 260-1 av den med vindusteknikk behandlede ramme 240-k, fra den andre underseksjon 260-2 av den med vindusteknikk behandlet ramme 240-(k-l), fra den tredje underseksjon 260-3 fra den med vindusteknikk behandlede ramme 240-(k-2) og fra den fjerde underseksjon 260-4 fra den med vindusteknikk behandlede ramme 240-(k-3).
Som en følge av den beskrevne overlapp-/adderingsprosedyre som beskrevet, omfatter den adderte ramme 290 M = N/2 adderte prøver. Med andre ord er prøvefremskrittsverdien M lik lengden av den adderte ramme 290. Videre er minst med hensyn til noen utførelser av en synteseiflterbank 200 også lengden av en inngangsramme lik prøvefremskrittsverdien M, som tidligere nevnt.
Det faktum at i utførelsen vist i figur 4 blir minst tre eller fire med vindusteknikk behandlete prøver benyttet for å oppnå henholdsvis en addert prøve i startseksjonen 300 og i restseksjonen 310 av den adderte ramme, har blitt valgt kun for enkelhets skyld. I utførelsen vist i figur 4 omfatter hver av utgangsrammene/de med vindusteknikk behandlede rammer 240 fire startende seksjoner 260-1 til 260-4.1 prinsippet kan imidlertid en utførelse av syntesefilterbanken lett bli realisert i hvilken en utgangsramme eller en med vindusteknikk behandlet ramme omfatter bare én med vindusteknikk behandlet prøve mer enn to ganger antallet av adderte prøver av en addert ramme 290. Med andre ord kan en utførelse av en synteseiflterbank 200 bli tilpasset slik at hver med vindusteknikk behandlede ramme omfatter bare 2M+1 med vindusteknikk behandlede prøver.
Som forklart i sammenhengen med en utførelse av en analyseiflterbank 100, kan en utførelse av en synteseiflterbank 200 også bli innlemmet i rammeverket av en ER-AAC-ELD-kodek (kodek = koder / dekoder) ved en modifikasjon av en ER-AAC-LD-kodek. Derfor kan en utførelse av et syntesefilter 200 bli benyttet i sammenhengen med en AAC-LD-kodek for å definere et lav bithastighets og lavforsinkelses audiokoding/audiodekodingssystem. For eksempel kan en utførelse av en synteseiflterbank omfatte en dekoder for ER-AAC-ELD-kodeken ved siden av et valgbart SBR-verktøy (SBR = Spectral Bank Replication). For å oppnå en tilstrekkelig lav forsinkelse kan imidlertid noen modifikasjoner være å anbefale å realisere sammenliknet med en ER-AAC-LD-kodek, for å komme frem til en realisering av en utførelse av en synteseiflterbank 200.
Syntesefilterbanken fra de foran nevnte kodeker kan bli modifisert for å tilpasse en utførelse av en lav (syntese-) filterbank, hvor kjerne iMDCT-algoritmen (IMDCT = Invers, modifisert, diskret cosinustransform) kan bestå for det meste uendret for frekvens/tid-omformeren 210. Sammenliknet med en IMDCT frekvens/tid-omformer kan imidlertid frekvens/tid-omformeren 210 bli realisert med en lengre vindusfunksjon, slik at prøveindeksen n nå heller løper opp til 2N-1 enn opp til N-l.
For å være mer nøyaktig kan frekvens/tid-omformeren 210 bli realisert slik at den er konstruert for å gjøre tilgjengelig utgangsverdier xi n basert på et uttrykk
hvor n, som tidligere nevnt er et heltall for å indikere en prøveindeks, i er et heltall for å indikere an vindusindeks, k er en spektral koeffisientindeks, N er en vinduslengde basert på parameteren "vindussekvens" fra en ER-AAC-LD-kodekrealisering slik at heltall N er to ganger antallet av adderte prøver av en addert ramme 290. Videre er n0forskyvningsverdi gitt ved
hvor spec[i][k] er en inngangsverdi som korresponderer med den spektrale koeffisientindeks k og vindusindeksen I fra inngangsrammen. I noen utførelser av en synteseiflterbank 200 er parameteren N lik 960 eller 1024.1 prinsippet kan imidlertid parameteren N også anta hvilken som helst verdi. Med andre ord kan ytterligere utførelser av en syntesefilterbank 200 virke basert på en parameter N = 360 eller andre verdier.
Innretningen 220 for vindusteknikk og overlapp-/addereren 230 kan også være modifisert sammenliknet med vindusteknikken og overlapp-/adderingen realisert innen rammeverket av en ER-AAC-LD-kodek. For å være mer nøyaktig: sammenliknet med den foran nevnte kodek, blir lengden N av en vindusfunksjon erstattet av en vindusfunksjon av lengde 2N med mer overlapp i fortiden og mindre overlapp i fremtiden. Som senere vil bli forklart i sammenhengen med den følgende figur 5 til 11, kan i utførelser av en syntesefilterbank 200 vindusfunksjoner omfattende M/4 = N/8 verdier eller vinduskoeffisienter i virkeligheten bli satt til null. Som en følge korresponderer disse vinduskoeffisienter med de innledende seksjoner 160 og 270 av de respektive rammer. Som tidligere forklart trenger denne seksjonen ikke være realisert i det hele tatt. Som et mulig alternativ kan de korresponderende moduler (for eksempel innretningene for vindusteknikk 110 og 220) være konstruert slik at å multiplisere med null ikke er nødvendig. Som tidligere forklart kan de med vindusteknikk behandlete prøver bli satt til null eller kan bli sett bort fra, for å nevne bare to mulige realiseringsrelaterte forskjeller i utførelser.
Følgelig kan vindusteknikken utført av innretningen 220 for vindusteknikk i tilfellet av en slik utførelse av en syntesefilterbank omfattende en slik lavforsinkelses vindusfunksjon bli realisert ifølge
hvor vindusfunksjonen med vinduskoeffisientene w(n) nå har en lengde på 2N vinduskoeffisienter. Dermed løper prøveindeksen fra N = 0 til N = 2N-2, hvor forhold så vel som verdier av vinduskoeffisientene av forskjellige vindusfunksjoner er omfattet av tabell 1 til 4 i vedlegget for forskjellige utførelser av en syntesefilterbank. Videre kan overlapp-/addereren 230 være realisert ifølge, eller basert på uttrykket eller likningen
hvor uttrykkene og likningene gitt foran kan bli noe endret avhengig av den konkrete realisering av en utførelse av en syntesefilterbank 200. Avhengig av den konkrete realisering særlig i betraktning av det faktum at en med vindusteknikk behandlet ramme ikke trenger omfatte en innledende seksjon kan med andre ord likningene og uttrykkene gitt over for eksempel bli endret med hensyn til grenser av summeringsindeksene for å utelate med vindusteknikk behandlede prøver av den innledende seksjon i tilfellet av at en innledende seksjon ikke er tilstede eller omfatter trivielle med vindusteknikk behandlete prøver (for eksempel prøver med verdien null). Ved å realisere minst én av en utførelse av en analyseiflterbank 100 eller av en synteseiflterbank 200, kan med andre ord en ER-AAC-LD-kodek valgbart med et hensiktsmessig SBR-verktøy bli realisert for å oppnå en ER-AAC-ELD-kodek, som for eksempel kan bli benyttet for å oppnå en lavbithastighets og/eller et lavforsinkelses audiokodingssystem og audiodekodingssystem. En oversikt over en koder og en dekoder vil henholdsvis bli gitt i rammeverket av figur 12 og 13.
Som allerede indikert flere ganger kan både utførelser av en analysefilterbank 100 og av en syntesefilterbank 200 tilby fordelen av å muliggjøre en forbedret lavforsinkelses kodemåte ved å realisere en lavforsinkelses vindusfunksjon innen rammeverket av en analyse-/syntesefilterbank 100 og 200 så vel som innen rammeverket av utførelser av en koder og en dekoder. Ved å realisere en utførelse av en analyseiflterbank eller en syntesefilterbank, som kan omfatte én av vindusfunksjonene, som vil bli beskrevet mer i detalj i sammenhengen med figur 5 til 11, kan mange fordeler bli oppnådd avhengig av den konkrete realisering av en utførelse av en filterbank omfattende en lavforsinkelses vindusfunksjon. Under henvisning til sammenhengen med figur 2, kan en realisering av en utførelse av en filterbank være i stand til å fremstille forsinkelsen sammenliknet med kodeken basert på ortogonale vinduer, som er brukt i alle spissteknologiske kodeker. For eksempel kan i tilfellet av at systemet er basert på parameteren N = 960, forsinkelsesreduksjonen fra 960 prøver som er lik en forsinkelse på 20 ms ved en samplingfrekvens på 48 kHz til 700 prøver bli realisert, som er lik en forsinkelse på 15 ms ved samme samplingfrekvens. Som vil bli vist likner videre frekvensresponsen av en utførelse av en synteseiflterbank og/eller av en analyseiflterbank veldig på filterbanken som benytter et fortegnsvindu. Ved sammenlikning med en filterbank som benytter det såkalte lavoverlappvindu (engelsk: low overlap window) er frekvensresponsen enda mye bedre. Videre er forhåndsekkoadferden liknende lavoverlappvinduet, slik at en utførelse av en syntesefilterbank og/eller av en analysefilterbank kan representere en utmerket avveining mellom kvalitet og lav forsinkelse avhengig av den konkrete realisering av en utførelse av filterbankene. En ytterligere fordel som for eksempel kan bli benyttet innen rammeverket av en utførelse av et konferansesystem er at bare én vindusfunksjon kan bli benyttet for å behandle alle typer av signaler.
Figur 5 viser en grafisk representasjon av en mulig vindusfunksjon som for eksempel kan bli benyttet innen rammeverket av en innretning 110 og 220 for vindusteknikk i tilfellet av en utførelse av en analyseiflterbank 100 og i tilfellet av en synteseiflterbank 200. For å være mer nøyaktig korresponderer vindusfunksj onene vist i figur 5 med en analysevindusfunksjon for M = 480 bånd eller et antall av utgangsprøver i tilfellet av en utførelse av en analyseiflterbank i den øvre graf.
Den nedre graf av figur 5 viser den korresponderende syntesevindusfunksjon for en utførelse av en syntesefilterbank. Fordi begge vindusfunksjoner vist i figur 5 korresponderer med M = 480 bånd eller prøver av en utgangsramme (analyseiflterbank) og en addert ramme (syntesefilterbank), omfatter vindusfunksj onene vist i figur 5 definisjonssettet av 1920 verdier, hver med indeksen n = 0. 1919.
Som de to grafer i figur 5 videre klart viser: med hensyn til et midtpunkt av definisjonssettet, som i tilfellet her ikke selv er del av definisjonssettet fordi midtpunktet ligger mellom indeks N = 959 og N = 960, omfatter begge vindusfunksjonene et betydelig høyere antall av vinduskoeffisienter i én halvdel av definisjonssettet med hensyn til det foran nevnte midtpunkt med absoluttverdier av vinduskoeffisientene som er større enn 10 %, 20 %, 30 % eller 50 % av den maksimale absoluttverdi av alle vinduskoeffisienter. I tilfellet av analysevindusfunksjonen i den øvre graf av figur 5 er den tilhørende halvdel av definisjonssettet definisjonssettet som omfatter indeks N = 960, ..., 1919, mens i tilfellet av syntesevindusfunksjonen i den nedre graf av figur 5, omfatter den tilhørende halvdel av definisjonssettet med hensyn til midtpunktet indeksen N = 0, ..., 959. Som en konsekvens med hensyn til midtpunktet, er både
analysevindusfunksjonen og syntesevindusfunksjonen sterkt asymmetrisk.
Som allerede vist i sammenhengen med både innretningen 110 for vindusteknikk av en utførelse av analysefilterbanken så vel som i tilfellet av innretningen 220 for vindusteknikk av utførelsen av syntesefilterbanken, er analysevindusfunksjonen og syntesevindusfunksjonen beskrevet med hensyn til indeksene, en invers av hverandre.
Et viktig synspunkt med hensyn til vindusfunksjonen vist i de to grafer i figur 5 er at i tilfellet av analysevinduet vist i den øvre graf er de siste 120 vindusteknikk-koeffisienter og i tilfellet av syntesevindusfunksjonen i den nedre graf i figur 5 de første 120 vinduskoeffisienter satt til null eller omfatter en absoluttverdi slik at de kan bli betraktet å være lik 0 innenfor en rimelig nøyaktighet. Derfor kan med andre ord de foran nevnte 120 vindusteknikk-koeffisienter fra de to vindusfunksjoner bli ansett for å forårsake et hensiktsmessig antall av prøver som skal bli satt til minst én verdi i et forutbestemt område ved å multiplisere de 120 vinduskoeffisienter med de respektive prøver. Avhengig av den konkrete realisering av utførelser av en analysefilterbank 100 eller en synteseiflterbank 200 vil med andre ord de 120 nullverdi, med vindusteknikk behandlete koeffisienter føre til dannelsen av den innledende seksjon 160 og 270 av de med vindusteknikk behandlede rammer i utførelser av en analyseiflterbank og en synteseiflterbank ved anvendelighet som tidligere forklart. Selv om de innledende seksjoner 160 og 270 ikke er tilstede kan de 120 nullverdi vinduskoeffisienter bli tolket av innretningen 110 for vindusteknikk, av tid/frekvens-omformeren 120, av innretningen 220 for vindusteknikk og av overlapp-/addereren 230 i utførelser av en analysefilterbank 100 og en syntesefilterbank 200 for å behandle eller prosessere de forskjellige rammer deretter, selv i tilfellet at de innledende seksjoner 160 og 270 av de hensiktsmessige rammer ikke er tilstede i det hele tatt.
Ved å realisere en analysevindusfunksjon eller en syntesevindusfunksjon som vist i figur 5, omfattende 120 nullverdi vindusteknikk-koeffisienter i tilfellet av M = 480 (N = 960) vil hensiktsmessige utførelser av en analysefilterbank 100 og en synteseiflterbank 200 bli etablert i hvilke de innledende seksjoner 160 og 270 av de korresponderende rammer omfatter M/4 prøver, eller de tilsvarende første underseksjoner 150-1 og 260-1 omfatter M/4 verdier eller prøver færre enn de andre underseksjoner, for å beskrive det mer generelt.
Som nevnt tidligere representerer analysevindusfunksjonen vist i den øvre graf av figur 5 og syntesevindusfunksjonen vist i den nedre graf av figur 5 lavforsinkelses vindusfunksjoner for både en analyseiflterbank og en syntesefilterbank. Videre er både analysevindusfunksjonen og syntesevindusfunksjonen som vist i figur 3 speilede utgaver av hverandre med hensyn til det foran nevnte midtpunkt av definisjonssettet fra hvilket begge vindusfunksjoner er definert.
Det bør bemerkes at bruken av lavforsinkelsesvinduet og/eller å benytte en utførelse av en analyseiflterbank eller en syntesefilterbank i mange tilfeller ikke fører til noen merkbar økning i beregningsmessig kompleksitet og bare en marginal økning i krav til lagring, som senere vil bli skissert under analysen av kompleksitet.
Vindusfunksj onene vist i figur 5 omfatter verdiene gitt i tabell 2 i vedlegget, som har blitt lagt der bare for enkelhets skyld. Imidlertid er det ikke på langt nær nødvendig for en utførelse av en analysefilterbank eller en syntesefilterbank for å virke på en parameter M = 480 å omfatte de eksakte verdier gitt i tabell 2 i vedlegget. Naturligvis kan den konkrete realisering av en utførelse av en analysefilterbank eller en syntesefilterbank lett benytte varierende vinduskoeffisienter innen rammeverket av hensiktsmessige vindusfunksjoner, slik at i mange tilfeller vil det være tilstrekkelig å benytte vinduskoeffisienter som benytter, i tilfelle av M = 480 relasjonene gitt i tabell 1 i vedlegget.
Videre blir det i mange utførelser med filterkoeffisienter ikke krevet verken fra vinduskoeffisienter eller fra løftende koeffisienter som vil bli innført i det følgende at de gitte figurer blir realisert så nøyaktig som gitt. Med andre ord, i andre utførelser av en analyseiflterbank så vel som en synteseiflterbank og vedrørende utførelser av den foreliggende oppfinnelse, kan også andre vindusfunksjoner bli realisert, som er filterkoefifsienter, vinduskoeffisienter og andre koeffisienter, slike som løftende koeffisienter, som er forskjellig fra koeffisientene gitt under i vedlegget så lenge som variasjonene er innenfor det tredje tall etter kommaet eller i høyere tall, slik som det fjerde, femte o.s.v. tall.
I betraktning av syntesevindusfunksjonen i den nedre graf fra figur 5, er som tidligere nevnt de første M/4 = 120 vinduskoeffisienter satt til null. Senere, omtrent frem til indeks 350 omfatter vindusfunksjonen en bratt stigning som blir fulgt av mer moderat stigning opp til en indeks av omtrent 600.1 denne sammenheng bør det bemerkes at ved omtrent en indeks på 480 (= M), blir vindusfunksjonen større enn enhet eller større enn én. Ved å følge indeks 600 opp til omtrent prøve 1100 faller vindusfunksjonen tilbake fra dens maksimale verdi til et nivå på mindre enn 0,1. Over resten av definisjonssettet omfatter vindusfunksjonen svake svingninger rundt verdien 0.
Figur 6 viser en sammenlikning av vindusfunksjonen som vist i figur 5 i tilfellet av en analysevindusfunksjon i den øvre graf av figur 6 og i tilfellet av en syntesevindusfunksjon i den nedre grav av figur 6. Videre som en prikket linje omfatter to grafer også den såkalte sinusvindusfunksjon, som for eksempel blir benyttet i de foran nevnte ER-AAC-kodeker AAC-LC og AAC-LD. Den direkte sammenlikning av sinusvindu- og lavforsinkelses vindusfunksjonen som vist i de to grafer fra figur 6 illustrerer de forskjellige tidsobjekter fra tidsvinduet som forklart i sammenhengen med figur 5. Ved siden av det faktum at sinusvinduet bare er definert over 960 prøver, er den mest slående forskjell mellom de to vindusfunksjoner vist i tilfellet av en utførelse av en analysefilterbank (øvre graf) og i tilfellet av en synteseiflterbank (nedre graf) at sinusvindusrammefunksjonen er symmetrisk om sitt respektive midtpunkt fra de nedkortede definisjonssett og omfatter i de første 120 elementer av definisjonssettet (for det meste) vinduskoeffisienter som er større enn null. I motsetning omfatter, som tidligere forklart, lavforsinkelsesvindu 120 (ideelt) nullverdi vinduskoeffisienter og er betydelig asymmetrisk med hensyn til dets midtpunkt fra det forlengede definisjonssett sammenliknet med definisjonssettet fra sinusvinduet.
Det er ytterligere en forskjell som skiller lavforsinkelsesvinduet fra sinusvinduet, mens begge vinduer tilnærmet antar en verdi på omtrent 1 og en prøveindeks på 480 (= M), når lavforsinkelsesvindusfunksjonen et maksimum på mer enn én omtrent 120 prøver etter å bli større enn 1 og en prøveindeks på omtrent 600 (= M + M/4 , M = 480), mens det symmetriske sinusvindu avtar symmetrisk ned mot 0. Med andre ord vil prøvene som skal bli behandlet, for eksempel ved multiplisering med null i en første ramme bli multiplisert i den følgende ramme med verdier større enn 1 på grunn av den overlappende virkemåte og prøvefremskrittsverdien på
M = 480 i disse tilfeller.
En ytterligere beskrivelse av ytterligere lavforsinkelses vinduer vil bli gitt, som for eksempel kan bli benyttet i andre utførelser av en analyseiflterbank eller en synteseiflterbank 200, konseptet for forsinkelsesreduksjon som er oppnåelig med vindusfunksj onene vist i figur 5 og 6 vil bli forklart med henvisning til parameteren M = 480 og N = 960 med M/4 = 120 nullverdier eller tilstrekkelig lave verdier. I analysevinduet vist i den øvre graf av figur 6 er delene som tar tilgang til fremtidige inngangsverdier (prøveindekser 1800 til 1920) redusert med 120 prøver. Tilsvarende blir i syntesevinduet i den nedre graf fra figur 6 overlappingen med tidligere utgangsprøver, som ville kreve en tilsvarende forsinkelse i tilfellet av en synteseiflterbank redusert med enda 120 prøver. Med andre ord vil, i tilfellet av et syntesevindu overlappingen med tidligere prøver, som trengs for å komplettere overlappVadderingsfunksjonen eller å fullføre overlapp-/adderingen sammen med reduksjonen på 120 prøver i tilfellet av et analysevindu, føre til en helhetlig forsinkelsesreduksjon på 240 prøver i tilfellet av et system omfattende både utførelsen av en analyseiflterbank og en syntesefilterbank.
Den utvidede overlapping fører imidlertid ikke til noen tilleggsforsinkelse fordi den bare involverer å addere verdier fra fortiden, som lett kan være lagret uten å forårsake tilleggsforsinkelse, i hvert fall i størrelse med samplingfrekvensen. En sammenlikning av tiden for sett av det tradisjonelle sinusvindu og lavforsinkelsesvinduet vist i figur 5 og 6 illustrerer dette.
Figur 7 omfatter i tre grafer tre forskjellige vindusfunksjoner. For å være mer nøyaktig viser den øvre graf fra figur 7 det foran nevnte sinusvindu, mens den midtre grav viser det såkalte lavoverlappvindu og den nedre graf viser lavforsinkelsesvinduet. De tre figurer vist i figur 7 korresponderer imidlertid med en prøvefremskrittsverdi eller parameter M = 512 (N = 2M = 1024). Enda en gang er sinusvinduet og lavoverlappvinduet i de to øvre grafer i figur 7 definert bare over begrensede eller nedkortede definisjonssett omfattende 1024 prøveindekser sammenliknet med lavforsinkelses vindusfunksjonen som vist i den nedre graf av figur 7, som er definert over 2048 prøveindekser.
Kurvene av vindusformer av et sinusvindu, lavoverlappvinduet og lavforsinkelsesvinduet i figur 7 omfatter mer eller mindre de samme karakteristikker som tidligere drøftet med hensyn til sinusvinduet og lavforsinkelsesvinduet. For å være mer nøyaktig er sinusvinduet (øvre graf i figur 7) enda en gang symmetrisk med hensyn til det hensiktsmessige midtpunkt av definisjonssettet liggende mellom indeks 511 og 512. Sinusvinduet antar en maksimal verdi ved omtrent verdien M = 512 og faller ned fra den maksimale verdi tilbake til null igjen ved kanten av definisjonssettet.
I tilfellet av at lavforsinkelsesvinduet vist i den nedre graf av figur 7, omfatter dette lavforsinkelsesvindu 128 nullverdi vinduskoeffisienter, som enda en gang er en firedel av prøvefremskrittsverdien M. Videre antar lavforsinkelsesvinduet en verdi av omtrent 1 ved en prøveindeks M mens den maksimale verdi av vinduskoeffisientene blir antatt omtrent 128 prøveindekser n etter å ha blitt større enn én innenfor en økende indeks (rundt indeks 640). Også med hensyn til de andre egenskaper fra kurven av vindusfunksjonen, avviker vindusfunksjonen for M = 512 i den nedre graf fra figur 7 ikke betydelig fra de lavforsinkelsesvinduer for M = 480 vist i figur 5 og 6, bortsett fra en valgbar forskyvning på grunn av de lengre definisjonssett (2048 indekser sammenliknet med 1920 indekser). Lavforsinkelsesvinduet vist i den nedre graf fra figur 7 omfatter verdien gitt i tabell 4 i vedlegget.
Som tidligere forklart er det imidlertid ikke nødvendig for utførelser av en syntesefilterbank eller en analysefilterbank å realisere vindusfunksjonen med de nøyaktige verdier som gitt i tabell 4. Med andre ord kan vinduskoeffisientene avvike fra verdiene gitt i tabell 4, så lenge de holder relasjonene gitt i tabell 3 i vedlegget. Videre kan i utførelser av den foreliggende oppfinnelse også variasjoner med hensyn til vinduskoeffisientene lett bli realisert, så lenge variasjonene er innenfor det tredje tall etter kommaet, eller i høyere tall slik som det fjerde, femte, etc. tall som tidligere forklart.
I den midtre graf fra figur 7 har lavoverlappvinduet så langt ikke blitt beskrevet. Som tidligere nevnt omfatter lavforsinkelsesvinduet også et definisjonssett omfattende 1024 elementer. Videre omfatter lavoverlappvinduet også i begynnelsen av et definisjonssett og ved enden av et definisjonssett et forbundet undersett, i dette forsvinner lavoverlappvinduet. Etter dette forbundne undersett i hvilket lavoverlappvinduet forsvinner, følger imidlertid en bratt stigning eller reduksjon, som hver omfatter bare noe over 100 prøveindekser. Videre omfatter ikke det symmetriske lavoverlappvindu verdier større enn 1 og kan omfatte en mindre stoppbånddempning sammenliknet med vindusfunksjoner benyttet i noen utførelser.
Lavoverlappvinduet omfatter med andre ord et betydelig lavere definisjonssett mens det har den samme prøvefremskrittsverdi som lavforsinkelsesvinduet og ikke antar verdier større enn én. Videre er både sinusvinduet og lavoverlappvinduet med hensyn til deres respektive midtpunkter av definisjonssettene ortogonale eller symmetriske, mens lavforsinkelsesvinduet er asymmetrisk om midtpunktet av dets definisjonssett på den beskrevne måte.
Lavoverlappvinduet ble innført for å eliminere forhåndsekkomessige unaturligheter for transienter. Den lavere overlapping unngår spredning av kvantiseringsstøy forut for signaltilslaget, som illustrert i figur 8. Det nye lavforsinkelsesvindu har imidlertid den samme egenskap, men tilbyr en bedre frekvensrespons, som vil bli tydelig ved å sammenlikne frekvensresponsene vist i figur 10 og 11. Derfor er lavforsinkelsesvinduet i stand til å erstatte både tradisjonelle AAC-LD vinduer, det vil si fortegnsvinduet ved lavoverlappvinduet, slik at en dynamisk vindusformtilpasning ikke lenger trenger å bli realisert.
Figur 8 viser for de samme funksjoner vist i figur 7 i den samme rekkefølge av grafer et eksempel på spredning av kvantiseringsstøy for de forskjellig vindusformer av sinusvinduet eller overlappvinduet og lavforsinkelsesvinduet. Forhåndsekkoadferden av lavforsinkelsesvinduet som vist i nedre graf av figur 8 likner adferden av lavoverlappvindu som vist i den midtre graf fra figur 8, mens forhåndsekkoadferden av sinusvinduet i den øvre grav av figur 8 omfatter betydelige bidrag i de første 128 (M = 512) prøver.
Med andre ord kan anvendelse av et lavforsinkelsesvindu i en utførelse av en syntesefilterbank eller en analysefilterbank føre til en fordel vedrørende en forbedret forhåndsekkoadferd. I tilfellet av et analysevindu krever fremgangsmåten som tar tilgang til fremtidige inngangsverdier og dermed ville kreve en forsinkelse, blir redusert med mer enn en prøve og helst med 120/128 prøver i tilfellet av en blokklengde eller prøvefremskrittverdi av 480/512 prøver, slik at det reduserer forsinkelsen i sammenlikning med MDCT-en (Modifisert diskret cosinustransform). Ved samme tid forbedrer det forhåndsekkoadferden, siden et mulig tilslag i signalet, som kunne være i disse 120/128 prøver bare ville komme tilsyne én blokk eller én ramme senere. Tilsvarende blir, i syntesevinduet overlappen med tidligere utgangsprøver for å fullføre deres overlapp-/adderingsoperasjon, som også vil kreve en tilsvarende forsinkelse, redusert med ytterligere 120/128 prøver, som resulterer i en helhetlig forsinkelsesreduksjon på 240/256 prøver. Dette fører også til en forbedret forhåndsekkoadferd siden disse 120/128 prøver ellers ville bidra til støyen spredt inn i fortiden, før et mulig tilslag. Sammenlagt betyr dette at et forhåndsekko opptrer muligens én blokk eller ramme senere, og at det resulterende forhåndsekko fra syntesesiden alene blir 120/128 prøver kortere.
En slik reduksjon som kan være oppnåelig ved å benytte et slikt lavforsinkelsesvindu som beskrevet i figur 5 til 7, avhengig av den konkrete realisering av en utførelse av en syntesefilterbank eller en analysefilterbank, kan være spesielt nyttig når man tar i betraktning den menneskelige hørselkarakteristikk, spesielt innenfor maskering. For å illustrere dette viser figur 9 en skjematisk skisse av maskeringsadferden til det menneskelige øre. For å være mer nøyaktig viser figur 9 en skjematisk representasjon av hørselterskelnivået av det menneskelige øre, som en funksjon av tiden, når en lyd eller en tone med en spesifikk frekvens er tilstede under en tidsperiode av omtrent 200 ms.
Kort før den foran nevnte lyd eller tone er tilstede som indikert ved pilen 350 i figur 9, er imidlertid en forhåndsmaskering tilstede under en kort tidsperiode på omtrent 20ms, dermed muliggjøres en jevn overgang mellom ingen maskering og maskeringen under tilstedeværelsen av tonen eller lyden, som noen ganger refereres til som samtidig maskering. Under tiden ved hvilken lyden eller tonen er tilstede er maskeringen på. Når tonen eller lyden forsvinner, som vist ved pilen 360 i figur 9 blir imidlertid ikke maskeringen øyeblikkelig opphevet, men under en tidsperiode på omtrent 150 ms blir maskeringen sakte redusert, dette refereres også noen ganger til som ettermaskering.
Det er slik figur 9 viser en generell tidsmessig maskeringsegenskap av det
menneskelige øre, som omfatter en fase av forhåndsmaskering, så vel som en fase av ettermaskering før og etter at en lyd eller en tone er tilstede. På grunn av reduksjonen av forhåndsekkoadferden ved å innlemme et lavforsinkelsesvindu i en utførelse av en analyseiflterbank 100 og/eller en syntesefilterbank 200, vil hørbare forstyrrelser bli begrenset meget i mange tilfeller fordi de hørbare forhåndsekko vil minst i noen grad
falle i forhåndsmaskeringsperioden av den tidsmessige maskeringsvirkning av det menneskelige øre som vist i figur 9.
Videre vil å benytte en lavforsinkelses vindusfunksjon som illustrert i figur 5 til 7, beskrevet mer i detalj med hensyn til relasjoner og verdier i tabell 1 til 4 i vedlegget, tilby en frekvensrespons som er liknende den fra et sinusvindu. For å illustrere dette viser figur 10 en sammenlikning av frekvensresponsen mellom sinusvinduet (stiplet linje) og et eksempel på et lavforsinkelsesvindu (heltrukket linje). Som man kan se ved å sammenlikne de to frekvensresponser av de to foran nevnte vinduer i figur 10, er lavforsinkelsesvinduet sammenliknbart med hensyn til frekvensselektiviteten med sinusvinduet. Frekvensresponsen fra lavforsinkelsesvinduet er liknende eller sammenliknbar med frekvensresponsen av sinusvinduet og mye bedre enn frekvensresponsen av lavoverlappvinduet, som sammenlikning av frekvensresponsene vist i figur 11 illustrerer.
For å være mer nøyaktig viser figur 11 en sammenlikning av frekvensresponsene mellom sinusvinduet (stiplet linje) og lavoverlappvinduet (heltrukken linje). Som man kan se er den heltrukne linje fra frekvensresponsen av lavoverlappvinduet betydelig større enn den korresponderende frekvensrespons fra sinusvinduet. Fordi lavforsinkelsesvinduet og sinusvinduet viser sammenliknbare frekvensresponser, som man kan se ved å sammenlikne de to frekvensresponser vist i figur 10, kan også en sammenlikning mellom lavoverlappvinduet og lavforsinkelsesvinduet lett kan bli tegnet, slik kurven vist i figur 10 og 11 begge viser frekvensresponsen av sinusvinduet og omfatter de samme mål med hensyn til frekvensaksen og styrkeaksen (dB). Følgelig kan det lett konkluderes at sinusvinduet som lett kan realiseres i en utførelse av en syntesefilterbank, så vel som i en utførelse av en analysefilterbank, sammenliknet med lavoverlappvinduet tilbyr en betydelig bedre frekvensrespons.
Fordi sammenlikningen av forhåndsekkoadferden vist i figur 8 og er vist ved lavforsinkelsesvinduet tilbyr en betydelig fordel sammenliknet med forhåndsekkoadferd, mens forhåndsekkoadferd av lavforsinkelsesvinduet er sammenliknbar med den av et lavoverlappvindu, representerer lavforsinkelsesvinduet et utmerket kompromiss mellom de to foran nevnte vinduer.
Som en følge kan, lavforsinkelsesvinduet som kan bli realisert innen rammeverket av en utførelse av en analysefilterbank like gjerne som en utførelse av en syntesefilterbank og vedrørende utførelser på grunn av dette kompromiss, den samme vindusfunksjon bli benyttet for transiente signaler like gjerne som for tonale signaler, slik at ingen veksling mellom forskjellige blokklengder eller mellom forskjellige vinduer er nødvendig. Med andre ord tilbyr utførelser av en analysefilterbank, en synteseiflterbank og vedrørende utførelser muligheten av å bygge en koder, en dekoder og ytterligere systemer som ikke trenger å veksle mellom forskjellige sett av operasjonelle parametre, slike som forskjellige blokkstørrelser, blokklengder, vinduer eller vindusformer. Med andre ord, ved å benytte en utførelse av en analysefilterbank eller en synteseiflterbank med lavforsinkelsesvinduet, kan konstruksjonen av en utførelse av en koder, en dekoder og vedrørende systemer bli betydelig forenklet. På grunn av det faktum at ingen veksling mellom forskjellige sett av parametre er nødvendig, kan som en tilleggsmulighet signaler fra forskjellig kilder bli behandlet i frekvensdomenet istedenfor i tidsdomenet som krever en tilleggsforsinkelse slik som vil bli skissert i de følgende seksjoner.
Med ytterligere andre ord tilbyr å benytte en utførelse av en syntesefilterbank eller en analyseiflterbank muligheten av å ha fordel av en fordel av lav beregningsmessig kompleksitet i noen utførelser. For å kompensere for den lavere forsinkelse sammenliknet med en MDCT med for eksempel et sinusvindu, blir en lengre overlapping innført uten å skape en tilleggsforsinkelse. Til tross for den lengre overlapping og korresponderende, et vindu av omtrent to ganger lengden av det korresponderende sinusvindu med to ganger mengden av overlapping og følgelig har fordel av frekvensselektiviteten som tidligere skissert, kan en realisering bli oppnådd med bare mindre tilleggskompleksitet på grunn av en mulig økende størrelse av blokklengdemultiplikasjoner og minne-elementer. Imidlertid vil ytterligere detaljer om en slik realisering bli forklart i sammenhengen med figur 19 til 24.
Figur 12 viser et skjematisk blokkskjema over en utførelse av en koder 400. Koderen 400 omfatter en utførelse av en analyseiflterbank 100, og som en valgbar komponent: en entropikoder 410, som er konstruert for å kode flertallet av utgangsrammer gjort tilgjengelige fra analysefilterbanken 100 og konstruert for å gi ut et flertall av kodede rammer basert på utgangsrammene. For eksempel kan entropikoderen 410 være realisert som en Huffman-koder eller en annen entropikoder som benytter et entropieffektivt kodingsskjema, slik som det aritmetiske kodingsskjema.
På grunn av anvendelsen av en utførelse av en analysefilterbank 100 innen rammeverket av en utførelse av en koder 400, tilbyr koderen en utgang for antallet av bånd N, mens den har en rekonstruksjonsforsinkelse på mindre enn 2N eller 2N-1. Videre representerer en utførelse av en koder i prinsippet også et filter, en utførelse av en koder 400 tilbyr en endelig impuls respons på mer enn 2N prøver. Det vil si at en utførelse av en koder 400 representerer en koder som er i stand til å behandle (audio-) data på en forsinkelseseffektiv måte.
Avhengig av den konkrete realisering av en utførelse av en koder 400 som vist i figur 12, kan en slik utførelse også omfatte en kvantiserer, et filter eller ytterligere komponenter for å forbehandle inngangsrammene som er gjort tilgjengelige for utførelsen av analysefilterbanken 100, eller å behandle utgangsrammene forut for å entropikode de respektive rammer. Som et eksempel kan en tilleggskvantiserer være gjort tilgjengelig for en utførelse av en koder 400 før analysefilterbanken 100 for å kvantisere dataene eller å gjenkvantisere dataene avhengig av den konkrete realisering og feltet for anvendelse. Som et eksempel på behandling etter analysefilterbanken, kan en utjevning eller annen forsterkningsjustering med hensyn til utgangsrammene i frekvensdomenet bli realisert.
Figur 13 viser en utførelse av en dekoder 450 omfattende en entropidekoder 460 og en utførelse av en syntesefilterbank 200 som tidligere beskrevet. Entropikoderen 460 fra utførelsen av dekoderen 450 representerer en valgbar komponent som for eksempel kan være konstruert for å dekode et flertall av kodede rammer som for eksempel blir gjort tilgjengelige fra en utførelse av en koder 400. Følgelig kan entropikoderen 460 være av en Huffman-dekoder, algoritmisk dekoder eller en annen entropidekoder basert på en entropi-kodings/dekodings-plan som er hensiktsmessig for anvendelsen av dekoderen 450, som er for hånden. Videre kan entropidekoderen 460 være konstruert for å gjøre tilgjengelig et flertall av inngangsrammer for syntesefilterbanken 200 som i sin tur gjør et flertall av adderte rammer tilgjengelige ved en utgang av syntesefilterbanken 200 eller ved en utgang av dekoderen 450.
Avhengig av den konkrete realisering kan imidlertid dekoderen 450 også omfatte tilleggskomponenter, slike som en dekvantiserer eller andre komponenter slike som en forsterkningsjusterer. For å være mer nøyaktig kan en forsterkningsjusterer bli realisert mellom entropidekoderen 460 og syntesefilterbanken, som en valgbar komponent for å gjøre en forsterkningsjustering eller en utjevning i frekvensdomenet mulig før audiodataene blir overført av syntesefilterbanken 200 til tidsdomenet. Følgelig kan en tilleggskvantiserer bli realisert i en dekoder 450 etter syntesefilterbanken 200 for å tilby muligheten av å gjenkvantisere de adderte rammer forut for å gjøre de valgbart rekvantiserte adderte rammer tilgjengelige for en komponent utenfor dekoderen 450.
Utførelser av en koder 400 som vist i figur 12 og utførelser av en dekoder 450 som vist i figur 13 kan bli benyttet innen mange felt av audio koding/dekoding og audiobehandling. Slike utførelser av en koder 400 og en dekoder 450 kan for eksempel bli benyttet innen feltet høykvalitets kommunikasjon.
Både en utførelse av en koder eller enkoder og en utførelse av en dekoder tilbyr muligheten for å drive den nevnte utførelsen uten å måtte realisere en endring av parameter slik som å veksle blokklengden eller veksle mellom forskjellige vinduer. Med andre ord trenger, sammenliknet med andre kodere og dekodere, en utførelse av den foreliggende oppfinnelse i formen av en syntesefilterbank, en analysefilterbank og vedrørende utførelser, ikke på langt nær å realisere forskjellige blokklengder og/eller forskjellige vindusfunksjoner.
Opprinnelig definert i versjon 2 av MPEG-4 audiospesifikasjon har en lavforsinkelses AAC-koder (AAC-LD) over tid økende tilpasning som en full båndbredde, høy kvalitets kommunikasjonskoder, som ikke er utsatt for begrensninger som vanlige talekodere har, slike som å fokusere på enkelthøyttalere, taleinnhold, dårlig fremstilling av musikksignaler og så videre. Denne bestemte kodek er i vidt bruk for video-/telekonferanse i andre kommunikasjonsanvendelser som for eksempel har utløst skapelsen av en lavforsinkelses AAC-profil på grunn av industri etterspørsel. Uansett er en forbedring av koderens kodingseffektivitet av bred interesse for brukergruppene og er emnet for bidraget som noen utførelser av den foreliggende oppfinnelse er i stand til å gjøre tilgjengelig.
For tiden fremstiller MPEG-4 ER-AAC-LD-kodek god audiokvalitet ved en bithastighet i området fra 64 kb/s til 48 kb/s pr. kanal. For å øke koderens kodingseffektivitet til å bli konkurransedyktig med talekodere er å benytte det velprøvde spektralbåndreplikeringsverktøy (engelsk: spectral band replication tool)
(SBR) et utmerket valg. Et tidligere forslag om dette emnet ble imidlertid ikke fulgt opp videre i løpet av standardiseringen.
For ikke å miste den lave kodekforsinkelse som er avgjørende for mange anvendelser, slike som å betjene telekommunikasjonsanvendelser, må tilleggstiltak bli foretatt. I mange tilfeller som et krav for utviklingen av de respektive kodere, ble det definert at slik en koder skulle være i stand til å gjøre tilgjengelig en algoritmisk forsinkelse så lav som 20 ms. Heldigvis trenger bare mindre modifikasjoner å bli tilført eksisterende spesifikasjoner for å møte dette mål. Mer bestemt viser det seg at bare to enkle modifikasjoner er nødvendige, av disse blir én presentert i dette dokument. En erstatning for AAC-LD-koderiflterbanken av en utførelse av en lavforsinkelsesfilterbank 100 og 200 gjør en betydelig forsinkelsesøkning i mange anvendelser lettere. Fulgt av en liten endring av SBR-verktøyet reduseres den adderte forsinkelse ved å innføre denne i koderen, slik som utførelsen av koderen 400 som vist i figur 12.
Som et resultat viser den forbedrede AAC-ELD-koder eller AAC-EL-dekoder omfattende utførelser av lavforsinkelses filterbanker en forsinkelse sammenliknbar med den av en plan AAC-LD-koder, men er avhengig av den konkrete realisering i stand til å spare en betydelig mengde av bithastigheten ved det samme kvalitetsnivå. For å være mer nøyaktig kan en AAC-ELD-koder være i stand til å spare opp til 25 % eller helt opptil 33 % av bithastigheten ved det samme kvalitetsnivå sammenliknet med en AAC-LD-koder.
Utførelser av en syntesefilterbank eller en analyseiflterbank kan bli realisert i en såkalt forbedret lavforsinkelses AAC-kodek (engelsk: enhanced low-delay AAC codec) (AAC-ELD). Som er i stand til å strekke driftsområdet ned til 24 kb/s pr. kanal avhengig av spesifikasjonen av den konkrete realisering og den konkrete anvendelse. Med andre ord kan utførelser av den foreliggende oppfinnelse bli realisert innen rammeverket av en kodings som en utvidelse av AAC-LD-planen, som benytter valgbare tilleggskodingsverktøy. Slikt et valgbart kodingsverktøy er spektralbåndreplikator- (SBR) verktøyet som kan være integrert eller tilleggsmessig benyttet innen rammeverket av både en utførelse av en koder og en utførelse av en dekoder. Spesielt innen feltet lav-bitrate-koding er SBR en attraktiv forbedring fordi den gjør en realisering av en to-hastighetskoder mulig, ved denne blir samplingsfrekvensen for en nedre del av frekvensspekteret kodet med bare halve samplingsfrekvensen av den opprinnelige sampler. Ved den samme tid er SBR i stand til å kode et høyere spektralt område av frekvenser basert på den nedre del, slik at den helhetlige samplingsfrekvens i prinsippet kan bli redusert med en faktor på 2.
Med andre ord gjør benyttelse av SBR-verktøy en realisering av forsinkelsesoptimaliserte komponenter spesielt attraktivt og fordelaktig, på grunn av den reduserte samplingsfrekvens av to-kjernekoderen kan den sparte forsinkelse i prinsippet redusere den helhetlige forsinkelse av systemet med en faktor på 2 av den sparte forsinkelse.
Følgelig ville imidlertid en enkel kombinasjon av AAC-LD og SBR resultere i en total algoritmisk forsinkelse på 60 ms, som vil bli forklart mer i detalj senere. Dermed ville en slik kombinasjon betegne den resulterende kodek som uhensiktsmessig for kommunikasjonsanvendelser, fordi generelt talt skulle ikke en systemforsinkelse for interaktiv toveis kommunikasjon overstige 50 ms.
Ved å benytte en utførelse av en analysefilterbank og/eller av en syntesefilterbank, og derfor erstatte MDCT-filterbanken med én av disse dedikerte lavforsinkelsesfilterbanker, kan den derfor være i stand til å lette forsinkelsesøkningen forårsaket ved å realisere en tohastighets koder som tidligere forklart. Ved å benytte de foran nevnte utførelser kan en AAC-ELD-koder fremvise forsinkelsen godt innenfor det aksepterbare område for toveis kommunikasjon, under innsparing av opptil 25 % til 33 % av hastigheten sammenliknet med en vanlig AAC-LD-koder, under opprettholdelse nivået av audiokvalitet.
Derfor beskriver, med hensyn til dens utførelser av en syntesefilterbank, en analyseiflterbank og andre vedrørende utførelser den foreliggende søknad en beskrivelse av mulige tekniske modifikasjoner sammen med en evaluering av en oppnåelig koderytelse, i det minste med hensyn til noen av de utførelser av den foreliggende oppfinnelse. Slik en lavforsinkelsesfilterbank er i stand til å oppnå en betydelig reduksjon i forsinkelse ved å benytte en annen vindusfunksjon som tidligere beskrevet, med flere overlappinger istedenfor å benytte en MDCT eller en IMDCT, mens den til samme tid tilbyr muligheten av perfekt rekonstruksjon avhengig av den konkrete realisering. En utførelse av en slik lavforsinkelsesfilterbank er i stand til å redusere rekonstruksjonsforsinkelsen uten å redusere filterlengden, men enda opprettholde egenskapen av perfekt rekonstruksjon under noen omstendigheter i tilfellet av noen utførelser.
De resulterende filterbanker har den samme cosinusmodulasjonsfunksjon som en tradisjonell MDCT, men kan ha lengre vindusfunksjoner, disse kan være ikke-symmetrisk eller asymmetrisk med en generalisert eller lav rekonstruksjonsforsinkelse. Som tidligere forklart, kan en utførelse av en slik ny lavforsinkelsesfilterbank benyttende et nytt lavforsinkelsesvindu være i stand til å redusere MDCT-forsinkelsen fra 960 prøver i tilfellet av en rammestørrelse på
M = 480 prøver til 720 prøver. Generelt kan en utførelse av filterbanken være i stand til å redusere forsinkelsen fra 2M til (2M - M/2) prøver ved å realisere M/4 nullverdi vinduskoeffisienter eller ved å tilpasse de hensiktsmessige komponenter deretter, som tidligere forklart, slik at de første underseksjoner 150-1 og 260-1 av de korresponderende rammer omfatter M/4 prøver færre enn de andre underseksjoner.
Eksempler på disse lavforsinkelses vindusfunksjoner har blitt vist i sammenhengen med figur 5 til 7, hvor figur 6 og 7 omfatter sammenlikningen med det tradisjonelle fortegnsvindu også. Imidlertid bør det bemerkes at analysevinduet simpelthen er en tidsreversert gjengivelse av syntesevinduet som tidligere forklart.
I det følgende vil en teknisk beskrivelse av en kombinasjon av et SBR-verktøy med en AAC-LD-koder for å oppnå en lav bithastighet og et lavforsinkelses audiokodingssystem bli gitt. Et tohastighetssystem blir brukt for å oppnå en høyere kodingsforsterkning sammenliknet med et enkelt-hastighetssystem, som tidligere forklart. Ved å benytte et to-hastighetssystem vil en mer energieffektiv koding som er mulig med mindre frekvensbånd, bli gjort tilgjengelig fra den korresponderende koder, som fører til en bitvis reduksjon i noen grad på grunn av å fjerne overflødig informasjon fra rammene som er gjort tilgjengelig av koderen. For å være mer nøyaktig blir en utførelse av en lavforsinkelsesfilterbank som tidligere beskrevet brukt innen rammeverket av AAC-LD-kjerne-koderen for å komme frem til en helhetlig forsinkelse som er akseptabel for kommunikasjonsanvendelser. Med andre ord vil forsinkelsen i det følgende bli beskrevet med hensyn til både AAC-LD-kjeraen og AAC-ELD-kjernekoderen.
Ved å benytte en utførelse av en synteseiflterbank eller en analysefilterbank kan en forsinkelsesreduksjon bli oppnådd ved å realisere en modifisert MDCT-vindu/-filterbank. Betydelig forsinkelsesreduksjon blir oppnådd ved å benytte de foran nevnte og beskrevne forskjellige vindusfunksjoner med flere overlapp for å utvide MDCT-en og IMDCT-en for å oppnå en lavforsinkelsesfilterbank. Teknikken fra lavforsinkelsesfilterbanker muliggjør benyttelse av et ikke-ortogonalt vindu med flere overlappinger. På denne måte er det mulig å oppnå en forsinkelse som er lavere enn vinduslengden. Derfor kan en lav forsinkelse, stadig med en lang impulsrespons som fører til en god frekvensselektivitet bli oppnådd.
Lavforsinkelsesvinduet for en rammestørrelse av M = 480 prøver reduserer MDCT-forsinkelsen fra 960 prøver til 720 prøver, som tidligere forklart.
For å sammenfatte kan i motsetning til en MPEG-4 ER-AAC-LD-kodek en utførelse av en koder og en utførelse av en dekoder 450 under visse omstendigheter være i stand til å fremstille en god audiokvalitet ved en veldig liten bithastighet. Mens den foran nevnte ER-AAC-LD-kodek fremstiller god audiokvalitet ved en bithastighet fra 64 kb/s til 48 kb/s pr. kanal, kan utførelsene av koderen 400 og dekoderen 450, som beskrevet i det foreliggende dokument, være i stand til å gjøre tilgjengelig en audiokoder og en -dekoder, som under noen omstendigheter er i stand til å fremstille en likeverdig audiokvalitet ved enda lavere bithastigheter av omtrent 32 kb/s pr. kanal. Videre har utførelser av en koder og en dekoder en algoritmisk forsinkelse liten nok til å bli benyttet for toveis kommunikasjonssystemer, som kan bli realisert i eksisterende teknologi ved å benytte bare minimale modifikasjoner.
Utførelser av den foreliggende oppfinnelse, spesielt i formen av en koder 400 og en dekoder 450 oppnår dette ved å kombinere eksisterende MPEG-4 audioteknologi med et minste antall av nødvendige tilpasninger for lavforsinkelsesdrift for å komme frem til utførelser av den foreliggende oppfinnelse. Mer bestemt kan MPEG-4 ER-AAC-lavforsinkelseskoderen bli kombinert med et MPEG-4 spektralbåndreplikerings- (SBR) verktøy for å realisere utførelser av en koder 400 og en dekoder 450 ved å ta i betraktning de beskrevne modifikasjoner. Den resulterende økning i algoritmisk forsinkelse blir lettet ved mindre modifikasjoner av SBR-verktøyet, som ikke vil bli beskrevet i den foreliggende søknad og bruken av en utførelse av en koderfilterbank med lavforsinkelseskjerne og en utførelse av en analyseiflterbank eller en syntesefilterbank. Avhengig av den konkrete realisering, er en slik forbedret AAC-LD-koder i stand til å spare opp til 33 % av bithastigheten ved det samme kvalitetsnivå, sammenliknet med en vanlig ACC-LD-koder mens den opprettholder lav nok forsinkelse for en toveis kommunikasjonsanvendelse.
Før en mer detaljert analyse blir presentert med referanse til figur 14, blir et kodingssystem omfattende et SBR-verktøy beskrevet. Med andre ord blir i denne seksjon alle komponenter av et kodingssystem 500 vist i figur 14a, analysert med hensyn til deres bidrag til den helhetlige systemforsinkelse. Figur 14a gir en detaljert oversikt over det komplette system, hvor figur 14b legger vekt på forsinkelseskildene.
Systemet vist i figur 14a omfatter en koder 500, som i sin tur omfatter en MDCT tid/frekvens-omformer, arbeider i to-hastighetsfremgangsmåten som en tohastighets koder. Videre omfatter koderen 500 også en QMF- (kvadratur speilfilter)
(engelsk: Quadrature Mirror Filter) analysefilterbank 520 som er del av SBR-verktøyet. Både MDCT tid/frekvens-omformeren 510 og QMF-analyseiflterbanken er koplet sammen både innenfor deres innganger og deres utganger. Med andre ord blir både MDCT-omformeren 510 og
QMF-analysefilterbanken 520 forsynt med de samme inngangsdata. Mens MDCT-omformeren 510 gjør lavbåndinformasjonen tilgjengelig, gjør QMF-analysefilterbanken 520 SBR-dataene tilgjengelige. Begge dataene blir kombinert til en bitstrøm og gjort tilgjengelige for en dekoder 530.
Dekoderen 530 omfatter en IMDCT frekvens/tid-omformer 540, som er i stand til å dekode bitstrømmen for å oppnå, minst med hensyn til lavbånddelene, et tidsdomenesignal som vil bli gjort tilgjengelig for en utgang av dekoderen via en forsinker 550. Videre er en utgang av IMDCT-omformeren 540 koplet til en ytterligere QMF-analysefilterbank 560, som er del av et SBR-verktøy av dekoderen 530. Videre omfatter SBR-verktøyet en HF generator 570 som er koplet til en utgang av QMF-analysefilterbanken 560 og er i stand til å fremstille de høyere frekvenskomponenter basert på SBR-dataene fra QMF-analysefilterbanken 520 fra koderen 500. En utgang av HF-generatoren 570 er koplet til en QMF-syntesefilterbank 580 som transformerer signalene i QMF-domenet tilbake til tidsdomenet, i dette blir de forsinkede lavbåndssignaler kombinert med høybåndssignalene slik de er gjort tilgjengelige fra SBR-verktøyet av dekoderen 530. De resulterende data vil så bli gjort tilgjengelige som utgangsdata fra dekoderen 530.
Sammenliknet med figur 14a legger figur 14b vekt på forsinkelseskildene i systemet vist i figur 14a. For å være mer nøyaktig, avhengig av den konkrete realisering av koderen 500 og dekoderen 530, illustrerer figur 14b forsinkelseskildene av MPEG-4 ER-AAC-LD-systemet omfattende et SBR-verktøy. Den hensiktsmessige koder for dette audiosystem benytter en MDCT/IMDCT-filterbank for en tid/frekvens/tid-transformering eller omforming med en rammestørrelse på 512 eller 480 prøver. Dette resulterer derfor i rekonstruksjonsforsinkelser som er lik 1024 eller 960 prøver, avhengig av den konkrete realisering. I tilfellet av å benytte MPEG-4 ER-AAC-LD-kodeken i kombinasjon med SBR i en to-hastighetsmodus må forsinkelsesverdien bli doblet på grunn av samplingshastighetsomformingen.
En mer detaljert helhetlig analyse av forsinkelse og krav viser at i tilfellet av en AAC-LD-kodek i kombinasjon med et SBR-verktøy, vil en helhetlig algoritmisk forsinkelse på 16 ms ved en samplingshastighet på 48 kHz og kjernekoderrammestørrelse på 480 prøver bli resultatet. Figur 15 omfatter en tabell som gir en oversikt over forsinkelsen som produseres av de forskjellige komponenter under antakelse av en samplingshastighet på 48 kHz og kjernekoderrammestørrelsen på 480 prøver, hvor kjernekoderen effektivt løper på en samplingshastighet på 24 kHz på grunn av to-hastighetsfremgangsmåten.
Oversikten over forsinkelseskilder i figur 15 viser at tilfellet av en AAC-LD-kodek sammen med et SBR-verktøy fører til en helhetlig algoritmisk forsinkelse på 16 ms, som et betydelig høyere en det som er akseptabelt for telekommunikasjonsanvendelser. Denne evaluering omfatter standardkombinasjonen av AAC-LD-koderen sammen med SBR-verktøyet som omfatter forsinkelsesbidragene fra MDCT/IMDCT-tohastighetskomponentene, QMF-komponentene og SBR-overlappingskomponentene.
Ved å bruke de tidligere beskrevne tilpasninger og ved å benytte utførelser som beskrevet foran er imidlertid en helhetlig forsinkelse på bare 42 ms oppnåelig, som omfatter forsinkelsesbidragene fra utførelsene av lavforsinkelsesfilterbankene i tohastighetsmodusen (ELD MDCT + IMDCT) og QMF-komponentene.
Som med hensyn til noen forsinkelseskilder innen rammeverket av AAC-kjernekoderen og med hensyn til SBR-modulen kan den algoritmiske forsinkelse av AAC-LD-kjernen bli beskrevet som å være 2M prøver, hvor enda en gang M er den grunnleggende rammelengde av kjernekoderen. I motsetning reduserer lavforsinkelsesfilterbanken antallet av prøver med M/2 på grunn av innføring av de innledende seksjoner 160 og 270, eller ved å innføre et hensiktsmessig antall av nullverdi eller andre verdier innen rammeverket av de hensiktsmessige vindusfunksjoner. I tilfellet av benyttelsen av en AAC-kjerne i kombinasjon med et SBR-verktøy blir forsinkelsen doblet på grunn av omformingen av samplingshastighet i et tohastighetssystem.
For å oppklare kan for noen av antallene gitt i tabellen i figur 15 innen rammeverket av en typisk SBR-dekoder, to kilder til forsinkelse bli identifisert. På den ene side omfatter QMF-komponentene en filterbanks rekonstruksjonsforsinkelse på 640 prøver. Imidlertid, siden innrammingsforsinkelsen på 64 - 1 = 63 prøver allerede er innført av kjernekoderen selv, kan den bli trukket fra for å oppnå den forsinkede verdi gitt i tabellen i figur 15 på 577 prøver.
På den annen side forårsaker SBR-HF-rekonstruksjonen en tilleggsforsinkelse med et standard SBR-verktøy på 6 QMF-luker på grunn av den variable tidsoppløsning. Følgelig er tidsforsinkelsen i standard SBR-en seks ganger 64 prøver eller 384 prøver.
Ved å realisere utførelser av en filterbanker og realisere et forbedret SBR-verktøy, kan en forsinkelsesinnsparing på 18 ms bli oppnådd ved ikke å realisere en rett frem kombinasjon av en AAC-LD-koder sammen med et SBR-verktøy med en helhetlig forsinkelse på 60 ms, men en helhetlig forsinkelse på 42 ms er oppnåelig. Som tidligere nevnt er disse tall basert på en samplinghastighet på 48 kHz og på en rammelengde på M = 480 prøver. Med andre ord, ved siden av den såkalte innrammingsforsinkelsen på M = 480 prøver i det foran nevnte eksempel, kan overlappingsforsinkelsen som er et annet viktig synspunkt med hensyn til forsinkelsesoptimalisering bli betydelig redusert ved å innføre en utførelse av en syntesefilterbank eller en analysefilterbank for å oppnå en lav bithastighet og et lavforsinkelses audiokodingssystem.
Utførelser av den foreliggende oppfinnelse kan bli realisert innen mange anvendelsesområder, slik som konferansesystemer og andre to-veis kommunikasjonssystemer. Ved tiden for dens opprinnelse rundt 1997 var kravene til forsinkelse satt for en lavforsinkelses, generell audiokodingsplan som førte til konstruksjonen av AAC-LD-koderen, å oppnå en algoritmisk forsinkelse på 20 ms som blir oppfylt av AAC-LD-en når den løper ved en samplingshastighet på 48 kHz og en rammestørrelse på M = 480.1 motsetning til dette, benytter mange praktiske anvendelser av denne kodek, slik som telekonferanse, en samplinghastighet på 32 kHz og arbeider dermed med en forsinkelse på 30 ms. Liknende: på grunn av den økende viktighet av IP-basert kommunikasjon, tillater forsinkelseskravene fra moderne ITU-telekommunikasjonskodek forsinkelser på grovt sagt 40 ms. Forskjellige eksempler omfatter den nylige G.722.1 vedlegg C koder med en algoritmisk forsinkelse på 40 ms og G.729.1 kodeken med en algoritmisk forsinkelse på 48 ms. Dermed kan den helhetlige forsinkelse oppnådd av en forbedret AAC-LD-koder eller en AAC-ELD-koder omfattende en utførelse av en lavforsinkelses filterbank bli drevet for helt å ligge innenfor forsinkelsesområdet for vanlige telekommunikasjonskodere.
Figur 16 viser et blokkdiagram av en utførelse av en blander 600 for å blande et flertall av inngangsrammer, hvor hver inngangsramme er en spektral representasjon av en korresponderende tidsdomeneramme som er gjort tilgjengelig fra en annen kilde. For eksempel kan hver inngangsramme for blanderen 600 være gjort tilgjengelig fra en utførelse av en koder 400 eller et annet hensiktsmessig system eller en hensiktsmessig komponent. Det bør bemerkes at i figur 16 er blanderen 600 tilpasset for å motta inngangsrammer fra tre forskjellige kilder. Dette representerer imidlertid ikke noen begrensning. For å være mer nøyaktig, kan i prinsipp en utførelse av en blander 600 være tilpasset eller konstruert for å behandle og motta et vilkårlig antall av inngangsrammer, der hver inngangsrammer er gjort tilgjengelig fra en særskilot kilde, slik som særskilte kodere 400.
Utførelsen av blanderen 600 vist i figur 16 omfatter en entropidekoder 610 som er i stand til å entropidekode flertallet av inngangsrammer gjort tilgjengelige fra de forskjellige kilder. Avhengig av den konkrete realisering kan entropidekoderen 610 for eksempel være realisert som en Huffman-entropidekoder eller som en entropidekoder som benytter en annen entropidekodingsalgoritme, slik som den såkalte aritmetiske koding, den unære koding, Elias Gamma kodingen, Fibonacci-kodingen, Golomb-kodingen eller Rice-kodingen.
De entropidekodede inngangsrammer blir så gjort tilgjengelige for en valgbar dekvantiserer 620 som kan bli tilpasset slik at de entropi dekodete inngangsrammer kan bli dekvantisert for å bli egnet for anvendelsesspesifikke omstendigheter, slik som lydstyrkekarakteristikken av det menneskelige øre. De entropidekodede og valgbart dekvantiserte inngangsrammer blir så gjort tilgjengelige for en skalerer 630 som er i stand til å skalere flertallet av entropirammer i frekvensdomenet. Avhengig av den konkrete realisering av en utførelse av en blander 600 kan skalereren 630 for eksempel skalere hver av de valgbart dekvantiserte og entropidekodede inngangsrammer ved å multiplisere hver av verdiene med en konstant faktor l/P, hvor P er et heltall for å indikere antallet av forskjellige kilder eller kodere 400.
Med andre ord er skalereren 630 i dette tilfelle i stand til å skalere ned rammene som er gjort tilgjengelige fra dekvantisereren 620 eller entropidekoderen 610 for å skalere dem ned for å hindre de korresponderende signaler fra å bli for store for å hindre en overskyting eller en annen beregningsmessig feil, eller for å hindre hørbare forstyrrelser som klipping. Forskjellige realiseringer av skalereren 630 kan også bli realisert, slik som en skalerer som er i stand til å skalere rammer som er gjort tilgjengelige på en energikonserverende måte ved for eksempel å vurdere energien av inngangsrammene avhengig av én eller flere spektrale frekvensbånd. I et slikt tilfelle kan i hvert av disse spektrale frekvensbånd den korresponderende verdi i frekvensdomenet bli multiplisert med en konstant faktor slik at den helhetlige energi med hensyn til alle frekvensområder er identisk. I tillegg eller som alternativ kan skalereren 630 også være tilpasset slik at energien av hver av de spektrale undergrupper er identisk med hensyn til alle inngangsrammer fra alle forskjellige kilder, eller at den helhetlige energi av hver av inngangsrammene er konstant.
Skalereren 630 blir så koplet til en adderer 640 som er i stand til å addere opp rammene som er gjort tilgjengelige fra skalereren, som også blir referert til som skalerte rammer, i frekvensdomenet for å fremstille en addert ramme også i frekvensdomenet. Dette kan for eksempel bli oppnådd ved å addere opp alle verdier som korresponderer med den samme prøveindeks fra alle skalerte rammer som er gjort tilgjengelige fra skalereren 630.
Addereren 640 er i stand til å addere opp rammene gjort tilgjengelige fra skalereren 6340 i frekvensdomenet for å oppnå en addert ramme som omfatter informasjonen fra alle kilder som gjort tilgjengelig fra skalereren 630. Som en ytterligere, valgbar komponent kan en utførelse av en blander 600 også omfatte en kvantiserer 650 til hvilken den adderte ramme fra addereren 640 kan bli gjort tilgjengelig for. Ifølge de anvendelsesspesifikke krav, kan den valgbare kvantiserer 650 for eksempel bli benyttet for å tilpasse de adderte rammer for å oppfylle noen betingelser. For eksempel kan kvantiserer 650 være tilpasset slik at takten av dekvantisereren 620 kan bli reversert. Med andre ord, hvis for eksempel en spesiell karakteristikk ligger til grunn for inngangsrammene forsynt til blanderen, som har blitt fjernet eller endret av dekvantisereren 620, kan kvantisereren 650 så bli tilpasset for å sørge for disse spesielle krav fra betingelser for den adderte ramme. Som et eksempel, kan kvantisereren 650 for eksempel være tilpasset for å være egnet for karakteristikken av den menneskelige øre.
Som en ytterligere komponent kan utførelsen av blanderen 600 ytterligere omfatte en entropikoder 660, som er i stand til å entropikode den valgbart kvantiserte adderte ramme og for å sørge for en blandet ramme for én eller flere mottakere, for eksempel omfattende en utførelse av en koder 450. Enda en gang kan entropikoderen 660 bli tilpasset for å entropikode den adderte ramme basert på Huffmann-algoritmen eller en annen av de foran nevnte algoritmer.
Ved å benytte en utførelse av en analysefilterbank, en syntesefilterbank eller
en annen vedrørende utførelse innen rammeverket av en koder og en dekoder, kan en blander bli etablert og realisert som er i stand til å blande signaler i frekvensdomenet. Ved å realisere en utførelse av én av de tidligere beskrevne forbedrede lavforsinkelses AAC-kodeker kan med andre ord en blander bli realisert, som er i stand til direkte å
blande et flertall av inngangsrammer i frekvensdomenet uten å måtte transformere de respektive inngangsrammer til tidsdomenet for å egne seg for den mulige veksling av parametre, som er realisert i spissteknologi-kodeker for talekommunikasjon. Som forklart i sammenhengen med utførelsene av en analysefilterbank og en syntesefilterbank muliggjør disse utførelser en drift uten å veksle parametre, som å veksle blokkiengdene eller veksle mellom forskjellige vinduer. Figur 17 viser en utførelse av et konferansesystem 700 i formen av en MCU (media kontrollenhet) (engelsk: Media Control Unit) som for eksempel kan være realisert innen rammeverket av en server. Konferansesystemet 700 eller MCU 700 omfatter for et flertall av bitstrømmer, av disse er to vist i figur 17. En kombinert entropidekoder og dekvantiserer 610 og 620, og en kombinert enhet 630 og 640 som er merket "blander" i figur 17. Videre er utgangen fra den kombinerte enhet 630 og 640 gjort tilgjengelig for den kombinerte enhet omfattende en kvantiserer 650 og entropikoderen 660, som gjør tilgjengelig de blandede rammer som en utgående bitstrøm. Figur 17 viser med andre ord en utførelse av et konferansesystem 700 som er i stand til å blande et flertall av innkommende bitstrømmer i frekvensdomenet, fordi den innkommende bitstrøm og de utgående bitstrømmer har blitt skapt ved å benytte et lavforsinkelsesvindu på kodersiden, mens de utgående bitstrømmer er tiltenkt og i stand til å bli behandlet basert på det samme lavforsinkelsesvindu på dekodersiden. Med andre ord er MCU-en 700 vist i figur 17 basert på benyttelsen av kun ett universelt lavforsinkelsesvindu.
En utførelse av en blander 600 og en utførelse av et konferansesystem 700 er derfor hensiktsmessig å bli benyttet innen rammeverket av utførelser av den foreliggende oppfinnelse i formen av en analysefilterbank, en syntesefilterbank og de andre vedrørende utførelser. For å være mer nøyaktig kan en teknisk anvendelse av en utførelse av en lavforsinkelseskodek med bare ett vindu tillate en blanding i frekvensdomenet. For eksempel kan det i (tele-) konferanse anvendelser med flere enn to deltakere eller kilder ofte være ønskelig å motta flere kodeksignaler, blande dem opp til ett signal og videre sende det resulterende kodede signal. Ved å benytte en utførelse av den foreliggende oppfinnelse på koder- og dekodersiden, kan i noen utførelser av et konferansesystem 700 og blanderen 600, realiseringsmetoden bli redusert sammenliknet med en rett frem måte å dekode de innkommende signaler, blande de dekodede signaler i tidsdomenet og gjenkode det blandede signal igjen til frekvensdomenet.
Realiseringen av slik en rett frem blander i formen av en MCU er vist i figur 18 som et konferansesystem 750. Konferansesystemet 750 omfatter også en kombinert modul 760 for hver av de innkommende bitstrømmer som virker i frekvensdomenet og er i stand til å entropidekode og dekvantisere de innkommende bitstrømmer. I konferansesystemet 750 vist i figur 18 er modulene 760 hver koplet til sin IMDCT-omformer 770, av hvilke én virker i sinusvindusmodus mens den andre ene for tiden virker i lavoverlappvindusmodus. De to IMDCT-omformere 770 transformerer med andre ord de innkommende bitstrømmer fra frekvensdomenet til tidsdomenet, som er nødvendig i tilfellet av et konferansesystem 750 fordi de innkommende bitstrømmer er basert på en koder som bruker begge, sinusvinduet og lavoverlappvinduet, avhengig av audiosignalet som skal kode de respektive signaler.
Konferansesystemet 750 omfatter videre en blander 780 som i tidsdomenet blander de to innkommende signaler fra de to IMDCT-omformere 770 og sørger for et blandet tidsdomenesignal til en MDCT-omformer 790, som omformer signalene fra tidsdomenet til frekvensdomenet.
Det blandede signal i frekvensdomenet som gjort tilgjengelig av MDCT 790 blir så gjort tilgjengelig for en kombinert modul 795 som så er i stand til å kvantisere og entropikode signalet for å danne den utgående bitstrøm.
Fremgangsmåten ifølge konferansesystemet 750 har imidlertid to ulemper. På grunn av den komplette dekoding og koding, som utføres av de to IMDCT-omformere 770 og MDCT-en 790 vil beregningskostnaden bli høy ved å realisere konferansesystemet 750. Videre, på grunn av innføringen av dekoding og koding blir en tilleggsforsinkelse innført som kan bli høy under visse omstendigheter.
Ved på dekoder- og koderstedene å benytte utførelser av den foreliggende oppfinnelse, eller for å være mer nøyaktig, ved å realisere det nye lavforsinkelsesvindu kan disse ulemper bli overvunnet eller eliminert avhengig av den konkrete realisering i noen tilfeller av realisering. Dette oppnås ved å gjøre blandingen i frekvensplanet, som forklart i sammenhengen med konferansesystemet 700 i figur 17. Som en følge omfatter ikke utførelsen av et konferansesystem 700 som vist i figur 17 transformer og/eller filterbanker som må bli realisert innen rammeverket av konferansesystemet 750 for å dekode og kode signalene for å transformere signalene fra frekvensdomenet til tidsdomenet og tilbake igjen. Med andre ord resulterer bitstrømblandingen i tilfellet av forskjellige vindusformer i tilleggskostnad for én tilleggsblokk av forsinkelse på grunn av MDCT/IMDCT-omformer 770 og 790.
Som en følge kan som tilleggsfordeler, lavere beregningsmessig kostnader og en begrensning med hensyn til tilleggsforsinkelser bli realisert i noen utførelser av blanderen 600 og i noen utførelser av konferansesystemet 700, slik at i noen tilfeller kan til og med ingen tilleggsforsinkelse være oppnåelig.
Figur 19 viser en utførelse av en effektiv realisering av en lavforsinkelses filterbank. For å være mer nøyaktig, før drøfting av den beregningsmessige kompleksitet og ytterligere anvendelsesvedrørende synspunkter vil innen rammeverket av figur 19 en utførelse av en synteseiflterbank 800 bli beskrevet mer i detalj, som for eksempel kan bli realisert i en utførelse av en dekoder. Denne utførelsen av en lavforsinkelses analyseiflterbank 800 symboliserer derfor en revers av en utførelse av en synteseiflterbank eller en koder.
Syntesefilterbanken 800 omfatter en invers type IV diskret cosinustransform frekvens/tid-omformer 810, som er i stand til å gjøre tilgjengelig et flertall av utgangsrammer for en kombinert modul 820, som omfatter en innretning for vindusteknikk og en overlapp-/adderer. For å være mer nøyaktig er tid/frekvens 810 en invers type IV diskret cosinus-transform-omformer, som er gjort tilgjengelig med en inngangsramme omfattende M ordnede inngangsverdier yk(0), ..., yk(M-l), hvor M enda en gang er et positivt heltall og hvor k er et heltall for å indikere en rammeindeks. Tid/frekvens-omformer 810 gjør tilgjengelig 2M ordnede utgangsprøver xk(0), ..., xk(2M-l) basert på inngangsverdiene og gjør disse utgangsprøver tilgjengelige for modulen 820 som i sin tur omfatter innretningen for vindusteknikk og overlapp-/addereren nevnt foran.
Innretningen for vindusteknikk fra modulen 820 er i stand til å fremstille et flertall av med vindusteknikk behandlede rammer, hvor hver av de med vindusteknikk behandlede rammer omfatter et flertall av med vindusteknikk behandlede prøver zk(0), ..., zk(2M-l) basert på likningen eller uttrykket
hvor n enda en gang er et heltall for å indikere en prøveindeks og w(n) er en realverdi vindusfunksjonskoeffisient som korresponderer med prøveindeksen n. Overlapp-/addereren omfattet også av modulen 820, gjør tilgjengelig eller fremstiller så i den mellomliggende ramme omfattende et flertall av mellomliggende prøver Mk(0), ..., Mk(M-l) basert på likningen eller uttrykket Utførelsen av syntesefilterbanken 800 omfatter videre en løfter 850, som fremstiller en addert ramme omfattende et flertall av adderte prøver outk(0), ..., outk(m-l) basert på likningen eller uttrykket
hvor l(M-l-n), ..., l(M-l) er realverdi, løftende koeffisienter. I figur 19 omfatter utførelsen av den beregningsmessig effektive realisering av en lavforsinkelses filterbank 800 innen rammeverket av løfteren 830, et flertall av kombinerte forsinkere og multipliserere 840 så vel som et flertall av adderere 850 for å utføre de foran nevnte beregninger innen rammeverket av løfteren 830.
Avhengig av den konkrete realisering av en utførelse av en synteseiflterbank 800 oppfyller vinduskoeffisientene eller vindusfunksj onskoeffisientene w(n) relasjonene gitt i tabell 5 fra vedlegget i tilfellet av en utførelse med M = 512 inngangsverdier pr. inngangsramme. Tabell 9 fra vedlegget omfatter et sett av relasjoner som vindusteknikk-koeffisientene w(n) oppfyller i tilfellet av M = 480 inngangsverdier pr. inngangsramme. Videre omfatter tabell 6 og 10 relasjoner for de løftende koeffisienter l(n) for utførelser med henholdsvis M = 512ogM = 480.
I noen utførelser av en synteseiflterbank 800 omfatter vinduskoeffisientene w(n) verdiene gitt i tabell 7 og 11 for utførelser med henholdsvis M = 512 og M = 480 inngangsverdier pr. inngangsramme. Følgelig omfatter tabell 8 og 12 i vedlegget verdiene for den løftende koeffisient l(n) for utførelser med henholdsvis M = 512 og M = 480 inngangsprøver pr. inngangsramme.
Med andre ord kan en utførelse av en lavforsinkelses filterbank 800 bli realisert som tilstrekkelig for en regulær MDCT-omformer. Den generelle oppbygning av en slik utførelse er illustrert i figur 19. Den inverse DCT-IV og den inverse vindusteknikk-overlapp/addér blir utført på samme måte som de tradisjonelle vinduer, men ved å bruke de foran nevnte vindusteknikk-koeffisienter avhengig av den konkrete realisering av utførelsen. Som i tilfellet med vindusteknikk-koeffisienter innen rammeverket av utførelsen av syntesefilterbanken 200, er også i dette tilfelle M/4 vinduskoeffisienter nullverdi vinduskoeffisienter, som dermed i prinsippet ikke involverer noen operasjoner. For den utvidede overlapp inn i fortiden er bare M multipliserer-adder-tilleggsoperasjoner nødvendige, som man kan se innen rammeverket av løfteren 830. Disse tilleggsoperasjoner blir noen ganger referert til som "nullforsinkelsesmatriser". Noen ganger er disse operasjoner også kjent som "løftende trinn".
Den effektive realisering vist i figur 19 kan under noen omstendigheter være mer effektiv enn en rett frem realisering av en syntesefilterbank 200. For å være mer nøyaktig kan, avhengig av den konkrete realisering en slik mer effektiv realisering føre til innsparing av M operasjoner, mens det i tilfellet av en rett frem realisering for M operasjoner kan være tilrådelig å realisere, fordi realiseringen vist i figur 19 i prinsipp krever, 2M operasjoner innen rammeverket av modulen 820 og M operasjoner innen rammeverket av løfteren 830.
Med hensyn til en vurdering angående kompleksiteten av en utførelse av en lavforsinkelses filterbank, spesielt med hensyn til den beregningsmessige kompleksitet omfatter figur 20 en tabell som illustrerer den aritmetiske kompleksitet av en utførelse av en realisering av en synteseiflterbank 800 ifølge figur 19 i tilfellet av at M = 512 inngangsverdier pr. inngangsramme. For å være mer nøyaktig omfatter tabellen i figur 20 et estimat over det resulterende helhetlige antall av operasjoner i tilfellet av en (modifisert) IMDCT-omformer langsmed en vindusteknikk i tilfellet av en lavforsinkelses vindusfunksjon. Det helhetlige antall av operasjoner er 9600.
Til sammenlikning omfatter figur 21 en tabell over den aritmetiske kompleksitet av IMDCT langsmed kompleksitet som er krevet for vindusteknikk basert på sinusvinduet for en parameter M = 512, som gir det totale antall av operasjoner for kodeken slik som AAC-LD-kodeken. For å være mer nøyaktig er den aritmetiske kompleksitet av denne IMDCT-omformer langsmed vindusteknikken for sinusvindu 9216 operasjoner, som er av den samme størrelsesordenen som det resulterende, helhetlige antall av operasjoner i tilfellet av utførelsen av syntesefilterbanken 800 vist i figur 19.
Som en ytterligere sammenlikning omfatter figur 22 en tabell for en AAC-LD-kodek, som også er kjent som den avanserte audiokodek med lav kompleksitet. Den aritmetiske kompleksitet av denne IMDCT-omformer, omfattende operasjonene for vindusteknikkoverlapping for AAC-LC-en (M = 1024) er 19968.
En sammenlikning av disse tall viser at sammenfattet omfatter kompleksiteten av kjernekoderen en utførelse av en forbedret lavforsinkelses filterbank i hovedsak sammenliknbar med den av en kjernekoder, som benytter en regulær MDCT-IMDCT-iflterbank. Videre er antallet av operasjoner grovt talt halve antallet av operasjoner av en AAC-LC-kodek.
Figur 23 omfatter to tabeller, hvor figur 23 a omfatter en sammenlikning av minnekravene for forskjellige kodeker, mens figur 23b omfatter det samme anslag med hensyn til ROM kravet. For å være mer nøyaktig omfatter tabellene både i figur 23a og 23b hver informasjon om AAC-LD, AAC-ELD og AAC-LC angående rammelengden, arbeidsbufferet og angående tilstandsbufferet med hensyn til
RAM-krav (figur 23a) og informasjon vedrørende rammelengden, antallet av vinduskoeffisienter og summen med hensyn til ROM-minnekrav (figur 23b). Som tidligere nevnt refererer i tabellene i figur 23a og 23b forkortelsene AAC, ELD til en utførelse av en syntesefilterbank, en analysefilterbank, en koder, en dekoder eller en senere utførelse. For å sammenfatte: sammenliknet med IMDCT-en med sinusvindu krever den beskrevne, effektive realisering ifølge figur 19 av en realisering av lavforsinkelsesfilterbanken et tilstandsminne i et tillegg av lengde M og M tilleggskoeffisienter, de løftende koeffisienter 1(0), ..., l(M-l). Fordi en rammelengde av AAC-LD-en er halve rammelengden av AAC-LC-en, er det resulterende minnekrav i området til det fra AAC-LC-en.
Med hensyn til minnekravene sammenlikner derfor tabellene vist i figur 23a og 23b RAM og ROM-krav for de tre foran nevnte kodeker. Det kan bli sett at minneøkningen for lavforsinkelsesfilterbanken bare er moderat. Det helhetlige minnekrav er stadig mye lavere sammenliknet med en AAC-LC-kodek eller - realisering.
Figur 24 omfatter en liste over benyttede kodeker for en MUSHRA-prøve brukt innen rammeverket av en ytelsesvurdering. I tabellen vist i figur 24 står forkortelsen AOT for Audio Objekt Type, hvor "X" står for audio objekt type ER-AAC-ELD som også kan bli satt til 39. Med andre ord identifiserer AOT-en, X-en eller AOT-39-en utførelse av en syntesefilterbank eller en analysefilterbank. Forkortelsen AOT står i denne sammenheng for "audio objekt type".
Innen rammeverket av en MUSHRA-prøve ble innflytelsen av å bruke en utførelse av lavforsinkelsesfilterbanken oppå den tidligere beskrevne koder prøvet ved å utføre en lytteprøve for alle kombinasjoner i listen. For å være mer nøyaktig muliggjør resultatet av disse prøver den følgende konklusjon. Ved 32 kb/s pr. kanal yter AAC-ELD-dekoderen betydelig bedre enn den opprinnelige AAC-L-dekoder ved 32 kb/s. Videre at AAC-ELD-dekoderen ved 32 kb/s pr. kanal yter statistisk ikke skjelnbart fra den opprinnelige AAC-LD-dekoder ved 48 kb/s pr. kanal. Som en referansekoder yter å forbinde AAC-LD og lavforsinkelsesfilterbanken statistisk ikke skjelnbart fra en opprinnelig AAC-LD-koder, begge løpende ved 48 kb/s. Dette bekrefter hensiktsmessigheten av en lavforsinkelsesfilterbank.
Dermed opprettholdes den helhetlige koderytelse sammenliknbar med, samtidig med en betydelig innsparing i kodekforsinkelse blir oppnådd. Videre var det mulig å opprettholde koderpåtrykkytelsen.
Som tidligere forklart er lovende anvendelsesområder eller anvendelser av utførelser av den foreliggende oppfinnelse, slike som en utførelse av en AAC-ELD-kodek, høykvalitets videotelekonferanse og anvendelser av tale over IP av den neste generasjon. Dette omfatter overføring av vilkårlige audiosignaler, slike som tale eller musikk, eller i sammenhengen med en multimediapresentasjon ved høye kvalitetsnivåer og konkurransedyktige bithastigheter. Den lave algoritmiske forsinkelse fra en utførelse av den foreliggende oppfinnelse (AAC-ELD) gjør denne kodek til et utmerket valg for alle typer av kommunikasjon og anvendelser.
Det foreliggende dokument har videre beskrevet konstruksjonen av en forbedret AAC-ELD-dekoder som valgbart kan bli kombinert med et spektralbåndreplikerings-(SBR) verktøy. For å beskranke den forbundne økning i forsinkelse kan mindre modifikasjoner innen en realisering i virkelig liv bli nødvendige i SBR-verktøyet og kjernekodermodulene. Ytelsen av den resulterende forbedrede lavforsinkelses audiodekoding basert på den foran nevnte teknologi er betydelig øket sammenliknet med hva som for tiden blir levert fra MPEG-4 audiostandarden. Kompleksitet av kjernekodingsplanen består imidlertid i hovedsak identisk.
Videre omfatter utførelser av den foreliggende oppfinnelse en analyseiflterbank eller synteseiflterbank omfattende et lavforsinkelses analysefilter eller et lavforsinkelses syntesefilter. Videre kan en utførelse av en fremgangsmåte for å analysere et signal eller syntetisere et signal med et lavforsinkelses analysefiltrerende trinn eller et lavforsinkelses syntesefiltrerende trinn. Utførelser av et lavforsinkelses analysefilter eller av et lavforsinkelses syntesefilter blir også beskrevet. Videre blir datamaskinprogrammer med en programkode for å realisere én av de over nevnte fremgangsmåter under kjøring på en datamaskin beskrevet. En utførelse av den foreliggende oppfinnelse omfatter også en koder med et lavforsinkelses analysefilter eller en dekoder med et lavforsinkelses syntesefilter, eller én av de korresponderende fremgangsmåter.
Avhengig av visse krav fra realisering av utførelsene av de oppfinneriske fremgangsmåter, kan utførelser av de oppfinneriske fremgangsmåter bli realisert i hardvare eller i programvare. Realiseringen kan bli utført ved bruk av et digitalt lagringsmedium, i særdeleshet en plate, en CD eller en DVD med elektronisk lesbare styresignaler lagret på den, som samarbeider med den programmerbare datamaskin eller en prosessor slik at en utførelse av de oppfinneriske fremgangsmåter blir utført. Generelt er en utførelse av den foreliggende oppfinnelse derfor et datamaskinprogramprodukt med programkode lagret på en maskinlesbar bærer, der programkoden er styrende for å utføre en utførelse av de oppfinneriske fremgangsmåter når datamaskinprogrammet kjører på datamaskinen eller prosessoren. Med andre ord er derfor utførelser av de oppfinneriske fremgangsmåter et datamaskinprogram med en programkode for å utføre minst én av utførelsene av de oppfinneriske fremgangsmåter, når datamaskinprogrammet kjører på datamaskinen eller prosessoren. I denne sammenheng omfatter prosessorer CPU-er (engelsk: Central Processing Unit) (sentrale behandlingsenheter) ASIC-er (engelsk: Application Specific Integrated Circuits) (bruksspesifikke integrerte kretser) eller ytterligere integrerte kretser (IC) (engelsk: Integrated Circuits).
Mens det foranstående i særdeleshet har blitt vist og beskrevet med referanse til enkeltutførelser av den, vil det bli forstått av de kyndige i faget at mangfoldige andre endringer i formen og i detaljene kan bli gjort uten å avvike fra ideen og omfanget av den. Det er å bli forstått at mangfoldige endringer kan bli gjort i tilpasning til forskjellige utførelser uten å avvike fra det bredere konsept beskrevet heri, og sammenfattet av kravene som følger.

Claims (14)

1 Syntesefilterbank for å filtrere flere inngangsrammer av et lydsignal, hvor hver inngangsramme omfatter flere sorterte inngangsverdier, som omfatter: • en frekvens/tid-omformer innrettet for å tilveiebringe flere utgangsrammer, idet en utgangsramme omfatter flere sorterte utgangssampler, idet en utgangsramme er en tidsrepresentasjon av en inngangsramme; • en vinduiseringsenhet innrettet for å generere et flere vinduiserte rammer fra de flere utgangsrammene, idet en vinduisert ramme omfatter flere vinduiserte sampler; og • hvor vinduiseringsenheten er konfigurert til å tilveiebringe de flere vinduiserte sampler for en prosessering på en overlappende måte basert på en sampelfremskrittsverdi; • en overlapp/adderer innrettet for å tilveiebringe en sammenlagt ramme som omfatter flere sammenlagte sampler ved å legge sammen, på en overlappende måte og ved å bruke sampelfremskrittsverdien, de vinduiserte rammene slik at minst tre vinduiserte sampler fra minst tre vinduiserte rammer blir lagd sammen for en sammenlagt sampel i den sammenlagte rammen, karakterisert vedat sampelfremskrittsverdien er mindre enn antallet av sorterte utgangssampler delt på to, idet frekvens/tid-omformeren, vinduiseringsenheten eller overlapp-/addereren omfatter en maskinvare-implementering.
2 Syntesefilterbank ifølge krav 1, hvor frekvens/tid-omformeren er konfigurert til å tilveiebringe utgangsrammer som omfatter flere utgangssampler, som er lik med flere inngangsverdier av en inngangsramme multiplisert med et heltalls antall større enn 2.
3 Syntesefilterbank ifølge krav 1, hvor frekvens/tid-omformeren er konfigurert til å tilveiebringe en utgangsramme som omfatter flere utgangssampler, som er lik med antallet inngangsverdier av en inngangsramme multiplisert med 4.
4 Syntesefilterbank ifølge krav 1, hvor frekvens/tid-omformeren er basert på minst en av en diskret kosinustransformasjon og en diskret sinustransformasjon.
5 Syntesefilterbank ifølge krav 1, hvor vinduiseringsenheten er konfigurert til å generere en vinduisert ramme basert på en utgangsramme og en vektingsfunksjon ved å vekte minst en utgangssampel av utgangsrammen basert på vektingsfunksjonen.
6 Synteseiflterbank ifølge krav 1, hvor vinduiseringsenheten er konfigurert til å generere en vinduisert sampel zunbasert på et uttrykk
hvor i er et heltall som angir en ramme-indeks eller en blokk-indeks av en vinduisert ramme og/eller av en utgangsramme, hvor n = 0, ..., 2N-1 er et heltall som angir en sampelindeks, hvor N er et heltall som angir to ganger antallet inngangsverdiene av en inngangsramme og/eller halvparten av antallet utgangssampel av en utgangsramme og/eller av de vinduiserte samplene av en vinduisert ramme, hvor w(n) er vindusfunksjonen og hvorx;)ner en utgangssampel med en sampelindeks n og rammeindeksen i.
7 Synteseiflterbank ifølge krav 6, hvor vinduiseringsenheten er konfigurert slik at N er lik 960 og vinduskoeffisientene w(0) til w(2N-l) adlyder relasjonene anført i tabell 1 i vedlegget.
8 Syntesefilterbank ifølge krav 6, hvor vinduiseringsenheten er konfigurert slik at vinduskoeffisientene w(0) til w(2N-l) omfatter verdiene anført i tabell 2 i vedlegget.
9 Synteseiflterbank ifølge krav 6, hvor vinduiseringsenheten er konfigurert slik at N er lik 1024 og vinduskoeffisientene w(0) til w(2N-l) adlyder relasjonene anført i tabell 3 i vedlegget.
10 Syntesefilterbank ifølge krav 9, hvor vinduiseringsenheten er konfigurert slik at vinduskoeffisientene w(0) til w(2N-l) omfatter verdiene anført i tabell 4 av vedlegget.
11 Synteseiflterbank ifølge krav 10, hvor overlapp/addereren er konfigurert til å generere den sammenlagte rammen basert på minst tre fortløpende genererte vinduiserte rammer av vindui seringsenheten.
12 Synteseiflterbank ifølge krav 11, hvor overlapp/addereren er konfigurert til å generere den sammenlagte rammen som omfatter flere sammenlagte sampler som er lik sampelfremskrittsverdien.
13 Fremgangsmåte for å filtrere flere inngangsrammer av et lydsignal, hvor hver inngangsramme omfatter flere sorterte inngangsverdier, idet fremgangsmåten omfatter: • å tilveiebringe, utført av en frekvens/tid-omformer, flere utgangsrammer, idet en utgangsramme omfatter flere sorterte utgangssampler, en utgangsramme som er en tidsrepresentasjon av en inngangsramme; • å generere, utført av en vinduiseringsenhet, flere vinduiserte rammer fra de flere utgangsrammene, idet en vinduisert ramme omfatter flere vinduiserte sampler; og • hvor genereringen utført av vinduiseringsenheten omfatter å tilveiebringe de flere vinduiserte sampler for en prosessering på en overlappende måte basert på en sampelfremskrittsverdi; • å tilveiebringe, utført av en overlapp/adderer, sammenlagt ramme som omfatter flere sammenlagte sampler ved å legge sammen, på en overlappende måte og ved å bruke sampelfremskrittsverdien, de vinduiserte rammene slik at minst tre vinduiserte sampler fra minst tre vinduiserte rammer blir lagd sammen for en sammenlagt sampel i den sammenlagte rammen, • hvor sampelfremskrittsverdien er mindre enn antallet av sorterte utgangssampler delt på to, • hvor frekvens/tid-omformeren, vinduiseringsenheten eller overlapp/addereren omfatter en maskinvare-implementering.
14 Datamaskinprogram for å utføre, når det kjører på en datamaskin, en fremgangsmåte ifølge krav 13.
NO20170986A 2006-10-18 2017-06-16 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem NO342514B1 (no)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US86203206P 2006-10-18 2006-10-18
US11/744,641 US8036903B2 (en) 2006-10-18 2007-05-04 Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
PCT/EP2007/007553 WO2008046468A2 (en) 2006-10-18 2007-08-29 Analysis filterbank, synthesis filterbank, encoder, decoder, mixer and conferencing system

Publications (2)

Publication Number Publication Date
NO20170986A1 true NO20170986A1 (no) 2009-05-14
NO342514B1 NO342514B1 (no) 2018-06-04

Family

ID=38904615

Family Applications (5)

Application Number Title Priority Date Filing Date
NO20091900A NO342445B1 (no) 2006-10-18 2009-05-14 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem
NO20170988A NO342476B1 (no) 2006-10-18 2017-06-16 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem
NO20170985A NO342515B1 (no) 2006-10-18 2017-06-16 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem
NO20170986A NO342514B1 (no) 2006-10-18 2017-06-16 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem
NO20170982A NO342516B1 (no) 2006-10-18 2017-06-16 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem.

Family Applications Before (3)

Application Number Title Priority Date Filing Date
NO20091900A NO342445B1 (no) 2006-10-18 2009-05-14 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem
NO20170988A NO342476B1 (no) 2006-10-18 2017-06-16 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem
NO20170985A NO342515B1 (no) 2006-10-18 2017-06-16 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem

Family Applications After (1)

Application Number Title Priority Date Filing Date
NO20170982A NO342516B1 (no) 2006-10-18 2017-06-16 Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem.

Country Status (22)

Country Link
US (6) US8036903B2 (no)
EP (5) EP2113910B1 (no)
JP (5) JP5546863B2 (no)
KR (3) KR101209410B1 (no)
CN (4) CN102243874B (no)
AT (3) ATE539432T1 (no)
AU (3) AU2007312696B2 (no)
BR (2) BRPI0716004B1 (no)
CA (3) CA2782476C (no)
ES (5) ES2592253T3 (no)
HK (4) HK1138674A1 (no)
IL (4) IL197757A (no)
MX (1) MX2009004046A (no)
MY (4) MY155487A (no)
NO (5) NO342445B1 (no)
PL (5) PL2884490T3 (no)
PT (1) PT2884490T (no)
RU (1) RU2426178C2 (no)
SG (2) SG174836A1 (no)
TW (1) TWI355647B (no)
WO (1) WO2008046468A2 (no)
ZA (1) ZA200901650B (no)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7422840B2 (en) * 2004-11-12 2008-09-09 E.I. Du Pont De Nemours And Company Apparatus and process for forming a printing form having a cylindrical support
US7916711B2 (en) * 2005-03-24 2011-03-29 Siport, Inc. Systems and methods for saving power in a digital broadcast receiver
GB2439685B (en) 2005-03-24 2010-04-28 Siport Inc Low power digital media broadcast receiver with time division
US7945233B2 (en) * 2005-06-16 2011-05-17 Siport, Inc. Systems and methods for dynamically controlling a tuner
US8335484B1 (en) 2005-07-29 2012-12-18 Siport, Inc. Systems and methods for dynamically controlling an analog-to-digital converter
ES2631906T3 (es) 2006-10-25 2017-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la generación de valores de subbanda de audio, aparato y procedimiento para la generación de muestras de audio en el dominio temporal
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
US8199769B2 (en) 2007-05-25 2012-06-12 Siport, Inc. Timeslot scheduling in digital audio and hybrid audio radio systems
US20090099844A1 (en) * 2007-10-16 2009-04-16 Qualcomm Incorporated Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders
JP5400059B2 (ja) * 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN102789782B (zh) * 2008-03-04 2015-10-14 弗劳恩霍夫应用研究促进协会 对输入数据流进行混合以及从中产生输出数据流
EP2410522B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
TWI496479B (zh) * 2008-09-03 2015-08-11 Dolby Lab Licensing Corp 增進多聲道之再生
JP2012516462A (ja) 2009-01-28 2012-07-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報、オーディオ信号を符号化および復号化する方法およびコンピュータ・プログラム
TWI569573B (zh) 2009-02-18 2017-02-01 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
US8320823B2 (en) * 2009-05-04 2012-11-27 Siport, Inc. Digital radio broadcast transmission using a table of contents
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
US8831318B2 (en) * 2009-07-06 2014-09-09 The Board Of Trustees Of The University Of Illinois Auto-calibrating parallel MRI technique with distortion-optimal image reconstruction
KR101732208B1 (ko) * 2009-10-09 2017-05-02 디티에스, 인코포레이티드 오디오 녹음의 적응적 동적 범위 강화
EP3693963B1 (en) * 2009-10-15 2021-07-21 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
EP2372703A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
MY156027A (en) * 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
US8489053B2 (en) 2011-01-16 2013-07-16 Siport, Inc. Compensation of local oscillator phase jitter
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
AU2012217158B2 (en) * 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
EP3441967A1 (en) * 2011-04-05 2019-02-13 Nippon Telegraph and Telephone Corporation Decoding method, decoder, program, and recording medium
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
WO2014046916A1 (en) * 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
JP5894347B2 (ja) * 2012-10-15 2016-03-30 ドルビー・インターナショナル・アーベー 転移器に基づく仮想ベース・システムにおけるレイテンシーを低減するシステムおよび方法
WO2015036348A1 (en) * 2013-09-12 2015-03-19 Dolby International Ab Time- alignment of qmf based processing data
DE102014214143B4 (de) 2014-03-14 2015-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals im Frequenzbereich
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
CN104732979A (zh) * 2015-03-24 2015-06-24 无锡天脉聚源传媒科技有限公司 一种音频数据的处理方法及装置
CN106297813A (zh) 2015-05-28 2017-01-04 杜比实验室特许公司 分离的音频分析和处理
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
US10762911B2 (en) * 2015-12-01 2020-09-01 Ati Technologies Ulc Audio encoding using video information
JP2018101826A (ja) * 2016-12-19 2018-06-28 株式会社Cri・ミドルウェア 音声通話システム、音声通話方法およびプログラム
US11282492B2 (en) 2019-02-18 2022-03-22 Bose Corporation Smart-safe masking and alerting system
US10991355B2 (en) 2019-02-18 2021-04-27 Bose Corporation Dynamic sound masking based on monitoring biosignals and environmental noises
US11071843B2 (en) 2019-02-18 2021-07-27 Bose Corporation Dynamic masking depending on source of snoring

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0620653A2 (en) * 1993-03-11 1994-10-19 Sony Corporation Devices for recording and/or reproducing or transmitting and/or receiving compressed data
WO1998002971A1 (en) * 1996-07-11 1998-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A method of coding and decoding audio signals

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5869819A (en) * 1994-08-17 1999-02-09 Metrologic Instuments Inc. Internet-based system and method for tracking objects bearing URL-encoded bar code symbols
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
FI935609A (fi) 1992-12-18 1994-06-19 Lonza Ag Dihydrofuroimidatsolijohdannaisten asymmetrinen hydraus
US5570363A (en) 1994-09-30 1996-10-29 Intel Corporation Transform based scalable audio compression algorithms and low cost audio multi-point conferencing systems
US5867819A (en) 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
JP4174859B2 (ja) * 1998-07-15 2008-11-05 ヤマハ株式会社 デジタルオーディオ信号のミキシング方法およびミキシング装置
US6226608B1 (en) 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
JP2000267682A (ja) * 1999-03-19 2000-09-29 Victor Co Of Japan Ltd 畳み込み演算装置
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
JP3518737B2 (ja) * 1999-10-25 2004-04-12 日本ビクター株式会社 オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体
JP2001134274A (ja) * 1999-11-04 2001-05-18 Sony Corp ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
US6707869B1 (en) 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
US6963842B2 (en) 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
CN1682281B (zh) * 2002-09-17 2010-05-26 皇家飞利浦电子股份有限公司 在语音合成中用于控制持续时间的方法
JP2004184536A (ja) * 2002-11-29 2004-07-02 Mitsubishi Electric Corp 畳み込み演算装置及び畳み込み演算プログラム
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US6982377B2 (en) * 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US7639823B2 (en) * 2004-03-03 2009-12-29 Agere Systems Inc. Audio mixing using magnitude equalization
EP1728243A1 (en) * 2004-03-17 2006-12-06 Koninklijke Philips Electronics N.V. Audio coding
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR20070068424A (ko) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
JP2006243664A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
GB2426168B (en) * 2005-05-09 2008-08-27 Sony Comp Entertainment Europe Audio processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0620653A2 (en) * 1993-03-11 1994-10-19 Sony Corporation Devices for recording and/or reproducing or transmitting and/or receiving compressed data
WO1998002971A1 (en) * 1996-07-11 1998-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A method of coding and decoding audio signals

Also Published As

Publication number Publication date
HK1163332A1 (en) 2012-09-07
EP2378516A1 (en) 2011-10-19
EP2113911B1 (en) 2011-12-28
TW200832357A (en) 2008-08-01
NO20170988A1 (no) 2009-05-14
US8036903B2 (en) 2011-10-11
USRE45526E1 (en) 2015-05-19
EP2074615B1 (en) 2012-04-18
ES2386206T3 (es) 2012-08-13
ES2531568T3 (es) 2015-03-17
KR20110049886A (ko) 2011-05-12
NO342516B1 (no) 2018-06-04
IL226224A0 (en) 2013-06-27
ATE554480T1 (de) 2012-05-15
AU2011201330A1 (en) 2011-04-14
AU2011201331B2 (en) 2012-02-09
JP2013210656A (ja) 2013-10-10
JP2014059570A (ja) 2014-04-03
JP2013228740A (ja) 2013-11-07
NO342476B1 (no) 2018-05-28
SG174836A1 (en) 2011-10-28
ES2380177T3 (es) 2012-05-09
JP5520994B2 (ja) 2014-06-11
IL226223A (en) 2016-02-29
BRPI0716004A8 (pt) 2019-10-08
JP5546863B2 (ja) 2014-07-09
CN102243875B (zh) 2013-04-03
EP2113910B1 (en) 2011-09-21
KR101209410B1 (ko) 2012-12-10
NO342445B1 (no) 2018-05-22
USRE45277E1 (en) 2014-12-02
EP2378516B1 (en) 2015-01-07
CN102243874B (zh) 2013-04-24
JP2010507111A (ja) 2010-03-04
NO342515B1 (no) 2018-06-04
BRPI0716004B1 (pt) 2020-11-17
ATE525720T1 (de) 2011-10-15
PT2884490T (pt) 2016-10-13
HK1138674A1 (en) 2010-08-27
USRE45339E1 (en) 2015-01-13
AU2007312696A1 (en) 2008-04-24
JP5700714B2 (ja) 2015-04-15
RU2009109129A (ru) 2010-11-27
KR20110049885A (ko) 2011-05-12
CA2667059A1 (en) 2008-04-24
USRE45294E1 (en) 2014-12-16
CN101529502A (zh) 2009-09-09
NO20170982A1 (no) 2009-05-14
CN102243874A (zh) 2011-11-16
JP5700713B2 (ja) 2015-04-15
IL226225A0 (en) 2013-06-27
NO342514B1 (no) 2018-06-04
CN102243873A (zh) 2011-11-16
NO20091900L (no) 2009-05-14
HK1138423A1 (en) 2010-08-20
RU2426178C2 (ru) 2011-08-10
CA2782476C (en) 2016-02-23
CN102243875A (zh) 2011-11-16
EP2074615A2 (en) 2009-07-01
MY164995A (en) 2018-02-28
WO2008046468A3 (en) 2008-06-26
AU2007312696A8 (en) 2009-05-14
JP2012150507A (ja) 2012-08-09
PL2378516T3 (pl) 2015-06-30
CA2782609A1 (en) 2008-04-24
SG174835A1 (en) 2011-10-28
WO2008046468A2 (en) 2008-04-24
MY155486A (en) 2015-10-30
IL226224A (en) 2016-02-29
CA2782609C (en) 2016-10-04
ES2374014T3 (es) 2012-02-13
ES2592253T3 (es) 2016-11-29
KR101162462B1 (ko) 2012-07-04
EP2884490B1 (en) 2016-06-29
MY153289A (en) 2015-01-29
PL2113910T3 (pl) 2012-02-29
JP5859504B2 (ja) 2016-02-10
BRPI0716004A2 (pt) 2013-07-30
USRE45276E1 (en) 2014-12-02
BR122019020171B1 (pt) 2021-05-25
IL197757A (en) 2014-09-30
AU2007312696B2 (en) 2011-04-21
CA2782476A1 (en) 2008-04-24
EP2884490A1 (en) 2015-06-17
CN102243873B (zh) 2013-04-24
NO20170985A1 (no) 2009-05-14
IL226225A (en) 2016-02-29
CA2667059C (en) 2014-10-21
EP2113911A2 (en) 2009-11-04
TWI355647B (en) 2012-01-01
ZA200901650B (en) 2010-03-31
PL2884490T3 (pl) 2016-12-30
MX2009004046A (es) 2009-04-27
AU2011201330B2 (en) 2011-08-25
KR101162455B1 (ko) 2012-07-04
US20080097764A1 (en) 2008-04-24
CN101529502B (zh) 2012-07-25
PL2113911T3 (pl) 2012-06-29
PL2074615T3 (pl) 2012-10-31
IL226223A0 (en) 2013-06-27
EP2113911A3 (en) 2009-11-18
IL197757A0 (en) 2009-12-24
ATE539432T1 (de) 2012-01-15
EP2113910A1 (en) 2009-11-04
KR20090076924A (ko) 2009-07-13
MY155487A (en) 2015-10-30
HK1128058A1 (en) 2009-10-16
AU2011201331A1 (en) 2011-04-14

Similar Documents

Publication Publication Date Title
NO20170986A1 (no) Analysefilterbank, syntesefilterbank, koder, dekoder, blander og konferansesystem
KR101253278B1 (ko) 복수의 입력 데이터 스트림을 믹싱하는 장치 및 방법
JP2008519306A (ja) 信号の組のエンコード及びデコード
EP2227682A1 (en) An encoder