NO342691B1 - Apparat og fremgangsmåte for å generere audiodelbåndsverdier, samt apparat og fremgangsmåte for å generere tidsdomeneaudiosampler - Google Patents

Apparat og fremgangsmåte for å generere audiodelbåndsverdier, samt apparat og fremgangsmåte for å generere tidsdomeneaudiosampler Download PDF

Info

Publication number
NO342691B1
NO342691B1 NO20170452A NO20170452A NO342691B1 NO 342691 B1 NO342691 B1 NO 342691B1 NO 20170452 A NO20170452 A NO 20170452A NO 20170452 A NO20170452 A NO 20170452A NO 342691 B1 NO342691 B1 NO 342691B1
Authority
NO
Norway
Prior art keywords
window
samples
time domain
coefficients
window coefficients
Prior art date
Application number
NO20170452A
Other languages
English (en)
Other versions
NO20170452A1 (no
Inventor
Manfred Lutzky
Ralf Geiger
Gerald Schuller
Marc Gayer
Markus Lohwasser
Bernhard Grill
Markus Schnell
Markus Schmidt
Michael Mellar
Bernd Edler
Markus Multrus
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Publication of NO20170452A1 publication Critical patent/NO20170452A1/no
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of NO342691B1 publication Critical patent/NO342691B1/no

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Liquid Crystal Substances (AREA)
  • Tires In General (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • External Artificial Organs (AREA)
  • Developing Agents For Electrophotography (AREA)
  • Peptides Or Proteins (AREA)
  • Materials For Photolithography (AREA)

Abstract

En utførelse av et apparat (100) for å generer audiodelbåndsverdier i audiodelbånds kanaler omfatter en analysevindussending (110) for vindussending av en ramme(120) avtids- domeneaudioinngangssampler som befinner seg i en tidssekvens som strekker seg fra et tidlig sampel til et senere sampel ved å bruke en analysevindusfunksjon (190) som omfatteren sekvens av vinduskoeffisienter for å tilveiebringe vindussendte sampler. Analysevindusfunksjonen (190) omfatter en første gruppe (200) av vinduskoeffisienter og en andre gruppe (210) av vinduskoeffisienter. Den første gruppe (200) av vinduskoeffisienter blir brukt for vindussending av senere tids-domenesampler og den andre gruppe (210) av vinduskoeffisienter blir brukt for vindussending av tidligere tids-domenesampler. Apparatet (100) omfatter videre en kalkulator (170) for å beregne audiodelbåndsverdiene som bruker de vindussendte sampler.

Description

Oppfinnelsen angår apparat og fremgangsmåte for å generere audiodelbåndsverdier, et apparat og en fremgangsmåte for å generere tidsdomeneaudiosampler og systemer som omfatter enhver av de ovennevnte apparater og som for eksempel kan implementeres på området moderne audiokoding, audiodekoding eller andre audiooverføringsrelaterte anvendelsesområder.
Moderne digital audiobehandling er typisk basert på kodesystemer som gir en vesentlig reduksjon med hensyn til bitrater, overføringsbåndbredder og lagringsplass sammenlignet med en direkte overføring eller lagring av de respektive audiodata. Dette oppnås ved å kode audiodataene på sendersiden og dekode kodede data på mottakersiden før eksempelvis levering av de dekodede audiodata til en lytter eller til ytterligere signalbehandling.
Slike audiobehandlingssystemer kan implementeres i en lang rekke parametere, som typisk påvirker kvaliteten av de overførte eller forøvrig behandlede audiodata på den ene side og beregningseffektiviteten, båndbredder og andre ytelsesrelaterte parametere på den annen side. Svært ofte krever høyere kvalitet høyere bitrater, en økt beregningskompleksitet og større krav til lagring for de tilsvarende kodede audiodata. Avhengig av anvendelsen, må følgelig faktorer som tillatte bitrater, akseptabel beregningskompleksitet og akseptable mengder data balanseres med en ønskelig og oppnåelig kvalitet.
En annen parameter som er spesielt viktig i sanntidsanvendelser, slik som en toveis eller enveis kommunikasjon, kan forsinkelsen innført av de forskjellige kodesystemer også spille en viktig rolle. Som konsekvens innebærer forsinkelsen innført ved audiokoding og dekoding en ytterligere begrensning i de tidligere nevnte parametere ved balansering av behovene og kostnadene ved de forskjellige kodesystemer for et spesifikt anvendelsesområde. Ettersom slike digitale audiosystemer kan brukes på mange forskjellige applikasjonsområder som varierer fra overføring med svært lav kvalitet til en høykvalitetsoverføring, blir forskjellige parametere og forskjellige begrensninger ofte innført på de respektive audiosystemer. I enkelte anvendelser kan f.eks. en mindre forsinkelse kreve en høyere bitrate og følgelig økt overføringsbåndbredde sammenlignet med et audiosystem med en større forsinkelse, og ved et sammenlignbart kvalitetsnivå.
I mange tilfeller må imidlertid kompromisser kjøres mellom de forskjellige parametere, slik som bitrate, beregningskompleksitet, minnekrav, kvalitet og forsinkelse.
US 6748363 B1 beskriver en metode og et system for å komprimere vindustabeller av transformasjonsbasert lydkoder, der metoden omfatter sampling et datavindu et forhåndsbestemt antall ganger og gi et første par av vindussampleverdier og resten av vindusampleverdiene, å tilveiebringe et vinduskompresjonsfilter som har en initialtilstandsvariabel før utførelse av filteret, å tilveiebringe en komprimert vindutabell i minnet for å lagre minst de første få av vindussampleverdier og de første
tilstandsvariabler av vinduets komprimeringsfilter, og differensielt koder for resten av vindussampleverdiene i vinduets kompresjonsfilter og lagring av de komprimerte vindussamplene i den komprimerte vindutabellen.
En utførelse av et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler omfatter en analysevindusbehandling for å presentere en ramme av tidsdomene audioinngangssampler som befinner seg i en tidssekvens som strekker seg fra en tidlig sampel til en senere sampel ved å bruke en analysevindusfunksjon som omfatter en rekke vinduskoeffisienter for å innhente vindussampler. Analysevindusfunksjonen omfatter en første gruppe vinduskoeffisienter med en første del av sekvensen av vinduskoeffisienter og en andre gruppe vinduskoeffisienter som omfatter en andre del av sekvensen av vinduskoeffisienter, der den første del omfatter færre vinduskoeffisienter enn den andre del og der en energiverdi av vinduskoeffisientene i den første del er høyere enn en energiverdi av vinduskoeffisientene i den andre del. Den første gruppe vinduskoeffisienter blir brukt for vindussending av senere tidsdomenesampler og den andre gruppe vinduskoeffisienter blir brukt for vindussending av tidligere tidsdomenesampler. Videre omfatter utførelsen en kalkulator for å beregne audiodelbåndsverdier som bruker de vindussendte sampler.
En utførelse av et apparat for å generere tidsdomeneaudiosampler omfatter en kalkulator for å beregne en sekvens av foreløpige domenesampler som danner audiodelbåndsverdier i audiodelbåndskanaler, der sekvensen omfatter tidligere foreløpige domenesampler og senere foreløpige domenesampler. Videre omfatter en utførelse av apparatet en syntesevindusutsendelse for sending av sekvensen av foreløpige domenesamler ved å bruke en syntesevindusfunksjon som omfatter en sekvens av vinduskoeffisienter for å innhente vindussendte foreløpige domenesampler, der syntesevindusfunksjonen omfatter første gruppe av vinduskoeffisienter som omfatter en første del av sekvensen av vinduskoeffisienter og en andre gruppe vinduskoeffisienter som omfatter en andre del av sekvensen av vinduskoeffisienter. Den første del omfatter færre vinduskoeffisienter enn den andre del og en energiverdi av vinduskoeffisientene i den første del er høyere enn energiverdien av vinduskoeffisientene av den andre del. Den første gruppe vinduskoeffisienter brukes for vindussending av senere foreløpige domenesampler og den andre gruppe vinduskoeffisienter blir brukt for vindussending av tidligere foreløpige domenesampler. Videre omfatter en utførelse av et apparat for å generere tidsdomeneaudiosampler et utgangstrinn med overlapningsadderer for å behandle vindusforeløpige domenesampler for å tilveiebringe tidsdomenesampler.
Oppfinnelsen skal nå beskrives i det følgende under henvisning til tegningene, der:
Fig. 1 viser et blokkskjema av en utførelse av et apparat for å generere audiodelbåndsverdier,
fig. 2a viser et blokkskjema av en utførelse av et apparat for å generere tidsdomeneaudiosampler,
fig. 2b viser et funksjonsprinsipp ifølge en utførelse av oppfinnelsen i form av et apparat for å generere tidsdomenesampler,
fig. 3 viser ideen med interpolering av vinduskoeffisienter i samsvar med en utførelse av oppfinnelsen,
fig. 4 viser interpoleringsvinduskoeffisienter i tilfellet med en sinusvindusfunksjon, fig. 5 viser et blokkskjema av en utførelse av oppfinnelsen som omfatter en SBR-dekoder og en SBR-koder,
fig. 6 viser forsinkelseskildene av et SBR-system,
fig. 7a viser et flytskjema av en utførelse av en fremgangsmåte for å generere audiodelbåndsverdier,
fig. 7b viser et trinn av utførelsen av fremgangsmåten vist på fig. 7a,
fig. 7c viser et flytskjema av en utførelse av en fremgangsmåte for å generere
audiodelbåndsverdier,
fig. 8a viser et flytskjema av en utførelse av en fremgangsmåte for å generere tidsdomenesampler,
fig. 8b viser et flytskjema av en utførelse av en fremgangsmåte for å generere tidsdomenesampler,
fig. 8c viser et flytskjema av en annen utførelse av en fremgangsmåte for å generere tidsdomenesampler,
fig. 8d viser et flytskjema av en annen utførelse av en fremgangsmåte for å generere tidsdomenesampler,
fig. 9a viser en mulig implementering av en utførelse av en fremgangsmåte for å generere audiodelbåndsverdier,
fig. 9b viser en mulig implementering av en utførelse av en fremgangsmåte for å generere audiodelbåndsverdier,
fig. 10a viser en mulig implementering av en utførelse av en fremgangsmåte for å generere tidsdomenesampler,
fig. 10b viser en annen mulig implementering av en utførelse av en fremgangsmåte for å generere tidsdomenesampler,
fig. 11 viser en sammenligning mellom en syntesevindusfunksjon i samsvar med en utførelse av oppfinnelsen og en sinusvindusfunksjon,
fig. 12 viser en sammenligning mellom en syntesevindusfunksjon ifølge en utførelse av oppfinnelsen og en SBR QMF-prototype filterfunksjon,
fig. 13 viser de forskjellige forsinkelser forårsaket av vindusfunksjonen og prototypefilterfunksjonen på fig. 12,
fig. 14a viser en tabell over forskjellige bidrag til forsinkelsen av en konvensjonell AAC-LD+SBR-kodek og AAC-ELD-kodek omfattende en utførelse av oppfinnelsen,
fig. 14b viser en annen tabell som omfatter detaljer om forsinkelsen av de forskjellige komponenter av forskjellige kodeker,
fig. 15a viser en sammenligning mellom en frekvensrespons av apparater basert på en vindusfunksjon ifølge en utførelse av oppfinnelsen og et apparat basert på en sinusvindusfunksjon, fig. 15b viser et nærbilde av frekvensresponsen på fig. 15a,
fig. 16a viser en sammenligning mellom frekvensresponsen fra fire forskjellige vindusfunksjoner,
fig. 16b viser et nærbilde av frekvensresponsen på fig. 16a,
fig. 17 viser en sammenligning mellom en frekvensrespons av to forskjellige vindusfunksjoner, en vindusfunksjon i samsvar med oppfinnelsen og en vindusfunksjon som er en symmetrisk vindusfunksjon og
fig. 18 viser skjematisk den generelle tidsmessige maskeringsegenskap ved det menneskelige øret,
fig. 19 viser en sammenligning mellom det opprinnelige audiotidssignal, et tidssignal generert basert på HEAAC-kodek og et tidssignal basert på kodek som omfatter en utførelse av oppfinnelsen.
Fig. 1-19 viser blokkskjemaer og ytterligere skjemaer beskriver funksjonsegenskapene og trekkene ved de forskjellige utførelsene av apparatene og fremgangsmåtene for å generere audiodelbåndsverdier av apparatene og fremgangsmåtene for å generere tidsdomenesampler og systemer som omfatter minst et av de tidligere nevnte apparater eller fremgangsmåter. Før en første utførelse av oppfinnelsen skal beskrives i detalj, skal det bemerkes at utførelsen ifølge oppfinnelsen kan implementeres i maskinvare og i programvare. Følgelig kan implementeringene beskrevet i forbindelse med blokkskjemaer av maskinvareimplementeringer av de respektive utførelser også vurderes som flytskjemaer av en egnet utførelse av en tilsvarende fremgangsmåte. Også et flytskjema som beskriver en utførelse av oppfinnelsen kan anses å være et blokkskjema av en tilsvarende maskinvareimplementering.
I det følgende vil implementering av filterbanker bli beskrevet, som kan implementeres som en analysefilterbank eller en syntesefilterbank. En analysefilterbank er et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler basert på tidsdomeneaudio (inngangs)-sampler som befinner seg i en tidssekvens som strekker seg fra en tidligere sampel til en senere sampel. Med andre ord kan uttrykket analysefilterbank brukes synonymt for en utførelse av oppfinnelsen i en form for et apparat for å generere audiodelbåndsverdier. Følgelig er en syntesefilterbank en filterbank for å generere tidsdomeneaudiosampler fra audiodelbåndsverdier i audiodelbåndskanaler. Med andre ord kan uttrykket syntesefilterbank brukes synonymt for en utførelse ifølge oppfinnelsen, i form av et apparat for å generere tidsdomeneaudiosampler.
Både en analysefilterbank og en syntesefilterbank, som også kalles oppsummert som filterbanker, kan f.eks. implementeres som modulerte filterbanker. Modulerte filterbanker, hvis eksempler og utførelser vil bli beskrevet i detalj nedenfor, er basert på oscilleringer som har frekvenser som er basert på eller som er avledet av senter eller midtfrekvenser av tilsvarende delbånd i frekvensdomenet. Uttrykket "modulert" brukes i denne sammenheng med en vindusfunksjon eller en prototypefilterfunksjon avhengig av den konkrete implementering av en slik modulert filterbank. Modulerte filterbanker kan i prinsipp være basert på realverdi oscilleringer, slik som an harmonisk oscillering (sinusoscillering eller cosinusoscillering) eller tilsvarende kompleksverdi oscilleringer (komplekse eksponential oscilleringer). Følgelig kalles de modulerte filterbanker virkelige modulerte filterbanker eller komplekse filtermodulerte filterbanker.
I den følgende beskrivelse vil utførelser av oppfinnelsen i form av komplekse, modulerte, lavforsinkede filterbanker og virkelig modulerte, lavforsinkede filterbanker og tilsvarende fremgangsmåter og programvareimplementeringer bli beskrevet i detalj. En av hovedanvendelsene av slike modulerte, lavforsinkede filterbanker er en integrering i et replikasjonssystem for lavforsinket spektralbånd (SBR) som for tiden er basert på bruk av en kompleks QMF-filterbank med et symmetrisk prototypefilter (QMF = Quadrature Mirror Filter).
Det vil fremgå innenfor rammen av beskrivelsen, at en implementering av lavforsinkede filterbanker ifølge utførelsen vil gi fordelen med forbedret kompromiss mellom forsinkelse, frekvensrespons, tidsmessig støyspredning og rekonstruksjonskvalitet.
Ovennevnte forbedrede kompromiss, spesielt mellom forsinkelse og rekonstruksjonskvaliteten er basert på en fremgangsmåte for å utnytte såkalte nullforsinkelsesteknikker for å utvide filterpulsresponsen fra de respektive filterbanker uten å innføre ekstra forsinkelse. En mindre forsinkelse ved et bestemt kvalitetsnivå, en bedre kvalitet ved et bestemt forsinkelsesnivå eller en samtidig forbedring både av forsinkelsen og kvaliteten, kan oppnås ved å bruke en analysefilterbank eller en syntesefilterbank ifølge en utførelse av oppfinnelsen.
Utførelser av oppfinnelsen er basert på det funn at disse forbindelsene kan oppnås ved å bruke en ny vindusfunksjon for hvilke som helst av de to filterbankene beskrevet tidligere. Med andre ord kan kvaliteten og/eller forsinkelsen forbedres ved en analysefilterbank ved å bruke en analysevindusfunksjon som omfatter en rekke vinduskoeffisienter som omfatter en første gruppe som omfatter en første etterfølgende del av sekvensen av vinduskoeffisienter og den andre gruppe vinduskoeffisienter som omfatter en andre etterfølgende del av sekvensen av vinduskoeffisienter. Den første og andre del omfatter alle vinduskoeffisienter av vindusfunksjonen. Videre omfatter den første del færre vinduskoeffisienter enn den andre del, men en energiverdi av vinduskoeffisienten i den første del er høyere enn en energiverdi av vinduskoeffisientene i den andre del. Den første gruppe vinduskoeffisienter blir brukt for vindussending av senere tidsdomenesampler og den andre gruppe vinduskoeffisienter blir brukt for vindussending av tidligere tidsdomenesampler. Denne form for vindusfunksjon gjør det mulig å behandle tidsdomenesampler med vinduskoeffisienter med høyere energiverdier tidligere. Dette er et resultat av den beskrevne fordeling av vinduskoeffisienter til de to delene og deres anvendelse på sekvensen av vindusdomeneaudiosampler. Som konsekvens, kan bruk av en slik vindusfunksjon redusere forsinkelsen innført av filterbanken på et konstant kvalitetsnivå eller gjøre det mulig å oppnå et forbedret kvalitetsnivå basert på et konstant forsinkelsesnivå.
I tilfellet en utførelse av oppfinnelsen i form av et apparat for å generere tidsdomeneaudiosampler og en tilsvarende fremgangsmåte, bruker følgelig en syntesevindussending en syntesevindusfunksjon som omfatter en rekke vinduskoeffisienter ordnet tilsvarende i en første (etterfølgende) del og (etterfølgende) andre del. Også i tilfellet med en syntesevindusfunksjon, blir en energiverdi eller en total energiverdi av en vinduskoeffisient i den første del høyere enn en energiverdi eller en total energiverdi av en vinduskoeffisient av den andre del, der den første del omfatter færre vinduskoeffisienter enn den andre del. På grunn av denne fordeling av vinduskoeffisienter blant de to delene og at syntesevindussendingen bruker den første del av vindussendingskoeffisienter for vindussendinger som har senere tidsdomenesampler og den andre del av vinduskoeffisientene for vindussendinger av tidligere tidsdomenesampler, idet de tidligere nevnte virkninger og fordeler også gjelder for en syntesefilterbank eller en tilsvarende utførelse av en fremgangsmåte.
Detaljerte beskrivelser av syntesevindusfunksjoner og analysevindusfunksjoner brukt innenfor rammen av utførelsen av oppfinnelsen, vil nå bli beskrevet i detalj. I mange utførelser av oppfinnelsen omfatter rekkefølgen av vinduskoeffisienter av syntesevindusfunksjonen og/eller analysevindusfunksjonen nøyaktig den første gruppe og andre gruppe av vinduskoeffisienter. Videre kan hver av vinduskoeffisientene i rekkefølgen av vinduskoeffisienter tilhøre nøyaktig enten den første eller andre gruppe vinduskoeffisienter.
Hver av de to gruppene omfatter nøyaktig en del av rekkefølgen av vinduskoeffisienter på en etterfølgende måte. I oppfinnelsen omfatter en del et sett av vinduskoeffisienter i rekke i samsvar med sekvensen av vinduskoeffisienter. I utførelser ifølge oppfinnelsen omfatter hver av de to grupper (første og andre gruppe) nøyaktig en del av sekvensen av vinduskoeffisientene på den ovennevnte måte. De respektive grupper av vinduskoeffisienter omfatter ikke vinduskoeffisienter som ikke tilhører den nøyaktige ene del av den respektive gruppe. Med andre ord, omfatter mange utførelser av oppfinnelsen hver av første og andre gruppe vinduskoeffisienter bare den første del og andre del av vinduskoeffisientene uten andre vinduskoeffisienter.
Innenfor rammen av beskrivelsen, kan en etterfølgende del av sekvensen av vinduskoeffisienter forstås å være tilkoblet sett av vinduskoeffisienter i matematisk betydning, der settet ikke mangler vinduskoeffisienter sammenlignet med rekkefølgen av vinduskoeffisienter som kan ligge i en rekke (f.eks. indeksrekke eller område) av vinduskoeffisientene fra den respektive del. Som konsekvens blir rekkefølgen av vinduskoeffisienter i mange utførelser av oppfinnelsen delt nøyaktig i to sammenkoblede deler av vinduskoeffisienter som hver danner første eller andre gruppe vinduskoeffisienter. I dette tilfellet blir hver vinduskoeffisient i den første gruppe vinduskoeffisienter enten anordnet før eller etter hver av vinduskoeffisientene i den andre gruppe vinduskoeffisienter i forbindelse med den totale rekkefølgen av vinduskoeffisientene.
Med andre ord blir rekkefølgen av vinduskoeffisienter i mange utførelser delt nøyaktig i to grupper eller deler uten å etterlate noen vinduskoeffisienter. I samsvar med rekkefølgen av vinduskoeffisienter som også representerer rekkefølgen av disse, kan hver av de to grupper eller deler omfatte alle vinduskoeffisienter opp til (men ikke) eller med begynnelse fra (inkludert) en grense vinduskoeffisient. Som eksempel kan den første del eller gruppe omfatte vinduskoeffisienter med indekser fra 0 til 95 eller fra 96 til 639 i tilfellet en vindusfunksjon som omfatter 640 vinduskoeffisienter (med indekser fra 0 til 639). Her vil grensevinduskoeffisienten være den som tilsvarer indeks 96. Naturligvis kan alle andre eksempler også være mulig (f.eks. 0 til 543 og 544 til 639).
Det detaljerte eksempel på implementering av en analysefilterbank beskrevet i det følgende, tilveiebringer en filterlengde som dekker 10 blokker av inngangssampler med en systemforsinkelse på bare 2 blokker, hvilket er den tilsvarende forsinkelse som innføres av en MDCT (modified discrete cosine transform) eller en MDST (modified discrete sine transform). En forskjell er at overlapning, på grunn av den lange filterlengde som dekker 10 blokker av inngangssampler sammenlignet med en implementering av en MDCT eller MDST øker fra 1 blokk i tilfellet MDCT og MDST til en overlapping på 9 blokker. Imidlertid kan andre implementeringer også realiseres for å dekke et annet antall blokker av inngangssampler som også kalles audioinngangssampler. Videre kan andre kompromisser vurderes og implementeres.
Fig.1 viser et blokkskjema av en annen analysefilterbank 100 som en utførelse av et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler. Analysefilterbanken 100 omfatter en analysevindussending 110 for vindussending av en ramme 120 av tidsdomene, audioinngangssampler. Rammen 120 omfatter T-blokker 130-1, ..., 130-T-blokker av tidsdomeneaudio (inngangs)-sampler, der T er en positiv integer og lik 10 i tilfellet utførelsen vist på fig. 1. Imidlertid kan rammen 120 også omfatte et annet antall blokker 130.
Både rammen 120 og hver av blokkene 130 omfatter tidsdomeneaudioinngangssampler i en tidssekvens som strekker seg fra en tidlig sampel til en sen sampel i samsvar med en tidslinje som vist av en pil 140 på fig. 1. Jo lengre tidsdomeneaudiosampelet, som i dette tilfellet også er et tidsdomeneaudioinngangssampel befinner seg mot høyre, jo senere blir det tilsvarende tidsdomeneaudiosampel være i forhold til sekvensen av tidsdomeneaudiosampelet.
Analysevindussendingen 110 genereres basert på rekkefølgen av tidsdomeneaudiosampler vindussamplet i tidsdomenet, som er anordnet i en ramme 150 av vindussamplene. Ifølge rammen 120 av tidsdomeneaudioinngangssampler, omfatter også rammen av vindussamplene 150 T blokker av vindussampler 160-1, ..., 160-T. I foretrukne utførelser av oppfinnelsen omfatter hver av blokkene i vindussamplene 160 samme antall vindussampler som antallet tidsdomeneaudioinngangssampler i hver blokk 130 av tidsdomeneaudioinngangssampler. Når hver av blokkene 130 omfatter N tidsdomeneinngangsaudiosampler, kan følgelig rammen 120 og rammen 150 hver omfatte T . N sampler. I dette tilfellet er N en positiv integer som f.eks. kan erverve verdier av 32 eller 64. For T = 10, omfatter rammene 120, 150 hver henholdsvis 320 og 640 i ovennevnte tilfeller.
Analysevinduet 110 er koblet til en kalkulator 170 for å beregne audiodelbåndsverdier basert på de vindussendte sampler levert av analysevindussenderen 110. Audiodelbåndsverdiene er levert av kalkulatoren 170 som en blokk 180 av audiodelbåndsverdier, der hver av audiodelbåndsverdiene tilsvarer en audiodelbåndskanal. I en foretrukket utførelse omfatter blokk 180 av audiodelbåndsverdier også N delbåndsverdier.
Hver audiodelbåndskanal tilsvarer en karakteristisk senterfrekvens. Senterfrekvensene av de forskjelllige audiodelbåndskanaler kan f.eks. være likt fordelt eller likt anbrakt med mellomliggende avstand i forbindelse med frekvensbåndbredden av det tilsvarende audiosignal som beskrevet av tidsdomeneaudioinngangssamplene levert til analysefilterbanken 100.
Analysevindussendingen 110 er tilpasset for vindussende tidsdomeneaudioinngangssampler av rammen 120 basert på en analysevindusfunksjon som omfatter en rekke vinduskoeffisienter for å innhente vindussamplene av rammen 150. Analysevinduet 110 er tilpasset for å utføre vindussendingen av rammen av tidsdomeneaudiosampler 120 ved å multiplisere verdiene av tidsdomeneaudiosamplene med vinduskoeffisientene av analysevindusfunksjonen. Med andre ord omfatter vindussendingen og den elementvise multiplisering av tidsdomeneaudiosampler med en tilsvarende vinduskoeffisient. Ettersom både rammen 120 av tidsdomeneaudiosamplene og vinduskoeffisientene omfatter en tilsvarende sekvens, blir den elementvise multiplisering av vinduskoeffisientene og tidsdomenaudiosampler utført i samsvar med de respektive sekvenser, f.eks. som vist av en sampel- og vinduskoeffisientindeks.
I utførelser av oppfinnelsen, og i form av en analysefilterbank 100 som vist på fig. 1, omfatter analysevindusfunksjonen samt syntesevindusfunksjonen i tilfelle en syntesefilterbank, bare realverdi vinduskoeffisienter. Med andre ord er hver vinduskoeffisient tilknyttet en vinduskoeffisientindeks en virkelig verdi.
Vinduskoeffisientene danner sammen den respektive vindusfunksjon og et eksempel på dette er vist på fig. 1 som en analysevindusfunksjon 190. Som skissert før, danner sekvensen av vinduskoeffisienter analysevindusfunksjonen 190 som omfatter en første gruppe 200 og en andre gruppe 210 av vinduskoeffisienter. Den første gruppe 200 omfatter en første sammenhengende og tilkoblet del av vinduskoeffisientene av sekvensen av vinduskoeffisienter mens den andre gruppe 210 omfatter en etterfølgende og tilkoblet andre del av en vinduskoeffisient. Sammen med den første del i den første gruppe 200 danner de hele sekvensen av vinduskoeffisienter av analysevindusfunksjonen 190. Videre tilhører hver vinduskoeffisient av rekken av vinduskoeffisienter enten den første del eller den andre del av vinduskoeffisienter, slik at hele analysevindusfunksjonen 190 utgjøres av vinduskoeffisienten av den første og andre del. Den første del av vinduskoeffisientene er følgelig identisk med den første gruppen 200 av vinduskoeffisienter og den andre del er identisk med den andre gruppe 210 av vinduskoeffisienter som vist av de tilsvarende piler 200, 210 på fig. 1.
Antallet vinduskoeffisienter i den første gruppe 200 av den første del av vinduskoeffisienter er mindre enn antallet vinduskoeffisienter i den andre gruppe av den andre del av vinduskoeffisienter. Imidlertid er en energiverdi eller en total energiverdi av vinduskoeffisientene i den første gruppe 200 høyere enn en energiverdi eller en total energiverdi av vinduskoeffisientene i den andre gruppe 210. Som skissert senere, blir en energiverdi av et sett av vinduskoeffisienter basert på en sum av kvadratene av de absolutte verdier av de tilsvarende vinduskoeffisienter.
I utførelser ifølge oppfinnelsen, blir analysevindusfunksjonen 190 samt tilsvarende syntesevindusfunksjon følgelig asymmetrisk i forhold til en sekvens av vinduskoeffisienter eller en indeks av en vinduskoeffisient. Basert på et definisjonssett av vinduskoeffisientindekser over hvilken analysevindusfunksjonen 190 blir definert, er analysevindusfunksjonen 190 asymmetrisk når for alle virkelige antall n eksisterer et ytterligere virkelig antall n0, slik at den absolutte verdi av vinduskoeffisientene tilsvarer vinduskoeffisienten av vinduskoeffisientindeksen (n0- n) som ikke er lik den absolutte verdi av vinduskoeffisienten tilsvarende vinduskoeffisientindeksen (n0+ n), når (n0- n) og (n0+ n) tilhører definisjonssettet.
Som også vist skjematisk på fig. 1, omfatter videre analysevindusfunksjonen 190 tegnendringer ved hvilke produktet av to etterfølgende vinduskoeffisienter er negativ. Flere opplysninger og andre trekk ved mulige vindusfunksjoner ifølge utførelsene, vil bli omtalt i detalj i sammenheng med fig. 11-19.
Som vist tidligere, omfatter rammen av vindussendte sampler 150 en tilsvarende blokkstruktur med enkelte blokker 160-1, ..., 160-T som ramme 120 av individuelle tidsdomeneinngangssampler. Ettersom analysevindussendingen 110 er tilpasset for å vindussende tidsdomeneaudioinngangssampler ved å multiplisere disse verdiene med vinduskoeffisientene av analysevindusfunksjonen 190, er rammen 150 av vindussendte sampler også i tidsdomenet.
Kalkulatoren 170 beregner audiodelbåndsverdier, eller mer nøyaktig, bruker blokken 180 av audiodelbåndsverdiene rammen 150 av vindussendte sampler og utfører en overføring fra tidsdomenet til frekvensdomenet. Kalkulatoren 170 kan følgelig anses å være en tids/frekvenskonverter som kan forsyne blokken 180 med audiodelbåndsverdier som en spektral fremstilling av rammen 150 av vindussendte sampler.
Hver audiodelbåndsverdi av blokken 180 tilsvarer et delbånd med en karakteristisk frekvens. Antallet audiodelbåndsverdier omfattet i blokken 180 kalles også et båndnummer.
I flere utførelser ifølge oppfinnelsen, er antallet audiodelbåndsverdier i blokken 180 identisk med antallet tidsdomeneaudioinngangssampler av hver av blokkene 130 av rammen 120. I det tilfellet at rammen 150 av vindussendte sampler omfatter samme blokkvise struktur som rammen 120, slik at hver av blokkene 160 av de vindussendte sampler også omfatter samme antall vindussendte sampler som blokken av disse tidsdomeneaudioinngangssampler 130, vil blokken 180 av audiodelbåndsverdiene naturligvis også omfatte samme antall som blokken 160.
Rammen 120 kan eventuelt genereres basert på en blokk av nye tidsdomeneaudioinngangssampler 220 ved å flytte blokkene 130-1, ..., 130-(T-1) med en blokk i motsatt retning av pilen 140 som indikerer tidsretningen. Følgelig blir en ramme 120 av tidsdomeneaudioinngangssamplene som skal behandles, generert ved å flytte (T-1) siste blokker av en direkte tidligere ramme 120 av tidsdomeneaudiosamplene med en blokk mot de tidligere tidsdomeneaudiosampler og ved å legge til den nye blokk 220 av nye tidsdomeneaudiosampler som den nye blokk 130-1 som omfatter de nyeste tidsdomeneaudiosampler av gjeldende ramme 120. På fig. 1 er dette også vist av en rekke stiplede piler 230 som indikerer forflytningen av blokkene 130-1, ..., 130-(T-1) i motsatt retning av pilen 140.
På grunn av denne forflytning av blokkene 130 i motsatt retning av tiden som vist av pilen 140, omfatter en nærværende ramme 120 for behandling blokk 130-(T-1) av den direkte foregående ramme 120 som den nye blokk 130-T. Følgelig blir blokken 130-(T-1), ..., 130-2 av nærværende ramme 120 for behandling, lik blokken 130-(T-2), ..., 130-1 av den direkte foregående ramme 120. Blokken 130-T av den direkte foregående ramme 120 blir forkastet.
Som følge av dette vil hver tidsdomeneaudiosampel av den nye blokk 220 bli behandlet T ganger i rammen av T etterfølgende behandlinger av T etterfølgende rammer 120 av tidsdomeneaudioinngangssamplene. Følgelig bidrar hvert tidsdomeneaudioinngangssampel av den nye blokk 220 ikke bare til T forskjellige rammer 120, men også T forskjellige rammer 150 av vindussendte sampler og T blokker 180 av audiodelbåndsverdier. Som vist tidligere, i en foretrukket utførelse av oppfinnelsen, er antallet blokker T i rammen 120 lik 10, slik at hvert tidsdomeneaudiosampel levert til analysefilterbanken 100 bidrar til 10 forskjellige blokker 180 av audiodelbåndsverdier.
I begynnelsen, og før en enkelt ramme 120 blir behandlet av analysefilterbanken 100, kan rammen 120 initialiseres til en liten absolutt verdi (under en bestemt terskel), f.eks. verdien 0. Som forklart i detalj nedenfor, omfatter formen av analysevindusfunksjonen 190 et midtpunkt eller et "massesentrum" som typisk tilsvarer eller ligger mellom to vinduskoeffisientindekser av den første gruppe 200.
Som resultat blir antallet nye blokker 220 som settes inn i rammen 120 liten og, før rammen 120 blir fylt minst til et punkt slik at delene av rammen 120 blir opptatt av ikke-forsvinnende (dvs. ikke-nullverdsatte) verdier som tilsvarer vinduskoeffisienter med et vesentlig bidrag når det gjelder deres energiverdier. Typisk er antallet blokker som settes inn i rammen 120 før en "meningsfull" behandling kan begynne, 2-4 blokker avhengig av formen av analysevindusfunksjonen 190.
Følgelig kan analysefilterbanken 100 levere blokker 180 raskere enn ved å bruke en tilsvarende filterbank, f.eks. en symmetrisk vindusfunksjon. Siden de nye filterblokkene 220 typisk blir levert til analysefilterbanken 100 som en helhet, kan hver av de nye blokkene tilsvare en registreringseller samplingstid som vesentlig gis av lengden av blokken 220 (dvs. antallet tidsdomeneaudioinngangssampler omfattet i blokken 220) og samplingsraten eller samplingsfrekvensen. Følgelig fører analysevindusfunksjonen 190, som tatt med i en utførelse av oppfinnelsen, til minsket forsinkelse før den første og etterfølgende blokk 180 av audiodelbåndsverdier kan leveres eller sendes av filterbanken 100.
Som en annen mulighet kan apparatet 100 generere et signal eller ha informasjon om analysevindusfunksjonen 190 brukt ved generering av rammen 180 eller om en syntesevindusfunksjon for bruk i rammen for en syntesefilterbank. Således kan analysefilterfunksjonen 190 f.eks. være en tids- eller indeksreversert utgave av syntesevindusfunksjonen for bruk av syntesefilterbanken.
Fig. 2a viser et blokkskjema av en utførelse av apparatet 300 for å generere tidsdomeneaudiosampler basert på blokken av audiodelbåndsverdier. Som tidligere nevnt er en utførelse av oppfinnelsen i form av et apparat 300 for å generere tidsdomeneaudiosampler også kalt en syntesefilterbank 300 siden apparatet kan generere tidsdomeneaudiosampler som i prinsippet kan spilles av basert på audiodelbåndsverdier som omfatter spektral informasjon om et audiosignal. Følgelig kan syntesefilterbanken 300 syntetisere tidsdomeneaudiosampler basert på audiodelbåndsverdier som f.eks. kan genereres av en tilsvarende analysefilterbank 100.
Fig. 2a viser et blokkskjema av syntesefilterbanken 300 med en kalkulator 310 til hvilken en blokk 320 av audiodelbåndsverdier (i frekvensdomenet) er tilveiebrakt. Kalkulatoren 310 kan beregne en ramme 330 som omfatter en sekvens av foreløpige domenesampler fra audiodelbåndsverdier av blokken 310. Rammen 330 av foreløpige domenesampler omfatter i mange utførelser ifølge oppfinnelsen også en tilsvarende blokkstruktur som f.eks. rammen 150 av vindussendte sampler av analysefilterbanken 100 på fig. 1. I disse tilfeller omfatter rammen 300 blokken 340-1, ..., 340-T blokker av foreløpige domenesampler.
Sekvensen av foreløpige domenesampler av rammen 330 samt hver blokk 340 av foreløpige domenesampler omfatter en rekkefølge i samsvar med tiden som vist av en pil 350 på fig. 2a. Som en konsekvens omfatter rammen 330 et tidlig foreløpige domenesampel i blokk 340-T og et siste foreløpige domenesampel i blokk 340-1 som representerer første og siste foreløpige domenesampel for rammen 330. Hver av blokkene 340 omfatter også en tilsvarende rekkefølge. Som resultat, i utførelsene av en syntesefilterbank, kan uttrykkene "ramme" og "sekvens" ofte brukes synonymt.
Kalkulatoren 310 er koblet til en syntesevindussending 360 til hvilken rammen 330 av foreløpige domenesampler er tilveiebrakt. Syntesevindussendingen er tilpasset for å vindussende sekvensen av foreløpige domenesampler ved å bruke en syntesevindusfunksjon 370 som skjematisk vist på fig. 2a. Som et utgangssignal tilveiebringer syntesevindussendingen 360 en ramme 380 av vindussendte foreløpige domenesampler som også kan omfatte en blokkvis struktur av blokker 390-1, ..., 390-T.
Rammene 330 og 380 kan omfatte T-blokker 340 og 390, der T er en positiv integer. I en foretrukket utførelse ifølge oppfinnelsen, og i form av en syntesefilterbank 300, er antallet blokker T lik 10. I forskjellige utførelser kan imidlertid også forskjellige antall blokker være omfattet i en av rammene. Mer presist kan i prinsippet antallet blokker T være større eller lik 3 eller større eller lik 4 avhengig av omstendighetene ved implementeringen av de tidligere forklarte kompromisser for utførelser ifølge oppfinnelsen som omfatter en blokkvis struktur av rammer både for en syntesefilterbank 100 og en syntesefilterbank 300.
Syntesevindussendingen 360 er koblet til en overlapningsadderers utgangstrinn 400 til hvilken rammen 380 av vindussendte foreløpige domenesampler er tilveiebrakt.
Overlapningsaddererutgangstrinnet 400 kan behandle de vindussendte foreløpige domenesampler for å tilveiebringe en blokk 410 av tidsdomenesampler. Blokken 410 av de tidsdomene (utgangs) sampler kan da f.eks. være tilveiebrakt til andre komponenter for ytterligere behandling, lagring eller omdanning til hørbare audiosignaler.
Kalkulatoren 310 for å beregne sekvensen av tidsdomenesampler omfattet i rammen 330 kan overføre data fra frekvensdomenet til tidsdomenet. Følgelig kan kalkulatoren omfatte en frekvens/tidskonverter som kan generere et tidsdomenesignal av den spektrale fremstilling i blokken 320 av audiodelbåndsverdier. Som det ble forklart i sammenheng med kalkulatoren 170 av analysefilterbanken 100 på fig. 1, tilsvarer hver av audiodelbåndsverdiene av blokken 320 en audiodelbåndskanal med en karakteristisk sendt frekvens.
I motsetning til dette representerer foreløpige domenesampler i rammen 330 i prinsipp informasjon i tidsdomenet. Syntesevindussendingen 360 kan og er tilpasset for å vindussende sekvensen av foreløpige domenesampler omfattet i rammen 330 ved å bruke syntesevindusfunksjonen 370 som skjematisk vist på fig. 2a. Syntesevindusfunksjonen 370 omfatter en rekke vinduskoeffisienter som også omfatter en første gruppe 420 og en andre gruppe 430 av vinduskoeffisienter som tidligere forklart i forbindelse med vindusfunksjonen 190 med en første gruppe 200 og en andre gruppe 210 av vinduskoeffisienter.
Den første gruppe 420 av vinduskoeffisienter av syntesevindusfunksjonen 370 omfatter en første etterfølgende del av sekvensen av vinduskoeffisienter. Likeledes omfatter den andre gruppe 430 av koeffisienter også en andre etterfølgende del av sekvenser av vinduskoeffisienter, der den første del omfatter færre vinduskoeffisienter enn den andre del og der en energiverdi eller total energiverdi av vinduskoeffisientene i den første del er høyere enn den tilsvarende energiverdi av vinduskoeffisientene av den andre del. Andre trekk og egenskaper ved syntesevindusfunksjonen 370 kan tilsvare de tilsvarende trekk og egenskaper av analysevindusfunksjonen 190 som vist på fig.1. Som en konsekvens skal det her henvises til den tilsvarende beskrivelse i rammen av analysevindusfunksjonen 190 og den videre beskrivelse av vindusfunksjonene i forbindelse med fig.
11-19, der den første gruppe 200 tilsvarer den første gruppe 420 og den andre gruppe 210 tilsvarer den andre gruppe 430.
F.eks. danner delene i de to grupper 420, 430 av vinduskoeffisienter typisk hver et etterfølgende og tilkoblet sett av vinduskoeffisienter som omfatter alle vinduskoeffisienter av sekvensen av vinduskoeffisienter i vindusfunksjonen 370. I mange utførelser ifølge oppfinnelsen, er analysevindusfunksjonen 190 som vist på fig. 1 og syntesevindusfunksjonen 370 som vist på fig. 2a basert på hverandre. F.eks. kan analysevindusfunksjonen 190 være en tidsreversert eller indeksreversert versjon av syntesevindusfunksjonen 370. Imidlertid kan også andre forhold mellom de to vindusfunksjoner 190, 370 være mulig. Det kan være tilrådelig å bruke en syntesevindusfunksjon 370 i rammen av syntesevindussendingen 360 som er knyttet til analysevindusfunksjonen 190 som blir brukt i genereringen (eventuelt før ytterligere modifikasjon) av blokken 320 av audiodelbåndsverdiene levert til syntesefilterbanken 300.
Som skissert i sammenheng med fig. 1, kan syntesefilterbanken 300 på fig. 2a eventuelt tilpasses slik at den innkommende blokk 320 kan omfatte tilleggssignaler eller tilleggsdeler av informasjon om vindusfunksjonene. Som et eksempel kan blokken 320 omfatte informasjon om analysevindusfunksjonen 190 brukt for å generere blokken 320 eller syntesevindusfunksjonen 370 som skal brukes av syntesevindussenderen 360. Følgelig kan filterbanken 300 være tilpasset for å isolere den respektive informasjon og levere denne til syntesevindussenderen 360.
Overlapningsadderingens utgangstrinn 400 kan generere blokken 410 av tidsdomenesampler ved å behandle de vindussendte foreløpige domenesampler i rammen 380. I forskjellige utførelser ifølge oppfinnelsen kan overlapningsadderingstrinnet 4000 omfatte et minne for midlertidig å lagre tidligere mottatte rammer 380 av vindussendte foreløpige domenesampler. Avhengig av implementeringsdetaljer kan f.eks. overlapningsadderingens utgangstrinn 400 f.eks. omfatte T forskjellige lagringsposisjoner i minnet for å lagre et totalt antall T rammer 380 av vindussendte foreløpige domenesampler. Også et annet antall lagringsposisjoner kan være omfattet i overlapningsadderingens utgangstrinn 400 etter behov. I forskjellige utførelser kan videre overlapningsadderingens utgangstrinn 400 forsyne blokken 410 med tidsdomenesampler basert på en enkelt ramme 380 av foreløpige domenesampler alene. Utførelse av forskjellige syntesefilterbanker 300 vil bli forklart nedenfor.
Fig. 2b viser et funksjonsprinsipp i samsvar med en utførelse av oppfinnelsen i form av en syntesefilterbank 300. Blokken 320 av audiodelbåndsverdier blir først overført fra frekvensdomenet til tidsdomenet av kalkulatoren 310 som vist på fig. 2b av pilen 440. Den resulterende ramme 320 av foreløpige domenesampler omfatter blokkene 340-1, ..., 340-T av foreløpige domenesampler som deretter blir vindussendt av syntesevindussendingen 360 (ikke vist på fig. 2b) ved å multiplisere sekvensen av foreløpige domenesampler av rammen 320 med sekvensen av vinduskoeffisienter av syntesevindusfunksjonen 370 for å frembringe rammen 380 av vindussendte foreløpige domenesampler. Rammen 380 omfatter igjen blokkene 390-1, ..., 390-T av vindussendte foreløpige domenesampler som sammen danner rammen 380 av vindussendte foreløpige domenesampler.
I utførelsen vist på fig. 2b av en ny syntesefilterbank 300, blir overlapningsadderingens utgangstrinn 400 deretter i stand til å generere blokken 410 av tidsdomeneutgangssampler ved å legge til, for hver indeksverdi av tidsdomeneaudiosamplene av blokken 410, de vindussendte foreløpige domenesampler av en blokk 390 av forskjellige rammer 380. Som vist på fig. 2b, blir tidsdomeneaudiosampler av blokken 410 ervervet ved å legge til for hver audiosampelindeks, et vindussendt foreløpige domenesampel av blokken 390-1 av rammen 380 behandlet av syntesevindussendingen 360 i gjeldende runde, og som tidligere beskrevet, det tidligere foreløpige domenesampel av den andre blokk 390-2 av en ramme 380-1 behandlet umiddelbart før rammen 380 og lagret i en lagringsposisjon i overlapningsaddererens utgangstrinn 400. Som vist på fig. 2b kan ytterligere tilsvarende vindussendte foreløpige domenesampler av ytterligere blokker 390 (f.eks. blokk 390-3 av ramme 380-2, blokk 390-4 av ramme 380-3, blokk 390-5 av ramme 380-4) behandlet av syntesefilterbanken 300 tidligere, brukes. Rammene 380-2, 380-3, 380-4 og eventuelt rammer 380 har blitt behandlet av syntesefilterbanken 300 i tidligere runder. Rammen 380-2 har vært umiddelbart behandlet før rammen 380-1 og følgelig ble rammen 380-3 umiddelbart generert før rammen 380-2 osv.
Overlapningsadderingsutgangstrinnet 400 brukt i utførelsen, kan summeres for hver indeks av blokken 410 av tidsdomene (utgang)-sampler T forskjellige blokker 390-1, ..., 390-T av vindussendte foreløpige domenesampler fra T forskjellige rammer 380, 380-1, ..., 380-(T-1).
Bortsett fra de første T-blokker som behandles, blir følgelig hver av tidsdomene (utgang)-sampler av blokken 410 basert på T forskjellige blokker 320 av audiodelbåndsverdier.
Som i utførelsen ifølge oppfinnelsen, gir en analysefilterbank 100 beskrevet på fig. 1, på grunn av formene av syntesevindusfunksjonen 370, syntesefilterbanken 300 mulighet til raskt å tilveiebringe blokken 410 av tidsdomene (utgang)-sampler. Dette er også en følge av formen av vindusfunksjonen 370. Ettersom den første gruppe 420 av vinduskoeffisienter tilsvarer en høyere energiverdi og omfatter færre vinduskoeffisienter enn den andre gruppen 430, kan syntesevindussendingen 360 tilveiebringe "meningsfulle" rammer 380 av vindussendte sampler når rammen 330 av foreløpige domenesamplene blir fylt, slik at i det minste vinduskoeffisientene av den første gruppe 420 bidrar til rammen 380. Vinduskoeffisientene av den andre gruppe 430 yter et mindre bidrag på grunn av deres mindre energiverdi.
I begynnelsen blir følgelig syntesefilterbanken 300 initialisert med 0, idet bruken av blokkene 410 i prinsipp kan startes bare når noen få blokker 320 av audiodelbåndsverdiene har blitt mottatt av syntesefilterbanken 300. Følgelig kan også syntesefilterbanken 300 bidra til en vesentlig forsinkelsesreduksjon sammenlignet med syntesefilterbanken som f.eks. har en symmetrisk syntesevindusfunksjon.
Som tidligere nevnt kan kalkulatorene 170 og 310 av utførelsene på fig. 1 og 2a implementeres som realverdi kalkulatorer som genererer eller som kan behandle realverdi audiodelbåndsverdier av blokkene 180 og 320. I disse tilfeller kan kalkulatorene f.eks. implementeres som realverdi kalkulatorer basert på harmoniske oscilleringsfunksjoner, slik som sinusfunksjonen eller cosinusfunksjonen. Også kompleksverdie kalkulatorer kan implementeres som kalkulatorene 170, 310. I disse tilfeller kan kalkulatorene f.eks. implementeres på basis av komplekse eksponentialfunksjoner eller andre harmoniske kompleksverdi funksjoner. Frekvensen av de realverdi eller imaginærverdi oscillasjoner er avhengig vanligvis av indeksen av audiodelbåndsverdien som også kan kalles båndindeksen eller delbåndsindeksen av det spesifikke delbånd. Videre kan frekvensen være identisk eller avhengig av senterfrekvensen av tilsvarende delbånd. F.eks. kan frekvensen av oscillasjonen multipliseres med en konstant faktor og forflyttes i forhold til senterfrekvensen av det tilsvarende delbånd eller kan være avhengig av en kombinasjon av begge modifikasjoner.
En kompleksverdi kalkulator 170, 310 kan konstrueres eller implementeres basert på realverdi kalkulatorer. For en kompleksverdi kalkulator, kan f.eks. en effektiv implementering i prinsippet bli brukt for både den cosinus- og sinusmodulerte del av en filterbank som representerer den virkelige og tenkte del av en kompleksverdi komponent. Dette innebærer at det blir mulig å implementere både den cosinusmodulerte del og den sinusmodulerte del f.eks. basert på de modifiserte DCT-IV- og DST-IV-strukturer. Videre kan andre implementeringer gjøre bruk av en FFT (FFT = Fast Fourier-transformering) som eventuelt implementeres felles for både den virkelig del og delen av de kompleksmodulerte kalkulatorer som bruker en FFT eller som i stedet bruker et separat FFT-trinn for hver transformering.
Matemat
zisk beskrivelse
De følgende avsnitt vil beskrive et eksempel på utførelse av en analysefilterbank og syntesefilterbank med flere overlapninger av 8 blokker til delen som ikke forårsaker ytterligere forsinkelse som forklart ovenfor og en blokk til fremtiden som forårsaker samme forsinkelse som for en MDCT/MDST-struktur (MDCT = Modified Discrete Cosine Transform; MDST = Modified Discrete S d
<,>ine Tr(a1n0sNform1). M )e r parameteren T i de
En beskrivelse av den kompleksmodulerte analysefilterbank med liten forsinkelse vil først bli gitt. Som vist på fig. 1 omfat<,>andre ord bli t følgende eksempel lik 10.
ter analysefilterbanken 100 transformasjonstrinnene av en analysevindussending utført av analysevindussendingen 110 og en analysemodulasjon utført av kalkulatoren 170. Analysevindussendingen baseres på ligningen
der zi,ner (virkelig verdsatt) vindusutsendt0 sampe
virk1l
e0 tilsvarende blokkindeksen i og sampelindeksen n av rammen 150 vist på fig. 1. Verdien xi,ner ( lig
r N verdsatt) tidsinngangsamplet tilsvarende samme blokkindeks i og sampelindeks n. Analysevindusfunksjonen 190 fremstilles i ligning (1) av sine realverdi vinduskoeffisienter w(n), der n også er vinduskoeffisientindeksen i rekken vist i ligning (1). Som allerede tidligere forklart, er parameteren N antallet sampler i en blokk 220, 130, 160, 180.
Fra argumentene av analysevindu
nrer
t avn en
k��s kfu
ba�nk
ksi���sj
d
syntesevindusfunksjonen som faktisk er represen����onen W(10N-1-n) kan det ses at analysevind f
tert av vinduskoeffisienten w(n).
A0na<e>u
l<l>s
ys<k>unksjonen
e Nmodulas z re eversjon eller en tidsreversert versjon av joncp
eor
nsesente
utfø alkula å fig. 1, er basert på de to ligningene
og<,,k>� m er en integ mrådet
. ����<��>z<,>sin�����n�n�� ��to���ren 170 i utførelsen p
for spektralkoeffisientindeksen eller båndindeksen k so er i o
<(4)>Verdiene XReal,i,kog Ximag,i,krepresenterer den virkelige del og den tenkte del av den imaginærverdi audiodelbåndsverdi tilsvarende blokkindeksen i og spektralkoeffisientindeksen k av blokken 180. Parameteren n0representerer en indeksmulighet som er lik
<(5)>
Den svarende kompleksmodulerte syntesefilterbank med liten forsinkelse omfatter transformeringstrinnene i en syntesemodulasjon, en syntesevindussending og en overlapningsaddering som vil bli beskrevet.
Syntesemodulasjon er basert på ligningen
,ner<,>til
<(6)>
der x'iet foreløpige d enesampel av rammen 330 d ampelindeksen n og blokkindeksen i. Igjen er parameteren N en integer som indikerer lengden av blokken 320, 340, 390, 410 som gså kan kalleseom
transformeringslengden eller, nn av den blokkvise struktur av rammene 330, 380, en forskyvning av den foregående blokk. Også de andre variablene og parametrene har blitt innført ovenfor, slik som den spek k t
p
t�<�>ilsvaren
å gru
rale koe ke s
ffisientindeks k og forskyvningen n
z0.
Syntese ussend n utført av syntesevindussendingen 360 i utførelsen på fig. 2a er basert på l
'� �zz o
' '<,>igningen
'�z� '�(vin
� )d 'inge
<(7)>
der z'i,ner verdien av det
ti ' vindussen
dsdomene0dte fore
(utgang1løpige domenesampel tilsvarende sampelindeksen n og blokkindeksen i av rammen 380.
Transformeringsstempelet i overlap
s '0nin
)-s Ngsadderingen er basert på ligning
)
der outi,nrepresenterer amplet tilsvarende s mpe d ksen
s derin 'soperasjonen som tf
n ifølge oppfinnelsen ikke begrenset til kompleksmodulerte filterbanker med liten forsinkelse for en audiosignalbehandling med en a 'i
v disse filterbanker. elig verdsatt implezm�en�teringz '
a�v e�n filtzer� l
ba�nk mz '
ed� li�ad
ten foz (
rs�8
g
in�a
kelse z fo�n
r f�e
orbedf n blokkindeksen i. Ligning (8) viser følgelig overlapning u ørt overlapningsadderingsutgangstrinnet 400 som vist i den nedre del på fig. 2b.
Imidlertid er utførelse
retr o
a0g
udiokoding med liten forsinkelse kan også implementeres. For sammenligning avslører f.eks. ligningene (2) og (6) for en cosinusdel, cosinusbidraget av analysemodulasjonen og syntesemodulasjonen en sammenlignbar struktur når en MDCT vurderes. Selv om fremgangsmåten i prinsipp tillater utvidelse av MDCT i begge retninger i tid, blir bare en forlengelse av E (= T-2)-blokker til ti N En virk
en dligere brukt her, idet hver av de T-blokker omfatter N sampler. Frekvenskoeffisienten Xi,kav båndet k og blokken i i en N-kanal- eller N-båndanalysefilterbank kan oppsummeres av
for den spe rale koeffisientindeks k som definert av ligning (4). Her er enda en gang n en sampelindeks og w analysevindusfunksjonen.
For å fullføre kan den tidligere gitte matematiske beskrivelse av den kompleksmodulerte analyse e<,>kt
rbank med liten forsinke
tvidelsen av åtte blokker til tidligere har blitt erstattet med variabelen E (=8) i motsetning til ligningen g (3).
Trinnene av syntesemodulasjonen og syntesevindussendingen som beskrevet for det komplekse tilfellet i ligningene (6) og (7) kan oppsummeres i tilfellet med en virkelig verdsatt syntesefi ze (2
lte<,>r k) o
ba R�aer
filt
a<�>m� lse gis i samme oppsummeringsform som ligning (9) ved å bytte cosinusfunksjonen med kompleksverdi eksponentialfunksjoner. Mer nøyaktig, kan ligningene (1), (2), (3) og (5), med definisjonen og variablene gitt ovenfor, oppsummeres og utvides i samsvar med
der u
m 38 ige domenesampler som også kalles den demodulerte vektor, av
der z'i,ner vindussendte foreløp
sen n er enda en g
<,>i
a<k>av de se
ge domenesampel tilsvarende båndindeksen i og sampelindeksen n. Sampelindek ng en intege området
og ws(n<,>is
)x er syntese kvinduet som er kompatibelt med analysevinduet wa(n) av ligning (9).
Transforma<�>g
sjonstrinnet av overlapningsadderingen blir deretter gitt av
der x'i,ner t rekonstruerte signal eller snarere et
v )te
t( fore
l
<, ,>de�<�>nk
� N1.
�e zr 'l<�>a<l>p<�>n<l�>i(enN vi(ndus<�>nd
r i
ng)0
sad���� idsdo
t 400 )løp
menesampel av blokken 410 som tilveiebrakt av o deringsutgangstrinne vist på fig. 2a.
For den kompleksverdi sy<,>ntese��<�>filte<�>rb�ank 300, kan k ligninger (6) og (7) oppsummeres og generaliseres i forbindelse med forlengelsen av E(=8) blokker t���il���� banen ifølge
<der som er den tenkte enhet. Ligning (13) representerer den generaliserte form av ligning>(8) og er også gyldig for imaginærverdi tilfellet.
Som en direkte sammenligning mellom ligning (14) og ligning (7), er vindusfunksjonen w(n) av ligning (7) den samme syntesevindusfunksjon som ws(n) av ligning (14). Som skissert tidligere, viser den tilsvarende sammenligning mellom ligning (10) med analysevindusfunksjonskoeffisienten wa(n) og ligning (1) at analysevindusfunksjonen er den tidsreverserte versjon av syntesevindusfunksjonen i tilfelle ligningen (1).
Ettersom både analysefilterbank 100 som vist på fig.1 og en syntesefilterbank 300 som vist på fig. 2a gir en vesentlig forbedring når det gjelder et kompromiss mellom forsinkelse på den ene side og kvaliteten av audiobehandlingen på en annen, kan filterbankene 100, 300 ofte kalles filterbanker med liten forsinkelse. Den kompleksverdi versjon kalles også filterbank med kompleks liten forsinkelse som er forkortet som CLDFB. I enkelte tilfeller blir uttrykket CLDFB ikke bare brukt for den imaginærverdi versjon men også for den realverdi versjon av filterbanken.
Som den tidligere diskusjon av den matematiske bakgrunn har vist, bruker rammen for implementering av de foreslåtte filterbanker med liten forsinkelse en MDCT- eller IMDCT-lignende (IMDCT = invers MDCT)-struktur som kjent fra MPEG-4-standarden ved å bruke en utvidet overlapning. Tilleggsoverlapningsområdene kan knyttes på en blokkvis måte til venstre samt høyre side av den MCDT-lignende kjerne. Her blir bare utvidelsen mot høyre side (for syntesefilterbanken) brukt som virker fra bare de tidligere sampler og følgelig ikke forårsaker ytterligere forsinkelser.
Undersøkelse av ligningene (1), (2) og (14) har vist at behandlingen er svært lik den som gjelder for en MDCT eller IMDCT. Ved bare små modifikasjoner som omfatter en modifisert analysevindusfunksjon og syntesevindusfunksjon, blir MDCT eller IMDCT utvidet til en modulert filterbank som kan håndtere flere overlapninger og som er svært fleksibel omkring dens forsinkelse. Som f.eks. ligningene (2) og (3) har vist, blir den komplekse versjon i prinsipp oppnådd ved ganske enkelt å legge til en sinusmodulasjon til den gitte cosinusmodulasjon.
Interpolasjon
Som sitert i sammenheng med fig. 1 og 2a, kan både analysevindussendingen 110 og syntesevindussendingen 360 eller de respektive filterbanker 100, 300 tilpasses for vindussending av de respektive rammer av tidsdomenesampler ved å multiplisere hvert av de respektive tidsdomeneaudiosampler med en individuell vinduskoeffisient. Hvert av tidsdomenesamplene blir med andre ord multiplisert av en (individuell) vinduskoeffisient som f.eks. ligningene (1), (7), (9), (10), (11), (14) har vist. Som konsekvens blir antallet vinduskoeffisienter av den respektive vindusfunksjon typisk identisk med antallet respektive tidsdomeneaudiosampler.
Under enkelte implementeringstilfeller kan det imidlertid være tilrådelig å implementere en vindusfunksjon med et større antall vinduskoeffisienter sammenlignet med den faktiske vindusfunksjon som har et mindre første antall koeffisienter og som faktisk blir brukt under vindussendingen av den respektive ramme eller sekvens av tidsdomeneaudiosampler. Dette kan f.eks. være tilrådelig i tilfellet når minnekravene ti en spesifikk implementering blir mer verdifull enn beregningseffektiviteten. Et annet tilfelle hvor en nedsampling av vinduskoeffisientene kan bli anvendelig, er i tilfellet med den såkalte doble rate, som f.eks. blir brukt i rammen av SBR-systemer (SBR = Spectral Band Replication). Ideen med SBR vil bli forklart i detalj i forbindelse med fig. 5 og 6.
I et slikt tilfelle kan analysevindussendingen 110 eller syntesevindussendingen 360 videre tilpasses slik at den respektive vindusfunksjon brukt for vindussending av tidsdomeneaudiosampler levert til den respektive vindussending 110, 360 blir avledet av en interpolasjon av vinduskoeffisientene av den større vindusfunksjon som har et større andre antall vinduskoeffisienter.
Interpolasjonen kan f.eks. utføres ved en lineær, polynomial eller kilebasert interpolasjon. I tilfellet den lineære interpolasjon, men også i tilfellet med en polynomial eller kilebasert interpolasjon, kan f.eks. den respektive vindussending 100, 360 kunne implementere vinduskoeffisientene av vindusfunksjonen brukt for vindussending basert på to etterfølgende vinduskoeffisienter av den større vindusfunksjon i samsvar med en sekvens av vinduskoeffisientene av den større vindusfunksjon for å tilveiebringe en vinduskoeffisient av vindusfunksjonen.
Spesielt i tilfellet med et likt antall tidsdomeneaudiosampler og vinduskoeffisienter, fører en implementering av en interpolasjon som tidligere beskrevet i en vesentlig forbedring av lydkvaliteten. I tilfellet med et likt antall N . T av tidsdomeneaudiosampler i en av rammene 120, 330, som ikke bruker en interpolasjon, f.eks. en lineær interpolasjon, vil f.eks. føre til alvorlig fremmedeffekter under den ytterligere behandling av de respektive tidsdomeneaudiosampler.
Fig. 3 viser et eksempel på en lineær interpolasjon basert på en vindusfunksjon (en analysevindusfunksjon eller en syntesevindusfunksjon) for bruk i forbindelse med rammene som omfatter N . T/2 tidsdomeneaudiosampler. På grunn av begrensninger eller andre implementeringsdetaljer, blir vinduskoeffisientene av selve vindusfunksjonen ikke lagret i et minne men en større vindusfunksjon som omfatter N T vinduskoeffisienter blir lagret under et egnet minne eller på annen måte gjort tilgjengelig. Fig. 3 viser øverst i tilsvarende vinduskoeffisienter c(n) som funksjon av vinduskoeffisientindeksene n i området mellom 0 og N . T-1.
Basert på en lineær interpolasjon av to etterfølgende vinduskoeffisienter av
vindusfun
A<i>ksjonen som har det større antall vinduskoeffisienter som vist i den øvre graf på fig.3, blir en interpolert vindu j n b
ntallet int<2>sfunks
erpolert<2>o
e vin<1>er basert p
d�egnet å ligningene
uskoe
indu<0>.
ffisiente n) av vindusfunksjonen som skal brukes på en ramme med N . T/2 tidsdomeneaudiosampler omfatter halvparten av antallet vinduskoeffisienter.
For å illustrere dette videre er vinduskoeffisientene 450-0, ..., 450-7 på fig. 3 vist i en øvre del av fig. 3 tilsvarende en vinduskoeffisient c(0), ..., c(7). Basert på
sfunksjo<N>r c
ne<T>i(
n, f<2>disse vinduskoeffisienter og ytterligere vinduskoeffisienter av v ører en anvendelse av ligning (15) til vinduskoeffisientene ci(n) av den interpolerte vindusfunksjon vist i den nedre del på fig.3. F.eks. basert på vinduskoeffisientene 450-2 og 450-3, blir vinduskoeffisienten 460-1 generert basert på ligning (15) som vist av pilene 470 på fig.3. Følgelig blir vinduskoeffisienten 460-2 av den interpolerte vindusfunksjon beregnet basert på vinduskoeffisienten 450-4, 450-5 av vindusfunksjonen vist i en øvre del av fig. 3. Fig. 3 viser genereringen av ytterligere vinduskoeffisienter ci(n).
For å vise fremmedkanselleringen som oppnås ved interpolert nedsampling av vindusfunksjonen, viser fig. 4 interpoleringen av vinduskoeffisientene i tilfellet en sinusvindusfunksjon som f.eks. kan brukes i en MDCT. For enkelthets skyld er venstre halvdel av vindusfunksjonen og høyre h(aNlvdel av vindusfunksjonen tegnet over hverandre. Fig. 4 viser en forenklet versjon av et sinusvindu som omfatter bare 2 . 4 vinduskoeffisienter eller punkter for en MDCT med en lengde på 8 sampler.
Fig. 4 viser fire vinduskoeffisienter 408-1, 408-2, 408-3 og 408-4 av den første halvdel av sinusvinduet og fire vinduskoeffisienter 490-1, 490-2, 490-3 og 390-4 av den andre halvdel av sinusvinduet. Vinduskoeffisientene 490-1, ..., 490-4 tilsvarer vinduskoeffisientindeksene 5, ..., 8. Vinduskoeffisientene 490-1, ..., 490-4 tilsvarer den andre halvdel av lengden av vindusfunksjonen, slik at gitt N' = 4 blir lagt til for å oppnå de virkelige indekser til indeksene.
For å redusere eller tilveiebringe kanselleringen av fremmedeffekter som beskrevet ovenfor, bør vindus(ko)ef(fNis'ie1nten) oppfylle' til)felle(t2N'1 )<(16)>
så godt som mulig. Jo bedre forholdet (16) blir oppfylt, jo bedre blir fremmedundertrykkelsen eller fremmedkanselleringen.
Forutsatt situasjonen at en ny vindusfunksjon med halvparten av vinduskoeffisientene skal bestemmes for den venstre halvdel av vindusfunksjonen, vil følgende problem oppstå. På grunn av at vindusfunksjonen omfatter et likt antall vinduskoeffisienter (lik nummerert nedsampling), uten å bruke et interpoleringssystem som skissert på fig. 3, tilsvarer vinduskoeffisientene 480-1 og 480-3 eller 480-2 og 480-4 bare en fremmedverdi av den opprinnelige vindusfunksjon eller det opprinnelige filter.
Dette fører til en ubalansert andel av spektralenergi og fører til usymmetrisk omfordeling av senterpunktet (massesenter) av den tilsvarende vindusfunksjon. Basert på interpolasjonsligningen (15) for vinduskoeffisienten w(n) på fig. 4, oppfyller de interpolerte verdier I1og I2fremmedforholdet (16) på en langt bedre måte og vil følgelig føre til en vesentlig forbedring i kvaliteten av de behandlede audiodata.
Ved å bruke et enda mer avansert interpoleringssystem, kan f.eks. en kile eller annet tilsvarende interpoleringssystem føre til vinduskoeffisienter som oppfyller forholdet (16) enda bedre. En lineær interpolasjon er i de fleste tilfeller tilstrekkelig og muliggjør en rask og effektiv implementering.
Situasjonen i tilfellet med et typisk SBR-system bruker en SBR-QMF-filterbank (QMF = Quadrature Mirror Filter), idet en lineær interpolasjon eller annet interpolasjonssystem ikke er nødvendig å implementere ettersom SBR-QMF-prototypefilteret omfatter et ulikt antall prototypefilterkoeffisienter. Dette innebærer at SBR-QMF-prototypefilteret omfatter en maksimal verdi med hensyn til hvordan nedsamplingen kan implementeres, slik at symmetrien av SBR-QMF-prototypefilteret forblir intakt.
På fig. 5 og 6 vil det nå bli beskrevet en mulig anvendelse for utførelse ifølge oppfinnelsen i form av både en analysefilterbank og en syntesefilterbank. Et viktig anvendelsesområde er et SBR-system eller SBR-verktøy (SBR = Spectral Band Replication).
Imidlertid kan andre anvendelser av utførelser komme fra andre områder hvor det er behov for spektralmodifikasjoner (f.eks. gevinstmodifikasjoner eller utjevnere), slik som ved spatial audioobjektkoding, parametrisk stereokoding med liten forsinkelse, spatial/surroundkoding med liten forsinkelse, rammetapskjuling, ekkokansellering eller andre tilsvarende anvendelser.
Hovedideen bak SBR er den observasjon av det fins vanligvis en sterk korrelering mellom egenskapene til et høyfrekvensområde av et signal som kan kalles såkalt høybåndsignal og egenskapene ved et lavbåndsfrekvensområde som kan kalles lavbånd eller lavbåndssignaler av det samme signalet. Således kan en god approksimering for gjengivelsen av det opprinnelige inngangssignalets høybånd oppnås av en transponering fra lavbånd til høybånd.
I tillegg til transponeringen, bruker rekonstruksjonen av høybånd forming av en spektral omslutning som omfatter en justering av styrkene. Denne prosess blir typisk regulert av en overføring av høybåndsspektralomslutningen av det opprinnelige inngangssignal. Ytterligere veiledningsinformasjon sendt fra koderen regulerer ytterligere syntesemoduler, slik som en invers filtrering, et støy- og sinustillegg for å takle et audiomateriale når transponeringen alene ikke er tilstrekkelig. Tilsvarende parametere omfatter parametrene "støyhøybånd" for tillegg av støy og parameteren "tonalitetshøybånd" for sinustillegget. Denne veiledningsinformasjon kalles også SBR-data.
SBR-prosessen kan kombineres med en konvensjonell bølgeform eller kodek ved hjelp av en forhåndsbehandling ved kodersiden og etterbehandling på dekodersiden. SBR koder høyfrekvensdelen av et audiosignal til en svært lav kostnad mens audiokodeken blir brukt for å kode den lavere frekvensdel av signalet.
På kodersiden blir det opprinnelige inngangssignal analysert og høybåndsspektralomslutningen og dens egenskaper i forhold til lavbåndet blir kodet og de resulterende SBR-data blir multiplekset med en bitstrøm fra kodek for lavbåndet. På dekodersiden blir SBR-data først av-multiplekset. Dekodingsprosessen blir generelt organisert i trinn. Først genererer kjernedekoderen lavbåndet og deretter virker SBR-dekoderen som en etterbehandler ved å bruke de dekodede SBR-data for å lede spektralbåndrepliseringen. Et utgangssignal med fullstendig båndbredde blir da oppnådd.
For å oppnå en kodingseffektivitet som er så høy som mulig og holde beregningskompleksiteten lav, blir SBR-forbedrede kodeker ofte implementert og såkalte doble ratesystemer. Dobbelrate innebærer at båndets begrensede kjernekodek blir brukt ved halvparten av den eksterne audiosamplingsrate. På en annen side blir SBR-delen behandlet ved en fullstendig samplingsfrekvens.
Fig. 5 viser et skjematisk blokkskjema av et SBR-system 500. SBR-systemet 500 omfatter f.eks. en AAC-LD-koder (AAC-LD = Advanced Audio Codec Low-delay) 510 og en SBR-koder 520 som audiodata skal behandles til, blir tilveiebrakt parallelt. SBR-koderen 520 omfatter en analysefilterbank 530 som er vist på fig. 5 som QMF-analysefilterbank. Analysefilterbanken 530 kan levere delbåndsaudioverdier tilsvarende delbåndene basert på audiosignalene levert til SBR systemet 500. Disse delbåndsaudioverdier blir deretter levert til en modul for SBR-parameteruttrekning 540 som genererer SBR-dataene som tidligere beskrevet f.eks. omfattende den spektrale omslutning for høybåndet, høybåndsstøyparameteren og høybåndstonalitetsparameteren. Disse SBR-data blir deretter levert til AAC-LD-koderen 510.
AAC-LD-koderen 510 er vist på fig.5 som en koder for dobbelrate. Med andre ord virker koderen 510 ved halve samplingsfrekvensen sammenlignet med samplingsfrekvensen av audiodataene levert til koderen 510. For dette omfatter AAC-LD-koderen 510 et nedsamplingstrinn 550 som eventuelt kan omfatte et lavpassfilter for å unngå forvrengninger forårsaket f.eks. av en overtredelse av Nyquist-Shannon-teorien. De nedsamplede audiodata blir sendt av nedsamplingstrinnet 550 til en koder 560 (analysefilterbank) i form av en MDCT-filterbank.
Signalene levert av koderen 560 blir deretter kvantisert og kodet i kvantiserings- og kodingstrinnet 570. Videre blir SBR-data levert av SBR-parameteruttrekningsmodulen 540 også kodet for å oppnå en bitstrøm som deretter vil bli sendt av AAC-LD-koderen 510. Kvantiserings- og kodingstrinnet 570 kan f.eks. kvantisere dataene i samsvar med ørets lytteegenskaper.
Bitstrømmen blir deretter levert til en AAC-LD-dekoder 580 som er en del av dekodersiden som bitstrømmen blir transportert til. AAC-LD-dekoderen omfatter et dekodings- og dekvantiseringstrinn 590 som henter ut SBR-data fra bitstrømmen og de dekvantiserte eller gjenkvantiserte audiodata i frekvensdomenet representerer lavbåndet. Lavbåndsdata blir deretter levert til en syntesefilterbank 600 (omvendt MDCT-filterbank). Det omvendte eller inverse MDCT-trinn (MDCT<-1>) 600 konverterer signalene levert til det omvendte MDCT-trinn fra frekvensdomenet til tidsdomenet for å levere et tidssignal. Dette tidsdomenesignal blir deretter levert til SBR-dekoderen 610 som omfatter en analysefilterbank 620 som vist på fig. 5 som en QMF-analysefilterbank.
Analysefilterbanken 620 utfører en spektralanalyse av tidssignalet levert til analysefilterbanken 620 som representerer lavbåndet. Disse dataene blir deretter levert til en høyfrekvensgenerator 630 som også kalles en HF-generator. Basert på SBR-dataene levert av AAC-LD-koderen 580 og dens dekodings- og dekvantiseringstrinn 590, genererer HF-generatoren 630 høybåndet basert på lavbåndssignalene levert av analysefilterbanken 620. Både lavbånds- og høybåndssignalene blir deretter levert til en syntesefilterbank 640 som overfører lavbånds- og høybåndssignaler fra frekvensdomenet til tidsdomenet for å levere et tidsdomeneaudioutgangssignal fra SBR-systemet 500.
For å fullføre skal det bemerkes at SBR-systemet 500 i mange tilfeller, og som vist på fig.
5, ikke blir implementert på denne måte. Mer nøyaktig blir AAC-LD-koderen 510 og SBR-koderen 520 vanligvis implementert på kodersiden som vanligvis implementeres separat fra dekodersiden og omfatter AAC-LD-dekoderen 580 og SBR-dekoderen 610. Med andre ord representerer systemet 500 vist på fig. 5 vesentlig tilkoblingen av to systemer, nemlig en dekoder som omfatter nevnte kodere 510, 520 og en dekoder som omfatter de nevnte dekodere 580, 610.
Utførelsene ifølge oppfinnelsen i form av analysefilterbanker 100 og syntesefilterbanker 300 kan f.eks. implementeres i systemet 500 på fig. 5 som en erstatning for analysefilterbanken 530, analysefilterbanken 620 og syntesefilterbanken 640. Med andre ord kan f.eks. syntese- eller analysefilterbanken av SBR-komponenten av systemet 500 erstattes av tilsvarende utførelser av oppfinnelsen. Videre kan MDCT 560 og den inverse MDCT 600 også erstattes av analyse- og syntesefilterbanker med liten forsinkelse. I dette tilfellet, og hvis alle de beskrevne erstatninger har blitt implementert, vil den såkalte forbedrede AAC-kodek med liten forsinkelse (kodek = koderdekoder) bli realisert.
Den forbedrede AAC (AAC-ELD) med liten forsinkelse tar sikte på å kombinere trekkene ved en AAC-LD med liten forsinkelse (Advanced Audio Coded - Low-delay) med en høy kodingseffektivitet av HE-AAC (High Efficiency Advanced Audio Codec) ved å utnytte SBR med AAC-LD. SBR-dekoderen 610 virker i dette tilfellet som en etterbehandler som blir brukt etter kjernedekoderen 580 med en komplett analysefilterbank og en syntesefilterbank 640. Følgelig legger komponentene av SBR-dekoderen 610 til ytterligere dekodingsforsinkelse som vist på fig. 5 ved skyggelegging av komponentene 620, 630, 540.
I mange implementeringer av SBR-systemene 500, varierer den nedre frekvensdel eller lavbåndsområdene typisk fra 0 kHz til typisk 5-15 kHz og blir kodet ved å bruke en bølgeformkoder kalt kjernekodek. Kjernekodeken kan f.eks. være av MPEG-audiokodekfamilien. I tillegg blir en rekonstruksjon av høyfrekvensdelen eller høybåndet oppnådd ved en overgang av lavbåndet.
Kombinasjonen av SBR med en kjernekoder blir i mange tilfelle implementert som et dobbelt ratesystem, der den underliggende AAC-koder/dekoder blir brukt ved halvparten av samplingsraten av SBR-koder/dekoder.
De fleste styredata blir brukt for den spektrale omslutningsvisning som har en varierende tids- og frekvensoppløsning for å styre SBR-prosessen best mulig med så lite tilleggsinformasjon som mulig. De andre styredata forsøker hovedsakelig å styre det tonale/støy-forholdet i høybåndet.
Som vist på fig. 5 blir signalet fra den underliggende AAC-dekoder 580 typisk analysert med en 32-kanals QMF-filterbank 620. Deretter gjenskaper HF-generatormodulen 630 høybåndet ved å reparere QMF-delbåndene fra det eksisterende lavbånd til høybåndet. Videre blir inversfiltrering utført på delbåndsbasis basert på styredataene fra bitstrømmen (SBR-data).
Omslutningsjustereren modifiserer den spektral omslutning av det regenererte høybånd og legger til tilleggskomponenter, slik som støy og sinusoider som legges til i samsvar med styredataene i bitstrømmen. Siden alle operasjoner utføres i frekvensdomenet (også kjent som QMF- eller delbåndsdomenet), blir det endelige trinn fra dekoderen 610 en QMF-syntese 640 for å beholde tidsdomenesignalet. I tilfellet at QMF-analysen på kodersiden utføres på et 32 QMF-delbåndssystem for 1024 tidsdomenesampler, fører høyfrekvenskonstruksjonen i 64-QMF-delbånd på hvilke syntesen utføres ved å produsere 2048 tidsdomenesampler, slik at en oppsampling med en faktor på 2, tilveiebringes.
I tillegg blir forsinkelsen av kjernekoderen 510 doblet ved å bruke halvparten av den opprinnelige samplingsrate i den doble ratemodus som kan forårsake flere forsinkelseskilder i både koder- og dekoderprosessen av en AAC-LD i kombinasjon med SBR. I det følgende blir slike forsinkelseskilder undersøkt og deres forsinkelse minimert.
Fig. 6 viser et forenklet blokkskjema av systemet 500 på fig.5. Fig. 6 konsentrerer seg om forsinkelseskilder i koder/dekoderprosessen ved å bruke SBR og filterbanker med liten forsinkelse for koding. Ved å sammenligne fig. 6 med fig. 5, har MDCT 560 og den inverse MDCT 600 blitt erstattet av forsinkelsesoptimerte moduler, den såkalte MDCT 560' med liten forsinkelse (LD MDCT) og den inverse MDCT 600' (LD IMDCT) med liten forsinkelse. Videre har HF-generatoren 630 også blitt erstattet med en forsinkelsesoptimert modul 630'.
Bortsett fra MEDCT 560' med liten forsinkelse og den inverse MDCT 600' med liten forsinkelse, blir en modifisert SBR-ramme og en modifisert HF-generator 630' brukt i systemet på fig. 6. For å unngå forsinkelse med forskjellig ramming av en kjernekoder/dekoder 560, 600 og henholdsvis SBR-modulen, blir SBR-rammeutsendelsen tilpasset for å passe til rammelengden på 480 eller 512 sampler av AAC-LD. Videre blir det variable tidsgitter av HF-generatoren 630 som innebærer 384 sampler av forsinkelser, begrenset i forbindelse med spredningen av SBR-data over AC-LD-rammer. Således blir den eneste gjenværende kilde av forsinkelse i SBR-modulen filterbankene 530, 620 og 640.
I samsvar med situasjonen vist på fig. 6 som representerer delvis implementering av AAC-ELD kodeken, har enkelte forsinkelsesoptimeringer allerede blitt implementert slik som bruk av en filterbank med liten forsinkelse i AAC-LD-kjernen og fjerning av den tidligere nevnte SBR-overlapning. For ytterligere forbedringer i forsinkelsen, må de gjenværende moduler undersøkes. Fig. 6 viser forsinkelseskildene i koder/dekoderprosessen ved å bruke SBR og filterbankene med liten forsinkelse kalt LD-MDCT og LD-IMDCT. Sammenlignet med fig. 5, representerer hver boks på fig. 6 en forsinkelseskilde, der forsinkelsesoptimeringsmodulene er tegnet skyggelagt. De like modulene har blitt optimert for liten forsinkelse så langt.
Fig. 7a viser et flytskjema som omfatter en C- eller C++- kvasikode for å vise en utførelse ifølge oppfinnelsen i form av en analysefilterbank eller en tilsvarende fremgangsmåte for å generere audiodelbåndsverdier i audiodelbåndskanaler. Mer nøyaktig viser fig. 7a et flytskjema av en kompleksverdi analysefilterbank for 32 bånd.
Som nevnt tidligere blir analysefilterbanken brukt for å dele tidsdomenesignalet, f.eks. sendt fra kjernekoderen til N = 32 delbåndssignaler. Signalet fra filterbanken, delbåndssamplene eller audiodelbåndsverdiene blir i tilfellet med en kompleksverdi analysefilterbank kompleksverdi og oversamples således av en faktor på 2 sammenlignet med filterbank av virkelig verdi.
Filtreringen innebærer å omfatte følgende trinn, der en rekke x(n) omfatter nøyaktig 320 tidsdomenesampler. Jo høyere indeksen av samplene n er i rekken, jo eldre er samplene.
Etter begynnelsen av utførelsen av fremgangsmåten i trinn S100, blir først samplene i rekken x(n) flyttet med 32 posisjoner i trinn S110. De eldste 32 sampler blir forkastet og 32 nye sampler blir lagret i posisjonen 31-0 i trinn S120. Som vist på fig. 7a blir de innkommende tidsdomeneaudiosampler lagret i posisjoner tilsvarende en minskende indeks n i området 31-0. Dette fører til en tidsreversering av samplene lagret i den tilsvarende ramme eller vektor, slik at reversering av indeksen av vindusfunksjonen for å oppnå analysevindusfunksjonen basert på (samme lengde) syntesevindusfunksjon allerede har blitt ivaretatt.
Under et trinn S130 blir vinduskoeffisienter ci(j) tilveiebrakt ved en lineær interpolasjon av koeffisientene c(j) basert på ligning (15). Interpolasjonen er basert på en blokkstørrelse (blokklengde eller antall delbåndsverdier) av N = 64 verdier og basert på ramme som omfatter T = 10 blokker. Følgelig er indeksen av vinduskoeffisientene av den interpolerte vindusfunksjon i området mellom 0 og 319 i samsvar med ligning (15). Vinduskoeffisientene c(n) er gitt i tabellen i tillegg 1 av beskrivelsen. Avhengig av implementeringsdetaljer for å oppnå vinduskoeffisientene som basert på verdiene i tabellene i tillegg 1 og 3, vil imidlertid tilleggstegn endres i forbindelse med vinduskoeffisientenes tilsvarende indeksene 128 til 255 og 384 til 511 (multiplikasjon med faktor (-1)) som må vurderes.
I disse tilfeller kan vinduskoeffisientene w(n) eller c(n) som brukes, tilveiebringes i samsvar med
med tegnsvitsjefunksjonen s(n) i samsvar med
for n = 0 til 639, der Wtabie(n) er verdiene oppgitt i tabellene i tilleggene.
Imidlertid er vinduskoeffisientene ikke påkrevd å bli implementert i samsvar med tabellen i tillegg 1 for å oppnå f eks. den allerede beskrevne reduksjon av forsinkelsen. For å oppnå denne reduksjon og samtidig opprettholde kvalitetsnivået av de behandlede audiodata eller for å oppnå et annet kompromiss, kan vinduskoeffisientene c(n) for vinduskoeffisientindeksen n i området mellom 0 og 639 oppfylle settet av forhold som gitt i et av tilleggene 2-4. Videre skal det bemerkes at også andre vinduskoeffisienter c(n) kan brukes i utførelsen ifølge oppfinnelsen. Naturligvis kan også andre vindusfunksjoner som omfatter et annet antall vinduskoeffisienter enn 320 eller 640 implementeres, selv om tabellene i tilleggene 1-4 bare gjelder for vindusfunksjoner med 640 vinduskoeffisienter.
Den lineære interpolasjon i samsvar med S130 fører til en vesentlig kvalitetsforbedring og reduksjon av fremmedeffekter eller kansellering i tilfellet en vindusfunksjon som omfatter et likt antall vinduskoeffisienter. Det skal videre bemerkes at den komplekse enhet ikke er j som i ligningene (1), (2) og (16), men er benevnt som i = V-l .
I trinn S 140 blir samplene av rekken x(n) deretter multiplisert elementvis med koeffisientene ci(n) av det interpolerte vindu.
I trinn S 150 blir de vindussendte sampler oppsummert i samsvar med ligningen gitt i flytskjemaet på fig. 7a for å frembringe 64-elementrekker u(n). I trinn S 160, blir 32 nye delbåndssampler eller audiodelbåndsverdier W(k,l) beregnet i samsvar med matriseoperasjonen Mu, der elementet av matrisen M gis av
der exp() benevner den komplekse eksponentialfunksjon og, som tidligere nevnt, er i den tenkte enhet. Før sløyfen av et flytskjema avsluttes med trinn S 140, kan hver av delbåndsverdiene W(k, 1) (=W[k] [1]) sendes, hvilket tilsvarer delbåndssamplet 1 i delbåndet med indeks K. Med andre ord produserer hver sløyfe i flytskjemaet på fig. 7a 32 kompleksverdi delbåndsverdier som hver representerer signalet fra et filterbankdelbånd.
Fig. 7b viser trinnet S150 for å kollapse rammen 150 av de vindustidsdomeneaudiosampler som omfatter 10 blokker 160-1, ..., 160-10 av vindustidsdomeneaudiosamplene z(n) til vektoren u(n) av en 5 gangers oppsummering av to blokker av rammen 150, hver. Sammenlegningen eller tilbaketrekningen utføres på elementvis basis, slik at de vindustidsdomeneaudiosampler tilsvarende den samme sampelindeks i hver av blokkene 160-1, 160-3, 160-5, 160-7, 160-9 blir lagt til for å oppnå en tilsvarende verdi i de første blokker 650-1 av vektoren u(n). Basert på blokkene 160-2, 160-4, 160-6, 160-8 og 160-10, blir følgelig de tilsvarende elementer av vektoren u(n) i blokk 160-2 generert i trinn S150.
En annen utførelse ifølge oppfinnelsen i form av en analysefilterbank kan implementeres som en 64-båndkompleks filterbank med liten forsinkelse. Behandlingen av denne komplekse filterbank med liten forsinkelse som en analysefilterbank er hovedsakelig tilsvarende analysefilterbanken som beskrevet i forbindelse med fig. 7a. På grunn av likhetene og hovedsakelig samme behandling som beskrevet i forbindelse med fig. 7a, vil bare forskjellene mellom den beskrevne komplekse analysefilterbank for 32 bånd på fig. 7a og den komplekse analysefilterbank for 64 delbånd bli skissert her.
I motsetning til analysefilterbanken som omfatter 32 delbånd som vist på fig. 7a, omfatter vektoren av rammen x(n) i tilfellet med en 64-båndanalysefilterbank 640 elementer med indekser fra 0 til 639. Følgelig blir trinn S110 modifisert slik at samplene i rekken x(n) blir flyttet med 64 posisjoner, der de eldste 64 sampler blir forkastet. I trinn S120 blir i stedet for 32 nye sampler, 64 nye sampler lagret i posisjonen 63-0. Som vist på fig.7c blir de innkommende tidsdomeneaudiosampler lagret i posisjonene tilsvarende en avtagende indeks n i området 63 til 0. Dette førze(r t)il en( tid)sre(ve )rsering av samplene lagret i den tilsvarende ramme eller vektor, slik at reversering av indeksen av vindusfunksjonen for å oppnå analysevindusfunksjonen basert på (samme lengde) syntesevindusfunksjon som allerede har blitt ivaretatt.
Ettersom vinduet c(n) brukt for vindussending av elementene av vektoren av rammen x(n) omfatter typisk 640 elementer, kan trinnet S130 med lineært å interpolere vinduskoeffisientene for å oppnå interpolerte vinduer ci(n), utelates.
Deretter blir samplene av rekken x(n) under trinn S140 multiplisert eller vindussendt ved å bruke sekvensen av vinduskoeffisienter c(n) som enda en gang er basert på verdiene i tabellen i tillegg 1. I tilfellet vinduskoeffisienten c(n) er av syntesevindusfunksjonen, blir vindussendingen eller multipliseringen av rekken x(n) med vinduet c(n) utført i samsvar med ligningen
<(18)>
for an = 0, ..., 639. For å oppnå egenskapene til vindusfunksjonen med liten forsinkelse, er det igjen ikke nødvendig å implementere vindusfunksjonen nøyaktig i samsvar med vinduskoeffisientene basert på verdiene oppgitt i tabellen i tillegg 1. I mange anvendelser vil en implementering hvor vinduskoeffisientene oppfyller hvert sett av forhold som oppgis i tabellen i tillegg 2-4 være tilstrekkelig for å oppnå et akseptabelt kompromiss mellom kvalitet og en vesentlig reduksjon av forsinkelse. Avhengig av implementeringsdetaljer for å oppnå vinduskoeffisientene basert på verdiene oppgitt i tabellene i tillegg 1 og 3, endres imidlertid tilleggstegnet i forbindelse med vinduskoeffisientene tilsvarende indeksene 128 til 255 og 384 til 511 (multiplikasjon med faktor (-1)) og bør vurderes i samsvar med ligningene (16a) og (16b).
Trinnet S 150 av flytskjemaet på fig. 7a blir dereter erstatet ved en oppsummering av samplene av vektoren av ramme z(n) i samsvar med ligning
for å frembringe 128-elementrekken u(n).
Trinn S 160 på fig. 7a blir dereter erstatet av et trinn hvor 64 nye delbåndssampler blir beregnet i samsvar med matriseoperasjonen Mu, der matriseelementene av matrisen M gis av
M (20) 8’
der exp() benevner den komplekse eksponentialfunksjon og i er som forklart, den tenkte enhet.
Fig. 7c viser et flytskjema ifølge en utførelse av oppfinnelsen i form av en virkelig verdsat analysefilterbank for 32 delbåndskanaler. Utførelsen vist på fig. 7c skiller seg ikke vesentlig fra utførelsen vist på fig. 7a. Hovedforskjellen mellom de to utførelsene er at trinn S 160 for beregning av de nye 32 kompleksverdi delbåndsaudioverdier blir erstatet i utførelsen vist på fig. 7c med et trinn S162 hvor 32 realverdi delbåndsaudiosampler blir beregnet i samsvar med en matriseoperasjon Mru, der elementene av matrisen M gis av
Som konsekvens produserer hver sløyfe i flytskjemaet 32 realverdi delbåndssampler, der W(k,l) tilsvarer delbåndsaudiosamplet 1 av delbåndet k.
Den realverdi analysefilterbank kan f.eks. brukes i rammen av en laveffektsmodus av et SBR-system som vist på fig. 5. Laveffektsmodusen av SBR- verktøyet skiller seg fra høykvalitets SBR-verktøyet hovedsakelig i forbindelse med at de realverdi filterbanker brukes. Dete reduserer beregningskompleksiteten og beregningsarbeidet med en faktor på 2, slik at antallet operasjoner per tidsenhet blir vesentlig redusert med en faktor på 2 etersom det ikke er nødvendig å beregne en tenke del.
De foreslåte nye filterbanker ifølge oppfinnelsen er helt kompatibel med laveffektmodusen av SBR-systemer. Med filterbankene ifølge oppfinnelsen kan SBR-systemer således fremdeles kjøre både i normalmodus eller høykvalitetsmodus med komplekse filterbanker og i laveffektmodus med realverdi filterbanker. Den realverdi interbank kan f.eks. avledes fra den komplekse filterbank ved å bruke bare de riktige verdier (cosinusmodulerte bidrag) og utelate de tenkte verdier (sinusmodulerte bidrag).
Fig. 8a viser et flytskjema ifølge en utførelse av oppfinnelsen i form av en kompleksverdi syntesefilterbank for 64 delbåndskanaler. Som tidligere nevnt oppnås syntesefiltreringen av SBRbehandlede de ed å bruke en
nalet fra filterbanken er en blokk med realverdi tidsdomenesampler som skissert i forbindelse med fig. 1. Fremgangsmåten er vist av flytskjemaet på fig. 8a som også viser en utførelse i form av en fremgangsm
e
nlbåndss
sefiltrer
entene N (k,n) gis
tialfunksjon og i er den tenkte enhet. Den virkelige del av signalet fra denne operasjon blir lagret i posisjonen 0-127 av rekken v, som vist på fig.8a.
I trinn S230 blir samplene, som nå er i tidsdomenet, trukket ut fra rekken v i samsvar med ligning gitt på fig.8a for å frembringe en 640-element rekke g(n). I trinn S240 blir de virkelige verdsatte sampler i tidsdomenet av rekke g multiplisert med vinduskoeffisienten c(n) for å produsere en rekke w, der vinduskoeffisientene av en foretrukket utførelse enda en gang er vinduskoeffisienter basert på verdiene gitt i tabellen i tillegg 1.
Som skissert tidligere, kreves det ikke at vinduskoeffisientene blir nøyaktig basert på verdiene gitt i tabellen
ienteneei
in
oxgnaler v 64-delbåndssyntesefilterbank i samsvar med en utførelse av oppfinnelsen. Sig
åte for å generere tidsdomeneaudiosampler.
Synt gen omfatter, etter en start (trinn S200) følgende trinn, der en rekke v omfatter 1280 sampler. I trinn S210, blir samplene i rekken v forflyttet 128 posisjoner, der de eldste 128 sampler blir forkastet. I trinn S220 blir de 64 nye kompleksverdi audiodelbåndsverdier multiplisert med en matrise N, der matrisee av
der exp() benevner den komplekse ekspone
i tillegg 1. Det er i f
ppfyller et av setten nlem
n
orskjellige utførelser tilstrekkelig hvis vinduskoeffis e av forholdene som gitt i tabellene i tillegg 2-4 for å oppnå den ønskede egenskap med liten forsinkelse av syntesefilterbanken. Som forklart i forbindelse med analysefilterbanken, kan videre også andre vinduskoeffisienter brukes innenfor rammen av syntesefilterbanken. Avhengig av implementeringsdetaljer for å oppnå vinduskoeffisienter basert på verdiene gitt i tabellen i tillegg 1 og 3, bør videre tilleggstegnendringer i forbindelse med vinduskoeffisientene tilsvarende indeksene 128 til 255 og 384 til 511 (multiplikasjon med faktor (-1)), vurderes.
I trinn S250 blir 64 nye utgangssampler beregnet ved å summere samplene fra rekken w(n) i samsvar med et siste trinn og formelen i flytskjemaet på fig. 8a før en sløyfe av flytskjemaet avsluttes i trinn S260. I flytskjemaet vist på fig. 8a, tilsvarer X[k] [1] (= X(k,1)) audiodelbåndsverdien 1 i delbåndet med indeks k. Hver nye sløyfe som vist på fig.8a produserer 64 tidsdomener, realverdi audiosampler som et utsignal.
Implementeringen vist på fig. 8a av en kompleksverdi analysefilterbank for 64 bånd krever ikke en overlapnings/tilleggsbuffer omfattende flere lagringsposisjoner som forklart i forbindelse med utførelsen vist på fig. 2b. Her er overlapningstilleggsbufferen "skjult" i vektorene v og g som er beregnet basert på verdiene lagret i vektoren v. Overlapningstilleggsbufferen er implementert i rammen av disse vektorene hvor disse indeksene er større enn 128, slik at verdiene tilsvarer verdien fra tidligere eller senere blokker.
Fig. 8b
n viser et flytskjema av en virkelig verdsatt syntesefilterbank for 64 realverdi
audiodelbåndskanaler. Den realverdi syntesefilterbank ifølge fig. 8b kan også implementeres i tilfellet med en laveffeckots SBR-implementering som en tilsvarende SBR-filterbank.
Flytskjemaet på fig. 8b skiller seg fra flytskjemaet på fig. 8a for det meste i forbindelse med trinn S222 som erstatter S220 på fig. 8a. I nye realverdi delbåndsverdier multiplisert med en matrise Nr, der elementene av matrisen Nr(k,n) gis av
der signalet fra denne operasjon enda en gang blir lagret i posisjonene 0-127 av rekken v.
Bortsett fra disse modifikasjonene skiller ikke flytskjemaet som vist på fig. 8b i tilfellet med en virkelig verdsatt syntesefilterbank for laveffekts SBR modus seg vesentlig fra flytskjemaet som vist på fig. 8a av den kompleksverdi syntesefilterbank for høykvalitets SBR-modus.
Fig. 8c viser et flytskjema ifølge en utførelse i form av en nedsamplet kompleksverdi syntesefilterbank og egnet fremgangsmåte som f.eks. kan implementeres i en høykvalitets SBR-implementering. For å være mer nøyaktig angår syntesefilterbanken som beskrevet på fig. 8c en kompleksverdi syntesefilterbank som kan behandle kompleksverdi audiodelbåndsverdier for 32 delbåndskanaler.
Den nedsamplede syntesefiltrering av de SBR-behandlede delbåndssignaler oppnås ved å bruke en 32-kanals syntesefilterbank som vist på fig. 8c. Signalet fra filterbanken er en blokk av realverdi tidsdomenesample P n trinn S222 blir 64
flytskjemaet på fig. 8c. Syntesefiltreringen omfatter en start (trinn S300) følgende trinn, der en rekke v omfatter 640 realverdi tidsdomenesampler
I trinn S310 blir samplene i rekken v forflyttet med 64 posisjoner, der de eldste 64 sampler blir forkastet. Deretter blir 32 nye kompleksverdi delbåndssampler i trinn S320 eller kompleksverdi audiodelbåndsverdier multiplisert med en m rise N, h elem v
der exp(
. . . . .
lagret i posisjonene 0-63 av rekken v.
I trinn S330 blir samplene hentet fra vektor v i samsvar med ligningen gitt i flytskjemaet på fig. 8c for åk frnem�bringeex en 3�r.
20-kro�sessen gis i
elements re nat
kke g. I trin00vis
n S3406342enter gis a
) benevner komplekseksponentialfunksjonen og i er igjen en tenkt enhet. Den virkelige del av signalet fra denne operasjon blir
blir vinduskoeffisientene ci(n) av en interpolert vindusfunksjon hentet av en lineær interpolasjon av koeffisientene c(n) i samsvar med ligning (15) der indeksen n enda en gang er i området mellom 0 og 319 (N=64, T=10 for ligning (15)). Som vist tidligere, er koeffisientene av en vindusfunksjon c(n) basert på verdiene gitt i tabell i tillegg 1. For å oppnå egenskapene med liten forsinkelse som vist tidligere, er det ikke nødvendig at vinduskoeffisientene c(n) er nøyaktig figurene som gitt i tabellen i tillegg 1. Det er tilstrekkelig at vinduskoeffisientene c(n) oppfyller minst et sett av forhold som gitt i tilleggene 2-4. Avhengig av implementeringsdetaljer for å oppnå vinduskoeffisientene basert på verdiene gitt i tabellene i tillegg 1 og 3, idet flere tegnendringer i forbindelse med vinduskoeffisientene tilsvarende indeksene 128 til 255 og 384 til 511 (multiplikasjon med faktor (-1)) bør vurderes i samsvar med ligningene (16a) og (16b). Også forskjellige vindusfunksjoner som omfatter forskjellige vinduskoeffisienter c(n) kan videre naturligvis brukes i utførelsene ifølge oppfinnelsen.
I trinn S350 blir samplene av rekken g multiplisert med den interpolerte vinduskoeffisient ci(n) av den interpolerte vindusfunksjon for å oppnå vindussendt tidsdomenesampelet w(n).
I trinn S360 blir deretter nye utgangssampler beregnet ved en summering av samplene fra rekken w(n) i samsvar med det siste trinn S360 før det endelige trinn S370 i flytskjemaet på fig. 8c.
Som vist tidligere, i flytskjemaet på fig. 8c, tilsvarer X([k] [1]) (= x(k,1)) en audiodelbåndsverdi 1i audiodelbåndskanalen k. Videre produserer hver nye sløyfe av et flytskjema som vist på fig. 8c 32 realverdi tidsdomenesampler som et utsignal.
Fig. 8d viser et flytskjema av en utførelse ifølge oppfinnelsen i form av en nedsamplet virkelig verdsatt syntesefilterbank som f.eks. kan brukes i tilfellet med en laveffekts SBR-filterbank. Utførelsen og flytskjemaet vist på fig. 8d skiller seg fra flytskjemaet vist på fig. 8c av den nedsamplede kompleksverdi syntesefilterbank bare i forbindelse med trinn S320 som erstattes i flytskjemaet vist på fig. 8d med trinnet S322.
I trinn 322 blir 32 nye realverdi audiodelbåndsverdier eller delbåndssampler multiplisert med matrise
knn Nr,� der e s av
der signalet for denne
.cl
ooe
psm
e���r<�>ente tr
as .jokn
n�e av ma
blir l .agr .e
m av en fremgangsmåte tilsvarende en kompleksverdi analysefilterbank for 64 delbånd. Fig. 9a viser en implementering som en MATLAB-implementering som tilveiebringer
programmeringssprå nisen N
t i pos
ng a
k bety���rgi
isjon
v en
r pro00en 0 til 64 av rekken v.
Fig. 9a viser en annen implementeri utførelse i samsvar med oppfinnelsen i for
sentteg 63n42 som et utsignal, en vektor y og en vektor "tilstand". Denne funksjon, som definert i dette skript vist på fig.9a, kalles LDFB80 til hvilken en vektor x omfatter nye audiosampler og vektoren "tilstand" blir tilveiebrakt som et innsignal. Navnet på funksjonen LFB80 er en forkortelse for lavforsinkelse filterbank for 8 blokker som strekker seg til tidligere og 0 blokker som strekker seg inn i fremtiden.
I MATLAB- et (%) merknader som ikke utføres, men bare tjener som formål for å kommentere og vise kildekoden. I beskrivelsen vil forskjellige segmenter av kildekoden bli forklart i forbindelse med deres funksjoner.
I kodesekvensen S400 blir bufferen som representeres av vektoren "tilstand" oppdatert på en slik måte at innholdet av vektoren som har indeksene 577 til 640 blir erstattet av innholdet i vektoren x som omfatter nye tidsdomeneaudioinngangssampler. I kodesekvensen S410 blir vinduskoeffisientene av analysevindusfunksjonen lagret i den variable LDFB80_win overført til vektoren win_ana.
I trinn S420 som forutsetter at de siste samplene blir tilpasset høyre side av bufferen, utføres den faktiske vindussending. I blokk S420 blir innholdet av vektortilstanden elementvis multiplisert (.*) med elementene av vektor win ana som omfatter analysevindusfunksjonen. Resultatet av denne multiplikasjon blir deretter lagret i vektor x win orig. ;I trinn S430 blir innholdet av vektoren x win orig omskapt til å danne en matrise med en størrelse på 128 · 5 elementer kalt x stack. I trinn S440 blir tegnendringen av stack x stack utført i forbindelse med andre og fjerde kolonne av matrisens x stack. ;I trinn S450 blir stacken x stack kollapset eller trukket tilbake ved å summere elementene av x stack i forhold til den andre indeks og samtidig invitere rekkefølgen av elementene og transponere resultatet før lagring av resultatet igjen til de forskjellige x stack. ;I kodesegmentet S460 blir transformasjonen fra tidsdomenet til frekvensdomenet utført ved å beregne en kompleks hurtig Fourier-transformasjon (FFT) av det elementvise, multipliserte innhold av stacken x stack multiplisert med den komplekse eksponentialfunksjon til hvilken argumentet (-i · π · n/128) er tilveiebrakt med indeksene og i rekken fra 0 til -127 og den tenkte enhet i. ;I kodesegmentet S470 blir en post-vridning utført ved å variere variabelen m = (64 l)/2 og ved å beregne blokken som omfatter audiodelbåndsverdier som en vektor y i samsvar med ligning ;; ;;; Indeksen k dekker området av integere fra 1-64 i implementeringen vist på fig. 9a. Vektoren y blir der sendt som vektoren eller blokk omfattende delbåndsverdier 180 på fig. 1. Streken over den andre faktoreringsligning (26) samt funksjonen conjQ med kodesegmentet S417 på fig. 9a gjelder for det komplekse konjugat av argumentet for det respektive komplekse nummer. ;I et endelig kodesegment S480 blir statusvektor forflyttet med 64 elementer. Statusvektoren i denne forflyttede form kan deretter leveres til funksjonen LDFB80 som et inngangssignal, igjen i en annen sløyfe av funksjonen. ;Fig. 9b viser en MATLAB-implementering i samsvar med en utførelse av oppfinnelsen i form av en fremgangsmåte som tilsvarer en kompleksverdi analysefilterbank for 32 delbånd. ;Følgelig kalles funksjonen LDFB80 32 som indikerer at implementering representerer en filterbank med liten forsinkelse for 32 delbånd, basert på en tilleggsoverlapning med 8 blokker inn i tidligere og 0 blokker inn i fremtiden. ;Implementeringen av fig. 9b skiller seg fra implementeringen vist på fig. 9a bare i forbindelse med noen få kodesekvenser som skissert i den følgende beskrivelse. Kodesekvensene S400, S430, S460, S470 og S480 blir erstattet av tilsvarende kodesekvenser S400', S430', S460', S470' og S480' under hensyntagen til at antallet delbånd eller antallet delbåndsverdier av funksjonen LDFB80 32 blir redusert med en faktor på 2. Følgelig angår trinnet S400' vektortilstanden som blir oppdatert i forbindelse med 32 siste innføringer tilsvarende indeksene 289 til 320 med tilsvarende 32 tidsdomeneaudioinngangssampler av den nye blokk 220 som vist på fig. 1. ;Imidlertid vises hovedforskjellen mellom implementeringene på fig. 9a og 9b i kodesekvensen S410 på fig. 9a som er erstattet av en kodesekvens S412 i implementeringen vist på fig. 9b. Kodesekvensen for S412 på fig. 9b omfater først en kopiering av 640 vinduskoeffisienter som omfater vinduer lagret i vektoren LDFB80_win til den lokale vektor win ana. Dereter finner en interpolasjon ifølge ligning (15) sted hvor to eterfølgende vinduskoeffisienter er representert av vektorelementene av vektoren win ana blir addert og dividert med 2 og dereter lagret tilbake i vektoren win ana. ;Den neste kodesekvens S420 er identisk med kodesekvensen S420 som vist på fig. 9a som utfører den faktiske elementvise multiplikasjon (.*) av vindus sendingen av verdiene eller elementene av vektortilstanden med elementene av vektoren win ana som omfater de interpolerte vinduskoeffisienter av den interpolerte vindusfunksjon. Signalet fia denne operasjon blir lagret i vektoren x win orig. Imidlertid er forskjellen mellom kodesekvensen S420 på fig. 9b og tilsvarende kodesekvens S420 på fig. 9a at, i tilfellet på fig. 9b, ikke at 640 men bare 320 multiplikasjoner blir utført i rammen av vindussendingen.
I kodesekvensen S430' som erstater kodesekvensen S430, blir stack en x stack forberedt ved å omforme vektoren x win orig. Etersom vektoren X win orig imidlertid bare omfater 320 elementer sammenlignet med tilsvarende vektor på fig. 9a som omfater 640 elementer, blir matrisen x stack bare en matrise på 64 . 5 elementer.
Kodesekvensene S440 av tegnendringen og kodesekvensen S450 med sammenfalning av stacken, er identisk i begge implementeringer ifølge fig. 9a og 9b, bortset fia det reduserte antall elementer (320 sammenlignet med 640).
I kodesekvensen S460' som erstater kodesekvensen S460, blir en ulik kompleks hurtig Fourier-transformering (FFT) av vindusdata utført som er ganske lik transformeringen av kodesekvensen S460 på fig. 9a. På grunn av det reduserte antall audiodelbåndsverdier, blir imidlertid enda en gang vektor temp tilveiebrakt med resultatet fia en rask Fourier transformering, den elementvise multiplisering av elementene av stacken x stack og den komplekse eksponentialfunksjon av argumentet (-i . π . n/64), der indeksen n er i området mellom 0 og 63.
I den modifiserte kodesekvens S470', utføres eterbehandlingen ved å definere variabelen m =(32+l)/2 og ved å generere utgangsvektoren y i samsvar med ligning (26), der indeksen k bare dekker området fia 1 til 32 og hvor nummeret 128 som vises i argumentet til den komplekse eksponentialfunksjon erstatet av nummer 64.
I den endelige kodesekvens S480', blir buffertilstanden forflytet med 32 elementer i implementeringen vist på fig. 9b, der bufferen, i den tilsvarende kodesekvens S480 blir forflytet med 64 elementer.
Fig. 10a viser et MATLAB-skript med en implementering ifølge en utførelse i form av en fremgangsmåte som tilsvarer en kompleksverdi syntesefilterbank for 64 delbånd. Skriptet vist på fig. 10a definerer funksjonen ILDFB80 til hvilken vektoren x representerer pakken 320 av audiodelbåndsverdiene på fig. 2a og en tilstandsvektor "tilstand" blir tilveiebrakt som inngangsparametere. Navnet ILDFB80 indikerer at den definerte funksjon er en invers filterbank med liten forsinkelse som tilsvarer 8 blokker med audiodata fra tidligere og 0 blokker fia fremtiden. Funksjonen tilveiebringer en vektor y og en ny eller omdefinert statusvektor "tilstand" som utgangssignal, der vektoren y tilsvarer blokken 410 av tidsdomeneaudiosamplene fra fig. 2a.
I en kodesekvens S500 utføres en forhåndsvridning ved at en variabel m = (64 l)/2 samt en vektor temp blir definert. Elementene temp(n) av vektortempen blir definert ifølge ligning
der streken over elementet av vektoren x(n) og funksjonen conj() representerer det komplekse konjugat og exp() representerer den komplekse eksponentiale funksjon og i representerer den tenkte enhet og n er en indeks i området fra 1 til 64.
I kodesekvensen S510 blir vektor tempen ekspandert til en matrise som omfatter i den første kolonne, elementene av vektortempen og i den andre kolonne komplekskonjugatet av den reverserte vektortemp i forbindelse med rekkefølgen av elementene som definert av indeksen til vektoren. I kodesekvensen S5 10 blir følgelig en ulik symmetri av matrisetempen etablert basert på vektortempen.
I en kodesekvens S520 blir en ulik rask Fourier transformering (FFT) utført basert på matrisetempen. I denne kodesekvens blir den virkelige del av den elementvise multiplikasjon av resultatet fra den inverse Fourier transformering av matrisetempen med eksponentialfunksjonen som har argumentet av (i · π/128) utført og sendt til en vektor y knl, der indeksen n er i området fra 0 til 127.
I kodesekvensen S530 blir en utvidelse av dataene og en vekslende tegnflik formet. For å oppnå dette blir rekkefølgen av elementene av vektoren y knl reversert og samtidig hvis en tegnflik blir utført. Deretter blir en matrise-tmp definert omfattende første, tredje og femte kolonne av vektoren y knl, der andre og fjerde kolonne omfatter den tegnflippede vektor y knl.
I en kodesekvens S540 blir vinduskoeffisientene som er lagret i vektoren FDFB80_win først kopiert til vektoren win ana. Deretter blir syntesevinduskoeffisientene bestemt basert på analysevinduskoeffisientene som lagret i vektoren win ana ved å generere en tidsreversert versjon av analysevindusfunksjonen i samsvar med
der N · T er det totale antall vinduskoeffisienter og n er indeksen av vinduskoeffisientene.
I en kodesekvens S550 blir syntesevinduet brukt på vektoren-tmp av en elementvis multiplikasjon av vektoren med syntesevindusfunksjonen. I en kodesekvens S560 blir bufferen oppdatert ved å sette elementene av vektortilstanden med indeksene 577 til 640 til 0 og ved å addere innholdet av den vindussendte vektor-tmp til status-vektor-tilstanden.
I en kodesekvens S570 blir utgangsvektoren y som omfatter tidsdomeneaudiosampler trukket ut fra tilstandsvektoren ved å ekstrahere elementene av tilstandsvektoren ved å ekstrahere elementene av tilstandsvektoren med indeksene 1-64.
I en kodesekvens S580 blir den endelige kodesekvens av funksjonen som vist på fig. 10a, tilstandsvektortilstanden forflyttet med 64 elementer, slik at elementene med indekser fra 65 til 640 blir kopiert til de første 576 elementer av vektortilstanden.
Fig. 10b viser et MATFAB-skript av en implementering ifølge utførelsen i form av en kompleksverdi syntesefilterbank for 32 delbåndsverdier. Navnet på funksjonen som definert av skriptet på fig. 10b viser dete etersom funksjonen definert blir kalt ILDFB80 32 som indikerer at funksjonen som defineres er en invers filterbank med liten forsinkelse for 32 bånd med 8 blokker som overlapper fia tidligere og 0 blokker som overlapper fia fremtiden.
Som nevnt i forbindelse med sammenligningen mellom implementeringen vist på fig. 9a og 9b, blir implementeringen ifølge skriptet på fig. 10b også nøye knytet til implementeringen av den 64-delbåndssyntesefilterbank i samsvar med fig. 10a. Som konsekvens blir samme vektorer levert til funksjonen og blir sendt av funksjonen som imidlertid omfater bare halvparten av antallet elementer sammenlignet med implementeringen på fig. 10a. Implementeringen for en 32-bånd syntesefilterbank for 32 bånd skiller seg fra 64-delbåndsversjonen vist på fig. 10a, hovedsakelig i henhold til to aspekter. Kodesekvensen S500, S510, S520, S530, S560, S570 og S580 er erstatet med kodesekvenser hvor antallet elementer som blir behandlet og videre antallet elementrelaterte parametere, blir dividert med 2. Videre blir kodesekvensen S540 for generering av syntesevindusfunksjonen erstatet av en kodesekvens S542 hvor syntesevindusfunksjonen blir generert som en lineært interpolert syntesevindusfunksjon i samsvar med ligning (15).
I kodesekvensen S500' som erstater kodesekvensen S500, blir variabelen m definert til å være lik m = (32+l)/2 og vektor-tempen blir definert ifølge ligning (27), der indeksen n bare dekker området 1 til 32 og der faktoren 1/128 blir erstatet av faktoren 1/64 i argumentet til eksponentialfunksj onen.
I kodesekvensen S510' som erstater kodesekvensen S510, dekker følgelig indeksområdet bare indeksene av 32-elementet som omfater vektor-tempen. Med andre ord dekker indeksen bare verdiene fra 1 til 32. 1 kodesekvensen S520' som erstater kodesekvensen S520, blir argumentet fra eksponentialfunksj onen følgelig erstatet av (i · π · n/64), der indeksen n er i området fra 0 til 63. 1 rammen av kodesekvensen S530', blir indeksområdet også redusert med en faktor på 2 sammenlignet med kodesekvensen S530.
Kodesekvensen S542 som erstater kodesekvensen S540 av fig. 10a kopierer også vindusfunksjonen som er lagret i vektoren LDFB80_win til vektoren win ana og genererer en tidsreversert versjon win syn ifølge ligning (28). Imidlertid omfater kodesekvensen S542 av implementeringen vist på fig. 10b videre et interpoleringstrinn ifølge ligning (15) hvor, for hvert element av den omdefinerte vektor win syn, omfater vinduskoeffisientene av syntesevindusfunksjonen, en lineær interpolasjon av to eterfølgende vinduskoeffisienter av den opprinnelige syntesevindusfunksjon.
Kodesekvensen S550 med å bruke vinduet på vektor-tmp og erstate elementene tmp med den vindussendte versjon derav, er identisk med koden som en direkte sammenligning av de respektive kodesekvenser på fig. 10a og 10b. På grunn av den mindre størrelse av vektor-tempen ved implementeringen av fig. 10b, og under en implementering, blir imidlertid bare halvparten av antallet multiplikasjoner utført.
Også i rammen av kodesekvensene S560', S570' og S580', blir indeksene 640 og 64, ved å erstate kodesekvensene S560, S570 og S580, erstatet av 320 og 32. Følgelig skiller disse tre endelige kodesekvenser seg bare fra kodesekvensene av implementering vist på fig. 10a i forbindelse med størrelsen av vektortilstandene tmp og y.
Som utførelsene beskrevet så langt har vist, blir analysevindussendingen samt syntesevindussendingen tilpasset vindussendingen av de respektive sampler i tidsdomenet omfattet i de respektive rammer ved å multiplisere disse på en elementvis basis, med vinduskoeffisientene av en vindusfunksjon.
Før en vindusfunksjon blir beskrevet som kan brukes f eks. som en syntesevindusfunksjon og som en analysevindusfunksjon i dens tidsre vers erte versjon mer nøye, vil fordeler med utførelsene ifølge oppfinnelsen bli skissert i detalj, spesielt i betraktning av en implementering av rammen av et SBR-verktøy eller systemet som vist på fig. 5 og 6.
Blant fordelene kan utførelsene ifølge oppfinnelsen og systemene som omfatter flere enn en utførelse ifølge oppfinnelsen tilby en vesentlig reduksjon av forsinkelsen ifølge andre filterbanker. Imidlertid vil denne egenskap med liten forsinkelse bli behandlet i forbindelse med fig. 13 og 14 i detalj. Et viktig aspekt i denne sammenheng er å merke seg at lengden av vindusfunksjonen, med andre ord antallet vinduskoeffisienter som kan brukes på en ramme eller en blokk av tidsdomenesampler, er uavhengig av forsinkelsen.
Som vil bli nevnt i sammenheng med fig. 17 og 18 i detalj, i forbindelse med psykoakustikken, gjør utførelsene ifølge oppfinnelsen ofte bruk av de tidsmessige maskeringsegenskapene til det menneskelige øret på en bedre måte enn andre filterbanker. Som vil bli nevnt i detalj i forbindelse med fig. 15, 16 og 19, tilbyr videre utførelsen ifølge oppfinnelsen et utmerket frekvensområde.
Også i mange filterbanker ifølge en utførelse av oppfinnelsen kan en perfekt rekonstruksjon oppnås hvis en analysefilterbank og syntesefilterbanken blir koblet sammen. Med andre ord gir ikke utførelsene ifølge oppfinnelsen bare et hørbart uatskillelig signal sammenlignet med inngangssignalet til et slikt sammenkoblet sett av en analysebank og en syntesefilterbank, men, bortsett fra kvantiseringsfeil, beregningsmessige avrundede effekter og andre effekter forårsaket av den nødvendige diskretiseringen og et identisk utgangssignal sammenlignet med inngangssignalet.
En integrering i SBR-modulen av filterbankene ifølge oppfinnelsen kan lett oppnås. Mens typiske SBR-moduler virker i dobbelratemodus, kan de kompleksverdi filterbanker med liten forsinkelse ifølge utførelsen av oppfinnelsen gi en perfekt rekonstruksjon i enkeltratemodus mens de opprinnelige SBR QMF-filterbanker bare kan tilveiebringe en nesten perfekt rekonstruksjon. I dobbelratemodus blir 32-båndversjonen av impulsresponsen oppnådd ved lineær interpolasjon som også kalles nedsampling av to nærliggende uttak eller vinduskoeffisienter av 64 bånds impulsresponsen eller vindusfunksjonen som forklart i forbindelse med fig. 3.
I tilfellet en kompleksverdi implementering av en filterbank, kan en vesentlig redusert analysering (eller syntetiseringj-forsinkelse for kritisk samplede filterbanker oppnås hvor samplingen eller behandlingen av frekvensen tilsvarer grensefrekvensen ifølge Nyquist-Shannonteorien. I tilfelle en virkelig verdsatt implementering av en filterbank, kan en effektiv implementering oppnås ved å bruke optimerte algoritmer som f. eks. vist i forbindelse med MATL AB -implementeringen på fig. 9 og 10. Disse implementeringene kan f.eks. være brukt for laveffektmodusen av SBR-verktøyet som beskrevet i forbindelse med fig. 5 og 6.
Som nevnt i forbindelse med fig. 5 og 6, blir det mulig å oppnå ytterligere reduksjon av forsinkelsen i tilfelle et SBR-system, ved å bruke en kompleksverdi filterbank med liten forsinkelse ifølge en utførelse. Som nevnt tidligere, i SBR-dekoderen 610 som vist på fig. 5, blir QMF-analysefilterbanken 620 erstattet av en kompleks filterbank med liten forsinkelse (CLDFB) ifølge en utførelse. Denne erstatning kan utføres på en beregningsmessig måte ved å holde antallet bånd (64), lengden av pulsresponsen (640) og ved å bruke en kompleks modulasjon. Forsinkelsen oppnådd av dette verktøy minimeres i en slik utstrekning for å kunne oppnå en total forsinkelse som er tilstrekkelig lav for en toveis kommunikasjon uten at det går utover et oppnåelig kvalitetsnivå.
Sammenlignet f.eks. med et system som omfatter en MDCT og en MDST for å forme et komplekst verdsatt MDCT-lignende system, tilveiebringer en utførelse av oppfinnelsen langt bedre frekvensområde. Sammenlignet med QMF-filterbanken som f.eks. blir brukt i MPEG-4 SBR i dag, omfatter systemet en eller flere filterbanker ifølge utførelsene som gir en vesentlig mindre forsinkelse.
Selv sammenlignet med en QMF-filterbank med liten forsinkelse, gir utførelsene ifølge oppfinnelsen fordelen med en perfekt rekonstruksjon kombinert med lav forsinkelse. Fordelene som oppstår fra den perfekte rekonstruksjon i motsetning til den nær perfekte rekonstruksjon av QMF-filterbanker, er slik. For en nær perfekt rekonstruksjon, blir det nødvendig med en høy stoppbånddempning for å undertrykke fremmedeffekter til et tilstrekkelig lavt nivå. Dette begrenser muligheten til å oppnå en svært lav forsinkelse i filterutformingen. På en annen side får bruken av en utførelse ifølge oppfinnelsen nå mulighet til uavhengig å konstruere filteret slik at ingen høy stoppbånddempning er nødvendig for å undertrykke fremmedeffektene til tilstrekkelig lav nivåer. Stoppbånddempningen behøver bare være tilstrekkelig lav for å minske fremmedeffekten tilstrekkelig for anvendelsen av den ønskede signalbehandling. Således kan et bedre kompromiss mot en mindre forsinkelse oppnås ved filterkonstruksjonen.
Fig. 1 1 viser en sammenligning av vindusfunksjonen 700 som f.eks. kan brukes i en utførelse sammen med sinusvindusfunksjonen 710. Vindusfunksjonen 700, som også kalles et "syntese" CMLDFB-vindu (CMLDFB = complex modulated low-delay filterbank) omfatter 640 vinduskoeffisienter basert på verdiene gitt i tabellen i tillegg 1. Om størrelsen av vindusfunksjonene skal det bemerkes at generelle forsterkning sfaktor er eller dempningsfaktorer for å justere en amplitude av det vindussendte signal ikke vurderes i det følgende. Vindusfunksjonene kan f.eks. normaliseres i forhold til en verdi tilsvarende sentrum for forsinkelsen som skissert i forbindelse med fig. 13 eller i henhold til en verdi n = N, n = N - 1 eller n = N 1, der N er blokklengden og n er indeksen av vinduskoeffisientene. Til sammenligning blir sinusvindusfunksjonen 710 bare definert over 128 sampler og blir f.eks. brukt i tilfellet med en MDCT- eller MDST-modul.
Avhengig av implementerings detalj ene for å oppnå vinduskoeffisienter basert på verdiene gitt i tabellene i tillegg 1 og 3, bør tilleggstegnendringer i forbindelse med vinduskoeffisientene tilsvarende indeksene 128 til 255 og 384 til 511 (multiplikasjon med faktor (-1)) vurderes i samsvar med ligning (16a) og (16b).
Før forskjellene mellom de to vindusfunksjonene 700, 710 blir omtalt, skal det bemerkes at begge vindusfunksjoner bare omfatter de virkelige verdsatte vinduskoeffisienter. I begge tilfeller er videre en absolutt verdi av vinduskoeffisienten tilsvarende en indeks n = 0 mindre enn 0,1. 1 tilfellet med et CMLDFB-vindu 700, er den respektive verdi enda mindre enn 0,02.
I forbindelse med de to vindusfunksjoner 700, 710 og deres definisjonssett, vil flere betydelige forskjeller fremgå. Mens sinusvindusfunksjonen 710 er symmetrisk, viser vindusfunksjonen 700 en asymmetrisk atferd. For å definere dette tydeligere er sinusvindusfunksjonen symmetrisk ettersom en virkelig verdsatt verdi enn 0 eksisterer, slik at når det gjelder alle virkelige tall n0, slik at vindusfunksjonen 710 blir definert for (n0+n) og (n0-n), og forholdet
blir oppfylt for en ønsket margin (ε > 0, idet den absolutte verdi av forskjellen mellom uttrykkene på de to sider av ligningen (29) blir mindre eller lik ε), der w(n) representerer vinduskoeffisienten tilsvarende indeks n. I tilfellet sinusvinduet, er den respektive indeks n0 nøyaktig i midten av de to øverste vinduskoeffisienter. Med andre ord blir, for sinusvinduet 710, indeksen n0= 63,5.
Sinusvindusfunksjonen defineres for indeksene n = 0, ..., 127.
På den annen side defineres vindusfunksjonen 700 over settet av indekser n = 0, ..., 639. Vindusfunksjonen 700 er tydelig asymmetrisk i betydningen at, for alle realverdi nummer n0, at minst et virkelig tall alltid finnes, slik at (n0+n) og (no-n) tilhører i definisjonssettet av vindusfunksjonen for hvilken ulikheten
holder til en (nesten bestemt) definerbar margin (ε > 0, idet den absolutte verdi av forskjellen på de to sider av ligningen (29) er større eller lik ε), der igjen w(n) er vinduskoeffisienten tilsvarende indeksen n.
Andre forskjeller mellom de to vindusfunksjoner som begge angår blokkstørrelser på N = 64 sampler, er at den maksimale verdi av vindusfunksjonen 700 er større enn 1 og blir ervervet for indeksene i området
(31)
for syntesevinduet. I tilfellet vindusfunksjonen 700 vist på fig. 11, blir den maksimale verdi ervervet, større enn 1,04, ervervet ved sampelindeksen n = 77. På den annen side blir de maksimale verdier av sinusvinduet 710 mindre eller lik 1 som er ervervet ved n = 63 og n = 64.
Også vindusfunksjonen 700 erverver en verdi på omtrent 1 ved sampelindeksene rundt n = N. Mer nøyaktig er den absolutte verdi av selve verdien av vinduskoeffisienten w(N-l) tilsvarende indeksen n = N-l mindre enn 1 mens den absolutte verdi eller selve verdien av vinduskoeffisienten w(N) tilsvarende indeksen n = N er større enn 1. 1 enkelte utførelser oppfyller disse to vinduskoeffisientene forholdene
(32)
som er et resultat av optimeringen av lydkvaliteten av fllterbankene ifølge utførelsen av oppfinnelsen. I mange tilfeller er det ønskelig å ha en vinduskoeffisient w(0) som omfatter en absolutt verdi så liten som mulig. I dette tilfellet bør en determinant av vinduskoeffisientene
være så nær som mulig til 1 for å oppnå en lydkvalitet som er optimert i forhold til de mulige parametere. Tegnet for determinanten som gitt av ligningen (33) kan imidlertid velges fritt. Som følge av at vinduskoeffisienten w(0) er mindre eller omtrent 0, bør produktet av w(N-l) · w(N) eller dens absolutte verdi være så nær som mulig til /- 1. 1 dette tilfellet kan vinduskoeffisienten w(2N-1) deretter velges fritt. Ligning (33) er et resultat ved å bruke teknikken med null forsinkelsesmatriser som beskrevet i "New Framework for Modulated Perfect Reconstruction Filter Banks" av G.D.T. Schuller og M.J.T. Smith, IEEE Transactions on Signal Processing, Vol. 44, nr.
8, august 1996.
Som skissert i detalj i forbindelse med fig. 13, er videre vinduskoeffisientene tilsvarende indeksene N-l og N omfattet i midten av modulasjonskjemen og tilsvarer følgelig sampelet med en verdi på omtrent 1,0 og som sammenfaller med forsinkelsen av fllterbanken som definert av prototypefllterfunksjonen eller vindusfunksjonen.
Syntesevindusfunksjonen 700 som vist på fig. 11 viser videre en oscilleringsatferd med strengt monotont økende vinduskoeffisient fra vinduskoeffisienten av sekvensen av vinduskoeffisienter tilsvarende indeksen (n = 0) brukt for vindussending av nyeste vindusdomeneaudiosampel opp til vinduskoeffisienten som omfatter den absolutt høyeste verdi av alle vinduskoeffisienter av syntesevindusfunksjonen 700. 1 tilfellet tidsreversert analysevindusfunksjon, omfatter naturligvis oscilleringatferden en strengt monoton minskning av vinduskoeffisientene fra vinduskoeffisienten som omfatter den høyeste absolutte verdi av alle vinduskoeffisienter av en tilsvarende (tidsreversert) analysevindusfunksjon til vinduskoeffisientene av sekvensen av vinduskoeffisienter tilsvarende en indeks (n = 639) brukt for vindussending av det siste tidsdomeneaudiosampel.
Som følge av oscilleringsatferden, starter utvikling av syntesevindusfunksjonen 700 med en vinduskoeffisient tilsvarende indeksen n = 0 med en absolutt verdi som er mindre enn 0,02 og en absolutt verdi av vinduskoeffisienten tilsvarende indeksen n = 1 lavere enn 0,03, som erverver en verdi på omtrent 1 ved en indeks n = N, og erverver en maksimal verdi på mer enn 1,04 ved en indeks i samsvar med ligning (3 1), erverver ytterligere en verdi på omtrent 1 ved en indeks n = 90 og 91, en første tegnendring ved indeksverdiene n = 162 og n = 163, erverve en minimal verdi på mindre enn -0,1 eller -0,12755 ved en indeks på omtrent n = 3N og en ytterligere tegnendring ved indeksverdier n = 284 og n = 285. Imidlertid kan syntesevindusfunksjonen 700 videre omfatte ytterligere tegnendring er ved andre indeksverdier n. Ved sammenligning av vinduskoeffisientene med verdiene gitt i tabellene i tilleggene 1 og 3, bør tilleggstegnendringer i forbindelse med vinduskoeffisienter tilsvarende indeksene 128 til 255 og 384 til 511 (multiplikasjon med faktor (-1)) vurderes i samsvar med ligningene (16a) og (16b).
Oscillasjonsatferden av syntesevindusfunksjonen 700 tilsvarer en sterkt dempet oscillasjon som vist av den maksimale verdi på omtrent 1,04 og den minste verdi på omtrent -0,12. Som konsekvens omfatter flere enn 50 % av alle vinduskoeffisienter absolutt verdier som er mindre eller lik 0,1. Som omtalt i forbindelse med utførelsen beskrevet på fig. 1 og 2a, omfatter utviklingen av vindusfunksjonen en første gruppe 420 (eller 200) og en andre gruppe 430 (eller 210), der den første gruppe 420 omfatter en første etterfølgende del av vinduskoeffisienter og den andre gruppe 430 omfatter en etterfølgende andre del av vinduskoeffisienter. Som allerede nevnt, omfatter sekvensen av vinduskoeffisienter av vinduet bare den første gruppe 420 av vinduskoeffisienter og den andre gruppe av vindusfunksjoner 430, der den første gruppe 420 av vinduskoeffisienter nøyaktig omfatter den første etterfølgende sekvens av vinduskoeffisienter og der den andre gruppe 430 nøyaktig omfatter den andre etterfølgende del av vinduskoeffisienter. Følgelig kan benevningene av første gruppe 420 og den første gruppe vinduskoeffisienter samt benevningene av den andre gruppe 430 og den andre del av vinduskoeffisientene brukes synonymt.
De mer enn 50 % av alle vinduskoeffisienter med absolutte verdier som er mindre eller lik 0, 1, er omfattet i den andre gruppe eller andre del 430 av vinduskoeffisienter som følge av den sterkt dempede oscillasjonsatferd av vindusfunksjonen 700. Videre omfatter også mer enn 50 % av alle vinduskoeffisienter sammenlignet i den andre gruppe eller andre del 430 av vinduskoeffisienter absolutte verdier på mindre eller lik 0,01.
Den første del 420 av vinduskoeffisienter omfatter mindre enn en tredjedel av alle vinduskoeffisienter av sekvensen av vinduskoeffisienter. Følgelig omfatter den andre del 430 av vinduskoeffisienter mer enn to tredjedeler av vinduskoeffisienter. I tilfellet et totalt antall blokker T for behandlet i en av rammene 120, 150, 330, 380 av mer enn fire blokker, omfatter den første del typisk 3/2 · N vinduskoeffisienter, der N er antallet tidsdomenesampler av en blokk. Følgelig omfatter den andre del resten av vinduskoeffisientene eller mer nøyaktig (T-3/2)N vinduskoeffisienter. I tilfellet T = 10 blokker per ramme som vist på fig. 11, omfatter den første del 3/2 · N vinduskoeffisienter mens den andre del 210 omfatter 8,5 · N vinduskoeffisienter. I tilfelle en blokkstørrelse på N = 64 tidsdomeneaudiosampler per blokk, omfatter den første del 96 vinduskoeffisienter mens den andre del omfatter 544 vinduskoeffisienter. Syntesevindusfunksjonen 700 som vist på fig. 11 erverver en verdi på omtrent 0,96 ved grensen av den første del og andre del med en indeks på omtrent N = 95 eller 96.
Til tross for antallet vinduskoeffisienter omfattet i den første del 420 og den andre del 430, skiller en energiverdi eller en total energiverdi av tilsvarende vinduskoeffisienter seg vesentlig fra hverandre. Energien som defineres av
der w(n) er en vinduskoeffisient og indeksen n over hvilken summen i ligningen (34) blir evaluert, tilsvarer indeksene av de respektive deler 420, 430, hele settet av vinduskoeffisienter eller et annet sett av vinduskoeffisienter til hvilket de respektive energiverdier E tilsvarer. Til tross for den vesentlige forskjell av vinduskoeffisienter, blir energien av den første del 420 lik eller høyere enn 2/3 av den totale energiverdi av alle vinduskoeffisienter. Følgelig blir energiverdien av den andre del 430 mindre eller lik 1/3 av den totale energiverdi av alle vinduskoeffisienter.
For å illustrere dette er energiverdien av den første del 420 av vinduskoeffisientene av vindusfunksjonen 700 omtrent 55,85 mens energiverdien av vinduskoeffisientene av den andre del 430 er omtrent 22,81. Den totale energiverdi av alle vinduskoeffisienter av vindusfunksjonen 700 er omtrent 78,03, slik at energiverdien av den første del 420 blir omtrent 71,6 % av den totale energiverdi mens energiverdien av den andre del 430 blir omtrent 28,4 % av den totale energiverdi av alle vinduskoeffisienter.
Naturligvis kan ligning (34) oppgis i en normalisert versjon ved å dividere energiverdien E med en normaliseringsfaktor E0som i prinsipp kan være enhver energiverdi.
Normalisering sfaktoren E0kan f. eks. være den totale energiverdi av alle vinduskoeffisientene av sekvensen av vinduskoeffisienter beregnet i samsvar med ligning (34).
Basert på de absolutte verdier av vinduskoeffisientene eller basert på energiverdiene av de respektive vinduskoeffisienter, kan også et midtpunkt eller et "massesentrum" av sekvensen av vinduskoeffisienter, bestemmes. Massesentrum eller midtpunktet av sekvensen av vinduskoeffisienter er et virkelig tall og ligger typisk i området av indeksen av den første del 420 av vinduskoeffisienter. I tilfellet med de respektive rammer som omfatter mer enn fire blokker av tidsdomeneaudiosampler (T>4), blir massesentrum ncabasert på de absolutte verdier av vinduskoeffisientene eller massesentrum basert på energiverdiene av vinduskoeffisientene mindre enn 3/2 · N. I tilfellet T = 10 blokker per ramme, ligger med andre ord massesentrum godt innenfor området av indekser av den første del 200.
Massesentrum ncabasert på de absolutte verdier av vinduskoeffisientene w(n) defineres i samsvar med
og massesentrum ncci betraktning av energiverdien av vinduskoeffisientene w(n) defineres i samsvar med
der N og T er positive integere som indikerer antallet tidsdomeneaudiosampler per blokk og antallet blokker per ramme. Naturligvis kan midtpunktene ifølge ligningene (35) og (36) også beregnes i forbindelse med et begrenset sett av vinduskoeffisienter ved å erstatte grensen av summene ovenfor tilsvarende.
For vindusfunksjonen 700 som vist på fig. 1, er massesentrum ncabasert på de absolutte verdier av vinduskoeffisientene w(n) lik en verdi på nca ≈ 87,75 og midtpunktet eller massesentrumet ncei forbindelse med energiverdiene av vinduskoeffisientene w(n) er nce≈ 80,04. Ettersom den første del 200 av vinduskoeffisientene av vindusfunksjonen 700 omfatter 96 (= 3/2 · N; N = 64) vinduskoeffisienter, ligger begge midtpunktene godt innenfor den første del 200 av vinduskoeffisienter som tidligere nevnt.
Vinduskoeffisientene w(n) av vindusfunksjonen 700 er basert på verdiene gitt i tabellen i tillegg 1. For å oppnå f.eks. egenskapene med liten forsinkelse av filterbanken som nevnt tidligere, er det imidlertid nødvendig å implementere vindusfunksjonen nøyaktig som gitt av vinduskoeffisientene i tabellen i tillegg 1. 1 mange tilfeller er det mer enn tilstrekkelig at vinduskoeffisientene av en vindusfunksjon omfatter 640 vinduskoeffisienter for å oppfylle noen av forholdene eller ligningene gitt i tabellene i tilleggene 2-4. Vinduskoeffisientene eller filterkoeffisientene gitt i tabellen i tillegg 1 representerer foretrukne verdier som kan tilpasses i samsvar med ligningene (16a) og (16b) i enkelte implementeringer. Som indikert f.eks. av de andre tabellene i de andre tilleggene, kan imidlertid de foretrukne verdier varieres for andre, tredje, fjerde, femte siffer etter desimalpunktet, slik at de resulterende filtre eller vindusfunksjonene fremdeles har fordelene med utførelsen ifølge oppfinnelsen. Avhengig av implementeringsdetaljer for å tilveiebringe vinduskoeffisienter basert på verdiene gitt i tabellene i tilleggene 1 og 3, bør imidlertid tilleggstegnendringer i forbindelse med vinduskoeffisientene tilsvarende indeksene 128 til 255 og 384 til 511 (multiplikasjon med faktor (-1)) vurderes i forbindelse med ligningene (16a) og (16b).
Naturligvis kan andre vindusfunksjoner som omfatter et annet antall vinduskoeffisienter også defineres og brukes i rammen av utførelser ifølge oppfinnelsen. I denne sammenheng skal det bemerkes at både antallet tidsdomeneaudiosampler per blokk og antallet blokker per ramme samt fordelingen av blokker i forbindelse med tidligere sampler og fremtidige sampler kan varieres over en lang rekke parametere.
Fig. 12 viser en sammenligning mellom et kompleksmodulert filterbankvindu med liten forsinkelse (CMLDFB-vindu) 700 som vist på fig. 11 og det originale SBR QMF -proto typefilter 720 som blir brukt f.eks. i SBR-verktøyet ifølge MPEG-standarden. Som vist på fig. 11 blir CMLDFB -vinduet 700 enda en gang syntesevinduet i samsvar med en utførelse.
Selv om vindusfunksjonen 700 ifølge en utførelse er tydelig asymmetrisk som definert i forbindelse med ligning (30), er det opprinnelige SBR QMF-prototypefilter 720 symmetrisk i forbindelse med indeksene n = 319 og 320 ettersom vindusfunksjonen 700 samt SBR QMF-prototypefilteret 720 hver defineres i forbindelse med 640 indekser hver. Med andre ord blir "indeksverdien" n0som representerer indeksen av symmetrisenteret, i forbindelse med ligning (29), gitt av n0= 319,5 i tilfellet SBR QMF-prototypefilteret 720.
På grunn av symmetrien av SBR QMF-prototypefilteret 720, er videre også midtpunktet ncaog riceifølge ligningene henholdsvis (35) og (36) identisk med symmetrisenteret n0. Energiverdien av SBR QMF-prototypefilteret 720 er 64,00 ettersom prototypefilteret er et ortogonalt filter. På en annen side omfatter den tydelige asymmetriske vindusfunksjon 700 en energiverdi på 78,0327 som nevnt tidligere.
I de følgende avsnitt av beskrivelsen vil SBR-systemer som omtalt i forbindelse med fig. 5 og 6 bli vurdert i hvilken SBR-dekoderen 610 omfatter utførelser ifølge oppfinnelsen i form av en analysefilterbank som filterbanken 620 og en utførelse ifølge oppfinnelsen i form av en syntesefilterbank for syntesefilterbanken 640. Som nevnt i detalj, bruker den totale forsinkelse av en analysefilterbank ifølge oppfinnelsen vindusfunksjonen 700 som vist på fig. 11 og 12 og omfatter en total forsinkelse på 127 sampler mens det opprinnelige SBR QMF-prototypefilter baserte SBR-verktøy fører til en total forsinkelse på 640 sampler.
Erstatningen av QMF-filterbanken i SBR-modulen, f.eks. i SBR-dekoderen 610, med en kompleksverdi filterbank med en liten forsinkelse (CLDFB) fører til en forsinkelsesreduksjon fia 42 ms til 31,3 ms uten å innføre en svekkelse av audiokvaliteten eller en tilleggskompleksitet ved beregningen. Med den nye filterbank støttes både standard SBR-modus (høykvalitetsmodus) og laveffektsmodus som bare bruker realverdi filterbanker som beskrivelsen av utførelsen ifølge oppfinnelsen i forbindelse med fig. 7 til 10 har vist.
Spesielt på området telekommunikasjon og toveiskommunikasjon, er liten forsinkelse av stor betydning. Selv om det forbedrede AAC med liten forsinkelse allerede kan oppnå en forsinkelse som er tilstrekkelig liten for kommunikasjonsanvendelser på 42 ms, er dens algoritmiske forsinkelse fremdeles høyere enn for kjemekodeken med liten forsinkelse AAC som kan oppnå forsinkelser ned til 20 ms og andre telekommunikasjonskodeker. I SBR-dekoderen 610, vil QMF-analysen og syntesetrinnene fremdeles forårsake en rekonstruksjonsforsinkelse på 12 ms. En lovende fremgangsmåte for å redusere denne forsinkelsen på er å utnytte en filterbank med liten forsinkelse i samsvar med en utførelse av oppfinnelsen og erstatte gjeldende QMF-filterbanker med en versjon med liten forsinkelse ifølge utførelsene. Med andre ord oppnås ytterligere forsinkelsesreduksjon ganske enkelt ved å erstatte vanlig filterbanker som blir brukt i SBR-modulen 610 med en kompleks filterbank med liten forsinkelse ifølge utførelsen.
For bruk i SBR-modulen 610, er de nye filterbanken ifølge utførelsene som også kalles CLDFB, konstruert for å være så nær de opprinnelig brukte QMF-filterbanker som mulig. Dette omfatter f.eks. bruk av 64 delbånd eller bånd, en lik lengde av pulsresponsene og en kompatibilitet med dobbelrate moduser som brukt i SBR-systemer.
Fig. 13 viser sammenligningen mellom CLDFB -vindusformen 700 ifølge en utførelse og det opprinnelige SBR QMF-prototypefilter 720. Videre viser den forsinkelsen av modulert filterbank som kan bestemmes ved å analysere overlapningsforsinkelsen innført av prototypefilteret eller vindusfunksjonen i tillegg til rammeforsinkelsen av modulasjonskjemen med en lengde av N sampler i tilfellet et DCT-IV-basert system. Situasjonen vist på fig. 13 gjelder enda gang tilfellet med en syntesefilterbank. Vindusfunksjon 700 og prototypefilterfunksjonen 720 representerer også impulsresponser av synteseprototypefiltrene av de to filterbankene som er brukt.
Med hensyn til forsinkelsesanalysen for både SBR QMF-filterbanken og den foreslåtte CLDFB i samsvar med en utførelse i analysen og syntesen, vil bare overlapningen på høyre side og venstre side av modulasjonskjemen legge til forsinkelser.
For begge filterbanker blir modulasjonskjemen basert på en DCT-IV som innfører en forsinkelse på 64 sampler som er merket på fig. 13 som forsinkelsen 750. 1 tilfellet SBR QMF-prototypefilteret 720, og på grunn av symmetrien, blir modulasjonskjemeforsinkelsen 750 symmetrisk anordnet i forhold til massesentrum eller midtpunktet av den respektive prototypefilterfunksjon 720 som vist på fig. 13. Årsaken til denne atferd er at bufferen av SBR QMF-filterb anken må fylles opp til et punkt som prototypefilterfunksjonen 720 har mest betydelig bidrag ved når det gjelder de respektive energiverdier av prototypefilterverdien som vurdert under behandlingen. På grunn av formen av prototypefilterfunksjonen 720, krever dette at bufferen fylles opp minst til midtpunktet eller massesentrum av den respektive prototypefilterfunksjon.
For å vise dette ytterligere, og ved å begynne fia en helt initialisert buffer av den tilsvarende SBR QMF-filterbank, må bufferen fylles opp til et punkt som behandlingen av data vil føre til en behandling av vesentlig data som krever at den respektive vindusfunksjon eller prototypefilterfunksjon får et tilstrekkelig bidrag. I tilfellet med SBR QMF-prototypefilterfunksjonen, gir den symmetriske form av prototypefilteret 720 en forsinkelse som er i størrelsesorden massesentrum eller midtpunktet av prototypefilterfunksjonen.
Ettersom forsinkelsen innført av modulasjonskjemen av DCT-IV-basert system av N = 64 for samplene alltid er til stede og systemet også omfatter en forsinkelse på en blokk, vil det fremgå at synteseprototypen for SBR QMF innfører en overlapningsforsinkelse på 288 sampler.
Som nevnt tidligere, og i tilfellet med syntesefilterbanker som fig. 4 angår, forårsaker denne ekstra venstre overlapning 760 forsinkelsen mens den høyre side overlapning 770 angår tidligere sampler og følgelig ikke innfører en ekstra forsinkelse i en syntesefilterbank.
På en annen side og med begynnelse med en helt initialisert buffer av CLDFB i følgende utførelse, kan syntesefilterbanken samt analysefilterbanken tilveiebringe "meningsfulle" data snarere enn SBR QMF-filterbanken på grunn av formen av vindusfunksjonen. På grunn av formen av analyse- eller syntesevindusfunksjonen 700, indikerer sampler behandlet av vindusfunksjonene at det vesentlige bidrag med andre ord blir mulig tidligere. Som konsekvens innfører synteseprototypen eller syntesevindusfunksjonen av CLDFB bare en overlapningsforsinkelse på 32 sampler under hensyntagen til forsinkelsen som allerede er innført av modulasjonskjemen 750. Den første del 720 eller den første gmppe 420 av vinduskoeffisienter av vindusfunksjonen 700 ifølge en utførelse omfatter i en foretrukket utførelse 96 vinduskoeffisienter tilsvarende forsinkelsen forårsaket av den venstre sides overlapning 760 sammen med modulasjonskjemeforsinkelsen 750.
Samme forsinkelse blir innført av analysefilterbanken eller analyseprototypefunksjonen. Årsaken er at analysefilterbanken er basert på den tidsreverserte versjon av syntesevindusfunksjonen eller prototypefunksjonen. Således blir overlapningsforsinkelsen innført på høyre side og omfatter samme overlapningsstørrelse som syntesefilterbanken. I tilfellet med en opprinnelig QMF-prototypefilterbank, blir følgelig også en forsinkelse på 288 sampler innført mens bare 32 sampler blir innført som forsinkelse for en analysefilterbank ifølge en utførelse av oppfinnelsen.
Tabellen vist på fig. 14a gir et overblikk over forsinkelsen med forskjellige modifikasjonstrinn som forutsetter en rammelengde på 480 sampler og en samplingsrate på 48 kHz. I en standard konfigurasjon som omfatter en AAC-LD-kodek sammen med et standard SBR-verktøy, forårskaker MDCT og IMDCT-filterbanker i dobbebatemodus forsinkelser på 40 ms.
Videre forårsaker selve QMF-verktøyet en forsinkelse på 12 ms. På grunn av en SBR-overlapning, blir ytterligere en forsinkelse på 8 ms generert, slik at den totale forsinkelse av denne kodek er i området 60 ms.
Som sammenligning omfatter en AAC-ELD-kodek situasjoner av liten forsinkelse av MDCT og IMDCT generert i dobbelratefremgangsmåten en forsinkelse på 30 ms. Sammenlignet med den opprinnelige QMF-filterbank av et SBR- verktøy, vil bruk av en kompleksverdi filterbank med liten forsinkelse ifølge en utførelse av oppfinnelsen føre til en forsinkelse på bare 1 ms sammenlignet med 12 ms for det opprinnelige QMF -verktøy. Ved å unngå SBR-overlapning, kan en tilleggsoverlapning på 8 ms av en enkelt kombinasjon av en AAC-FD og SBR-verktøyet unngås fullstendig. Følgelig kan den forbedrede AAC-kodek med liten forsinkelse være i stand til å oppnå en total algoritmisk forsinkelse på 3 1 ms snarere enn 60 ms for den tidligere nevnte enkle kombinasjon. Følgelig vil det fremgå at kombinasjonen i fremgangsmåten for den beskrevne forsinkelsesreduksjon faktisk fører til en total forsinkelsesbesparelse på 29 ms.
Tabellen på fig. 14b gir en oversikt over den totale kodek forsinkelse forårsaket av den opprinnelige og foreslåtte filterbankversjoner i et system som vist på fig. 5 og 6. Dataene og verdiene på fig. 14b er basert på en samplingsrate på 48 kHz og en rammestørrelse for kjemekoderen på 480 sampler. På grunn av dobbeltraten i et SBR-system som vist og beskrevet på fig. 5 og 6, kjører kjemekoderen effektivt i en samplingsrate på 24 kHz. Siden rammeforsinkelsen på 64 sampler på modulasjonskjemen allerede er innført av kjemekoderen, kan den trekkes fra fra de selvstendige forsinkelsesverdier av de to filterbanker som beskrevet i forbindelse med fig. 13.
Tabellen på fig. 14b understreker at det er mulig å minske den totale forsinkelse av den forbedrede AAC-kodek med liten forsinkelse som omfatter versjoner med liten forsinkelse av en MDCT og IMDCT (FD MDCT og FD IMDCT). Mens en total algoritmisk forsinkelse på 42 ms er bare oppnåelig ved å bruke versjonene med liten forsinkelse av MDCT og IMDCT samt de opprinnelige QMF-filterbanker ved å bruke kompleksverdi filterbanker med liten forsinkelse ifølge utførelser av oppfinnelsen i stedet for de konvensjonelle QMF-filterbanker, kan den totale algoritmeforsinkelse vesentlig reduseres til bare 31,3 ms.
For å evaluere kvaliteten av filterbankene ifølge utførelsene og systemene som omfatter en eller flere filterbanker, har lytteprøver blitt utført hvorfra det kan konkluderes at filterbanken ifølge utførelsen av oppfinnelsen holder lydkvaliteten av AAC-EFD på samme nivå og ikke innfører noen svekkelse verken for den komplekse SBR-modus eller for den realverdi laveffekt SBR-modus. Således vil ikke de forsinkelsesoptimerte filterbanker ifølge utførelsene innføre noen belastning på lydkvaliteten selv om de kan redusere forsinkelsen med så mye som 10 ms. For transientproblemer har det også blitt observert at noen små men ikke statistisk betydelige forbedringer kan oppnås. Ovennevnte forbedring har blitt observert under lytteprøver med kastanjetter og klokkespill.
For ytterligere å bekrefte at nedsamplingen i tilfellet med en 32-bånd filterbank ifølge en utførelse av oppfinnelsen virker like godt for filterbanker ifølge oppfinnelsen sammenlignet med QMF-filterbanker, blir følgende evaluering utført. Først blir en logaritmisk sinussveip analysert med en nedsamplet 32-bånds filterbank, der de 32 øvre bånd som ble initialisert med nuller, lagt til. Etterpå ble resultatet syntetisert av en 64 bånd filterbank og nedsamplet igjen og sammenlignet med det opprinnelige signal. Ved å bruke et konvensjonelt SBR QMF-prototypefilter ble det oppnådd et signal/støyforhold (SNR) på 59,5 dB. En filterbank ifølge oppfinnelsen oppnår imidlertid en SNRverdi på 78, 5 dB som viser at filterbanken ifølge utførelsen også virker i den nedsamplede versjon minst like godt som de opprinnelige QMF-filterbanker.
For å vise at denne fremgangsmåte med forsinkelsesoptimert, ikke-symmetrisk filterbank som brukt i utførelsene ifølge oppfinnelsen gir en tilleggsverdi sammenlignet med en klassisk filterbank med en symmetrisk prototype, vil asymmetriske prototyper bli sammenlignet med symmetriske prototyper med samme forsinkelse, i det følgende.
Fig. 15a viser en sammenligning av en frekvensrespons i en illustrasjon av en filterbank ifølge oppfinnelsen som bruker et vindu med liten forsinkelse (graf 800) sammenlignet med frekvensresponsen av en filterbank som bruker et sinusvindu med en lengde på 128 uttak (graf 810). Fig. 15b viser en forstørrelse av frekvensresponsen i nærfeltet av samme filterbanker ved å bruke samme vindusfunksjoner som nevnt tidligere.
En direkte sammenligning av de to grafene 800, 810 viser at frekvensresponsen av filterbanken som bruker en filterbank med liten forsinkelse ifølge utførelsen, er vesentlig bedre enn den tilsvarende frekvensrespons av en filterbank brukt i et sinusvindu med 128 uttak og samme forsinkelse.
Fig. 16a viser også en sammenligning av forskjellige vindusfunksjoner med en total forsinkelse på 127 sampler. Filterbanken (CLDFB) med 64 bånd omfatter en total forsinkelse på 127 sampler, herunder rammeforsinkelsen og overlapningsforsinkelsen. En modulert filterbank med en symmetrisk prototype og samme forsinkelse vil følgelig ha en prototype med lengde 128 som allerede vist i forbindelse med fig. 15a og 15b. For disse filterbanker med 50 % overlapning, f.eks. MDCT, sinusvinduer eller Kaiser-Bessel-avledede vinduer gir generelt et godt valg for prototyper. Følgelig blir en oversikt på fig. 16a av en frekvensrespons av en filterbank som bruker et vindu med liten forsinkelse som prototype ifølge en utførelse, sammenlignet med frekvensresponsene av alternative symmetriske prototyper med samme forsinkelse. Fig. 16a viser, bortsett fra frekvensresponsen av filterbanken ifølge oppfinnelsen (graf 800) og frekvensresponsen av en filterbank som bruker sinusvindu (graf 810), som allerede vist på fig. 15a og 15b, videre to KBD-vinduer basert på parametrene α = 4 (graf 820) og α = 6 (graf 830). Både fig. 16a og nærrisset av 16a vist på fig. 16b viser tydelig at en meget bedre frekvensrespons kan oppnås med en filterbank ifølge en utførelse av oppfinnelsen som har en ikke-symmetrisk vindusfunksjon eller en prototypefilterfunksjon med samme forsinkelse.
For å vise denne fordel på en mer generell basis på fig. 17, blir to filterbankprototyper med forsinkelsesverdier som er forskjellig fra den tidligere beskrevne filterbank sammenlignet. Mens filterbanken ifølge oppfinnelsen som blir vurdert under fig. 15 og 16 har en total forsinkelse på 127 sampler, som tilsvarer en overlapning av 8 blokker i tidligere og 0 blokker i fremtiden (CLDFB 80), viser fig. 17 en sammenligning av frekvensresponsen av to forskjellige filterbankprototyper med samme forsinkelse på 383 sampler. Mer nøyaktig viser fig. 17 en frekvensrespons av en ikkesymmetrisk prototypefilterbank (graf 840) ifølge en utførelse som er basert på en overlapning av 16 blokker av tidsdomenesampler i tidligere og to blokker av tidsdomenesampler i fremtiden (CLDFB 62). Videre viser fig. 17 også frekvensresponsen (graf 850) av en tilsvarende symmetrisk prototypefilterfunksjon som også har forsinkelse på 383 sampler. Det vil fremgå at en ikkesymmetrisk prototype eller vindusfunksjon med samme forsinkelsesverdi, oppnår en bedre en frekvensrespons enn en filterbank med en symmetrisk vindusfunksjon eller prototypefilter. Dette viser muligheten til å oppnå et bedre kompromiss mellom forsinkelse og kvalitet, som nevnt tidligere.
Fig. 18 viser den tidsbestemte maskeringseffekt av det menneskelige øre. Når en lyd eller en tone oppstår på et tidsøyeblikk vist av linjen 860 på fig. 18, vil en maskeringseffekt av frekvensen av tonen eller lyden og nærliggende frekvenser oppstå omtrent 20 ms før den faktiske lyd begynner. Denne effekt kalles forhåndsmaskering og er et aspekt ved psykoakustiske egenskaper ved det menneskelig øret.
I situasjonen vist på fig. 18 holdes lyden hørbar i omtrent 200 ms inntil øyeblikket vist av en linje 870. 1 løpet av denne tid er en maskering av det menneskelige øret aktiv og kalles også simultan maskering. Etter at lyden stopper (vist av linje 870), vil maskeringen av frekvensen i den nærliggende frekvens av tonen langsomt avta over en tidsperiode på omtrent 150 ms som vist på fig.
18. Denne psykoakustiske effekt kalles også postmaskering.
Fig. 19 viser en sammenligning av en forekkoatferd av et konvensjonelt HE-AAC-kodet signal og et HE-AAC-kodet signal og et HE-AAC-kodet signal som er basert på en filterbank som bruker en filterbank med liten forsinkelse (CMLDFB) ifølge en utførelse av oppfinnelsen. Fig. 19a viser det opprinnelige tids signal av kastanjetter som har blitt behandlet med et system som omfatter en HE-AAC-kodek (HE-AAC = høyeffektiv avansert audiokodek). Signalet fra systemet basert på den konvensjonelle HE-AAC er vist på fig. 19b. En direkte samling av de to signalene, det opprinnelige tidssignal og utgangssignalet av HE-AAC-kodeken, viser at utgangssignalet, før begynnelsen av lyden av kastanjettene i området vist av pilen 880, omfatter utgangssignalet av HE-AAC-kodeken merkbare preekkoeffekter.
Fig. 19c viser et utgangssignal av et system som omfatter en HE-AAC basert på filterbanker som omfatter CMLDFB -vinduer ifølge en utførelse av oppfinnelsen. De samme opprinnelige tidssignaler som vist på fig. 19a og behandlet ved å bruke filterbanker ifølge en utførelse av oppfinnelsen viser et betydelig redusert utseende av preekkoeffekter like før begynnelsen av et kastanjettsignal som vist av en pil 890 på fig. 19c. På grunn av premaskeringseffekten som beskrevet i forbindelse med fig. 18, vil preekkoeffekten vist av pilen 890 på fig. 19c bli langt bedre maskert enn preekkoeffektene indikert av pilen 880 av den konvensjonelle HE-AAC-kodek.
Følgelig vil preekkoatferden av filterbanker ifølge oppfinnelsen som også er et resultat av den vesentlig reduserte forsinkelse sammenlignet med konvensjonelle filterbanker bevirke at signalet blir langt bedre tilpasset de tidsbestemte maskeringsegenskaper og psyko akustikken ved det menneskelig øret. Som resultat og som allerede indikert under beskrivelsen av lytteprøvene, kan bruk av filterbanker ifølge oppfinnelsen også føre til en forbedring av kvaliteten forårsaket av den reduserte forsinkelse.
Utførelser ifølge oppfinnelsen øker ikke beregningskompleksiteten sammenlignet med konvensjonelle filterbanker. Filterbanker med liten forsinkelse bruker samme filterlengde og samme modulasjonsmodus som f.eks. QMF-filterbanker i SBR-systemer, slik at beregningskompleksiteten ikke øker. Når det gjelder minnekrav som skyldes den asymmetriske natur av prototypefiltre, at ROM (leseminne) minnekravet til syntesefilterbanken øker omtrent med 320 ord i en filterbank basert på N = 64 sampler per blokk og T = 10 blokker per ramme. Når det gjelder et SBR-reversert system, øker videre minnekravet ytterligere med 320 ord hvis analysefilteret blir lagret separat.
Ettersom gjeldende ROM-krav til en AAC-ELD-kjeme er omtrent 2,5 k ord (kilo ord) og for SBR-implementering i tillegg 2,5 k ord, blir imidlertid ROM-kravet bare moderat økt med omtrent 10 %. Som et mulig kompromiss mellom minne og kompleksitet, og hvis lite minneforbruk er viktig, kan en lineær interpolasjon brukes for å generere analysefilteret fra syntesefilteret som skissert i forbindelse med fig. 3 og ligning (15). Denne interpolasjon øker antallet nødvendige instrukser bare med omtrent 3,6 %. Følgelig kan en erstatning av de konvensjonelle QMF-filterbanker i rammen av SBR-moduler med filterbanker med liten forsinkelse ifølge utførelsene redusere forsinkelsen i enkelte utførelser med så mye som 10 ms uten å svekke lydkvaliteten eller vesentlig å øke kompleksiteten.
Utførelser ifølge oppfinnelsen angår følgelig en analyse eller et syntesevindu eller apparat eller fremgangsmåte for vindussending. Videre er det beskrevet en analyse eller en syntesefilterbank eller en fremgangsmåte for å analysere eller syntetisere et signal ved å bruke et vindu. Naturligvis blir dataprogrammet som implementerer en av de ovennevnte fremgangsmåter også beskrevet.
Implementering ifølge utførelsen av oppfinnelsen kan utføres som maskinvareimplementeringer, programvareimplementeringer eller en kombinasjon av begge.
Datavektorer og variabler som genereres, mottas eller på annen måte lagres for behandling, kan lagres i forskjellige typer minne, slik som direktelager, buffere, leseminne, ikke-flyktige minner (f. eks. EEPROM, flash-minne) eller andre minner, slik som magnetiske eller optiske minner. En lagringsposisjon kan f.eks. være en eller flere minneenheter som kan lagre eller oppbevare de respektive mengder data, slik som variabler, parametere, vektorer, matriser, vinduskoeffisienter eller annen informasjon og data.
Programvareimplementeringer kan brukes på forskjellige datamaskiner, datamaskinlignende systemer, prosessorer, ASIC (applikasjonsspesifikke integrerte kretser) eller andre integrerte kretser (IC).
Avhengig av bestemte implementering skrav av utførelsene, kan disse implementeres i maskinvare, programvare eller en kombinasjon av disse. Implementering kan utføres ved å bruke et digitalt lagringsmedium, især en disk CD, en DVD eller en annen disk med et elektronisk lesbart styresignal som samvirker et programmerbart datasystem, en prosessor eller integrert krets, slik at en utførelse av den nye fremgangsmåten kan utføres. Generelt er følgelig en utførelse av oppfinnelsen også et dataprogramprodukt med en programkode lagret på en maskinlesbar bærer, idet programkoden kan brukes for å utføre en utførelse av de nye fremgangsmåter når dataprogrammet kjøres på en datamaskin, en prosessor eller integrert krets. Med andre ord er følgelig utførelsen av de nye fremgangsmåter et dataprogram med en programkode for å utføre minst en utførelse av fremgangsmåten når programmet kjøres på en datamaskin, en prosessor eller integrert krets.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge utførelsene, er analysevindussendingen (110) tilpasset slik at en første del av analysevindusfunksjonen omfatter en vinduskoeffisient med en absolutt maksimumsverdi som er større enn 1.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge utførelsene, er analysevindussendingen (110) tilpasset slik at analysevindusfunksjonen omfatter en oscilleringsatferd.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at alle vinduskoeffisienter av sekvensen av vinduskoeffisienter er virkelig verdsatt vinduskoeffisienter.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at rammen (120) av tidsdomeneaudioinngangssampler omfatter en sekvens av T-blokker (130) av tidsdomeneaudioinngangssampler som strekker seg fra de tidligste til de siste tidsdomeneaudioinngangssampler av rammen (120), idet hver blokk omfatter N tidsdomeneaudioinngangssampler, der T og N er positive integere og T er større enn 4.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at vindusutsendelsen omfatter en elementvis multiplisering av tidsdomeneaudioinngangssampler av rammen (110) med vinduskoeffisientene av sekvensene av vinduskoeffisienter.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at hvert tidsdomeneaudioinngangssampel blir elementvist multiplisert med en vinduskoeffisient av analysevindusfunksjonen ifølge en sekvens av tidsdomeneaudioinngangssampler og sekvensen av vinduskoeffisienter.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, blir analysevindussendingen (110) tilpasset slik at det for hvert tidsdomeneaudioinngangssampel av rammen (120) av tidsdomeneaudioinngangssamplene blir generert nøyaktig et vindussampel.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at vinduskoeffisienten tilsvarer en indeks av vinduskoeffisientene n = (T-3) · N som omfatter en verdi på mindre enn -0,1, der indeksen av sekvensen av vinduskoeffisienter er en integer i området 0 til N · T -1 og der vinduskoeffisienten brukt for vindusutsendelsen av det siste tidsdomeneaudioinngangssampel er vinduskoeffisienten som tilsvarer indeksen N · T - 1.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at den første del av vinduskoeffisienten omfatter 3/2 · N vinduskoeffisienter og den andre del av vinduskoeffisientene omfatter (T - 3/2) · N vinduskoeffisienter av sekvensen av vinduskoeffisienter.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at vinduskoeffisientene c(n) oppfyller forholdene som gitt i tabellen i tillegg 3.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at vinduskoeffisientene c(n) oppfyller forholdene som vist i tabellen i tillegg 2.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) tilpasset slik at vinduskoeffisientene c(n) omfatter verdiene gitt i tabellen i tillegg 1.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) eller apparatet (100) tilpasset slik at analysevindusfunksjonen (190) omfatter et første antall vinduskoeffisienter avledet fra en større vindusfunksjon som omfatter en sekvens av et større andre antall vinduskoeffisienter, der vinduskoeffisientene av vindusfunksjonen blir avledet av en interpolasjon av vinduskoeffisienter av den større vindusfunksjon og der det andre antall er et likt antall.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) eller apparatet (100) tilpasset slik at vinduskoeffisientene av vindusfunksjonen er interpolert lineært.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) eller apparatet (1009 tilpasset slik at vinduskoeffisientene av analysevindusfunksjonen blir interpolert basert på to etterfølgende vinduskoeffisienter av den større vindusfunksjon i samsvar med sekvensen av vinduskoeffisienter av den større vindusfunksjon for å oppnå en vinduskoeffisient av vindusfunksjonen.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er analysevindussendingen (110) eller apparatet (100) tilpasset for å oppnå vinduskoeffisientenes c(n) av analysevindusfunksjonen basert på ligningen
der n er en integer som indikerer en indeks av vinduskoeffisientene c(n) og c2(n) er en vinduskoeffisient av den større vindusfunksjon.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er apparatet (100) tilpasset slik at rammen (120) av tidsdomeneaudioinngangssamplene for behandling, blir generert ved å flytte (T-l) senere blokker av en direkte foregående ramme (120) av tidsdomeneaudioinngangssampler med en blokk mot de tidligere tidsdomeneaudioinngangssampler og addere en blokk (220) med nye tidsdomeneaudiosampler når blokken omfatter de siste tidsdomeneaudioinngangssampler av den nærværende ramme (120).
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er apparatet (100) tilpasset slik at rammen (120) av tidsdomeneaudioinngangssampler x(n) for behandling, blir generert basert på å flytte tidsdomeneaudioinngangssampler xprev(<n>) av den direkte foregående ramme (120) av tidsdomeneaudioinngangssampler, basert på ligningen
for en tids- eller sampelindeks n = 32, ..., 319, og der apparatet (100) videre er tilpasset for å generere tidsdomeneaudioinngangssampler x(n) av nærværende ramme (120) av tidsdomeneaudioinngangssampler ved å ta med 32 neste innkommende tidsdomeneinngangssampler i samsvar med en rekkefølge av de innkommende tidsdomeneaudioinngangssampler av avtagende tid eller sampelindekser n for tidsdomeneaudioinngangssampler x(n) av nærværende ramme (120) som begynner ved tidspunktet eller sampelindeksen n = 31.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, omfatter kalkulatoren (170) en tids/ffekvenskonverter som kan generere audiodelbåndsverdier, slik at alle delbåndsverdier basert på en ramme (150) av vindusutsendte sampler representerer en spektral fremstilling av vindussendte sampler av rammen (150) av vindussendte sampler.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er tids/frekvenskonverteren tilpasset for å generere kompleksverdi eller realverdi audiodelbåndsverdier.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er kalkulatoren (170) tilpasset for å beregne en audiodelbåndsverdi for hvert tidsdomeneaudioinngangssampel av en blokk (130) av tidsdomeneaudioinngangssampler, der beregningen av hver audiodelbåndsverdi eller hvert av tidsdomeneaudioinngangssampler av en blokk (130) av tidsdomeneaudioinngangssampler er basert på de vindussendte sampler av den vindussendte ramme (150).
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er kalkulatoren (170) tilpasset for å beregne audiodelbåndsverdiene basert på å multiplisere vindussamplene (150) med en harmonisk oscillerende funksjon for hver delbåndsverdi og summere de multipliserte vindus sampler, der en frekvens av den harmonisk oscillerende funksjon er basert på en senterfrekvens for et tilsvarende delbånd av delbåndsverdiene.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er kalkulatoren (170) tilpasset slik at den harmonisk oscillerende funksjon er en kompleks eksponentialfunksjon, en sinusfunksjon eller en cosinusfunksjon.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er kalkulatoren (170) tilpasset for å beregne audiodelbåndsverdier wu basert på ligningen
for n = 0, ..., 63 og
for k = 0, ..., 31, der z(n) er et vindussendt sampel tilsvarende en indeks n, der k er en delbåndsindeks, der 1 er en indeks av blokk (180) av audiodelbåndsverdier og der fosc(x) er en oscilleringsfunksjon avhengig av den realverdi, variable x.
342691
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er kalkulatoren (170) tilpasset slik at oscilleringsfunksjonen fosc(x) er
der i er den tenkte enhet.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er apparatet (100) tilpasset for å behandle en ramme (120) av realverdi, tidsdomeneaudioinngangssampler.
I et apparat for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen, er apparatet (100) tilpasset for å levere et signal som indikerer en syntesevindusfunksjon (370) for bruk med audiodelbåndsverdiene eller som indikerer analysevindusfunksjonen (190) brukt for å generere audiodelbåndsverdiene.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er apparatet (300) tilpasset for å generere en blokk (410) av tidsdomeneaudiosampler, idet blokken (410) av tidsdomeneaudiosampler omfatter N tidsdomeneaudiosampler, der N er en positiv integer.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er apparatet (300) tilpasset for å generere blokken (410) av tidsdomeneaudiosampler basert på en blokk (320) av audiodelbåndsverdier som omfatter N audiodelbåndsverdier og der kalkulatoren (3 10) er tilpasset for å beregne sekvensen (330) av foreløpige domeneaudio sampler som omfatter T · N foreløpige domeneaudiosampler, der T er en positiv integer.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) tilpasset slik at syntesevindusfunksjonen er asymmetrisk i forhold til sekvensvinduskoeffisienten.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindusutsendelsen (360) tilpasset slik at en første del omfatter en maksimal verdi av alle vinduskoeffisienter av syntesevindusfunksjonen som har en absolutt verdi som er større enn 1.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) tilpasset slik at syntesevindusfunksjonen (370) omfatter en oscilleringsatferd.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) tilpasset slik at den første del omfatter 3/2 · N vinduskoeffisienter og den andre del av vinduskoeffisientene omfatter (T-3/2) · N vinduskoeffisienter, der T er en indeks 342691
som er større eller lik 4 som indikerer et antall blokker 340 omfattet i rammen (330) av foreløpige domenesampler.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) tilpasset slik at vindussendingen av sekvensen av foreløpige domenesampler omfatter en elementvis multiplisering av foreløpige domenesamplene med en vinduskoeffisient.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) tilpasset slik at hvert foreløpige domenesampel blir elementvis multiplisert med vinduskoeffisienten av syntesevindusfunksjonen (370) i samsvar med sekvensen av foreløpige domenesampler og sekvensen av vinduskoeffisienter.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevinduet (360) tilpasset slik at vinduskoeffisientene av syntesevindusfunksjonen (370) er realverdi verdier.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) tilpasset slik at vinduskoeffisienten c(n) oppfyller forholdene som oppgitt i tabellen i tillegg 3.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) tilpasset slik at vinduskoeffisientene c(n) oppfyller forholdene som gitt i tabellen i tillegg 2.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) tilpasset slik at vinduskoeffisientene c(n) omfatter verdiene gitt i tabellen i tillegg 1.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) eller apparatet (300) tilpasset slik at syntesevindusfunksjonen omfatter et første antall vinduskoeffisienter avledet fra en større vindusfunksjon som omfatter en sekvens av et større andre antall vinduskoeffisienter, der vinduskoeffisientene av vindusfunksjonen blir avledet av en interpolasjon av vinduskoeffisienter i den større vindusfunksjon og der det andre tallet er likt.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) eller apparatet (300) tilpasset slik at vinduskoeffisientene av syntesevindusfunksjonen (370) er interpolert lineært.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) eller apparatet (300) tilpasset slik at vinduskoeffisientene av syntesevindusfunksjonen (370) blir interpolert basert på to etterfølgende vinduskoeffisienter av den større vindusfunksjon ifølge sekvensen av vinduskoeffisientene av den større vindusfunksjon for å oppnå en vinduskoeffisient av vindusfunksjonen.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er syntesevindussendingen (360) eller apparatet (300) tilpasset for å oppnå vinduskoeffisientene c(n) av syntesevindusfunksjonen basert på ligning
der n er en integer som indikerer en indeks av vinduskoeffisientene c(n) og c2(n) er en vinduskoeffisient av den større vindusfunksjon.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er kalkulatoren (3 10) tilpasset for å beregne foreløpige domenesampler av sekvensen av foreløpige domenesampler basert på å multiplisere audiodelbåndsverdiene med en harmonisk oscillerende funksjon og oppsummere de multipliserte audiodelbåndsverdier, der frekvensen av den harmonisk oscillerende funksjon er basert på en senterfrekvens av det tilsvarende delbånd.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er kalkulatoren (3 10) tilpasset slik at den harmonisk oscillerende funksjon er en kompleks eksponentialfunksjon, en sinusfunksjon eller en cosinusfunksjon.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er kalkulatoren (3 10) tilpasset for å beregne realverdi foreløpige domenesampler basert på de kompleksverdi eller realverdi audiodelbåndsverdier.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er kalkulatoren (3 10) tilpasset for å beregne sekvensen av realverdi foreløpige domenesampler z(i,n) basert på ligningen
for en integer n i området 0 til N · T-l, der Re(x) er den virkelige del av det kompleksverdie nummer x, π = 3, 14 ... som er det sirkulære tall og fosc(x) som er en harmonisk oscillerende funksjon, der
når audiodelbåndsverdiene levert til kalkulatoren er kompleksverdi, der I er den tenkte enhet og der
når audiodelbåndsverdiene levert til kalkulatoren (3 10) er virkelige verdier.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, omfatter kalkulatoren (310) en frekvens/tidskonverter som kan generere sekvensen av foreløpige domenesampler, slik at audiodelbåndsverdiene levert til kalkulatoren (3 10) representerer en spektral fremstilling av sekvensen av foreløpige domenesampler.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er frekvens/tidskonverteren tilpasset for å generere sekvensen av foreløpige domensampler basert på kompleksverdi eller realverdi audiodelbåndsverdier.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er kalkulatoren (3 10) tilpasset for å beregne sekvensen av foreløpige domenesampler g(n) fra audiodelbåndsverdiene X(k) basert på ligningen
for en integer n i området 20N - 1 og 2N,
for integeren n i området 0 og 2N - 1 og
g{2N-j k) = v{ANj k)
g(2N ■ j N k) = v(ANj 3N k)
for en integer j i området 0 og 4 og for en integer k i området 0 og N - 1, der N er en integer som indikerer antallet audiodelbåndsverdier og antallet tidsdomeneaudiosampler, der g er en virkelig verdsatt vektor, der vprcver en virkelig verdsatt vektor v av den direkte foregående generasjon av tidsdomeneaudiosampler, der i er den tenkte enhet og π er det sirkulære tall.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er kalkulatoren (3 10) tilpasset for å beregne sekvensen av foreløpige domenesampler g(n) fra audiodelbåndsverdiene X(k) basert på ligningen
for en integer n i området 20N - 1 og 2N,
for integeren n i området 0 og 2N- 1 og
g{2N-j k) = v{ANj k )
g(2N ■ j N k) = v(ANj 3N k)
for en integer j i området 0 og 4 og for en integer k i området 0 og N-l, der N er en integer som indikerer antallet audiodelbåndsverdier og antallet tidsdomeneaudiosampler, der v er en virkelig verdsatt vektor, der vprcver en virkelig verdsatt vektor v av den direkte foregående generering av tidsdomeneaudiosampler og der π er det sirkulære tall.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er det overlapningstillagte utgangstrinn (400) tilpasset for å behandle vindussendte foreløpige domenesampler på en overlappende måte, basert på T etterfølgende leverte blokker (320) av audiodelbåndsverdier.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er overlapningstilleggstrirmet (400) tilpasset for å levere tidsdomenesampler outj(n), der n er en integer som indikerer en sampelindeks basert på ligningen
der z1 ner et vindussendt foreløpige domenesampel tilsvarende en sampelindeks og en ramme eller sekvensindeks 1 i området fra 0 til T - 1, der 1 = 0 tilsvarer den siste ramme eller sekvens og mindre verdier av 1 tidligere genererte rammer eller sekvenser.
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er det tillagte utgangstrinn (400) tilpasset for å levere tidsdomenesampler out(k) basert på ligningen
der w er en vektor som omfatter de vindussendte foreløpige domenesampler og k er en integer som indikerer en indeks i området mellom 0 og (N-l).
I et apparat for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen, er apparatet (300) tilpasset for å motta et signals om indikerer analysevindusfunksjonen (190) brukt for å generere audiodelbåndsverdier eller som indikerer syntesevindusfunksjonen (370) for bruk for å generere tidsdomeneaudiosampler.
Ifølge en utførelse av oppfinnelsen, omfatter en koder (510) et apparat (560) for å generere audiodelbåndsverdier i audiodelbåndskanaler ifølge en utførelse av oppfinnelsen.
Ifølge en utførelse av oppfinnelsen, omfatter en koder (510) videre en kvantiserer og koder (570) koblet til apparatet (560) for å generere audiodelbåndsverdier og tilpasset for å kvantisere og kode audiodelbåndsverdienes signal av apparatet (560) og sende de kvantiserte kodede audiodelbåndsverdier.
Ifølge en utførelse av oppfinnelsen, omfatter en dekoder (580) et apparat (600) for å generere tidsdomeneaudiosampler ifølge en utførelse av oppfinnelsen.
Ifølge en utførelse av oppfinnelsen, omfatter dekoderen (580) videre en dekoder og dekvantiserer (590) tilpasset for å motta kodede og kvantiserte audiodelbåndsverdier, koblet til apparatet (600) for å generere tidsdomeneaudiosampler og for å levere de dekodede og dekvantiserte audiodelbåndsverdier som audiodelbåndsverdier til apparatet (600).
Ifølge en utførelse av oppfinnelsen, omfatter en SBR-koder (520) et apparat (530) for å generere audiodelbåndsverdier i audiodelbåndskanaler basert på en ramme av tidsdomeneaudioinngangssampler levert til SBR-koderen (520) og en SBR-parameter ekstraheringsmodul (540) koblet til apparatet (530) for å generere audiodelbåndsverdier og hente ut og sende SBR parametere basert på audiodelbåndsverdiene.
Ifølge en utførelse av oppfinnelsen, omfatter et system (610) et apparat (620) for å generere audiodelbåndsverdier fra en ramme av tidsdomeneaudioinngangssampler levert til systemet (620) og et apparat (640) for å generere tidsdomeneaudiosampler basert på audiodelbåndsverdiene generert av apparatet (640) for å generere audiodelbåndsverdier.
Ifølge en utførelse av oppfinnelsen, er et system (610) en SBR-dekoder.
Ifølge en utførelse av oppfinnelsen, omfatter et system videre en HF-generator (630) koblet mellom apparatet (620) for å generere audiodelbåndsverdier og apparatet (640) for å generere tidsdomeneaudiosampler og for å mota SBR-data tilpasset for å modifisere eller legge til audiodelbåndsverdier basert på SBR-dataene og audiodelbåndsverdiene fia apparatet (620) for å generere audiodelbåndsverdier.
Når det gjelder alle apparatene og fremgangsmåtene ifølge utførelsene av oppfinnelsen, og avhengig av implementeringen for å tilveiebringe vinduskoeffisientene basert på verdiene oppgit i tabellene i tilleggene 1 og 3, kan tilleggstegnendringer i forbindelse med vinduskoeffisientene tilsvarende indeksene 128 til 255 og 384 til 511 (multiplikasjon med faktor (-1)) implementeres i samsvar med ligningene (16a) og (16b). Med andre ord er vinduskoeffisientene av vindusfunksjonen basert på vinduskoeffisientene git i tabellen i tillegg 1. For å oppnå vinduskoeffisientene av vindusfunksjonen vist på figurene, må vinduskoeffisientene i tabellen tilsvarende indeksene 0 til 127, 256 til 383 og 512 til 639 multipliseres med (+1) (dvs. ingen tegnendring) og vinduskoeffisientene tilsvarende indeksene 128 til 255 og 384 til 511 må multipliseres med (-1) (dvs. en tegnendring) for å oppnå vinduskoeffisientene av den viste vindusfunksjon. Følgelig må forholdene oppgit i tabellen i tillegg 3 behandles tilsvarende. Med andre ord kan vinduskoeffisientene som oppgit i tabellene i tilleggene 1-4 endres i samsvar med ligningene (16a) og (16b).
Det skal bemerkes at i rammen av nærværende søknad under en ligning, vil det fremgå at det er innført tilleggsforsinkelser, faktorer, tilleggskoeffisienter og en innføring av en annen enkelfunksjon. Videre skal enkle konstanter, konstantaddender osv. utelates. Videre er algebraiske transformasjoner, ekvivalenstransformasjoner og approksimeringer (f. eks. en Taylorapproksimasjon) som ikke endrer resultatet av ligningen i det hele tat eller på en vesentlig måte, også omfatet. Med andre ord er både små modifikasjoner samt transformasjoner som vesentlig fører til samme resultat omfatet i det tilfellet at en ligning eller et uttrykk er basert på en ligning eller et uttrykk.
Mens det foregående har blit vist og beskrevet under henvisning til bestemte utførelser, vil det fremgå for en fagmann at forskjellige andre endringer i form og detaljer kan utføres uten at oppfinnelsens ånd eller omfang fravikes. Det vil videre fremgå at forskjellige endringer kan foretas i de forskjellige utførelser uten at det fravikes fra den bredere forståelse som beskrevet her og som er omfatet av de vedføyde krav.

Claims (15)

P at e n tk r av
1. Apparat for å generere audiodelbåndsverdier i audio delbåndskanaler, omfattende:
en analysevindussender (1 10) for vindussending av en ramme (120) med tidsdomeneaudioinngangssampler som er i en tidssekvens som strekker seg fra et tidlig sampel til et senere sampel ved bruk av en analysevindusfunksjon (190) omfattende en sekvens av vinduskoeffisienter for å oppnå vindussendte sampler, hvor analysevindusfunksjon (190) omfatter en første gruppe (200) av vindus-koeffisienter omfattende en første del av sekvensen av vinduskoeffisienter og en andre gruppe (210) av vinduskoeffisientene som omfatter en andre del av sekvensen av vinduskoeffisienter, hvor den første del omfattende færre vindus-koeffisienter enn den andre del,
hvor en total energiverdi av vinduskoeffisientene i den første del er større enn en total energiverdi av vinduskoeffisientene i den andre del,
hvor den første gruppen av vinduskoeffisienter blir brukt for vindussending av senere tidsdomenesampler og den andre gruppe vinduskoeffisienter blir brukt for vindussending av tidligere tidsdomenesampler og,
hvor analysevindussenderen (110) er innrettet slik at rammen (120) med tidsdomeneaudioinngangssampler omfatter en sekvens på mer enn 4 blokker (130) med tidsdomeneaudioinngangssampler som strekker seg fra den første til den siste tidsdomeneaudioinngangssampler til rammen (120); og
en kalkulator (170) for beregning av audio delbånd verdier ved hjelp av vindusprøvene, hvor kalkulatoren (170) omfatter en tid / frekvens-konverter innrettet til å generere audiodelbåndsverdier slik at alle delbåndsverdier basert på en ramme (150) av vindusprøver representerer en spektral representasjon av vindussamplene til rammen (150) av vindusprøver.
2. Apparat (100) ifølge krav 1, hvor analysevindussenderen (110) er innrettet slik at en energiverdi av vinduskoeffisientene til den første del er lik eller større enn 2/3 av en energiverdi av alle vinduskoeffisienter i sekvensen av vinduskoeffisienter, og en energiverdi av vinduskoeffisientene i den andre del av vinduskoeffisienter er mindre enn eller lik 1/3 av en energiverdi av alle vinduskoeffisienter i sekvensen av vinduskoeffisienter.
3. Apparat (100) ifølge et hvilket som helst av de foregående krav, hvor analysevindussenderen (1 10) er innrettet slik at den første delen av vinduskoeffisientene omfatter 1/3 eller mindre enn 1/3 av et totalt antall vinduskoeffisienter i sekvensen av vinduskoeffisienter og den andre del omfatter 2/3 eller mer enn 2/3 av det totale antall vinduskoeffisienter i sekvensen av vinduskoeffisienter.
4. Apparat (100) ifølge et hvilket som helst av de foregående krav, hvor analysevindus senderen (1 10) er innrettet slik at vindussending omfatter å multiplisere tidsdomeneaudioinngangssampler x (n) til rammen (120) for å oppnå de vindussendte samplene z (n) til den vindussendte rammen, basert på ligning
z(n) = x(n ) · c(n)
hvor n er et helt tall som indikerer en indeks av sekvensen av vinduskoeffisienter i området fra 0 til T · N-l, hvor c (n) i vinduskoeffisienten for analysevindusfunksjonen som korresponderer med indeksen n, hvor x (N · T-l) er det siste tidsdomeneaudioinngangssampel i en ramme (120) av tidsdomeneaudioinngangssampler, hvor analysevindussenderen (110) er innrettet slik at rammen (120) av tidsdomeneaudioinngangssampler omfatter en sekvens av T-blokker (130) med tidsdomeneaudioinngangssampler som strekker seg fra det første til det siste tidsdomeneaudioinngangssampel av rammen (120), hvor hver blokk omfatter N tidsdomeneaudioinngangssampler, og hvor T og N er positive heltall og T er større enn 4.
5. Apparat (100) ifølge krav 4, hvor analysevindussenderen (1 10) er innrettet slik at vinduskoeffisientene c (n) følger relasjonene som er gitt i tabellen i vedlegg 4.
6. Apparat ifølge hvilket som helst av de foregående krav, hvor apparatet (100) er innrettet til å bruke en analysevindusfunksjon (190) som er en tidsreversert eller indeks-reversert versjon av en syntesevindusfunksjon (370) som skal brukes for audiodelbåndsverdiene.
7. Apparat (300) for å generere tidsdomeneaudiosampler, omfattende:
en kalkulator (3 10) for å beregne en sekvens (330) av foreløpige tidsdomenesampler fra audiodelbåndsverdier i audiodelbåndskanaler, hvor sekvensen omfatter tidligere foreløpige domenesampler og senere tidsdomenesampler,
hvor kalkulatoren (3 10) omfatter en frekvens/tidskonverter tilpasset for å generere sekvensen av foreløpige domenesampler, slik at audiodelbåndsverdiene levert til kalkulatoren (310) representerer en spektral fremstilling av sekvensen av foreløpige domenesampler,
en syntesevindussender(360) for vindussending av sekvensen (330) av foreløpige tidsdomenesampler ved å bruke en syntesevindusfunksjon (370) som omfatter en sekvens av vinduskoeffisienter for å oppnå vindussendte foreløpige domenesampler, hvor syntesevindusfunksjonen (370) omfatter en første gruppe (420) av vinduskoeffisienter som omfatter en første del av sekvensen av vinduskoeffisienter, og en andre gruppe (430) av vinduskoeffisienter som omfatter en andre del av sekvensen av vinduskoeffisienter, hvor den første del omfatter færre vinduskoeffisienter enn den andre del,
hvor en total energiverdi av vinduskoeffisientene i den første del er høyere enn en total energiverdi av vinduskoeffisientene i den andre del,
hvor den første gruppe av vinduskoeffisienter blir brukt for vindussending av senere foreløpige domenesampler, og den andre gruppe vinduskoeffisienter blir brukt for vindussending av tidligere foreløpige domenesampler, og
et overlapningsaddert utgangstrinn (400) for å behandle vindussendte foreløpige tidsdomenesampler for å oppnå tidsdomenesamplene,
hvor det overlapningsadderte utgangstrinnet (400) er innrettet til å oppsummere foreløpige tidsdomenesampler av mer enn 4 forskjellige blokker (390) av vindussendte foreløpige tidsdomenesampler fra mer enn 4 ulike rammer (380) for tidsdomeneutgangssamplene.
8. Apparat (300) ifølge krav 7, hvor syntesevindussenderen (360) er innrettet slik at en energiverdi av vinduskoeffisientene til den første del av vinduskoeffisientene er større enn eller lik 2/3 av en energiverdi av alle vinduskoeffisienter i syntesevindusfunksjonen (370) og en energiverdi på den andre del av vinduskoeffisientene er mindre enn, eller lik 1/3 av energiverdien av alle vinduskoeffisientene i syntesevindusfunksjonen.
9. Apparat (300) ifølge et hvilket som helst av kravene 7 eller 8, hvor syntesevindusseneren (360) er innrettet slik at den første delen av vinduskoeffisientene omfatter 1/3 eller mindre enn 1/3 av det totale antall av alle vinduskoeffisienter av sekvensen av vinduskoeffisienter og den andre del av vinduskoeffisientene omfatter 2/3 eller mer enn 2/3 av det totale antall vinduskoeffisienter i sekvensen av vindus koeffisienter.
10. Apparat (300) ifølge et hvilket som helst av kravene 7 til 9, hvor vinduskoeffisient som korresponderer med en indeks n = N omfatter en absolutt verdi i området mellom 0,9 og 1, 1, hvor indeksen n av sekvensen av vinduskoeffisienter er et helt tall i området fra 0 til T · N - 1, hvor vinduskoeffisienten som brukes for vindussending av det siste foreløpige tidsdomenesampelet er vinduskoeffisienten som korresponderer med indeks n = 0, hvor t er et helt tall større enn 4, som indikerer antallet blokker omfattet i rammen (330) av foreløpige tidsdomenesampler, hvor apparatet (300) er innrettet for å generere en blokk (410) av tidsdomeneaudiosampler, hvor blokken (410) av tidsdomeneaudiosampler omfatter N tidsdomeneaudiosampler, hvor N er et positivt heltall.
11. Apparat (300) ifølge et hvilket som helst av kravene 7 til 10, hvor syntesevindussenderen (360) er innrettet slik at vindussending omfatter å multiplisere de foreløpige tidsdomenesamplene g (n) fra sekvensen av foreløpige tidsdomenesampler for å oppnå det vindussendte sampel z (n) i vindusrammen (380) på grunnlag av ligningen
z(n ) = g(n )<■>C(T<■>N - 1 - n)
for n = 0, ..., T - N - 1.
12. Apparat (300) ifølge krav 11, hvor syntesevindussenderen (360) er innrettet slik at vinduskoeffisienten c (n) oppfyller relasjonene som er gitt i tabellen i vedlegg 4.
13. Fremgangsmåte for å generere audiodelbåndsverdier i delbåndsaudiokanaler, omfattende:
vindussending av en ramme av tidsdomeneaudioinngangssampler som er i en tidssekvens som strekker seg fra et tidlig sampel til et senere sampel ved å bruke en analysevindusfunksjon som omfatter en første gruppe (200) av vinduskoeffisienter som omfatter en første del av sekvensen av vinduskoeffisienter, og den andre gruppe (210) av vinduskoeffisienter som omfatter en andre del av sekvensen av vinduskoeffisienter, idet den første del omfatter færre vinduskoeffisienter enn den andre del,
hvor en total energiverdi av vinduskoeffisientene i den første del er høyere enn den totale energiverdi av vinduskoeffisientene i den andre del,
hvor den første gruppe (200) av vinduskoeffisientene blir brukt for vindussending av senere tidsdomenesampler, og den andre gruppe (210) av vinduskoeffisientene blir brukt for vindussending av tidligere tidsdomenesampler,
hvor rammen (120) av tidsdomeneaudioinngangsprøver omfatter en sekvens på mer enn 4 blokker (130) av tidsdomeneaudioinngangsprøver som strekker seg fra det tidligste til det seneste tidsdomeneaudioinngangssampel av rammen (120); og
beregning av audiodelbåndsverdier ved hjelp av vindussamplene,
hvor beregningen omfatter tid/frekvenskonvertering av vindussampler slik at alle delbåndsverdier basert på en ramme (150) av vindussampler representerer en spektral fremstilling av vindussamplene av rammen (150) av vindussampler.
14. Fremgangsmåte for generering av tidsdomeneaudiosampler, omfattende:
beregning av en sekvens av foreløpige -domenesampler fra audiodelbåndsverdier i audiodelbåndskanaler, hvor sekvensen omfatter tidligere foreløpige domenesampler og senere foreløpige domenesampler,
hvor beregning omfatter frekvens / tid konvertering av de foreløpige tidsdomenesampler slik at audiodelbåndsverdiene representerer en spektral fremstilling av sekvensen av foreløpige tidsdomenesampler;
vindussending av sekvensen av foreløpige tidsdomenesampler ved å bruke en syntesevindusfunksjon som omfatter en sekvens av vinduskoeffisienter for å oppnå foreløpige tidsdomenesampler, hvor syntesevindusfunksjonen omfatter en første gruppe (420) av vinduskoeffisienter omfattende en første del av sekvensen av vinduskoeffisienter og en andre gruppe (430) av vinduskoeffisienter som omfatter en andre del av sekvensen av vinduskoeffisienter, hvor den første del omfatter mindre vinduskoeffisienter enn den andre del, hvor en energiverdi fra en vinduskoeffisient i den første del er høyere enn en energiverdi fra en vinduskoeffisient fra den andre del, hvor den første gruppen av vinduskoeffisienter blir brukt for senere foreløpige tidsdomenesampler og den andre gruppen (420) av vinduskoeffisienter blir brukt for vindussende tidligere foreløpige tidsdomenesampler; og overlapping saddering av vindussendte tidsdomenesamplene for å oppnå tidsdomenesamplene,
hvor overlappingsadderingen omfater summering av foreløpige tidsdomenesampler av mer enn 4 forskjellige blokker (390) av foreløpige tidsdomenesampler fra mer enn 4 forskjellige rammer (380) for tidsdomeneutgangssamplene.
15. Program med en programkode for å utføre, når de kjøres på en prosessor, en fremgangsmåte ifølge krav 13 eller ifølge krav 1.
NO20170452A 2006-10-25 2017-03-23 Apparat og fremgangsmåte for å generere audiodelbåndsverdier, samt apparat og fremgangsmåte for å generere tidsdomeneaudiosampler NO342691B1 (no)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US86295406P 2006-10-25 2006-10-25
PCT/EP2007/009199 WO2008049589A1 (en) 2006-10-25 2007-10-23 Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples

Publications (2)

Publication Number Publication Date
NO20170452A1 NO20170452A1 (no) 2009-07-22
NO342691B1 true NO342691B1 (no) 2018-07-09

Family

ID=39048961

Family Applications (3)

Application Number Title Priority Date Filing Date
NO20084012A NO341567B1 (no) 2006-10-25 2008-09-19 Apparat og fremgangsmåte for å generere audiobåndverdier, og apparat og fremgangsmåte for å generere audioutvalg i tidsdomene
NO20091951A NO341610B1 (no) 2006-10-25 2009-05-19 Apparat og fremgangsmåte for å generere audiosubbåndverdier, samt apparat og fremgangsmåte for å generere audioutvalg i tidsdomene
NO20170452A NO342691B1 (no) 2006-10-25 2017-03-23 Apparat og fremgangsmåte for å generere audiodelbåndsverdier, samt apparat og fremgangsmåte for å generere tidsdomeneaudiosampler

Family Applications Before (2)

Application Number Title Priority Date Filing Date
NO20084012A NO341567B1 (no) 2006-10-25 2008-09-19 Apparat og fremgangsmåte for å generere audiobåndverdier, og apparat og fremgangsmåte for å generere audioutvalg i tidsdomene
NO20091951A NO341610B1 (no) 2006-10-25 2009-05-19 Apparat og fremgangsmåte for å generere audiosubbåndverdier, samt apparat og fremgangsmåte for å generere audioutvalg i tidsdomene

Country Status (26)

Country Link
US (11) USRE50132E1 (no)
EP (10) EP1994530B1 (no)
JP (2) JP4936569B2 (no)
KR (2) KR101056253B1 (no)
CN (2) CN101405791B (no)
AR (2) AR063400A1 (no)
AT (1) ATE435480T1 (no)
AU (2) AU2007308415B2 (no)
BR (2) BRPI0709310B1 (no)
CA (2) CA2645618C (no)
DE (1) DE602007001460D1 (no)
DK (2) DK1994530T3 (no)
ES (6) ES2834024T3 (no)
FI (1) FI3848928T3 (no)
HK (2) HK1119824A1 (no)
HU (1) HUE064482T2 (no)
IL (2) IL193786A (no)
MX (2) MX2009004477A (no)
MY (2) MY148715A (no)
NO (3) NO341567B1 (no)
PL (6) PL1994530T3 (no)
PT (5) PT2076901T (no)
RU (2) RU2411645C2 (no)
TW (2) TWI355649B (no)
WO (2) WO2008049589A1 (no)
ZA (2) ZA200810308B (no)

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE50158E1 (en) 2006-10-25 2024-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50132E1 (en) 2006-10-25 2024-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US8160890B2 (en) * 2006-12-13 2012-04-17 Panasonic Corporation Audio signal coding method and decoding method
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
CN101983403B (zh) * 2008-07-29 2013-05-22 雅马哈株式会社 演奏相关信息输出装置、具有演奏相关信息输出装置的系统、以及电子乐器
EP2268057B1 (en) * 2008-07-30 2017-09-06 Yamaha Corporation Audio signal processing device, audio signal processing system, and audio signal processing method
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
EP2359366B1 (en) * 2008-12-15 2016-11-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and bandwidth extension decoder
PL3246919T3 (pl) 2009-01-28 2021-03-08 Dolby International Ab Ulepszona transpozycja harmonicznych
PL3985666T3 (pl) 2009-01-28 2023-05-08 Dolby International Ab Ulepszona transpozycja harmonicznych
TWI458258B (zh) * 2009-02-18 2014-10-21 Dolby Int Ab 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
US8392200B2 (en) 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
US9299362B2 (en) 2009-06-29 2016-03-29 Mitsubishi Electric Corporation Audio signal processing device
CN101958119B (zh) * 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
FR2949582B1 (fr) * 2009-09-02 2011-08-26 Alcatel Lucent Procede pour rendre un signal musical compatible avec un codec a transmission discontinue ; et dispositif pour la mise en ?uvre de ce procede
KR101701759B1 (ko) * 2009-09-18 2017-02-03 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
ES2936307T3 (es) * 2009-10-21 2023-03-16 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
JP5575149B2 (ja) * 2009-11-30 2014-08-20 三菱電機株式会社 分波装置、合波装置および中継装置
UA102347C2 (ru) 2010-01-19 2013-06-25 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
JP5782677B2 (ja) 2010-03-31 2015-09-24 ヤマハ株式会社 コンテンツ再生装置および音声処理システム
CN102971788B (zh) * 2010-04-13 2017-05-31 弗劳恩霍夫应用研究促进协会 音频信号的样本精确表示的方法及编码器和解码器
US9443534B2 (en) 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
ES2942867T3 (es) 2010-07-19 2023-06-07 Dolby Int Ab Procesamiento de señales de audio durante la reconstrucción de alta frecuencia
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
CN101908342B (zh) * 2010-07-23 2012-09-26 北京理工大学 利用频域滤波后处理进行音频暂态信号预回声抑制的方法
US8755460B2 (en) * 2010-07-30 2014-06-17 National Instruments Corporation Phase aligned sampling of multiple data channels using a successive approximation register converter
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
FR2969804A1 (fr) * 2010-12-23 2012-06-29 France Telecom Filtrage perfectionne dans le domaine transforme.
AU2012217216B2 (en) 2011-02-14 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
ES2534972T3 (es) 2011-02-14 2015-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral
CN102959620B (zh) 2011-02-14 2015-05-13 弗兰霍菲尔运输应用研究公司 利用重迭变换的信息信号表示
CA2827000C (en) 2011-02-14 2016-04-05 Jeremie Lecomte Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
SG192746A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for processing a decoded audio signal in a spectral domain
PL3471092T3 (pl) 2011-02-14 2020-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekodowanie pozycji impulsów ścieżek sygnału audio
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
EP2573761B1 (en) 2011-09-25 2018-02-14 Yamaha Corporation Displaying content in relation to music reproduction by means of information processing apparatus independent of music reproduction apparatus
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
JP5494677B2 (ja) 2012-01-06 2014-05-21 ヤマハ株式会社 演奏装置及び演奏プログラム
EP2717262A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
ES2881510T3 (es) 2013-02-05 2021-11-29 Ericsson Telefon Ab L M Método y aparato para controlar la ocultación de pérdida de trama de audio
CN117253498A (zh) 2013-04-05 2023-12-19 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
MX343673B (es) 2013-04-05 2016-11-16 Dolby Int Ab Codificador y decodificador de audio.
US10893488B2 (en) 2013-06-14 2021-01-12 Microsoft Technology Licensing, Llc Radio frequency (RF) power back-off optimization for specific absorption rate (SAR) compliance
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP3291233B1 (en) 2013-09-12 2019-10-16 Dolby International AB Time-alignment of qmf based processing data
EP3767970B1 (en) 2013-09-17 2022-09-28 Wilus Institute of Standards and Technology Inc. Method and apparatus for processing multimedia signals
WO2015060654A1 (ko) 2013-10-22 2015-04-30 한국전자통신연구원 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
KR102244613B1 (ko) * 2013-10-28 2021-04-26 삼성전자주식회사 Qmf 필터링 방법 및 이를 수행하는 장치
WO2015099429A1 (ko) 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치
EP3122073B1 (en) 2014-03-19 2023-12-20 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
KR101856540B1 (ko) 2014-04-02 2018-05-11 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
EP4002359A1 (en) * 2014-06-10 2022-05-25 MQA Limited Digital encapsulation of audio signals
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3107096A1 (en) * 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
WO2017050398A1 (en) 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
MX2018010756A (es) * 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Unidad de ocultamiento de error, decodificador de audio, y método relacionado y programa de computadora que usa características de una representación decodificada de una trama de audio decodificada apropiadamente.
US10770082B2 (en) * 2016-06-22 2020-09-08 Dolby International Ab Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
EP3276620A1 (en) 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
US10224974B2 (en) 2017-03-31 2019-03-05 Microsoft Technology Licensing, Llc Proximity-independent SAR mitigation
TWI681384B (zh) * 2018-08-01 2020-01-01 瑞昱半導體股份有限公司 音訊處理方法與音訊等化器
CN113544774B (zh) * 2019-03-06 2024-08-20 弗劳恩霍夫应用研究促进协会 降混器及降混方法
CN112447166B (zh) * 2019-08-16 2024-09-10 阿里巴巴集团控股有限公司 一种针对目标频谱矩阵的处理方法及装置
EP3786948A1 (en) * 2019-08-28 2021-03-03 Fraunhofer Gesellschaft zur Förderung der Angewand Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar
CN111402917B (zh) * 2020-03-13 2023-08-04 北京小米松果电子有限公司 音频信号处理方法及装置、存储介质
US11632147B2 (en) * 2020-08-13 2023-04-18 Marvell Asia Pte, Ltd. Simplified frequency-domain filter adaptation window
CN114007176B (zh) * 2020-10-09 2023-12-19 上海又为智能科技有限公司 用于降低信号延时的音频信号处理方法、装置及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US351882A (en) 1886-11-02 Thill-coupling
US3666543A (en) * 1969-11-24 1972-05-30 Ludwig Maier Tris-(2-hydroxyalkyl)-phosphine oxide flame retardant articles
WO1990014719A1 (de) 1989-05-17 1990-11-29 Telefunken Fernseh Und Rundfunk Gmbh Verfahren zur übertragung eines signals
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
KR100346734B1 (ko) 1995-09-22 2002-11-23 삼성전자 주식회사 고속분석필터및합성필터를구비한오디오부호화기및복호화기
US5819215A (en) 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
ATE269575T1 (de) 1997-01-27 2004-07-15 Entropic Res Lab Inc Ein system und verfahren zur prosodyanpassung
JP3065067B2 (ja) * 1998-03-04 2000-07-12 韓國電氣通信公社 Mpegオ―ディオ多チャンネル処理用等間隔サブバンド分析フィルタ及び合成フィルタ
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
US6226608B1 (en) 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6510407B1 (en) 1999-10-19 2003-01-21 Atmel Corporation Method and apparatus for variable rate coding of speech
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
JP2002091499A (ja) * 2000-06-14 2002-03-27 Texas Instruments Inc ウインドウ圧縮/伸張方法
EP1199711A1 (en) 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US6996198B2 (en) 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
US6707869B1 (en) 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
SE0101175D0 (sv) * 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US7400651B2 (en) 2001-06-29 2008-07-15 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal
WO2003019533A1 (fr) 2001-08-24 2003-03-06 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation adaptive de composantes de frequence d'un signal
DE10228103A1 (de) 2002-06-24 2004-01-15 Bayer Cropscience Ag Fungizide Wirkstoffkombinationen
ES2259158T3 (es) * 2002-09-19 2006-09-16 Matsushita Electric Industrial Co., Ltd. Metodo y aparato decodificador audio.
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP3876850B2 (ja) 2003-06-02 2007-02-07 ヤマハ株式会社 アレースピーカーシステム
US7563748B2 (en) 2003-06-23 2009-07-21 Cognis Ip Management Gmbh Alcohol alkoxylate carriers for pesticide active ingredients
EP1513137A1 (en) 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
TWI227866B (en) 2003-11-07 2005-02-11 Mediatek Inc Subband analysis/synthesis filtering method
CN100573666C (zh) * 2003-11-26 2009-12-23 联发科技股份有限公司 子带分析/合成滤波方法
CN1270290C (zh) * 2003-11-26 2006-08-16 联发科技股份有限公司 子带分析/合成滤波方法
US20080249765A1 (en) 2004-01-28 2008-10-09 Koninklijke Philips Electronic, N.V. Audio Signal Decoding Using Complex-Valued Data
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
WO2006000020A1 (en) 2004-06-29 2006-01-05 European Nickel Plc Improved leaching of base metals
BRPI0607646B1 (pt) 2005-04-01 2021-05-25 Qualcomm Incorporated Método e equipamento para encodificação por divisão de banda de sinais de fala
US7774396B2 (en) 2005-11-18 2010-08-10 Dynamic Hearing Pty Ltd Method and device for low delay processing
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
USRE50132E1 (en) 2006-10-25 2024-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
TW200922334A (en) 2007-11-02 2009-05-16 Univ Nat Chunghsing Low complexity frequency field motion estimation method adapted to wavelet video coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method

Also Published As

Publication number Publication date
FI3848928T3 (fi) 2023-06-02
PL2109098T3 (pl) 2021-03-08
KR100957711B1 (ko) 2010-05-12
CN101606194B (zh) 2012-06-27
EP4325723B1 (en) 2024-08-28
JP2010507820A (ja) 2010-03-11
AU2007308415B2 (en) 2010-08-26
MX2009004477A (es) 2009-05-13
EP4325723C0 (en) 2024-08-28
HUE064482T2 (hu) 2024-03-28
RU2420815C2 (ru) 2011-06-10
MX2008011898A (es) 2008-11-06
NO20091951L (no) 2009-07-22
US8452605B2 (en) 2013-05-28
BRPI0709310A2 (pt) 2011-07-05
US20130238343A1 (en) 2013-09-12
AU2007308416A1 (en) 2008-05-02
NO20084012L (no) 2009-07-22
PT1994530E (pt) 2009-10-09
EP4207189C0 (en) 2023-11-22
EP4300825A3 (en) 2024-03-20
RU2009119456A (ru) 2010-11-27
EP4325724C0 (en) 2024-08-28
US20100023322A1 (en) 2010-01-28
JP4936569B2 (ja) 2012-05-23
RU2008137468A (ru) 2010-03-27
EP4325724A2 (en) 2024-02-21
PT3848928T (pt) 2023-06-07
EP3288027B1 (en) 2021-04-07
DK3848928T3 (da) 2023-06-19
MY142520A (en) 2010-12-15
DE602007001460D1 (de) 2009-08-13
RU2411645C2 (ru) 2011-02-10
KR20090058029A (ko) 2009-06-08
US8775193B2 (en) 2014-07-08
PT3288027T (pt) 2021-07-07
EP4300824A2 (en) 2024-01-03
BRPI0716315A2 (pt) 2017-05-30
CN101606194A (zh) 2009-12-16
USRE50144E1 (en) 2024-09-24
CN101405791A (zh) 2009-04-08
JP5083779B2 (ja) 2012-11-28
TWI357065B (en) 2012-01-21
EP4300824C0 (en) 2024-08-28
AU2007308416B2 (en) 2010-07-08
IL197976A (en) 2014-03-31
EP3848928A1 (en) 2021-07-14
USRE50009E1 (en) 2024-06-11
PT2076901T (pt) 2017-08-23
EP4300825A2 (en) 2024-01-03
EP4300825B1 (en) 2024-08-28
US20090319283A1 (en) 2009-12-24
EP2076901B1 (en) 2017-05-10
KR101056253B1 (ko) 2011-08-11
MY148715A (en) 2013-05-31
EP3288027A1 (en) 2018-02-28
TW200836166A (en) 2008-09-01
EP4325724A3 (en) 2024-04-17
KR20080102222A (ko) 2008-11-24
BRPI0709310B1 (pt) 2019-11-05
CA2645618C (en) 2013-01-22
CN101405791B (zh) 2012-01-11
US8438015B2 (en) 2013-05-07
JP2009530675A (ja) 2009-08-27
PL3848928T3 (pl) 2023-07-17
NO341610B1 (no) 2017-12-11
CA2667505C (en) 2015-07-07
ATE435480T1 (de) 2009-07-15
USRE50015E1 (en) 2024-06-18
EP3848928B1 (en) 2023-03-15
EP1994530B1 (en) 2009-07-01
ES2631906T3 (es) 2017-09-06
IL193786A (en) 2011-11-30
ES2873254T3 (es) 2021-11-03
PL4207189T3 (pl) 2024-04-08
HK1251073A1 (zh) 2019-01-18
EP2076901B8 (en) 2017-08-16
PL1994530T3 (pl) 2009-12-31
EP4300825C0 (en) 2024-08-28
ES2966657T3 (es) 2024-04-23
PL2076901T3 (pl) 2017-09-29
EP2076901A1 (en) 2009-07-08
EP4207189B1 (en) 2023-11-22
AU2007308415A1 (en) 2008-05-02
TW200837719A (en) 2008-09-16
WO2008049589A1 (en) 2008-05-02
USRE49999E1 (en) 2024-06-04
IL197976A0 (en) 2009-12-24
CA2667505A1 (en) 2008-05-02
USRE50132E1 (en) 2024-09-17
EP4325723A3 (en) 2024-04-17
ZA200902199B (en) 2010-04-28
PL3288027T3 (pl) 2021-10-18
ES2947516T3 (es) 2023-08-10
USRE50157E1 (en) 2024-10-01
NO341567B1 (no) 2017-12-04
ZA200810308B (en) 2009-12-30
PT2109098T (pt) 2020-12-18
EP1994530A1 (en) 2008-11-26
EP2109098A2 (en) 2009-10-14
USRE50054E1 (en) 2024-07-23
EP4300824B1 (en) 2024-08-28
EP4325723A2 (en) 2024-02-21
TWI355649B (en) 2012-01-01
EP4207189A1 (en) 2023-07-05
EP2109098A3 (en) 2017-06-21
AR063400A1 (es) 2009-01-28
HK1119824A1 (en) 2009-03-13
EP4325724B1 (en) 2024-08-28
DK1994530T3 (da) 2009-08-31
NO20170452A1 (no) 2009-07-22
AR063394A1 (es) 2009-01-28
CA2645618A1 (en) 2008-05-02
ES2834024T3 (es) 2021-06-16
EP4300824A3 (en) 2024-03-20
WO2008049590A1 (en) 2008-05-02
USRE50159E1 (en) 2024-10-01
EP2109098B1 (en) 2020-09-09
ES2328187T3 (es) 2009-11-10

Similar Documents

Publication Publication Date Title
NO342691B1 (no) Apparat og fremgangsmåte for å generere audiodelbåndsverdier, samt apparat og fremgangsmåte for å generere tidsdomeneaudiosampler
US9865275B2 (en) Low delay modulated filter bank
KR102068464B1 (ko) 고 주파수 재구성 또는 파라메트릭 스테레오를 위한 복소 지수 변조 필터 뱅크