NO342161B1 - Audiodynamisk prosessering ved bruk av en tilbakestilling - Google Patents

Audiodynamisk prosessering ved bruk av en tilbakestilling Download PDF

Info

Publication number
NO342161B1
NO342161B1 NO20091518A NO20091518A NO342161B1 NO 342161 B1 NO342161 B1 NO 342161B1 NO 20091518 A NO20091518 A NO 20091518A NO 20091518 A NO20091518 A NO 20091518A NO 342161 B1 NO342161 B1 NO 342161B1
Authority
NO
Norway
Prior art keywords
reset
signal
level
dynamics
audio
Prior art date
Application number
NO20091518A
Other languages
English (en)
Swedish (sv)
Other versions
NO20091518L (no
Inventor
Alan Jeffrey Seefeldt
Kenneth James Gundry
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of NO20091518L publication Critical patent/NO20091518L/no
Publication of NO342161B1 publication Critical patent/NO342161B1/no

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/005Control by a pilot signal
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/09Arrangements for device control with a direct linkage to broadcast information or to broadcast space-time; Arrangements for control of broadcast-related services
    • H04H60/11Arrangements for counter-measures when a portion of broadcast information is unavailable
    • H04H60/12Arrangements for counter-measures when a portion of broadcast information is unavailable wherein another information is substituted for the portion of broadcast information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuits Of Receivers In General (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

En audiodynamisk prosessor eller prosesseringsmetode som anvender en nullstillingsmekanisme eller -prosess for raskt å tilpasse seg til innholdsendringer i lydsignalet. Et nullstillingssignal kan genereres ved å analysere selve lydsignalet, eller nullstillingen kan bli trigget fra en ekstern hendelse, så som en kanalendring på en fjernsynsmottaker eller en endring av inngangsvalg på en audio/video-mottaker. Dersom en ekstern trigger anvendes, kan én eller flere indikatorer for tilstanden til dynamikkprosessoren for en gjeldende lydkilde bli lagret og knyttet til denne lydkilden før det skiftes til en ny lydkilde. Dersom systemet senere skifter tilbake til den første lydkilden kan dynamikkprosessoren bli nullstilt til tilstanden lagret tidligere eller en tilnærming til denne. 1

Description

Teknisk område
Oppfinnelsen vedrører behandling av lydsignaler. Spesielt vedrører oppfinnelsen en audiodynamisk prosessor eller prosesseringsmetode som anvender en tilbakestillingsmekanisme eller -prosess for raskt å tilpasse seg til innholdsendringer i lydsignalet. Et tilbakestillingssignal kan bli generert ved å analysere selve lydsignalet, eller tilbakestillingen kan bli trigget fra en ekstern forekomst, så som en kanalendring på en fjernsynsmottaker eller en endring av inngangsvalg på en audio/video-mottaker. Dersom en ekstern trigger anvendes, kan én eller flere indikatorer for tilstanden til dynamikkprosessoren for en gjeldende lydkilde bli lagret og knyttet til denne lydkilden før det skiftes til en ny lydkilde. Hvis systemet senere skifter tilbake til den første lydkilden kan dynamikkprosessoren bli nullstilt til den tidligere lagrede tilstanden eller en tilnærming til denne. Oppfinnelsen vedrører også dataprogrammer for å utføre slike fremgangsmåter eller styre slike anordninger.
Bakgrunn
Et mål med audiodynamisk prosessering er å endre nivået eller dynamikken til et lydsignal til å falle innenfor ønskede grenser. Dette gjøres i alminnelighet ved å danne et tidsvarierende mål for nivået til et lydsignal (for eksempel rms-nivå eller maksnivå) og så beregne og anvende en tidsvarierende signalendring (for eksempel en forsterkningsendring) som er en funksjon av nivåestimatet.
Dynamikkprosessorer som har en slik virkemåte omfatter automatiske forsterkningsregulatorer (AGC – Automatic Gain Controls), dynamiske spektrumkontrollere (DRC – Dynamic Range Controllers), ekspandere, begrensere, støyporter, etc. Forskjellige former for dynamisk signalbehandling er omtalt i den internasjonale patentsøknaden PCT/US 2005/038579 til Alan Jeffrey Seefeldt, publisert som WO 2006/047600 den 4. mai 2006.
JP 2003152483 A beskriver en automatisk nivåkontroll (ALC) krets som kan forkorte en returtid når et høyt signalnivå er påtrykket inngangen, samtidig som forvrengningsytelsen opprettholdes. ALC-kretsen 30 er anordnet med en variabel demper 1, en forsterker 3 for å forsterke et lavfrekvenssignal Vs som har passert gjennom demperen 1, to detektorer 4a, 4b for å detektere et lavfrekvenssignal V1 som er blitt forsterket, en korttidskonstant krets 14 som er ladet med en lavfrekvenssignalspenning V2 som er blitt detektert og en langtidskonstant krets 15 som har en ladningsakselerasjonsbryter 19, en nivåkomparator 17 for å sammenligne ladningsspenningen V2 på kretsen 14 ́s side med en spenning V4 på kretsen 15 ́s side og en tidkretskrets 18 som tillater bryteren 19 å utlade raskt de elektriske ladningene på en kondensator C3.
Kretsen 30 har en tilbakekoblingsstruktur hvor spenningen V3 på kretsen 15 ́s side innmates som et styresignal S for demperen 1.
Figur 1 viser et høynivå blokkdiagram av en generisk audiodynamisk prosessor. Prosessoren kan anses å ha to baner, en øvre “signalbane” 2 og en nedre “styrebane” 4. På den nedre banen måler en dynamikkstyrende prosess eller styreenhet (“dynamikkstyring”) 6 nivået til lydsignalet og genererer én eller flere tidsvarierende modifiseringsparametre som funksjon av det målte nivået. Som vist blir modifiseringsparametrene avledet fra det inngående lydsignalet. Alternativt kan modifiseringsparametrene bli avledet fra den behandlede (utgående) lyden eller fra en kombinasjon av de inngående og utgående lydsignalene. På den øvre audiobanen 2 blir modifiseringsparametrene generert av dynamikkstyringen 6 anvendt på lyden for å generere behandlet lyd.
Anvendelsen av modifiseringsparametrene på et lydsignal kan skje på mange kjente måter, og er vist generisk ved multiplikatorsymbolet 8. For eksempel, for en enkel automatisk forsterkningsreguleringsanordning eller -prosess, kan det være én enkelt bredbånd forsterkningsmodifiseringsparameter som styrer forsterkningen til en anordning eller prosess med variabel forsterkning/tap i hovedbanen. I praksis kan lyden også bli forsinket før anvendelse av modifiseringsparametrene for å kompensere for eventuelle forsinkelser i forbindelse med beregningen av modifiseringsparametrene i dynamikkstyringsprosessen. For å lette presentasjonen er ikke en forsinkelse vist i figur 1 eller andre figurer her.
I en dynamikkstyringsprosess er det vanlig at både signalnivåmålet og de resulterende modifiseringsparametrene blir beregnet kontinuerlig over tid. Videre blir én eller begge av signalnivåmålene og modifiseringsparametrene normalt glattet over tid for å minimere introduksjonen av merkbare artefakter i den behandlede lyden. Glattingen blir som oftest utført med bruk av “rask attack” og “langsom release”, hvilket innebærer at modifiseringsparametrene endrer seg forholdsvis raskt som reaksjon på en økning i signalnivået og reagerer langsommere når signalnivået avtar. Slik glatting er i overensstemmelse med dynamikken til naturlige lyder og hvordan mennesker oppfatter endringer i lydstyrke over tid. Følgelig er slik tidsglatting veldig utbredt i audiodynamiske prosessorer.
I noen anvendelser av dynamikkprosessering kan tidskonstantene for slik glatting være forholdsvis store; i størrelsesorden ett eller flere sekunder. En AGC kan for eksempel beregne et estimat av det langsiktige gjennomsnittsnivået til et signal med bruk av store tidskonstanter og så anvende det resulterende estimatet for å generere langsomtvarierende modifiseringsparametere som flytter lydens gjennomsnittsnivå nærmere et ønsket målnivå. I dette tilfellet kan store tidskonstanter være ønskelig for å bevare den kortsiktige dynamikken i lydsignalet. Anta at en slik AGC jobber på lyden til en fjernsynsmottaker i den hensikt å opprettholde et konsekvent gjennomsnittsnivå på tvers av programinnhold og på tvers av forskjellige kanaler. I et slikt tilfelle kan innholdet i lydsignalet som behandles av AGC’en endre seg brått eller ha en diskontinuitet, for eksempel ved skifte av kanal, og gjennomsnittsnivået til lydsignalet kan derfor også endre seg brått eller ha en diskontinuitet. Med sine store tidskonstanter bruker imidlertid AGC’en betydelig tid på å konvergere til et nytt nivå og bringe det modifiserte nivået til den behandlede lyden til det ønskede målnivået. Under denne tilpasningsperioden kan en som ser på fjernsynet oppleve lydnivået som for høyt eller for lavt. Som følge av dette kan fjernsynsseeren raskt gripe etter fjernkontrollen for å justere volumet – bare for å sloss mot AGC’en mens den konvergerer.
En vanlig løsning i kjent teknikk på problemet beskrevet over omfatter bruk av tidskonstanter som tilpasser seg basert på dynamikken i signalet. Dersom for eksempel det kortsiktige nivået til signalet er betydelig høyere eller lavere enn det glattede nivået som definert av gitte terskelgrenser rundt det glattede nivået, skifter glattingsoperasjonen henholdsvis til raskere attack- og/eller releasetidskonstanter inntil det kortsiktige nivået igjen faller innenfor terskelgrensene rundt det glattede nivået. Senere skifter systemet tilbake til de opprinnelige, langsommere tidskonstantene. Et slikt system kan redusere AGC’ens tilpasningstid, men tersklene og de kortere tidskonstantene må velges med omhu. For alle rimelige terskler kan det generelt eksistere signaler der den opprinnelige, ønskede signaldynamikken fluktuerer utenfor terskelgrensene rundt gjennomsnittsnivået, og således gjør at glattingsprosessen feilaktig skifter til rask attack- eller releasemodus. Som følge av den potensielt hyppige forekomsten av slik feilaktig skifting må ikke tidskonstantene for rask attack- og releasemodus velges for korte, slik at en unngår å gjøre AGC’en ustabil ved normalt programinnhold. Som følge av dette kan konvergensen til AGC’en ved brå overganger eller diskontinuiteter i lydinnholdet fortsatt ikke være så rask som ønsket.
Det er derfor et mål med foreliggende oppfinnelse å tilveiebringe en bedre løsning på problemet med dynamikkprosesseringens tilpasningstid når lydinnhold endrer seg.
Beskrivelse av oppfinnelsen
Ifølge et aspekt ved oppfinnelsen omfatter en fremgangsmåte for behandling av et lydsignal (eller en anordning som utfører fremgangsmåten) det å endre dynamikken i lydsignalet i henhold til en dynamikkstyringsprosess, detektere en endring av innholdet i lydsignalet og tilbakestilling av dynamikkstyringsprosessen som reaksjon på at en slik endring detekteres. Det å detektere en endring av innholdet i lydsignalet kan omfatte én eller begge av å (1) detektere en forekomst i tidsutviklingen av lydsignalet der lydsignalets nivå holder seg under en terskel, Lsilence, over et tidsintervall som ikke er kortere enn en første tidsterskel, tsilence, og (2) detektere en forekomst i tidsutviklingen av lydsignalet der lydsignalets nivå avtar med en mengde som er større enn en differanseterskel, Ldrop, innenfor et tidsintervall som ikke er større enn en andre tidsterskel, tdrop.
Ifølge et annet aspekt ved oppfinnelsen omfatter en fremgangsmåte for behandling av et lydsignal (eller en anordning som utfører fremgangsmåten) det å endre dynamikken i lydsignalet i henhold til en dynamikkstyringsprosess, motta et eksternt forsynt tilbakestilling-triggersignal som angir en endring i lydsignalet, og tilbakestilling av dynamikkstyringsprosessen som reaksjon på tilbakestillingtriggersignalet. Tilbakestilling-triggersignalet kan angi én eller flere av (1) at en bruker endrer kanal, (2) at en bruker endrer inngangskilder, (3) at en bruker velger en avspillings-, tilbake- eller fremoverspolingsfunksjon, (4) skifte fra én fil til en annen, (5) en programendring, (6) skifte fra ett lydkodingsformat til et annet, og (7) en endring i kodingsparametre.
I henhold til begge de ovennevnte aspekter kan tilbakestilling av dynamikkstyringsprosessen øke hastigheten med hvilken dynamikkprosesseringen tilpasser seg til endringer i inngangssignalet.
Tilbakestillingen av dynamikkstyringsprosessen kan sette verdien til én eller flere prosess-styrende parametre, eller et signal som én eller flere av disse prosessstyrende parametere er en funksjon av, til en lagret verdi eller en forhåndsbestemt verdi. Tilbakestilling av dynamikkstyringsprosessen kan redusere verdien til én eller flere tidskonstanter som anvendes ved bestemmelse av én eller flere prosess-styrende parametere eller et signal som disse én eller flere prosessstyrende parametrene er en funksjon av.
Selv om tilnærmingen med adaptive tidskonstanter beskrevet over til en viss grad kan være nytting for å redusere tilpasningstiden til en audiodynamisk prosessor eller prosess og kan anvendes sammen med aspekter ved foreliggende oppfinnelse, kan en slik prosessor eller prosess forbedres betydelig ved at den utvides med en eksplisitt tilbakestillingsmekanisme eller -prosess som blir aktivert ved forekomst av bestemte brå endringer eller diskontinuiteter i innholdet i lydsignalet som behandles. Figur 2 viser foreliggende oppfinnelse i en generell form der en ytterligere styrebane, en tilbakestilling-styrebane 10, er lagt til den generiske dynamikkprosessoren i figur 1. En tilbakestillingsstyremekanisme eller -prosess (“Tilbakestillingskontroll”) 12 kan reagere på den ene eller begge av lydsignalene selv (det inngående lydsignalet eller en kombinasjon av det inngående og det utgående lydsignalet) og et eksternt triggersignal. Følgelig er det tre mulige utførelser: (1) lydsignalet selv (som igjen kan omfatte det inngående lydsignalet eller en kombinasjon av det inngående og det utgående lydsignalet), (2) et eksternt triggersignal og (3) både lydsignalet selv og et eksternt triggersignal. Dersom en beslutning om tilbakestilling tas av tilbakestillingskontrollen 12, sender tilbakestillingsstyremekanismen eller -prosessen en tilbakestillingsmelding til dynamikkstyringen 6, som instruerer den til tilbakestilling av bestemte aspekter ved sin dynamikkstyringstilstand på en måte som gjør at den audiodynamiske prosesseringen raskt kan tilpasse seg til det nye nivået til det innkommende lydsignalet. Tilbakestillingen av bestemte aspekter ved dynamikkstyringstilstanden kan for eksempel (1) sette én eller flere tidskonstanter til en kortere verdi for en kort tidsperiode (og med det øke lydbehandlingens tilpasningshastighet) og/eller (2) sette et glattet mål for lydsignalnivået eller én eller flere modifiseringsparametere til en lagret verdi eller til en gjennomsnitts- eller forhåndsbestemt verdi.
Analyse av lydsignalet for å bestemme forekomst av en brå endring eller diskontinuitet i signalinnhold
En tilbakestillingsbeslutning kan bli tatt av tilbakestillingskontrollen 12 på en rekke forskjellige måter, for eksempel ved å analysere det innkommende lydsignalet eller ved å motta et eksternt tilbakestilling-triggersignal. Ved analyse av lydsignalet søker tilbakestillingskontrollen 12 å detektere forhold i signalet som tyder på en brå endring eller diskontinuitet i innholdet. Når den oppdager et slikt forhold med en gitt grad av sikkerhet, tar tilbakestillingskontrollen 12 en tilbakestillingsbeslutning og instruerer deretter dynamikkstyringen 6 til tilbakestilling av ett eller flere aspekter ved sin dynamikkstyringstilstand. Selv om andre metoder kan anvendes for å detektere brå endringer eller diskontinuiteter i signalinnhold, er to praktiske og virkningsfulle eksempler for å gjøre dette beskrevet nedenfor.
Bruk av en ekstern trigger for å fastslå forekomst av en brå endring eller diskontinuitet i signalinnhold
I mange anvendelser kan meget pålitelig ekstern informasjon være tilgjengelig for å trigge en tilbakestilling. For eksempel, i en fjernsynsmottaker eller ”kabeldekoder”, kan det at en bruker endrer kanal tjene som en ekstern tilbakestillingstrigger. I en fjernsynsmottaker eller audio/video-mottaker kan videre det at en bruker endrer inngangskilde, for eksempel fra “Video 1” til “Video 2”, tjene til å trigge en tilbakestilling. Andre eksempler omfatter en filbasert mediaspiller, for eksempel en bærbar lydanordning eller en digital videoopptaker. I slike tilfeller kan en tilbakestilling bli trigget eksternt når systemet avslutter avspilling av én fil og skifter til en annen. En tilbakestilling kan også bli trigget når en bruker selv eksplisitt endrer filer, trykker på ”avspill” eller spoler forover eller bakover til et nytt sted i et gitt innhold. Dersom lyden som behandles er dekodet fra en komprimert strøm av digitale data, for eksempel Dolby Digital audio, kan det finnes andre kilder for et eksternt tilbakestilling-triggersignal. “Dolby” og “Dolby Digital” er varemerker eiet av Dolby Laboratories Licensing Corporation. For eksempel er kodingssystemet Dolby Digital audio det obligatoriske lydformatet for High Definition Television i USA. På en gitt programkanal blir lyden sendt kontinuerlig, men Dolby Digital-formatet kan endre seg ved programgrenser. For eksempel kan hovedprogrammet være innkodet i kanalformatet 5.1, men et reklameinnslag kan være innkodet i stereoformat. En Dolby Digital-dekoder vil nødvendigvis detektere slike endringer og kan videresende informasjonen til den audiodynamiske prosessoren ifølge foreliggende oppfinnelse som en tilbakestillingstrigger. Andre endringer i kodingsparametere kan også anvendes, for eksempel endringer i Dolby Digitals dialognormaliseringsparameter, “DIALNORM”, som i alminnelighet holdes konstant for et gitt innhold. En tilsvarende ekstern tilbakestillingstrigger kan også bli generert fra andre lydkodingsformater, så som MP3 og AAC. I tillegg til de ovenfor angitte kildene for eksterne tilbakestillingstriggere er andre mulige, og oppfinnelsen er ikke ment begrenset til de som er nevnt.
Dersom oppfinnelsen blir anvendt i en anordning der lyden kan komme fra et sett av kjente kilder, kan oppfinnelsen forbedres ytterligere som vist i figur 3. Langs bunnen av figuren er det vist N lydkilder (“Lydkilde 1” til “Lydkilde N”) 14-1 til 14-N, der det er forutsatt at én av de N lydkildene er valgt for avspilling gjennom dynamikkprosesseringssystemet ved hjelp av en kildevalganordning eller -prosess (“Kildevelger”) 16. Disse lydkildene kan representere, men er ikke begrenset til forskjellige kanaler på et fjernsyn eller en dekoderboks, de forskjellige inngangene på en audio/video-mottaker eller forskjellige filer på en bærbar mediaspiller. Med hver lydkilde er det lagret indikatorer for tilstanden til ett eller flere aspekter ved dynamikkstyringsprosessen som den var forrige gang den aktuelle lydkilden ble spilt av. Slike aspekter ved tilstanden til dynamikkstyringen kan for eksempel omfatte én eller flere av (1) det glattede målet for lydsignalnivået, (2) én eller flere modifiseringsparametere fremkommet fra det glattede målet for lydsignalnivået og (3) én eller flere av tidskonstantene anvendt for å frembringe et glattet mål for lydsignalnivået. I et utførelseseksempel beskrevet nedenfor anvendes det glattede målet for lydsignalnivået, som indirekte påvirker forsterkningsmodifiseringsparameteren (i eksempelet er forsterkning en funksjon av det glattede lydsignalnivået). Når en annen lydkilde blir valgt gjennom kildevalgprosessen, før det faktisk skiftes til den nye lydkilden, sender kildevelgeren 16 en ekstern tilbakestillingstrigger til tilbakestillingskontrollen 12’. Dette gjør i sin tur at tilbakestillingskontrollen 12’ fanger opp indikatorer for den gjeldende tilstanden til dynamikkstyringsprosessen for lydkilden som spilles av. Tilbakestillingskontrollen 12’ lagrer da indikatorer for dynamikkstyringstilstanden i de N dynamikkstyringstilstand-lagringsstedene for det gjeldende lydvalget (Dynamikkstyringstilstand-lagrene 1 til N) 18-1 til 18-N. Deretter skifter kildevalget 16 til den nye lydkilden og sender de tilhørende lagrede indikatorene for dynamikkstyringstilstanden til tilbakestilling-styreprosessen, som i sin tur tilbakestiller dynamikkstyringsprosessen ved hjelp av de lagrede tilstandsindikatorene.
Ved å anvende aspekter ved den siste dynamikkstyringstilstanden til en lydkilde for tilbakestilling av dynamikkstyringsprosessen når det skiftes til denne kilden kan en oppnå en bedre ytelse enn uten bruk av en slik initialtilstand. Uten denne informasjonen er dynamikkstyringsprosessen avhengig av det innkommende lydsignalet etter tilbakestillingen når det tilpasser seg til den nye lydkilden. På kort sikt kan lydens nivå fluktuere raskt, og følgelig kan også modifiseringsparametrene fluktuere raskt mens dynamikkstyringsprosessen forsøker å tilpasse seg raskt til den nye lyden. Ved at en anvender aspekter ved den siste tilstanden til dynamikkprosessoren for lydkilden til tilbakestilling av dynamikkprosessoren er det sannsynlig at dynamikkprosessoren vil begynne i en tilstand som er nærmere den tilstanden den til slutt vil konvergere mot for denne lydkilden. Som følge av dette trenger ikke de raske tilpasningstidskonstantene etter tilbakestilling å reduseres like mye som ellers vil kunne være nødvendig, slik at en oppnår bedre stabilitet uten å øke den totale tilpasningstiden. Som et eksempel, betrakt et skifte mellom to fjernsynsstasjoner, den første med lyd med et gjennomsnittlig nivå på –15 dB i forhold til fullskala digital og den andre med lyd med et gjennomsnittlig nivå på –30 dB, begge med et variasjonsområde på pluss/minus 5 dB rundt sine respektive gjennomsnittsnivåer. Anta at gjennomsnittsnivået til den første stasjonen umiddelbart før skifte til den andre stasjonen er –13 dB. Anta videre at gjennomsnittsnivået til den andre stasjonen er –33 dB etter skiftet. Dette er en forskjell på –20 dB. Dersom en for eksempel ønsker at det dynamiske prosesseringssystemet skal tilpasse seg på et halvt sekund, er en tilpasningshastighet på –40 dB per sekund nødvendig ved fravær av annen informasjon. En slik hastighet er nokså høy og vil kunne introdusere ustabiliteter i den behandlede lyden. Anta på den annen side at den siste dynamikkprosesseringstilstanden lagret med den andre stasjonen svarer til et nivå på –28 dB. Etter tilbakestilling kan dynamikkstyringsprosessen bli nullstilt med denne tilstanden, og det er da en differanse på bare –33 dB – (-28 dB) = -5 dB. Følgelig er en tilpasningshastighet på kun –10 dB per sekund (noe som krever mindre reduksjon av tidskonstanten) nødvendig for å konvergere til det ønskede nivået i løpet av et halvt sekund. Dette eksempelet illustrerer fordelene med å lagre den siste tilstanden til dynamikkstyringsprosessen med lydkilden som resulterte i denne tilstanden.
Virkningen etter at tilbakestilling blir trigget
Trigging av en tilbakestilling øker tilpasningshastigheten i den audiodynamiske prosesseringen (hastigheten med hvilken dynamikkprosesseringen tilpasser seg til endringer i inngangssignalet). For eksempel, når en tilbakestilling blir trigget, kan én eller flere tidskonstanter knyttet til tilpasningshastigheten raskt skifte til betydelig lavere verdier og så på en glatt måte returnere til sine opprinnelig store verdier over en forutbestemt tidsperiode. Alternativt kan den ene eller de flere tidskonstantene skifte til betydelig lavere verdier og beholde disse verdiene for en forutbestemt tidsperiode. I en AGC-anordning kan et tidskonstant-styresignal c[t] forbigående redusere tidskonstantene som anvendes ved beregning av det glattede gjennomsnittsnivået. For eksempel kan glattingstidskonstantene bli redusert over en varighet på omtrent ett sekund etter en tilbakestilling. I ett utførelseseksempel kan tidskonstant-styresignalet c[t] begynne med verdien “1” (som angir en maksimal endringseffekt på én eller flere tidskonstanter) ved forekomst av en tilbakestillingstrigger; når dette signalet er lik “1”, blir attack- og releasekoeffisientene satt til verdier som er betydelig lavere enn deres nominelle verdier. Etter hvert som c[t] avtar til null over en kort tidsperiode, for eksempel ett sekund (varigheten av tidsperioden er ikke avgjørende), blir koeffisientene interpolert tilbake til deres nominelle, normale (ikke nullstilte) verdier. Alternativt eller i tillegg, ved forekomst av en tilbakestillingstrigger, kan verdien til et glattet gjennomsnittsnivå beregnet av dynamikkstyringsprosessen bli nullstilt til en tilstand lagret med en gitt lydkilde, eller til en forhåndsbestemt verdi.
Foreliggende oppfinnelse er særlig egnet til å tilveiebringe en fremgangsmåte for behandling av et lydsignal, omfattende:
å styre dynamikken til lydsignalet ved hjelp av en dynamikkstyringsprosess eller kontroller, hvor nevnte dynamikkstyringsprosess eller kontroller utjevner signalnivået til lydsignalet og / eller en dynamikk-forsterknings modifikasjonsparameter med et utjevningsfilter som anvender en adaptiv tidskonstant β, å detektere en første type forekomst i en tidsmessige utviklingen av lydsignalet hvor lydsignalets nivå reduseres med en mengde som er større enn en forskjells terskel Ldrop, innenfor et tidsintervall som ikke er større enn en andre tidsterskel, tdrop, hvor nevnte deteksjon detekterer reduksjonen i nivået av lydsignalet i en flerhet av frekvensbånd, å detektere en andre type forekomst i den tidsmessige utviklingen av lydsignalet hvor lydsignalnivået forblir under en terskel Lsilence, gjennom et tidsintervall som ikke er kortere enn en første tidsterskel, tsilence og å tilbakestille, ved hjelp av en eksplisitt tilbakestillings-mekanisme eller -prosess, styringen av dynamikkstyringsprosessen av lydsignalet som svar på deteksjon av enten den første type forekomst eller den andre type forekomst, hvor tilbake-stillingen av styringen av dynamikkstyringsprosessen inkluderer å sette utjevnings- filtertidskonstanten til en forutbestemt verdi βfast, å interpolere tidskonstanten β tilbake til en verdi βslow over en forutbestemt tidsperiode etter tilbakestillingen, βfast, som er en raskere tidskonstant enn βslow.
Videre er foreliggende oppfinnelse egnet til å tilveiebringe et apparat for behandling av et lydsignal, omfattende:
en innretning for å styre dynamikken til lydsignalet ved hjelp av en dynamikkstyringsprosess eller kontroller, hvor nevnte dynamikkstyringsprosess eller kontroller utjevner signalnivået til lydsignalet og / eller en dynamikk forsterknings-endringsparameter med et utjevningsfilter som anvender en adaptiv tidskonstant β, innretning for å detektere en første type forekomst i den tidsmessige utviklingen av lydsignalet hvor lydsignalets nivå reduseres med en mengde som er større enn en differensgrense, Ldrop, innenfor et tidsintervall som ikke er større enn en andre tidsterskel, tdrop, hvor nevnte innretning for deteksjon detekterer reduksjonen i nivået av lydsignalet i en flerhet frekvensbånd, deteksjon av en andre type forekomst i den tidsmessige utviklingen av lydsignalet hvor lydsignalnivået forblir under en terskel, Lsilence, gjennom et tidsintervall som ikke er kortere enn en første tidsterskel, tsilence og innretning for tilbake-stilling ved hjelp av en eksplisitt tilbake-stillings-mekanisme eller -prosess, styring av dynamikkstyringsprosessen som svar på deteksjon av enten den første typen forekomst eller den andre type forekomst, hvor nevnte innretning for tilbake-stilling av styringen av dynamikkstyringsprosessen innbefatter innretning for å sette utjevningsfiltertidskonstanten til en forutbestemt verdi βfast, innretning for interpolering av tidskonstanten β tilbake til en verdi βslow over en forutbestemt tidsperiode etter tilbake-stillingen, βfast, som er en raskere tidskonstant enn βslow.
Beskrivelse av figurene
Figur 1 er et skjematisk funksjonsblokkdiagram som viser, på et høyt nivå, en generisk audiodynamisk prosessor.
Figur 2 er et skjematisk funksjonsblokkdiagram som viser, i henhold til aspekter ved foreliggende oppfinnelse, et eksempel på en utførelse av foreliggende oppfinnelse der, i en generell form, en ytterligere styrebane, en tilbakestillingskontrollbane, er lagt til i den generiske dynamiske prosessoren i figur 1.
Figur 3 er et skjematisk funksjonsblokkdiagram som viser, i henhold til aspekter ved foreliggende oppfinnelse, et eksempel på en utførelse av foreliggende oppfinnelse der en audiodynamisk prosessor er forbedret ytterligere.
Figur 4 viser et eksempel på inn/ut-funksjon for en vanlig automatisk forsterkningsregulator (AGC).
Figur 5 viser et sett av båndpass-frekvensresponser valgt slik at de likner den kritiske båndfiltreringen som observeres langs basilarmembranen i menneskeøret.
Figur 6 er et skjematisk funksjonsblokkdiagram som viser, i henhold til aspekter ved foreliggende oppfinnelse, et eksempel på en AGC-basert utførelsesform av foreliggende oppfinnelse.
Beste måte å realisere oppfinnelsen
Den beskrevne oppfinnelsen kan anvendes i en rekke forskjellige dynamikkprosesseringsapplikasjoner, så som dynamisk spektrumkontroll, kompressorer, begrensere, ekspandere, etc. Den er imidlertid spesielt nyttig når den anvendes med en AGC, der typisk store tidskonstanter resulterer i langsom tilpasning når foreliggende oppfinnelse ikke anvendes. Følgelig beskriver den foretrukne utførelsesformen, som et eksempel, anvendelse av oppfinnelsen med en AGC.
Grunnleggende AGC-basert utførelse
En grunnleggende utførelse av en AGC beregner et tidsvarierende estimat av et signals gjennomsnittsnivå og beregner et ønsket modifisert utgangsnivå som er en funksjon av inngangsnivået og et ønsket målnivå. En tidsvarierende signalmodifikasjon kan så bli beregnet som funksjon av differansen mellom inngangsnivået og det ønskede utgangsnivået. Funksjonen som avbilder inngangen til utgangen er innrettet for å bringe nivået til den modifiserte lyden nærmere det ønskede målnivået, og figur 4 viser én slik inn/ut-funksjon. For en inngang som er høyere enn målnivået, beordrer AGC’en signaldempning, og for en inngang som er lavere enn målnivået, beordrer AGC’en signaløkning. Graden av dempning eller økning kan styres ved å variere stigningen til linjen i figur 4.
Ideelt sett bør målet som anvendes for å beregne lydens gjennomsnittsnivå samsvare med menneskets oppfatning av lydstyrke. Dette kan oppnås på mange måter; for eksempel av et vektet middelkvadratmål eller et psykoakustisk lydstyrkemål. Et enkelt, ikke-vektet middelkvadratmål er noe mindre nøyaktig enn de to metodene nevnt over, men gir likevel en høy grad av samsvar med menneskets lydstyrkeoppfatning for de fleste fysisk relevante lydsignaler. Som følge av dens beregningsmessige enkelhet anvendes et ikke-vektet middelkvadratmål i en foretrukket utførelsesform, men dette skal ikke forstås som en begrensning av oppfinnelsen.
Selv om, i prinsippet, aspekter ved oppfinnelsen kan realiseres i det analoge og/eller digitale domenet, vil utførelser trolig i praksis bli realisert i det digitale domenet der hvert av lydsignalene er representert av enkeltstående sampler eller sampler innenfor datablokker. Estimatet av inngangsnivået og det tilhørende ønskede utgangsnivået og signalmodifiseringsparametrene kan bli beregnet kontinuerlig for et analogt lydsignal eller for hvert sample av et digitalt signal, men i dette utførelseseksempelet er det i stedet ønskelig å beregne disse størrelsene for etterfølgende, overlappende blokker av sampler av et digitalt lydsignal. Dette er hovedsaklig som følge av det faktum at behandling av digitale blokker er nyttig for å detektere tilbakestillingsbetingelser fra selve signalet, som beskrevet nedenfor. Med det digitale lydsignalet representert ved x[n] kan de overlappende blokkene i lydsignalet beregnes som:
der N er blokklengden, N/2 er graden av overlapp mellom etterfølgende blokker, t er blokkindeksen og w[n] er en vindusfunksjon, for eksempel et sinusvindu. For signaler samplet med en frekvens på 44100 Hz, fungerer valg av N=512 eller N=1024 greit. Ytterligere detaljer ved en digital lydbehandlingsanordning som anvender overlappende blokker av sampler er gitt i U.S.-patentet 5,899,969 til Fielder m.fl. (“Frame-based audio with gain-control words”), som med dette inntas som referanse i sin helhet. Som beskrevet nedenfor beregner AGC’en en tidsvarierende forsterkning G[t ] som så blir multiplisert med hver blokk av signalet. Hver av disse modifiserte blokkene blir så overlapp-addert for å generere det endelige modifiserte lydsignalet y[n� tN /2 ] :
Som et første trinn i beregningen av forsterkningen G[t ] blir det tidsvarierende øyeblikksnivået til signalet L[t] beregnet som middelkvadratet av hver blokk x[n, t ] . I desibel blir nivået beregnet som:
(3)
der 0 dB svarer til nivået til en fullskala digital kvadratbølge.
Deretter kan øyeblikksnivået i glattet med en rask attakk og en langsom release for å generere et glattet gjennomsnittsnivå for lydsignalet, L[t ] :
der
og
(4c)
Glattingskoeffisientene α attack og α release velges slik en å oppnår de ønskede attack- og releasetidene. Én måte å spesifisere dette er glattingsfilterets halveringstid, dvs. tiden det tar før tidsglattingsfilterets impulsrespons er redusert til halvparten av sin opprinnelige verdi. Selv om valg av α attack svarende til en halveringstid på 1 sekund og α release svarende til en halveringstid på 4 sekunder fungerer godt for en AGC, er ikke disse verdiene kritiske. Verdien L min i likning 4a representerer et minimumsnivå som signalets øyeblikksnivå L[t ] må overstige for at det glattede nivået skal bli oppdatert. Dette hindrer at det glattede gjennomsnittsnivået faller for lavt, og at den tilhørende forsterkningen blir for høy når signalet faller inn i relativ stillhet. Antatt at 0 dB representerer nivået til en fullskala digital kvadratbølge, er dB et rimelig valg, selv om nivået ikke er avgjørende.
Fra det glattede gjennomsnittsnivået L[t ] og AGC’ens inn/ut-funksjon F AGC , som vist i figur 4, beregnes det ønskede utgangsnivået
Endelig blir forsterkningen G[t ] beregnet fra differansen mellom utgangsnivået Lout[t ] og inngangsnivået L[t ] :
[ ]
(6)
Når Lout[t ] >L[t ] , er forsterkningen større enn én, hvilket betyr at signalet økes, og når Lout[t ] <L[t ] er forsterkningen mindre enn én, hvilket betyr at signalet dempes.
AGC med tilbakestilling
Som nevnt over kan tilbakestillingsmekanismen eller -funksjonen forårsake én eller begge av to handlinger: (1) at én eller flere tidskonstanter settes til en kortere varig verdi for en kort tidsperiode (og dermed øke tilpasningshastigheten i lydbehandlingen) og (2) at et glattet mål for lydsignalnivået eller én eller flere modifiseringsparametere settes til en lagret verdi eller til en gjennomsnitts- eller forhåndsbestemt verdi, som kan være uttrykt som L init (se ligning 8a nedenfor og beskrivelsen før og etter denne likningen). Først vil tilbakestilling av én eller flere tidskonstanter bli beskrevet.
Siden modifiseringsparameteren, forsterkningenG[t ] , er en funksjon av det glattede gjennomsnittsnivået L[t ] er hastigheten med hvilken den beskrevne AGC’en tilpasser seg til lyden styrt av attack- og releasetidene anvendt ved beregning av L[t ] . Som angitt over blir disse glattingstidskonstantene valgt forholdsvis store, i størrelsesorden flere sekunder, slik at AGC’en ikke endrer lydens nivå for raskt under tidsutviklingen av normalt lydinnhold. Dersom imidlertid lydinnholdet endrer seg brått eller har en diskontinuitet, kan AGC’en bruke for lang tid på å tilpasse seg, spesielt dersom det nye innholdet har et nivå som avviker betydelig fra det tidligere innholdet. For å gjøre tilpasningen raskere kan tilbakestillingssignalet beskrevet over anvendes for å trigge en modifikasjon av én eller flere av tidskonstantene knyttet til nivåglattingen. I så fall, når en tilbakestilling trigges, skifter tidskonstantene raskt til betydelig lavere verdier, og returnerer så gradvis kontinuerlig til sine opprinnelige store verdier (eller tilnærminger til disse) over en forutbestemt tidsperiode. Andre metoder for å øke tilpasningshastigheten etter at en tilbakestilling er trigget er mulig. For eksempel, i stedet for at de gradvis kontinuerlig returnerer til sine opprinnelige verdier eller tilnærminger til disse, kan tidskonstantene bli holdt ved sine lavere verdier over en forutbestemt tidsperiode og så bli tilbakeført direkte til sine opprinnelige verdier eller tilnærminger til disse. En annen mulighet er å sørge for en stegvis tilbakeføring av tidskonstantene over en forutbestemt tidsperiode. Oppfinnelsen er ikke begrenset med hensyn til hvordan tidskonstantene tilbakeføres til sine opprinnelige verdier eller en tilnærming til disse.
For å trigge en tilbakestilling kan det forefinnes et binært tilbakestillingssignal R[t ] , for eksempel R[t ] =0 under normal operasjon og R[t ] =1 når tilbakestilling er ønsket ved tidsblokk t. Tilbakestillingen kan trigges ved å analysere lydsignalet eller av en ekstern kilde, som beskrevet over. Detaljer ved eksempler på trigging av en tilbakestilling gjennom signalanalyse er beskrevet nedenfor. Dersom en ekstern trigger anvendes, kan det eksistere en lagret tilstand som dynamikkprosessen kan bli nullstilt til, som vist i figur 3. For den beskrevne foretrukne utførelsesformen kan en slik lagret tilstand bestå av verdien til det glattede gjennomsnittsnivået L[t ] ved den siste tidsblokken hvor en gitt lydkilde ble behandlet. Den initielle tilstanden, hentet frem fra et lager under en eksternt trigget tilbakestilling (eller alternativt kan en initiell tilstand være en forhåndsbestemt verdi uansett om en eksternt trigget tilbakestilling anvendes), kan være representert ved verdien L init .
Fra det binære tilbakestillingssignalet R[t ] kan et tidskonstant styresignal bli generert og deretter anvendt for midlertidig å redusere tidskonstantene som anvendes for å beregne det glattede gjennomsnittsnivået L[t ] , og med det øke tilpasningshastigheten i behandlingen. Et tidskonstant styresignal c[t ] kan bli beregnet slik at det er lik “1” idet en tilbakestilling inntreffer (R[t ] =1) og så avtar eksponentielt til “0” med en rate styrt av en reduksjonskoeffisient λ < 1 :
ellers
Reduksjonskoeffisienten λ kan for eksempel velges slik at en får en halveringstid på ett sekund, hvilket innebærer at glattingstidskonstantene blir redusert over en varighet på omtrent ett sekund etter en tilbakestilling. Merk også at styresignalet vil kunne bli oppdatert bare dersom signalnivået L[t ] ≥ L min for å hindre at rask tilpasning skjer under relativ stillhet.
Heller enn å anvende faste attack- og releasekoeffisienter for å glatte signalnivået, som vist i likning 4b, kan koeffisientene nå variere over tid som funksjon av det tidskonstante styresignalet c[t ] . Når c[t ] =1, hvilket betyr at en tilbakestilling akkurat har funnet sted, kan attack- og releasekoeffisientene bli satt lik verdier som er betydelig lavere enn verdiene α attack og α release fra likning 4b (for eksempel omtrent ti prosent av de opprinnelige verdiene eller lavere). Etter hvert som c[t ] så avtar til ”0” kan koeffisientene bli interpolert tilbake til sine nominelle verdier α attack og α release . Eventuelt vil i tillegg de lave koeffisientverdiene som anvendes umiddelbart etter en tilbakestilling også kunne variere avhengig av hvorvidt det eksisterer en initiell tilstandsverdi L init . Dersom det ikke finnes noen lagret initialtilstand kan en anvende veldig lave koeffisientverdier, og dersom det eksisterer en lagret initialtilstand kan en anvende litt høyere koeffisientverdier. I sistnevnte tilfelle er det forutsatt at initialiseringen av L[t ] med L init begynner L[t ] med en verdi som nærmere den verdien som den til slutt vil konvergere til. En kan derfor anvende en litt langsommere tilpasningstid, svarende til større koeffisienter, sammenliknet med tilfellet der ingen initialtilstand er tilgjengelig. Den adaptive glattingsprosessen kan uttrykkes som:
ellers
der
og
Verdiene β afast og β rfast representerer de initielle attack- og releaseglattingskoeffisientene umiddelbart etter en tilbakestilling når ingen initialtilstand, L init , er tilveiebragt. Verdier svarende til halveringstider på henholdsvis 50 millisekunder og 200 millisekunder er funnet anvendelige. De konkrete verdiene er ikke avgjørende. Verdiene β aslow og β rslow representerer de høyere initielle attackog release-glattingskoeffisientene umiddelbart etter en tilbakestilling når initialtilstand, L init , er tilveiebragt. I dette tilfellet er verdier svarende til halveringstider lik to ganger de til deres raske motparter; henholdsvis 100 millisekunder og 400 millisekunder, funnet å være anvendelige. Heller ikke i dette tilfellet er de konkrete verdiene avgjørende.
Tilbakestillingsdeteksjon gjennom signalanalyse Den mest pålitelige måten å trigge en tilbakestilling i den beskrevne oppfinnelsen er å motta en trigger eksternt fra en mekanisme eller prosess som en vet er direkte knyttet til endring i lydinnhold. Flere slike mekanismer er omtalt tidligere; for eksempel en kanalendring på en fjernsynsmottaker eller en endring av inngangsvalg på en audio/video-mottaker. I mange tilfeller er imidlertid ingen slike eksterne mekanismer tilgjengelig, og derfor må systemet anvende analyse av selve lydsignalet for å avgjøre om en tilbakestilling skal trigges. Anta for eksempel at den beskrevne oppfinnelsen er realisert i en fjernsynsmottaker som en bruker har koblet en ekstern kabeldekoderboks til. Kabeldekoderboksen har ansvar for avstemning til og endring av kanaler, og den dekodede lyden blir bare videresendt til fjernsynet som en kontinuerlig lydstrøm. Fjernsynet mottar derfor ingen eksplisitt informasjon om når en ny kanal er valgt. Den eneste informasjonen tilgjengelig er den som kan avledes fra lydstrømmen det mottar.
En forholdsvis enkel, men effektiv måte å trigge en tilbakestilling gjennom signalanalyse er å detektere en forekomst i tidsutviklingen av lydsignalet der nivået til lydsignalet holder seg under en terskel, Lsilence, over en minimumsperiode (et tidsintervall som ikke er kortere enn en tidsterskel tsilence). Med andre ord detektere et tidsrom med relativ stillhet av en varighet som i hvert fall er like lang som et forutbestemt terskeltidsintervall. En slik forekomst indikerer trolig en brå endring eller diskontinuitet i lydens innhold. Mange anordninger, spesielt kabeldekoderbokser, demper lydsignalet for en kort tidsperiode når lydkilden endres. Denne dempningen reduserer lydsignalet til et nivå som er langt lavere enn det en i alminnelighet ser i normalt lydinnhold. For digital lyd, for eksempel, kan den redusere samplene av signalet til null. Slike forhold i signalets tidsutvikling kan oppdages gjennom analyse av det kortsiktige nivået L[t ] omtalt over. Dersom L[t ] holder seg lavere enn en terskel L silence over et tidsintervall av en varighet på i hvert fall t silence , kan en tilbakestilling bli trigget. Denne tilnærmingen kan uttrykkes som:
der et stillhetstellersignal s[t ] blir oppdatert i henhold til:
Antatt at 0 dB svarer til nivået til en fullskala digital kvadratbølge, fungerer for eksempel innstillingen L silence lik -90 dB godt i praksis, selv om nivået ikke er avgjørende. Å sette t silence til en tidsperiode på 0,25 sekunder, for eksempel, er et rimelig valg for mange anvendelser, selv om tidsperioden ikke er avgjørende.
I noen tilfeller blir det ikke innledet en pause med relativ stillhet når lydinnholdet endrer seg brått eller har en diskontinuitet, og derfor vil ikke metoden over nødvendigvis trigge en tilbakestilling. En alternativ tilbakestillingstriggende forekomst for å håndtere ytterligere tilfeller er derfor ønskelig. I enhver situasjon der lydinnholdet endrer seg brått eller har en diskontinuitet vil nivået til den nye lyden enten være høyere enn, lik eller lavere enn nivået til det foregående lydinnholdet. Siden de fleste dynamikkprosessorer anvender en attakk-koeffisient som er betydelig raskere enn release-koeffisienten, er tilfellet der nivået til det nye lydinnholdet er høyere enn eller lik det gamle mindre problematisk enn når det nye lydinnholdet er betydelig lavere enn det gamle. I sistnevnte tilfelle kan den langsomme release-tiden føre til en urimelig lang tilpasningstid. Å trigge en tilbakestilling når det nye lydinnholdet er betydelig lavere enn det gamle kan derfor anses som spesielt ønskelig. For å gjøre dette kan en utnytte et trekk som er felles for de fleste lydsignaler som er sammensatt av naturlige lyder. Naturlige lyder kan utvise brå nivåøkninger, men de utviser i alminnelighet en mer gradvis reduksjon. Lyder som kuttes brått er ikke veldig vanlig i de fleste lydopptak. Dersom imidlertid lydinnhold skifter brått, for eksempel som følge av en endring i inngangsvalg, og nivået til den nye lydinngangen er betydelig lavere enn den gamle, vil den resulterende lydstrømmen utvise et drastisk, unaturlig brått fall i nivået. Et slikt nivåfall kan detekteres fra det kortsiktige nivået L[t ] og anvendes for å trigge en tilbakestilling.
Følgelig er en annen virkningsfull måte å trigge en tilbakestilling gjennom signalanalyse å detektere en forekomst i tidsutviklingen av lydsignalet der lydsignalets nivå avtar med en mengde som er større enn en differanseterskel Ldropinnenfor et tidsintervall som ikke er større enn en tidsterskel tdrop. Nærmere bestemt blir en tilbakestilling trigget dersom forskjellen mellom L[t ] og L[t�1 ] overstiger en forutbestemt terskel L drop innenfor et tidsintervall tdrop:
En passende tidsdifferanse tdroper tiden for én digital behandlingsblokk. Med en blokkoverlapp på en halv, svarer for eksempel én blokktid til N/2 sampler. Dersom N=512 og samplingsraten er 48000 Hz, er tdropomtrent 5 millisekunder. Dersom N=1024, er tdropomtrent 10 millisekunder. En nivåforskjell Ldroppå omtrent -10 til -20 dB er funnet passende, selv om den eksakte nivåforskjellen ikke er avgjørende.
Metoden over vil trigge en tilbakestilling når nivået til nytt lydinnhold er betydelig lavere enn det gamle, men den kan noen ganger feilaktig trigge en tilbakestilling under normalt lydinnhold. Den beskrevne metoden ser etter et fall i signalets totale nivå, og noen ganger kan en dominerende andel av lydsignalet, for eksempel en ”kick-drum”, utvise en slik oppførsel, mens resten av signalet ikke gjør det. Den dominerende signalkomponenten bidrar imidlertid mest til det totale nivået, og kan derfor gjøre at en tilbakestilling blir trigget. For å håndtere slik utilsiktet trigging kan deteksjonsmetoden forbedres ved at den detekterer en tilbakestilling når signalets nivå utviser et betydelig nivåfall samtidig over flere frekvensbånd (for eksempel alle frekvensbånd) innenfor terskelperioden. På denne måten vil alle slike frekvensbånd bidra likt til tilbakestillingsdeteksjonsprosessen, uavhengig av absoluttnivået i et gitt bånd. For å gjennomføre en slik metode blir først øyeblikksnivået innenfor flere frekvensbånd beregnet. Dette nivået blir representert som L[b, t ] , der b angir båndindeksen. Det kan genereres effektivt ved å beregne den diskrete fouriertransformasjonene (DFT) til hver lydblokk x[n, t ] og multiplisere den diskrete fouriertransformasjonen med en båndpass-frekvensrespons Cb[k ] for hvert bånd b:
derX[k, t ] , den diskrete fouriertransformasjonen av x[n, t ] , beregnes som:
Settet av båndpass-frekvensresponser Cb[k ] kan tjenlig velges slik at det likner den kritiske båndfiltreringen som observeres langs basilarmembranen i menneskets øre. Som foreslått av Moore og Glasberg ( “A Model for the Prediction of Thresholds, Loudness, and Partial Loudness”, Brian Moore, Brian Glasberg og Thomas Baer, J. Audio Eng. Soc., Vol.45, nr.4, april 1997) har slike filtre en tilnærmet avrundet eksponentiell form og en jevn innbyrdes avstand på ERB-(Equivalent Rectangular Bandwidth)-skalaen. Figur 5 viser et passende sett av filtre med en innbyrdes avstand lik 1 ERB, som resulterer i totalt 40 bånd.
Fra øyeblikksnivået til hvert bånd, L[b, t ] , kan en beregne differansen mellom suksessive tidsblokker, midlet over alle bånd:
For fysisk relevante lydsignaler er D[t ] ekstremt liten bare dersom nivået til signalet faller betydelig i flesteparten av båndene b. Dersom differansen er mindre enn en terskel, D drop , detekteres en tilbakestilling:
I praksis fungerer valg av D drop mellom -10 og -20 dB godt, selv om denne innstillingen ikke er avgjørende. Den resulterende multibåndmetoden er mindre utsatt for feilaktig trigging av tilbakestilling enn den enklere metoden som kun betrakter forskjellen i totalt signalnivå.
Figur 6 viser et blokkdiagram av en AGC som innlemmer aspekter ved foreliggende oppfinnelse. Et digitalt audio-inngangssignal x[n,t] (se ligning 1) blir anvendt på to baner i en AGC-anordning eller -prosess. I styrebanen beregner en “nivåberegning”-anordning eller -prosess 20 et mål for lyden, som kan være et tidsvarierende øyeblikksnivå for signalet L[t], beregnet som middelkvadratet til hver blokk av inngangssignalet x[n,t] (se ligning.3). Deretter blir øyeblikksnivået L[t] tidsglattet i en “nivåglatting”-anordning eller -prosess 22 for å generere et glattet middelnivå for lydsignalet L[t ] (se likn.4a). Uten tilbakestilling kan tidsglattingen ha en rask attakk og langsom release. Nivåglattingen 22 kan være styrt av en “tidskonstant styresignal c[t]”-inngang og/eller en “initialiser L[t ] ”-inngang. Tidskonstant styresignal-inngangen c[t] kan gjøre at én eller flere av tidskonstantene anvendt i nivåglattingen 22 endres ved en tilbakestilling, som beskrevet over. Initialiser L[t ] -inngangen kan gjøre at utgangen fra nivåglattingen 22 antar en lagret verdi eller forhåndsbestemt verdi L init ved forekomst av en tilbakestilling, som beskrevet over. Utgangen fra nivåglattingen 22, L[t ] , blir anvendt på en “Bruk inn/ut-funksjon F AGC ”-anordning eller -funksjon 24 og på en “forsterkningsberegning”-anordning eller -funksjon 26. Anordningen eller funksjonen 24 anvender funksjonen beskrevet i forbindelse med figur 4 for å frembringe et ønsket utgangsnivå Lout[t ] (se likn.5). Forsterkningsberegningen 26 beregner forsterkningen G[t ] fra forskjellen mellom utgangsnivået Lout[t ] og inngangsnivået L[t ] (se likn.6). Når Lout[t ] >L[t ] , er forsterkningen større enn én, hvilket betyr at signalet økes, og når Lout[t ] <L[t ] er forsterkningen mindre enn én, hvilket betyr at signalet dempes. Den tidsvarierende forsterkningen G[t ] , en modifiseringsparameter, blir så anvendt ”multipliser”-anordningen eller -prosessen 28 der den blir multiplisert med hver blokk av signalet x[n,t] for å generere et modifisert lydsignal y[n tN/2] (se likn.2). Selv om som beskrevet forsterkningsmodifiseringsparameteren G[t ] er frekvensuavhengig, kan en frekvensavhengig forsterkningsmodifiseringsparameter G[b, t ] bli beregnet, der b er en båndindeks. I så fall kan nivåberegningen 20 beregne et frekvensavhengig momentant signalnivå L[b, t ] , Nivåglattingen 22 kan frembringe en frekvensavhengig utgang L[b, t ] (dens styring mater inn det tidskonstante styresignalet c[t], og initialiseringen av L[t ] kan også være frekvensavhengig), Bruk funksjonen F AGC kan anvende en frekvensavhengig funksjon, og forsterkningsberegningen 26 tilveiebringer en frekvensavhengig, tidsvarierende forsterkning G[b, t ] .
Realisering
Oppfinnelsen kan realiseres i maskinvare eller programvare, eller en kombinasjon av begge (f.eks. programmerbare logikkmatriser). Dersom ikke annet er angitt er ikke algoritmene omfattet som del av oppfinnelsen naturlig bundet til noen konkret datamaskin eller annen anordning. Spesielt kan forskjellige universelle maskiner anvendes med programmer skrevet i henhold til det som er vist her, eller det kan være mer hensiktsmessig å konstruere mer spesialiserte anordninger (f.eks. integrerte kretser) for å utføre de nødvendige fremgangsmåtetrinnene. Følgelig kan oppfinnelsen realiseres i ett eller flere dataprogrammer som kjører på ett eller flere programmerbare datasystemer som hvert innbefatter minst én prosessor, minst ett datalagringssystem (omfattende volatile og ikke-volatile minne- og/eller lagringselementer), minst én innmatingsanordning eller -port og minst én utmatingsanordning eller -port.
Programkode blir anvendt på inndata for å utføre funksjonene beskrevet her og generere utdata. Utdataene blir anvendt på én eller flere utmatingsanordninger, på kjent måte.
Hvert slikt program kan implementeres i et hvilken som helst ønsket datamaskinspråk (omfattende maskinkode, assemblerkode eller høynivå prosedyreorienterte, logiske eller objektorienterte programmeringsspråk) for å kommunisere med et datasystem. Språket kan være et kompilert eller interpretert språk.
Hvert slikt dataprogram blir fortrinnsvis lagret på eller lastet ned til et lagringsmedium eller en lagringsanordning (f.eks. halvlederminne eller -medier eller magnetiske eller optiske medier) som kan leses av en generell eller spesialisert programmerbar datamaskin, for å konfigurere og styre datamaskinen når lagringsmediet eller -anordningen leses av datasystemet for å utføre prosedyrene beskrevet her. Systemet ifølge oppfinnelsen kan også vurderes realisert som et datamaskinlesbart lagringsmedium, utstyrt med et dataprogram, der lagringsmediet utstyrt på denne måten bevirker et datasystem til å kjøre på en spesifikk og forhåndsdefinert måte for å utføre funksjonene beskrevet her.
NO20091518A 2006-10-20 2009-04-17 Audiodynamisk prosessering ved bruk av en tilbakestilling NO342161B1 (no)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US85312706P 2006-10-20 2006-10-20
PCT/US2007/020747 WO2008051347A2 (en) 2006-10-20 2007-09-25 Audio dynamics processing using a reset

Publications (2)

Publication Number Publication Date
NO20091518L NO20091518L (no) 2009-05-18
NO342161B1 true NO342161B1 (no) 2018-04-09

Family

ID=38961076

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20091518A NO342161B1 (no) 2006-10-20 2009-04-17 Audiodynamisk prosessering ved bruk av en tilbakestilling

Country Status (16)

Country Link
US (1) US8849433B2 (no)
EP (1) EP2082480B1 (no)
JP (1) JP4940308B2 (no)
KR (1) KR101137715B1 (no)
CN (1) CN101529721B (no)
AU (1) AU2007309691B2 (no)
BR (1) BRPI0717484B1 (no)
CA (1) CA2665153C (no)
IL (1) IL197856A (no)
MX (1) MX2009004175A (no)
MY (1) MY144271A (no)
NO (1) NO342161B1 (no)
RU (1) RU2413357C2 (no)
TW (1) TWI415481B (no)
UA (1) UA94968C2 (no)
WO (1) WO2008051347A2 (no)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
US8144881B2 (en) 2006-04-27 2012-03-27 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
AU2007309691B2 (en) 2006-10-20 2011-03-10 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US9009032B2 (en) * 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
EP2168122B1 (en) 2007-07-13 2011-11-30 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
PL2232700T3 (pl) * 2007-12-21 2015-01-30 Dts Llc System regulacji odczuwanej głośności sygnałów audio
CN101608947B (zh) * 2008-06-19 2012-05-16 鸿富锦精密工业(深圳)有限公司 声音测试方法
US20090323985A1 (en) * 2008-06-30 2009-12-31 Qualcomm Incorporated System and method of controlling power consumption in response to volume control
EP2425426B1 (en) 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
WO2010127024A1 (en) 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Controlling the loudness of an audio signal in response to spectral localization
TWI503816B (zh) 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
JPWO2010131470A1 (ja) * 2009-05-14 2012-11-01 シャープ株式会社 ゲイン制御装置及びゲイン制御方法、音声出力装置
US8406431B2 (en) * 2009-07-23 2013-03-26 Sling Media Pvt. Ltd. Adaptive gain control for digital audio samples in a media stream
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
GB0919672D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Noise suppression
GB0919673D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Gain control for an audio signal
KR20110065095A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 디바이스를 제어하는 방법 및 그 장치
CN102098606A (zh) * 2009-12-10 2011-06-15 腾讯科技(深圳)有限公司 一种音量动态调节的方法及装置
WO2012026092A1 (ja) * 2010-08-23 2012-03-01 パナソニック株式会社 音声信号処理装置及び音声信号処理方法
JP5707219B2 (ja) * 2011-05-13 2015-04-22 富士通テン株式会社 音響制御装置
JP5702666B2 (ja) * 2011-05-16 2015-04-15 富士通テン株式会社 音響装置および音量補正方法
US20120294457A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function
US20120294459A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function
EP2714184B1 (en) * 2011-05-26 2017-05-10 Advanced Bionics AG Systems for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels
FR2976748B1 (fr) * 2011-06-17 2013-12-27 Arkamys Procede de normalisation de la puissance d'un signal sonore et dispositif de traitement associe.
EP2624449B1 (en) * 2012-02-01 2016-12-07 Harman Becker Automotive Systems GmbH Peak detection when adapting a signal gain based on signal loudness
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US10027303B2 (en) * 2012-11-13 2018-07-17 Snell Advanced Media Limited Management of broadcast audio loudness
TWI528777B (zh) 2012-12-28 2016-04-01 鴻海精密工業股份有限公司 音量調節方法與系統
US9570093B2 (en) 2013-09-09 2017-02-14 Huawei Technologies Co., Ltd. Unvoiced/voiced decision for speech processing
CN103745734B (zh) * 2014-01-02 2017-01-11 青岛海信电器股份有限公司 一种设置声音曲线的设备及方法
WO2018231185A1 (ru) * 2017-06-16 2018-12-20 Василий Васильевич ДУМА Способ синхронизации звуковых сигналов
CN113037428B (zh) * 2019-12-09 2022-01-25 大唐移动通信设备有限公司 一种对数据流程的处理方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003152483A (ja) * 2001-11-16 2003-05-23 Victor Co Of Japan Ltd オートマチックレベルコントロール回路

Family Cites Families (145)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
GB2215927A (en) 1988-03-16 1989-09-27 British Broadcasting Corp Improvements to RDS radio receivers
US4953112A (en) 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (no) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
AU653582B2 (en) 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
EP0517233B1 (en) 1991-06-06 1996-10-30 Matsushita Electric Industrial Co., Ltd. Music/voice discriminating apparatus
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
JPH0590857A (ja) * 1991-09-28 1993-04-09 Victor Co Of Japan Ltd 音響効果装置
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
JPH065212U (ja) * 1992-06-15 1994-01-21 国際電気株式会社 Am・fm用受信機のagc回路
JP2727883B2 (ja) * 1992-08-20 1998-03-18 ヤマハ株式会社 楽音合成装置
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
GB2272615A (en) 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
US5548638A (en) 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (no) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
ZA95605B (en) 1994-04-28 1995-12-20 Qualcomm Inc Method and apparatus for automatic gain control and dc offset cancellation in quadrature receiver
US5530760A (en) 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
JPH07307058A (ja) * 1994-05-10 1995-11-21 Sony Corp レベルコントロール回路及び録音装置
US5422602A (en) 1994-06-20 1995-06-06 Aphex Systems, Ltd. Frequency discriminate leveler
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
EP0661905B1 (de) 1995-03-13 2002-12-11 Phonak Ag Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
BR9609799A (pt) 1995-04-10 1999-03-23 Corporate Computer System Inc Sistema para compressão e descompressão de sinais de áudio para transmissão digital
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US5642075A (en) * 1995-12-21 1997-06-24 Itt Corporation Sampled data automatic gain control
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
DE59713033D1 (de) 1996-07-19 2010-06-02 Bernafon Ag Lautheitsgesteuerte Verarbeitung akustischer Signale
US5832444A (en) * 1996-09-10 1998-11-03 Schmidt; Jon C. Apparatus for dynamic range compression of an audio signal
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
US5903655A (en) 1996-10-23 1999-05-11 Telex Communications, Inc. Compression systems for hearing aids
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5923710A (en) 1997-02-05 1999-07-13 Tektronix, Inc. Synchronous switching of digital audio while maintaining block alignment
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6535846B1 (en) * 1997-03-19 2003-03-18 K.S. Waves Ltd. Dynamic range compressor-limiter and low-level expander with look-ahead for maximizing and stabilizing voice level in telecommunication applications
DE19713862A1 (de) 1997-04-04 1998-10-08 Bosch Gmbh Robert Verfahren zur automatischen Lautstärkesteuerung in einer Audiosignal-Wiedergabevorrichtung und Anordnung dazu
US6792119B1 (en) * 1997-05-05 2004-09-14 Koninklijke Philips Electronics N.V. Audio system
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
EP1086607B2 (en) * 1998-06-08 2012-04-11 Cochlear Limited Hearing instrument
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
DE69933929T2 (de) 1999-04-09 2007-06-06 Texas Instruments Inc., Dallas Bereitstellen von digitalen Audio- und Videoprodukten
WO2000065872A1 (en) 1999-04-26 2000-11-02 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
WO2001039370A2 (en) 1999-11-29 2001-05-31 Syfx Signal processing system and method
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
DK1206104T3 (da) 2000-11-09 2006-10-30 Koninkl Kpn Nv Måling af en samtalekvalitet af en telefonforbindelse i et telekommunikationsnetværk
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
DK1290914T3 (da) 2001-04-10 2004-09-27 Phonak Ag Fremgangsmåde til tilpasning af et höreapparat til et individ
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
ES2258575T3 (es) 2001-04-18 2006-09-01 Gennum Corporation Instrumento de audicion de multiples canales con comunicacion entre canales.
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7242784B2 (en) * 2001-09-04 2007-07-10 Motorola Inc. Dynamic gain control of audio in a communication device
WO2003036621A1 (en) 2001-10-22 2003-05-01 Motorola, Inc., A Corporation Of The State Of Delaware Method and apparatus for enhancing loudness of an audio signal
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
KR101016982B1 (ko) 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP2004133051A (ja) * 2002-10-08 2004-04-30 Wave Come:Kk 音声入力装置
US20060069550A1 (en) 2003-02-06 2006-03-30 Dolby Laboratories Licensing Corporation Continuous backup audio
DE10308483A1 (de) 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7590251B2 (en) * 2003-03-21 2009-09-15 D2Audio Corporation Clip detection in PWM amplifier
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
SG185134A1 (en) 2003-05-28 2012-11-29 Dolby Lab Licensing Corp Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
US7844059B2 (en) * 2005-03-16 2010-11-30 Microsoft Corporation Dereverberation of multi-channel audio streams
WO2006102892A1 (en) * 2005-03-29 2006-10-05 Gn Resound A/S Hearing aid with adaptive compressor time constants
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
JP5185254B2 (ja) 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
ES2400160T3 (es) 2006-04-04 2013-04-08 Dolby Laboratories Licensing Corporation Control de una característica percibida del volumen sonoro de una señal de audio
US8144881B2 (en) 2006-04-27 2012-03-27 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
US7813825B2 (en) * 2006-07-10 2010-10-12 Apple Inc. Multiband dynamic range control graphical interface
AU2007309691B2 (en) 2006-10-20 2011-03-10 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US8194889B2 (en) 2007-01-03 2012-06-05 Dolby Laboratories Licensing Corporation Hybrid digital/analog loudness-compensating volume control
KR101163411B1 (ko) 2007-03-19 2012-07-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 지각 모델을 사용한 스피치 개선
MX2009009942A (es) 2007-06-19 2009-09-24 Dolby Lab Licensing Corp Medicion de volumen con modificaciones expectrales.
EP2009786B1 (en) * 2007-06-25 2015-02-25 Harman Becker Automotive Systems GmbH Feedback limiter with adaptive control of time constants

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003152483A (ja) * 2001-11-16 2003-05-23 Victor Co Of Japan Ltd オートマチックレベルコントロール回路

Also Published As

Publication number Publication date
CA2665153A1 (en) 2008-05-02
IL197856A (en) 2014-03-31
MY144271A (en) 2011-08-29
RU2413357C2 (ru) 2011-02-27
AU2007309691A1 (en) 2008-05-02
TWI415481B (zh) 2013-11-11
BRPI0717484B1 (pt) 2019-05-21
NO20091518L (no) 2009-05-18
JP4940308B2 (ja) 2012-05-30
RU2009118955A (ru) 2010-11-27
WO2008051347A2 (en) 2008-05-02
EP2082480A2 (en) 2009-07-29
AU2007309691B2 (en) 2011-03-10
US8849433B2 (en) 2014-09-30
UA94968C2 (ru) 2011-06-25
EP2082480B1 (en) 2019-07-24
IL197856A0 (en) 2009-12-24
JP2010507330A (ja) 2010-03-04
CA2665153C (en) 2015-05-19
CN101529721B (zh) 2012-05-23
KR20090078834A (ko) 2009-07-20
CN101529721A (zh) 2009-09-09
TW200830890A (en) 2008-07-16
MX2009004175A (es) 2009-04-30
US20100198377A1 (en) 2010-08-05
BRPI0717484A2 (pt) 2013-10-15
KR101137715B1 (ko) 2012-04-25
WO2008051347A3 (en) 2008-07-17

Similar Documents

Publication Publication Date Title
NO342161B1 (no) Audiodynamisk prosessering ved bruk av en tilbakestilling
KR101735416B1 (ko) 오디오 라우드니스 제어 시스템
US8787595B2 (en) Audio signal adjustment device and audio signal adjustment method having long and short term gain adjustment
TWI600273B (zh) 即時調整音訊訊號之響度的系統與方法
US10594284B2 (en) System and method for controlling volume
US11109095B2 (en) Automatic activation of closed captioning for low volume periods
EP3379847B1 (en) Audio device, speaker device, and audio signal processing method
JP4661422B2 (ja) ミューティング装置、デジタルオーディオ装置
US11792487B2 (en) Audio device with learning and adaptive quiet mode capabilities
JP2002165152A (ja) 音量調整装置
CN114902560A (zh) 具有环境噪音补偿的用于自动音量控制的设备和方法
KR20070022116A (ko) 오디오 신호의 크기를 자동적으로 조정하는 방법 및 시스템
GB2559858A (en) Audio processing apparatus and method of controlling same
JPH05347794A (ja) ビデオカメラ用収音装置

Legal Events

Date Code Title Description
CHAD Change of the owner's name or address (par. 44 patent law, par. patentforskriften)

Owner name: DOLBY LABORATORIES LICENSING CORPORATION, US