NO332437B1 - Apparat og fremgangsmate for a supprimere et akustisk ekko - Google Patents

Apparat og fremgangsmate for a supprimere et akustisk ekko Download PDF

Info

Publication number
NO332437B1
NO332437B1 NO20100081A NO20100081A NO332437B1 NO 332437 B1 NO332437 B1 NO 332437B1 NO 20100081 A NO20100081 A NO 20100081A NO 20100081 A NO20100081 A NO 20100081A NO 332437 B1 NO332437 B1 NO 332437B1
Authority
NO
Norway
Prior art keywords
signal
subband
signals
microphone
squared magnitude
Prior art date
Application number
NO20100081A
Other languages
English (en)
Other versions
NO20100081A1 (no
Inventor
Oystein Birkenes
Original Assignee
Cisco Systems Int Sarl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cisco Systems Int Sarl filed Critical Cisco Systems Int Sarl
Priority to NO20100081A priority Critical patent/NO332437B1/no
Priority to US13/008,651 priority patent/US8675883B2/en
Priority to PCT/NO2011/000017 priority patent/WO2011087376A1/en
Publication of NO20100081A1 publication Critical patent/NO20100081A1/no
Publication of NO332437B1 publication Critical patent/NO332437B1/no

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/085Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using digital techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

Apparat og fremgangsmåte for å supprimere et akustisk ekko
Teknologisk område
Utførelsesformer beskrevet her vedrører ekkosuppresjon. Spesielt vedrører utførelsesformene her ekkosuppresjon som benytter en lineær regresjonsmodul for hvert subbånd som kan operere på kvadratet av inngangssampler, så vel som korresponderende kryssprodukter, for å generere et estimat av den kvadrerte magnitude av subbåndekkosignalet.
Bakgrunn
Et alminnelig problem med håndfrikommunikasjonssystemer er akustisk ekko, og problemet kan formuleres som følger. Et digitalt inngangsaudiosignal x(n) mottas av et kommunikasjonsgrensesnitt fra et fjernendested (eng.: a far end site) over et nettverk slik som internett eller PSTN, og avspilles på en høyttaler. En mikrofon genererer et digitalt audiosignal y(n) sammensatt av et ekkosignal u(n) og et nærendelydsignal v(n) slik som tale fra en nærendetaler og bakgrunnsstøy. Ekkosignalet er sammensatt av det direkte signalet og reflekterte versjoner (reflektert av vegger/himlinger, osv.) av høyttalersignalet. Mikrofonsignalet y(n) kan uttrykkes som følger:
Dersom mikrofonsignalet y(n) ble transmittert tilbake til fjernenden umodifisert, ville deltakerne ved fjernendestedet høre et ekko av seg selv, og dersom et tilsvarende system var tilstede ved fjernendestedet, kunne i tillegg hyling/tilbakekobling oppstå.
En måte å dempe ekkosignalet på er illustrert i fig. 1, og dette er alminnelig omtalt som akustisk ekkokansellering (AEC). Her modelleres romimpulsresponsen fra høyttaleren til mikrofonen (innbefattet responsen for høyttaleren og mikrofonen, og digital til analog og analog til digital omformere som ikke er vist for enkelthets skyld) med et adaptivt endelig-impulsrespons-(FIR-)filter med L koeffisienter gitt i vektoren h(n) = [ho(n), hi(n) hL-i(n)]T. En adaptiv algoritme, slik som normalisert minste midlere kvadrater (NLMS) eller rekursiv minste kvadrater (RLS), benyttes for kontinuerlig å oppdatere filterkoeffisientene med det mål å approksimere romimpulsresponsen så nøyaktig som mulig. Jo nærmere det estimerte filteret er til romimpulsresponsen, desto bedre er det estimerte ekkoet, og desto mindre ekko sendes tilbake til fjernenden. På grunn av den variable natur for romimpulsresponsen, så vel som nærendelyden som opptrer ved mikrofonen, vil det imidlertid alltid være noe residualekko tilbake etter subtrahering av det estimerte ekkosignalet. Derfor er det vanlig å benytte en ulineær prosesseringsblokk (NLP) for ytterligere å supprimere gjenværende ekko. I fullbånd-ekkokanselleringsløsningen vist i fig. 1 genererer det adaptive filteret 1203 et estimat u(n) av ekkosignalet u(n). Dette estimerte ekkosignalet u(n) subtraheres fra mikrofonsignalet y(n) ved node 1201 for å generere det ekkokansellerte utgangssignalet e(n), i samsvar med ligning 2 som følger:
For bredbåndsaudio og typiske rom krever ekkokansellereren i fig. 1 et stort antall filterkoeffisienter for å fungere tilfredsstillende. Dette medfører at ekkokansellatoren blir beregningsmessig svært kompleks, selv for enkle adaptive algoritmer slik som NLMS. Videre, selv om beregningskompleksitet har mindre betydning, vil mange av de mest alminnelig benyttede adaptive algoritmene lide under lav konvergenshastighet på grunn av den høye autokorrelasjonen som finnes i signalet x(n).
Disse problemene reduseres i stor grad i den akustiske subbåndekkokansellatoren illustrert i fig. 2.1 fig. 2 blir det digitale inngangssignalet x(n) mottatt fra fjernenden, og som føres til høyttaleren, inndelt i et forhåndsbestemt antall K av subbånd X](m) ..., Xic(m) ved bruk av analysefilterbanken 3301, der m representerer en tidsindeks. Mikrofonsignalet y(n) deles også i K subbånd Yi(m), ..., Yic(m) ved bruk av en lignende analysefilterbank 3302. For hvert subbånd, f.eks. subbånd k, filtreres et subbåndreferansesignal xic(m) gjennom et subbånd FIR-filter Hk(m) 3204 som beregner et subbåndekkoestimat Uk(m). Subbåndekkoestimatet Uk(m) subtraheres fra det korresponderende subbåndmikrofonsignalet Yk(m) ved node 2110 for å danne et subbåndekkokansellert mikrofonsignal Ek(m). Det ekkokansellerte mikrofonsubbåndsignalet Ek(m) benyttes for å adaptere FIR-filteret 3204, vist som subbånd FIR-filteroppdateringssløyfen 3208. De ekkokansellerte mikrofonsubbåndsignalene Ei(m) ..., Eic(m) fra alle subbånd samles sammen for å danne et fullbånds ekkokansellert mikrofonsignal ved syntesefilterbanken 3303.
Den smale båndbredden for frekvenssubbåndene tillater nedsampling i analysefilterbanken. Etter nedsampling kjøres all subbåndprosessering ved en lavere rate, antallet koeffisienter for det adaptive filteret i hvert subbånd reduseres betraktelig, og høyttalersubbåndsignalene Xk(m) har en lavere autokorrelasjon sammenlignet med fullbåndsignalet x(n). Sammenlignet med systemet i fig. 1, har systemet i fig. 2 lavere beregningskompleksitet og raskere konvergenshastighet for mange av de fleste alminnelig benyttede adaptive algoritmer. Imidlertid vil de akustiske ekkokanselleringssystemene i fig. 1 og fig. 2 ikke virke godt under raske endringer i faseresponsen for romimpulsresponsen. Slike endringer opptrer ofte på personlige datamaskiner på grunn av feilaktig synkronisme mellom høyttalersignalet x(n) og mikrofonsignalet y(n).
Moderne akustisk ekkosuppresjon ble foreslått som et robust alternativ til AEC i Carlos Avendano, Acoustic Echo Suppression in the STFT Domain, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001, sidene W2001-4, hvilket innhold her inntas ved referanse. Referansen vil heretter bli omtalt som [Avendano, 2001].
Fig. 3 illustrerer tilnærmingsmåten. Slik som med subbåndekkokansellering, benyttes analysefilterbanker og en syntesefilterbank, slik at prosesseringen kan gjøres uavhengig og effektivt på hvert subbånd. I det følgende vil vi bare betrakte subbånd nr. k, mens det tas hensyn til at den samme prosesseringen gjøres for alle de andre subbåndene. Forskjellig fra subbåndekkokansellering, hvor det komplekse subbåndekkosignalet Uk(m) estimeres, er bare magnituden |Uk(m)| av subbåndekkosignalet nødvendig i den akustiske ekkosuppresjonstilnærmelsesmåten foreslått i [Avendano, 2001]. Ekkomagnituden i subbånd k dannes ved å ta magnituden av det komplekse ekkoestimatet. Den estimerte ekkomagnituden benyttes til å beregne en tidsvarierende subbåndforsterkning definert som:
der parameterne a og p benyttes til å kontrollere mengden av ekkoreduksjon versus signaldistorsjon. Utgangen Zk(m) i subbånd k dannes ved å multiplisere Yk(m), som er mikrofonsignalet i subbånd k, med forsterkningen Gk(m). Ofte er det nødvendig, spesielt dersom magnitudeestimatoren er svak, å utjevne forsterkningene Gk(m) over enten frekvens eller tid. For et eksempel på forsterkningsutjevning, se [Faller og Chen, 2005]. Bemerk i (3) at fasen av ekkoestimatet Uk(m) ikke benyttes. Dette er et viktig trekk for faserobusthet. Imidlertid oppnås full robusthet mot fasevariasjoner bare dersom den spektrale magnitudeestimatoren er robust. Det er enkelt å se at estimatoren i [Avendano, 2001] ikke er robust overfor faseendringer. Betrakt f.eks. hva som skjer etter at en forsinkelse innføres i romimpulsresponsen. Da vil alle de adaptive filterkoeffisientene bli feilstilt på grunn av den endrede fasen, og det adaptive filteret må gjenadapteres.
En faserobust akustisk ekkosuppressor ble presentert i Christof Faller og J. Chen,
(2005), Suppressing acoustic echo in a spectral envelope space, IEEE Trans. Speech and Audio Processing, vol. 5, nr. 13, sidene 1048-1062, heretter omtalt som [Faller og Chen, 2005]. Innholdet av denne inntas herved ved referanse. Til forskjell fra tilnærmingsmåten i [Avendano, 2001], der ekkomagnituden i hvert subbånd estimeres fra en sekvens av komplekse subbåndsampler, har tilnærmingsmåten i [Faller og Chen, 2005] til hensikt å estimere spektralenvelopen for ekkosignalet fra spektralenvelopen av høyttalersignalet. I deres arbeid ble spektralenvelopen tatt for å være det øyeblikkelige effektspekteret, eller magnitudespekteret, utjevnet over frekvens. Selv om denne tilnærmingsmåten gir en fullstendig faserobust ekkosuppressor, er imidlertid nøyaktigheten for estimatoren svak, selv for et høyt antall adaptive filterkoeffisienter. US patent 7 062 040 til Faller beskriver også suppresjon av et ekkosignal, hele innholdet av denne inntas herved ved referanse. US-2006/0222172 vedrører et regresjonsbasert redidual-ekkosuppresjonssystem (RES) og en prosess for å supprimere den del av et mikrofonsignal som samsvarer med en avspilling av et høyttaler-audiosignal som ikke ble supprimert av en akustisk ekko-kansellator (AEC).
Sammenfatning
Oppfinnelsen er definert i kravene.
Det er her beskrevet en fremgangsmåte for å prosessere et audiosignal eksekvert av et audiosuppresjonsapparat. En eksempelutførelsesform av fremgangsmåten kan innbefatte: en fremgangsmåte for å prosessere audiosignaler, omfattende trinnene: å motta et inngangssignal, hvor inngangssignalet anvendes på en høyttaler, deles inngangssignalet inn i et flertall K av subbåndinngangssignaler, å motta et mikrofonsignal generert av en mikrofon, og å dele mikrofonsignalet til et flertall K av subbåndmikrofonsignaler, og å beregne den kvadrerte magnitude av hvert av de K subbåndmikrofonsignalene. Den beregnede kvadrerte magnitude av de K subbåndsignalene og de K subbåndinngangssignalene føres til en lineær regresjonsmodul for å generere estimater av den kvadrerte magnituden av en signalkomponent i superbåndmikrofonsignalet for hvert av flertallet K av subbånd, hvor signalkomponenten samsvarer med lyd generert av høyttaleren som respons på inngangssignalet, og opplukkes av mikrofonen. Endelig er signalkomponenten i subbåndmikrofonsignalene supprimert basert på estimatene av den kvadrerte magnituden av en signalkomponent og den kvadrerte magnituden av subbåndmikrofonsignalene for å generere et flertall K av subbåndutgangssignaler.
Andre utførelsesformer kan innbefatte et ekkosuppresjonsapparat, og et datamaskinlesbart lagringsmedium kodet med instruksjoner for å supprimere et ekko.
Andre audiokanselleringssystemer er beskrevet i US patentene 7 010 119,
7 315 619, 7 277 538 og 7 206 404. Innholdet av disse inntas herved ved referanse i sin helhet.
Kort beskrivelse av tegningene
For å gjøre oppfinnelsen lettere å forstå, vises til de vedføyde tegninger, hvor
Fig. 1 illustrerer et konvensjonelt ekkoproblem i et håndfrikommunikasjonssystem, Fig. 2 er en skjematisk tegning av en konvensjonell subbåndakustisk ekkokansellator, Fig. 3 er en skjematisk tegning av et konvensjonelt akustisk ekkosuppresjonssystem, Fig. 4 er et blokkdiagram som skjematisk illustrerer et system for å supprimere ekko og/eller andre signaler, Fig. 5 er et blokkdiagram som skjematisk illustrerer en lineær regresjonsmodul, Fig. 6 illustrerer en eksempelutførelsesform av en spektralmagnitudeestimator for anvendelse i et ekkosuppresjonssystem som utgjør en utførelse av den foreliggende oppfinnelsen, Fig. 7 er et blokkdigram som skjematisk illustrerer en annen lineær regresjonsmodul, Fig. 8 er et flytskjema som illustrerer en eksempelfremgangsmåte som utgjør en utførelsesform av den foreliggende oppfinnelsen, Fig. 9 illustrerer et eksempeldatamaskinsystem som kan utgjøre en utførelsesform av den foreliggende oppfinnelsen.
Detaljert beskrivelse
Det skal nå vises til eksempelutførelsesformer av den foreliggende oppfinnelsen, for eksempler på slike er illustrert i de vedføyde tegninger. Der det passer vil tilsvarende henvisningstall benyttes på alle tegningene for å vise til de samme eller like deler. Implementasjonene som er fremsatt i den følgende beskrivelsen representerer ikke alle implementasj onene som er konsistente med den foreliggende oppfinnelsen. I stedet er de å anse som eksempler på systemer og fremgangsmåter som er konsistente med den foreliggende oppfinnelse.
En ny akustisk ekkosuppressor og fremgangsmåte for akustisk ekkosuppresjon er beskrevet her. Eksempelutførelsesformer av den akustiske ekkosuppressoren benytter en lineær regresjonsmodul for hvert subbånd. Den lineære regresjonsmodellen for hvert subbånd kan operere på den kvadrerte magnituden av inngangssamplene så vel som korresponderende kryssprodukter. På denne måten kan nøyaktige og robuste estimater av ekkosignalet i hvert subbånd oppnås, hvorved det tilveiebringes god ekkoreduksjon mens signaldistorsjonen holdes lav.
Den foreliggende oppfinnelsen kan utføres som et ekkosuppresjonsapparat i et håndfritelefonsystem. Imidlertid kan den foreliggende oppfinnelsen utføres i et hvilket som helt audiosystem der ekkosuppresjon er ønskelig, slik som videokonferansesystemer og audioreproduksjons-/opptakssystemer.
Fig. 4 illustrerer skjematisk et system for å supprimere ekko og/eller andre signaler som korresponderer med lyd generert av en høyttaler og som plukkes opp av en mikrofon. Slik som i den tidligere kjente løsning i fig. 3, føres et inngangsaudiosignal x(n) til en høyttaler 401, mens en mikrofon 402 genererer et mikrofonsignal y(n), som er sammensatt av et ekkosignal u(n) (en signalkomponent som samsvarer med lyd generert av høyttaleren 401, og som plukkes opp av mikrofonen 402) og nærendetale og bakgrunnsstøy v(n). Høyttalersignalet x(n) og mikrofonsignalet y(n) deles inn i et flertall K av smale frekvenssubbånd med bare liten overlapping, med bruk av analysefilterbanken 403 og henholdsvis analysefilterbanken 404, danner subbåndinngangssignaler Xk(m) og subbåndmikrofonsignaler Yk(m), der k angir subbåndtallet og m angir den nedsamplede tidsindeksen. En operator 405 beregner den kvadrerte magnituden |Yk(m)|<2>av subbåndmikrofonsignalet Yk(m), som benyttes som inngangssignal til en lineær regresjonsmodul 406, og en forsterkningsberegningsmodul 407. Lineærregresjonsmodulen 406 genererer og avgir et estimat |Uk(m)|2 av den kvadrerte magnituden av subbåndekkosignalet basert på subbåndsignalet Xk(m) og den kvadrerte magnituden av det korresponderende subbåndmikrofonsignalet Yk(m). Utgangen av lineærregresjonsmodulen 406 benyttes sammen med den kvadrerte magnituden av det korresponderende subbåndmikrofonsignalet Yk(m) ved ekkosuppresjonsmodulen 408 til å supprimere ekkoet i subbåndmikrofonsignalet Yk(m). Avhengig av impementasjonen kan ekkosuppresjonsmodulen 408 utføre en hvilken som helst egnet ekkosuppresjonsteknikk, slik som de som alminnelig er benyttet for støysuppresjon eller talesuppresjon. I samsvar med en eksempelutføre Ises form omfatter ekkosuppresjonsmodulen 408 en forsterkningsberegningsmodul 407 for å beregne en tidsvarierende subbåndforsterkning definert som:
der parameterne a og p benyttes til å kontrollere mengden av ekkoreduksjon versus signalforvrengning. Utgangen Zk(m) i subbånd k dannes ved å multiplisere Yk(m) med forsterkningen Gk(m).
I beskrivelsen ovenfor har det blitt spesifisert at inngangsaudiosignalet x(n) føres til høyttaleren. Selv om det ikke er illustrert, vil fagfolk enkelt forstå fra denne beskrivelsen at mellomliggende kretser slik som en D/A-omformer, filtre og en forsterker kan være innbefattet i forbindelsen mellom audiosignalet x(n) og høyttaleren. Likeledes vil det forstås at mellomliggende kretser slik som en forsterker, filtre og en A/D-omformer kan være innbefattet i forbindelsen mellom mikrofonen og mikrofonsignalet y(n).
Fig. 5 illustrerer skjematisk en lineær regresjonsmodul 406 i samsvar med en eksempelutførelsesform av den foreliggende oppfinnelsen. Spesielt er fig. 5 et blokkdiagram som illustrerer en eksempelestimator av den kvadrerte magnituden for hvert subbåndekkosignal som danner en utførelsesform av den foreliggende oppfinnelsen. Drøftelsen som følger for fig. 5 viser til
ekkosuppresjonsprosesseringen for ett av de multiple frekvenssubbåndene. Analog prosessering utføres for hvert av de andre subbåndene. Den lineære regresjonsmodulen 406 vil bli beskrevet i nærmere detalj senere.
Så lenge overlappingen mellom tilstøtende subbånd er liten, kan et godt estimat for det komplekse ekkosignalet i subbånd k oppnås fra et adaptivt FIR-filter. Dette er ekkoestimatet som benyttes i tradisjonell subbåndakustisk ekkokansellering (AEC). Dersom FIR-filteret har M komplekse koeffisienter angitt som Hk(0) ..., Hk(M-l), er ekkoestimatet i subbånd k:
Ekkosuppressoren i samsvar med den foreliggende oppfinnelsen, vist i fig. 5, estimerer en kvadrert magnitude av det komplekse ekkoestimatet Uk( m), og dette gjøres forskjellig fra systemene som er beskrevet i bakgrunnsdelen. Den ovenfor viste ligning (5) kan avledes til et uttrykk for den kvadrerte magnituden av Uk( m) som splitter hvert uttrykk til to faktorer, der den første faktor er en funksjon av bare Hk(i), i = 0 ..., M-l, mens den andre faktor er en funksjon bare av filterinngangene Xk(m-i), i = 0 ..., M-l. Dette fører til en nøyaktig og robust estimator av den kvadrerte magnituden av subbåndekkosignalene. Den kvadrerte magnituden av (5) kan skrives (ligning 6):
Ved å ta kvadratet av |Uk(m)| som vist i (6) tilveiebringer en robust og nøyaktig estimator |Uk(m)|<2>av den kvadrerte magnituden av det komplekse ekkoestimatet.
Uttrykket i (6) kan gjenkjennes som en lineær regresjonsmodell der settet av regressorer omfatter den kvadrerte magnituden av de M siste inngangssamplene Xk(m) Xk(m-M+1) i tillegg til de reelle og imaginære deler av deres gjensidige komplekse produkter, der for to komplekse tall zi ogZ2, det komplekse produktet er definert her som zi<*>Z2, dvs. den kompleks konjugerte av det første tallet multiplisert med det andre tallet. For hver regressor finnes en regresjonsparameter angitt som Fk(i, j) i samsvar med (6). ;I figur 5 kan alminnelige adaptive algoritmer slik som f.eks. NLMS, APA og RLS benyttes som en kontrollalgoritme for å oppdatere regresjonsparameterne, fordi ligning (6) er en lineær funksjon av regressorene. Derfor, ved hver tidsindeks m, innstilles regresjonsparameterne Fk(i, j) basert på settet av beregnede regressorer og den kvadrerte magnituden av mikrofonsignalet i subbånd k. ;Ved hvert tidsøyeblikk m er inngangen til lineærregresjonsmodulen 406 i fig. 5 høyttalerreferansesamplet Xk(m) i subbånd k og den kvadrerte magnituden av mikrofonsamplet Yk(m) i subbånd k. På noen plattformer finnes en stor forsinkelse i ekkoveien. Da vil bedre ytelse for den lineære regresjonen oppnås dersom inngangen forsinkes på samme måte, enten i fullbånd eller i subbånd. Selv om denne forsinkelsen ikke alltid er fast, kan forsinkelsen typisk til enhver tid oppnås fra det opererende systemet. Dersom dette ikke er tilfelle, kan forsinkelsen estimeres, f.eks. som den som gir maksimal krysskorrelasjon mellom høyttalersignalet og mikrofonsignalet. Derfor kan subbåndhøyttalerreferansesampelet Xk(m) valgfritt forsinkes med d sampler, hvor d kan settes til en fast verdi, eller den kan variere som funksjon av tiden. I én eksempelutførelsesform settes d som forsinkelsen mellom høyttaleren og mikrofonen, slik som forsinkelsen i en PC. ;Fig. 5 viser en tidsforsinkelsesmodul 500 dannet av en sekvens (M-l) av én-sampelforsinkelseselementer som holder inngangssampelet ved ulike tidsforsinkelser (M = 3 i fig. 5). Inngangssamplene med forskjellige tidsforsinkelser i fig. 5 kan uttrykkes som Xk(m), Xk(m-l), og Xk(m-2). Den valgfrie forsinkelsen d kan benyttes sammen med disse tidsforsinkelsene, hvor inngangssamplene med ulike tidsforsinkelser kan uttrykkes som Xk(m-d), Xk(m-d-l), og Xk(m-d-2), hvor d e{0, 1,2, ...}. ;For hver tidsforsinkelse beregnes den kvadrerte magnituden av signalet fulgt av multiplikasjon med en regresjonsparameter Fk(i, j) ved å kombinere modul eller moduler 502. Resultatene av multiplikasjonen med regresjonsparameteren Fk(i, j) adderes sammen ved noder 504 for å danne en første sum. Videre, for hvilke som helst to tidsforsinkelser Xk(m), Xk(m-l), og Xk(m-2), beregnes det komplekse produktet mellom de to signalene av en kalkuleringsmodul 506. De reelle og imaginære deler av det komplekse produktet multipliseres deretter med en korresponderende regresjonsparameter Fk(i, j) 508, og adderes sammen for å danne en andre sum som kombinerer modulene 502 og nodene 510. Det bemerkes at kombinering av modulene 508 og 502 kan være sammen eller separat. ;Estimatet \ 0^ m) f finnes deretter som summen av de første og andre summer av estimatormodulen 512. ;Et feilsignal Ek(m) benyttet til adaptivt å oppdatere regresjonsparameterne Fk(i, j) for den lineære regresjonsmodellen 406 genereres ved å subtrahere \ Uk( m) f fra den kvadrerte magnituden |Yk(m)|<2>for subbåndmikrofonsamplet Yk(m). Dette feilsignalet Ek(m) kan benyttes til å oppdatere regresjonsparameterne Fk(i, j) ved å benytte en adaptiv algoritme slik som f.eks. NLMS, APA eller RLS. Feilsignalet Ek(m) kan genereres av den lineære regressormodulen 406 eller en annen modul. ;Videre med henvisning til figur 4 føres utgangen av den lineære regresjonsmodulen 406, som er estimatet \ Ok( m)\ 2 av den kvadrerte magnituden av ekko i subbånd k til forsterkningsberegningsmodulen 407. Forsterkningen for subbånd k kan deretter beregnes ved å benytte ligning (4). ;Den lineære regresjonsmodulen 406 benyttet som estimator for | Uk( m)\ 2 i (6) har M<2>reelle regressorer og et korresponderende antall reelle parametere. Eksemplet i fig. 5 har M = 3. Andre verdier for M er mulig. M kan velges i samsvar med tilgjengeligheten av beregningsressurser. Videre er utførelsesformer av den foreliggende oppfinnelsen ikke begrenset til bruken av alle regressorer og korresponderende regresjonsparametere Fk(i, j) for en gitt M. Et hvilket som helst sett av regressorer som definert i (6) og korresponderende regresjonsparametere Fk(i, j) kan benyttes. I én eksempelutførelsesform vil settet av regressorer som bidrar mest til summen velges sammen med deres korresponderende regresjonsparametere Fk(i, j). Dette settet kan velges basert på karakteristikkene for romimpulsresponsen, og derved Hk(i), og karakteristikkene for inngangssignalet Xk(m). Et godt sett av regressorer er viktig når begrensede beregningsressurser bare tillater at et lite sett av regressorer kan benyttes. ;I ligning (6) forsøker regresjonsparameterne Fk(i, j) for j > i å estimere ;;der ^FHkCi) og ^FHkG') er fasene for henholdsvis Hk( i) og Hk( j). I stedet for å forsøke å estimere fasen for hver koeffisient i filteret slik som i (5), estimerer estimatoren i (6) fasedifferansen mellom koeffisientene HFk(i, j). Disse differansene er tilnærmet uendret etter en endring i forsinkelsen for romimpulsresponsen, selv om fasene i seg selv har endret seg. Den samme analysen gjelder regresjonsparameterne Fk(i, j) for j ;< i. Dette er årsaken til at estimatoren i fig. 5 er robust overfor faseendringer. ;I en annen utførelsesform, i stedet for å estimere den kvadrerte magnituden av ekkosignalet i hvert subbånd, kan en utjevnet kvadrert magnitude av subbåndekkosignalet ;estimeres, hvor der ye<0,l]. Den utjevnede kvadrerte magnitude kan nøyaktig estimeres ved å erstatte regressorene i (6) med utjevnet kvadrert magnitude og utjevnede komplekse produkter. F.eks. kan den kvadrerte magnituderegressoren |Xk(m)|<2>erstattes med og hvert kryssprodukt X[ ( m — i) Xk( m - j) kan erstattes med ;Hver subbåndforsterkning kan deretter beregnes ved å erstatte Uk( m)\ 2 og | |2 i ;Cfc,i,;(m),V?yi(m) ;(4) med henholdsvis PXk( m) og . For en y kan den utjevnede kvadrerte magnituden gjerne maksimere effekten av inngangssignalet, og de utjevnede komplekse produktene kan gjerne approksimere krysskorrelasjoner. Siden krysskorrelasjoner av store tidsforsinkelser kan være små i subbånd i en filterbank, bidrar disse regressorene ikke mye til estimatet, og de kan utelates. Et blokkdiagram for den akustiske ekkosuppressoren som innbefatter estimatet av den utjevnede kvadrerte magnituden av ekkosignalet er illustrert i fig. 6. Operatoren S (•) er en utjevningsoperator, hvorav et eksempel er gitt ovenfor. Den korresponderende lineære regresjonen er vist i fig. 7. ;Det skal bemerkes at dersom Fk( i, j) = 0, j * i, dvs. null kryssparametere, ser tilnærmingsmåten ovenfor ut til å ligne tilnærmingen i [Faller og Chen, 2005]. Imidlertid finnes det fortsatt forskjeller. I [Faller og Chen, 2005] estimeres spektralenvelopen for ekkosignalet fra spektralenvelopen for inngangssignalet. Spektralenvelopen for inngangssignalet beregnes ved å utjevne den kvadrerte magnituden for subbåndhøyttalersamplene over frekvens. I tilnærmingsmåten ovenfor utjevnes subbåndhøyttalersamplene over tid.
Fig. 8 illustrerer en eksempelfremgangsmåte for å supprimere ekko. Denne fremgangsmåten kan eksekveres av et audioekkosuppresjonsapparat slik som det som er vist i fig. 9. Imidlertid kan andre passende programmerte maskiner eller datamaskinsystemer også benyttes.
Fremgangsmåten i fig. 8 innbefatter trinn 700 ved å motta inngangsaudiosignalet x(n) og mikrofonsignalet y(n). Dette inngangsaudiosignalet kan mottas fra en fjernendeinnretning over et nettverk (slik som internett). Fjernendeinnretningene kan innbefatte et videokonferanseendepunkt, en telefoninnretning, eller en PC. Fremgangsmåten i fig. 8 innbefatter trinn 702 med å generere et inngangssubbåndsignal Xk(m) fra inngangsaudiosignalet x(n) og å generere et mikrofonsubbåndsignal Yk(n) fra inngangsmikrofonsignalet y(n). Dette trinnet kan utføres ved å benytte analysefilterbanker slik som dem som er vist i fig. 4. Genereringen av mikrofonsubbåndsignalet kan innbefatte generering av en kvadrert magnitude av mikrofonsubbåndsignalet. Alternativt kan genereringen av mikrofonsubbåndsignalet innbefatte generering av en utjevnet kvadrert magnitude av mikrofonsubbåndsignalet, hvorav et eksempel er vist ovenfor.
Fremgangsmåten i fig. 8 innbefatter trinn 704 med å forsinke inngangssubbåndsignalet Xk(n) med en sekvens av ett-sampelforsinkelser for å danne et flertall av tidsforsinkelsessignaler. Slik det er bemerket ovenfor, kan en ytterligere forsinkelse d inkluderes. Fremgangsmåten i fig. 8 innbefatter trinn 706, hvor, for én eller flere tidsforsinkelser, kvadrert magnitude av signalet beregnes fulgt av multiplikasjon ved en første respektiv regressorparameter, og å ta en sum av disse, for å generere et første signal. I én eksempelutførelsesform beregnes en kvadrert magnitude for alle tidsforsinkelsessignalene etterfulgt av multiplikasjon med en regressorparameter. I en annen eksempelutførelsesform beregnes en kvadrert magnitude av tidsforsinkelsessignaler etterfulgt av multiplikasjon med en regressorparameter som gjøres bare for valgte tidsforsinkelsessignaler. Valget kan gjøres manuelt av en administrator basert på romrespons, eller automatisk ved en algoritme.
Fremgangsmåten i fig. 8 innbefatter trinn 708, ved beregning av et komplekst produkt mellom hvilke som helst par av flertallet av tidsforsinkelsessignaler for å generere komplekse produktsignaler. En eksempelutførelsesform beregnes et komplekst produktsignal for hver pardannelse av tidsforsinkelsessignaler. En annen eksempelutførelsesform beregnes et komplekst produktsignal bare for valgte par av tidsforsinkelsessignaler. Valget kan gjøres automatisk av en administrator basert på romrespons, eller automatisk av en algoritme.
Det komplekse produktsignalet kan innbefatte en realdel og en imaginærdel. Fremgangsmåten i fig. 8 innbefatter trinn 710 med å multiplisere, ved audioekkosuppresjonsapparatet, hver av en realdel og en imaginærdel av de komplekse produktsignalene med andre respektive regressorparametere, og ta en sum av disse, for å generere et andre signal.
Fremgangsmåten i fig. 8 innbefatter trinn 712 ved å generere et estimat av den kvadrerte magnituden av subbåndekkosignalet ved å addere sammen det første signalet og det andre signalet, hvilket danner \ Uk( m)\ 2.
Fremgangsmåten i fig. 8 innbefatter trinn 714 ved å generere et feilsignal basert på estimatet av den kvadrerte magnituden av subbåndekkosignalet \ l%( m)\ 2 og den kvadrerte magnituden av mikrofonbåndsignalet \ Yk( m)\ 2. Feilsignalet kan genereres ved å beregne en forskjell mellom \ l%( m)\ 2 og \ Yk( m)\ 2. Dette feilsignalet kan benyttes til å oppdatere de første respektive regressorparameterne og de andre respektive regressorparameterne, ved bruk av en adaptiv algoritme slik som f.eks. NLMS, APA eller RLS.
Fig. 9 illustrerer et datamaskinsystem 1201 som en utførelsesform av den foreliggende oppfinnelsen kan implementeres på. Dette datamaskinsystemet kan være et audioekkosuppresjonsapparat innbefattet i en telefoninnretning, en PC eller et videokonferanseendepunkt. Datamaskinsystemet 1201 innbefatter en buss 1202 eller annen kommunikasjonsmekanisme for å kommunisere informasjon, og en prosessor 1203 koblet med bussen 1202 for å prosessere informasjonen. Datamaskinsystemet 1201 innbefatter også et hovedminne 1204, slik som et lese- og skriveminne (RAM), eller annen dynamisk lagringsinnretning (f.eks. dynamisk RAM (DRAM), statisk RAM (SRAM), og synkron DRAM (SDRAM)), koblet til bussen 1202 for å lagre informasjon og instruksjoner som skal eksekveres av prosessoren 1203.1 tillegg kan hovedminnet 1204 benyttes for å lagre temporære variabler eller annen mellomliggende informasjon under eksekvering av instruksjoner av prosessoren 1203. Datamaskinsystemet 1201 innbefatter videre et leseminne (ROM) 1205 eller annen statisk lagringsinnretning (f.eks. programmerbar ROM (PROM), slettbar PROM (EPROM), og elektrisk slettbar PROM (EEPROM)) koblet til bussen 1202 for å lagre statisk informasjon og instruksjoner for prosessoren 1203.
Datamaskinsystemet 1201 innbefatter også en diskkontroller 1206 koblet til bussen 1202 for å kontrollere én eller flere lagrings innretninger for å lagre informasjon og instruksjoner, slik som en magnetisk harddisk 1207, og et fjernbart mediedrev 1208 (f.eks. floppydiskdrev, kompaktdiskdrev for bare lesing, kompaktdiskdrev for lesing og skriving, kompaktdisk-jukebox, bånddrev, og fjernbart magnetooptisk drev). Lagringsinnretningene kan tillegges til datamaskinsystemet 1201 ved bruk av et passende innretningsgrensesnitt (f.eks. small computer system interface (SCSI), integrated device electronics (IDE), enhanced-IDE (E-IDE), direct memory access (DMA) eller ultra-DMA).
Datamaskinsystemet 1201 kan også innbefatte logiske kretser for spesielle formål (f.eks. application specific integrated circuits (ASICs)) eller konfigurerbare logiske innretninger (f.eks. simple programmable logic devices (SPLEDs), complex programmable logic devices (CPLDs) og field programmable gate arrays (FPGAs)).
Datamaskinsystemet 1201 kan også innbefatte en displaykontroller 1209 koblet til bussen 1202 for å kontrollere et display 1210, slik som et katodestrålerør (CRT), for å fremvise informasjon til en datamaskinbruker. Datamaskinsystemet innbefatter inngangsinnretninger, slik som et tastatur 1211 og en pekeinnretning 1212, for å samvirke med en datamaskinbruker, og tilveiebringe informasjon til prosessoren 1203. Pekeinnretningen 1212 kan f.eks. være en buss, en rulleball eller en pekepinne for å kommunisere retningsinformasjon og kommandovalg til prosessoren 1203 og for å kontrollere markørbevegelse på displayet 1210.1 tillegg kan en printer tilveiebringe utskrift av data lagret og/eller generert av datamaskinsystemet 1201.
I en eksempelutførelsesform kan datamaskinsystemet 1201 utføre en del av eller alle prosesseringstrinnene for oppfinnelsen som respons på at prosessoren 1203 eksekverer én eller flere sekvenser av én eller flere instruksjoner inneholdt i et minne, slik som hovedminnet 1204. Slike instruksjoner skal leses inn i hovedminnet 1204 fra et annet datamaskinlesbart lagringsmedium, slik som en harddisk 1207 eller et fjernbart mediedrev 1208. En eller flere prosessorer i et multiprosesseringsarrangement kan også anvendes for å eksekvere sekvensen av instruksjoner som er inneholdt i hovedminnet 1204.1 alternative utførelsesformer kan hardkodede kretser benyttes istedenfor eller i kombinasjon med programvareinstruksjoner. Således er utførelsesformer ikke begrenset til noen spesifikk kombinasjon av hardwarekretser og programvare.
Slik det er angitt ovenfor, innbefatter datamaskinsystemet 1201 minst ett datamaskinlesbart lagringsmedium eller minne for å holde instruksjoner programmert i samsvar med læren for oppfinnelsen, og for å inneholde datastrukturer, tabeller, records eller andre data beskrevet her. Eksempler på datamaskinlesbare medier er kompaktdisker, harddisker, floppydisker, tape, magnetopptiske disker, PROMs (EPROM, EEPROM, flash EPROM), DRAM, SRAM, SDRAM eller hvilke som helst andre magnetiske medier, kompaktdisker (f.eks. CD-ROM), eller hvilke som helst andre medier, hullkort, papirbånd eller andre fysiske medier med mønstre av hull. Den foreliggende oppfinnelsen kan også implementeres med en passende kodet bærebølge.
Lagret på et hvilket som helst eller en kombinasjon av datamaskinlesbare lagringsmedier, innbefatter den foreliggende oppfinnelsen programvare for å kontrollere datamaskinsystemet 1201 for å drive en innretning eller innretninger for å implementere oppfinnelsen, og for å sette datamaskinsystemet 1201 i stand til å samvirke med en menneskelig bruker (f.eks. printproduksjonspersonale). Slik programvare kan innbefatte, men er ikke begrenset til, innretningsdrivere, operativsystemer, utviklingsverktøy og applikasjonsprogramvare. Slike datamaskinlesbare medier innbefatter videre datamaskinprogramprodukter ifølge den foreliggende oppfinnelsen for å utføre alle, eller en del av (dersom prosessering er distribuert) prosesseringene som utføres ved implementering av oppfinnelsen.
Datamaskinkodeinnretningene ifølge den foreliggende oppfinnelsen kan være hvilke som helst interpreterbare eller eksekverbare kodingsmekanismer, innbefattende, men ikke begrenset til, scripts, interpreterbare programmer, dynamiske lenkebiblioteker (DLL'er), Javaklasser og komplette eksekverbare programmer. Videre kan deler av prosesseringen av den foreliggende oppfinnelsen distribueres for bedre ytelse, pålitelighet og/eller kostnad.
Uttrykket "datamaskinlesbart lagringsmedium", slik det er benyttet her, henviser til et hvilket som helst konkret medium som deltar i å tilveiebringe instruksjoner til prosessoren 1203 for eksekvering. Et datamaskinlesbart lagringsmedium kan anta mange former, innbefattende, men ikke begrenset til, ikke-flyktige medier og flyktige medier. Ikke-flyktige medier innbefatter f.eks. optiske, magnetiske disker, og magnetooptiske disker, slik som harddisken 1207 eller det fjernbare mediedrevet 1208. Flyktige medier innbefatter dynamisk minne, slik som hovedminnet 1204.
Ulike former av datamaskinlesbare lagringsmedier kan være involvert i utførelse av én eller flere sekvenser av én eller flere instruksjoner til prosessoren 1203 for eksekvering. F.eks. kan instruksjonene initielt utføres på en magnetisk disk i en fjern datamaskin. Den fjerne datamaskinen kan laste instruksjonene for å implementere alle eller en del av den foreliggende oppfinnelsen fjernt inn i et dynamisk minne og sende instruksjonene over en telefonlinje ved bruk av et modem. Et modem lokalt til datamaskinsystemet 1201 kan motta data på telefonlinjen, og benytte en infrarød transmitter for å konvertere dataene til et infrarødt signal. En infrarød detektor koblet til bussen 1202 kan motta dataene båret i det infrarøde signalet, og plassere dataene på bussen 1202. Bussen 1202 bærer dataene til hovedminnet 1204, fra hvilket prosessoren 1203 innhenter og eksekverer instruksjonene. Instruksjonene mottatt av hovedminnet 1204 kan valgfritt lagres på en lagringsinnretning 1207 eller 1208 enten før eller etter eksekvering av prosessoren 1203.
Datamaskinsystemet 1201 innbefatter også et kommunikasjonsgrensesnitt 1213 koblet til bussen 1202. Kommunikasjonsgrensesnittet 1213 tilveiebringer en toveis datakommunikasjonskobling til en nettverkslink 1214 som er forbundet til, f.eks., et lokalnettverk (LAN) 1215, eller til et annet kommunikasjonsnettverk 1216 slik som internett. F.eks. kan kommunikasjonsgrensesnittet 1213 være et nettverksgrensesnittkort for tilknytning til et hvilket som helst pakkesvitsjet LAN. Som et annet eksempel kan kommunikasjonsgrensesnittet 1213 være et ADSL-kort (asymmetrical digital subscriber line), et ISDN-kort (integrated services digital network) eller et modem for å tilveiebringe en datakommunikasjonsforbindelse til en tilsvarende type kommunikasjonslinje. Trådløse linker kan også implementeres. I en hvilken som helst slik implementasjon sender og mottar kommunikasjonsgrensesnittet 1213 elektriske, elektromagnetiske eller optiske signaler som bærer digitale datastrømmer som representerer ulike typer informasjon.
Nettverks linken 1214 tilveiebringer typisk datakommunikasjon gjennom ett eller flere nettverk til andre datainnretninger. F.eks. kan nettverkslinken 1214 tilveiebringe en forbindelse til en annen datamaskin gjennom et lokalnettverk 1215
(f.eks. et LAN) eller gjennom utstyr operert av en tjenesteleverandør, som tilveiebringer kommunikasjonstjenester gjennom et kommunikasjonsnettverk 1216. Lokalnettverket 1214 og kommunikasjonsnettverket 1216 benytter f.eks. elektriske, elektromagnetiske eller optiske signaler som bærer digitale datastrømmer, og det assosierte fysiske laget (f.eks. CAT 5-kabel, koakskabel, optisk fiber, osv.). Signalene gjennom de ulike nettverkene og signalene på nettverkslinken 1214 og gjennom kommunikasjonsgrensesnittet 1213, som bærer de digitale data til og fra datamaskinsystemet 1201, kan implementeres i basisbåndsignaler eller bærebølgebaserte signaler. Basisbåndsignalene formidler de digitale datasom umodulerte elektriske pulser som beskriver en strøm av digitale databits, der
uttrykket "bits" skal forstås bredt og bety symbol, der hvert symbol formidler minst én eller flere informasjonsbits. De digitale data kan også benyttes til å modulere en bærebølge, slik som med amplitude, fase og/eller frekvensskiftkodede signaler som propageres over et ledende medium, eller transmitteres som elektromagnetiske bølger gjennom et propageringsmedium. Således kan de digitale data sendes som umodulerte basisbånddata gjennom en "trådbundet" kommunikasjonskanal og/eller sendes innenfor et forhåndsbestemt frekvensbånd, forskjellig fra basisbåndet, ved å modulere en bærebølge. Datamaskinsystemet 1201 kan sende og motta data, innbefattende programkode, gjennom nettverket eller nettverkene 1215 og 1216, nettverkslinken 1214 og kommunikasjonsgrensesnittet 1213. Videre kan nettverkslinken 1214 tilveiebringe en forbindelse gjennom et LAN 1215 til en mobilinnretning 1217 slik som en personlig digital assistent (PDA) bærbar datamaskin eller mobiltelefon.
Den ovenstående beskrivelsen av mulige implementasjoner og utførelsesformer konsistent med den foreliggende oppfinnelsen representerer ikke en fullstendig liste over alle slike implementasjoner eller alle variasjoner av implementasj onene som er beskrevet. Beskrivelsen av bare noen implementasjoner skal ikke tolkes som en intensjon om å ekskludere andre implementasjoner. Andre utførelsesformer av oppfinnelsen vil fremstå for fagfolk ved betraktning av spesifikasjonen og praktiseringen av oppfinnelsen beskrevet her. Fagfolk vil forstå hvordan man skal implementere oppfinnelsen i de vedføyde krav på andre måter, ved bruk av ekvivalenter og alternativer som ikke fraviker fra rekkevidden av de etterfølgende krav. Det er tiltenkt at spesifikasjonen og eksemplene skal betraktes bare som eksempler, med en sann rekkevidde og ånd for oppfinnelsen som angitt ved de etterfølgende krav.

Claims (17)

1. Fremgangsmåte for å prosessere audiosignaler, omfattende trinnene: (a) å motta et inngangssignal, der inngangssignalet føres til en høyttaler (401); (b) å dele inngangssignalet i et flertall K av subbåndinngangssignaler; (c) å motta et mikrofonsignal generert av en mikrofon (402), og å dele mikrofonsignalet i et flertall K av subbåndmikrofonsignaler; (d) å beregne den kvadrerte magnitude av hvert av de K subbåndmikrofonsignalene; (e) å tilføre den beregnede kvadrerte magnitude av de K subbåndmikrofonsignalene og de K subbåndinngangssignalene til en lineær regresjonsmodul (406) for å generere estimater av den kvadrerte magnituden for en signalkomponent i subbåndmikrofonsignalet for hvert av flertallet K av subbånd, der signalkomponenten samsvarer med lyd generert av høyttaleren (401) som respons på inngangssignalet og plukket opp av mikrofonen (402); og (f) å supprimere signalkomponenten i subbåndmikrofonsignalet basert på estimatene av den kvadrerte magnituden av en signalkomponent og den kvadrerte magnituden av subbåndmikrofonsignalene for å generere et flertall K av subbåndutgangssignaler.
2. Fremgangsmåte i samsvar med krav 1, der fremgangsmåten videre omfatter trinnet: (g) å samle flertallet K av subbåndutgangssignaler til ett utgangssignal.
3. Fremgangsmåte i samsvar med krav 1, hvor signalkomponenten omfatter et ekkosignal.
4. Fremgangsmåte i samsvar med et av de ovenstående krav, hvor trinnet med å generere estimater av den kvadrerte magnitude av en signalkomponent i subbåndmikrofonsignalene videre omfatter: å forsinke hvert subbåndinngangssignal med en sekvens (M-l) av én-sampelforsinkelseselementer for å danne et flertall M av tidsforsinkelsessignaler; å beregne den kvadrerte magnitude av ett eller flere av flertallet av tidsforsinkelsessignaler og multiplisere med første respektive regresjonsparametere, for å danne én eller flere første utganger, og å summere nevnte utganger for å generere et første signal.
5. Fremgangsmåte i samsvar med krav 4, hvor det første signal er estimatet av den kvadrerte magnitude av en signalkomponent i subbåndmikrofonsignalet.
6. Fremgangsmåte i samsvar med et av kravene 1-4, hvor trinnet med å generere estimater av den kvadrerte magnitude av en signalkomponent i subbåndmikrofonsignalet videre omfatter: å beregne et komplekst produkt mellom ett eller flere par av flertallet av tidsforsinkelsessignaler for å generere komplekst produktsignal eller komplekse produkts ignaler; å multiplisere hver av en realdel og imaginærdel av det komplekse produktsignal eller de komplekse produktsignaler med andre respektive regresjonsparametere, for å danne to eller flere andre utganger, og å summere nevnte andre utganger for å generere et andre signal.
7. Fremgangsmåte i samsvar med krav 6, hvor det andre signal er estimatet av den kvadrerte magnitude av en signalkomponent i subbåndmikrofonsignalet.
8. Fremgangsmåte i samsvar med ett eller flere av de ovenstående krav, hvor fremgangsmåten videre omfatter: å addere det første signal og det andre signal for å danne estimatet av den kvadrerte magnitude av en signalkomponent til mikrofonsignalet.
9. Fremgangsmåte i samsvar med krav 8, hvor fremgangsmåten videre omfatter: å benytte hele flertallet av tidsforsinkelsessignaler for å generere nevnte første signal og å benytte alle mulige par av flertallet av tidsforsinkelsessignaler for å generere nevnte andre signal.
10. Fremgangsmåte i samsvar med ett eller flere av kravene 4-9, hvor de respektive første og andre regresjonsparametere estimeres ved bruk av en adaptiv kontrollalgoritme.
11. Fremgangsmåte i samsvar med ett eller flere av kravene 4-10, hvor fremgangsmåten videre omfatter: å generere et feilsignal basert på det første signal og/eller andre signal og mikrofonsignal; og å oppdatere de første respektive regresjonsparameterne og de andre respektive regresjonsparameterne basert på feilsignaler.
12. Fremgangsmåte i samsvar med et av kravene 1-11, hvor trinnene å beregne den kvadrerte magnitude av hvert av de K mikrofonsubbåndsignalene innbefatter å beregne en utjevnet kvadrert magnitude; og beregningen av den kvadrerte magnitude av én eller flere av flertallet av tidsforsinkelsessignaler innbefatter å beregne en utjevnet kvadrert magnitude; og genereringen av komplekst produktsignal eller komplekse produktsignaler innbefatter generering av utjevnet komplekst produktsignal eller utjevnede komplekse produktsignaler.
13. Fremgangsmåte i samsvar med krav 12, hvor utjevning innbefatter multiplisering av ett av nevnte signaler med en første veieparameter (y), og addere en én-sampelforsinket versjon av resulterende signal multiplisert med en andre veieparameter (1-y).
14. Fremgangsmåte i samsvar med et av de ovenstående krav, hvor inngangssubbåndsignalene er forsinket med d sampler, der d e {0, 1,2, ...}.
15. Datamaskinlesbart lagringsmedium (1207; 1208) eller minne (1204) som konkret lagrer et sett av prosesseringsinstruksjoner som bevirker at et audiosignalprosesseringsapparat (1201) utfører fremgangsmåten som fremsatt i ett av kravene 1-14 når prosesseringsinstruksjonene eksekveres av en prosesseringsinnretning (1203) innbefattet i nevnte audiosignalprosesseringsapparat (1201).
16. Audiosignalprosesseringsapparat (1201), omfattende en prosesseringsinnretning (1203), et minne (1204) og et display (1210), idet nevnte minne (1204) konkret lagrer et sett av prosesseringsinstruksjoner som bevirker at et audiosignalprosesseringsapparat (1201) utfører fremgangsmåten som fremsatt i ett av kravene 1-14 når prosesseringsinstruksjonene eksekveres av en prosesseringsinnretning (1203) innbefattet i nevnte audiosignalprosesseringsapparat (1201).
17. Audiosignalprosesseringsapparat (1201) i samsvar med krav 16, hvor nevnte audiosignalprosesseringsapparat er del av en videokonferanseterminal.
NO20100081A 2010-01-18 2010-01-18 Apparat og fremgangsmate for a supprimere et akustisk ekko NO332437B1 (no)

Priority Applications (3)

Application Number Priority Date Filing Date Title
NO20100081A NO332437B1 (no) 2010-01-18 2010-01-18 Apparat og fremgangsmate for a supprimere et akustisk ekko
US13/008,651 US8675883B2 (en) 2010-01-18 2011-01-18 Apparatus and associated methodology for suppressing an acoustic echo
PCT/NO2011/000017 WO2011087376A1 (en) 2010-01-18 2011-01-18 Apparatus and associated methodology for suppressing an acoustic echo

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
NO20100081A NO332437B1 (no) 2010-01-18 2010-01-18 Apparat og fremgangsmate for a supprimere et akustisk ekko

Publications (2)

Publication Number Publication Date
NO20100081A1 NO20100081A1 (no) 2011-07-19
NO332437B1 true NO332437B1 (no) 2012-09-17

Family

ID=42307807

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20100081A NO332437B1 (no) 2010-01-18 2010-01-18 Apparat og fremgangsmate for a supprimere et akustisk ekko

Country Status (3)

Country Link
US (1) US8675883B2 (no)
NO (1) NO332437B1 (no)
WO (1) WO2011087376A1 (no)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150052B2 (en) * 2008-10-15 2012-04-03 Hewlett-Packard Development Company, L.P. Integrating acoustic echo cancellation as a subsystem into an existing videoconference and telepresence system
GB2510331A (en) * 2012-12-21 2014-08-06 Microsoft Corp Echo suppression in an audio signal
GB2512022A (en) * 2012-12-21 2014-09-24 Microsoft Corp Echo suppression
GB2509493A (en) * 2012-12-21 2014-07-09 Microsoft Corp Suppressing Echo in a received audio signal by estimating the echo power in the received audio signal based on an FIR filter estimate
US9385779B2 (en) 2013-10-21 2016-07-05 Cisco Technology, Inc. Acoustic echo control for automated speaker tracking systems
JP6295722B2 (ja) * 2014-02-28 2018-03-20 沖電気工業株式会社 エコー抑圧装置、プログラム及び方法
GB2536742B (en) * 2015-08-27 2017-08-09 Imagination Tech Ltd Nearend speech detector
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9811314B2 (en) 2016-02-22 2017-11-07 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US9972337B2 (en) * 2016-06-22 2018-05-15 Cisco Technology, Inc. Acoustic echo cancellation with delay uncertainty and delay change
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US10473751B2 (en) 2017-04-25 2019-11-12 Cisco Technology, Inc. Audio based motion detection
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
CN107249116B (zh) * 2017-08-09 2020-05-05 成都全云科技有限公司 基于视频会议的噪音回音消除装置
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) * 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
CN113870885B (zh) * 2021-12-02 2022-02-22 北京百瑞互联技术有限公司 蓝牙音频啸叫检测和抑制方法、装置、介质及设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG71035A1 (en) * 1997-08-01 2000-03-21 Bitwave Pte Ltd Acoustic echo canceller
GB2344036B (en) * 1998-11-23 2004-01-21 Mitel Corp Single-sided subband filters
US7813499B2 (en) * 2005-03-31 2010-10-12 Microsoft Corporation System and process for regression-based residual acoustic echo suppression
US8594320B2 (en) 2005-04-19 2013-11-26 (Epfl) Ecole Polytechnique Federale De Lausanne Hybrid echo and noise suppression method and device in a multi-channel audio signal
DE102006047197B3 (de) * 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
DE102008039329A1 (de) * 2008-01-25 2009-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
US8213598B2 (en) * 2008-02-26 2012-07-03 Microsoft Corporation Harmonic distortion residual echo suppression
US8355511B2 (en) * 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation

Also Published As

Publication number Publication date
US8675883B2 (en) 2014-03-18
NO20100081A1 (no) 2011-07-19
WO2011087376A1 (en) 2011-07-21
US20110176687A1 (en) 2011-07-21

Similar Documents

Publication Publication Date Title
NO332437B1 (no) Apparat og fremgangsmate for a supprimere et akustisk ekko
US8488776B2 (en) Echo suppressing method and apparatus
JP4161628B2 (ja) エコー抑圧方法及び装置
JP4702372B2 (ja) エコー抑圧方法及び装置
US8213598B2 (en) Harmonic distortion residual echo suppression
JP4702371B2 (ja) エコー抑圧方法及び装置
TWI458331B (zh) 用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法
US9972337B2 (en) Acoustic echo cancellation with delay uncertainty and delay change
CN110176244B (zh) 回声消除方法、装置、存储介质和计算机设备
JP5391103B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
NO328622B1 (no) Anordning og fremgangsmate for reduksjon av tastaturstoy i konferanseutstyr
EP2671223A1 (en) Estimation and suppression of harmonic loudspeaker nonlinearities
JPH09139696A (ja) 適応識別とそれに関する適応エコーキャンセラのための方法と装置
JP6422884B2 (ja) エコー抑圧
JP2008259032A (ja) 情報処理装置、およびプログラム
JP5469564B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置及びそのプログラム
CN113744748A (zh) 一种网络模型的训练方法、回声消除方法及设备
JP5524316B2 (ja) パラメータ推定装置、エコー消去装置、パラメータ推定方法、及びプログラム
KR20220157475A (ko) 반향 잔류 억제
JP2017191992A (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
US9531884B2 (en) Stereo echo suppressing device, echo suppressing device, stereo echo suppressing method, and non-transitory computer-readable recording medium storing stereo echo suppressing program
JP5925149B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム
JPWO2012157783A1 (ja) 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体
WO2023093292A1 (zh) 一种多通道回声消除方法和相关装置
JP2008054269A (ja) 音響結合量算出装置、音響結合量算出装置を用いたエコー消去装置及びボイススイッチ装置、通話状態判定装置、これらの方法、これらのプログラム及びその記録媒体

Legal Events

Date Code Title Description
MM1K Lapsed by not paying the annual fees