DE102021103179A1 - Erkennung und unterdrückung von audio-rückkopplungen - Google Patents

Erkennung und unterdrückung von audio-rückkopplungen Download PDF

Info

Publication number
DE102021103179A1
DE102021103179A1 DE102021103179.6A DE102021103179A DE102021103179A1 DE 102021103179 A1 DE102021103179 A1 DE 102021103179A1 DE 102021103179 A DE102021103179 A DE 102021103179A DE 102021103179 A1 DE102021103179 A1 DE 102021103179A1
Authority
DE
Germany
Prior art keywords
audio
feedback
energy level
filter
filters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021103179.6A
Other languages
English (en)
Inventor
Dimitrios Grimanis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tymphany Acoustic Technology Ltd Tw
Original Assignee
Tymphany Acoustic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tymphany Acoustic Technology Co Ltd filed Critical Tymphany Acoustic Technology Co Ltd
Publication of DE102021103179A1 publication Critical patent/DE102021103179A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/45Prevention of acoustic reaction, i.e. acoustic oscillatory feedback
    • H04R25/453Prevention of acoustic reaction, i.e. acoustic oscillatory feedback electronically
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems

Abstract

Hierin wird ein Verfahren zur automatischen Erkennung von Audio-Rückkopplungen in einem Eingangsaudiosignal offenbart. Das Verfahren umfasst das separate Filtern des Audioeingangssignals mit einer Mehrzahl von separaten Analyseaudiofiltern, um eine Mehrzahl von gefilterten Audiosignalen zu erzeugen. Die separaten Analyseaudiofilter sind unterschiedlich. Dann Vergleichen von mindestens zwei der gefilterten Audiosignale, um einen Energiepegelunterschied zu erhalten. Durchführen einer oder mehrerer Wiederholungen der Schritte des Filterns und Vergleichens, um eine Mehrzahl von Energiepegelunterschieden zu ermitteln. Dann Vergleichen der Energiepegelunterschiede von mindestens zwei der Wiederholungen, um die Audio-Rückkopplung zu erkennen. Weiterhin wird ein Audioverarbeitungssystem zum Erkennen von Audio-Rückkopplungen eines Eingangsaudiosignals und eine Verwendung des Audioverarbeitungssystems offenbart. Bevorzugte Ausführungsformen des Verfahrens und des Systems umfassen Merkmale zur automatischen Durchführung einer Audio-Rückkopplungsunterdrückung der erkannten Audio-Rückkopplung.

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Erkennung und, optional, Unterdrückung von Audio-Rückkopplungen in einem Eingangsaudiosignal. Die Erfindung betrifft ferner die Verwendung der Vorrichtung.
  • Hintergrund der Erfindung
  • Audio-Rückkopplungen können in vielen Situationen im Bereich der Audiotechnik auftreten. Sie kann beispielsweise auftreten, wenn eine Tonschleife vorhanden ist, die sowohl einen Audioeingang, wie z.B. ein Mikrofon, als auch einen Audioausgang, wie z.B. einen Lautsprecher, aufweist, insbesondere, wenn Audio vor der Ausgabe durch den Lautsprecher verstärkt wird. In solchen Fällen kann jedes vom Mikrofon aufgenommene Audiosignal verstärkt werden, bevor es vom Lautsprecher wiedergegeben und erneut vom Mikrofon aufgenommen wird, wodurch eine positive Schleifenverstärkung entsteht.
  • Rückkopplungen können in einer Mehrzahl von Kontexten auftreten, von großen Live-Musikkonzerten bis hin zu mikroelektrischen Audioschaltungen, wie z. B. Schaltungen zur Verwendung in Hörgeräten oder Kopfhörern und Hearables.
  • Obwohl Audio- Rückkopplungen manchmal absichtlich eingesetzt wird, ist es typischerweise eine unerwünschte Eigenschaft eines Audiosystems. Audio-Rückkopplungen können zum Beispiel einen Benutzer des Audiosystems stören und im schlimmsten Fall die Audioausrüstung beschädigen oder sogar das Gehör von Personen in der Nähe des Audiosystems beeinträchtigen.
  • Daher ist die Bereitstellung von Lösungen zur Erkennung von Audio-Rückkopplungen sehr wünschenswert. Insbesondere sind Lösungen wünschenswert, die relativ wenig Rechenleistung benötigen, so dass Audio-Rückkopplungen schnell erkannt und um sie gekümmert werden können, bevor es zu Schäden oder Verletzungen kommt.
  • Zusammenfassung der Erfindung
  • Der Erfinder hat die oben genannten Probleme und Herausforderungen im Zusammenhang mit Audio-Rückkopplungen erkannt und daraufhin die nachfolgend beschriebene Erfindung gemacht, die möglicherweise die Erkennung und Unterdrückung von Audio-Rückkopplungen verbessern kann.
  • Die Erfindung betrifft ein Verfahren zum automatischen Erkennen von Audio-Rückkopplungen in einem Audioeingangssignal, wobei das Verfahren die folgenden Schritte umfasst:
    • separates Filtern des Audioeingangssignals mit einer Mehrzahl von separaten Analyseaudiofiltern, um eine Mehrzahl von gefilterten Audiosignalen zu erzeugen; wobei die separaten Analyseaudiofilter unterschiedlich sind;
    • Vergleichen von mindestens zwei gefilterten Audiosignalen der Mehrzahl von gefilterten Audiosignalen, um eine Energiepegelunterschied zu erhalten;
    • Durchführen einer oder mehrerer Wiederholungen des Schritts des getrennten Filterns des Audioeingangssignals und des Schritts des Vergleichens der gefilterten Audiosignale, wodurch eine Mehrzahl der Energiepegelunterschieden ermittelt wird;
    • Vergleichen von mindestens zwei Energiepegelunterschieden aus der Mehrzahl der Energiepegelunterschieden, die aus mindestens zwei der Wiederholungen erhalten wurden, um die Audio-Rückkopplung zu erkennen.
  • In einer beispielhaften Ausführungsform der Erfindung wird das Verfahren in einer Audioverarbeitungseinheit implementiert. Es wird ein Eingangsaudiosignal bereitgestellt, z.B. ein Audiosignal von einem Mikrofon, das eine Audio-Rückkopplung umfassen kann. Das Verfahren der vorliegenden Erfindung kann dabei angewendet werden, um Audio-Rückkopplung in dem Mikrofonsignal zu erkennen, und verschiedene Ausführungsformen der Erfindung können Tools implementieren, um die Erkennung zuverlässiger oder genauer zu machen, und/oder Tools, um die Audio-Rückkopplung zu unterdrücken, wie hierin detaillierter beschrieben.
  • Eine Mehrzahl von Analyseaudiofiltern, z. B. zwei Analyseaudiofilter, werden auf das Eingangsaudiosignal angewendet, um ein gefiltertes Audiosignal für jeden Analyseaudiofilter zu erzeugen. Da die Analyseaudiofilter unterschiedlich sind, liefern sie unterschiedliche gefilterte Audiosignale, wenn ein identischer Eingang gegeben ist. In einem Beispiel können zwei der Analyseaudiofilter zum Beispiel Bandpassfilter sein, die bei 40 Hz bzw. 200 Hz zentriert sind. Wenn das Eingangsaudiosignal eine Audio-Rückkopplung bei etwa 40 Hz enthält, wird das gefilterte vom ersten Bandpassfilter, der bei 40 Hz zentriert ist, ausgegebene Audiosignal nicht wesentlich gedämpft, aber der zweite Bandpassfilter, der bei 200 Hz zentriert ist, wird das Eingangsaudiosignal wesentlich dämpfen, zum Beispiel um 20 dB, wenn es das zweite gefilterte Audiosignal erzeugt. Im Gegensatz dazu wird im gleichen Beispiel der Filterauswahl, wenn die Audio-Rückkopplung bei ca. 200 Hz liegt, der bei 40 Hz zentrierte Filter das Eingangsaudiosignal wesentlich abschwächen, während der zweite Analyseaudiofilter das Eingangsaudiosignal nicht wesentlich abschwächt. Generell, wenn die Rückkopplung irgendwo zwischen den Frequenzen der beiden Analyseaudiofilter liegt, werden die beiden gefilterten Audiosignale in Kombination eine eindeutige relative Dämpfung des Eingangsaudiosignals aufweisen. Diese eindeutige Beziehung zwischen der Frequenz und der relativen Dämpfung kann analysiert werden, um eine Schätzung der Frequenzcharakteristik der Rückkopplung zu erhalten. Die beiden gefilterten Audiosignale werden verglichen, um einen Energiepegelunterschied zu erhalten, der auf die Frequenzcharakteristik der Rückkopplung hinweist.
  • Wenn das Eingangsaudiosignal einen markanten Ton enthält, wie z. B. eine Rückkopplung, die sich von den anderen Inhalten wie z. B. Musik, Sprache oder Rauschen abhebt, basiert die relative Dämpfung zwischen den beiden verschiedenen Analyseaudiofiltern in erster Linie auf dem markanten Ton und kann verwendet werden, um z. B. die Frequenz der Rückkopplung eindeutig zu identifizieren. Wenn das Eingangssignal jedoch keinen markanten Ton enthält, d. h. beispielsweise keine Audio-Rückkopplung, wird die relative Dämpfung zwischen den Analyseaudiofiltern erheblich variieren und nicht sehr nützlich sein.
  • Die Filter- und Vergleichsschritte werden daher vorzugsweise wiederholt, um eine Mehrzahl von Energiepegelunterschieden über die Zeit gemessen zu ermitteln, und die Entwicklung der Energiepegelunterschieden wird analysiert. Wenn also über z. B. 50 ms annähernd ähnliche Energiepegelunterschieden festgestellt werden, können die Energiepegelunterschieden als Audio-Rückkopplung darstellend validiert werden. In einer Ausführungsform kann ein Rückkopplungserkennungsvalidierer also feststellen, wenn die Differenz über eine Anzahl von Wiederholungen annähernd Null ist, und dies als Validierung ansehen, dass eine Audio-Rückkopplung erkannt wird, und wenn die Differenz nicht annähernd Null ist, wird das Ergebnis als Validierung angesehen, dass keine Audio-Rückkopplung erkannt wird. Diese Funktion kann auch als Sustain- bzw. Halte-Erkennung bezeichnet werden, d. h. Feststellung, ob das Eingangsaudiosignal einen anhaltenden, markanten Ton enthält, der wahrscheinlich von einer Audio-Rückkopplung stammen könnte.
  • Die Erfindung ermöglicht die Erkennung von Rückkopplungen in einem Eingangsaudiosignal. Im Stand der Technik gibt es andere Ansätze zur Erkennung von Audio-Rückkopplungen. Im Vergleich dazu können Ausführungsformen der vorliegenden Erfindung eine Erkennung von Audio-Feedback bereitstellen, die vorteilhafterweise unabhängig von der Lautstärke des Eingangsaudiosignals sein kann, schneller sein kann, billiger oder einfacher zu implementieren sein kann und/oder weniger Rechenleistung erfordern kann. Einige dieser Vorteile oder andere Vorteile können in unterschiedlichem Umfang und in unterschiedlichen Kombinationen durch verschiedene Ausführungsformen der vorliegenden Erfindung erreicht werden.
  • Die Erfindung ist daher in Anwendungen nützlich, in denen das Erkennen von Audio-Rückkopplungen in einem Eingangsaudiosignal erforderlich oder vorteilhaft ist, beispielsweise mit dem Ziel, die Audio-Rückkopplungen zu unterdrücken. Solche Anwendungen können beispielsweise jede Situation umfassen, in der ein Mikrofon eingesetzt wird, um Audio für die Wiedergabe über einen Lautsprecher zu erhalten und bereitzustellen, der so angeordnet ist, dass das Mikrofon weiterhin das über den Lautsprecher wiedergegebene Audio erhält und dem Lautsprecher bereitstellt. Das Mikrofon und der Lautsprecher bilden dabei eine Rückkopplungsschleife. Einige konkrete Beispiele für Situationen, in denen dies auftreten kann, umfassen Musikkonzerte, Theateraufführungen, Musikproben, während Telefongesprächen oder Anrufen mit einem Computersystem oder bei der Verwendung von Hörgeräten oder Kopfhörern mit eingebauten Mikrofonen.
  • Die Zeichnungen
  • Verschiedene Ausführungsformen der Erfindung werden im Folgenden unter Bezugnahme auf die Zeichnungen beschrieben, wobei
    • 1a-b eine Ausführungsform der Erfindung und eine zugehörige visuelle Darstellung von zwei Analyseaudiofiltern dieser Ausführungsform illustriert,
    • 2 eine Ausführungsform einer relativen Dämpfung von zwei Analyseaudiofiltern illustriert,
    • 3 eine schematische Übersicht über eine Ausführungsform der Erfindung illustriert,
    • 4 eine Ausführungsform eines erfindungsgemäßen Verfahrens illustriert,
    • 5 eine Ausführungsform eines erfindungsgemäßen Vorprozessors illustriert,
    • 6 eine Ausführungsform der Periodendetektionseinheit illustriert,
    • 7 eine Ausführungsform eines erfindungsgemäßen Tondetektors illustriert,
    • 8 eine Ausführungsform eines erfindungsgemäßen Tondetektors mit drei Filtern illustriert,
    • 9a-b eine Ausführungsform von drei Analyseaudiofiltern und ihre entsprechende relative Dämpfung illustrieren,
    • 10a-c visuelle Darstellungen verschiedener anderer Kombinationen von Analyseaudiofilter illustrieren,
    • 11 eine Ausführungsform eines erfindungsgemäßen Tondetektors illustriert,
    • 12 eine visuelle Darstellung von fünf Analyseaudiofiltern illustriert,
    • 13 eine Ausführungsform einer erfindungsgemäßen
    • Rückkopplungsdetektoreinheit illustriert,
    • 14 eine Ausführungsform eines erfindungsgemäßen Halte-Detektors 9 illustriert,
    • 15 eine visuelle Darstellung der Veränderung der Energiepegelunterschied als Funktion der Zeit illustriert,
    • 16 eine Ausführungsform einer erfindungsgemäßen Rückkopplungsunterdrückungseinheit illustriert, und
    • 17 eine Ausführungsform der Erfindung illustriert, bei der ein erfindungsgemäßes Audioverarbeitungssystem zum Erkennen und Unterdrücken von Audio-Rückkopplungen auf einem audio-digitalen Signalprozessor DSP und einem System-on-Chip SoC implementiert ist.
  • Detaillierte Beschreibung
  • Im Folgenden werden verschiedene Konzepte der Erfindung ohne Bezugnahme auf bestimmte Ausführungsformen vorgestellt.
  • Ein Eingangsaudiosignal kann beispielsweise als eine Art von digitalem oder analogem Signal verstanden werden, das hörbaren Schall repräsentiert. Das Audioeingangssignal kann beispielsweise geeignet sein, einem Lautsprecher zugeführt zu werden, optional mit einem oder mehreren Zwischenschritten der Verstärkung, Umwandlung (z. B. digital-analog) oder anderen Verarbeitung, z. B. der Audio-Rückkopplungsunterdrückung. Das Eingangsaudiosignal kann zum Beispiel über einen Audiosignaleingang zugeführt werden, zum Beispiel über eine drahtgebundene oder drahtlose Verbindung zu einer Audiosignalquelle. Das Eingangsaudiosignal kann beispielsweise auch über einen Tonabnehmer oder ein Mikrofon bereitgestellt werden, das einen Ton aufnimmt, auf dem das Eingangsaudiosignal basiert. Darüber hinaus versteht es sich, dass das Eingangsaudiosignal auch durch jede Art von elektrischer Komponente oder Schaltung bereitgestellt werden kann.
  • Ein typisches Audiosignal kann aus mehreren unterschiedlichen Frequenzkomponenten zusammengesetzt sein. Dies kann zum Beispiel durch eine Fourier-Transformation des Signals ersichtlich sein. Eine Audio-Rückkopplung führt typischerweise zu einem markanten Ton, der als eine Frequenzkomponente eines Audiosignals verstanden werden kann, bei der diese Frequenzkomponente aufgrund einer höheren Amplitude zumindest teilweise von anderen Frequenzkomponenten des Audiosignals unterscheidbar ist. Bei Audiosignalen, die mehrere Frequenzkomponenten enthalten, z. B. Musik, Sprache, die meisten natürlich vorkommenden Geräusche, Rauschen usw., kann eine bestimmte Frequenzkomponente als markanter Ton angesehen werden, wenn der Pegel dieser Frequenzkomponente deutlich von den anderen Signalinhalten unterscheidbar ist, z. B. mehr als 8 dB oder 9 dB lauter als der andere Inhalt im gleichen oder benachbarten Frequenzbereich. Der markante Ton einer unerwünschten Audio-Rückkopplung wird jedoch typischerweise sehr schnell im Pegel ansteigen, bis zum Clipping, und dadurch zu einer erheblichen Störung für die Zuhörer werden, und dabei typischerweise viel lauter sein als die oben erwähnten 8-9 dB über dem Pegel anderer Audioinhalte.
  • Einige Audiosignale setzen sich aus einem Kontinuum von Frequenzen zusammen, die sich dynamisch in Amplitude und Phase ändern. In solchen Fällen ist ein markanter Ton und damit eine Audio-Rückkopplung möglicherweise nicht ganz klar definiert. In einigen Ausführungsformen der Erfindung wird besondere Sorgfalt darauf verwendet, solche komplexen Audiosignale zu analysieren, z. B. durch die Implementierung zusätzlicher Filter, um dennoch eine genaue Darstellung der markanten Töne zu erhalten, die Audio-Feedback darstellen können. Im Allgemeinen sind Ausführungsformen der Erfindung nicht auf die Erkennung von Rückkopplungen in einer bestimmten Art von Audiosignal beschränkt, da eine nützliche Darstellung einer Audio-Rückkopplung auch aus komplexen Audiosignalen durch die Verwendung geeigneter Verarbeitungs- und Analysewerkzeuge extrahiert werden kann. Um die Beschreibung der Erfindung jedoch nicht mit unnötigen Details zu vernebeln, wird die Erkennung von Rückkopplungen eines Eingangsaudiosignals hauptsächlich anhand von einfachen Audiosignalen als Beispielen erläutert. Weiterhin ist zu beachten, dass in den meisten Ausführungsformen der Erfindung eine Darstellung der Audio-Rückkopplung typischerweise unabhängig von der Komplexität des Audiosignals bereitgestellt werden kann, dass jedoch bei hinreichend komplexen Audiosignalen Genauigkeit oder Präzision reduziert sein kann.
  • Eine Audio-Rückkopplung kann beispielsweise auftreten, wenn eine Tonausgabe eines Lautsprechers von einem Ton abhängt, der von einem nahen Mikrofon aufgenommen wurde. Hier kann ein vom Mikrofon empfangenes Signal verstärkt und an den Lautsprecher weitergeleitet werden, der wiederum einen verstärkten Ton ausgibt, den das Mikrofon dann wieder empfangen kann, wodurch eine Rückkopplungsschleife entsteht. Eine solche Audio-Rückkopplung kann typischerweise von einem einzelnen markanten Ton dominiert werden, für dessen Identifizierung und optionale Unterdrückung das Verfahren der Erfindung geeignet sein kann. Audio-Rückkopplung kann auch als akustische Rückkopplung oder als Larsen-Effekt bezeichnet werden. In der vorliegenden Beschreibung kann Audio-Feedback auch einfach als Feedback bezeichnet werden.
  • Unter einem Analyseaudiofilter kann ein Audiofilter verstanden werden, der z. B. wiederum eine frequenzabhängige Verstärkerschaltung sein kann, die z. B. im hörbaren Frequenzbereich, z. B. bis 20 kHz, arbeitet. Ein Analyseaudiofilter kann also typischerweise eine frequenzabhängige Verstärkung, Dämpfung, Durchlass und/oder Phasenverschiebung bewirken. Ein Analyseaudiofilter kann z. B. als digitale Schaltung, als analoge Schaltung und/oder programmiert auf einer programmierbaren Einheit, wie z. B. einem digitalen Signalprozessor, implementiert sein. Beispiele für Analyseaudiofilter sind Tiefpassfilter, Hochpassfilter, Bandpassfilter und Allpassfilter. Ein Analyseaudiofilter kann in einer Audiofiltereinheit implementiert sein, die sowohl als physikalische Schaltung als auch als digital programmierte Einheit verstanden werden kann.
  • Wenn ein Audiofilter auf ein Audiosignal angewendet wurde, führt dies typischerweise zur Erzeugung eines anderen Audiosignals, z. B. kann die Anwendung eines Analyseaudiofilters auf ein Eingangsaudiosignal zur Erzeugung eines gefilterten Audiosignals führen, z. B. kann die Anwendung einer Mehrzahl von Analyseaudiofiltern auf ein Audiosignal zu einer Mehrzahl von gefilterten Audiosignalen führen. Obwohl mindestens eines der Mehrzahl von gefilterten Audiosignalen typischerweise nicht darauf beschränkt sein muss, ein gefiltertes Signal zu sein.
  • Ein Energiepegelunterschied kann als eine Differenz zwischen den Energiepegeln zweier Audiosignale verstanden werden. Ein Energiepegel eines Audiosignals kann zum Beispiel ein RMS-Mittelwert, ein Spitzenwert, ein Mittelwert des Quadrats des Audiosignals oder ein Mittelwert einer Hüllkurve des Audiosignals sein. Ein Energiepegel eines Audiosignals kann auch mit einem Leistungspegel des Audiosignals zusammenhängen oder diesen anzeigen. Typischerweise kann ein Energiepegel ein Indikator für die Dämpfung eines Audiosignals sein. Wenn zum Beispiel ein Audiosignal durch einen Audiofilter gedämpft wurde, wird sein Energiepegel niedriger sein, als wenn das Audiosignal nicht gedämpft wurde. Ein Energiepegel kann z. B. in dB quantifiziert werden, z. B. relativ zu einer Bezugsenergie/-intensität/-audiolautstärke.
  • Der durch den Vergleich von mindestens zwei Audiosignalen erhaltene Energiepegelunterschied kann z. B. als Verhältnis oder als Subtraktion zwischen den Energiepegeln der beiden Signale ermittelt werden. Der Energiepegelunterschied muss nicht unbedingt explizit aus zwei Energiepegeln berechnet werden, sondern kann z. B. durch den Vergleich von zwei Audiosignalen erhalten werden. Der Energiepegelunterschied kann z. B. aus dem Verhältnis zweier Audiosignale gewonnen werden. Alternativ kann der Energiepegelunterschied auch durch explizite Berechnung eines (ersten) Energiepegels eines ersten Audiosignals und eines (zweiten) Energiepegels eines zweiten Audiosignals ermittelt werden. Das Ermitteln eines Energiepegels eines Audiosignals kann beispielsweise durch einen Pegeldetektor ermöglicht werden. Ermitteln eines Energiepegelunterschieds kann z.B. durch einen Energiepegelvergleicher ermöglicht werden, der z.B. mindestens zwei Audiosignale oder zwei Energiepegel als Eingänge verwenden kann.
  • Im Folgenden werden verschiedene Ausführungsformen der Erfindung unter Bezugnahme auf die Figuren beschrieben.
  • 1a und 1b zeigen schematisch eine Ausführungsform der Erfindung.
  • Die Ausführungsform ist eine automatische Audio-Rückkopplungserkennungseinheit, beispielsweise eine automatische Rückkopplungserkennungseinheit, die zumindest teilweise unter Verwendung eines digitalen Signalprozessors implementiert ist. Die automatische Rückkopplungserkennungseinheit umfasst einen Tondetektor 3 und einen Rückkopplungsdetektor 4. Der Tondetektor 3 empfängt ein Eingangsaudiosignal 2, z. B. von einem Audiosignaleingang. In dieser beispielhaften Beschreibung umfasst das Eingangsaudiosignal 2 einen markanten Ton.
  • Das Eingangsaudiosignal wird separat durch eine erste Analyseaudiofiltereinheit 5a und eine zweite Analyseaudiofiltereinheit 5b gefiltert. Die beiden Analyseaudiofiltereinheiten 5a, 5b unterscheiden sich in dem Sinne, dass sie unterschiedliche Analyseaudiofilter anwenden. Sie können z. B. beide Bandpassfilter mit demselben Gütefaktor, aber mit unterschiedlichen Filtermittenfrequenzen anwenden.
  • Die Wirkung der beiden Analyseaudiofilter ist in 1b detailliert dargestellt. Die horizontale Achse ist eine Frequenzachse in Einheiten von Hz, während die vertikale Achse eine Energiepegelachse in Einheiten von dB ist. Die frequenzabhängige Wirkung, die die Filtereinheit 5a und 5b auf ein Audiosignal ausübt, ist als eine erste Frequenzdarstellung der Energiepegeldämpfung 26a und eine zweite Frequenzdarstellung der Energiepegeldämpfung 26b dargestellt. Die Frequenzdarstellungen der Energiepegeldämpfung 26a, 26b entsprechen Bandpassfiltern mit jeweiligen Filtermittenfrequenzen von etwa 41 Hz und 82 Hz. Ein Eingangsaudiosignal 2, das über die erste Analyseaudiofiltereinheit 5a zur Energiepegelvergleichereinheit 7 gelangt, wird also basierend auf der Frequenz des Audiosignals gemäß der dargestellten ersten Frequenzdarstellung der Energiepegeldämpfung 26a abgeschwächt. Im Gegensatz dazu wird ein Eingangsaudiosignal 2, das über die zweite Analyseaudiofiltereinheit zur Energiepegelvergleichereinheit 7 gelangt, basierend auf der Frequenz dieses Audiosignals gedämpft, entsprechend der dargestellten zweiten Frequenzdarstellung der Energiepegeldämpfung 26b.
  • Das erste und das zweite gefilterte Audiosignal 6a, 6b werden beide einer Energiepegelvergleichereinheit 7 zugeführt, die eingerichtet ist, um die beiden Signale 6a, 6b zu vergleichen, um einen Energiepegelunterschied 8 der beiden Signale zu erhalten. Wenn die Energie der beiden Signale unterschiedlich ist, kann dies im Allgemeinen durch den Energiepegelunterschied 8 angezeigt werden. Zu beachten ist, dass, wenn ein markanter Ton im Eingangsaudiosignal vorhanden ist, die Energiepegelunterschied eine Darstellung dieses markanten Tons ist. Die genauen Details hängen von der Art des Filters ab und davon, wie genau der Energiepegelunterschied berechnet wird, was zwischen verschiedenen Ausführungsformen variieren kann. Zum Beispiel wird in einer beispielhaften Ausführungsform der Erfindung das Verhältnis der beiden gefilterten Audiosignale 6a, 6b erzeugt und ein RMS-Mittelwert des resultierenden Verhältnisses gemessen. In dieser besonderen Ausführungsform der Erfindung wird jedoch der Energiepegelunterschied 8 als Subtraktion der Energiepegel der beiden gefilterten Audiosignale 6a, 6b erhalten.
  • Der erhaltene Energiepegelunterschied 8 wird einem Rückkopplungsdetektor 4 zugeführt. Um die Energiepegelunterschiede über die Zeit vergleichen zu können, wird eine Anzahl von Energiepegelunterschieden in einer Speichereinheit gespeichert, zum Beispiel im Tondetektor 3, im Rückkopplungsdetektor 4 oder extern. Die Speichereinheit kann z. B. eine einfache Verzögerung sein, die einen oder zwei vorherige Werte hält, oder jede Art von Register, Speicher usw. In dieser beispielhaften Ausführungsform der Erfindung ist die Speichereinheit ein FIFO-Puffer. Der gespeicherte Energiepegelunterschied 8 kann auf einer beliebigen Länge eines Eingangsaudiosignals basieren, z. B. auf jedem Abtastwert, oder über eine Anzahl von Abtastwerten gemittelt sein.
  • Da die nachfolgende Audio-Rückkopplungserkennung die Energiepegelunterschiede vorzugsweise mit einer niedrigeren Rate als die Audiosignalverarbeitung verarbeiten kann, z. B. um langsamere Tendenzen wie den Aufbau von Audio-Rückkopplungen zu überwachen, kann die Bildung von Energiepegelunterschieden mit der Audiosignalverarbeitungsrate durchgeführt werden und dann mit niedrigeren Raten von der nachfolgenden Verarbeitung verwendet werden, oder mit niedrigeren Raten durchgeführt werden. In einer beispielhaften Ausführungsform der Erfindung wird der Energiepegelunterschied nur alle 50 ms des Eingangsaudiosignals berechnet und in der Speichereinheit gespeichert, da dies eine bevorzugte Rate für die Überwachung der Entwicklung durch die spätere Rückkopplungserkennungsverarbeitung sein kann. In anderen Ausführungsformen wird der Energiepegelunterschied viel schneller berechnet und in der Speichereinheit gespeichert, zum Beispiel mit der Rate der Aud iosi g na lverarbeitung.
  • Wenn zwei aufeinanderfolgende Energiepegelunterschiede ermittelt wurden, werden diese von einem Halte-Detektor 9 des Rückkopplungsdetektors 4 verglichen, um zu überprüfen, ob ein markanter Ton über die beiden Energiepegelunterschiedsmessungen hinweg gehalten wird. Dieser Vergleich von Energiepegelunterschieden von zwei verschiedenen Zeitpunkten kann wiederum mit der Rate des Energiepegelunterschieds durchgeführt werden, die die Audiosignalverarbeitungsrate sein kann, oder mit einer langsameren Rate, die mit der Rückkopplungserfassungsrate vergleichbar ist. Zum Beispiel sind die beiden verglichenen Energiepegelunterschiede durch 50 ms getrennt, so dass eine Halte-Erkennung auf der Entwicklung über 50 ms des Eingangsaudiosignals basiert. In einer anderen Ausführungsform, in der die Energiepegelunterschiede mit einer schnelleren Rate, z. B. mit der Audiosignalverarbeitungsrate, berechnet werden, können die Energiepegelunterschiedsvergleiche, d. h. die Halte-Erkennung, auch schneller, z. B. mit der Audiosignalverarbeitungsrate, durchgeführt werden, und die anschließende Überwachung der Halte-Erkennungsausgabe kann mit einer niedrigeren Rate, wie z. B. alle 20 ms, 30 ms, 50 ms oder 80 ms, durchgeführt werden.
  • Ein anhaltender markanter Ton kann auf eine Audio-Rückkopplung hinweisen. Zu beachten ist, dass in anderen Ausführungsformen der Erfindung der Energiepegelunterschiedsvergleich auf mehr als zwei Energiepegelunterschieden basieren kann. Beispielsweise können drei aufeinanderfolgende Energiepegelunterschiede über z. B. 100 ms verglichen werden, um festzustellen, dass ein markanter, anhaltender Ton im Eingangsaudiosignal vorhanden ist. Wenn die aufeinanderfolgend erhaltenen Energiepegelunterschiede unterschiedlich sind, was auf das Fehlen eines markanten Tons hinweist, kann dies im Allgemeinen durch einen vom Halte-Detektor 9 festgestellten Halte-Zustand 10 dargestellt werden. Wenn die aufeinanderfolgend erhaltenen Energiepegelunterschiede annähernd gleich sind, was auf das Vorhandensein eines markanten Tons hinweist, wird dies ebenfalls durch den Halte-Zustand repräsentiert. Ein vorbestimmter Schwellenwert für die Änderung des Energiepegelunterschieds kann angewendet werden, um zu bestimmen, wann die Änderung ausreichend ähnlich ist, um das Vorhandensein eines markanten Tons anzuzeigen.
  • Der Halte-Detektor kann Energiepegelunterschiede vergleichen, um einen Halte-Zustand auf mehrere verschiedene Arten zu erhalten. Ein Beispiel ist die Berechnung eines Verhältnisses der Energiepegelunterschiede, mit anderen Worten die Bestimmung einer prozentualen Änderung gegenüber dem vorherigen Energiepegelunterschied. In einer bevorzugten Ausführungsform der Erfindung jedoch subtrahiert der Halte-Detektor die beiden Energiepegelunterschiede, um eine subtraktive Differenz zwischen den Energiepegelunterschieden zu erhalten. Wenn diese Differenz annähernd Null ist, d.h. unter einem Schwellenwert für die Änderung des Energiepegelunterschieds, wird ein anhaltender markanter Ton detektiert, und ein Halte-Zustand 10, der diese Information enthält, wird an einen Rückkopplungszustandsvalidierer 11 geliefert. Auch wenn die Subtraktion der beiden Energiepegelunterschiede nicht annähernd gleich ist, wird ein Halte-Zustand 10 umfassend diese Information an den Rückkopplungszustandsvalidierer 11 geliefert.
  • Basierend auf verschiedenen Eingaben bestimmt der Rückkopplungszustandsvalidierer 11, ob das Eingangsaudiosignal eine Audio-Rückkopplung umfasst. In dieser besonderen Ausführungsform der Erfindung empfängt der Rückkopplungszustandsvalidierer 11 den Halte-Zustand 10 und bestimmt, dass das Eingangsaudiosignal eine Audio-Rückkopplung umfasst, wenn der Halte-Zustand 10 anzeigt, dass zwei Energiepegelunterschiede ungefähr gleich sind. Der Rückkopplungszustandsvalidierer gibt dann eine Rückkopplungsinformation 12 aus, z. B. einen Audio-Rückkopplungszustand. Im Allgemeinen wird die Information, ob eine Audio-Rückkopplung erkannt wird oder nicht, in der Rückkopplungsinformation 12 gegeben, die vom Rückkopplungszustandsvalidierer 11 gesendet wird. In weiteren Ausführungsformen der Erfindung kann die Rückkopplungsinformation 12 zusätzliche Informationen enthalten, einschließlich, aber nicht beschränkt auf, zum Beispiel die Frequenz der erkannten Audio-Rückkopplung, den Energiepegelunterschied der erkannten Audio-Rückkopplung, der aus dem markanten Ton, der mit der Audio-Rückkopplung verbunden ist, und/oder dem Audio-Rückkopplungsenergiepegel erhalten wird.
  • Die Ausführungsform von 1 ist somit in der Lage, Audio-Feedback in einem Eingangsaudiosignal zu erkennen. Wenn beispielsweise ein Eingangsaudiosignal 2 von einem markanten Ton mit einer Frequenz von etwa 75 Hz dominiert wird, und die beiden Analyseaudiofilter wie in oben beschreiben in 1b gezeigt bei 41 Hz bzw. 82 Hz zentriert sind, wird das erste gefilterte Audiosignal 6a um etwa 15 dB im Vergleich zum Eingangsaudiosignal 2 gedämpft, während das zweite gefilterte Audiosignal um etwa 5 dB im Vergleich zum Eingangsaudiosignal gedämpft wird. Der Vergleicher für gefilterte Audiosignale 7 vergleicht die gefilterten Audiosignale 6a, 6b und erhält einen Energiepegelunterschied 8 von ca. 10 dB, z. B. für die ersten 50 ms des Eingangsaudiosignals. Der Energiepegelunterschied 8 wird dann der Rückkopplungsdetektoreinheit 4 zugeführt, wo sie im FIFO-Puffer gespeichert wird. Dann wird in einem sich wiederholenden Schritt ein zweiter Energiepegelunterschied, der z. B. den nächsten 50 ms des Eingangsaudiosignals entspricht, ermittelt und im FIFO-Puffer gespeichert. In diesem Beispiel werden die beiden 50 ms-Intervalle des Eingangsaudiosignals von demselben markanten 75 Hz-Ton dominiert. Daher sind die beiden erhaltenen aufeinanderfolgenden Energiepegelunterschiede mit jeweils 10 dB ungefähr gleich. Der Halte-Detektor 9 nimmt die beiden ersten Werte im FIFO-Puffer und vergleicht sie, und basierend auf diesem Vergleich stellt er fest, dass die beiden Energiepegel ungefähr gleich sind und dass Halten erkannt wird. Der Halte-Detektor sendet dann einen Halte-Zustand 10, der diese Information enthält. Der Rückkopplungszustandsvalidierer 11 empfängt den Halte-Zustand und bestimmt basierend auf dem bestätigten Halte-Zustand, dass das Eingangsaudiosignal mit einer Länge von 100 ms eine Audio-Rückkopplung enthält. Der Rückkopplungszustandsvalidierer sendet dann eine Rückkopplungsinformation 12, umfassend diese Information, z. B. als Audio-Rückkopplungszustand. Die Rückkopplungsinformation kann an einen Benutzer oder an eine weitere Audioverarbeitungseinheit zur weiteren Audioanalyse geliefert werden. Vorzugsweise wird die Audio-Rückkopplungsinformation anschließend verwendet, um das Audio-Feedback zu behandeln, z. B. zurückzuweisen. Es ist zu beachten, dass selbst wenn die Lautstärke des Eingangsaudiosignals zwischen den Differenzmessungen geändert wird, der erhaltene Energiepegelunterschied und damit die Darstellung des markanten Tons weitgehend unbeeinflusst bleibt, da die Erkennung auf relativen Pegeln zwischen den Analyseaudiofiltern basiert.
  • Wenn der Energiepegelunterschied 8 eines Eingangsaudiosignals bei einer ersten Messung 10 dB beträgt und eine nachfolgende Energiepegelunterschiedsmessung eine Differenz von 15 dB ergibt, würde der Halte-Detektor 9 feststellen, dass die beiden aufeinanderfolgenden Energiepegelunterschiede zu unterschiedlich sind, und einen Halte-Zustand senden, der anzeigt, dass kein Halten erkannt wurde. Basierend auf diesem Halte-Zustand würde der Rückkopplungszustandsvalidierer die Rückkopplungsinformation 12 senden, umfassend die Information, dass das Audiosignal keine Audio-Rückkopplung enthält. In anderen Ausführungsformen der Erfindung sendet der Rückkopplungszustandsvalidierer nur dann Rückkopplungsinformationen 12, wenn der Rückkopplungszustandsvalidierer feststellt, dass das Eingangsaudiosignal eine Audio-Rückkopplung umfasst.
  • Zu beachten ist, dass bei hinreichend hohen Frequenzen oder Frequenzen bei geringer Lautstärke des Eingangsaudiosignals, das Eingangsaudiosignal 2 durch die Analyseaudiofilter 5a, 5b in einem solchen Ausmaß gedämpft werden kann, dass es nicht möglich ist, einen Energiepegelunterschied 8 zu erhalten, der zuverlässig die Frequenz angibt, aufgrund des schlechten Signal-Rausch-Verhältnis des gefilterten Audiosignals 6a, 6b. Es ist jedoch zu beachten, dass Filtertypen und - konfigurationen im Rahmen der Erfindung variiert werden können, was beispielsweise zu anderen Frequenzgrenzen oder sogar keinen Frequenzgrenzen führen kann (z. B. durch die Implementierung einer großen Anzahl von einzelnen Filtern, die alle Frequenzen abdecken). Somit ist die Erfindung nicht auf bestimmte Frequenzbereiche beschränkt.
  • 2 zeigt eine Frequenzdarstellung 261a der relativen Dämpfung, die die beiden in 1b dargestellten Analyseaudiofilter auf ein einen markanten Ton umfassendes Eingangsaudiosignal anwenden können. Unterhalb von etwa 58 Hz ist die relative Dämpfung größer als 0, und oberhalb liegt die relative Dämpfung unter 0 dB. Dies spiegelt wider, dass die erste Frequenzdarstellung 26a unterhalb dieser Frequenz höher auf der Dämpfungsachse liegt als die zweite 26b und umgekehrt.
  • Die relative Dämpfung kann typischerweise für verschiedene Ausführungsformen beispielsweise die Grundlage für den Energiepegelunterschied sein. In einem ungefähren Frequenzbereich, der durch die Filtermittenfrequenzen der Analyseaudiofilter bestimmt wird, weist die Frequenzdarstellung 261a eine lineare Steigung auf. Diese lineare Steigung kann verwendet werden, um einen Energiepegelunterschied in eine Darstellung des markanten Tons umzuwandeln, wobei eine Differenz-zu-Frequenz-Abbildungsfunktion 27 verwendet wird. In dieser beispielhaften Darstellung ist die Abbildungsfunktion 27 einfach eine Gerade (allerdings auf einer nichtlinearen Skala). So kann z. B. eine relative Dämpfung von etwa 8 dB durch die Abbildungsfunktion 27 in eine Frequenz von 50 Hz umgewandelt werden.
  • Es ist zu beachten, dass diese beispielhafte Abbildungsfunktion 27 keine genaue Darstellung der Frequenzdarstellung der relativen Energiepegeldämpfung 261a außerhalb der Filtermittenfrequenzen der beiden Analyseaudiofilter ist, wie z. B. den in 1b dargestellten Analyseaudiofiltern. Der ungefähre Bereich, der durch die beiden Filtermittenfrequenzen bestimmt wird, stellt somit ein zulässiges Frequenzband dar.
  • In anderen Ausführungsformen können eine oder mehrere Abbildungsfunktionen verwendet werden, um auch eine genaue Darstellung des markanten Tons außerhalb der Filtermittenfrequenzen der Filtereinheiten/Analyseaudiofilter zu erhalten.
  • 3 zeigt eine schematische Übersicht über eine Ausführungsform der Erfindung, die beispielsweise in einem Audioverarbeitungssystem 1 implementiert sein kann, das zum Empfang und zur Verstärkung von Schall bei Konzerten, in Proberäumen, in Theatern, in Hörgeräten, in Kopfhörern, in Mobiltelefonen oder in Personalcomputern usw. verwendet wird. Diese besondere Ausführungsform der Erfindung ist in der Lage, Schall von einem Mikrofon als ein Audiosignal zu empfangen, Audio-Rückkopplungen in dem Audiosignal zu erkennen, erkannte Audio-Rückkopplungen zu unterdrücken und das Audiosignal, in dem erkannte Audio-Rückkopplungen unterdrückt wurden, an einen Lautsprecher zur Tonwiedergabe zu liefern.
  • Die dargestellte Ausführungsform umfasst ein Mikrofon 14, das empfangenen Schall in ein Eingangsaudiosignal 2 umwandelt, eine Verarbeitungseinheit 51 konfiguriert zum Erkennen von Audio-Rückkopplungen, eine Rückkopplungsunterdrückungseinheit 13 konfiguriert zum Unterdrücken erkannter Audio-Rückkopplungen, und einen Lautsprecher 15 zum Erzeugen von Schall basierend auf einem Ausgangsaudiosignal 16, wobei erkannte Audio-Rückkopplungen unterdrückt werden. Die Verarbeitungseinheit 51 umfasst einen Vorprozessor 17, einen Tondetektor 3 und einen Rückkopplungsdetektor 4. Das Mikrofon, das auch ein Instrumentenabnehmer sein kann, empfängt Schall von z. B. einem Instrument oder einer Stimme. Zusätzlich, z. B. in den meisten Live-Situationen, kann das Mikrofon 14 zusätzlich den vom Lautsprecher 15 erzeugten Schall empfangen, wodurch eine Rückkopplungsschleife entstehen kann, die unter gewissen Umständen laute, unerwünschte, möglicherweise schädliche Audio-Rückkopplungen verursacht.
  • Ein Dauerschall wird vom Mikrofon 14 empfangen und in ein Eingangsaudiosignal 2 umgewandelt. Das Eingangsaudiosignal kann digital oder analog sein. Das Eingangsaudiosignal kann auch verschiedene Arten von konventioneller Audioverarbeitung durchlaufen, wie Mikrofonverstärkung, Pufferung, Mischen usw., bevor es von der vorliegenden Erfindung verarbeitet wird. Das Eingangsaudiosignal wird von dem Vorprozessor 17 und der Rückkopplungsunterdrückungseinheit 13 empfangen. Eine beispielhafte Ausführungsform eines erfindungsgemäßen Vorprozessors 17 ist in 5 dargestellt. Der Vorprozessor 17 bereitet das Eingangsaudiosignal 2 für die Rückkopplungserkennung vor, beispielsweise durch Rauschfilterung, und gibt ein vorverarbeitetes Audiosignal 18 aus, das von dem Tondetektor 3 empfangen wird, wie er zum Beispiel in 1a dargestellt ist, oder wie er weiter unten näher beschrieben wird. Der Tondetektor 3 gibt einen Energiepegelunterschied 8 aus, der eine Darstellung eines markanten Tons, falls vorhanden, im Eingangsaudiosignal 2 ist. Dann empfängt eine Rückkopplungsdetektoreinheit 4, von der eine Ausführungsform in 1a dargestellt ist oder wie weiter unten im Detail beschrieben, den Energiepegelunterschied 8.
  • In einigen fortgeschrittenen Ausführungsformen der Erfindung kann die Rückkopplungsdetektoreinheit 4 zusätzlich zu dem, was oben beschrieben ist, eine zusätzliche Validierung des Vorhandenseins von Audio-Rückkopplungen durchführen, die einen Zugriff auf das Eingangsaudiosignal 2 erfordern kann, wie durch die gestrichelte Linie angezeigt. Beispielsweise kann sie so konfiguriert sein, dass sie Oberschwingungen und Unterschwingungen eines potenziellen markanten Audio-Rückkopplungstons auswertet, wie nachstehend mit Bezug auf 13 beschrieben.
  • Es ist zu beachten, dass die Schritte des Empfangens von Schall, der Vorverarbeitung eines Eingangsaudiosignals und der Erzeugung von Energiepegelunterschieden sich wiederholen oder kontinuierlich sein können. Somit können die Energiepegelunterschiede als ein Signal interpretiert werden, das sowohl kontinuierlich als auch digital sein kann, und wie oben ausgeführt, mit der Audiosignalverarbeitungsrate oder einer Überwachungsrate.
  • Die Rückkopplungsdetektoreinheit 4 vergleicht die empfangenen Energiepegelunterschiede, um ihre Differenz zu bestimmen. Der Vergleich kann kontinuierlich, oder beispielsweise bei jeder Abtastung, oder in langsameren Raten, z. B. in Intervallen zwischen 10 und 150 ms, durchgeführt werden. Basierend auf diesem Vergleich gibt die Rückkopplungsdetektoreinheit 4 eine Rückkopplungsinformation 12 aus, die anzeigt, ob das Eingangsaudiosignal eine Audio-Rückkopplung enthält. Wenn die Energiepegelunterschiede nicht ausreichend gleich sind, zeigt die Rückkopplungsinformation 12 der Rückkopplungsunterdrückungseinheit an, dass das Eingangsaudiosignal keine zu unterdrückende Audio-Rückkopplung enthält. Die Rückkopplungsunterdrückungseinheit 13 gibt dann ein Ausgangsaudiosignal 16, das mit dem Eingangsaudiosignal 2 identisch ist, an einen Lautsprecher 15 aus, vorzugsweise über eine Verstärkereinheit (nicht dargestellt), und der Lautsprecher 15 erzeugt Schall basierend auf dem empfangenen Ausgangsaudiosignal. Wenn die Rückkopplungsdetektoreinheit 4 feststellt, dass die verglichenen Energiepegelunterschiede ausreichend gleich sind, um eine Audio-Rückkopplung anzuzeigen, informiert die Rückkopplungsinformation 12 die Rückkopplungsunterdrückungseinheit 13, dass das Eingangsaudiosignal eine Audio-Rückkopplung enthält. Die Rückkopplungsunterdrückungseinheit 13 wendet dann Filter auf das empfangene Eingangsaudiosignal an, um die Frequenz der erkannten Audio-Rückkopplung zu unterdrücken, bevor sie das rückkopplungsunterdrückte Ausgangsaudiosignal 16 an den Lautsprecher 15, möglicherweise über einen Verstärker, liefert.
  • Die Audio-Rückkopplungsfrequenz wird als die Frequenz des markanten Tons bestimmt, der vom Tondetektor identifiziert wurde. Der Energiepegelunterschied ist eine Darstellung der Frequenz des markanten Tons. Daher werden ein oder mehrere zur Unterdrückung der erkannten Audio-Rückkopplung geeignete Rückkopplungsunterdrückungsfilter, die weiter unten ausführlicher beschrieben werden, von der Rückkopplungsunterdrückungseinheit basierend auf dem Energiepegelunterschied angewendet.
  • Die Anzahl der angewendeten Unterdrückungsfilter, die Verstärkungsreduktion und die Mittenfrequenz dieser Filter können auf dem Energiepegel der Rückkopplung und der Frequenz der erkannten Audio-Rückkopplung basieren.
  • Die Rückkopplungsinformation 12 kann verschiedene Informationen umfassen. Zum Beispiel kann sie eine oder mehrere Energiepegelunterschiede, die Frequenz der detektierten Audio-Rückkopplung und/oder einen Audio-Rückkopplungsstatus umfassen, der darüber informiert, ob das Eingangsaudio eine Audio-Rückkopplung enthält.
  • 4 zeigt eine visuelle Darstellung von Verfahrensschritten gemäß einer Ausführungsform der Erfindung. Diese Ausführungsform der Erfindung ist in der Lage, automatisch Audio-Rückkopplungen in einem Eingangsaudiosignal zu erkennen und umfasst vier Verfahrensschritte S1-S4. Es ist jedoch zu beachten, dass Ausführungsformen der Erfindung nicht auf diese speziellen Verfahrensschritte beschränkt sind. Insbesondere können bevorzugte Ausführungsformen zusätzliche Schritte umfassen, wie im Folgenden beschrieben.
  • In Schritt S1 wird ein Eingangsaudiosignal separat von einer Mehrzahl von verschiedenen Analyseaudiofiltern empfangen, und die Analyseaudiofilter filtern separat die empfangenen Eingangsaudiosignale, um eine Mehrzahl von gefilterten Audiosignalen zu erzeugen.
  • In Schritt S2 wird ein Energiepegelunterschied durch Vergleichen von mindestens zwei der erzeugten gefilterten Audiosignale erhalten.
  • In Schritt S3 wird eine Mehrzahl von Energiepegelunterschieden ermittelt, indem eine oder mehrere Wiederholungen der Schritte S1 und S2 durchgeführt werden.
  • In Schritt S4, der vorzugsweise kontinuierlich während der Wiederholungen von Schritt S3 durchgeführt wird, wird das Vorhandensein einer Audio-Rückkopplung basierend auf einem Vergleich von mindestens zwei Energiepegelunterschieden erkannt.
  • In einigen Ausführungsformen der Erfindung wird das Verfahren auf einer Schaltung oder einem Prozessor implementiert, der die Schritte des Verfahrens kontinuierlich wiederholt durchführt. Ein oder mehrere der Schritte können zumindest teilweise parallel ausgeführt werden.
  • 5 zeigt eine Ausführungsform eines Vorprozessors, der eine Periodendetektionseinheit 23 mit zwei Vorverarbeitungsfiltern 25a, 25b und einen Schwellenwertdetektor 24 umfasst. Die Periodendetektionseinheit 23 reduziert die Menge an nichtperiodischem Rauschen, das zum Beispiel von einem Mikrofon aufgenommen wird, das das Eingangsaudiosignal 2 liefert.
  • Ein Eingangsaudiosignal 2 wird der Periodendetektionseinheit 23 zugeführt. Dabei wird das Eingangsaudiosignal durch zwei Vorverarbeitungsfilter gefiltert, die adaptive Filter in einer Line-Enhancer-Konfiguration sein können. Um das Signal-zu-Rausch-Verhältnis für die Rückkopplungserkennung weiter zu verbessern, werden zwei Line-Enhancer-Stufen in Reihe geschaltet. Andere Ausführungsformen der Erfindung können andere Arten von Filtern und andere Arten von Konfigurationen der Filter verwendet werden. Nichtperiodisches Rauschen kann beispielsweise Umgebungsgeräusche und aus einem Lautsprecher kommende Musik umfassen, wenn der Vorprozessor 17 in einem Tonsystem implementiert ist, das einen Lautsprecher wie in 3 dargestellt umfasst.
  • Die Ausgabe der Periodendetektionseinheit 23 wird dann von der Schwellenwertdetektoreinheit 24 empfangen, wobei der Energiepegel des Signals gemessen wird. Wenn der Energiepegel des Signals einen Schwellenwert überschreitet, z. B. -40 dBFS, gibt die Schwellenwertdetektoreinheit 24 ein vorverarbeitetes Audiosignal 18 zur weiteren Analyse aus.
  • In anderen Ausführungsformen der Erfindung kann das Eingangsaudiosignal 2 zunächst in die Schwellenwertdetektoreinheit 24 gelangen, wonach die Ausgabe der Schwellenwertdetektoreinheit 24 von der Periodendetektionseinheit empfangen wird. Dies hat den Vorteil, dass die Filterung durch die Periodendetektionseinheit nur dann angewendet wird, wenn der Schwellenwert erreicht ist und die Wahrscheinlichkeit einer Audio-Rückkopplung im Eingangsaudiosignal höher ist, als wenn der Energiepegel des Eingangsaudiosignals niedriger ist.
  • Andere Ausführungsformen eines Vorprozessors 17 können zusätzliche Vorverarbeitungsschritte zur Vorbereitung des Signals für die Audio-Rückkopplungserkennung umfassen.
  • 6 zeigt eine spezielle Ausführungsform der Periodendetektionseinheit 23, die auch in 5 dargestellt ist. Die in 6 dargestellte bestimmte Ausführungsform umfasst zwei Periodenfilter 39a, 39b in Reihe und zwei Verzögerungseinheiten 40a und 40b.
  • Ein erster Periodenfilter 39a empfängt ein Eingangsaudiosignal 2 und ein verzögertes Eingangsaudiosignal, das durch eine erste Verzögerungseinheit 40a verzögert wird. Der erste Audiofilter 39a reduziert dann nichtperiodische Inhalte im Eingangsaudiosignal, zum Beispiel basierend auf der Korrelation von Komponenten des Eingangsaudiosignals und des verzögerten Eingangsaudiosignals. Der erste Periodenfilter 39a gibt dann ein erstes gefiltertes Signal 52 aus, das von einem zweiten Periodenfilter 39b und von einer zweiten Verzögerungseinheit 40b empfangen wird. Der zweite Periodenfilter 39b empfängt ferner ein verzögertes erstes gefiltertes Signal 53 von der zweiten Verzögerungseinheit 40b und reduziert dann weiter nichtperiodische Inhalte in dem empfangenen ersten gefilterten Signal, zum Beispiel basierend auf der Korrelation von Komponenten des ersten gefilterten Signals 52 und des verzögerten ersten gefilterten Signals 53.
  • 7 zeigt eine besondere Ausführungsform eines erfindungsgemäßen Tondetektors 3, der eine Energiedifferenz-zu-Frequenz-Abbildungseinheit 20 aufweist. Die Ausführungsform umfasst zwei Analyseaudiofilter 5a, 5b und einen Vergleicher für gefilterte Audiosignale 7, der in einer ähnlichen Konfiguration wie der in 1 dargestellte Tondetektor 3 angeordnet ist. Der vom Vergleicher für gefilterte Audiosignale 7 ermittelte Energiepegelunterschied 8 wird von der Energiedifferenz-zu-Frequenz-Abbildungseinheit 20 empfangen, die den Energiepegelunterschied 8 unter Verwendung einer Differenz-zu-Frequenz-Abbildungsfunktion in eine Darstellung, z.B. eine Frequenz, des markanten Tons umwandelt und diese Darstellung des markanten Tons als eine repräsentative Tonfrequenz 22 ausgibt. Ein anschauliches Beispiel für eine Differenz-zu-Frequenz-Abbildungsfunktion 27 ist in 2 dargestellt.
  • Die Differenz-zu-Frequenz-Abbildungsfunktion kann auf unterschiedliche Weise implementiert werden. Sie kann zum Beispiel eine lineare Funktion oder eine nichtlineare Funktion sein. Sie kann auch als Lookup-Tabelle implementiert sein.
  • 8 zeigt eine Ausführungsform eines erfindungsgemäßen Tondetektors, basierend auf drei Analysefiltern 5a, 5b, 5c, zwei Vergleichern für gefilterte Audiosignale 7a, 7b und drei Energiedetektoren 19a, 19b, 19c. Diese Ausführungsform ist der Ausführungsform von 7 im Wesentlichen ähnlich. Die Ausführungsform von 8 umfasst jedoch zusätzlich einen dritten Analyseaudiofilter 5c, der das Eingangsaudiosignal filtert, um ein drittes gefiltertes Audiosignal 6c zu erhalten. Ein Beispiel für drei geeignete Analyseaudiofilter wird im Folgenden unter Bezugnahme auf die 9a-9b beschrieben. Darüber hinaus umfasst diese Ausführungsform Energiedetektoren 19a, 19b, 19c, die den Energiepegel 50a, 50b, 50c der gefilterten Audiosignale 6a, 6b, 6c erfassen, die von den Analyseaudiofiltern 5a, 5b, 5c geliefert werden. Sobald das erste gefilterte Audiosignal 6a, das gefilterte Audiosignal 6b und das dritte Analyseaudiosignal 6c erzeugt worden sind, werden diese Signale durch zwei Energiepegelvergleicher 7a, 7b verarbeitet, um zwei vorläufige Energiepegelunterschiede 54a, 54b zu erhalten, die wiederum einer Energiedifferenz-zu-Frequenz-Abbildungseinheit zugeführt werden, um eine repräsentative Tonfrequenz 22 basierend auf einer Differenz-zu-Frequenz-Abbildungsfunktion und einem Energiepegelunterschied 8 zu bestimmen.
  • Die gefilterten Audiosignale, die von zwei benachbarten Analyseaudiofiltern mit den höchsten Ausgangsenergiepegeln ausgegeben werden, bestimmen grob, in welchem Bereich, d.h. zwischen welchen beiden Analyseaudiofiltern, die Frequenz des markanten Tons, falls vorhanden, liegt. Dabei wird in dieser besonderen Ausführungsform der Erfindung der Energiepegelunterschied 8 als derjenige der beiden vorläufigen Energiepegelunterschiede 54a bzw. 54b ausgewählt, der basierend auf dem benachbarten Paar gefilterter Audiosignale mit dem höchsten Energiepegel ergibt.
  • In dieser Ausführungsform der Erfindung basiert die repräsentative Tonfrequenz 22 auf dem Energiepegelunterschied 8.
  • 9a-b zeigen eine visuelle Darstellung von drei Analyseaudiofiltern und ihrer entsprechenden relativen Dämpfung. 9a ist ähnlich wie 1b, abgesehen davon, dass die visuelle Darstellung von 9a drei Analyseaudiofiltern entspricht, wie sie z.B. als erster, zweiter und dritter Analyseaudiofilter in der in 8 dargestellten Ausführungsform implementiert sind. In 9a entsprechen die drei Frequenzdarstellungen der Energiepegeldämpfung 26a, 26b, 26c Bandpassfiltern mit jeweiligen Filtermittenfrequenzen von etwa 41 Hz, 82 Hz und 165 Hz.
  • In 9b ist eine erste relative Dämpfung 261a dargestellt, die der Dämpfungsdifferenz entspricht, die die erste und zweite Frequenzdarstellung der Energiepegeldämpfung 26a, 26b anwendet. Des Weiteren ist eine zweite relative Dämpfung 261b dargestellt, die der Dämpfungsdifferenz entspricht, die die zweite und dritte Frequenzdarstellung der Energiepegeldämpfung 26a, 26b anwendet. Die erste 261a und zweite Darstellung 261b in 9b haben jeweils eine steile Flanke in einem separaten Frequenzbereich. So kann ein erstes Filterpaar, das der ersten 26a und der zweiten Darstellung 26b in 9a entspricht, ein genaues Maß für die Frequenz des markanten Tons in einem ersten Frequenzbereich liefern, während ein zweites Filterpaar, das der zweiten 26b und der dritten Darstellung 26c in 9a entspricht, ein genaues Maß für die Frequenz des markanten Tons in einem zweiten Frequenzbereich liefern kann. Diese verschiedenen optimalen Frequenzbereiche können kombiniert werden, z. B. durch die Frequenzabbildungseinheit oder durch einen gewichteten Mittelwert.
  • 10a-c zeigen visuelle Darstellungen verschiedener anderer Analyseaudiofilterkombinationen. Jede der Teilfiguren illustriert die Darstellungen auf einer horizontalen Achse, die eine beliebige Frequenzachse ist, und einer vertikalen Achse, die eine beliebige Energiepegelachse ist.
  • 10a illustriert die Verwendung einer Mehrzahl von Tiefpassfiltern in Ausführungsformen der Erfindung. Jedes einzelne Filter kann in Kombination mit einem anderen Filter mit höherer Grenzfrequenz verwendet werden, um eine Darstellung eines markanten Tons in einem Frequenzbereich zu bestimmen. Durch eine Mehrzahl von Tiefpassfiltern, statt z.B. einem einzigen, ist es möglich, die einzelnen Frequenzbereiche so zu kombinieren, dass ein beliebiger Frequenzbereich abgedeckt wird. Zum Beispiel kann ein erster Filter, der als ganz linke Darstellung 26a dargestellt ist, in Kombination mit einem der anderen Filter, die als Darstellungen 26b-26e mit höherer Grenzfrequenz dargestellt sind, einen ersten Frequenzbereich abdecken. Dann kann ein zweiter Filter, der als nächste Darstellung 26b dargestellt ist, in Kombination mit einem der anderen Filter, die als Darstellungen 26c-26e mit höherer Grenzfrequenz dargestellt sind, einen nächsten Frequenzbereich abdecken, usw.
  • Zum Beispiel sind in einer Ausführungsform der Erfindung mindestens fünf separate Tiefpassfilter mit Grenzfrequenzen von 20 Hz, 100 Hz, 500 Hz, 2500 Hz und 12500 Hz implementiert. Solche Filter können z. B. Frequenzabhängigkeiten aufweisen, wie sie in 10a durch die Darstellungen 26a, 26b, 26c, 26d und 26e visualisiert sind. Der erste Filter, dargestellt durch die erste Darstellung 26a, kann in Kombination mit dem dritten Filter, dargestellt durch die dritte Darstellung 26c, verwendet werden, um einen Frequenzbereich von 20 Hz bis 100 Hz abzudecken. Der zweite Filter, der durch die zweite Darstellung 26b repräsentiert wird, kann in Kombination mit dem vierten Filter, der durch die dritte Darstellung 26d repräsentiert wird, verwendet werden, um den Frequenzbereich von 100 Hz bis 500 Hz abzudecken, usw. Solche Ausführungsformen können optional auch auf einem ungefilterten Eingangsaudiosignal basieren, zur Verwendung für einen Vergleich von Analyseaudiosignalen.
  • In anderen Ausführungsformen kann ein ähnliches Prinzip unter Verwendung von Hochpassfiltern anstelle von Tiefpassfiltern implementiert werden.
  • 10b zeigt, dass ein Tiefpassfilter 26a, ein Bandpassfilter 26b und ein Hochpassfilter 26c in Ausführungsformen der Erfindung kombiniert werden können. Beliebige andere Kombinationen mit unterschiedlicher Anzahl der verschiedenen Filtertypen sind anwendbar.
  • 10c zeigt, wie ebenso eine Mehrzahl von Bandpassfiltern kombiniert werden kann, um einen beliebigen Frequenzbereich abzudecken. Eine Ausführungsform hiervon wird weiter unten unter Bezugnahme auf die 11-12 ausgeführt.
  • 11 zeigt eine Ausführungsform eines erfindungsgemäßen Tondetektors, basierend auf fünf Analyseaudiofiltern 5a, 5b, 5c, 5d, 5e, die das Eingangsaudiosignal 2 filtern, um ein gefiltertes Audiosignal 6a, 6b, 6c, 6d und 6e zu erzeugen. Nachdem die gefilterten Audiosignale gebildet wurden, werden sie von einem Vergleicher für gefilterte Audiosignale 7 verarbeitet. Der Vergleicher für gefilterte Audiosignale bestimmt den Energiepegel jedes der fünf gefilterten Audiosignale und wählt die gefilterten Audiosignale aus, die von zwei benachbarten Analyseaudiofiltern mit den höchsten Ausgangsenergiepegeln ausgegeben werden, um grob zu bestimmen, in welchem Bereich, d.h. zwischen welchen zwei Analyseaudiofiltern, die Frequenz des markanten Tons, falls vorhanden, liegt. Mit Bezug auf 12, die weiter unten beschrieben wird, führt z. B. eine Audio-Rückkopplung bei 3000 Hz dazu, dass Filter 26d den höchsten gefilterten Audiosignalenergiepegel ausgibt, und Filter 26c den nächsthöheren. Dadurch kann festgestellt werden, dass die Audio-Rückkopplung zwischen diesen beiden Filtern liegt, und der Energiepegelunterschied kann aus den gefilterten Audiosignalen dieser beiden Filter bestimmt werden. Die Differenz zwischen den Energiepegeln der beiden gefilterten Audiosignale, die aus der Grobabschätzung ausgewählt wurden, werden als Energiepegelunterschied für die weitere Verfahrensanalyse verwendet. Der Energiepegelunterschied wird einer Frequenzabbildungseinheit 20 zugeführt, um die repräsentative Tonfrequenz 22 zu bestimmen. Anwendung von fünf Filtern verbreitert das Frequenzband, innerhalb dessen eine Audio-Rückkopplungsfrequenz genau erkannt werden kann.
  • 12 zeigt eine visuelle Darstellung von fünf Analyseaudiofiltern. Jeder dieser fünf Analyseaudiofilter kann der in 11 dargestellten Ausführungsform der Erfindung entsprechen, die fünf Analyseaudiofilter umfasst. In 12 ist die horizontale Achse eine Frequenzachse, während die vertikale Achse eine Betragsachse ist, die den Energiepegel darstellt.
  • 12 illustriert die Verwendung von fünf Bandpassfiltern mit Filterspitzenfrequenzen von 40 Hz, 200 Hz, 1000 Hz, 5000 Hz und 15500 Hz in einer Ausführungsform der Erfindung. Jeder einzelne Filter kann in Kombination mit einem anderen Filter mit einer anderen Filterspitzenfrequenz verwendet werden, um eine Darstellung eines markanten Tons in einem Frequenzbereich zu bestimmen. Zu beachten ist, dass die Darstellung eines markanten Tons ein Energiepegelunterschied sein kann. Durch eine Mehrzahl von Filtern, statt z.B. einem einzelnen Filter, ist es möglich, die einzelnen Frequenzbereiche so zu kombinieren, dass ein beliebiger Frequenzbereich mit einer von der Anzahl der Filter abhängigen Genauigkeit abgedeckt wird. Zum Beispiel kann ein erster Filter, der als ganz linke Darstellung 26a dargestellt ist, in Kombination mit einem der anderen Filter, die als Darstellungen 26b-26e dargestellt sind und eine höhere Filterspitzenfrequenz aufweisen, einen ersten Frequenzbereich abdecken. Dann kann ein zweiter Filter, der als nächste Darstellung 26b dargestellt ist, in Kombination mit einem der anderen Filter, die als Darstellungen 26c-26e mit einer höheren Filterspitzenfrequenz dargestellt sind, einen nächsten Frequenzbereich abdecken, usw.
  • In einer speziellen Implementierung der Erfindung, die in 12 dargestellt ist, decken Paare von benachbarten Analyseaudiofiltern einen bestimmten Frequenzbereich ab. In dieser Ausführungsform der Erfindung kann ein erster Filter, der als Darstellung 26a ganz links dargestellt ist, in Kombination mit einem benachbarten Filter, der als Darstellung 26b mit einer höheren Spitzenfrequenz 55b dargestellt ist, einen ersten Frequenzbereich 56a abdecken. Dann kann ein zweiter Filter, der als Darstellung 26b dargestellt ist, in Kombination mit einem benachbarten Filter, der als Darstellung 26c mit einer höheren Spitzenfrequenz 55c dargestellt ist, einen zweiten Frequenzbereich 56b abdecken. Ferner kann ein dritter Filter, der als Darstellung 26c dargestellt ist, in Kombination mit einem benachbarten Filter, der als Darstellung 26d mit einer höheren Spitzenfrequenz 55d dargestellt ist, einen dritten Frequenzbereich 56c abdecken, usw.
  • In anderen Ausführungsformen kann ein ähnliches Prinzip unter Verwendung anderer Typen und Bereiche von Filtern implementiert werden.
  • 13 zeigt eine Ausführungsform einer erfindungsgemäßen Rückkopplungsdetektoreinheit, die zusätzlich zu dem in 1 dargestellten Halte-Detektor und Rückkopplungszustandsvalidierer einen weiteren Detektor 29 für abnehmende Energiepegel und einen Oberschwingungsdetektor 28 umfasst, der mit einem Rückkopplungszustandsvalidierer 11 verbunden ist, wobei der Oberschwingungsdetektor 28 fünf Oberschwingungsfilter 30a, 30b, 30c, 30d, 30e umfasst.
  • Eine repräsentative Tonfrequenz 22 eines markanten Tons mit einer Frequenz von 500 Hz, die beispielsweise durch einen Tondetektor wie oben beschrieben identifiziert wird, wird dem Detektor 29 für abnehmende Energiepegel und dem Oberschwingungsdetektor 28 zusammen mit einem Eingangsaudiosignal zugeführt.
  • Der abnehmende Energiepegel nutzt die eingehende repräsentative Tonfrequenz 22 von 500 Hz, um wiederholt den Energiepegel der 500 Hz-Frequenz im Eingangsaudiosignal 2 zu lesen. Wenn der Energiepegel der repräsentativen Tonfrequenz konstant ist oder von einer Wiederholung zur nächsten ansteigt, ist das ein Hinweis darauf, dass die repräsentative Tonfrequenz eine sich aufbauende Audio-Rückkopplung ist. Der Detektor für den abnehmenden Energiepegel sendet diesen Hinweis an den Rückkopplungszustandsvalidierer 11 in Form eines abnehmenden Energiepegelzustands 32. Wenn der Energiepegel der ankommenden 500 Hz-Frequenz abnimmt und damit anzeigt, dass es sich bei dem markanten Ton entweder nicht um eine unerwünschte Audio-Rückkopplung handelt oder dass er im Begriff ist, von selbst zu verschwinden, gibt der Energiepegeldetektor diese Information in Form des abnehmenden Energiepegelzustands 32 weiter.
  • Der Oberschwingungsdetektor verwendet die repräsentative Tonfrequenz 22, die in diesem Beispiel ein 500 Hz-Ton ist, um die Filterkoeffizienten von fünf Oberschwingungsfiltern 30a, 30b, 30c, 30d, 30e zu bestimmen. In dieser Ausführungsform der Erfindung werden die Filterkoeffizienten so bestimmt, dass die Oberschwingungsfilter Bandpassfilter mit einer Spitzenfrequenz, die der ersten, zweiten, dritten und vierten Oberschwingung und der ersten Unterschwingung der repräsentativen Tonfrequenz 22 entspricht, sind. In diesem Beispiel 1000 Hz, 1500 Hz, 2000 Hz, 2500 Hz und 250 Hz. Dann wird jeder Oberschwingungsfilter auf das eingehende Eingangsaudiosignal 2 angewendet und der Energiepegel des Ausgangs jedes Filters gemessen. Der Energiepegel des Ausgangs jedes Oberschwingungsfilters wird dann mit einem gemessenen Energiepegel der repräsentativen Tonfrequenz 22 des Eingangsaudiosignals verglichen. Wenn der Energiepegel der Ausgabe eines der Oberschwingungsfilter über einem Schwellenwert, z. B. -30 dB relativ zum Energiepegel der repräsentativen Tonfrequenz, im Eingangsaudiosignal liegt, ist dies ein Hinweis darauf, dass die repräsentative Tonfrequenz keine Audio-Rückkopplung ist, weil Oberschwingungen vorhanden sind. In diesem Beispiel liegt die Ausgabe aller Oberschwingungsfilter unter -30 dB relativ zum Energiepegel der eingehenden repräsentativen Tonfrequenz von 500 Hz. Der Oberschwingungsdetektor liefert somit die Anzeige eines fehlenden Oberschwingungsgehalts an den Rückkopplungszustandsvalidierer 11 in Form eines Oberschwingungszustands 31.
  • Ähnlich wie bei der in 1 dargestellten Ausführungsform sendet der Halte-Detektor 9 basierend auf den eingehenden Energiepegelunterschieden an den Rückkopplungszustandsvalidierer 11 einen Halte-Zustand, enthaltend Informationen, ob die repräsentative Tonfrequenz, in diesem Beispiel ein 500 Hz-Ton, im Eingangsaudiosignal gehalten wird. In diesem Beispiel wird der 500 Hz-Ton gehalten, so dass die Differenz zwischen den eingehenden Energiepegelunterschieden ungefähr Null bleibt. Der Halte-Detektor sendet also einen Halte-Zustand aus, der anzeigt, dass ein markanter Ton des Eingangsaudiosignals gehalten wird.
  • Der Rückkopplungszustandsvalidierer gibt eine Rückkopplungsinformation 12 basierend auf dem empfangenen abnehmenden Energiepegelzustand 32, dem Oberschwingungszustand 31 und dem Halte-Zustand 10 aus, die anzeigen, ob das Eingangsaudiosignal eine Audio-Rückkopplung umfasst oder nicht. In dieser besonderen Ausführungsform der Erfindung bestimmt der Rückkopplungszustandsvalidierer nur dann, dass das Eingangsaudiosignal eine Audio-Rückkopplung umfasst, wenn es ein Anzeichen für einen anhaltenden markanten Ton, einen ansteigenden oder konstanten Energiepegel der repräsentativen Tonfrequenz und ein Fehlen von Oberschwingungen der repräsentativen Tonfrequenz im Eingangsaudiosignal gibt. In diesem Beispiel werden alle diese Kriterien für eine Audio-Rückkopplung durch die repräsentative Tonfrequenz von 500 Hz erfüllt, und daher wird eine Rückkopplungsinformation, umfassend die Information, dass eine Audio-Rückkopplung bei 500 Hz detektiert wird, vom Rückkopplungsvalidierer 11 versendet.
  • Die Rückkopplungsinformation 12 kann Informationen bezüglich der repräsentativen Tonfrequenz, des Energiepegels der repräsentativen Tonfrequenz sowie weitere von der Rückkopplungsdetektoreinheit 4 erhaltene Informationen und möglicherweise zusätzliche relevante Informationen enthalten.
  • Die Rückkopplungsinformationen 12 können beispielsweise auf einem Bildschirm angezeigt werden, damit ein Benutzer dieses Wissen anwenden kann, um beispielsweise Schritte zur Reduzierung der erkannten Audio-Rückkopplung zu ergreifen. Die Rückkopplungsinformationen 12 können auch anderen Audioverarbeitungseinheiten zugeführt werden, z. B. einer Rückkopplungsunterdrückungseinheit.
  • Alle von der Rückkopplungsdetektoreinheit 4 durchgeführten Schritte und Verarbeitungsschritte können vorteilhaft parallel durchgeführt werden, um die Verarbeitungsgeschwindigkeit der Rückkopplungsdetektoreinheit 4 zu erhöhen.
  • Es liegt im Rahmen der Erfindung, dass die Schritte des Auswertens von Oberschwingungen und Unterschwingungen der repräsentativen Tonfrequenz und der Schritt des Auswertens von abnehmenden Energiepegeln der repräsentativen Tonfrequenz kontinuierlich oder alternativ, beispielsweise alle 50 ms oder öfter oder weniger oft durchgeführt werden. Es ist zu beachten, dass es in verschiedenen Implementierungen gemäß der Erfindung vorteilhaft sein kann, verschiedene unterschiedliche Oberschwingungen und Unterschwingungen der repräsentativen Tonfrequenz auszuwerten.
  • 14 zeigt eine Ausführungsform eines erfindungsgemäßen Halte-Detektors 9, der eine Subtraktionseinheit 46, eine Verzögerungseinheit 40, einen Absolutwertbestimmer 42, eine Hüllkurvenberechnungseinheit 43 und einen Energiepegelunterschiedsänderungsschwellenwertvergleicher 44 umfasst. Der Halte-Detektor 9 zeigt an, ob ein markanter Ton eines Eingangsaudiosignals über die Zeit gehalten wird. Das Halten eines markanten Tons ist ein Hinweis darauf, dass es sich bei diesem Ton um eine Audio-Rückkopplung handelt.
  • Der Energiepegelunterschied 8, der für einen markanten Ton in einem Eingangsaudiosignal repräsentativ ist, wird wiederholt von der Subtraktionseinheit 46 und von der Verzögerungseinheit 40 empfangen. Die Verzögerungseinheit wendet eine Verzögerung auf den empfangene Energiepegelunterschied 8 an, um wiederholt verzögerte Energiepegelunterschieden zu erzeugen. Der Subtraktor empfängt wiederholt den verzögerten Energiepegelunterschied 45 und subtrahiert wiederholt den Energiepegelunterschied 8 von dem empfangenen verzögerten Energiepegelunterschied, um wiederholt einen Energiepegelunterschied 47 zu erzeugen. Ein Absolutwertbestimmer 42 bestimmt den Absolutwert des Energiepegelunterschieds 47, woraufhin eine Hüllkurvenberechnungseinheit die Hüllkurve des Absolutwerts des Energiepegelunterschieds 47 berechnet, um eine Energiepegelunterschiedsänderung 35 zu erzeugen. Der Energiepegelunterschiedsänderungsvergleicher 44 vergleicht dann die Energiepegelunterschiedsänderung 35 mit einem Energiepegelunterschiedsänderungs-Schwellenwert und gibt auf der Grundlage dieses Vergleichs einen Halte-Zustand 10 aus. Wenn der Energiepegelunterschied gleich oder größer als der Schwellenwert für die Energiepegelunterschiedsänderung ist, zeigt der Halte-Zustand 10 an, dass ein markanter Ton des Eingangsaudiosignals gehalten wird. Andernfalls zeigt der Halte-Zustand an, dass ein markanter Ton des Eingangsaudiosignals nicht gehalten wird.
  • In dieser besonderen Ausführungsform der Erfindung ist der Energiepegelunterschiedsänderungsschwellenwert klein, z.B. im Bereich von 0,1 dB bis 0,5 dB gewählt. Dadurch zeigt der Halte-Zustand an, dass ein markanter Ton des Eingangsaudiosignals gehalten wird, wenn die Energiepegelunterschiedsänderung im Wesentlichen Null ist. In anderen Ausführungsformen der Erfindung kann es relevant sein, den Schwellenwert der Energiepegelunterschiedsänderung auf einen höheren Wert anzuheben, um die Halte-Erkennung empfindlicher zu machen. In anderen Ausführungsformen kann es bevorzugt sein, den Schwellenwert für die Energiepegelunterschiedsänderung auf einen niedrigen Wert näher an Null zu senken, um die Empfindlichkeit des Halte-Detektors zu verringern und dadurch das Risiko einer fälschlichen Identifizierung von Halten zu verringern, d.h. fälschlicherweise anzuzeigen, dass die Energiepegelunterschiedsänderung, die zu einem markanten Ton gehört, eine Audio-Rückkopplung in einem Eingangsaudiosignal darstellen kann.
  • 15 illustriert gemäß einer Ausführungsform eine visuelle Darstellung der Energiepegelunterschiedsänderung (in dB subtraktiver Differenz) als Funktion der Zeit (in ms), ermittelt für ein Eingangsaudiosignal, das beispielsweise musikalischen Inhalt und Perioden von Audio-Rückkopplungen umfasst. Der in 15 dargestellte Energiepegelunterschied kann z.B. durch die in 14 dargestellte Ausführungsform der Erfindung berechnet werden.
  • Während eines Intervalls 34, in dem das Eingangsaudiosignal nur Musik und keine Audio-Rückkopplung umfasst, variiert die Energiepegelunterschiedsänderung 35 beträchtlich, da es keinen einzelnen markanten Ton gibt, der das Eingangsaudiosignal dominiert. Umgekehrt, wenn ein markanter Ton, der eine Audio-Rückkopplung repräsentiert, im Eingangsaudiosignal zusammen mit der Musik auftaucht, wie im Intervall 36, wird die Energiepegelunterschiedsänderung plötzlich annähernd Null und bleibt annähernd konstant, bis die Audio-Rückkopplung aussortiert wird oder anderweitig verschwindet.
  • 16 zeigt eine Ausführungsform einer erfindungsgemäßen Rückkopplungsunterdrückungseinheit, von der eine allgemeine Implementierung auch in 3 dargestellt ist. Die in 16 dargestellte Rückkopplungseinheit 13 umfasst einen Energiedetektor 19, eine Filterparameterberechnungseinheit 49, die zum Berechnen von Filterkoeffizienten für 16 Bandsperrfilter einer Filterbank 48 konfiguriert ist.
  • Der Energiedetektor empfängt ein Eingangsaudiosignal und Rückkopplungsinformationen 12 von beispielsweise einer Rückkopplungsdetektoreinheit wie der in 13 dargestellten. In dieser besonderen Ausführungsform der Erfindung umfassen die empfangenen Rückkopplungsinformationen 12 eine repräsentative Tonfrequenz, die der Frequenz der Audio-Rückkopplung entspricht, die beispielsweise von einem Rückkopplungsdetektor wie in 13 dargestellt detektiert wird, sowie Informationen darüber, ob eine Rückkopplung im Audiosignal detektiert wird oder nicht. Wenn der Energiedetektor durch die Rückkopplungsinformation 12 informiert wird, dass eine Rückkopplung im Audioeingangssignal 2 erkannt wird, liest der Energiedetektor den Energiepegel 50 des Eingangsaudiosignals bei der eingehenden repräsentativen Tonfrequenz, um den Energiepegel der Audio-Rückkopplung zu erkennen. Der Energiepegel 50 der Audio-Rückkopplung wird dann der Filterparameterberechnungseinheit 49 zugeführt, die in einem ersten Schritt eine Filterintensitätsprüfung durchführt. Dieser Schritt stellt sicher, dass die Unterdrückung der Audio-Rückkopplung nur dann durchgeführt wird, wenn der Energiepegel der Audio-Rückkopplung einen signifikanten Pegel erreicht. Dies ist ein weiterer Schutzmechanismus gegen die Unterdrückung von z. B. Sprache oder Instrumenten anstelle von Audio-Feedback. Der signifikante Pegel kann je nach verschiedenen Implementierungen der Ausführungsformen variieren. In einigen Ausführungsformen der Erfindung wird die Filterintensitätsprüfung als Teil der Bestimmung, ob das Eingangsaudiosignal eine Audio-Rückkopplung umfasst, durchgeführt.
  • Wenn ein signifikanter Pegel der Audio-Rückkopplung erkannt wird, bestimmt die Filterparameterberechnungseinheit 49 Filterparameter basierend auf der empfangenen repräsentativen Tonfrequenz. In diesem Beispiel bestimmt sie die Filterkoeffizienten eines Bandsperrfilters der Filterbank 48 so, dass die Mittenfrequenz des Bandsperrfilters gleich der eingehenden repräsentativen Tonfrequenz ist. In anderen Ausführungsformen der Erfindung bestimmt die Filterparameterberechnungseinheit 49 ferner eine Verstärkungsreduzierung des Bandsperrfilters bei der ermittelten Filtermittenfrequenz, basierend auf dem eingehenden Energiepegel, der bei der repräsentativen Tonfrequenz des Eingangsaudiosignals gemessen wird. In dieser Ausführungsform der Erfindung ist die Verstärkung des Bandsperrfilters bei -6 dB vorgegeben, und der Gütefaktor der Bandsperre ist bei Q=16 vorgegeben. Andere Ausführungsformen der Erfindung können eine andere Filterverstärkungsreduktion und einen anderen Gütefaktor anwenden.
  • Die Filterparameterberechnungseinheit 49 sendet die berechneten Filterkoeffizienten an die Filterbank, die dann einen der 16 Filter der Filterbank mit den empfangenen Filterkoeffizienten konfiguriert. Dann wird das empfangene Eingangsaudiosignal 2 durch den Bandsperrfilter mit Filterkoeffizienten, die der repräsentativen Tonfrequenz entsprechen, geleitet, um ein gefiltertes Audiosignal zu erzeugen, das als Ausgangsaudiosignal 16 ausgegeben wird.
  • Die Rückkopplungsunterdrückungseinheit ist somit in der Lage, Filterkoeffizienten basierend auf einer markanten Frequenz zu bestimmen, die einer Darstellung der Audio-Rückkopplung in einem Eingangsaudiosignal entspricht, und dann die Audio-Rückkopplung des Eingangsaudiosignals zu unterdrücken, um ein Ausgangsaudiosignal mit einer unterdrückten Audio-Rückkopplung zu erzeugen.
  • In einigen Ausführungsformen der Erfindung kann die Filterberechnungseinheit 49 zwei Filter der Filterbank 48 mit identischen Filterkoeffizienten konfigurieren. Wenn diese in Reihe geschaltet werden, kann die Verstärkungsreduzierung bei der spezifischen Filtermittenfrequenz der beiden Filter vorteilhafterweise verdoppelt werden. Dies kann vorteilhaft sein, wenn der Energiepegel der erkannten Audio-Rückkopplung hoch ist.
  • In einer weiteren fortgeschrittenen Ausführungsform der Erfindung kann die Filterparameterberechnungseinheit die Verstärkungsreduktion eines Filters so konfigurieren, dass sie dem gemessenen Energiepegel der Audio-Rückkopplung mit der repräsentativen Tonfrequenz entspricht, oder die Verstärkungsreduktion kann so konfiguriert werden, dass sie einem Prozentsatz des identifizierten Energiepegels des markanten Tons entspricht.
  • Die Rückkopplungserkennungseinheit ist konfiguriert, das Eingangsaudiosignal nur dann zu filtern, wenn die empfangene Rückkopplungsinformation 12 die Information liefert, dass eine Audio-Rückkopplung in dem Eingangsaudiosignal erkannt wird. Wenn keine Audio-Rückkopplung erkannt wird, kann das Eingangsaudiosignal 2 die Rückkopplungsunterdrückungseinheit umgehen.
  • In einer Ausführungsform der Rückkopplungsunterdrückungseinheit 13 speichert die Rückkopplungsunterdrückungseinheit 13 die repräsentative Tonfrequenz, die jedem konfigurierten Filter zugeordnet ist, und speichert ferner den zugehörigen Energiepegel dieser Frequenz im Eingangsaudiosignal. Die gespeicherte Frequenz entspricht einer Darstellung der erkannten Audio-Rückkopplungsfrequenz. Dadurch enthält die Rückkopplungsunterdrückungseinheit eine Historie der erkannten Pegel und Frequenzen jeder aktuellen und zuvor erkannten Audio-Rückkopplung. Wenn eine neue Audio-Rückkopplung erkannt wird und wenn alle verfügbaren Unterdrückungsfilter der Filterbank 48 bereits verwendet wurden, wird der Filter, der der Frequenz mit dem niedrigsten Energiepegel zugeordnet ist, entsprechend der neuen Audio-Rückkopplung und der zugehörigen Rückkopplungsinformation 12 aktualisiert.
  • Die Filterbank 48 kann aus einer großen Anzahl von Filtern bestehen, die in Reihe oder parallel geschaltet sein können. Die Filter können ferner mit einer Multiplexereinheit gekoppelt sein, um die Filter ein- und auszukoppeln, vorzugsweise mit einem Schwenkmultiplexer (engl. slewing multiplexer), um Poppgeräusche und Knackser zu vermeiden.
  • 17 zeigt eine Ausführungsform der Erfindung, bei der ein Audioverarbeitungssystem zum Erkennen und Unterdrücken von Audio-Rückkopplungen gemäß der Erfindung auf einem Audio-Digitalsignalprozessor DSP bzw. einem System-on-Chip SoC implementiert wurde. Dies kann vorteilhaft sein, da ein Audio-DSP gut für die Verarbeitung von Audiosignalen geeignet ist, einschließlich geeigneter Audioverarbeitungstaktfrequenzen, effizienter Audiofilterungsfunktionen, möglicherweise einschließlich eines parametrischen Equalizers, geeigneter A/D- und D/A-Wandler, falls relevant, usw. Andererseits sind einige der Berechnungen, logikbasiertereren Verarbeitungen und ereignisgesteuerten Verarbeitungen möglicherweise besser für die Implementierung auf einem Allzweckprozessor und den Zugriff auf Speicher usw. geeignet, wie sie z. B. von einem SoC oder einem Mikroprozessor in Kombination mit externem Speicher o. Ä. bereitgestellt werden.
  • In 17 ist eine Ausführungsform dargestellt, wie die verschiedenen oben beschriebenen Blöcke zur Rückkopplungserkennung und -unterdrückung in den beiden Prozessoren verteilt sein können.
  • Der DSP kann vorzugsweise den Empfang eines Mikrofonsignals, oben auch als Eingangsaudiosignal 2 bezeichnet, sowie die Filterung des Audiosignals durch Rückkopplungsunterdrückungsfilter, beispielsweise wie oben mit Bezug auf eine Rückkopplungsunterdrückungseinheit 13 beschrieben, und die Erzeugung der Lautsprecherausgabe, oben auch als Ausgangsaudiosignal 16 bezeichnet, übernehmen. Weiterhin kann dem Audio-DSP vorzugsweise die Aufgabe zugewiesen werden, eine Vorverarbeitung durchzuführen, wie beispielsweise mit Bezug auf die 5-6 oben beschrieben, zum Beispiel einschließlich eines Rauschfilters und einer Schwellenwerterkennung. Auch die Analysefilterung wird vorzugsweise von dem filteroptimierten Audio-DSP durchgeführt, und eine eventuelle anschließende Halte-Detektion, z.B. durch die oben beschriebenen Analyseaudiofilter 5a-5e und die Berechnung und eventuelle Umhüllung von Energiepegelunterschiedsänderungen, wie z.B. oben mit Bezug auf die 14-15 beschrieben. Die Erkennungen von Oberschwingungen und Amplitudenreduzierung, die ebenfalls mehrere Audiofilter umfasst, wird ebenfalls vorzugsweise vom Audio-DSP übernommen und kann z. B. wie oben mit Bezug auf 13 beschrieben, implementiert werden. Eine Clipping-Erkennung, die als Notfall-Handler implementiert ist, wenn der Pegel des Audioausgangssignals sehr hoch wird und die Gefahr des Clippings im Lautsprecher besteht, kann im Audio-DSP implementiert werden, und kann wie unten beschrieben implementiert werden.
  • Andererseits werden Aufgaben wie die typischerweise aufwändigere Berechnung von Filterkoeffizienten, das Nachschlagen in speicherbasierten Lookup-Tabellen, die Überwachung, wenn ein bestimmter Wert einen Schwellenwert überschreitet oder von wahr auf falsch wechselt, usw., dem SoC zugewiesen. Dies kann z. B. die Berechnung einer wahrscheinlichen Audio-Rückkopplungsfrequenz durch eine Differenz-zu-Frequenz-Abbildung beinhalten, wie z. B. mit Bezug auf die 2 und 7 beschrieben. Es kann vorzugsweise auch die Berechnung von Filterkoeffizienten für die Oberschwingungsfilter und die Rückkopplungsunterdrückungsfilter umfassen, wie beispielsweise mit Bezug auf die 13 und 16 beschrieben. Weitere Aufgaben, die vorzugsweise von dem SoC ausgeführt werden, können die Überwachung oder Abfrage der Halte-Detektion oder der abnehmenden Amplitudendetektion und der Erkennung von Oberschwingungen sein, wovon mögliche Ausführungsformen unter Bezugnahme auf die 13-15 oben beschrieben sind. Auch eine Filterintensitätsprüfung kann vorzugsweise im SoC enthalten sein, z.B. wie mit Bezug auf 16 oben beschrieben.
  • Im Folgenden werden verschiedene Ausführungsformen der Erfindung ohne Bezugnahme auf bestimmte Figuren dargestellt.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Bereitstellens des Eingangsaudiosignals. Das Bereitstellen des Eingangsaudiosignals ist nicht auf ein bestimmtes Mittel beschränkt. Es kann zum Beispiel über einen Datenspeicher, eine drahtgebundene Verbindung, eine drahtlose Verbindung, ein Eingangsmikrofon, einen Instrumentenabnehmer usw. bereitgestellt werden. In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt zur Aufnahme des Eingangsaudiosignals über ein Eingangsmikrofon. Gemäß einer Ausführungsform der Erfindung kann ein Eingangsaudiosignal mittels Mikrofon oder beispielsweise durch einen Instrumentenabnehmer bereitgestellt werden. In einer weiteren beispielhaften Ausführungsform kann das Eingangsaudiosignal als Audiosignal bereitgestellt werden, das über ein Mikrofon oder einen Tonabnehmer aufgenommen wird. Darüber hinaus versteht es sich, dass in weiteren Ausführungsformen der Erfindung das Audioeingangssignal durch eine beliebige Art von elektrischem Bauteil oder Schaltung bereitgestellt werden kann. Audio-Rückkopplungen stammen typischerweise von einem Mikrofon oder einem Instrumentenabnehmer, können aber durch eine Reihe von Stufen verarbeitet werden, z. B. Mikrofonverstärker, Puffer, Instrumenten- oder Gesangseffekte, Mischer usw., bevor es für das Verfahren der vorliegenden Erfindung empfangen wird. Auch nach einer solchen Verarbeitung kann das Eingangsaudiosignal noch als von einem Mikrofon bereitgestellt betrachtet werden.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt der Verarbeitung des Eingangsaudiosignals, um ein Ausgangsaudiosignal zu erzeugen. Eine solche Verarbeitung kann beispielsweise Filterung, Verstärkung, Mischung usw. umfassen. In einer bevorzugten Ausführungsform kann die Verarbeitung auch eine Audio-Rückkopplungsunterdrückung basierend auf der Audio-Rückkopplungserkennung der vorliegenden Erfindung umfassen. Dies kann sehr vorteilhaft sein, wenn das Ausgangsaudiosignal akustisch in der Nähe einer Quelle des Eingangsaudiosignals wiedergegeben wird und dadurch anfällig für das Verursachen von Audio-Rückkopplungen ist. In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Wiedergebens eines Ausgangsaudiosignals basierend auf dem Eingangsaudiosignal unter Verwendung von einem oder mehreren Lautsprechern. Die vorliegende Erfindung kann sehr vorteilhaft sein, wenn sie in der Schleife des Empfangs von Mikrofonsignalen zur Wiedergabe durch Lautsprecher durchgeführt wird, die sich akustisch in der Nähe der Mikrofone befinden. Da ein solcher Aufbau, der typisch für Live-Beschallungssituationen wie Musikkonzerte oder Reden ist, anfällig für die Entstehung von Audio-Rückkopplungen ist, kann es vorteilhaft sein, erkennen zu können, wann dies geschieht, um Gegenmaßnahmen einleiten zu können, z. B. Änderung der Mikrofon- oder Lautsprecherkonfiguration, Verringerung der Lautstärke oder Hinzufügen von Audio-Rückkopplungsunterdrückung im Signalpfad usw.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt zur automatischen Unterdrückung der erkannten Audio-Rückkopplung. Wenn eine Audio-Rückkopplung durch die vorliegende Erfindung erkannt wurde, kann sie vorteilhafterweise automatisch unterdrückt werden. In bevorzugten Ausführungsformen kann die Frequenz der Audio-Rückkopplung während des Erkennungsprozesses ermittelt werden, und Unterdrückungsfilter können dann auf die erkannte Audio-Rückkopplungsfrequenz ausgerichtet werden. In einer Ausführungsform der Erfindung umfasst der Schritt des Unterdrückens der Audio-Rückkopplung das Abschwächen eines Ausgangsaudiosignals auf der Basis des Eingangsaudiosignals. Simples automatisches Absenken der Lautstärke des Ausgangssignals kann häufig die Audio-Rückkopplung beseitigen und das Risiko eines erneuten Aufbaus einer Rückkopplung verringern. In einer Ausführungsform der Erfindung umfasst der Schritt des Unterdrückens der Audio-Rückkopplung das Anwenden mindestens eines Audio-Rückkopplungsunterdrückungsfilters. In einer Ausführungsform der Erfindung hat der mindestens eine Audio-Rückkopplungsunterdrückungsfilter eine Filtermittenfrequenz, die ungefähr gleich einer Audio-Rückkopplungsfrequenz der Audio-Rückkopplung ist. Da Audio-Rückkopplungen von Natur aus sehr engbandig sind, können Audio-Rückkopplungen oft effektiv und automatisch durch Anwendung eines oder mehrerer Audio-Rückkopplungsunterdrückungsfilter, die auf die Frequenzen der Audio-Rückkopplung abzielen, entfernt werden.
  • In einer Ausführungsform der Erfindung wird die Audio-Rückkopplungsfrequenz auf der Grundlage des Energiepegelunterschieds durch eine Differenz-zu-Frequenz-Abbildungsfunktion bestimmt. Wie oben erwähnt, besteht eine recht zuverlässige Beziehung zwischen der Frequenz und dem Energiepegelunterschied, wenn das Eingangsaudiosignal einen markanten Ton enthält, was der Fall ist, wenn Audio-Rückkopplung auftritt, und wenn die Audio-Rückkopplungsfrequenz zwischen den Mittenfrequenzen zweier Analyseaudiofilter liegt. Daher kann eine Differenz-zu-Frequenz-Abbildungsfunktion, die auf dieser Beziehung basiert, vorteilhaft verwendet werden, um die Audio-Rückkopplungsfrequenz zu identifizieren.
  • In einer Ausführungsform der Erfindung ist der mindestens eine Unterdrückungsfilter ein Kerbfilter. Ein Kerbfilter hat den Vorteil, nur ein schmales Frequenzband zu dämpfen und damit beispielsweise Audio-Rückkopplungen zu unterdrücken, während gleichzeitig ein möglichst großer Teil des ursprünglichen Signals intakt bleibt. Es versteht sich, dass der erfindungsgemäße Unterdrückungsfilter nicht auf eine bestimmte Art von Filter beschränkt ist. So können gemäß Ausführungsformen der Erfindung die Unterdrückungsfilter Kerbfilter oder Doppelpräzisions-Spitzenwertfilter und/oder andere Unterdrückungsfiltertypen umfassen. In einer beispielhaften Ausführungsform der Erfindung sind ein oder mehrere Unterdrückungsfilter als Bandsperrfilter ausgeführt. In einer Ausführungsform der Erfindung ist der mindestens eine Unterdrückungsfilter ein parametrischer Equalizerfilter, der als Bandsperrfilter implementiert ist. Parametrische Equalizerfilter sind Bandpass- oder Bandsperrfilter, die durch ihre Verstärkung, Mittenfrequenz und ihren Gütefaktor gekennzeichnet sind. In einer Ausführungsform sind die Audio-Rückkopplungsunterdrückungsfilter als parametrische Equalizerfilter mit doppelter Präzision implementiert, deren Mittenfrequenz bei der Audio-Rückkopplungsfrequenz liegt und die einen relativ hohen Gütefaktor aufweisen, um einen schmalen Sperrbandfilter zu erhalten. In einer Ausführungsform der Erfindung hat der mindestens eine Unterdrückungsfilter einen Gütefaktor Q von 10 oder höher.
  • In einer Ausführungsform der Erfindung kann Q beispielsweise bei 16 liegen, was für viele Anwendungen eine geeignete Genauigkeit des Unterdrückungsbandes ergibt. Andere Ausführungsformen können Q höher als 15 haben, wie z.B. 16, 17, 18 oder noch höher, wie z.B. 20, 25 oder 30. Andere Ausführungsformen können Q höher als 5 oder 10 haben, wie z.B. im Bereich von 5-26, z.B. 12 oder 14. Es kann von Vorteil sein, einen Unterdrückungsfilter mit einem Q=16 zu verwenden, um sicherzustellen, dass der Unterdrückungsfilter ein geeignet schmales Frequenzband hat, um zu gewährleisten, dass der Unterdrückungsfilter vorwiegend die Rückkopplungsfrequenz dämpft, während andere Teile des Audiosignals unverzerrt bleiben. In weiteren Ausführungsformen der Erfindung kann es bevorzugt sein, ein oder mehrere Unterdrückungsfilter mit einem Q über 16 einzusetzen, um das Frequenzband des Unterdrückungsfilters noch weiter zu verengen. In einer beispielhaften Ausführungsform kann es bevorzugt sein, ein oder mehrere Unterdrückungsfilter mit einem Q unter 16 zu konfigurieren, um das Frequenzband des Unterdrückungsfilters zu verbreitern. Dies kann insbesondere sinnvoll sein, wenn die Genauigkeit der Rückkopplungserkennung in Bezug auf die verursachende Frequenz gering ist. Dies kann z. B. bei niedrigen Signal-zu-Rausch-Verhältnissen vorkommen. In einer Ausführungsform der Erfindung hat der mindestens eine Unterdrückungsfilter eine Verstärkung von -3 dB oder weniger. Ein oder mehrere Unterdrückungsfilter können eine Verstärkung von z. B. -6 dB haben, d. h. das Signal bei der Unterdrückungsfilterfrequenz um 6 dB reduzieren. Dies kann auch als eine Dämpfung um 6 dB bezeichnet werden. In verschiedenen Ausführungsformen beträgt die Verstärkung mindestens eines Unterdrückungsfilters -4 dB oder weniger, wie z. B. -5 dB, -6 dB, -7 dB oder noch weniger, wie z. B. -9 dB, -12 dB oder -20 dB, z. B. im Bereich von -1 bis -20 dB oder -30 dB.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Unterdrückens der Audio-Rückkopplung das Anwenden von mindestens zwei kaskadierten Audio-Rückkopplungsunterdrückungsfiltern. Durch Kaskadierung z.B. Reihenschaltung mehrerer Audio-Rückkopplungsunterdrückungsfilter können mehrere Audio-Rückkopplungsfrequenzen unterdrückt werden, wenn einige der kaskadierten Filter mit unterschiedlichen Mittenfrequenzen konfiguriert sind, und/oder eine Audio-Rückkopplungsfrequenz kann durch Kaskadierung mehrerer Filter mit der gleichen Mittenfrequenz kumuliert unterdrückt werden. Zum Beispiel können 4 Audio- Rückkopplungsunterdrückungsfiltern, die alle parametrische Equalizersperrfilter mit doppelter Präzision, Q=16 und einer Verstärkung von -6 dB sind, und jeweiligen Mittenfrequenzen von 151 Hz, 151 Hz, 417 Hz und 2276 Hz, eine kombinierte Unterdrückung von Audio-Rückkopplungen bei 151 Hz um 12 dB, bei 417 Hz um 6 dB und bei 2276 Hz um 6 dB bewirken. Dieses Prinzip kann für beliebige Mittenfrequenzen und eine beliebige Anzahl von Filtern angewendet werden.
  • In einer Ausführungsform der Erfindung umfasst der Schritt der Unterdrückung der Audio-Rückkopplung die Verarbeitung des Eingangsaudiosignals durch eine Filterbank von Audio-Rückkopplungsunterdrückungsfiltern, um ein Ausgangsaudiosignal zu erzeugen. Ein Beispiel für eine Filterbank, die vorteilhaft sein kann, ist eine Bank von 16 parametrischen Equalizersperrfiltern mit doppelter Präzision, jeweils mit Q=16 und einer Verstärkung von -6 dB, wobei die Filter kaskadiert werden können, um den oben beschriebenen Filterkombinationseffekt zu erzielen, um beispielsweise eine wählbare Unterdrückung bei 6 dB, 12 dB oder 18 dB und bei verschiedenen Frequenzen entsprechend der durch die Erfindung erfassten Audio-Rückkopplung zu bewirken. Die Filter der Filterbank können vorzugsweise weich ein- und ausgekoppelt werden, z. B. mittels eines Schwenkmultiplexers, um Knackser im Ausgangsaudiosignal zu vermeiden. In einer Ausführungsform der Erfindung umfasst das Verfahren das Aktualisieren der Audio-Rückkopplungsunterdrückungsfilter basierend auf einer Historie von Pegeln bei verschiedenen Audio-Rückkopplungsfrequenzen. In einer bevorzugten Ausführungsform, wenn alle verfügbaren Audio-Rückkopplungsunterdrückungsfilter bereits zur Unterdrückung von Audio-Rückkopplungsfrequenzen verwendet werden und eine neue Audio-Rückkopplung detektiert wird, kann eine Historie von Audio-Rückkopplungspegeln bei den verschiedenen Audio-Rückkopplungsfrequenzen vorteilhaft verwendet werden, um den am wenigsten wichtigen Audio-Rückkopplungsunterdrückungsfilter in Verwendung zu bestimmen und diesen Filter zu aktualisieren, um die neu detektierte Audio-Rückkopplung zu unterdrücken.
  • In einer Ausführungsform der Erfindung werden Filterkoeffizienten des Audio-Rückkopplungsuterdrückungsfilters durch eine Differenz-zu-FilterKoeffizienten-Abbildungsfunktion bestimmt, wobei die Differenz-zu-FilterKoeffizienten-Abbildungsfunktion einen Energiepegelunterschied für eine detektierte Audio-Rückkopplung auf Filterkoeffizienten abbildet, so dass eine Mittenfrequenz des mindestens einen Unterdrückungsfilters im Wesentlichen gleich der Frequenz der detektierten Audio-Rückkopplung ist. In einer Ausführungsform kann der Energiepegelunterschied direkt auf Unterdrückungsfilterkoeffizienten abgebildet werden, anstatt zuerst die Audio-Rückkopplungsfrequenz zu bestimmen. Da eine Beziehung zwischen Rückkopplungsfrequenz und Energiepegelunterschied sowie zwischen Rückkopplungsfrequenz und Unterdrückungsfilterkoeffizienten besteht, kann die Rückkopplungsfrequenz aus der Berechnung entfernt und die Filterkoeffizienten direkt aus dem Energiepegelunterschied berechnet oder nachgeschlagen werden. In einigen Ausführungsformen kann dies Laufzeitverarbeitung einsparen, zum Beispiel durch eine Lookup-Tabelle mit vorberechneten Filterkoeffizienten.
  • In einer Ausführungsform der Erfindung umfasst die Mehrzahl der Analyseaudiofilter 3, 4, 5, 6 oder mehr verschiedene Analyseaudiofilter. Die verschiedenen Analyseaudiofilter können unterschiedliche Mittenfrequenzen haben, die über den Frequenzbereich verteilt sind, in dem eine Audio-Rückkopplungserkennung erwünscht ist, z. B. um das Frequenzband von 40 Hz bis 15,5 kHz abzudecken. In einer bevorzugten Ausführungsform werden 5 verschiedene Analyseaudiofilter verwendet, wobei es sich bei allen 5 um Doppelpräzisions-Peakfilter mit Mittenfrequenzen von 40 Hz, 200 Hz, 1000 Hz, 5000 Hz bzw. 15500 Hz handelt. Die ersten vier Filter haben vorzugsweise Gütefaktoren von 2, um relativ breitbandige Filter bereitzustellen, während der fünfte Filter bei 15500 Hz einen höheren Gütefaktor von z. B. 5 haben kann, da das Verhältnis zwischen dem vierten und fünften Filter geringer ist als zwischen den anderen Filtern. In einer Ausführungsform mit der obigen Filterverteilung kann erreicht werden, dass die Differenz zwischen dem Dämpfungsgrad zweier benachbarter Analyseaudiofilter zwischen 20 dB und -20 dB variiert, d. h. ein Bereich von 40 dB Differenz über einen Frequenzbereich von z. B. 200 Hz - 1000 Hz oder 1000 Hz - 5000 Hz. Vorteilhafterweise kann dadurch eine Audio-Rückkopplungserkennung mit einer geeigneten Genauigkeit erreicht werden, um die Frequenz der Audio-Rückkopplung zu bestimmen, falls dies gewünscht wird. In einer Ausführungsform der Erfindung hat jeder Analyseaudiofilter der Mehrzahl von Analyseaudiofiltern eine unterschiedliche Filtermittenfrequenz. In einer Ausführungsform der Erfindung, hat jeder Analyseaudiofilter der Mehrzahl von Analyseaudiofilter unterschiedliche Filterkoeffizienten.
  • Bei einem Bandpassfilter kann die Filtermittenfrequenz beispielsweise als die Frequenz der Mitte des Bandpassfilters und/oder die Frequenz, bei der die Dämpfung/Verstärkung des Filters einen Extrempunkt hat, verstanden werden. Bei Tiefpass- und Hochpassfiltern kann die Filtermittenfrequenz z. B. als die Grenzfrequenz des jeweiligen Filters verstanden werden. Eine Grenzfrequenz kann z. B. als die Frequenz definiert werden, bei der der Filter ein Eingangssignal um 3 dB abschwächt. Die Verwendung verschiedener Filter mit unterschiedlicher Filtermittenfrequenz und oder unterschiedlichen Filterkoeffizienten ermöglicht eine weitere Anpassung der Analyse, was von Vorteil ist. So kann z. B. ein optimaler Frequenzbereich vergrößert oder die Präzision oder Genauigkeit verbessert werden. In einer Ausführungsform der Erfindung beträgt ein Frequenzverhältnis der Filtermittenfrequenz von wenigstens einem separaten Analyseaudiofilter der Mehrzahl separater Analyseaudiofilter und der Filtermittenfrequenz von wenigstens einem anderen separaten Analyseaudiofilter der Mehrzahl separater Analyseaudiofilter von 1.001 bis 1000, z.B. von 1,01 bis 100, z.B. von 1,02 bis 50, z.B. von 1,05 bis 20, z.B. 1,1 bis 10, wie beispielsweise 1,2 bis 5. In einer beispielhaften Ausführungsform der Erfindung hat ein erster Analyseaudiofilter eine Filtermittenfrequenz von 40 Hz, und ein zweiter Analyseaudiofilter hat eine Filtermittenfrequenz von 200 Hz. Das Frequenzverhältnis beträgt somit 5. Ein bestimmtes Frequenzverhältnis der Filtermittenfrequenzen der Analyseaudiofilter kann einen bestimmten optimalen Frequenzbereich für das Verfahren vorsehen, was vorteilhaft ist. Alternativ weisen in weiteren Ausführungsformen der Erfindung der erst und der zweite Analyseaudiofilter die gleiche Filtermittenfrequenz auf, aber mit unterschiedlichen Gütefaktoren Q. In einer weiteren beispielhaften Ausführungsform der Erfindung weist ein zusätzlicher dritter Analyseaudiofilter eine Filtermittenfrequenz von 1000 Hz, ein vierter Analyseaudiofilter eine Mittenfrequenz von 5000 Hz und ein fünfter Analyseaudiofilter eine Mittenfrequenz von 15500 Hz auf, wodurch sich ein Frequenzverhältnis zwischen dem dritten und vierten Filter von 5 und zwischen dem vierten und fünften Filter von 3,1 ergibt. In einer Ausführungsform der Erfindung beträgt ein Gütefaktor Q mindestens eines Analyseaudiofilters der Mehrzahl von Analyseaudiofiltern 0,01 bis 100, beispielsweise 0,1 bis 10, wie zum Beispiel 2 oder 5. In einigen Ausführungsformen der Erfindung können die Analyseaudiofilter einen Gütefaktor von 2 oder etwa 2 haben. In anderen Ausführungsformen der Erfindung kann es jedoch bevorzugt sein, dass mindestens ein Analyseaudiofilter einen höheren Gütefaktor aufweist, beispielsweise 5 oder etwa 5. Der Gütefaktor kann die Empfindlichkeit und Präzision bestimmen, mit der eine bestimmte Audio-Rückkopplung erkannt werden kann. Es kann daher vorteilhaft sein, den Gütefaktor des Filters so anzupassen, dass die Differenz zwischen der Dämpfung zweier Filter mit überlappenden Frequenzbändern bei den Frequenzen, bei denen eine Audio-Rückkopplung erwartet wird, groß ist.
  • In einer Ausführungsform der Erfindung ist mindestens ein Analyseaudiofilter der Mehrzahl von Analyseaudiofiltern ein Bandpassfilter. Zwei oder mehr, z.B. drei oder mehr, z.B. vier oder mehr, z.B. alle Analyseaudiofilter können ebenso Bandpassfilter sein. In einer Ausführungsform der Erfindung ist mindestens ein Analyseaudiofilter der Mehrzahl von Analyseaudiofiltern ein Doppelpräzisions-Peakfilter. In einer bevorzugten Ausführungsform der Erfindung sind die Analyseaudiofilter Doppelpräzisions-Peakfilter. In einer weiteren Ausführungsform ist mindestens ein Analyseaudiofilter ein Doppelpräzisions-Peakfilter. In einer Ausführungsform der Erfindung ist mindestens ein Analyseaudiofilter der Mehrzahl von Analyseaudiofiltern ein Hochpassfilter. In einer Ausführungsform der Erfindung ist mindestens ein Analyseaudiofilter der Mehrzahl von Analyseaudiofiltern ein Tiefpassfilter. In einigen Ausführungsformen der Erfindung kann einer der Mehrzahl von Analyseaudiofiltern ein Bandpassfilter sein, während mindestens einer der anderen der Mehrzahl von Analyseaudiofiltern ein Hochpass- oder ein Tiefpassfilter sein kann. In einer Ausführungsform der Erfindung ist mindestens einer der Analyseaudiofilter der Mehrzahl von Analyseaudiofiltern ein Allpassfilter. In einigen Ausführungsformen der Erfindung ist ein Analyseaudiofilter ein Allpassfilter. Ein Allpassfilter kann als ein Filter verstanden werden, der eine frequenzabhängige Phasenverschiebung anwendet. In Ausführungsformen mit einem Allpassfilter kann der Vergleich der mindestens zwei gefilterten Audiosignale daher die Schätzung einer relativen Phasenverschiebung zwischen den beiden gefilterten Audiosignalen beinhalten, und dementsprechend ist der Energiepegelunterschied indikativ für diese relative Phasenverschiebung. In einer Ausführungsform der Erfindung liegt eine niedrigste Filtermittenfrequenz eines Analyseaudiofilters der Mehrzahl von Analyseaudiofiltern im Bereich von 0 bis 100 Hz. Es kann vorteilhaft sein, dass eine niedrigste Filtermittenfrequenz eines Analyseaudiofilters unter 100 Hz liegt, um Audio-Rückkopplungen im Frequenzband über und unter 100 Hz zu detektieren oder um Unterschwingungen einer Grundfrequenz bei oder unter oder über 100 Hz zu messen. Bei Audio-Rückkopplungen fehlen typischerweise Oberschwingungen oder Unterschwingungen oder sie haben subharmonische oder harmonische Inhalte mit wesentlich geringerem Energiepegel im Vergleich zu z. B. von Musikinstrumenten erzeugtem Schall. In einer fortgeschrittenen Ausführungsform der Erfindung kann die Messung des subharmonischen Gehalts daher ein weiteres Mittel zur Validierung einer detektierten Audio-Rückkopplung als tatsächliches Feedback bereitstellen, basierend auf dem subharmonischen und subharmonischen Gehalt. In einer Ausführungsform der Erfindung liegt eine höchste Filtermittenfrequenz eines Analyseaudiofilters der Mehrzahl von Analyseaudiofiltern im Bereich von 10000 bis 50000 Hz. Es kann vorteilhaft sein, einen Analyseaudiofilter mit einer Filtermittenfrequenz im Bereich von 10000 Hz bis 50000 Hz vorzusehen, um Oberschwingungen von Grundfrequenzen erkennen zu können. Das Vorhandensein von Oberschwingungen kann in einem weiteren Analyseschritt verwendet werden, um den tatsächlichen Rückkopplungs- vom Nicht-Rückkopplungs-Frequenzgehalt des Audiosignals zu trennen.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Erhaltens des Energiepegelunterschieds das Subtrahieren von mindestens zwei aus der Mehrzahl der gefilterten Audiosignale. In einer Ausführungsform der Erfindung umfasst der Schritt des Erhaltens des Energiepegelunterschieds das Berechnen eines Verhältnisses zwischen mindestens zwei der Mehrzahl von gefilterten Audiosignalen. In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Messens eines Signalenergiepegels für jedes der mindestens zwei gefilterten Audiosignale, um mindestens zwei separate Signalenergiepegel zu erhalten. Das Messen eines gefilterten Audiosignals, um dessen Energiepegel zu ermitteln, ist ein einfacher Ansatz, um den Energiepegel zu bestimmen und ist daher aufgrund der Einfachheit vorteilhaft. Eine solche Messung kann z. B. durch einen separaten Prozess oder eine Einheit, z. B. einen Pegeldetektor, durchgeführt werden. Eine Messung kann auch als integrierter Teil des Vergleichs von mindestens zwei gefilterten Audiosignalen der Mehrzahl von gefilterten Audiosignalen durchgeführt werden, um einen Energiepegelunterschied zu erhalten. In einer Ausführungsform der Erfindung basiert der Schritt des Erhaltens des Energiepegelunterschieds auf zwei benachbarten Analyseaudiofiltern mit den höchsten gefilterten Audiosignalenergiepegel n.
  • In einer Ausführungsform wird ermittelt, zwischen welchen beiden Analyseaudiofiltern die Audio-Rückkopplung vorliegt, indem die beiden benachbarten Analyseaudiofilter mit den höchsten Ausgangspegeln beim Anlegen des Eingangsaudiosignals ausgewählt werden. Die Differenz zwischen diesen beiden Pegeln wird dann als Energiepegelunterschied für die weiteren Verfahrensschritte verwendet. Analyseaudiofilter werden als benachbarte Filter betrachtet, wenn sie in einer nach Spitzenfrequenz geordneten Filterliste nebeneinander liegen.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Erhaltens des Energiepegelunterschieds das Vergleichen von mindestens zwei der mindestens zwei separaten Signalenergiepegel, um mindestens einen vorläufigen Energiepegelunterschied zu erhalten, wobei der Energiepegelunterschied auf mindestens einem vorläufigen Energiepegelunterschied des mindestens einen vorläufigen Energiepegelunterschieds basiert. Es kann bevorzugt sein, einzelne gefilterte Audiosignale von mindestens zwei Analyseaudiofiltern zu vergleichen, um einen vorläufigen Energiepegelunterschied zu erhalten, der dem von den beiden Analyseaudiofiltern abgedeckten Frequenzband entspricht. Ausführungsformen der Erfindung können mehrere Analyseaudiofilter umfassen, wie oben beschrieben, wobei jedes Paar von Audiofiltern separate Frequenzbänder abdecken kann. In solchen Beispielen von Ausführungsformen der Erfindung kann es bevorzugt sein, einen vorläufigen Energiepegelunterschied für jedes Paar von Analyseaudiofiltern, das ein unterschiedliches Frequenzband abdeckt, zu erhalten. Dann kann jeder dieser vorläufigen Energiepegelunterschiede, die verschiedene Frequenzbänder repräsentieren, ausgewertet werden, um zu bestimmen, welche der vorläufigen Energiepegelunterschiede einen markanten Ton, d.h. eine Audio-Rückkopplung, des Audioeingangssignals repräsentiert. In einer beispielhaften Ausführungsform der Erfindung mit zwei Analyseaudiofiltern kann der Energiepegelunterschied gleich dem vorläufigen Energiepegelunterschied sein. Subtraktion und Berechnung eines Verhältnisses sind zwei beispielhafte Ansätze zum Vergleich von Energiepegeln, die aufgrund ihrer Einfachheit vorteilhaft sind.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren ferner einen Schritt des Umwandelns des Energiepegelunterschieds durch eine Differenz-zu-Frequenz-Abbildungsfunktion in eine Audio-Rückkopplungsfrequenz der detektierten Audio-Rückkopplung. Eine Differenz-zu-Frequenz-Abbildungsfunktion kann als eine physikalische oder digitale Einheit verstanden werden, die in der Lage ist, an der Umwandlung des Energiepegelunterschieds in eine entsprechende Darstellung der Audio-Rückkopplungsfrequenz teilzuhaben. In verschiedenen Ausführungsformen der Erfindung hängt der Energiepegelunterschied aufgrund unterschiedlicher Analyseaudiofilter von der Frequenz der Audio-Rückkopplung ab, zumindest in einem gewissen Frequenzbereich. Diese Abhängigkeit kann in der Differenz-zu-Frequenz-Abbildungsfunktion enthalten sein. Die Differenz-zu-Frequenz-Abbildungsfunktion kann also z. B. eine Lookup-Tabelle einer abschnitts- bzw. stückweisen mathematischen Funktion sein. Sie kann z. B. in einer Frequenzabbildungseinheit implementiert sein. In einigen Ausführungsformen der Erfindung kann eine Differenz-zu-Frequenz-Abbildungsfunktion mehrere Energiepegelunterschiede als Eingänge haben, zum Beispiel einen Energiepegelunterschied von einem ersten und einem zweiten gefilterten Audiosignal und einen Energiepegelunterschied von dem zweiten und einem dritten gefilterten Audiosignal. In einer Ausführungsform der Erfindung ist die Differenz-zu-Frequenz-Abbildungsfunktion eine Lookup-Tabelle. In einer Ausführungsform der Erfindung ist die Differenz-zu-Frequenz-Abbildungsfunktion eine mathematische Funktion. Sowohl eine Lookup-Tabelle als auch eine mathematische Funktion sind einfach zu implementieren und benötigen begrenzte Rechenleistung, was vorteilhaft ist. Andere Differenz-zu-Frequenz-Abbildungsfunktionen, z. B. eine zweite oder eine dritte Differenz-zu-Frequenz-Abbildungsfunktion, können z. B. auch auf Lookup-Tabellen und/oder mathematischen Funktionen basieren. Eine mathematische Funktion kann z. B. eine lineare Funktion oder eine nichtlineare Funktion sein. Es kann eine stückweise mathematische Funktion sein.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Umwandelns des Energiepegelunterschieds durch eine Differenz-zu-Filter-Abbildungsfunktion in Filterkoeffizienten für einen Bandsperr- oder Bandpassfilter einer entsprechenden Frequenz. Da der Energiepegelunterschied in eine Frequenz übersetzbar ist, kann der Energiepegelunterschied in einer Ausführungsform auch direkt zur Berechnung oder zum Nachschlagen von Filterkoeffizienten, Filterparametern oder anderen Filtercharakterisierungen verwendet werden, wodurch eine direkte Anpassung von z. B. Audio-Rückkopplungsunterdrückungsfiltern oder Oberschwingungserkennungsfiltern basierend auf dem Energiepegelunterschied ermöglicht wird, anstatt einen Zwischenschritt der Umwandlung in eine Frequenz und dann der Umwandlung von der Frequenz in einen Filter zu durchlaufen. In anderen Ausführungsformen wird die Frequenz für mehrere Zwecke verwendet, so dass es weniger vorteilhaft wird, ihre Bestimmung aus dem Energiepegelunterschied zu vermeiden.
  • In einer Ausführungsform der Erfindung umfasst das Erkennen der Audio-Rückkopplung das Bestimmen des Vorhandenseins einer Audio-Rückkopplung, wenn mindestens zwei aufeinanderfolgende Energiepegelunterschiede der Mehrzahl von Energiepegelunterschieden ungefähr gleich sind. Wie oben beschrieben, werden zur Bestätigung, dass ein festgestellter Energiepegelunterschied eine Audio-Rückkopplung und nicht Musik, Sprache oder Rauschen usw. darstellt, die Energiepegelunterschiede aus mehreren, beispielsweise mindestens zwei, vorzugsweise drei, aufeinanderfolgenden Wiederholungen des Analyseschritts und des Vergleichsschritts für gefilterte Audiosignale verglichen. Wenn über z. B. zwei oder drei Wiederholungen annähernd ähnliche, d. h. annähernd gleiche, Energiepegelunterschiede erkannt werden, wird festgestellt, dass eine Audio-Rückkopplung im Eingangsaudiosignal vorhanden ist. Wie oben erwähnt, wird dies auch als Halte-Erkennung bezeichnet, d. h. es wird festgestellt, ob das Eingangsaudiosignal einen anhaltenden, markanten Ton enthält, der wahrscheinlich von einer Audio-Rückkopplung stammen könnte. In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Aktualisierens eines Halte-Zustands basierend auf dem Vergleich von mindestens zwei Energiepegelunterschieden aus mindestens zwei der Wiederholungen, wobei der Halte-Zustand auf einen anhaltenden Ton in dem Eingangsaudiosignal hinweist. In einer Ausführungsform wird ein Halte-Zustand basierend auf der Differenz zwischen den jüngsten Energiepegelunterschieden kontinuierlich aktualisiert, so dass der Halte-Zustand anzeigt, ob ein anhaltender Ton in dem Signal vorhanden ist, z. B. durch Speichern eines Wertes von wahr oder falsch oder durch Speichern des Wertes des Energiepegelunterschieds, wenn Halten erkannt wird, als weitere Referenz in nachfolgenden Schritten, z. B. Differenz-zu-Frequenz-Abbildung usw. In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Aktualisierens eines Audio-Rückkopplungszustands basierend auf dem Halte-Zustand oder dem Vergleich von mindestens zwei Energiepegelunterschieden aus mindestens zwei der Wiederholungen, wobei der Audio-Rückkopplungszustand eine Audio-Rückkopplung in dem Eingangsaudiosignal anzeigt. In einer Ausführungsform wird ein Audio-Rückkopplungszustand kontinuierlich basierend auf entweder dem Halte-Zustand, wie oben beschrieben, oder der Differenz zwischen den jüngsten Energiepegelunterschieden aktualisiert. Im ersten Fall, in dem ein Halte-Zustand aktualisiert wird und das Vorhandensein eines anhaltenden Tons anzeigt, kann ein Rückkopplungsvalidierer dies als Eingabe verwenden, optional zusammen mit anderen Eingaben, um zu bestimmen, ob dadurch eine Audio-Rückkopplung vorhanden ist. Ohne andere Eingaben ist der Rückkopplungszustand vorzugsweise gleich dem Halte-Zustand. Andere Eingabemöglichkeiten zur Validierung dieser Bestimmung werden weiter unten beschrieben, z. B. Erkennung von Oberschwingungen, Erkennung von abnehmender Amplitude usw. Im letzteren Fall, in dem der Rückkopplungszustand direkt aus dem Vergleich aufeinanderfolgender Energiedifferenzpegel bestimmt wird, wird der Audio-Rückkopplungszustand wie oben für den Halte-Zustand beschrieben bestimmt, und es wird unnötig, zwei identische Zustände zu aktualisieren. In beiden Fällen zeigt der Audio-Rückkopplungszustand an, ob eine Audio-Rückkopplung im Signal vorhanden ist, z. B. durch Speichern eines Wertes von wahr oder falsch oder durch Speichern des Wertes des Energiepegelunterschieds, wenn eine Audio-Rückkopplung erkannt wird, für weitere Referenz in nachfolgenden Schritten, z. B. Differenz-zu-Frequenz-Abbildung usw. In einer Ausführungsform der Erfindung wird der Halte-Zustand oder der Audio-Rückkopplungszustand in einem Intervall im Bereich von 5 ms bis 500 ms, z. B. 50 ms, aktualisiert.
  • Um festzustellen, dass ein Ton anhaltend ist, d. h. über einen längeren Zeitraum anhält, ist es notwendig, eine angemessene Zeitspanne zu warten, bevor ein neuer Energiepegelunterschied zum Vergleich ausgewertet wird. Andernfalls könnte sich auch der gewünschte Inhalt des Eingangsaudiosignals, wie Musik, Sprache usw., nicht ausreichend geändert haben, um einen anderen Energiepegelunterschied zu erzeugen, und könnte daher fälschlicherweise als anhaltender Ton angesehen werden. Andererseits sollte das Intervall zwischen den Halte-Bewertungen ausreichend kurz sein, so dass die automatische Audio-Rückkopplungserkennung in der Lage ist, die Audio-Rückkopplung zu erkennen und optional zu unterdrücken, bevor sie zu störend wird oder Geräte beschädigt. In bevorzugten Ausführungsformen kann das Intervall zwischen Halte- oder Rückkopplungs-Auswertungen zwischen 1 ms und 1 s liegen, beispielsweise zwischen 10 ms und 100 ms, z. B. 25, 40, 50, 60, 75 oder 80 ms. Die Auswertung und Aktualisierung in diesen Intervallen kann in einer bevorzugten Ausführungsform basieren auf einer Hüllkurve eines Stroms von Energiepegelunterschiedsänderungen unterhalb eines Schwellenwerts, wie unten beschrieben, in jedem der Intervalle für 2 oder 3 oder mehr aufeinanderfolgende Intervalle, um eine Änderung des Halte-Zustands und/oder des Audio-Rückkopplungszustands zu bewirken.
  • In einer Ausführungsform der Erfindung umfasst der Schritt des Vergleichens von mindestens zwei Energiepegelunterschieden der Mehrzahl von Energiepegelunterschieden, die aus mindestens zwei der Wiederholungen erhalten werden, das Bestimmen mindestens einer Energiepegelunterschiedsänderung. In einer Ausführungsform der Erfindung ist die mindestens eine Energiepegelunterschiedsänderung eine Darstellung einer mathematischen Beziehung, wie beispielsweise eine Subtraktion oder ein Verhältnis, zwischen den mindestens zwei der Mehrzahl von Energiepegelunterschieden, die aus mindestens zwei der Wiederholungen erhalten werden.
  • Gemäß einer Ausführungsform der Erfindung umfasst das Erkennen von Audio-Rückkopplung das Bestimmen, ob ein Ton anhaltend ist, durch berechnen einer Energiepegelunterschiedsänderung zwischen Wiederholungen des Verfahrens. Die Energiepegelunterschiedsänderung kann in einer Ausführungsform als eine Differenz zwischen mindestens zwei Energiepegelunterschieden berechnet werden. Es versteht sich, dass diese Differenz eine absolute Differenz sein kann. In einer Ausführungsform kann die Energiepegelunterschiedsänderung als Verhältnis, Faktor oder Prozentsatz der Änderung berechnet werden. Subtraktion und Berechnung eines Verhältnisses sind zwei beispielhafte Ansätze zum Vergleich von Energiepegelunterschieden, die aufgrund ihrer Einfachheit vorteilhaft sind. Eine Energiepegelunterschiedsänderung von annähernd Null für einen Subtraktionsansatz oder von annähernd Eins für einen Verhältnisansatz ist ein Indikator dafür, dass ein Ton zwischen mindestens zwei Wiederholungen oder Halte-Bewertungen, d. h. beispielsweise für 50 ms, anhält. Die Änderung des Energiepegelunterschieds kann noch länger überwacht werden, d. h. für weitere Auswertungen, um einen anhaltenden Ton zu erkennen, z. B. für 3 oder 4 Auswertungen, was 100 ms oder 150 ms entspricht für eine Ausführungsform mit 50 ms Intervall zwischen den Auswertungen. In einer Ausführungsform der Erfindung wird eine Differenzänderungshüllkurve basierend auf einer oder mehreren aufeinanderfolgenden der ermittelten mindestens einen Energiepegelunterschiedsänderung berechnet. Basierend auf einer Hüllkurve des Stroms von Energiepegelunterschiedsänderungen kann es relativ einfach sein zu bestimmen, wann die Energiepegelunterschiede z.B. bei einer Ausführungsform mit Subtraktionsansatz um Null herum bleiben, was auf einen anhaltenden Ton hindeutet.
  • In einer Ausführungsform der Erfindung ist mindestens eine Energiepegelunterschiedsänderung mindestens zwei Energiepegelunterschiedsänderungen, wie z.B. mindestens drei Energiepegelunterschiedsänderungen. In einer Ausführungsform der Erfindung werden zwei Energiepegelunterschiedsänderungen verglichen, um eine Audio-Rückkopplung in einem Eingangsaudiosignal zu erkennen. In einer weiteren Ausführungsform der Erfindung kann es vorteilhaft sein, drei oder mehr aufeinanderfolgende Energiepegelunterschiedsänderungen zu überwachen, um Audio-Rückkopplungen zu detektieren, da Audio-Rückkopplungen im Wesentlichen über die Zeit konstant bleiben, während der musikalische Inhalt eines Audiosignals typischerweise über kurze Zeiträume stark variiert. Gemäß einer Ausführungsform der Erfindung wird eine Rückkopplung erkannt, wenn mindestens eine Energiepegelunterschiedsänderung annähernd Null ist. In einer anderen Ausführungsform der Erfindung wird eine Rückkopplung erkannt, wenn mindestens 2, 3 oder 4 oder mehr Energiepegelunterschiedsänderungen annähernd gleich sind. Die Einbeziehung von mehr Energiepegelunterschiedsänderungen in die Rückkopplungserkennung kann vorteilhaft die Fehlerrate der Rückkopplungserkennung verringern. In einer Ausführungsform der Erfindung umfasst das Erkennen der Audio-Rückkopplung das Bestimmen des Vorhandenseins einer Audio-Rückkopplung, wenn die mindestens eine Energiepegelunterschiedsänderung unter einem Energiepegelunterschiedsänderungsschwellenwert liegt. In einer Ausführungsform der Erfindung ist der Energiepegelunterschiedsänderungsschwellenwert vorgegeben. Es kann ein Vorteil sein, einen Schwellenwert zu verwenden, um zu bestimmen, wann eine Energiepegelunterschiedsänderung ausreichend klein ist, um auf das Vorhandensein eines anhaltenden Tons oder einer Audio-Rückkopplung hinzuweisen. Ein solcher Energiepegelunterschiedsänderungsschwellenwert kann von der Methode abhängig sein, mit der die Änderung des Energiepegelunterschieds bestimmt wird. Ein Energiepegelunterschiedsänderungsschwellenwert in einer auf Subtraktion basierenden Ausführungsform kann beispielsweise 2 dB, 1 dB, 0,8 dB, 0,5 dB oder 0,3 dB betragen, oder in einer auf Verhältnis basierenden Ausführungsform beispielsweise zwischen 0,8 und 1,2, 0,9 und 1,1, 0,95 und 1,05, 0,98 und 1,02 oder 0,99 und 1,01 liegen.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt der Schwellenwerterkennung, um festzustellen, dass keine Audio-Rückkopplung vorliegt, wenn eine Größe einer digitalen Darstellung des Eingangsaudiosignals -40 dBFS nicht überschreitet. Da Audio-Rückkopplungen dadurch gekennzeichnet sind, dass sie schnell einen hohen Pegel aufbauen, ist es vorteilhaft, ein Verfahren zur Rückkopplungserkennung erst ab einem bestimmten Energiepegel anzuwenden. Um unnötige Verarbeitung zu vermeiden und/oder schnell zu bestimmen, wann eine Audio-Rückkopplung im Eingangsaudiosignal nicht möglich ist, kann es vorteilhaft sein, einen Eingangspegelschwellenwert anzuwenden, bevor die Schritte des Analysierens und Vergleichens durchgeführt werden, und nur dann mit dem Rest des Verfahrens fortzufahren, wenn der Pegel des digitalisierten Eingangsaudiosignals einen bestimmten Wert erreicht. Ein geeigneter Schwellenwert kann -40 dBFS sein. In anderen Ausführungsformen kann der Schwellenwert auf -60 dBFS, -50 dBFS, -30 dBFS, -20 dBFS eingestellt werden.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Filterns des Eingangsaudiosignals mit mindestens einem Rauschfilter vor dem Schritt des separaten Filterns des Audioeingangssignals mit der Mehrzahl von separaten Analyseaudiofiltern. In einer Ausführungsform der Erfindung ist der mindestens eine Rauschfilter ein adaptiver Filter. In einer Ausführungsform der Erfindung umfasst der mindestens eine Rauschfilter mindestens zwei adaptive Filter in einer Line-Enhancer-Konfiguration. Es kann ein Vorteil sein, einen Rauschfilter anzuwenden, um den nichtperiodischen Anteil des Eingangsaudiosignals zu reduzieren, bevor das Signal den Analyseaudiofiltern zugeführt wird, da dies die Genauigkeit der Rückkopplungserkennung verbessern kann. Es kann weiterhin vorteilhaft sein, mindestens einen adaptiven Filter oder alternativ einen Rauschfilter umfassend zwei adaptive Filter in einer Line-Enhancer-Konfiguration anzuwenden. Die Periodenerkennung mit solchen Rauschfiltern kann das Signal-zu-Rausch-Verhältnis erhöhen. In einem Beispiel kann das Signal-zu-Rausch-Verhältnis von z. B. 10 dB auf 50 dB erhöht werden. Der Effekt kann von der Frequenz des gefilterten Signals abhängen. Die Verbesserung des Signal-zu-Rausch-Verhältnisses kann zu einer empfindlicheren und präziseren Rückkopplungserkennung führen. In einer Ausführungsform der Erfindung können dem vorgenannten einen oder mehreren Rauschfiltern, z. B. adaptiven Filtern oder nicht-adaptiven Filtern, ein aktuelles Signal und ein verzögertes Signal zugeführt werden. Einbeziehen des verzögerten Signals in den Filterungsschritt kann die Entfernung von nichtperiodischen Inhalten durch den adaptiven Filter verbessern, wodurch das Signal-zu-Rausch-Verhältnis des gefilterten Audioeingangssignals weiter verbessert werden kann. Es versteht sich, dass sich der Begriff Rauschfilter auf jede Form von Filter, konfiguriert um nichtperiodische Inhalte in einem Audiosignal zu reduzieren, beziehen kann.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt der Grenzwertdetektion, um die Erfassung der Audio-Rückkopplung basierend auf zwei oder mehr aufeinanderfolgenden Energiepegelunterschiedsänderungen zu validieren.
  • Das oben beschriebene Verfahren, der Halte-Detektion, indem mehrere Energiepegelunterschiedsänderungen in vorbestimmten Intervallen ausgewertet werden, um die Zuverlässigkeit der Audio-Rückkopplungserkennung zu verbessern, kann in bestimmten Ausführungsformen unter bestimmten Umständen anfällig für eine Unregelmäßigkeit sein, wobei es in diesem Fall vorteilhaft sein kann, eine Grenzdetektionsfunktion bereitzustellen, um zu validieren, wann diese Umstände vorhanden sind. Ausführungsformen mit drei oder mehr Analyseaudiofiltern sind anfällig für diese Unregelmäßigkeit, da das System dann entscheiden muss, von welchen zwei benachbarten Filtern die Ausgaben verglichen werden sollen, um das Vorhandensein von Audio-Rückkopplung zu erkennen. Je markanter der Ton ist, desto zuverlässiger repräsentiert ein Energiepegelunterschied die Frequenz dieses Tons, z. B. die Frequenz der Audio-Rückkopplung. Wenn diese Frequenz jedoch zufällig mit einer Spitze eines Analyseaudiofilters zusammenfällt, die zwischen zwei anderen Analyseaudiofiltern liegt, oder in der Nähe einer solchen Spitze, z. B. in einem Frequenzbereich von +/- 2% relativ zu einer solchen Spitze, ist die Bestimmung, ob der Ton anhaltend ist, fehleranfälliger, insbesondere bei Vorhandensein von Rauschen. Da der Energiepegelunterschied aufgrund des anderen Signalinhalts, z. B. Rauschen, variiert, kann sich, selbst wenn eine ausgeprägte und konstante Audio-Rückkopplung im Eingangsaudiosignal vorhanden ist, die dem Energiepegelunterschied zugeordnete Frequenz beiderseits einer Filterspitzenfrequenz hin und her verschieben und dadurch ständig ändern, welche beiden Analyseaudiofilter verglichen werden, um den Energiepegelunterschied für die weitere Auswertung zu bestimmen, wodurch sich auch der Energiepegelunterschied ändert und die anschließend berechnete Hüllkurve zu instabil werden kann, um unter dem Schwellenwert zu bleiben, der für die zuverlässige Bestimmung einer Audio-Rückkopplung eingestellt ist, was dazu führt, dass Audio-Rückkopplungen bei den Frequenzen, die mit den Analyseaudiofiltermittenfrequenzen übereinfallen, langsamer oder gar nicht erkannt werden. Es kann eine Funktion zur Grenzerkennung implementiert werden, die überwacht, wenn Energiepegelunterschiede von Audio-Rückkopplungskandidaten mit den Mittenfrequenzen des Analyseaudiofilters übereinstimmen oder in der Nähe davon liegen. Gemäß einer Ausführungsform der Erfindung kann die Frequenzprüfung der Grenzerkennung bestimmen, wann ein problematischer Energiepegelunterschied erkannt wird, und zum Beispiel den Vergleich der gefilterten Audiosignalenergiepegel auf ein bestimmtes Paar von Analyseaudiofiltern festzulegen oder die Halte-Detektion vorübergehend deaktivieren. Als ein Beispiel, in einer Ausführungsform der Erfindung konfiguriert mit fünf Analyseaudiofiltern mit Spitzenfrequenzen bei jeweils z. B. 40 Hz, 200 Hz, 1000 Hz 5000 Hz und 15500 Hz, liegen die problematischen Grenzfrequenzen beispielsweise bei 200, 1000 und 5000 Hz.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt der Validierung der Audio-Rückkopplung basierend auf dem Erkennen des Fehlens eines harmonischen Inhalts der Audio-Rückkopplung in dem Eingangsaudiosignal. Es versteht sich, dass sich der harmonische Inhalt auf alle Harmonischen oder Subharmonischen eines Tons bezieht. Im Allgemeinen sind Audio-Rückkopplungen durch einen Mangel an harmonischem Inhalt relativ zur Grundfrequenz der Audio-Rückkopplung gekennzeichnet. Im Vergleich dazu erzeugen die meisten Musikinstrumente und Stimmen einen hohen Anteil an Oberschwingungen. Daher kann es vorteilhaft sein, das Fehlen von harmonischem Inhalt eines markanten Tons zu erkennen, um zu überprüfen, ob es sich bei einem identifizierten markanten Ton um eine Audio-Rückkopplung oder, zum Beispiel wahrscheinlicher falls Oberschwingungen vorhanden sind, um einen anhaltenden Musikton handelt. In einer Ausführungsform der Erfindung wird das Erkennen des Fehlens von harmonischem Inhalt in vorbestimmten Intervallen durchgeführt. In einer Ausführungsform der Erfindung beträgt das vorbestimmte Intervall 50 ms. In einer beispielhaften Ausführungsform gemäß der Erfindung wird das Fehlen von harmonischen Komponenten einer Audio-Rückkopplung in vorbestimmten Intervallen überwacht, beispielsweise alle 100 ms, wie alle 70 ms, beispielsweise vorzugsweise alle 50 ms, wie alle 40 ms, wie alle 30 ms, wie alle 20 ms, wie alle 10 ms. In einer weiteren beispielhaften Ausführungsform gemäß der Erfindung wird das Fehlen von harmonischen Komponenten jede 100. bis 5. Millisekunde überwacht. In einer Ausführungsform der Erfindung umfasst das Erfassen des Fehlens von harmonischem Inhalt das Bestimmen, wann mindestens ein harmonischer Energiepegel unter einem vorbestimmten Schwellenwert für den harmonischen Energiepegel liegt. In einer Ausführungsform der Erfindung umfasst das Erkennen des Fehlens von harmonischem Inhalt das Bestimmen, wann der mindestens eine harmonische Energiepegel unterhalb des vorbestimmten Schwellenwerts für den harmonischen Energiepegel für mindestens zwei von drei aufeinanderfolgenden vorbestimmten Intervallen liegt. In einer Ausführungsform der Erfindung beträgt der Schwellenwert für den harmonischen Energiepegel im Vergleich zu einem Energiepegel des markanten Tons -20 dB, beispielsweise -30 dB, beispielsweise - 40 dB, beispielsweise -50 dB, beispielsweise -60 dB.
  • Ein Mangel an harmonischem Inhalt kann vorzugsweise als ein niedriger Signalpegel bei den Oberschwingungsfrequenzen des markanten Tons, der für die Audio-Rückkopplung ausgewertet wird, bestimmt werden. Mit niedrigem Signalpegel kann beispielsweise ein Pegel gemeint sein, der 30 dB unter dem des markanten Tons liegt. In einer bevorzugten Ausführungsform wird ein vorbestimmter Schwellenwert verwendet, um zu bewerten, ob harmonischer Inhalt vorhanden ist, indem der Signalpegel bei den Oberschwingungsfrequenzen mit dem vorbestimmten Schwellenwert, z. B. -30 dB, verglichen wird. In einer Ausführungsform der Erfindung umfasst der harmonische Inhalt eine oder mehrere aus der Liste einer ersten Harmonischen, einer zweiten Harmonischen, einer dritten Harmonischen und einer Subharmonischen des markanten Tons. Vorteilhafterweise kann ein Fehlen dieser Oberschwingungen und/oder Unterschwingungen ein guter Prädiktor für Audio-Rückkopplung sein. Da unterschiedliche Musikinstrumente und Stimmen unterschiedliche Oberschwingungen erzeugen, was der Grund ist, warum sie so unterschiedliche Klangfarben haben, ist es vorteilhaft, mehrere Oberschwingungen zu testen und nicht nur z. B. den ersten Harmonischen. In einer Ausführungsform der Erfindung umfasst der Schritt des Erkennens des Fehlens von harmonischem Inhalt einen Schritt des Filterns des Eingangsaudiosignals mit Oberschwingungsfiltern, die auf Oberschwingungsfrequenzen des markanten Tons zentriert sind, um mindestens ein Oberschwingungserkennungssignal zu erhalten. In einer Ausführungsform der Erfindung wird ein Energiepegel des mindestens Oberschwingungserkennungssignals mit einem Energiepegel des markanten Tons verglichen, um mindestens einen Oberschwingungsenergiepegel zu erhalten. In einer Ausführungsform der Erfindung wird der Filterkoeffizient des mindestens einen Oberschwingungsfilters auf der Grundlage des Energiepegelunterschied bestimmt. In einer Ausführungsform der Erfindung wird der Filterkoeffizient des mindestens einen Oberschwingungsfilters auf der Grundlage der Audio-Rückkopplungsfrequenz der Audio-Rückkopplung bestimmt. In einer Ausführungsform der Erfindung ist der mindestens eine Oberschwingungsfilter ein Schmalbandpassfilter, wie beispielsweise ein Doppelpräzisions-Peak-Filter mit einem Gütefaktor von 64.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Validierens der Audio-Rückkopplung basierend auf dem Erkennen, wenn ein Energiepegel der Audio-Rückkopplung annähernd konstant oder ansteigend zwischen zwei oder mehr aufeinanderfolgenden Wiederholungen ist. Da der gewünschte Ton, wie z. B. Musik, anhaltende Töne umfassen kann, kann in einer bevorzugten Ausführungsform eine weitere Validierung der Audio-Rückkopplung vorteilhaft angewendet werden. Durch Überwachung des Pegels des markanten Tons, der als Audio-Rückkopplungskandidat bewertet wird, kann der Ton als unerwünschte Audio-Rückkopplung validiert werden, wenn der Pegel gleich bleibt oder ansteigt. Verringert sich hingegen die Amplitude, wird der Ton als erwünschter, anhaltender Ton betrachtet, und die Rückkopplungsunterdrückung wird nicht angewendet.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt des Validierens der Audio-Rückkopplung basierend auf dem Erkennen eines Energiepegels bei einer Audio-Rückkopplungsfrequenz der Audio-Rückkopplung, der einen vorbestimmten Rückkopplungs-Intensitätsschwellenwert überschreitet. Indem ein Rückkopplungskandidat nur dann als tatsächliche Audio-Rückkopplung, für die eine Audio-Rückkopplungsunterdrückung angewendet werden kann, validiert wird, wenn sein Pegel einen Schwellenwert für die Rückkopplungsintensität überschreitet, kann die Zuverlässigkeit erhöht werden, dass gewünschte, anhaltende Musiktöne bei niedrigeren Pegeln nicht fälschlicherweise für Audio-Rückkopplung gehalten werden, und es kann außerdem vermieden werden, Filterleistung für Rückkopplungen mit niedrigem Pegel zu verbrauchen, die möglicherweise nicht störend oder gar wahrnehmbar sind. Der Schwellenwert für die Rückkopplungsintensität kann z. B. als ein Pegel gewählt werden, bei dem Rückkopplungen hörbar oder störend werden.
  • In einer Ausführungsform der Erfindung umfasst das Verfahren einen Schritt der Anwendung der Audio-Rückkopplungsunterdrückung, wenn eine Clipping-Erkennung einen Signalpegel ermittelt, der einen Clipping-Schwellenwert überschreitet. In einer Ausführungsform überwacht eine Clipping-Erkennung das Ausgangsaudiosignal, das nachfolgenden Stufen, einschließlich eines Verstärkers, zugeführt wird. Die Clipping-Erkennung bestimmt, wann der Signalpegel ausreichend hoch ist, dass die Gefahr besteht, dass im Wandler, z. B. einem Lautsprecher, ein Clipping auftritt. In diesem Fall wird sofort die Audio-Rückkopplungsunterdrückung angewendet. Selbst in Ausführungsformen mit Oberschwingungserkennung und/oder Amplitudenreduzierungserkennung werden diese Maßnahmen deaktiviert, da sie einen erheblichen Zeitaufwand erfordern, wie z. B. das Warten auf drei Intervalle von 50 ms. Die Clipping-Erkennung und sofortige Aktivierung der Rückkopplungsunterdrückung kann vorteilhaft sein, weil ein Clipping des Wandlers zu einer Audio-Rückkopplung mit harmonischem Inhalt führen kann, die vom Mikrofon aufgenommen werden und noch mehr Audio-Rückkopplung erzeugen kann. Daher können in einem solchen Fall, und um die Rückkopplung dennoch unterdrücken zu können, der Oberschwingungsdetektor und der Detektor für Amplitudenreduzierung vorzugsweise deaktiviert und die Rückkopplungsunterdrückung aktiviert werden.
  • In einem alternativen Aspekt wird ein Verfahren zur automatischen Erkennung von Audio-Rückkopplungen in einem Eingangsaudiosignal offenbart. Das Verfahren umfasst die Schritte des separaten Filterns des Audioeingangssignals mit einer Mehrzahl von separaten Analyseaudiofiltern, um eine Mehrzahl von gefilterten Audiosignalen zu erzeugen; wobei die separaten Analyseaudiofilter unterschiedlich sind. Zudem, Vergleichen von mindestens zwei gefilterten Audiosignalen der Mehrzahl von gefilterten Audiosignalen, um einen Energiepegelunterschied zu erhalten. Weiteres Vergleichen von mindestens zwei der erhaltenen Energiepegelunterschiede, um die Audio-Rückkopplung zu erkennen. Weiteres Anwenden einer Audio-Rückkopplungsunterdrückung auf das Eingangsaudiosignal, um ein Ausgangsaudiosignal zu erzeugen, wobei die Audio-Rückkopplungsunterdrückung auf der Grundlage der Erkennung der Audio-Rückkopplung konfiguriert wird. In diesem Aspekt kann jedes der oben beschriebenen Merkmale zur weiteren Verbesserung und Konfiguration angewendet werden.
  • Ein Aspekt der Erfindung bezieht sich auf ein Audioverarbeitungssystem zum Erkennen von Audio-Rückkopplungen eines Eingangsaudiosignals, wobei das Audioverarbeitungssystem umfasst:
    • einen Audiosignaleingang zum Empfangen des Eingangsaudiosignals;
    • eine Mehrzahl von Analyseaudiofiltereinheiten, die kommunizierend mit dem Audiosignaleingang verbunden sind, um das Eingangsaudiosignal separat zu filtern;
    • mindestens eine Vergleichereinheit für gefilterte Audiosignale, die kommunizierend mit mindestens zwei Analyseaudiofiltereinheiten der Mehrzahl von Analyseaudiofiltereinheiten verbunden ist, wobei ein Ausgang des mindestens einen Vergleichers für gefilterte Audiosignale einen Energiepegelunterschied darstellt, der auf der Eingabe von den mindestens zwei Analyseaudiofiltereinheiten basiert; und
    • eine Rückkopplungsdetektoreinheit, die kommunizierend mit dem Ausgang des mindestens einen Vergleichers für gefilterte Audiosignale verbunden ist, wobei die Rückkopplungsdetektoreinheit eingerichtet ist, um zu detektieren, wann ein Wert des Ausgangs des mindestens einen Vergleichers für gefilterte Audiosignale konstant ist, und dadurch Rückkopplungsinformationen zu erzeugen und bereitzustellen. Ein Audiosignaleingang kann jede Art von Eingang sein, z. B. basierend auf einer verdrahteten Verbindung, einer drahtlosen Verbindung, einem Mikrofon oder einem Datenspeicher zur Bereitstellung des Eingangsaudiosignals. Als solches hat der Audiosignaleingang nicht notwendigerweise einen physischen Anschluss.
  • Die Mehrzahl von Analyseaudiofiltereinheiten können beispielsweise das Eingangsaudiosignal separat filtern, um ein Mehrzahl von gefilterten Audiosignalen zu erzeugen, von denen zwei als Eingabe für eine Vergleichereinheit für gefilterte Audiosignale verwendet werden.
  • In einer Ausführungsform der Erfindung ist die mindestens eine Vergleichereinheit für gefilterte Audiosignale über separate Energiedetektoren mit den mindestens zwei Analyseaudiofiltereinheiten kommunizierend verbunden. Beispielsweise kann ein separater Energiedetektor nach jeder der beiden Analyseaudiofiltereinheiten oder nach jeder Analyseaudiofiltereinheit der Mehrzahl von Analyseaudiofiltereinheiten angeordnet sein. Zum Beispiel so, dass jede der mindestens einen Vergleichereinheiten für gefilterte Audiosignale über separate Pegeldetektoren mit Analyseaudiofiltereinheiten verbunden ist. In einer Ausführungsform der Erfindung ist die mindestens eine Vergleichereinheit für gefilterte Audiosignale eine Mehrzahl von Vergleichereinheiten für gefilterte Audiosignale, wobei jede Vergleichereinheit für gefilterte Audiosignale der Mehrzahl von Vergleichereinheiten für gefilterte Audiosignale kommunizierend mit mindestens zwei jeweiligen Analyseaudiofiltereinheiten der Mehrzahl von Analyseaudiofiltereinheiten verbunden ist, wobei die Rückkopplungsinformation auf einem oder mehreren jeweiligen Ausgaben von jeweiligen Vergleichereinheiten für gefilterte Audiosignale der Mehrzahl von Vergleichereinheiten für gefilterte Audiosignale basiert. In Ausführungsformen mit mehr als einer Vergleichereinheit für gefilterte Audiosignale kann jede Vergleichereinheit für gefilterte Audiosignale mit zwei Analyseaudiofiltereinheiten verbunden sein, so dass jede Vergleichereinheit mit einer einzigartigen Kombination von Analyseaudiofiltereinheiten verbunden ist. So können mehrere Energiepegelvergleiche durchgeführt werden, z. B. um mehrere Energiepegelunterschiede zu ermitteln. Und die Rückkopplungserkennung kann auf der Auswahl eines dieser Energiepegelunterschiede für die weitere Verarbeitung beruhen, oder auf der Verarbeitung mehrerer dieser.
  • In einer Ausführungsform der Erfindung umfasst der Rückkopplungsdetektor einen Halte-Detektor, der dazu eingerichtet ist, den Energiepegelunterschied mit einem zuvor ermittelten Energiepegelunterschied zu vergleichen. Ein zuvor ermittelter Energiepegelunterschied kann beispielsweise in ähnlicher Weise wie der Energiepegelunterschied ermittelt werden, jedoch zu einem früheren Zeitpunkt. Zum Beispiel kann ein Audiosignal eine Länge von mehreren hundert Millisekunden haben, und ein Energiepegelunterschied kann alle 50 Millisekunden ermittelt werden. In einer Ausführungsform der Erfindung umfasst der Rückkopplungsdetektor einen Rückkopplungszustandsvalidierer, der so eingerichtet ist, dass er Rückkopplungsinformation basierend auf der Eingabe vom Halte-Detektor erzeugt. Der Halte-Detektor kann z. B. den Energiepegelunterschied und den zuvor ermittelten Energiepegelunterschied subtrahieren. Der Rückkopplungszustandsvalidierer kann dann beispielsweise das Ergebnis dieser Subtraktion analysieren, um zu überprüfen, ob eine Audio-Rückkopplung vorhanden ist, z. B. wenn die Subtraktion annähernd Null ist.
  • In einer Ausführungsform der Erfindung umfasst das Audioverarbeitungssystem ferner eine Rückkopplungsunterdrückungseinheit, die so eingerichtet ist, dass sie mindestens einen Unterdrückungsfilter in einer kommunizierenden Verbindung zwischen einem Eingangsmikrofon und einem Ausgangslautsprecher implementiert. In einigen Lautsprechersystemen kann ein Ausgangslautsprecher Schall basierend auf durch ein Eingangsmikrofon aufgenommenem Ton erzeugen. In solchen Systemen kann es zu Audio-Rückkopplungen kommen, z. B. wenn das Mikrofon und der Lautsprecher nahe beieinander liegen. Audio-Rückkopplungen können dann unterdrückt werden, indem mindestens ein Unterdrückungsfilter implementiert wird, den das vom Mikrofon aufgenommene Audio durchläuft, bevor es vom Lautsprecher als Schall ausgegeben wird. In einer Ausführungsform der Erfindung ist das Eingangsmikrofon eingerichtet, um das Eingangsaudiosignal bereitzustellen.
  • In einer Ausführungsform der Erfindung umfasst ein Tondetektor mindestens die Mehrzahl von Analyseaudiofiltereinheiten und die mindestens eine Vergleichereinheit für gefilterte Audiosignale. In einer Ausführungsform der Erfindung sind der Tondetektor und der Rückkopplungsdetektor auf separaten Einheiten implementiert, die kommunizierend verbunden sind. In einer Ausführungsform der Erfindung ist der Tondetektor auf einem digitalen Signalprozessor implementiert und der Rückkopplungsdetektor auf einem System-On-a-Chip implementiert, wobei das System-On-a-Chip eine von dem digitalen Signalprozessor getrennte Einheit ist.
  • Die strategische Trennung verschiedener Berechnungen und/oder Untereinheiten zu separaten Einheiten, wie hier beispielhaft dargestellt, kann es ermöglichen, billigere, kleinere oder schnellere Elektronik zu wählen, um das System zu ermöglichen, was vorteilhaft ist. Ein Aspekt der Erfindung bezieht sich auf die Verwendung des Audioverarbeitungssystems zum Erkennen von Audio-Rückkopplungen. In einer Ausführungsform der Erfindung wird das Audioverarbeitungssystem ferner zur Unterdrückung der Audio-Rückkopplung verwendet, indem mindestens ein Unterdrückungsfilter implementiert wird. Das Audioverarbeitungssystem gemäß Ausführungsformen der Erfindung kann zum Erkennen von Audio-Rückkopplungen und optional zum Unterdrücken dieser Rückkopplungen geeignet sein, was vorteilhaft ist.
  • Bezugszeichenliste
  • 1
    Audioverarbeitungssystem
    2
    Eingangsaudiosignal
    3
    Tondetektor
    4
    Rückkopplungsdetektoreinheit
    5a-e
    Analyseaudiofiltereinheit
    6a-e
    Gefiltertes Audiosignal
    7, 7a-b
    Vergleichereinheit für gefilterte Audiosignale
    8, 8a-b
    Energiepegelunterschied
    9
    Halte-Detektor
    10
    Halte-Zustand
    11
    Rückkopplungszustandsvalidierer
    12
    Rückkopplungsinformation
    13
    Rückkopplungsunterdrückungseinheit
    14
    Mikrofon
    15
    Lautsprecher
    16
    Ausgangaudiosignal
    17
    Vorprozessor
    18
    Vorverarbeitetes Audiosignal
    19a-c
    Energiedetektor
    20
    Energiedifferenz-zu-Frequenz-Abbildungseinheit
    21
    Grenzfrequenzprüfer
    22
    Repräsentative Tonfrequenz
    23
    Periodendetektionseinheit
    24
    Schwellenwertdetektor
    25a-b
    Vorverarbeitungsfilter
    26a-e
    Frequenzdarstellung der Energiepegelabschwächung
    261a-b
    Frequenzdarstellung der Energiepegelabschwächung
    27
    Differenz-zu-Frequenz-Abbildungsfunktion
    28
    Oberschwingungs-Detektor
    29
    Detektor für abnehmende Energiepegel
    30a-e
    Oberschwingungsfilter
    31
    Oberschwingungszustand
    32
    abnehmender Energiepegelzustand
    33
    Banderkennung
    34
    Keine Audio-Rückkopplung
    35
    Energiepegelunterschiedsänderung
    36
    Rückkopplungsperiode
    37
    Audio-digitaler Signalprozessor
    38
    System-on-Chip
    39a-b
    Periodenfilter
    40a-b
    Verzögerungseinheit
    41
    Rauschgefiltertes Audiosignal
    42
    Absolutwertbestimmer
    43
    Hüllkurvenberechnungseinheit
    44
    Energiepegelunterschiedsänderungsschwellenwertvergleicher
    45
    Verzögerter Energiepegelunterschied
    46
    Subtraktionseinheit
    47
    Energiepegelunterschied-Differenz
    48
    Filterbank
    49
    Filterparameter-Berechnungseinheit
    50a-e
    Energiepegel
    51
    Verarbeitungseinheit
    52
    Erstes gefiltertes Signal
    53
    Verzögertes erstes gefiltertes Signal
    54a-b
    vorläufiger Energiepegelunterschied
    55a-e
    Filterspitzenfrequenz
    56a-d
    Filterfrequenzbereich
    S1-S4
    Verfahrensschritte

Claims (21)

  1. Verfahren zum automatischen Erkennen von Audio-Rückkopplungen in einem Audioeingangssignal; wobei das Verfahren die folgenden Schritte umfasst: separates Filtern des Audioeingangssignals mit einer -Mehrzahl von separaten Analyseaudiofiltern, um eine Mehrzahl von gefilterten Audiosignalen zu erzeugen; wobei die separaten Analyseaudiofilter unterschiedlich sind; Vergleichen von mindestens zwei gefilterten Audiosignalen der Mehrzahl von gefilterten Audiosignalen, um einen Energiepegelunterschied zu erhalten; Durchführen einer oder mehrerer Wiederholungen des Schritts des getrennten Filterns des Audioeingangssignals und des Schritts des Vergleichens der gefilterten Audiosignale, wodurch eine Mehrzahl der Energiepegelunterschiede ermittelt wird; Vergleichen von mindestens zwei Energiepegelunterschieden aus der Mehrzahl der Energiepegelunterschiede, die aus mindestens zwei der Wiederholungen erhalten wurden, um die Audio-Rückkopplung zu erkennen.
  2. Verfahren nach Anspruch 1, wobei das Verfahren einen Schritt der Wiedergabe, unter Verwendung eines oder mehrerer Lautsprecher, eines Ausgangsaudiosignals basierend auf dem Eingangsaudiosignal umfasst.
  3. Verfahren nach Anspruch 1 oder 2, wobei das Verfahren einen Schritt der automatischen Unterdrückung der erkannten Audio-Rückkopplung umfasst.
  4. Verfahren nach Anspruch 3, wobei der Schritt des Unterdrückens der Audio-Rückkopplung das Anwenden mindestens eines Audio-Rückkopplungsunterdrückungsfilters umfasst.
  5. Verfahren nach Anspruch 3, wobei der Schritt des Unterdrückens der Audio-Rückkopplung das Anwenden von mindestens zwei kaskadierten Audio-Rückkopplungsunterdrückungsfiltern umfasst.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verfahren einen Schritt des Messens eines Signalenergiepegels für jedes der mindestens zwei gefilterten Audiosignale umfasst, um mindestens zwei separate Signalenergiepegel zu erhalten.
  7. Verfahren nach Anspruch 6, wobei der Schritt des Vergleichens der mindestens zwei gefilterten Audiosignale auf zwei benachbarten Analyseaudiofiltern mit den höchsten gefilterten Audiosignalenergiepegeln basiert.
  8. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verfahren ferner einen Schritt des Umwandelns eines Energiepegelunterschieds der Mehrzahl von Energiepegelunterschieden durch eine Differenz-zu-Frequenz-Abbildungsfunktion in eine Audio-Rückkopplungsfrequenz der erfassten Audio-Rückkopplung umfasst.
  9. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Erkennen der Audio-Rückkopplung das Bestimmen des Vorhandenseins einer Audio-Rückkopplung, wenn mindestens zwei aufeinanderfolgende Energiepegelunterschiede der Mehrzahl von Energiepegelunterschiede ungefähr gleich sind, umfasst.
  10. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verfahren einen Schritt des Aktualisierens eines Halte-Zustands basierend auf dem Vergleich der mindestens zwei Energiepegelunterschiede aus mindestens zwei der Wiederholungen umfasst, wobei der Halte-Zustand einen anhaltenden Ton in dem Eingangsaudiosignal anzeigt.
  11. Verfahren nach Anspruch 10, wobei das Verfahren einen Schritt des Aktualisierens eines Audio-Rückkopplungszustands basierend auf dem Halte-Zustand oder dem Vergleich der mindestens zwei Energiepegelunterschiede von mindestens zwei der Wiederholungen umfasst, wobei der Audio-Rückkopplungszustand eine Audio-Rückkopplung in dem Eingangsaudiosignal anzeigt.
  12. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verfahren einen Schritt der Durchführung einer Schwellenwerterkennung umfasst, um zu bestimmen, dass keine Audio-Rückkopplung vorhanden ist, wenn eine Größe einer digitalen Darstellung des Eingangsaudiosignals -40 dBFS nicht überschreitet.
  13. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verfahren einen Schritt des Filterns des Audioeingangssignals mit mindestens einem Rauschfilter vor dem Schritt des separaten Filterns des Audioeingangssignals mit der Mehrzahl von separaten Analyseaudiofiltern umfasst.
  14. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Schritt des Vergleichens von mindestens zwei Energiepegelunterschieden der Mehrzahl von Energiepegelunterschieden, die aus mindestens zwei der Wiederholungen erhalten werden, das Bestimmen von mindestens einer Energiepegelunterschiedsänderung umfasst, wobei das Verfahren einen Schritt des Durchführens einer Grenzerkennung umfasst, um die Erkennung von Audio-Rückkopplung basierend auf zwei oder mehr aufeinanderfolgenden Energiepegelunterschiedsänderungen zu validieren.
  15. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verfahren einen Schritt der Validierung der Audio-Rückkopplung basierend auf der Erkennung des Fehlens eines harmonischen Inhalts der Audio-Rückkopplung in dem Eingangsaudiosignal umfasst.
  16. Verfahren nach einem der Ansprüche 1 bis 14, wobei das Verfahren einen Schritt des Validierens der Audio-Rückkopplung basierend auf der Erkennung, wann ein Energiepegel der Audio-Rückkopplung zwischen zwei oder mehr aufeinanderfolgenden Wiederholungen annähernd konstant oder ansteigend ist, umfasst.
  17. Verfahren nach einem der Ansprüche 1 bis 14, wobei das Verfahren einen Schritt des Validierens der Audio-Rückkopplung basierend auf dem Erfassen eines Energiepegels bei einer Audio-Rückkopplungsfrequenz der Audio-Rückkopplung, der einen vorbestimmten Rückkopplungsintensitäts-Schwellenwert überschreitet, umfasst.
  18. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verfahren einen Schritt der Anwendung von Audio-Rückkopplungsunterdrückung umfasst, wenn ein Clipping-Erkennungsschritt einen Signalpegel feststellt, der einen Clipping-Schwellenwert überschreitet.
  19. Audioverarbeitungssystem zum Erkennen von Audio-Rückkopplung eines Eingangsaudiosignals, wobei das Audioverarbeitungssystem umfasst: einen Audiosignaleingang zum Empfangen des Eingangsaudiosignals; eine Mehrzahl von Analyseaudiofiltereinheiten, die kommunizierend mit dem Audiosignaleingang verbunden sind, um das Eingangsaudiosignal separat zu filtern; mindestens eine Vergleichereinheit für gefilterte Audiosignale, die kommunizierend mit mindestens zwei Analyseaudiofiltereinheiten der Mehrzahl von Analyseaudiofiltereinheiten verbunden ist, wobei ein Ausgang des mindestens einen Vergleichers für gefilterte Audiosignale einen Energiepegelunterschied basierend auf der Eingabe von den mindestens zwei Analyseaudiofiltereinheiten darstellt; und eine Rückkopplungsdetektoreinheit, die kommunizierend mit dem Ausgang des mindestens einen Vergleichers für gefilterte Audiosignale verbunden ist, wobei die Rückkopplungsdetektoreinheit eingerichtet ist, um zu detektieren, wann ein Wert des Ausgangs des mindestens einen Vergleichers für gefilterte Audiosignale konstant ist, und dadurch Rückkopplungsinformationen zu erzeugen und bereitzustellen.
  20. Audioverarbeitungssystem nach Anspruch 19, ferner umfassend mindestens einen Audio-Rückkopplungsunterdrückungsfilter zum Unterdrücken der erfassten Audio-Rückkopplung.
  21. Verwendung des Audioverarbeitungssystems nach Anspruch 19 oder Anspruch 20 zum Erkennen von Audio-Rückkopplungen.
DE102021103179.6A 2020-02-11 2021-02-11 Erkennung und unterdrückung von audio-rückkopplungen Pending DE102021103179A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202062972894P 2020-02-11 2020-02-11
US62/972,894 2020-02-11

Publications (1)

Publication Number Publication Date
DE102021103179A1 true DE102021103179A1 (de) 2021-08-12

Family

ID=74859021

Family Applications (2)

Application Number Title Priority Date Filing Date
DE102021103179.6A Pending DE102021103179A1 (de) 2020-02-11 2021-02-11 Erkennung und unterdrückung von audio-rückkopplungen
DE102021103175.3A Pending DE102021103175A1 (de) 2020-02-11 2021-02-11 Verfahren und audioverarbeitungseinheit zur erfassung eines tons

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE102021103175.3A Pending DE102021103175A1 (de) 2020-02-11 2021-02-11 Verfahren und audioverarbeitungseinheit zur erfassung eines tons

Country Status (4)

Country Link
US (2) US11528558B2 (de)
CN (2) CN113259811B (de)
DE (2) DE102021103179A1 (de)
GB (2) GB2596169B (de)

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214708A (en) * 1991-12-16 1993-05-25 Mceachern Robert H Speech information extractor
US5442712A (en) * 1992-11-25 1995-08-15 Matsushita Electric Industrial Co., Ltd. Sound amplifying apparatus with automatic howl-suppressing function
JP3235925B2 (ja) * 1993-11-19 2001-12-04 松下電器産業株式会社 ハウリング抑制装置
US6831986B2 (en) * 2000-12-21 2004-12-14 Gn Resound A/S Feedback cancellation in a hearing aid with reduced sensitivity to low-frequency tonal inputs
US7715447B2 (en) * 2003-12-23 2010-05-11 Intel Corporation Method and system for tone detection
EP1638083B1 (de) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandbreitenerweiterung von bandbegrenzten Tonsignalen
US7315264B2 (en) * 2006-01-17 2008-01-01 D2Audio Corporation Systems and methods for controlling transient response in the output of a noise shaper
US8483384B2 (en) * 2006-03-06 2013-07-09 Freescale Semiconductor, Inc. Enhanced tone detector including adaptive multi-bandpass filter for tone detection and enhancement
WO2010035760A1 (ja) * 2008-09-24 2010-04-01 ヤマハ株式会社 ループゲイン推定装置およびハウリング防止装置
WO2010126709A1 (en) * 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
CN102176313B (zh) * 2009-10-10 2012-07-25 北京理工大学 基于共振峰频率的汉语普通话单韵母语音可视化方法
EP2362375A1 (de) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Gerät und Verfahren zur Änderung eines Audiosignals durch Hüllkurvenenformung
US8756061B2 (en) * 2011-04-01 2014-06-17 Sony Computer Entertainment Inc. Speech syllable/vowel/phone boundary detection using auditory attention cues
KR102006734B1 (ko) * 2012-09-21 2019-08-02 삼성전자 주식회사 음성 신호의 처리 방법 및 무선 통신 단말
WO2014094242A1 (en) * 2012-12-18 2014-06-26 Motorola Solutions, Inc. Method and apparatus for mitigating feedback in a digital radio receiver
FR3030983B1 (fr) * 2014-12-19 2018-02-16 STMicroelectronics (Alps) SAS Systeme et procede de protection de haut-parleur audio
CA2908891A1 (en) * 2015-10-15 2017-04-15 Clearwater Clinical Limited A computer-implemented method for reducing crosstalk in a computer-based audiometer
US9747887B2 (en) * 2016-01-12 2017-08-29 Bose Corporation Systems and methods of active noise reduction in headphones
CN111149370B (zh) * 2017-09-29 2021-10-01 杜比实验室特许公司 会议系统中的啸叫检测
CN108088582B (zh) * 2017-12-29 2019-12-31 广东电网有限责任公司东莞供电局 一种声表面波快速测量开关柜温度的方法
CN108461087B (zh) * 2018-02-07 2020-06-30 河南芯盾网安科技发展有限公司 数字信号穿过声码器的装置及方法

Also Published As

Publication number Publication date
US20210249028A1 (en) 2021-08-12
GB2596169B (en) 2022-04-27
CN113259814A (zh) 2021-08-13
US11528558B2 (en) 2022-12-13
GB202100981D0 (en) 2021-03-10
CN113259811A (zh) 2021-08-13
US20210250691A1 (en) 2021-08-12
US11722822B2 (en) 2023-08-08
GB2596169A (en) 2021-12-22
CN113259814B (zh) 2023-02-17
CN113259811B (zh) 2022-08-26
GB202101040D0 (en) 2021-03-10
GB2595949A (en) 2021-12-15
DE102021103175A1 (de) 2021-08-12
GB2595949B (en) 2022-08-03

Similar Documents

Publication Publication Date Title
DE112012000052B4 (de) Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen
DE602005006412T2 (de) Verfahren und Vorrichtung zur Grundfrequenzbestimmung
EP1853089B1 (de) Verfahren zum Unterdrücken von Rückkopplungen und zur Spektralerweiterung bei Hörvorrichtungen
DE112016006218B4 (de) Schallsignal-Verbesserungsvorrichtung
DE3990151C1 (de) Einrichtung zur Überprüfung von Systemen zur Verarbeitung von Audiosignalen
DE60315228T2 (de) Einrichtung und verfahren zur rückkopplungskontrolle
EP1258865B1 (de) Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE112009000805T5 (de) Rauschreduktion
EP3454572B1 (de) Verfahren zum erkennen eines defektes in einem hörinstrument
DE10214407C1 (de) Anordnung und Verfahren zur Messung, Bewertung und Störungserkennung von Systemen
DE102016225205A1 (de) Verfahren zum Bestimmen einer Richtung einer Nutzsignalquelle
EP0772764B1 (de) Verfahren und vorrichtung zum bestimmen der tonalität eines audiosignals
EP3565270B1 (de) Verfahren zur rauschunterdrückung in einem audiosignal
EP1489882A2 (de) Verfahren zum Betrieb eines Hörhilfegerätes, sowie Hörhilfegerät mit einem Mikrofonsystem, bei dem unterschiedliche Richtcharakteristiken einstellbar sind
EP0531769A1 (de) Schaltungsanordnung zur Dynamiksteuerung eines Sprachendgerätes
DE102021103179A1 (de) Erkennung und unterdrückung von audio-rückkopplungen
EP1458216B1 (de) Vorrichtung und Verfahren zur Adaption von Hörgerätemikrofonen
DE3810068C2 (de)
DE4445983C2 (de) Verfahren zur Rauschunterdrückung und Vorrichtungen zur Durchführung der Verfahren
EP3796676B1 (de) Verfahren zum betrieb eines hörgeräts und hörgerät
EP4134954B1 (de) Verfahren und vorrichtung zur audiosignalverbesserung
DE102012204193B4 (de) Audioprozessor und Verfahren zum Verstärken oder Dämpfen eines empfangenen Audiosignals
DE102018131687B4 (de) Verfahren und vorrichtungen zur reduzierung von ploppgeräuschen
DE102007045858B4 (de) Verfahren und System zum Bestimmen eines Amplitudengangs
EP4235664A1 (de) Verfahren zur unterdrückung eines akustischen nachhalls in einem audiosignal

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R081 Change of applicant/patentee

Owner name: TYMPHANY ACOUSTIC TECHNOLOGY LIMITED, TW

Free format text: FORMER OWNER: TYMPHANY ACOUSTIC TECHNOLOGY (HUIZHOU) CO., LTD., HUIZHOU, GUANGDONG, CN