DE102019126509A1 - Verbesserung der subjektiven bass-wahrnehmung eines audiosignals mit hilfe höherer harmonischer - Google Patents

Verbesserung der subjektiven bass-wahrnehmung eines audiosignals mit hilfe höherer harmonischer Download PDF

Info

Publication number
DE102019126509A1
DE102019126509A1 DE102019126509.6A DE102019126509A DE102019126509A1 DE 102019126509 A1 DE102019126509 A1 DE 102019126509A1 DE 102019126509 A DE102019126509 A DE 102019126509A DE 102019126509 A1 DE102019126509 A1 DE 102019126509A1
Authority
DE
Germany
Prior art keywords
signal
raised
order
audio signal
corrected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102019126509.6A
Other languages
English (en)
Inventor
Markus E. CHRISTOPH
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman Becker Automotive Systems GmbH
Original Assignee
Harman Becker Automotive Systems GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman Becker Automotive Systems GmbH filed Critical Harman Becker Automotive Systems GmbH
Priority to DE102019126509.6A priority Critical patent/DE102019126509A1/de
Publication of DE102019126509A1 publication Critical patent/DE102019126509A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/07Generation or adaptation of the Low Frequency Effect [LFE] channel, e.g. distribution or signal processing

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

Die vorliegende Erfindung betrifft Verfahren zur Verbesserung der subjektiven Bass-Wahrnehmung eines Audiosignals. Ein Audiosignal wird empfangen, und mindestens ein potenziertes Signal des Audiosignals wird generiert, welches eine höhere Harmonische des Audiosignals umfasst. Das potenzierte Signal wird unter Verwenden von trigonometrischen Funktionen des Audiosignals durch eine fixe Matrix korrigiert, um Signalkomponenten des potenzierten Signals, welche nicht die höhere Harmonische sind, zu unterdrücken. Das mindestens eine korrigierte potenzierte Signal umfassend die höhere Harmonische wird ausgegeben.

Description

  • Die vorliegende Erfindung betrifft die Verarbeitung von Audiosignalen im Bereich der digitalen Signalverarbeitung (DSP), und insbesondere ein Verfahren zur subjektiven Verbesserung des Bass-Höreindrucks eines Audiosignals mit Hilfe künstlich generierter, höherer Harmonischer. Weiterhin werden ein entsprechender Prozessor, Tonsystem, Computerprogramm und elektronisch lesbarer Datenträger bereitgestellt.
  • Technischer Hintergrund
  • Bassverstärkungssysteme werden regelmäßig aufgrund von physikalischen Einschränkungen von verwendeten Lautsprechern eingesetzt, welche bestimmte niederfrequente Frequenzkomponenten nicht übertragen können. Um einen psychoakustischen Eindruck zu erwecken, dass diese niederfrequenten Frequenzkomponenten noch vorhanden und damit wahrnehmbar sind, werden typischerweise Verfahren zum Einfügen höherer Harmonischer, welche normalerweise mit der Anregung des Lautsprechers durch die niederfrequenten Komponenten einhergehen, angewendet.
  • Herkömmliche Verfahren zum Generieren von höheren Harmonischen eines Audiosignals sind oft kompliziert zu realisieren und daher sehr anspruchsvoll in Bezug auf Rechenleistung und Speicherverbrauch. Außerdem darauf basierende herkömmlichen Bassverstärkungssysteme nicht einfach zu justieren.
  • Zusammenfassung
  • Daher besteht Bedarf an verbesserten Techniken zur Verbesserung der subjektiven Bass-Wahrnehmung, die zumindest einige der genannten Einschränkungen und Nachteile überwinden oder abmildern.
  • Diese Aufgabe wird durch den Gegenstand der unabhängigen Ansprüche gelöst. In den abhängigen Ansprüchen sind weitere vorteilhafte Ausführungsbeispiele der Erfindung beschrieben.
  • Im Folgenden wird die erfindungsgemäße Lösung in Bezug auf beanspruchte Verfahren, als auch in Bezug auf einen beanspruchten Prozessor, ein Tonsystem, Computerprogramm und elektronisch lesbaren Datenträger beschrieben. Merkmale, Vorteile oder alternative Ausführungsbeispiele können den jeweils anderen beanspruchten Kategorien zugeordnet werden, und umgekehrt. Beispielsweise können die Ansprüche für den Prozessor und das Tonsystem durch Merkmale verbessert werden, die im Rahmen der Verfahren zur Verbesserung der subjektiven Bass-Wahrnehmung beschrieben sind.
  • Ein Verfahren zur Verbesserung der subjektiven Bass-Wahrnehmung, insbesondere ein Verfahren zum Generieren höherer Harmonischer eines Audiosignals, welches ein computerimplementiertes Verfahren sein kann, umfasst die folgenden Schritte.
  • In einem ersten Schritt wird ein Audiosignal empfangen. In einigen Beispielen kann ein Audiosignal ein digitales Audiosignal sein, welches gesampelt und quantisiert sein kann. Das Audiosignal kann ein breitbandiges Audiosignal im Zeitbereich sein, wobei das Audiosignal Signals in einem Bass-Frequenzbereich von 20 bis 150 Hz enthalten kann. In diesem Zusammenhang können die höheren Harmonischen als die höheren Harmonischen der im breitbandigen Audiosignal enthaltenen Signale bezeichnet sein.
  • In einem weiteren Schritt wird aus dem Audiosignal mindestens ein potenziertes Signal des Audiosignals generiert, wobei jedes des mindestens einen potenzierten Signals eine höhere Harmonische des Audiosignals umfasst. In anderen Worten, das Audiosignal kann ein zeitabhängiges Audiosignal x(n) sein, wobei ein potenziertes Signal eine Potenz einer höheren Ordnung größer gleich 2 des Audiosignals x(n) sein kann, d.h. ein potenziertes Signal xp(n), mit p≥2. Dabei kann p die Ordnung, oder den Rang, des potenzierten Signals bezeichnen.
  • In einigen Beispielen kann jedes potenziertes Signal eine höhere Harmonische des Ausgangssignals umfassen, welche durch die Potenzierung künstlich generiert wurde und welche in dem Audiosignal nicht enthalten ist. Die höhere Harmonische kann insbesondere die höhere Harmonische der Ordnung p des Audiosignals umfassen.
  • In einem weiteren Schritt wird jedes des mindestens einen potenzierten Signals unter Verwenden von trigonometrischen Funktionen des Audiosignals korrigiert, um Signalkomponenten des potenzierten Signals, welche nicht die höhere Harmonische sind, zu unterdrücken.
  • Die gewünschte höhere Harmonische in dem potenzierten Signal, die nach der Korrektur verbleibt, kann die höchste enthaltene höhere Harmonische sein, d.h. die höhere Harmonische mit einem Rang entsprechend der Ordnung des potenzierten Signals.
  • Es entsteht somit ein korrigiertes potenziertes Signal, welches eine höhere Harmonische umfasst, d.h. welches nur eine höhere Harmonische umfasst. In anderen Worten, das korrigierte potenzierte Signal entspricht der gewünschten höheren Harmonischen.
  • In einigen Beispielen kann eine einfache fixe Matrix auf das Audiosignal angewendet werden, welche trigonometrische Funktionen umfasst, wobei die Signalkomponenten eines potenzierten Signals, welche basierend auf der bekannten trigonometrische Funktionen sinp(x) bekannt sind, aus jedem des mindestens einen potenzierten Signals entfernt werden.
  • In einem weiteren Schritt wird das mindestens eine korrigierte potenzierte Signal umfassend die höhere Harmonische ausgegeben, in anderen Worten, die höhere Harmonische wird ausgegeben oder bereitgestellt.
  • In dem erfindungsgemäßen Verfahren kann eine einfache fixe Matrix auf das Audiosignal angewendet werden, wobei durch Anwenden der fixen Matrix auf das Audiosignal separate potenzierte Signale umfassend jeweils eine spezifische höhere Harmonische des Audiosignals generiert werden. Das Anwenden der fixen Matrix auf das Audiosignal kann somit das Generieren von mindestens einem potenzierten Signal umfassend eine höhere Harmonische des Audiosignals, und das Korrigieren jedes des mindestens einen potenzierten Signals umfassen.
  • Das Korrigieren jedes des mindestens einen potenzierten Signals kann ein Addieren mindestens eines weiteren potenzierten Signals niedrigerer Ordnung, d.h. niedrigerer Ordnung als der Ordnung des aktuell zu korrigierenden potenzierten Signals, zu dem aktuell zu korrigierenden potenzierten Signal umfassen.
  • Das Generieren des mindestens einen potenzierten Signals kann ein Generieren mindestens eines potenzierten Signals gerader Ordnung, d.h. einer Potenz des Audiosignals mit gerader Ordnung, umfassen. Dabei kann eine Ordnung einer Potenz des Audiosignals in dem potenzierten Signal eine gerade Zahl sein, und jedes des mindestens einen potenzierten Signals gerader Ordnung kann eine höhere Harmonische der Ordnung der Potenz des Audiosignals in dem potenzierten Signal umfassen.
  • Das Korrigieren jedes des mindestens einen potenzierten als gerader Ordnung kann dabei ein Addieren mindestens eines potenzierten Signals geringerer gerader Ordnung und/oder Addition einer Konstante zu dem (aktuell korrigierten) potenzierten Signal gerader Ordnung umfassen.
  • In einigen Beispielen kann das mindestens eine potenzierte Signal gerader Ordnung ein potenziertes Signal zweiter Ordnung sein, und das Korrigieren des potenzierten Signals zweiter Ordnung kann ein Multiplizieren des potenzierten Signals zweiter Ordnung mit -2 und ein Addieren der Konstante +1 umfassen.
  • Das Generieren des mindestens einen potenzierten Signals kann ein Generieren mindestens eines potenzierten Signals ungerader Ordnung, d.h. einer Potenz des Audiosignals mit ungerader Ordnung, umfassen. Dabei kann eine Ordnung einer Potenz des Audiosignals in dem potenzierten Signal eine ungerade Zahl sein, und jedes des mindestens einen potenzierten Signals ungerader Ordnung kann eine höhere Harmonische der Ordnung der Potenz des Audiosignals in dem potenzierten Signal umfassen.
  • Das Korrigieren jedes des mindestens einen potenzierten als ungerader Ordnung kann dabei ein Addieren mindestens eines potenzierten Signals geringerer ungerader Ordnung zu dem (aktuell korrigierten) potenzierten Signal ungerader Ordnung umfassen.
  • In einem Beispiel kann das mindestens eine potenzierte Signal ungerader Ordnung ein potenziertes Signal dritter Ordnung sein, und das Korrigieren des potenzierten Signals dritter Ordnung kann ein Multiplizieren des potenzierten Signals dritter Ordnung mit -4 und ein Addieren des Audiosignals multipliziert mit +3 umfassen.
  • Den erfindungsgemäßen Verfahren liegt die Erkenntnis zugrunde, dass höhere Harmonische eines Audiosignals durch eine fixe Matrix umfassend trigonometrische Funktionen generiert und korrigiert werden können, wobei insbesondere die Potenzen von trigonometrische Funktionen, z.B. sin p ( x ) = 1 2 p k = 0 p ( p k ) cos ( ( p 2 k ) ( x π 2 ) )
    Figure DE102019126509A1_0001
    mathematisch genau bekannt sind, so dass diese potenzierten Signale durch weitere Korrekturterme umfassend Potenzen geringerer Ordnung des Audiosignals modifiziert werden können, wobei einzig eine höhere Harmonische sin(nx) oder cos(nx) übrigbleibt. Derart werden die Signalkomponenten, welche aus den trigonometrischen Funktionen bekannt sind, und welche nicht die höchste höhere Harmonische sind, welche die gleiche Ordnung wie die Potenz des Audiosignals hat, aus dem potenzierten Signal entfernt werden. Insbesondere kann das Korrigieren des mindestens einen potenzierten Signals ein Anwenden einer einfachen fixen Matrix auf das Audiosignal umfassen.
  • Das erfindungsgemäße Verfahren zur Generierung von höheren Harmonischen ermöglicht somit eine Verbesserung der subjektiven Bass-Wahrnehmung mit geringerer Rechenleistung und Speicheraufwand als herkömmliche Verfahren zur Bassverstärkung. Insbesondere ermöglicht das Generieren der höheren Harmonischen unter Verwenden einer einfachen fixen Matrix einfach zu justierendes Bassverstärkungssystem, wobei einzelne höherer Harmonische unabhängig voneinander verstärkt, unterdrückt, oder gefiltert werden können.
  • Das Empfangen eines Audiosignals kann weiter folgende Schritte umfassen in einem ersten Schritt kann ein Eingangsaudiosignal empfangen werden, welches in einem weiteren Schritt durch Anwenden einer Frequenzweiche (engl. Crossover- oder X-Over-Filter) oder eines Tiefpass-Filters auf das Eingangsaudiosignal gefiltert wird, wobei das Audiosignal generiert wird, welches nur Signale in einem Frequenzbereich unterhalt einer vorbestimmten Grenzfrequenz enthält.
  • In einem weiteren Schritt am Ende des erfindungsgemäßen Verfahren kann das mindestens einen korrigierten potenzierten Signals zu einem hochpassgefilterten Anteil, bzw. hochfrequenten Anteil der Frequenzweiche, des Eingangsaudiosignals addiert werden.
  • Das Verfahren kann weiter ein Skalieren des Audiosignals mit einem zeitvariablen Skalierungsfaktor umfassen. Entsprechend kann das Verfahren ein Skalieren jedes des mindestens einen korrigierten potenzierten Signals mit dem inversen zeitvariablen Skalierungsfaktor umfassen, um die erste Skalierung rückgängig zu machen.
  • Das Verfahren kann ein Bestimmen eines Verstärkungsfaktors für jedes des mindestens einen korrigierten potenzierten Signals umfassen. Der Verstärkungsfaktor für jedes des mindestens einen korrigierten Potenz Signals kann ein zeitunabhängiger oder zeitabhängiger Verstärkungsfaktor sein. Der Verstärkungsfaktor kann in einem weiteren Schritt auf jedes des mindestens einen korrigierten potenzierten Signals angewendet werden, um eine justierbare, oder in anderen Worten tunebare, Bassverstärkung bereitzustellen.
  • Das Verfahren kann ein Anwenden mindestens eines Filters auf jedes des mindestens einen korrigierten potenzierten Signals umfassen. Der mindestens eine Filter kann einstellbar sein, z.B. durch einen Benutzer, und/oder der mindestens eine Filter kann zeitvariabel sein, oder der mindestens eine Filter kann konstant über Zeit sein. Auf jedes des mindestens einen korrigierten potenzierten Signals kann ein jeweiliger Filter angewendet werden, z.B. können auf mindestens zwei unterschiedliche potenzierte Signals mindestens zwei unterschiedliche jeweilige Filter angewendet werden, auf mindestens zwei unterschiedliche potenzierte Signals kann der gleiche jeweilige Filter angewendet werden, und/oder auf die potenzierten Signale können unterschiedliche Filter angewendet werden. Dadurch kann mindestens eine der höhere Harmonische spektral unterschiedlich gewichtet werden.
  • Das Generieren des mindestens einen potenzierten Signals kann ein Generieren einer Vielzahl von potenzierten Signalen unterschiedlicher Ordnungen des Audiosignals umfassen. In anderen Worten, das mindestens eine potenzierte Signal kann eine Vielzahl von potenzierten Signalen umfassen. Entsprechend kann das Korrigieren eines oder jedes der Vielzahl von potenzierten Signalen ein Addieren eines ganzzahligen Vielfachen mindestens eines anderen der potenzierten Signale zu dem aktuell zu korrigierenden potenzierten Signal umfassen. Dies kann einem Anwenden einer einfachen fixen Matrix auf das Audiosignal entsprechen.
  • Das Generieren mindestens eines potenzierten Signals kann ein Generieren einer Vielzahl von potenzierten Signalen gerader Ordnung umfassen, wobei jeweils eine Ordnung einer Potenz des Audiosignals gerade Zahl ist, und kann ein Generieren einer Vielzahl von potenzierten Signalen ungerader Ordnung umfassen, wobei jeweils eine Ordnung einer Potenz Audiosignals eine ungerade Zahl ist.
  • Das Verfahren kann weiter ein Aufsummieren der Vielzahl korrigierter potenzierter Signale gerader Ordnung zu einem Summensignal gerader höherer Harmonischer, und ein Aufsummieren der Vielzahl korrigierter potenzierter Signale ungerader Ordnung zu einem Summensignal ungerader höherer Harmonischer umfassen.
  • Das Verfahren kann ein Verschieben einer Phase des mindestens einen korrigierten potenzierten Signals durch einen Hilbert-Transformator umfassen. In einigen Beispielen kann jede einzelne, höhere Harmonische durch einen Hilbert-Transformator, phasenmäßig korrigiert werden.
  • Das Verfahren kann ein Verschieben der Phasen des Summensignals der geraden höheren Harmonischen und des Summensignals der ungeraden höheren Harmonischen durch einen Hilbert-Transformator zueinander um 90° umfassen. In einigen Beispielen kann zumindest ein korrigiertes potenziertes Signal gerader Ordnung und ein korrigiertes potenziertes Signal ungerader Ordnung durch einen Hilbert-Transformator zueinander um 90° phasenverschoben werden.
  • Das Verfahren kann weiter folgende Schritte umfassen: Aufsummieren von allen korrigierten potenzierten Signalen, insbesondere den Summensignalen gerader und ungerader höherer Harmonischer, zu einem Summensignal höherer Harmonischer; Bestimmen eines Verstärkungsfaktors für das Summensignal der höheren Harmonischen, so dass die Energie des Summensignals der höheren Harmonischen der Energie des Audiosignals entspricht, und Anwenden des Verstärkungsfaktors auf das Summensignal der höheren Harmonischen.
  • Das Verfahren kann im Zeitbereich durchgeführt werden, oder kann im Spektralbereich durchgeführt werden.
  • Ein Prozessor ist konfiguriert, um ein Verfahren zur Verbesserung der subjektiven Bass-Wahrnehmung eines Audiosignals, insbesondere zum Generieren von höheren harmonischen eines Audiosignals, durchzuführen.
  • In einem Schritt wird ein Audiosignal empfangen. In einem weiteren Schritt wird mindestens ein potenziertes Signal des Audiosignals generiert, wobei jedes des mindestens einen potenzierten Signals eine höhere Harmonische des Audiosignals umfasst. In einem weiteren Schritt wird jedes des mindestens einen potenzierten Signals unter Verwenden von trigonometrische Funktionen des Audiosignals korrigiert, um Signalkomponenten des potenzierten Signals, welche nicht die höhere Harmonische sind, zu unterdrücken.
  • In einigen Beispielen kann das Generieren des mindestens einen potenzierten Signals und das Korrigieren jedes des mindestens einen potenzierten Signals durch ein (einmaliges) Anwenden einer einfachen fixen Matrix auf das Audiosignal erfolgen.
  • In einem weiteren Schritt wird das mindestens eine korrigierte potenzierte Signal bereitgestellt, oder ausgegeben.
  • Der Prozessor kann weiter konfiguriert sein, um ein beliebiges anderes Verfahren oder eine beliebige Kombination von Verfahren gemäß der vorliegenden Offenbarung durchzuführen.
  • Ein Tonsystem umfasst einen erfindungsgemäßen Prozessor. Das Tonsystem ist konfiguriert, um ein Verfahren zur Verbesserung der subjektiven Bass-Wahrnehmung eines Audiosignals durchzuführen. Das Tonsystem umfasst mindestens einen erfindungsgemäßen Prozessor, einen Speicher, beispielsweise Arbeitsspeicher, welcher mit dem Prozessor operativ verbunden ist, und mindestens einen Audio-Lautsprecher. Der Speicher kann zum Speichern von Programmcode konfiguriert sein, wobei der mindestens eine Prozessor konfiguriert sein kann, um den Programmcode auszuführen, wobei Ausführung des Programmcodes den Prozessor veranlasst, die Schritte eines der erfindungsgemäßen Verfahren auszuführen.
  • Ein Computerprogramm und ein elektronisch lesbarer Datenträger umfassen Befehle, die bei der Ausführung des Programms durch einen Prozessor, insbesondere einen digitalen Signalprozessor eines Tonsystems, diesen veranlassen, die Schritte eines beliebigen Verfahrens gemäß der vorliegenden Offenbarung auszuführen.
  • Für einen solchen Prozessor, Tonsystem, Computerprogramm und elektronisch lesbaren Datenträger können technische Effekte erzielt werden, die den technischen Effekten entsprechen, welche für die Verfahren gemäß der vorliegenden Offenbarung beschrieben sind.
  • Obwohl die in der obigen Zusammenfassung und der folgenden detaillierten Beschreibung beschriebenen spezifischen Merkmale im Zusammenhang mit spezifischen Beispielen beschrieben werden, ist zu verstehen, dass die Merkmale nicht nur in den jeweiligen Kombinationen verwendet werden können, sondern auch isoliert oder in beliebigen Kombinationen verwendet werden können, und Merkmale aus verschiedenen Beispielen für die Verfahren, Prozessoren, Computerprogramme und elektronisch lesbare Datenträger miteinander kombiniert werden können und miteinander korrelieren, sofern nicht ausdrücklich anders angegeben.
  • Die obige Zusammenfassung soll daher nur einen kurzen Überblick über einige Merkmale einiger Ausführungsbeispiele und Implementierungen geben und ist nicht als Einschränkung zu verstehen. Andere Ausführungsbeispiele können andere als die oben beschriebenen Merkmale umfassen.
  • Figurenliste
  • Die Erfindung wird nachfolgend unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert.
    • 1 ist eine schematische Darstellung eines Signalflusses in einem Hybridsystem zur Verbesserung der subjektiven Bass-Wahrnehmung, gemäß Ausführungsbeispielen der Erfindung;
    • 2 ist eine schematische Darstellung eines Signalflussdiagramms eines nichtlinearen Filters, das im System von 1 zur Trennung des Audiosignals in eine harmonische und eine transiente Signalkomponente verwendet wird;
    • 3 zeigt ein Spektrogramm eines Mono-Audio-Eingangssignals, das in die beiden Signalkomponenten getrennt werden soll;
    • 4 zeigt ein Spektrogramm der transienten Signalkomponente des Mono-Audio-Eingangssignals von 3, das mit Hilfe eines Medianfilters der Ordnung 17 generiert wurde;
    • 5 zeigt ein Spektrogramm einer Maske, die unter Verwendung eines Medianfilters der Ordnung 17 in 4 erhalten wurde;
    • 6 zeigt ein Spektrogramm der harmonischen Signalkomponente des Mono-Audio-Eingangssignals von 3, die mit Hilfe eines Medianfilters der Ordnung 17 generiert wurde;
    • 7 zeigt ein Spektrogramm einer Maske, die unter Verwendung eines Medianfilters der Ordnung 17 in 6 erhalten wurde;
    • 8 zeigt ein Spektrogramm der transienten Signalkomponente des Mono-Audio-Eingangssignals von 3, die mit dem nichtlinearen Filter von 2 generiert wurde;
    • 9 zeigt ein Spektrogramm einer Maske, die mit Hilfe der der transienten Signalkomponente von 8 generiert wurde;
    • 10 zeigt ein Spektrogramm der harmonischen Signalkomponente, die mit Hilfe des nichtlinearen Filters von 2 generiert wurde;
    • 11 zeigt ein Spektrogramm einer Maske, die mit Hilfe der harmonischen Signalkomponente von 10 generiert wurde;
    • 12 zeigt eine Funktion für den nichtlinearen Filter, der im System von 1 verwendet wird;
    • 13 zeigt eine schematische Darstellung eines Signalflussdiagramms zur Überprüfung der Effizienz eines nichtlinearen Filters der im System von 1 verwendet wird;
    • 14 zeigt das Eingangssignal und das Ausgangssignal des nichtlinearen Filters von 13;
    • 15 zeigt ein Leistungsdichtespektrum des Eingangs- und des Ausgangssignals des nichtlinearen Filters von 13;
    • 16 zeigt eine schematische Darstellung eines Signalflussdiagramms zur Verbesserung des Bass-Eindrucks mit Hilfe künstlich erzeugter höherer Harmonischer, gemäß Ausführungsbeispielen der Erfindung;
    • 17 zeigt eine schematische Darstellung eines Signalflussdiagramms eines harmonischen Generators, gemäß Ausführungsbeispielen der Erfindung;
    • 18 zeigt eine schematische Darstellung einer fixen Matrix zur Erzeugung höherer Harmonischer im Zeitbereich, gemäß Ausführungsbeispielen der Erfindung;
    • 19 zeigt eine schematische Darstellung eines Hilbert-Transformators mit Allpassfilter, gemäß Ausführungsbeispielen der Erfindung;
    • 20 zeigt eine schematische Darstellung eines Prozessors, der zum Generieren höherer Harmonischer eines Audiosignals konfiguriert ist, gemäß Ausführungsbeispielen der Erfindung; und
    • 21 zeigt ein Flussdiagramm mit Schritten zum Generieren höherer Harmonischer eines Audiosignals, gemäß Ausführungsbeispielen der Erfindung.
  • Detaillierte Beschreibung von Ausführungsbeispielen
  • Die vorstehend genannten Elemente, Merkmale, Schritte und Konzepte der vorliegenden Offenbarung werden aus der folgenden detaillierten Beschreibung anhand von exemplarischen Ausführungsbeispielen, die unter Bezugnahme auf die beiliegenden Zeichnungen erläutert werden, ersichtlich.
  • Die Zeichnungen sind als schematische Darstellungen zu betrachten und die in den Zeichnungen dargestellten Elemente sind nicht unbedingt maßstabsgetreu dargestellt. Vielmehr werden die verschiedenen Elemente so dargestellt, dass ihre Funktion und ihr allgemeiner Zweck für einen Fachmann ersichtlich werden. Jede Verbindung oder Kopplung zwischen Funktionsblöcken, Vorrichtungen, Komponenten oder anderen physikalischen oder funktionellen Einheiten, die in den Zeichnungen oder hierin beschrieben sind, kann auch durch eine indirekte Verbindung oder Kopplung realisiert werden. Eine Kopplung zwischen den Komponenten kann auch über eine drahtlose Verbindung hergestellt werden. Funktionsblöcke können in Hardware, Firmware, Software oder einer Kombination davon implementiert werden.
  • Im Folgenden werden Ausführungsbeispiele unter Bezugnahme auf die beiliegenden Zeichnungen ausführlich beschrieben. Es ist zu beachten, dass die folgende Beschreibung der Ausführungsbeispiele nicht in einem engen Sinne zu verstehen ist. Der Umfang der Erfindung soll nicht durch die im Folgenden beschriebenen Ausführungsbeispiele oder durch die Zeichnungen eingeschränkt werden, die nur zur Veranschaulichung dienen.
  • Die vorliegende Offenbarung beschreibt Techniken in Bezug auf den Einsatz eines Verfahrens und Systems zur Verbesserung der subjektiven Bass-Wahrnehmung, in anderen Worten zur Bassverstärkung, mittels harmonischer Fortsetzung.
  • Physikalisch bedingt sind Lautsprecher mit einer kleinen Membranfläche und einer geringen Einbautiefe nicht in der Lage eine, für die Wiedergabe von tiefen Frequenzen nötige Volumenänderung zu erzeugen. Einfach ausgedrückt kann man sagen, dass kleine Lautsprecher nicht in der Lage sind für ausreichend Bass zu sorgen.
  • Kleine Lautsprecher sind anfällig für unerwünschte Nichtlinearitäten oder können keine Bass-Inhalte mit ausreichendem Pegel wiedergeben, wie z.B. Lautsprecher von Smartphones, (kleinen) Bluetooth-Lautsprechern usw. Darüber hinaus können auch Geräte mit Freisprecheinrichtungen, z.B. Autos, Kopfhörer, Freisprecheinrichtungen von Handys usw. von diesen Nachteilen betroffen sein, welche oft ein AEC-System aufweisen, das den Hauptteil einer Freisprecheinrichtung ausmacht.
  • Es gibt verschiedene Gründe, einen so genannten Bassverstärkungsalgorithmus zu verwenden. Meistens ist ein solches System gewünscht, wenn kleine Lautsprecher verwendet werden, die nicht in der Lage sind, die gewünschten, niederfrequenten Töne wiederzugeben, und/oder wenn ein Lautsprecher zu nichtlinear wird, wenn die gewünschte Grundschwingung auch bei niedrigen Lautstärken wiedergegeben wird. Letzteres ist beispielsweise notwendig, um die Leistung des akustischen Echokompensators (AEC) zu verbessern, der per Definition nicht in der Lage ist, nichtlineare Signale zu unterdrücken. Durch die Verwendung eines Bassverstärkungssystems, wie in dieser Erfindung offenbart, ist man in der Lage, einen gut definierten und gut klingenden Bass zu erzeugen, ohne die Leistung eines AEC-Algorithmus zu beeinträchtigen.
  • Aktuelle Bassverstärkungssysteme sind oft recht kompliziert zu realisieren und daher sehr anspruchsvoll in Bezug auf Rechenzeitbedarf (MIPS) und Speicherverbrauch. Außerdem sind diese „klassischen“ Versionen oft nicht einfach zu justieren. Der neuartige Algorithmus, wie er in dieser Erfindung offenbart wird, ist im Gegensatz zu den „klassischen“ Vorgängersystemen einfach zu implementieren und zu optimieren. Darüber hinaus bietet es die Möglichkeit, z.B. einen bekannten und (psycho-)akustisch gut klingenden Lautsprecher akustisch nachzuahmen, was andere Methoden nicht leisten können.
  • Viele Bassverstärkungssysteme sind derzeit auf dem Markt, wie z.B. das MaxBass-System. Die meisten dieser Systeme basieren auf der Verwendung von speziell entwickelten, fixen nichtlinearen Funktionen, um gewünschte Verzerrungsprodukte zu erzeugen. Da eine solche feste, nichtlineare Funktion akustische Probleme aufwies, vor allem wenn quasistationäre Signale (harmonische Anteile des Eingangssignals) als Eingang verwendet wurden, wurden in letzter Zeit ausgefeiltere Bassverstärkungssysteme eingeführt, die quasistationäre von impulsartigen Teilen des Eingangssignals trennen. Eine solche Trennung der Signalanteile ist sehr anspruchsvoll und bietet neue, zusätzliche Quellen zur Erzeugung akustischer Artefakte. Darüber hinaus muss jeder einzelne Signalteil unterschiedlich behandelt werden. Während der impulsive Teil als Input für die einfache, fixe nichtlineare Funktion verwendet werden kann, muss der quasi-periodische Teil im Spektralbereich behandelt werden, z.B. über einen Phasenvocoder, was sehr anspruchsvoll ist.
  • Möchte man also, zumindest den subjektiv wahrgenommenen Bass solch kleiner Lautsprecher erhöhen, so kann hierfür das psychoakustische Phänomen der harmonischen Fortsetzung genutzt werden. Dieses besagt, dass unser Gehör in der Lage ist aus einem harmonischen Abbild die zugrundeliegende Grundschwingung zu erzeugen und somit zumindest subjektiv, wahrzunehmen.
  • Eine andere Möglichkeit besteht hingegen darin den verwendeten Lautsprecher exakt zu modellieren. Gelingt dies, so kann ein sogenanntes Mirror-Filter eingesetzt werden, welches in der Lage ist das Eingangssignal so vorab zu verzerren, dass in Summe, d.h. unter Berücksichtigung der nichtlinearen Verzerrungen des Lautsprechers, wieder ein lineares System generiert wird. Auf diese Weise können die physikalischen Grenzen des Lautsprechers ebenfalls, hin zu tieferen Frequenzen, erweitert werden. Diese Methode ist jedoch wesentlich aufwändiger und sollte an dieser Stelle lediglich der Vollständigkeit halber erwähnt werden.
  • In der breiten Masse werden Prinzipien eingesetzt, welche auf dem psychoakustischen Phänomen der harmonischen Fortsetzung basieren. Sämtliche dieser Systeme sind nichtlinear und verursachen deshalb Verzerrungen, die es gilt akustisch möglichst unauffällig zu halten. Aus der Literatur weiß man, dass dies dann besonders gut gelingt, wenn man das Eingangssignal in seine impulshaften und quasi-stationären Anteile zerlegt. Dabei werden dann gute Ergebnisse im Sinne von geringen akustischen Artefakten erzielt, wenn die harmonische Fortsetzung der impulshaften Signalanteile mit Hilfe einer nichtlinearen Funktion und die der quasi-stationären Signalanteile mit Hilfe eines Phase Vocoder realisiert wird.
  • Optimierungsbedarf besteht jedoch beim „Kern“ dieses Hybrid-Systems, d.h. beim Algorithmus zur Trennung der impulshaften und quasi-stationären Signalanteile des Eingangssignals. Hier wurden zwar ebenfalls funktionale Systeme bereits vorgestellt, die aber allesamt nur mit großen Aufwand umgesetzt werden können, also unter einem zu hohen Implementierungsaufwand im Sinne des Rechenzeitbedarfs und/oder des Speicherverbrauchs leiden.
  • Ziel der vorliegenden Offenbarung ist es ein Hybrid-System zur subjektiven Verbesserung des Bass-Eindrucks bereitzustellen, wobei der Schwerpunkt bei der Optimierung des „Kern“-Algorithmus, also des Systems zur Trennung impulshafter (d.h. transienter) und quasi-stationärer (d.h. harmonischer) Signalanteile liegt.
  • Techniken zur Verbesserung der subjektiven Bass-Wahrnehmung, oder in anderen Worten Bassverstärkung
  • 1 ist eine schematische Darstellung eines Signalflusses in einem Hybridsystem zur Verbesserung der subjektiven Bass-Wahrnehmung, gemäß Ausführungsbeispielen der Erfindung.
  • Das Funktionsprinzip des Hybrid-Systems kann dabei wie folgt zusammengefasst werden:
    • Es wird zunächst aus den Eingangssignalen ein Monosignal generiert, welches dann mit Hilfe einer schnellen Fourier-Transformation (FFT) vom Zeit- in den Spektralbereich überführt wird. Im Spektralbereich erfolgt dann die Aufspaltung des Mono-Eingangssignals in einen quasi-stationären und einen transienten Teil. Dies geschieht mit Hilfe einer, sich über der Zeit (diskrete Zeit „n“) veränderlichen, spektralen (Frequenz-Bin „k“) Gewichtung (Maskierung), wobei MStat(k,n) die Maske zur Erzeugung des quasi-stationären Anteils und MTrans(k,n), die Maske für den transienten Anteil aus dem Monosignal bezeichnet. Das Spektrum des quasi-stationären Signalanteils wird dann in einem Phase Vocoder (PV) eingespeist. In diesem findet dann die spektrale Analyse des quasi-stationären Signalanteils statt, aus welcher letztendlich die Erzeugung/Überlagerung entsprechend, psychoakustisch abgestimmter Harmonischer erfolgt, bevor dann das so modifizierte, quasi-stationäre Signal mit Hilfe einer inversen Fourier-Transformation (IFFT) wieder vom Spektral- in den Zeitbereich überführt wird. Der transiente Signalanteil wird zuerst mit Hilfe einer IFFT vom Spektral- in den Zeitbereich transformiert, bevor dort, d.h. im Zeitbereich, dieses Mal mit Hilfe einer nichtlinearen Funktion (NLF) gewünschte, nichtlineare Verzerrungen erzeugt werden.
  • Die beiden Signalanteile werden im Anschluss daran mit Hilfe zweier Gewichtungsfaktoren (Gs für den quasi-stationären Anteil und GT für den transienten Anteil) skaliert, bevor sie zusammengefasst und dann den Eingangssignalen überlagert werden.
  • 2 ist eine schematische Darstellung eines Signalflussdiagramms eines nichtlinearen Filters, das im System von 1 zur Trennung des Audiosignals in eine harmonische und eine transiente Signalkomponente verwendet wird.
  • Impulshafte- bzw. transiente Signale zeichnen sich durch ein nahezu weißes Spektrum aus, was im besten anzunehmenden Fall, d.h. bei Eingang eines Kronecker-Delta, der gemeinhin auch als Dirac-Impuls bezeichnet wird, einleuchtend ist. Quasi-stationäre Signale weisen hingegen ein, über der Zeit nahezu unverändertes Spektrum auf. Als einleuchtendes Beispiel wäre hier ein Sinussignal zu nennen, welches sich über der Zeit nicht verändert, also eine über der Zeit unveränderliche Spektrallinie aufweist. Will man in einem Signal diese beiden Anteile voneinander trennen so kann dies dadurch geschehen, dass zur Isolierung der impulshaften Anteile das Spektrum über der Frequenz mit Hilfe eines nichtlinearen Filter geglättet wird, um störende, quasi-stationäre Anteile auszublenden und zum Extrahieren der quasi-stationären Anteile das Spektrogramm, also jede Spektrallinie für sich, über der Zeit mit Hilfe eines nichtlinearen Filter geglättet wird, um störende, transiente Anteile zu unterdrücken. Wichtig ist dabei, dass das Glättungsfilter nicht wie ein klassisches Glättungsfilter lediglich die eingehende Energie über der Zeit in Abhängigkeit des eingestellten Glättungskoeffizienten mehr oder weniger schnell verteilt, wobei die Eingangsenergie erhalten bleibt, sondern spektral bzw. zeitlich kurz auftretende Energiespitzen kappt, was einen nichtlinearen Prozess darstellt, der nicht Energie-erhaltend ist. Aus diesem Grund wird ein nichtlineares Glättungsfilter benötigt.
  • 2 veranschaulicht die Wirkungsweise des hier verwendeten, nichtlinearen Glättungsfilters. Dabei stellt b2(n) das Eingangssignal und b min 2 ( n ) ¯
    Figure DE102019126509A1_0002
    das nichtlinear geglättete Ausgangssignal dar.
  • Die Funktionsweise lässt sich mathematisch folgt beschreiben: b min 2 ( n ) ¯ = { max { MinNoiseLevel , C Inc b min 2 ( n 1 ) ¯ } ,  if  b 2 ( n ) ¯ > b min 2 ( n 1 ) ¯ max { MinNoiseLevel , C Dec b min 2 ( n-1 ) ¯ } ,  else
    Figure DE102019126509A1_0003
  • Wie man aus 2 und Formel 1 erkennen kann, wird das Eingangssignal b2(n) mit dem Ausgangssignal b min 2 ( n 1 ) ¯
    Figure DE102019126509A1_0004
    verglichen. Ist dabei das Eingangssignal größer als das Ausgangssignal, befindet man sich in dem Inkrement-Fall, d.h. das Ausgangssignal wird um ein festes Inkrement CInc erhöht mit CInc ≥ 1. Andernfalls befindet man sich im Dekrement-Fall, in dem das Ausgangssignal um ein festes Dekrement CDec verkleinert wird, mit CDec < 1. Außerdem wird mit Hilfe des Schwellwertes „MinNoiseLevel“ dafür gesorgt, dass das Ausgangssignal stets oberhalb dieser Schwelle bleibt und somit nicht zu stark abfallen kann, also nach unten hin limitiert wird. Dies ist vorteilhaft, um das Reaktionsverhalten beim ersten Hochstarten bzw. nach langen Pausen nicht zu träge werden zu lassen.
  • Eine andere Methode verwendet für die Realisierung der notwendigen, nichtlinearen Glättung ein Median-Filter, welches eine Ordnung zwischen 15,...,30 (typisch 17) betragen sollte. Dies bedeutet, dass für die Separierung quasi-stationärer Signalanteile die Daten der letzten 15,...,30 Spektren im Speicher gehalten werden müssen um daraus den Median, separat für jede Spektrallinie, zu bestimmen, um so das nichtlinear geglättete Spektrum des Ausgangssignals zu bestimmen, welches in diesem Fall dem quasi-stationären Signal entspricht.
  • Vergleicht man diese, z.B. auf einem Median-Filter 17. Ordnung basierte Methode die nichtlineare Glättung umzusetzen, mit der oben vorgestellten, verwendeten Methode für die Signalseparierung, fällt auf, dass die verwendete Methode, egal ob es sich nun um die spektrale oder um die zeitliche, nichtlineare Glättung handelt, stets nur einen spektralen Satz an Speicherelementen benötigt. Somit kann durch die oben vorgestellte, neuartige Realisierung des nichtlinearen Glättungsfilter der Speicherbedarf für die Signalseparierung, je nach verwendeter Ordnung des Median-Filter in etwa um den Faktor 10 gesenkt werden (Gültig bei Verwendung von Ordnungen > 19 für das Median-Filter). Nachfolgend werden Auswirkungen auf die Performance beschrieben.
  • 3 zeigt ein Spektrogramm eines Mono-Audio-Eingangssignals, das in die beiden Signalkomponenten getrennt werden soll.
  • Für die nachfolgende Untersuchung wurde als Eingangsvektor ein Monosignal gewählt, welches aus einem typischen Ausschnitt eines Stereo-Musiksignals generiert wurde.
  • Wie man aus 3 erkennen kann, besteht dieses sowohl aus impulshaften, also transienten oder perkussiven Signalanteilen, erkennbar durch das nahezu weiße Spektrum in diesen Zeiten (Vertikale Linien), als auch aus quasi-stationären, also harmonischen Signalanteilen, erkennbar anhand der über der Zeit quasi konstanten Spektrallinien (Horizontale Linien). Wie man weiter erkennen kann, besteht der Eingangsvektor dabei vorrangig aus perkussiven und nur wenigen harmonischen Anteilen.
  • Nachfolgend soll nun auf zwei verschiedene Art und Weisen versucht werden die Signaltrennung zu vollziehen. Zunächst wird dabei auf ein Verfahren eingegangen, welches ein Median-Filter für die Signaltrennung verwendet. In diesem Beispiel wird dabei ein Median-Filter 17. Ordnung verwendet.
  • Die Wirkungsweise eines Median-Filters kann dabei wie folgt zusammengefasst werden:
    • - Aufnahme eines Datenvektors in der Länge (Ordnung) des Median-Filters
    • - Sortieren der Werte des Datenvektors in aufsteigender Reihenfolge
    • - Entnahme des Wertes in der Mitte des sortierten Datenvektors, wenn der Datenvektor eine ungerade Länge aufweist, bzw. des Mittelwertes aus den beiden, sich in der Mitte befindlichen Werte, wenn die Ordnung des Median-Filters gerade ist. Dieser Wert stellt dann den, mit dem Median-Filter (nichtlinear) geglätteten Ausgangswert dar.
  • Wendet man ein solches Median-Filter über der Frequenz (vertikale Linie) an, resultiert daraus eine Extraktion perkussiver Signalanteile T(n, k), wie in 4 für das hier betrachtete Beispiel dargestellt.
  • 4 zeigt ein Spektrogramm der transienten Signalkomponente des Mono-Audio-Eingangssignals von 3, das mit Hilfe eines Medianfilters der Ordnung 17 von diesem separiert wurde.
  • Das Spektrum des perkussiven Ausgangssignals T̂ (n, k) ergibt sich, indem das in 3 dargestellte Eingangsspektrum X (n, k) über der Zeit n mit einer entsprechend, sich über der Zeit n veränderlichen, spektralen Maske MT (n, k) (separate Gewichtung für alle k = [ 0, N 2 ]
    Figure DE102019126509A1_0005
    Spektrallinien (Bins), mit N = Länge der FFT) gewichtet wird, was sich mathematisch durch die folgende Formel zur Extraktion der transienten Spektralanteile aus dem Eingangsspektrum ausdrücken lässt: T ^ ( n , k ) = X ( n , k ) M T ( n , k ) ,
    Figure DE102019126509A1_0006
  • Stellt man die hierfür benötigten Gewichtungsfaktoren MT(n,k), welche für die Extraktion der transienten Signalanteile T(n, k) aus dem Eingangssignal X(n, k) benötigt werden, über der Zeit dar, resultiert für die transienten Gewichtungsfaktoren MT(n,k) das in 5 aufgezeigte Spektrogramm.
  • 5 zeigt ein Spektrogramm einer Maske, die unter Verwendung eines Medianfilters der Ordnung 17 in 4 erhalten wurde.
  • Dass es sich hierbei um die Gewichtungsmatrix handelt, welche perkussive, also impulsartige Signalanteile aus dem Eingangssignal extrahiert, kann dabei sehr einfach anhand der vertikalen, roten Linien erkannt werden. Diese kennzeichnen Verstärkungswerte von 1, was wiederum zur Folge hat, dass Signalanteile des Eingangsspektrums ungestört die Maske passieren können und somit erhalten bleiben, während überwiegend in blau gehaltene Regionen der Maske eine Unterdrückung der entsprechenden, spektralen Regionen des Eingangsspektrums kennzeichnen.
  • Wendet man hingegen das Median-Filter über der Zeit an, so entsteht das in 6 aufgezeigte Spektrogramm S(n, k), welches den quasi-stationären Signalanteil des Eingangssignals darstellt.
  • 6 zeigt ein Spektrogramm der harmonischen Signalkomponente des Mono-Audio-Eingangssignals von 3, die mit Hilfe eines Medianfilters der Ordnung 17 von diesem separiert wurde.
  • Das Eingangssignal beinhaltet nur wenige, quasi-stationäre (harmonische) Anteile, was an den wenigen, in Rot gehaltenen, horizontalen Regionen ersichtlich ist. Perkussive Anteile erscheinen hingegen stark unterdrückt, was ein Vergleich mit 4 verdeutlicht.
  • Das Spektrum des quasi-stationären Ausgangssignal Ŝ(n,k) ergibt sich nun, indem das in 3 dargestellte Eingangsspektrum X(n, k) über der Zeit n mit einer entsprechend, sich über der Zeit n veränderlichen, spektralen Maske Ms(n, k) gewichtet wird, was sich mathematisch durch die folgende Formel zur Extraktion der quasi-stationären Spektralanteile aus dem Eingangsspektrum ausdrücken lässt: S ^ ( n , k ) = X ( n , k ) M S ( n , k )
    Figure DE102019126509A1_0007
  • 7 zeigt ein Spektrogramm einer Maske, die unter Verwendung eines Medianfilters der Ordnung 17 in 6 erhalten wurde.
  • Wie in 7 dargestellt, werden nun perkussive Spektralanteile gut unterdrückt, was anhand der in Blau (Gewichtung mit ≈0) gehaltenen, vertikalen Linien gut erkennbar ist und zum anderen, vorrangig Regionen im unteren Frequenzbereich über der Zeit nahezu unverändert durchgelassen (Gewichtung mit ≈1), was an den roten, horizontalen Linien sichtbar ist.
  • Somit stellt 7 das Spektrogramm der Maske (Gewichtungsmatrix) dar, mit welcher das Mono-Eingangssignal gewichtet werden muss, um den harmonischen Signalanteil aus dem Eingangssignal zu trennen.
  • Wie oben aufgezeigt, liefert das Median-Filter, welches in vertikaler Richtung, also über der Frequenz angewendet wurde, eine Schätzung des transienten Spektrogramms T(n, k), während jenes, welches in horizontaler Richtung, also über der Zeit angewendet wurde, eine Schätzung des quasi-stationären Spektrogramms S (n, k) liefert.
  • Diese dürfen jedoch nicht direkt für die Weiterverarbeitung verwendet werden, da es ansonsten, bedingt durch den nichtlinearen Charakter der Median-Filter, zu Unterschieden zwischen dem Eingangssignal und der Summe der Ausgangssignale kommt, d.h. X (n, k) ^ T (n, k) + S (n, k). Um dies zu verhindern wird der Umweg über die Maskierung, d.h. der Erzeugung der Ausgangssignale gemäß Formel 2 und Formel 3 genommen. Basierend auf den, geschätzten Spektren T(n, k) und S(n, k) lassen sich nun die Masken MT (n, k) und Ms (n, k) so berechnen, dass gilt: X(n, k) = T̂ (n, k) + Ŝ (n, k).
  • Die Berechnung der jeweiligen Masken zur Trennung der perkussiven und harmonischen Signalanteile, basierend auf einem Wiener-Filter, kann dabei durch die folgenden Formeln beschrieben werden: M T ( n , k ) = T 2 ( n , k ) T 2 ( n , k ) + S 2 ( n , k ) M S ( n , k ) = S 2 ( n , k ) T 2 ( n , k ) + S 2 ( n , k )
    Figure DE102019126509A1_0008
  • Da die Masken MT(n,k) und Ms(n, k) nun lediglich Verstärkungswerte beinhalten, die sich zudem noch zu jedem Zeitpunkt n zu 1 summieren (MT(n,k) + Ms(n, k) = 1, ∀ n, k), wird klar, dass nun einerseits die Energieerhaltung gilt (EIn=EOut), andererseits aber auch der Phasengang durch die Masken nicht verändert wird. Auf diese Weise lassen sich, andernfalls störende, akustische Artefakte erfolgreich vermeiden.
  • Die hier beschriebenen Techniken stellen einen gangbaren Weg für die Trennung perkussiver und harmonischer Signalkomponenten dar. Betrachtet man sich jedoch die Wirkungsweise eines Median-Filters etwas genauer, fällt auf, dass der damit verbundene Aufwand nicht unerheblich ist. Einerseits gilt es, sowohl über der Zeit als auch über der Frequenz stets Datenvektoren in der Länge des Median-Filters zu extrahieren und zu sortieren, um schließlich den Ausgangswert bestimmen zu können, was für jeden Zeitindex n sowie für jeden spektralen Bin k durchzuführen ist. Dies stellt einen erheblichen Rechenaufwand dar. Andererseits müssen für die Berechnung des Median-Filters über der Zeit Spektren in Anzahl der Ordnung des Median-Filters vorgehalten, d.h. gespeichert werden, was zudem den benötigten Speicheraufwand enorm erhöht. Eine effizientere Methode wird im nachfolgend, basierend auf einem nichtlinearen Glättungsfilter beschrieben.
  • 8 zeigt ein Spektrogramm der transienten Signalkomponente des Mono-Audio-Eingangssignals von 3, die mit dem nichtlinearen Filter von 2 generiert wurde.
  • Wird das in 2 dargestellte, nichtlineare Glättungsfilter über der Frequenz, also über die vertikalen Linien des Spektrogramms des Eingangssignals angewendet, resultiert daraus das in 8 dargestellte transiente Spektrogramm T(n, k) des impulshaften Signalanteils des Mono-Eingangssignals (z.B. Musik), welcher mit Hilfe eines nichtlinearen Glättungsfilters von diesem getrennt wurde.
  • Wie in 8 zu sehen, kommt es auch hier, in ähnlicher Art und Weise wie bei Verwendung des Median-Filters, zu einer Beibehaltung transienter, bei gleichzeitiger Unterdrückung quasi-stationärer Anteile.
  • 9 zeigt ein Spektrogramm einer Maske, die mit Hilfe der transienten Signalkomponente von 8 generiert wurde.
  • Das in 9 dargestellte Spektrogramm der Maske (Gewichtungsmatrix) wurde mit Hilfe eines nichtlinearen Glättungsfilter generiert, mit welcher das Mono-Eingangssignal mit dieser Maske gewichtet werden muss, um den impulshaften Signalanteil aus dem Eingangssignal zu trennen.
  • Ein Blick auf die dabei angewendete Maske MT(n,k) offenbart, dass es zu Beginn zu einer kurzen Einschwingphase kommt, welche die Gesamtperformance jedoch kaum negativ beeinflusst. Insgesamt kommt es zudem, vor allem im oberen Spektralbereich, zu einem etwas stärker ausgeprägten, zeitlichen Verschliff, was jedoch der verwendeten Parametrierung angelastet werden kann.
  • 10 zeigt ein Spektrogramm der harmonischen Signalkomponente des Mono-Eingangssignals, die mit Hilfe des nichtlinearen Glättungsfilters von 2 von diesem separiert wurde.
  • Betrachtet man sich das Spektrogramm des Ausgangssignals des nichtlinearen Glättungsfilter, welches über der Zeit angewendet wurde, wie in 10 dargestellt ist, so fällt einerseits auf, dass es zu einer sehr starken Unterdrückung perkussiver Signalanteile kommen (stärker als bei Verwendung des Median-Filters), jedoch im Gegenzug dazu quasi-stationäre Anteile nicht so deutlich herausgehoben werden, wie im Fall bei Verwendung eines Median-Filters ausreichender Länge.
  • 11 zeigt ein Spektrogramm einer Maske, die mit Hilfe der harmonischen Signalkomponente von 10 generiert wurde.
  • Das in 11 dargestellte Spektrogramm der Maske (Gewichtungsmatrix) wurde mit Hilfe eines nichtlinearen Glättungsfilter generiert, mit welcher das Mono-Eingangssignal gewichtet werden muss, um den harmonischen Signalanteil aus dem Eingangssignal zu trennen.
  • 11, welche die angewendete Maske Ms(n, k) darstellt, bestätigt einerseits die starke Unterdrückung impulshafter Anteile, andererseits offenbart sie aber auch, was in 10 nicht bzw. nur unzureichend erkennbar war, nämlich dass es zu einer Akzentuierung harmonischer Signalanteile kommt.
  • Ein akustischer Vergleich der beiden Signalanteile, welche einmal mit Hilfe eines Median-Filters 17. Ordnung und zum anderen mit Hilfe des nichtlinearen Glättungsfilter gemäß der vorliegenden Offenbarung extrahiert wurden, zeigt zudem, dass hier kaum ein Unterschied bezüglich der Qualität der Signaltrennung ausgemacht werden kann.
  • Im Folgenden wird auf die Bearbeitung transienter Signalanteile mit Hilfe eines nichtlinearen Filters (NLF) detailliert eingegangen.
  • Zunächst wird der nichtlineare Filterblock, welcher in 1 mit NLF bezeichnet ist und im Prinzip nichts anderes als ein Polynom-Filter darstellt, näher beschrieben. Wie man aus 1 erkennen kann wird, innerhalb des Blocks in welchen die Signaltrennung erfolgt, das Spektrum des transienten Signalanteils T(n, k) (siehe Formel 2) in den Zeitbereich mit Hilfe einer IFFT überführt. Dieses Signal, welches nachfolgend mit T(n) bezeichnet wird, stellt das Eingangssignal für das verwendete nichtlineare Filter dar.
  • 12 zeigt eine Funktion für den nichtlinearen Filter, der im System von 1 verwendet wird.
  • 13 zeigt eine schematische Darstellung eines Signalflussdiagramms zur Verifikation der Effizienz eines nichtlinearen Filters der im System von 1 verwendet wird.
  • Zur Verdeutlichung der Wirkungsweise des NLF wurde neben verschiedenen Musikstücken, auch ein Sinussignal mit f= 50 [Hz], anstelle von t̂ (n) in das NLF, auf die in 13 dargestellte Art eingespeist.
  • Wie man aus 13 erkennen kann, wird zunächst das Eingangssignal mit Hilfe eines komplementären Crossover-Filters (komplementäre Hoch- und Tiefpassfilter HP1 und TP, Frequenzweiche) spektral getrennt, wobei lediglich der tiefpassgefilterte Signalanteil dem nichtlinearen Filter NLF zugeführt, von diesem verarbeitet und dann wieder dem hochpassgefilterten Signalanteil aufaddiert wird. Im Anschluss daran wird das so rekonstruierte Signal, dessen Bass-Performance durch das NLF verbessert wurde, einen weiteren Hochpassfilter HP2 zugeführt, dessen Aufgabe es ist, die Wirkungsweise eines Lautsprechers mit geringer Bass-Performance zu simulieren. In Wirklichkeit ist HP2 nicht notwendig, da hier üblicherweise ein Lautsprecher mit schlechten Basswiedergabeeigenschaften eingesetzt wird, der diese Aufgabe intrinsisch übernimmt.
  • Bei einem akustischen A/B-Vergleich des (Stereo-) Originalsignal Lin / Rin mit dem (Stereo-) Ausgangssignal Lout / Rout wurde bei Verwendung unterschiedlicher Musikstücke einerseits die Wirksamkeit der Bass-Verbesserung und andererseits auch die Wahrnehmbarkeit akustischer Artefakte auf subjektive Weise festgestellt.
  • Dieser akustische Test verlief positiv, d.h. es wurde ein subjektiv eindeutig wahrnehmbarer, stärker Bass ausgemacht, ohne dass dabei auffällige oder störende akustische Artefakte zu verzeichnen gewesen wären.
  • Zur objektiven Darstellung der Wirkungsweise des NLF, wurde neben verschiedenen Musikstücken zudem noch ein Sinuston mit f=50[Hz] als Eingangssignal verwendet.
  • 14 zeigt das Eingangssignal und das Ausgangssignal des nichtlinearen Filters von 13.
  • Dabei ist in 14 das Eingangssignal (Sinus mit f=50[Hz]@fs=44100[Hz]) und Ausgangssignal des NLF im Zeitbereich dargestellt. 14 zeigt dabei dessen Wirkungsweise im Zeitbereich auf. Da dies jedoch nicht sonderlich aussagekräftig ist, wurde von den beiden hier dargestellten Signalen ebenfalls noch das jeweilige Leistungsdichtespektrum berechnet, welche in 15 dargestellt sind.
  • 15 zeigt ein Leistungsdichtespektrum des Eingangs- und des Ausgangssignals des nichtlinearen Filters von 13.
  • Dabei ist in 15 das Leistungsdichtespektren des Ein- (Sinus mit f=50[Hz]) und Ausgangssignals des NLF dargestellt.
  • Wie 15 nun wesentlich deutlicher veranschaulicht, kommt es dabei, aufgrund des nichtlinearen Funktionsverlaufes des verwendeten Polynom-Filters, wie gewünscht, zur Ausbildung von mindestens fünf, deutlich erkennbaren, höheren Harmonischen gerader und ungerader Ordnung.
  • Ist der verwendete Lautsprecher lediglich in der Lage Frequenzen oberhalb von f >100 [Hz] abzubilden, was etwa durch Verwendung einer Eckfrequenz von fc=100[Hz] beim Hochpassfilter HP2 in 13 simuliert werden kann, wird klar, dass der Lautsprecher die Grundschwingung bei f=50[Hz] prinzipiell nicht bzw. nur unzureichend wiedergeben kann. Dadurch, dass höhere Harmonische bei f = [100, 150,200, ...] mit Hilfe des NLF erzeugt werden, ist unser Gehör in der Lage die eigentlich akustisch nicht mehr vorhandene Grundschwingung bei f=50[Hz] aus diesen nachzubilden, weshalb subjektiv der Eindruck entsteht als ob diese akustisch vorhanden wäre. Somit wurde auch mit Hilfe dieses Beispiels nochmals die prinzipielle Wirkungsweise der Methode zur Bass-Verbesserung veranschaulicht.
  • Im Folgenden wird ein einfacher Algorithmus zur subjektiven Verbesserung der Bass-Wiedergabe mit Hilfe von künstlich erzeugten, höheren Harmonischen bereitgestellt.
  • 16 zeigt eine schematische Darstellung eines Signalflussdiagramms zur Verbesserung des Bass-Eindrucks mit Hilfe künstlich erzeugter höherer Harmonischer, gemäß Ausführungsbeispielen der Erfindung.
  • In 16 dargestellt ist der prinzipielle Signalfluss eines einfachen Algorithmus zur künstlichen Verbesserung des subjektiv wahrgenommenen Bass-Eindrucks. Hierzu wird das Eingangssignal 10 über ein komplementäres Hochpass/Tiefpass-Filter (X-Over Filter, Frequenzweiche) 11, dessen Eckfrequenz fCLSP durch den verwendeten Lautsprecher bestimmt wird, in einen tiefpassgefilterten (xLP(n)) und einen hochpassgefilterten (xHP(n)) Signalanteil 1,9 aufgespalten. Das tiefpassgefilterte Signal xLP(n) stellt dabei den Anteil dar, den der Lautsprecher (bauartbedingt) nicht mehr korrekt (z.B. linear bzw. mit ausreichendem Pegel) wiedergeben kann. Dieser Signalanteil 1 dient als Eingangssignal für die Erzeugung höherer Harmonischer, was im Signalverarbeitungsblock Harmonic Generator 12 stattfindet. Am Ausgang dieses Moduls steht dann die Summe sämtlicher erzeugter, höherer Harmonischer (SumHigherHarm(n)) 6, deren Frequenzen oberhalb von fcLSP liegen müssen, damit diese der betreffende Lautsprecher auch mit ausreichendem Pegel wiedergeben kann, ohne dabei nichtlinear zu werden. Optional wird dann dessen Ausgangssignal SumHigherHarm(n) 6 noch in seiner Verstärkung, mit Hilfe des zeitvariablen Verstärkungssignals G(n) 7 geregelt bevor dieses dann auf den hochpassgefilterten Signalanteil 9 des Eingangssignals aufaddiert wird und somit das Ausgangssignal bzw. das Lautsprecher-Ansteuersignal Out(n) liefert.
  • Nachfolgend wird aufgezeigt wie man die hierzu benötigten, höheren Harmonischen auf einfache Weise aus dem tiefpassgefilterten Signalanteil 1 bestimmen kann.
  • 17 zeigt eine schematische Darstellung eines Signalflussdiagramms des harmonischen Generators (Harmonic Generator Modul) 13 der 16, gemäß Ausführungsbeispielen der Erfindung.
  • Wie man aus 17 sieht, dient ausschließlich das tiefpassgefilterte Eingangssignal xLP(n) 1 als Grundlage für die Erzeugung der gewünschten, höheren Harmonischen. Hierzu wird dieses zunächst in eine Matrix (Harmonic Generation Matrix) 12 eingespeist, welche beispielsweise direkt im Zeitbereich eine gewünschte Anzahl von höheren Harmonischen erzeugt, die dann am Ausgang sortiert nach geraden (x even(n)) 4 und ungeraden Anteilen (xodd(n)) 5 zur Verfügung stehen. Optional können diese Anteile im Anschluss noch durch einen Hilbert Transformator 13 laufen um Phasenverschiebungen, welche eventuell, innerhalb der Matrix 12 zwischen den geraden und ungeraden Anteilen 4,5 eingeprägt wurden, wieder auszugleichen, bevor dann sämtliche, höheren Harmonischen aufsummiert werden. Das Summensignal der höheren Harmonischen SumHigherHarm(n) 6 stellt dann bereits eines der beiden Ausgangssignale dieses Signalverarbeitungsblocks dar. Das zweite Ausgangssignal entspricht dem zeitvariablen Verstärkungssignal G(n) 7, welches in dem optionalen Modul GlobalGainCalc anhand des ursprünglichen Eingangssignals xLP(n) 1 sowie des Summensignals der höheren Harmonischen SumHigherHarm(n) 6 berechnet wird. Hierzu kann etwa ein Langzeitmittelwert für beide Signale 1,6, unter Verwendung der gleichen Glättungszeitkonstante berechnet und dann das Verhältnis dieser beiden Energie-Schätzwerte bestimmt werden, was dann in das zeitvariable Verstärkungssignal G(n) 7 mündet. Ziel dieser Variante zur Bestimmung von G(n) 7 ist es, die Energie der höheren Harmonischen SumHigherHarm(n) 6 so einzustellen, dass diese der Energie des Eingangssignals xLP(n) 1 über der Zeit entspricht.
  • 18 zeigt eine schematische Darstellung der fixen Matrix zur Erzeugung höherer Harmonischer von 17 im Zeitbereich, gemäß Ausführungsbeispielen der Erfindung.
  • 18 ist eine Detaildarstellung einer einfachen, fixen Matrix 12 zur Erzeugung höherer Harmonischer (dargestellt bis zur Erzeugung der 5. Harmonischen) im Zeitbereich.
  • In der in 18 dargestellten Matrix 12 zur Erzeugung der gewünschten, höheren Harmonischen wird zunächst das tiefpassgefilterte Eingangssignal xLP(n) 1 optional skaliert, wodurch dieses zu dem Signal sin(x) wird. In anderen Worten, das Audiosignal x, skaliert oder unskaliert, wird als sin(x) betrachtet bzw. behandelt.
  • Im Anschluss daran wird dieses Signal dann potenziert, d.h. es werden die Signale x L p ( n )
    Figure DE102019126509A1_0009
    2 mit p ∈ [1,...,P] und P = maximal gewünschte höhere Harmonische gebildet. Jeder dieser potenzierten Eingangssignale x LP p
    Figure DE102019126509A1_0010
    (n) 2 wird im Anschluss daran korrigiert, sodass letztendlich nur noch die höheren Harmonischen, wie etwa die Signale cos(2x),sin (3x), usw. übrigbleiben - die restlichen, störenden Signalanteile (z.B. Mischprodukte), welche zwangsweise durch die Potenzierung erzeugt werden und welche mathematisch über die Trigonometrie vollständig bekannt sind, werden dabei, im Idealfall vollständig unterdrückt. Dabei entstehen korrigierte potenzierte Signale 3, welche den gewünschten höheren Harmonischen entsprechen.
  • Die nun extrahierten, höheren Harmonischen können dann z.B. durch breitbandige, zeitabhängige oder zeitunabhängige Verstärkungsfaktoren 8 oder aber auch durch spektralabhängige Gewichtungsfaktoren (Filter) 8, die ebenfalls zeitvariabel oder zeitinvariabel sein können, und auf jedes der potenzierten Signale 3 angewendet werden, modifiziert werden, wodurch etwa nichtlineare Eigenschaften von bestimmten, akustisch als gut und brauchbar empfundenen, Lautsprechern emuliert werden können. Somit kann in diesem Schritt ein Tuning, oder Equalizing, des Audiosignals durchgeführt werden, welches eine Anpassung des Höreindrucks des Audiosignals bereitstellen kann.
  • Durch die Potenzierung ergeben sich zwangsweise Phasenverschiebungen von 90° für sämtliche, höheren Harmonischen, gerader Ordnung, welche so nicht einfach in der Matrizierung korrigiert werden können. Falls dies als störend erachtet werden sollte, können diese Phasenverschiebungen sämtlicher höherer Harmonischen gerader Ordnung, gemeinschaftlich im nachfolgend, optional vorgesehenen Hilbert-Transformator (breitbandig) aufwandsgünstig korrigiert werden. Hierzu ist es jedoch nötig, dass man zunächst die Summe der höheren Harmonischen gerader und ungerader Ordnung 4,5 am Ausgang der Matrix zur Generierung der höheren Harmonischen bereitstellt.
  • 19 zeigt eine schematische Darstellung eines Hilbert-Transformators 13 mit Allpassfilter, gemäß Ausführungsbeispielen der Erfindung.
  • In der Praktischen Umsetzung wird ein Hilbert-Transformator, wie in 19 aufgezeigt, realisiert. Dazu werden die beiden Signale, die gegeneinander um 90° phasenverschoben werden sollen, jeweils in ein Allpass (AP)-Filter AP1, AP2 gespeist, deren Phasenfrequenzgänge so entworfen wurden, dass sich diese um 90° voneinander, möglichst breitbandig unterscheiden.
  • Klassischerweise werden hierzu FIR filter für die Umsetzung der AP-Filter verwendet. Möchte man jedoch auch im tieffrequenten Spektralbereich eine Wirkung des Hilbert-Transformators mit ausreichender Genauigkeit realisieren, so ist meist eine Implementierung der AP-Filter mit Hilfe von IIR-Filter zu bevorzugen, da dieses wesentlich aufwandsgünstiger erfolgen, insbesondere deshalb, weil FIR-Filter bekanntermaßen eine Frequenzauflösung besitzen, welche vom Verhältnis der Abtastfrequenz und der verwendeten Filterlänge abhängt, weshalb sehr lange FIR-Filter für die Realisierung der AP-Filter verwendet werden müssen, wenn auch im tieffrequenten Frequenzbereich eine minimale Genauigkeit erreicht werden soll, was so für IIR-Filter nicht der Fall ist.
  • Nach Anwendung der AP-Filter AP1, AP2 besitzen nun sämtliche, höheren Harmonischen die gleiche, relative Phasenlage und können somit vollständig zusammengefasst werden. Somit entsteht am Ausgang der Additionsstelle das Summensignal der höheren Harmonischen SumHigherHarm(n) 6 zur Verfügung.
  • Natürlich können höhere Harmonische auch auf andere Art und Weise generiert werden, z.B. direkt im Spektralbereich mit Hilfe eines Phasen-Vocoders oder etwa durch Modulation. Allerdings bietet die oben vorgestellte Methode den Vorteil der einfachen Umsetzbarkeit, ohne dabei in ansonsten oft zu beobachtenden, akustische oder numerische Probleme zu geraten.
  • Eine nachträgliche Modifikation - ob nun zeit- bzw. spektral abhängig oder spektral unabhängig - der einzelnen, höheren Harmonischen ist zwar, wie vorgestellt, möglich, jedoch keinesfalls, wie bei anderen Bass-Verbesserungsverfahren, unbedingt notwendig. Das heißt, man kann unter Umständen die generierten, höheren Harmonischen auch direkt zur Aufsummierung verwenden, was die Einfachheit dieses Verfahrens weiter unterstreicht.
  • Ferner erscheint die Verwendung eines zeitvariablen Verstärkungsfaktors G(n) 7 mit welchen die Summe der höheren Harmonischen 6 modifiziert werden kann, aus energetischer Sicht zwar als sinnvoll, ist aber ebenfalls nicht zwingend erforderlich. Gleiches gilt auch für die Anwendung des Hilbert-Transformators 13. Um mathematisch exakt zu werden ist dieser zwar nötig, aus akustischer Sicht muss dieser jedoch nicht unbedingt angewendet werden, weshalb man auf dessen Einsatz auch durchaus verzichten kann.
  • 20 zeigt eine schematische Darstellung eines Prozessors 100, die zum Generieren höherer Harmonischer eines Audiosignals konfiguriert ist, gemäß Ausführungsbeispielen der Erfindung.
  • Der Prozessor 100 umfasst einen Eingang 110 zum Empfang zumindest des Eingangssignals 1, und einen Ausgang 120 zum Bereitstellen zumindest eines korrigierten potenzierten Signals 3. In bevorzugten Beispielen können die Summe höherer Harmonischer 6 und/oder der Verstärkungsfaktor G(n) 7 bereitgestellt werden. Der Prozessor ist konfiguriert, um ein erfindungsgemäßes Verfahren durchzuführen.
  • 21 zeigt ein Flussdiagramm mit Schritten zum Generieren höherer Harmonischer eines Audiosignals, gemäß Ausführungsbeispielen der Erfindung.
  • Das Verfahren beginnt in Schritt S10. In Schritt S20 wird ein Audiosignal empfangen. In Schritt S30 wird mindestens ein potenziertes Signal des Audiosignals generiert, wobei jedes des mindestens einen potenzierten Signals eine höhere Harmonische des Audiosignals umfasst. In Schritt S40 wird jedes des mindestens einen potenzierten Signals unter Verwenden von trigonometrische Funktionen des Audiosignals korrigiert, um Signalkomponenten des potenzierten Signals, welche nicht die höhere Harmonische sind, zu unterdrücken. In Schritt S50 wird das mindestens eine korrigierte potenzierte Signal ausgegeben. Das Verfahren endet in Schritt S60.
  • Zusammenfassend werden Techniken zur Verbesserung des subjektiven Basseindrucks für Tonsysteme bereitgestellt, bei denen aufgrund der physikalischen Einschränkungen von verwendeten Lautsprechern niederfrequente Frequenzkomponenten nicht übertragen werden können. Um einen psychoakustischen Eindruck zu erwecken, dass diese tiefen Frequenzen noch vorhanden und damit wahrnehmbar sind, wird typischerweise ein Verfahren zum Einfügen höherer Harmonischer verwendet, die normalerweise mit der Anregung des Lautsprechers durch niederfrequente Komponenten einhergehen.
  • Die vorliegende Erfindung offenbart ein neuartiges Verfahren zur Erzeugung solcher höherer Harmonischer, die am Ende dem ursprünglichen, durch einen Crossover- (oder Hochpass-) gefilterten, lautsprechergetriebenen Signal überlagert werden, z.B. unter Verwendung eines einfachen, aber dennoch effizienten nichtlinearen Lautsprechermodells.
  • Dabei wird der tiefpassgefilterte Teil des Eingangssignals als Eingang für den harmonischen Generator (engl. Harmonic Generator) verwendet, der schließlich dem hochpassgefilterten Teil des Eingangssignals hinzugefügt wird, um das Lautsprechersteuersignal zu bilden.
  • Innerhalb des harmonischen Generators wird zunächst sein Eingangssignal in die Harmonischen-Erzeugungsmatrix eingespeist, die in manchen Beispielen ein einfaches, nichtlineares Lautsprechermodell darstellen kann, das in der Lage ist, an seinem Ausgang höhere Harmonische bis zu einer beliebigen Anzahl zu erzeugen (gewichtet, bzw. gefiltert).
  • Anschließend werden optional die höheren Harmonischen getrennt und ihre geraden und ungeraden Anteile aufsummiert und in einen Hilbert-Transformator eingespeist, um die 90°-Phasenverschiebung zwischen den geraden und ungeraden höheren Harmonischen zu kompensieren, die durch die Harmonischen-Erzeugungsmatrix zwangsläufig entsteht. Die Ausgangssignale des Hilbert-Transformators werden dann summiert, um die Summe aller (gewünschten) höheren Harmonischen zu erhalten.
  • Schließlich wird optional eine zeitvariable Verstärkung berechnet, basierend auf dem Eingangssignal (tiefpassgefiltertes Eingangssignal) und dem Ausgangssignal (Gesamtsumme aller (gewünschten) harmonischen Signale) des Oberschwingungsgenerators, so dass sichergestellt ist, dass beide die gleiche Energiemenge enthalten. Die optional gewichtete Gesamtsumme aller (gewünschten) harmonischen Signale wird dann zum hochpassgefilterten Eingangssignal addiert, um schließlich das Treibersignal des Lautsprechers zu erzeugen.
  • Obwohl die Erfindung in Bezug auf bestimmte bevorzugte Ausführungsbeispiele gezeigt und beschrieben wurde, werden Äquivalente und Änderungen durch Fachleute nach dem Lesen und Verstehen der Beschreibung vorgenommen. Die vorliegende Erfindung umfasst alle derartigen Äquivalente und Änderungen und ist nur durch den Umfang der beiliegenden Ansprüche begrenzt.

Claims (20)

  1. Verfahren zum Generieren höherer Harmonischer eines Audiosignals (1), umfassend: - Empfangen eines Audiosignals (1); - Generieren mindestens eines potenzierten Signals (2) des Audiosignals (1), wobei jedes des mindestens einen potenzierten Signals (2) eine höhere Harmonische (3) des Audiosignals (1) umfasst; - Korrigieren jedes des mindestens einen potenzierten Signals (2) unter Verwenden von trigonometrischen Funktionen des Audiosignals (1), um Signalkomponenten des potenzierten Signals (2), welche nicht die höhere Harmonische (3) sind, zu unterdrücken; und - Bereitstellen der mindestens einen höheren Harmonischen (3).
  2. Verfahren nach Anspruch 1, wobei das Korrigieren jedes des mindestens einen potenzierten Signals (2) umfasst: - Addieren mindestens eines weiteren potenzierten Signals niedrigerer Ordnung des Audiosignals (1) zu dem potenzierten Signal (2).
  3. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Generieren mindestens eines potenzierten Signals (2) des Audiosignals (1) und das Korrigieren jedes des mindestens einen potenzierten Signals (2) durch Anwenden einer fixen Matrix auf das Audiosignal (1) erfolgt.
  4. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Generieren des mindestens einen potenzierten Signals (2) umfasst: - Generieren mindestens eines potenzierten Signals (2) gerader Ordnung, wobei eine Ordnung einer Potenz des Audiosignals (1) eine gerade Zahl ist, und wobei jedes des mindestens einen potenzierten Signals (2) gerader Ordnung eine gerade höhere Harmonische der Ordnung der Potenz des Audiosignals (1) umfasst; und wobei das Korrigieren jedes des mindestens einen potenzierten Signals (2) gerader Ordnung umfasst: - Addieren mindestens eines potenzierten Signals (2) geringerer gerader Ordnung und/oder Addition einer Konstante zu dem potenzierten Signal gerader Ordnung.
  5. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Generieren mindestens eines potenzierten Signals (2) umfasst: - Generieren mindestens eines potenzierten Signals (2) ungerader Ordnung, wobei eine Ordnung einer Potenz des Audiosignals (1) eine ungerade Zahl ist, und wobei jedes des mindestens einen potenzierten Signals (2) ungerader Ordnung eine ungerade höhere Harmonische der Ordnung der Potenz des Audiosignals (1) umfasst; wobei das Korrigieren jedes des mindestens einen potenzierten Signals (2) ungerader Ordnung umfasst: - Addieren mindestens eines potenzierten Signals (2) geringerer ungerader Ordnung zu dem potenzierten Signal ungerader Ordnung.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Empfangen eines Audiosignals (1) umfasst: - Empfangen eines Eingangsaudiosignals (10); und - Anwenden einer Frequenzweiche oder eines Tiefpass-Filters auf das Eingangsaudiosignal (10), zum Generieren des Audiosignals (1), welches nur Signale in einem Frequenzbereich unterhalt einer vorbestimmten Grenzfrequenz enthält; und - Addieren des mindestens einen korrigierten potenzierten Signals (3) zu einem hochpassgefilterten Anteil (9) des Eingangsaudiosignals (10).
  7. Verfahren nach einem der vorhergehenden Ansprüche, weiter umfassend: - Skalieren des Audiosignals (1) mit einem zeitvariablen Skalierungsfaktor, so dass dieses zu jedem Zeitpunkt vollausgesteuert ist; - Skalieren jedes des mindestens einen korrigierten potenzierten Signals (3) mit dem inversen zeitvariablen Skalierungsfaktor.
  8. Verfahren nach einem der vorhergehenden Ansprüche, weiter umfassend: - Bestimmen eines zeitunabhängigen Verstärkungsfaktors (8) für jedes des mindestens einen korrigierten potenzierten Signals (3); - Anwenden des zeitunabhängigen Verstärkungsfaktors (8) auf jedes des mindestens einen korrigierten potenzierten Signals (3), um eine justierbare Bassverstärkung bereitzustellen.
  9. Verfahren nach einem der vorhergehenden Ansprüche, weiter umfassend: - Anwenden mindestens eines Filters auf jedes des mindestens einen korrigierten potenzierten Signals, wobei jedes des mindestens einen korrigierten potenzierten Signals spektral unterschiedlich gewichtet wird.
  10. Verfahren nach einem der vorhergehenden Ansprüche, weiter umfassend: - Verschieben einer Phase des mindestens einen korrigierten potenzierten Signals durch einen Hilbert-Transformator.
  11. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Generieren mindestens eines potenzierten Signals (2) umfasst: - Generieren einer Vielzahl von potenzierten Signalen unterschiedlicher Ordnungen des Audiosignals (1); wobei das Korrigieren der Vielzahl von potenzierten Signalen umfasst: - Addieren eines ganzzahligen Vielfachen mindestens eines anderen der potenzierten Signale zu dem potenzierten Signal.
  12. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Generieren mindestens eines potenzierten Signals (2) umfasst: - Generieren einer Vielzahl von potenzierten Signalen gerader Ordnung, wobei jeweils eine Ordnung einer Potenz des Audiosignals (1) eine gerade Zahl ist; und - Generieren einer Vielzahl von potenzierten Signalen ungerader Ordnung, wobei jeweils eine Ordnung einer Potenz des Audiosignals (1) eine ungerade Zahl ist.
  13. Verfahren nach Anspruch 12, weiter umfassend: - Aufsummieren der Vielzahl korrigierter potenzierter Signale (3) gerader Ordnung zu einem Summensignal gerader höherer Harmonischer (4), und - Aufsummieren der Vielzahl korrigierter potenzierter Signale (3) ungerader Ordnung zu einem Summensignal ungerader höherer Harmonischer (5).
  14. Verfahren nach Anspruch 12, wobei zumindest ein korrigiertes potenziertes Signal (3) gerader Ordnung und ein korrigiertes potenziertes Signal (3) ungerader Ordnung durch einen Hilbert-Transformator zueinander um 90° phasenverschoben werden.
  15. Verfahren nach Anspruch 13, wobei das Summensignal der geraden höheren Harmonischen (4) und das Summensignal der ungeraden höheren Harmonischen (5) durch einen Hilbert-Transformator zueinander um 90° phasenverschoben werden.
  16. Verfahren nach einem der vorhergehenden Ansprüche, weiter umfassend: - Aufsummieren von allen korrigierten potenzierten Signalen (3) zu einem Summensignal höherer Harmonischer (6); - Bestimmen eines Verstärkungsfaktors (7) für das Summensignal der höheren Harmonischen (6), so dass die Energie des Summensignals der höheren Harmonischen der Energie des Audiosignals (1) entspricht; und - Anwenden des Verstärkungsfaktors (7) auf das Summensignal der höheren Harmonischen (6).
  17. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verfahren im Zeitbereich durchgeführt wird.
  18. Prozessor (100) zum Generieren höherer Harmonischer eines Audiosignals, welcher konfiguriert ist, um die folgenden Schritte durchzuführen: - Empfangen eines Audiosignals (1); - Generieren mindestens eines potenzierten Signals (2) des Audiosignals (1), wobei jedes des mindestens einen potenzierten Signals (2) eine höhere Harmonische des Audiosignals (1) umfasst; - Korrigieren jedes des mindestens einen potenzierten Signals (2) unter Verwenden von trigonometrischen Funktionen des Audiosignals (1), um Signalkomponenten des potenzierten Signals (2), welche nicht die höhere Harmonische sind, zu unterdrücken; und - Bereitstellen der mindestens einen höheren Harmonischen (3).
  19. Prozessor (100) nach Anspruch 18, weiter konfiguriert, um eines der Verfahren nach den Ansprüchen 2 bis 17 auszuführen.
  20. Tonsystem, umfassend einen Prozessor (100) nach Anspruch 19.
DE102019126509.6A 2019-10-01 2019-10-01 Verbesserung der subjektiven bass-wahrnehmung eines audiosignals mit hilfe höherer harmonischer Pending DE102019126509A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102019126509.6A DE102019126509A1 (de) 2019-10-01 2019-10-01 Verbesserung der subjektiven bass-wahrnehmung eines audiosignals mit hilfe höherer harmonischer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102019126509.6A DE102019126509A1 (de) 2019-10-01 2019-10-01 Verbesserung der subjektiven bass-wahrnehmung eines audiosignals mit hilfe höherer harmonischer

Publications (1)

Publication Number Publication Date
DE102019126509A1 true DE102019126509A1 (de) 2021-04-01

Family

ID=74872552

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102019126509.6A Pending DE102019126509A1 (de) 2019-10-01 2019-10-01 Verbesserung der subjektiven bass-wahrnehmung eines audiosignals mit hilfe höherer harmonischer

Country Status (1)

Country Link
DE (1) DE102019126509A1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3638004A (en) * 1968-10-28 1972-01-25 Time Data Corp Fourier transform computer
US20090147963A1 (en) * 2007-12-10 2009-06-11 Dts, Inc. Bass enhancement for audio
US20170001561A1 (en) * 2013-11-29 2017-01-05 Harman Becker Automotive Systems Gmbh Generating an audio signal with a configurable distance cue

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3638004A (en) * 1968-10-28 1972-01-25 Time Data Corp Fourier transform computer
US20090147963A1 (en) * 2007-12-10 2009-06-11 Dts, Inc. Bass enhancement for audio
US20170001561A1 (en) * 2013-11-29 2017-01-05 Harman Becker Automotive Systems Gmbh Generating an audio signal with a configurable distance cue

Similar Documents

Publication Publication Date Title
DE112009001003B4 (de) Geräuschunterdrückungssystem mit zwei Mikrophonen
EP1143416B1 (de) Geräuschunterdrückung im Zeitbereich
DE69832595T2 (de) Mehrweg-audiodekoder
DE69819090T2 (de) Kompensationsfilter
DE60108401T2 (de) System zur erhöhung der sprachqualität
DE112012006458B4 (de) Signalverarbeitungsvorrichtung
DE102007048973B4 (de) Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE102018127071B3 (de) Audiosignalverarbeitung mit akustischer Echounterdrückung
DE69530961T2 (de) Signalverstärkersystem mit verbesserter echounterdrückung
DE112012006457B4 (de) Frequenzcharakteristikmodifikationsgerät
DE102008039330A1 (de) Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
DE102007030209A1 (de) Glättungsverfahren
DE102006020832A1 (de) Verfahren zum Unterdrücken von Rückkopplungen und zur Spektralerweiterung bei Hörvorrichtungen
DE112007003683B4 (de) Echounterdrückungssystem, Echounterdrückungsverfahren, Klangausgabevorrichtung, Audiosystem, Navigationssystem und mobiles Objekt
DE60308336T2 (de) Verfahren und system zur messung der übertragungsqualität eines systems
DE102015207706B3 (de) Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals
EP1239455A2 (de) Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung
DE102018117558A1 (de) Adaptives nachfiltern
DE602004006912T2 (de) Verfahren zur Verarbeitung eines akustischen Signals und ein Hörgerät
DE4343366A1 (de) Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
DE102019126509A1 (de) Verbesserung der subjektiven bass-wahrnehmung eines audiosignals mit hilfe höherer harmonischer
EP3349481A1 (de) Verfahren zur frequenzverzerrung eines audiosignals
EP1869765B1 (de) Kompandersystem
DE10254407B4 (de) Vorrichtung und Verfahren zum Unterdrücken einer Rückkopplung

Legal Events

Date Code Title Description
R163 Identified publications notified
R012 Request for examination validly filed