WO2022243257A2

WO2022243257A2 - Vorrichtung und verfahren zum bestimmen von audio-verarbeitungsparametern

Info

Publication number: WO2022243257A2
Application number: PCT/EP2022/063211
Authority: WO
Inventors: Peggy Sylopp; Tobias Bruns
Original assignee: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date: 2021-05-17
Filing date: 2022-05-16
Publication date: 2022-11-24
Also published as: DE102021204974A1; WO2022243257A3; CN117652160A; EP4342189A2; US20240089672A1

Abstract

Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein Verfahren zum Bestimmen von Audio-Verarbeitungsparametern in Abhängigkeit von zumindest einem Audio-Eingangssignal.

Description

Vorrichtung und Verfahren zum Bestimmen von Audio-Verarbeitungsparametern

Technisches Gebiet

Ausführungsbeispiele gemäß der vcrliegenden Erfindung beziehen sich auf eine Verrich tung und ein Verfahren zum Bestimmen vcn Audic-Verarbeitungsparametern in Abhängig keit vcn zumindest einem Audio-Eingangssignal.

Ausführungsbeispiele gemäß der Erfindung beziehen sich auf eine Vorrichtung und ein Ver fahren mit einer künstlichen Intelligenz, beispielsweise in einem Klangwiedergabegerät, die Audiosignale analysieren und mit benutzer-individuellen Einstellungen während des Benut zerbetriebs zuordnen bzw. kombinieren kann.

Ausführungsbeispiele beziehen sich ferner auf Konzepte zum Bestimmen von Audio-Ver- arbeitungsparametern basierend auf beim Benutzerbetrieb erhaltenen Audiosignalen.

Hintergrund der Erfindung

Die individuelle Wahrnehmung von Klang und damit die individuellen Anforderungen für den Klang bzw. Wohlklang an deren Anpassung von Klangwiedergabegeräten unterschei den sich unter anderem nach folgenden Kriterien:

• Individualität

• Situaticnsbedingte Bedürfnisse

• Äußere Rahmenbedingungen

Die Klangwahrnehmung unterscheidet sich vcn Perscn zu Perscn. Beispielsweise ist ein Gespräch mit einer Perscn in einem Raum mit vielen Menschen für den Einen schwerer zu führen als für den Anderen. Ebensc wird je nach Bedürfnis dieselbe Einstellung einer Klang wiedergabe unterschiedlich wahrgencmmen. Auch Umgebungsparameter, wie die audito- rische Umgebung, beeinflussen die Steuerungswerte für eine Klanganpassung eines Klangwiedergabegeräts erheblich. Aktuelle Klangwiedergabegeräte bieten spezifische Klanganpassungen, die nicht automa tisiert angewandt werden. Bei Klangwiedergabegeräten, wie beispielsweise tragbaren Ge räten zur Hörunterstützung, wie etwa Kopfhörer, Headsets oder Hörgeräte, stehen oft nur Lautstärkeregelung und Equalizer zur Klanganpassung zur Verfügung. Die Klanganpas sung, wie beispielsweise die Verstärkung der Lautstärke oder die Anpassung der höheren oder tieferen Töne, wird einmalig von dem Benutzer durchgeführt. Es wurde erkannt, dass zur Erzielung einer durchgängig guten Audioqualität für jede weitere Klangwiedergabe diese Einstellungen erneut durchgeführt werden müssen.

Es wurde erkannt, dass bei herkömmlichen Konzepten nicht nur der Vorgang der Klangan passung für unterschiedliche Klangwiedergaben wiederholt werden muss, sondern dass auch bei Klangwiedergabegeräten die Veränderungen der auditorischen Umgebung nicht adaptiv, beispielsweise an den Umgebungsgeräuschen angepasst, werden. Es wurde er kannt, dass es dabei Vorkommen kann, dass selbst bei einer relativ geringfügigen Änderung von Nebengeräuschen die Höranstrengung für das Sprachverstehen steigt.

Ferner wurde erkannt, dass bei herkömmlichen Konzepten Klanganpassungen zudem auch nur basierend auf den von Herstellern vorgegebenen Klangvoreinstellungen durchgeführt werden können. Es wurde herausgefunden, dass diese nicht immer den individuellen Be dürfnissen der Menschen entsprechen. So gibt es beispielsweise Einstellungen, wie „Mu sik“, wobei der präferierte Musikgeschmack und die persönliche Intention beim Musikhören dabei keine Berücksichtigung findet. So unterscheiden sich beispielsweise die Erwartung an das Klangerlebnis von Operngesang im Vergleich zu Techno grundsätzlich. Bei den Voreinstellungen im Hörprogramm „Musik“ werden jedoch von dem Hersteller verallgemei nerte Annahmen zugrunde gelegt, die unter Umständen weder den Erwartungen an das Klangerlebnis von Operngesang noch an Techno genügen und somit dem Benutzer unzu reichende Klangwiedergaben zur Verfügung stellen.

Aktuelle Klangwiedergabegeräte zur Hörunterstützung, wie beispielsweise Hörgeräte, kön nen je nach Ausstattung unter anderem mehrere Tausend Euro kosten, so dass die Erwar tungen an das Gerät entsprechend hoch ausfallen. Anpassungen von Hörgeräten werden generell unter Laborbedingungen vorgenommen, meist mit nur zwei Lautsprechern und nur einer sehr begrenzten Anzahl von Klängen, wie Sinustöne, Rauschen und Sprache. Kom plexe Geräuschsituationen, wie beispielsweise auf Straßenkreuzungen, können im Hörla bor nicht simuliert werden und führen daher zur Frustration der Hörgerätträgern und zu wenig zufriedenstellenden Ergebnissen im Alltag. Bei lernenden Anwendungen zur Klangwiedergabe, wie beispielsweise der Github-Veröf- fentlichung „liketehear-ai-pt“, werden in einer Datei aufgezeichnete, vcn Benutzern (Usern) situaticnsbedingte Parameteränderungen eines Hörgerätealgorithmus und die der Situaticn zugehörige aufgezeichnete Frequenzspektrumanalyse mit einem selbstlernenden Algorith mus verarbeitet. Der Algcrithmus erstellt die für die Entscheidung des Benutzers (Users) maßgebliche Relevanz eines bestimmten Frequenzspektrums und wählt autcmatisch die zugehörigen Parameter als Grundlage für ein Vcrhersagemcdell aus. Das Vorhersagemo- dell wird in einem zweiten Schritt auf die vcrher aufgezeichnete Frequenzspektrumanalyse angewandt. Es wurde erkannt, dass mittels dieser lernenden Anwendung zur Klangwieder gabe die Kcmplexität des Frequenzspektrums nicht abgebildet werden kann, sc dass immer wieder weitere Benutzeranpassungen netwendig sind.

In Anbetracht der ebigen Ausführungen besteht ein Bedarf für ein Kcnzept zur Bestimmung vcn Audic-Verarbeitungsparametern zur Laufzeit, das einen verbesserten Kcmprcmiss zwi schen Benutzerfreundlichkeit, erzielbarer Audicqualität und Implementierungsaufwand mit sich bringt.

Zusammenfassung der Erfindung

Diese Aufgabe wird durch den Gegenstand der unabhängigen Patentansprüche gelöst.

Ein Kerngedanke vcn Ausführungsbeispielen der vorliegenden Erfindung besteht darin, er kannt zu haben, von den Benutzern intuitiv durchgeführte Klanganpassungen in Laufzeit vorzunehmen und in Echtzeit in das lernende System zu integrieren.

Ein Ausführungsbeispiel gemäß der vorliegenden Erfindung umfasst eine Vorrichtung zum Bestimmen von Audio-Verarbeitungsparametern, beispielsweise Parameter für Audio-Ver- arbeitung, in Abhängigkeit von zumindest einem Audio-Eingangssignal, beispielsweise von einem Audio-Eingang kommend, wobei die Vorrichtung ausgebildet ist, um zumindest einen Koeffizienten einer Verarbeitungsparameter-Bestimmungsvorschrift benutzer-individuell basierend auf beim Benutzerbetrieb erhaltenen Audiosignalen zu bestimmen, und wobei die Vorrichtung ausgelegt ist, um die Audio-Verarbeitungsparameter unter Verwendung der Verarbeitungsparameter-Bestimmungsvorschrift basierend auf dem Audio-Eingangssignal zu erhalten. Koeffizienten einer Verarbeitungsparameter-Bestimmungsvorschrift können beispielsweise Koeffizienten eines neuronalen Netzes sein, das als Eingangsgröße das Au- dio-Eingangssignal, oder davon extrahierte Eingangssignalparameter, erhält, und das als Ausgangsgröße die Audio-Verarbeitungsparameter bereitstellt. In anderen Worten können die Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift beispielsweise be nutzer-individuell basierend auf beim Benutzerbetrieb erhaltenen Eingangs-Audiosignalen, beispielsweise während des Benutzerbetriebs, bestimmt werden. Ferner kann die Vorrich tung ausgelegt sein, um die Audio-Verarbeitungsparameter, beispielsweise unter Verwen dung der durch den zumindest einen Koeffizienten definierten Verarbeitungsparameter-Be stimmungsvorschrift basierend auf dem Audio-Eingangssignal zu erhalten.

Dieses Ausführungsbeispiel basiert auf dem Kerngedanken, dass es durch eine Benutzer individuelle Einstellung eines oder mehrere Koeffizienten der Verarbeitungsparameter-Be stimmungsvorschrift basierend auf beim Benutzerbetrieb erhaltenen Audiosignalen möglich wird, die Verarbeitungsparameter-Bestimmungsvorschrift an die individuellen Gewohnhei ten und Wünsche des Benutzers anzupassen. Indem während des Benutzerbetriebs erhal tene Audiosignale für die benutzer-individuelle Einstellung der Koeffizienten der Verarbei tungsparameter-Bestimmungsvorschrift herangezogen werden, kann erreicht werden, dass die Koeffizienten gut an diejenigen (konkreten) Hörsituationen anpasst, in denen sich der Benutzer üblicherweise tastsächlich aufhält. Somit ist es beispielsweise nicht länger erfor derlich, eine akustische Umgebung vorzuklassifizieren (zum Beispiel in eine allgemeine Ka tegorie „Musik“ und eine allgemeine Kategorie „Sprache“), sondern die Koeffizienten kön nen an die tatsächlichen Hörumgebungen, in der der Benutzer beispielsweise Musik oder Sprache hört, und auch an die individuellen Bedürfnisse des Benutzers angepasst werden. Beispielsweise kann durch geeignete Wahl der Koeffizienten der Verarbeitungsparameter- Bestimmungsvorschrift eine unmittelbare und Benutzer-individuelle Bestimmung von Au- dio-Verarbeitungsparametern erfolgen, wobei beispielswese die durch Koeffizienten ange passte Verarbeitungsparameter-Bestimmungsvorschrift eine unmittelbare Bestimmung der Audio Verarbeitungsparameter ohne Kategorisierung der akustischen Umgebung in eine von mehreren statisch vorgegebenen Kategorien erfordert. Vielmehr können Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift basierend auf den bei Benutzerbetrieb erhaltenen Audiosignalen angepasst werden, so dass die für den Benutzer relevanten Hö rumgebungen, in denen der Benutzer unterschiedliche Audio-Verarbeitungsparameter wünscht, „hart“ oder „weich“ (beispielsweise mit fließendem Übergang) unterscheiden wer den können. Somit ermöglicht es das Erfindungskonzept durch die Berücksichtigung der beim Benutzer betrieb erhaltenen Audiosignale (und durch entsprechende Einstellung der Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift) beispielsweise, dass bei Vorhanden sein von Sprache in verschiedenen akustischen Umgebungen, an denen sich der Benutzer aufhält (zum Beispiel lautes Großraumbüro, Einzelbüro, Straßenkreuzung mit vielen LKWs, Straßenkreuzung mit Straßenbahnverkehr, usw.) ganz verschiedene Audio-Verarbeitungs- parameter bereitgestellt werden. Die Bereitgestellten Parameter sind dann typischerweise an durch den Benutzer gewünschten Einstellungen in den jeweiligen Situationen orientiert.

Insofern liefert das Erfindungskonzept mit vertretbarem Aufwand Audio-Verarbeitungspa- rameter, die an die Lebenswirklichkeit eines individuellen Benutzers und dessen spezifi schen Präferenzen angepasst sind.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, um eine Da tenbasis in Abhängigkeit von durch den Benutzer eingestellten Nutzerparametern zu be stimmen, so dass Einträge der Datenbasis die durch den Benutzer eingestellten Nutzerpa rameter beschreiben. Beispielsweise kann die Datenbasis in Echtzeit während des Benut zerbetriebs erstellt und ein Vorhersagemodell bestimmt werden. Ferner kann die Datenba sis zur Bestimmung der Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift verwendet werden, indem die Datenbasis, die Informationen der Nutzerparameter enthält. Beispielsweise kann die Datenbasis auch personenbezogene Steuerungseinstellungen enthalten, die mit den Nutzerparametern verknüpft werden können. Die von dem Benutzer eingestellten Nutzerparameter können beispielsweise als Ausgangsgröße an die Stelle der Audio-Verarbeitungsparameter treten, oder die Audio-Verarbeitungsparameter verändern, so dass die Einträge der Datenbasis beispielsweise die durch den Benutzer eingestellten Nutzerparameter darstellen. Beispielsweise ist die Datenbasis entsprechend zumindest teil weise in ein Bestärkendes Lernen integriert, das beispielsweise die durch den Benutzer eingestellten Nutzerparameter verwendet.

Durch die Erstellung einer Datenbasis, deren Einträge die durch den Benutzer eingestellten Nutzerparameter beschreiben können die Koeffizienten der Verarbeitungsparameter-Be stimmungsvorschrift beispielsweise sukzessive verbessert oder optimiert werden. Die durch den Benutzer (typsicherweise in verschiedenen akustischen Umgebungen) einge stellten Nutzerparameter, die die Datenbasis bilden und die beispielsweise in einer Daten bank oder einer anderweitigen Speicherstruktur abgelegt werden, können hierbei Sollwerte von Audio-Verarbeitungsparametern darstellen. Besteht beispielsweise eine Zuordnung von Nutzerparametern zu Audiosignalen (oder Audiosignaleigenschaften) der jeweiligen akustischen Umgebung, in der der Benutzer die Nutzerparameter gewählt hat, so kann diese Datenbasis zu Bestimmung der Koeffizienten der Verarbeitungsparameter-Bestim mungsvorschrift verwendet werden. Durch Bestimmung einer Datenbasis, die beispiels weise mit zunehmender Dauer der Nutzung durch den Benutzer immer größer wird, kann beispielsweise erreicht werden, dass mit der Zeit eine immer größere Datenbasis zur (au tomatischen) Bestimmung (bzw. Verbesserung) der Koeffizienten der Verarbeitungspara meter-Bestimmungsvorschrift vorliegt, was eine zunehmende Verfeinerung bzw. Verbesse rung der genannten Koeffizienten (z. B. basierend auf einer immer größeren Basis an un terschiedlichen Hörumgebungen, in denen der Benutzer sich aufgehalten hat) ermöglicht. Somit kann durch Erstellung und fortlaufende Erweiterung der Datenbasis das Benutzer- Erlebnis immer weiter verbessert werden.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, um eine Da tenbasis in Abhängigkeit von dem zumindest einen Audio-Eingangssignal zu bestimmen, so dass Einträge der Datenbasis das Audio-Eingangssignal darstellen. Beispielsweise kann die Datenbasis zur Bestimmung der Koeffizienten der Verarbeitungsparameter-Bestim mungsvorschrift hinzugezogen werden. In anderen Worten wurden beispielsweise zu nächst personenbezogene Steuerungseinstellungen, beispielsweise die durch den Benut zer eingestellten Nutzerparameter gespeichert, die mit Klanginformationen der auditori- schen Umgebung als äußere Rahmenbedingung erweitert wird. Dadurch kann eine Daten grundlage geschaffen werden, die beispielsweise unter Verwendung des Bestärkenden Lernens Koeffizienten für die Verarbeitungsparameter-Bestimmungsvorschrift bereitstellt.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, die Datenbasis so zu bestimmen, dass die Datenbasis eine Zuordnung zwischen verschiedenen Audio- Eingangssignalen und jeweiligen durch den Benutzer eingestellten Nutzerparametern be schreibt. In anderen Worten kann die Vorrichtung beispielsweise die äußeren Rahmenbe dingungen basierend auf dem Audio-Eingangssignal und die personenbezogenen Steue rungseinstellungen, beispielsweise die durch den Benutzer eingestellten Nutzerparameter, einander zuordnen. Hierunter wird verstanden, dass die Zuordnung beispielsweise als Ba sis für das Vorhersagemodell dienen kann, das durch weitere Klanganpassungen des Be nutzers, beispielsweise ad hoc verändert werden kann, etwa indem die jeweiligen durch den Benutzer eingestellten Nutzerparameter mit der Datenbasis integriert werden (und dann beispielsweise eine Neubestimmung oder Verbesserung der Koeffizienten der Verar beitungsparameter-Bestimmungsvorschrift erfolgt). Beispielsweise kann im Hintergrund über den Audio-Eingang die auditorische Szene mittels Mikrofonen kontinuierlich aufge nommen, und/oder analysiert und/oder evaluiert werden, so dass beispielsweise eine Ana lyse der auditorischen Szene über die Dynamik, und/oder Frequenz und/oder spektrale Ei genschaft generiert wird. Das Analyseergebnis der auditorischen Szene kann beispiels weise als Umgebungsparameter in die Datenbasis integriert und dem Nutzerparameter zu geordnet werden, um eine Verknüpfung des Nutzerparameters und des Audio-Eingangs- signals in der auditorischen Umgebung für diesen entsprechenden Zeitpunkt zu erhalten.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, eine Datenba sis, beispielsweise zur Bestimmung der Koeffizienten der Verarbeitungsparameter-Bestim mungsvorschrift, in Abhängigkeit von einem Audio-Ausgangssignal zu bestimmen, so dass Einträge der Datenbasis das Audio-Ausgangssignal beschreiben beziehungsweise darstel len. Indem die Datenbasis in Abhängigkeit von zumindest einem Audio-Eingangssignal und von einem Audio-Ausgangssignal bestimmt wird, kann die Verarbeitungsparameter-Bestim mungsvorschrift, beispielsweise des Bestärkenden Lernens, die Datenbasis herziehen, um Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift, beispielsweise für ein neuronales Netz, bestimmen zu können. Die Koeffizienten der Verarbeitungsparameter- Bearbeitungsvorschrift können beispielsweise durch gemeinsame Verarbeitung eines Au- dio-Eingangssignals und eines zugehörigen Ausgangssignals oder durch Vergleich des Au- dio-Ausgangssignals mit dem Audio-Eingangssignal erhalten werden.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, die Datenbasis so zu bestimmen, dass die Datenbasis eine Zuordnung zwischen verschiedenen Audio- Ausgangssignalen und jeweiligen durch den Benutzer eingestellten Nutzerparametern be schreibt. In anderen Worten beschreibt die Datenbasis eine Zuordnung zwischen verschie denen Audio-Eingangssignalen, zwischen verschiedenen Audio-Ausgangssignalen und je weiligen durch den Benutzer eingestellten Nutzerparametern, um Koeffizienten der Verar beitungsparameter-Bestimmungsvorschrift bestimmen zu können. Mittels der erstellten Da tenbasis kann beispielsweise durch Analyse des eingehenden und ausgehenden Audiosig- nals eine Klangverarbeitung im Training eines selbstbestärkten Lernalgorithmus integriert werden. Beispielsweise kann das eingehende Audiosignal beziehungsweise das Audio-Ein gangssignal die Klangumgebung, beispielsweise die auditive Umgebung, enthalten. In an deren Worten, mittels der erstellten Datenbasis kann beispielsweise durch Analyse des ein gehenden und ausgehenden Audiosignals können beispielsweise die Koeffizienten der Ver- arbeitungsparameter-Bestimmungsvorschrift so gewählt werden, dass sich durch die Ver arbeitungsparameter-Bestimmungsvorschrift der gewünschte Zusammenhang zwischen Audio-Eingangssignal und Audio Ausgangssignal zumindest näherungsweise ergibt.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, den zumindest einen Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift basierend auf der von der Vorrichtung akquirierten Datenbasis anzupassen, um die Verarbeitungsparameter- Bestimmungsvorschrift benutzer-individuell anzupassen, um benutzer-individuell ange passte Audio-Verarbeitungsparameter zu erhalten. In anderen Worten wird beispielsweise das bestärkende Lernen Nutzermodell-basierend auf einer künstlichen Intelligenz ange passt, um benutzer-individuell angepasste Audio-Verarbeitungsparameter bzw. ein benut zer-individuell angepasstes Audiosignal zu erhalten. Beispielsweise ist es somit möglich, Änderungen der Klangumgebung, beispielsweise der auditiven Umgebung, und der Nutze reinstellungen, beispielsweise den Nutzerparametern, inhärent in Laufzeit zu lernen und anzupassen. Beispielsweise können benutzer-individuell angepasste Audio-Verarbeitungs parameter es ermöglichen, dass bei Verarbeitung des Audio-Eingangssignals unter Ver wendung der Audio-Verarbeitungsparameter benutzer-individuell angepasste Audiosignale während des Benutzerbetriebs erhalten werden. Anders gesagt kann aus der Datenbasis ein nutzerspezifischer Parametersatz zur Klangverarbeitung erhalten beziehungsweise ent wickelt werden, der einerseits automatisiert unter gleichen äußeren Rahmenbedingungen dieselben Steuerungsparameter anwendet, aber auch in der Situation selbst weitere Nut zer-Anpassungen zulässt, die in die Vorrichtung als lernendes System integriert werden. Beispielsweise kann sich so das Lernsystem und die Anwendung in einem fortwährenden Lernprozess den klanglichen Nutzerpräferenzen anpassen.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, die Verarbei tungsparameter-Bestimmungsvorschrift basierend auf der Datenbasis bereitzustellen und/oder anzupassen. Beispielsweise kann die Vorrichtung die Datenbasis, beispielsweise unter Verwendung des bestärkenden Lernens, nutzen, um die Verarbeitungsparameter-Be stimmungsvorschrift bereitzustellen, um unter Verwendung der Audio-Verarbeitungspara meter benutzer-individuell angepasste Audiosignale, zum Beispiel während des Benutzer betriebs, zu erhalten.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, den zumindest einen Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift basierend auf zu- mindest einem von einem Benutzer korrigierten und/oder veränderten Audio-Verarbei- tungsparameter zu bestimmen und/oder anzupassen. Wie bereits erwähnt, kann die Vor richtung ausgebildet sein, Benutzeranpassungen der Nutzerparameter während des Benut zerbetriebs zu berücksichtigen bzw. einzustellen, und beispielsweise zu einem späteren Zeitpunkt und entsprechend gleichen Ort bzw. entsprechend gleicher Klangumgebung wei tere Benutzeranpassungen der Nutzerparametern zuzulassen, so dass die vorhergehen den Nutzerparameter mit neu eingestellten Nutzerparameter eingestellt und/oder über schrieben werden. In anderen Worten können Koeffizienten der Verarbeitungsparameter- Bestimmungsvorschrift von einem Benutzer korrigiert werden und/oder es können bei spielsweise veränderte Audio-Verarbeitungsparametern bestimmt werden, beispielsweise abhängig von der Klangumgebung zum jeweiligen Zeitpunkt, in der sich der Benutzer be findet.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, eine Audio- Verarbeitung, beispielsweise eine parametrisierte Audio-Verarbeitungsvorschrift, basierend auf dem Audio-Eingangssignal und basierend auf dem Audio-Verarbeitungsparameter aus zuführen, um die benutzer-individuell angepassten Audiosignale, beispielsweise unter Be rücksichtigung von Benutzermodifikationen der Audio-Verarbeitungsparameter, zu erhal ten. Anders gesagt kann die Vorrichtung mittels einer optionalen Audio-Verarbeitung des Audio-Eingangssignals und der Audio-Verarbeitungsparameter ein benutzer-individuell an gepasstes Audiosignal für den Audio-Ausgang bereitstellen. Es kann also beispielsweise die Audioverarbeitung in die Vorrichtung integriert werden, wodurch ein effizientes System erhalten wird. Die Audioverarbeitung kann optional auch bei der Bestimmung der Audio- Verarbeitungsparameter mit einbezogen werden.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, die Koeffizien ten der Verarbeitungsparameter-Bestimmungsvorschrift unter Verwendung eines Ver gleichs des Audio-Eingangssignals und eines unter Verwendung des Audio-Verarbeitungs- parameter-gelieferten Audio-Eingangssignals, beispielsweise unter Berücksichtigung von Benutzermodifikationen der Audio-Verarbeitungsparameter, zu bestimmen. Anders gesagt kann die Bestimmung der Koeffizienten der Verarbeitungsparameter-Bestimmungsvor schrift auf einem Vergleich zwischen dem Audio-Eingangssignal und dem direkten Audio- Ausgangssignal oder dem durch die Audio-Verarbeitung gelieferten Audio-Ausgangssignal basieren. Beispielsweise kann optional vor oder nach Verwendung des Vergleichs eine Au- dio-Analyse des Audio-Eingangssignals oder eine Audio-Analyse des Audio-Ausgangssig- nals erfolgen, um die Koeffizienten der Vergleichsparameter-Bestimmungsvorschrift basie rend auf einem Audio-Analyseergebnis der Audiosignale zu bestimmen. Eine Bestimmung der Koeffizienten der Parameter-Bestimmungsvorschrift unter Verwendung eines solchen Vergleich liefert besonders zuverlässige bzw. robuste Ergebnisse, da das tatsächlich an den Benutzer ausgegebene Audiosignal als Kriterium für die Bestimmung der Koeffizienten der Parameter-Bestimmungsvorschrift gemacht werden kann. Das Kriterium, dass das Au- dio-Ausgangssignal dem vom Benutzer gewünschten entsprechen soll, ist nämlich aussa gekräftiger und robuster als die reine Optimierung der Audio-Verarbeitungsparameter an sich.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, die von dem Benutzer eingestellten Nutzerparameter als Ausgangsgröße an Stelle der Audio-Verarbei tungsparameter bereitzustellen, wobei die von dem Benutzer eingestellten Nutzerparame ter Lautstärkeparameter und/oder Klangparameter und/oder Equalizer-Parameter umfas sen. Anders gesagt können Nutzerparameter beispielsweise Filterparameter zur Tongestal tung und/oder zur Entzerrung von Tonfrequenzen aufweisen. Indem die von dem Benutzer eingestellten Nutzerparameter als Ausgangsgröße bereitgestellt werden, wird beispiels weise ein kurzfristiger Benutzereingriff ermöglicht, was ein besonders gutes Nutzererlebnis zur Folge hat. Ein Nutzereingriff kann dann zusätzlich zur Verbesserung der Koeffizienten verwendet werden, um so zukünftige Nutzereingriffe nach Möglichkeit zu vermeiden (und stattdessen automatisch eine an den Nutzerwunsch angepasste Einstellung zu erreichen).

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgelegt, die Nutzerpara meter mit den Audio-Verarbeitungsparametern zu kombinieren, beispielsweise durch Addi tion, um dadurch kombinierte Parameter der Audio-Verarbeitung zu erhalten und als Aus gangsgröße bereitzustellen. Kombinierte Parameter können beispielsweise Nutzerparame ter und Audio-Verarbeitungsparameter aufweisen, die kombiniert der Audio-Verarbeitung bereitgestellt oder unter Verwendung der Audio-Verarbeitung kombiniert werden und als Ausgangsgröße beispielsweise dem bestärkenden Lernen bereitgestellt werden. Entspre chend ist ein schneller Nutzereingriff möglich, und es kann somit die Audioverarbeitung an die Benutzerwünsche angepasst werden.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, eine Audio- Analyse des Audio-Eingangssignals durchzuführen, um ein Audio-Eingangssignalanaly- seergebnis für eine Bestimmung des zumindest einen Koeffizienten einer Verarbeitungspa- rameter-Bestimmungsvorschrift, beispielsweise unter Verwendung der Verarbeitungspara meter-Bestimmungsvorschrift, bereitzustellen. Beispielsweise kann die Verarbeitungspara meter-Bestimmungsvorschrift eine Ableitungsvorschrift zur Ableitung der Audio-Verarbei- tungsparameter von dem Audio-Eingangssignalanalyseergebnis definieren. Die Audio-Ana- lyse des Audio-Eingangssignals kann Audio-Eingangssignalanalyseergebnisse bereitstel len, beispielsweise in Form von Informationen über spektrale Eigenschaften und/oder Dy namik und/oder Frequenz des Audio-Eingangssignals, oder auch Informationen über Inten sitätswerte pro Band. Die Audio-Eingangssignalanalyseergebnisse können beispielsweise als Eingangsgrößen für eine Bestimmung des einen oder der Koeffizienten der Verarbei tungsparameter-Bestimmungsvorschrift, zum Beispiel unter Verwendung des bestärkenden Lernens, bereitgestellt werden. Ausführungsbeispiele sehen dabei ferner vor, dass die Au- dio-Analyse das von dem Audio-Eingang kommende Audio-Eingangssignal im Vorhinein analysiert und evaluiert, um es der Verarbeitungsparameter-Bestimmungsvorschrift bereit zustellen, wobei das nicht zwingend erforderlich ist. So ist es beispielsweise möglich, zu sätzlichen Informationen über spektrale Eigenschaften des Audio-Eingangssignals als Au- dio-Eingangssignalanalyseergebnis zu gewinnen. Weiterhin kann durch Verwendung eines Audio-Eingangssignalanalyseergebnisses die Verarbeitungsparameter-Bestimmungsvor schrift einfacher gestaltet werden als wenn beispielsweise das komplette Audio Eingangs signal zur Bestimmung von Audio-Verarbeitungsparametern herangezogen würde. So kön nen Parameter bzw. Werte des Audio-Eingangssignalanalyseergebnisses beispielsweise die wesentlichen Charakteristika des Audio-Eingangssignals in effizienter Weise beschrei ben, so dass der Verarbeitungsparameter-Bestimmungsvorschrift eine vergleichsweise ge ringe Zahl an Eingangsvariablen (nämlich beispielsweise die) Parameter bzw. Werte des Audio-Eingangssignalanalyseergebnisses aufweist und daher vergleichsweise einfach im plementierbar ist. Somit können gute Ergebnisse mit geringem Aufwand erzielt werden.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, eine Audio- Analyse des Audio-Ausgangssignals durchzuführen, um ein Audio-Ausgangssignalanaly- seergebnis, beispielsweise in Form einer Information über spektrale Eigenschaften des Au dio-Eingangssignals, für eine Bestimmung des zumindest einen Koeffizienten der Verarbei tungsparameter-Bestimmungsvorschrift, zum Beispiel unter Verwendung der Verarbei tungsparameter-Bestimmungsvorschrift, bereitzustellen. In anderen Worten ist die Vorrich tung ausgebildet, eine Audio-Analyse vor der Verarbeitungsparameter-Bestimmungsvor schrift oder nach der Verarbeitungsparameter-Bestimmungsvorschrift durchzuführen, um entweder ein Audio-Eingangssignalanalyseergebnis oder ein Audio-Ausgangssignalanaly- seergebnis oder beides für eine Bestimmung des Koeffizienten der Verarbeitungsparame ter-Bestimmungsvorschrift bereitzustellen. Beispielsweise ist es durch Bestimmung des Au- dio-Ausgangssignalanalyseergebnisses besonders einfach, das Audio Eingangssignal und das Audio-Ausgangssignal zu vergleichen, wobei beispielswiese Werte oder Parameter des Audio-Ausgangssignalanalyseergebnisses die charakteristischen Eigenschaften des Au- dio-Ausgangssignals besonders effizient (bzw. in besonders kompakter Form) beschreiben können. Somit ist eine Bestimmung bzw. Optimierung der Koeffizienten der Verarbeitungs parameter-Bestimmungsvorschrift besonders effizient möglich, wobei die Erzielung einer von dem Benutzer gewünschten Verarbeitung beispielsweise durch Auswertung des Audio- Ausgangssignalanalyseergebnis in effizienter Weise erfolgen kann bzw. wobei ein Ver gleich zwischen Audio-Eingangssignalanalyseergebnis und Audio-Ausgangssignalanaly- seergebnis einen Rückschluss auf Koeffizienten der Verarbeitungsparameter-Bestim mungsvorschrift erlauben kann.

Gemäß einem weiteren Ausführungsbeispiel umfasst der Audio-Verarbeitungsparameter beziehungsweise umfassen die Audio-Verarbeitungsparameter zumindest einen Multiband kompressionsparameter R, und/oder zumindest einen Hörschwellenanpassungsparame ter T, und/oder zumindest einen bandabhängigen Verstärkungsparameter G, und/oder zu mindest einen Störgeräuschreduktionsparameter und/oder zumindest einen blinden Quell trennungsparameter. Ferner können die Audio-Verarbeitungsparameter zumindest einen Schallrichtungsparameter, und/oder binaurale Parameter, und/oder Parameter über die An zahl unterschiedlicher Sprecher, und/oder Parameter von adaptiven Filtern im Allgemeinen, zum Beispiel Hallunterdrückung, Feedback, Echo-Cancellation, Active-Noise-Cancellation (ANC), umfassen. Beispielsweise kann mittels einem Schallrichtungsparameter die Direkti- vität der Schallquelle ausgewählt beziehungsweise eingestellt werden, so dass der Schall nur aus der gewünschten Richtung, beispielsweise dem Gesprächspartner einer Konver sation für die Kombination der Audio-Verarbeitungsparameter verarbeitet wird. Es wurde erkannt, dass derartige Audioverarbeitungsparameter eine Audiosignalverarbeitung in effi zienter Weise beeinflussen können, wobei bereits mit einer geringen Zahl an Parametern, die ohne größere Schwierigkeiten durch eine Verarbeitungsparameter-Bestimmungsvor schrift bestimmte werden können, eine Beeinflussung der Audiosignalverarbeitung über ei nen weiten Einstellbereich hinweg möglich ist.

Gemäß einem weiteren Ausführungsbeispiel kann die Vorrichtung ein neuronales Netz um fassen, das zum Beispiel die Verarbeitungsparameter-Bestimmungsvorschrift implemen tiert, so dass der zumindest eine Koeffizient definiert wird, oder bevorzugt eine Mehrzahl von Koeffizienten definiert werden, die ausgelegt sind, um die Audio-Verarbeitungsparame- ter unter Verwendung der Verarbeitungsparameter-Bestimmungsvorschrift zu erhalten. Ferner kann das neuronale Netz ausgelegt sein, die Audio-Verarbeitungsparameter basie rend auf dem Audio-Eingangssignal direkt von dem Audio-Eingang oder mittels der zwi schengeschalteten Audio-Analyse als analysiertes Audio-Eingangssignal zu erhalten. Es wurde erkannt, dass ein neuronales Netz sich gut zur Bestimmung der Audio-Verarbei tungsparameter eignet und durch die Koeffizienten gut an die persönliche Wahrnehmung des einzelnen Nutzers anpassbar ist. Das neuronale Netz, dessen Kantengewichte bei spielsweise durch die Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift definiert werden können, kann durch die Wahl der Koeffizienten (die beispielsweise durch eine Trainingsvorschrift erfolgen kann) an die Bedürfnisse des Benutzers anpassbar. Die Koeffizienten können beispielsweise sukzessive verbessert werden, wenn weitere Benut zereinstellungen vorliegen. Somit können Ergebnisse erzielt werden, die ein sehr gutes Be nutzererlebnis bieten.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, die Verarbei tungsparameter-Bestimmungsvorschrift basierend auf einer Methode des bestärkenden Lernens, und/oder basierend auf einer Methode des verstärkenden Lernens, und/oder ba sierend auf einer Methode des unbeaufsichtigten Lernens, und/oder basierend auf einer Methode der multivariaten Vorhersage, und/oder basierend auf einem mit multivariabler Regression festgelegten multidimensionalen Parameter bereitzustellen und/oder anzupas sen, um den Audio-Verarbeitungsparameter zu bestimmen. Die Verarbeitungsparameter- Bestimmungsvorschrift kann beispielsweise Koeffizienten für das neuronale Netz bereitstel len, die beispielsweise auf der Methode des bestärkenden Lernens basieren. Die Methode der multivariaten Vorhersage kann beispielsweise eine Vorhersage von Frequenzbändern und/oder eine Vorhersage von Eingangs/Ausgangs-Kennlinien bzw. Input/Output-Kennli nien entsprechend der Nutzerparameter umfassen. Ferner kann die Methode mit multivari abler Regression beispielsweise alle vorhandenen Frequenzbänder analysieren, um einen multidimensionalen Parameterraum festzulegen. Als multidimensionaler Parameterraum kann beispielsweise eine zweidimensionale Parametereinstellung verstanden werden, die eine graphische Oberfläche aufweist, in der die Nutzerparameter zum Beispiel mittels Schieberegler oder einem Punkt auf einem Koordinatensystem, dessen Achsen Lautstär keeinstellungen und Klangeinstellungen aufweisen bzw. zugeordnet sind, durch den Benut zer eingestellt und kontinuierlich angepasst werden können. Mittels der oben aufgeführten Methoden kann die Vorrichtung den Audio-Verarbeitungsparameter bestimmen, so dass zum Beispiel ein lernender Algorithmus benutzer-individuelle Audio-Verarbeitungsparame- ter einstellt, beziehungsweise, so dass sich durch Anwendung der Verarbeitungsparame ter-Bestimmungsvorschrift gelieferte Audio-Verarbeitungsparameter mit zunehmendem Lernfortschritt an durch den Benutzer korrigierte Audio-Verarbeitungsparameter annähern, beziehungsweise, so dass sich die Verarbeitungsparameter-Bestimmungsvorschrift in ei nem fortwährenden Lernprozess anpasst, zum Beispiel in Abhängigkeit von Benutzer-An passungen der Audio-Verarbeitungsparameter. Erwartungsgemäß ist beispielsweise ein Zugriff der Methoden auf die Datenbasis bzw. den Datenspeicher uneingeschränkt (so dass beispielsweise mit zunehmender Größe der Datenbasis immer bessere Koeffizienten unter Verwendung der genannten Lernverfahren bestimmt werden können).

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgebildet, die durch den Benutzer eingestellten Nutzerparameter, beispielsweise über oder mittels einer Schnitt stelle, beispielsweise von einer Benutzerschnittstelle, einer intuitiven und/oder ergonomi schen Benutzersteuerung, wie beispielsweise einem 2D-Raum auf einem Display eines Smartphones, zu erhalten. In anderen Worten kann die Vorrichtung eine Schnittstelle (bei spielsweise eine elektrische Schnittstelle oder auch eine Mensch-Maschine-Schnittsteile) umfassen, um die Nutzerparameter einstellen zu können. Vorzugsweise kann eine visuelle Nutzersteuerung eine Lautstärkeeinstellung, beispielsweise mittels eines Schiebereglers für lauter und leiser und/oder eine Höhen- und Tiefenregelung, umfassen. Auf diese Weise kann die Einstellung des Parameter für den Menschen sehr einfach gemacht werden, wobei erkannt wurde, dass diese einfache Klangeinstellung in vielen Fällen bereits einen guten Höreindruck zur Folge hat.

Gemäß einem weiteren Ausführungsbeispiel umfasst das Audio-Eingangssignal ein Mehr- kanal-Audiosignal, zum Beispiel mit mindestens vier Kanälen oder zumindest zwei Audio- Kanälen. Beispielsweise kann das Audio-Eingangssignal von dem Audio-Eingang, zum Bei spiel von, über oder mittels einem Mikrofon, bereitgestellt werden. Ferner kann das Audio- Eingangssignal Informationen enthalten, wie beispielsweise die Anzahl der Kanäle und/o der die Anzahl der Frequenzbänder. Die Verwendung von Mehrkanalsignalen erlaubt bei spielsweise eine Lokalisierung von gewünschten und/oder störenden Schallquellen sowie eine Berücksichtigung von Richtungen der gewünschten oder störenden Schalquellen bei der Bestimmung der Audio-Verarbeitungsparameter bzw. der Koeffizienten der Verarbei tungsparameter-Bestimmungsvorschrift. Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgelegt, eine Audio-Ver- arbeitung separat für zumindest vier Frequenzbänder des Audio-Eingangssignals durchzu führen. So kann sichergestellt werden, dass eine Frequenzselektivität bereitgestellt wird, um jede einzelne Frequenz analysieren zu können, beispielsweise falls das Audio-Ein- gangssignal ein Mehrkanal-Audiosignal umfasst. Die Berücksichtigung der unterschiedli chen Intensitäten in unterschiedlichen Frequenzbändern ermöglicht es, verschiedene akus tische Umgebungen zu berücksichtigen und auch die spezifischen Wünsche des Benutzers im Hinblick auf den Frequenzgang in effizienter Weise zu berücksichtigen.

Gemäß einem weiteren Ausführungsbeispiel ist die Vorrichtung ausgelegt, den zumindest einen Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift benutzer-individu ell, beispielsweise kontinuierlich, fortlaufend, während des Benutzerbetriebs, zum Beispiel in Echtzeit, zu bestimmen, um die Audio-Verarbeitungsparameter in Echtzeit, zum Beispiel in Laufzeit während des Benutzerbetriebs, zu erhalten und/oder die veränderten Audio-Ver arbeitungsparameter in Echtzeit zu bestimmen und/oder anzupassen. In anderen Worten ist die Vorrichtung beispielsweise ausgelegt, die Audio-Verarbeitungsparameter in Echtzeit zu bestimmen und/oder anzupassen, so dass die Vorrichtung als lernendes System diesen Lernprozess in Echtzeit durchführt, beispielsweise während des Benutzerbetriebs. Anders gesagt wird bei der vorliegenden Erfindung beispielsweise die Klangverarbeitung auf Basis von in Echtzeit gemessenen äußeren Rahmenbedingungen gesteuert. Somit erfolgt auch eine Analyse aller vorhandenen Frequenzbänder in Echtzeit, so dass das Vorhersagemo dell basierend auf einer multidimensionalen Optimierung in Echtzeit bereitgestellt werden kann, das bedeutet, beispielsweise eine Optimierung, in der anhand der analysierten Fre quenzbänder und der Nutzerparameter im Datenspeicher gespeichert, die Audio-Verarbei tungsparameter bestimmt werden.

Gemäß einem weiteren Ausführungsbeispiel umfasst die vorliegende Erfindung ein Flörge- rät, wobei das Flörgerät eine Audio-Verarbeitung aufweist und wobei das Flörgerät eine Vorrichtung zum Bestimmen von Audio-Verarbeitungsparametern aufweist, wobei die Au dio-Verarbeitung ausgelegt ist, um ein Audio-Eingangssignal abhängig von den Audio-Ver arbeitungsparametern zu verarbeiten. Beispielsweise kann das Flörgerät die Vorrichtung implementieren bzw. integrieren, um die individuelle Wahrnehmung von Klang bzw. Tönen in Form von Audiosignalen für den Benutzer zu verbessern. Es hat sich gezeigt, dass die hierin beschriebene Vorrichtung besonders gut für einen Einsatz in einem Flörgerät geeig net ist, und dass der Flöreindruck durch den Einsatz des Erfindungskonzepts deutlich ver bessert werden kann. Ein Ausführungsbeispiel gemäß der verliegenden Erfindung umfasst ein Verfahren zum Be stimmen ven Audie-Verarbeitungsparametern in Abhängigkeit ven zumindest einem Audio- Eingangssignal, webei das Verfahren ein benutzer-individuelles Bestimmen ven zumindest einem Keeffizienten einer Verarbeitungsparameter-Bestimmungsverschrift, basierend auf beim Benutzerbetrieb erhaltenen Audiesignalen, und ein Erhalten ven Audie-Verarbei tungsparametern unter Verwendung der Verarbeitungsparameter-Bestimmungsvorschrift, basierend auf dem Audio-Eingangssignal, aufweist. Das Verfahren basiert auf den selben Überlegungen wie die oben beschriebene Vorrichtung und kann optional um alle Merkmale, Funktionalitäten und Details ergänzt werden, die hierin auch im Hinblick auf die erfindungs gemäße Vorrichtung beschrieben sind. Das Verfahren kann um die genannten Merkmale, Funktionalitäten und Details sowohl einzeln auch in Kombination ergänzt werden.

Ein weiteres Ausführungsbeispiel gemäß der vorliegenden Erfindung umfasst ein Compu terprogramm mit einem Programmcode zur Durchführung des Verfahrens, wenn das Pro gramm auf dem Computer läuft.

Kurzbeschreibuna der Figuren

Ausführungsbeispiele werden nachfolgend bezugnehmend auf die beiliegenden Zeichnun gen erläutert. Es zeigen:

Fig. 1 ein schematisches Blockschaltbild einer Vorrichtung gemäß einem Ausführungs beispiel, die Audio-Verarbeitungsparameter in Abhängigkeit von zumindest einem Audio-Eingangssignal bestimmt;

Fig. 2 ein schematisches Blockschaltbild einer Vorrichtung gemäß einem Ausführungs beispiel, die Audio-Verarbeitungsparameter in Abhängigkeit von zumindest einem Audio-Eingangssignal und mittels bestärkenden Lernens bestimmt, basierend auf einem Audio-Eingangssignal und einem Audio-Ausgangssignal;

Fig. 3 ein schematisches Blockschaltbild einer Vorrichtung gemäß einem Ausführungs beispiel, die Audio-Verarbeitungsparameter in Abhängigkeit von zumindest einem Audio-Eingangssignal und mittels bestärkenden Lernens bestimmt, basierend auf einer Audio-Analyse des Audio-Eingangssignals und einer Audio-Analyse des Au- dio-Ausgangssignals;

Fig. 4 ein schematisches Blockschaltbild einer Vorrichtung gemäß einem Ausführungs- beispiel, die Audio-Verarbeitungsparameter in Abhängigkeit von zumindest einem Audio-Eingangssignal und mittels bestärkenden Lernens bestimmt, basierend auf einer Audio-Analyse des Audio-Eingangssignals und auf durch den Benutzer ein gestellte Nutzerparameter;

Fig. 5 ein schematisches Blockschaltbild einer Vorrichtung gemäß einem Ausführungs- beispiel, die Audio-Verarbeitungsparameter in Abhängigkeit von zumindest einem Audio-Eingangssignal und mittels bestärkenden Lernens bestimmt, basierend auf einem Audio-Eingangssignal und auf durch den Benutzer eingestellte Nutzerpara meter; und

Fig. 6 ein schematisches Ablaufdiagramm eines Verfahrens gemäß einem Ausführungs- beispiel zum Bestimmen von Audio-Verarbeitungsparametern.

Detaillierte Beschreibunq von Ausführunqsbeispielen der Erfindunq

Bevor nachfolgend Ausführungsbeispiele der vorliegenden Erfindung im Detail anhand der Zeichnungen näher erläutert werden, wird darauf hingewiesen, dass identische, funktions gleiche oder gleichwirkende Elemente, Objekte und/oder Strukturen in den unterschiedli chen Figuren mit den gleichen Bezugszeichen versehen sind, so dass die in unterschiedli chen Ausführungsbeispielen dargestellte Beschreibung dieser Elemente untereinander austauschbar ist bzw. aufeinander angewendet werden kann.

Nachfolgend beschriebene Ausführungsbeispiele werden im Zusammenhang mit einer Vielzahl von Details beschrieben. Ausführungsbeispiele können jedoch auch ohne diese detaillierten Merkmale implementiert werden. Des Weiteren werden Ausführungsbeispiele der Verständlichkeit wegen unter Verwendung von Blockschaltbildern als Ersatz einer De taildarstellung beschrieben. Ferner können Details und/oder Merkmale einzelner Ausfüh rungsbeispiele ohne Weiteres miteinander kombiniert werden, solange es nicht explizit ge genteilig beschrieben ist. Fig. 1 zeigt ein schematisches Blockschaltbild einer Vorrichtung 100 zum Bestimmen von Audio-Verarbeitungsparametern 120, die ausgangsseitig der Vorrichtung 100 dargestellt sind, in Abhängigkeit von zumindest einem Audio-Eingangssignal 110, das eingangsseitig der Vorrichtung 100 dargestellt ist. Die beispielhafte schematische Darstellung der Vorrich tung 100 umfasst beispielsweise ein Bestimmen von Koeffizienten, das mit dem Block Ko- effizienten-Bestimmung 130 dargestellt ist, so dass Koeffizienten 132 der Koeffizienten-Be- stimmung 130 der Verarbeitungsparameter-Bestimmungsvorschrift 140 bereitgestellt wer den können. Das Audio-Eingangssignal 110 kann beispielsweise direkt von der Verarbei tungsparameter-Bestimmungsvorschrift 140 verwendet werden, um die Koeffizienten 142 der Verarbeitungsparameter-Bestimmungsvorschrift 140 zu erhalten, und/oder als beim Be nutzerbetrieb erhaltenes Audiosignal 112 von der Koeffizienten-Bestimmung 130 verwen det werden, um die Koeffizienten 132 der Koeffizienten-Bestimmung 130 bereitzustellen. Beispielsweise kann die Koeffizienten-Bestimmung 130 während des Benutzerbetriebs be nutzer-individuell erfolgen, so dass die Koeffizienten 132 der Koeffizienten-Bestim mung 130 der Verarbeitungsparameter-Bestimmungsvorschrift 140 bereitgestellt werden, um die Audio-Verarbeitungsparameter 120 unter Verwendung der Verarbeitungs-Bestim mungsvorschrift 140 basierend auf dem Audio-Eingangssignal 110 zu erhalten.

Somit können die Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift bei spielsweise so eingestellt werden, dass die Verarbeitungsparameter-Bestimmungsvor schrift basierend auf den Audio-Eingangssignal und unter Verwendung der Koeffizienten als Ausgabe Audio-Verarbeitungsparameter liefert, die bei Verwendung in einer Audio-Ver- arbeitung zu einem Audio-Ausgangssignal führen, das den Benutzer-Erwartungen ent spricht.

Fig. 2 zeigt ein schematisches Blockschaltbild einer Vorrichtung 200 gemäß einem Ausfüh rungsbeispiel. Die dargestellte Vorrichtung 200 zum Bestimmen von Audio-Verarbeitungs parametern umfasst beispielsweise einen Audio-Eingang 210, eine Audio-Verarbei- tung 220, eine Nutzersteuerung 230, einen Audio-Ausgang 240, eine Verarbeitungsbestim- mungs-Vorschrift (bzw. Verarbeitungsparameter-Bestimmungseinrichtung) in Form eines bestärkenden Lernens 250 und ein neuronales Netz 260.

Der Audio-Eingang 210 kann beispielsweise ein Mikrofon oder ein anderes Audioerfas- sungsgerät umfassen und beispielsweise Informationen über die Anzahl von Kanälen, zum Beispiel „C“ und/oder Informationen über die Anzahl von Frequenzbändern, zum Beispiel „B“, enthalten. Beispielsweise kann ein Ton, ein Klang oder eine Schallwelle, bzw. ganz allgemein ein Audiosignal, über den Audio-Eingang 210 empfangen und als Audio-Ein- gangssignal 212, 214 und 216 beispielsweise für die Audio-Verarbeitung 220, und/oder für das bestärkende Lernen 250, und/oder für das neuronale Netz 260 bereitgestellt werden. Beispielsweise kann das Audiosignal 212 für das neuronale Netz 260, das Audiosignal 214 für das bestärkende Lernen 250 und das Audiosignal 216 für die Audio-Verarbeitung 220 bereitgestellt werden (wobei die Audiosignale 212,214,216 gleich sein können, oder sich beispielsweise im Detail (zum Beispiel in der Abtastrate, der Frequenzauflösung, der Band breite, etc.) unterscheiden können. Dabei kann das Audiosignal 212 dem Audiosignal 214 und/oder dem Audiosignal 216 entsprechend gleichen (oder zumindest den gleichen Audi- oinhalt beschreiben) und die entsprechend gleichen Informationen über die Anzahl der Fre quenzkanäle und Frequenzbänder aufweisen, so dass das Audio-Eingangssignal von dem Audio-Eingang 210 direkt, beispielsweise ohne weitere Audio-Analysen, aufgeteilt wird und, zum Beispiel über mehrere Ausgänge oder Datenpfade des Audio-Eingangs 210, bereitge stellt werden kann.

Die Audio-Verarbeitung 220 kann beispielsweise eine und/oder mehrere parametrisierte Audio-Verarbeitungsvorschriften aufweisen, die ein oder mehrere Audio-Signale 216 bei spielsweise so verarbeitet/verarbeiten, dass auf Basis des eingehenden Audiosignals 216 (bzw. der eingehenden Audiosignale) unter Verwendung der parametrisierten Audio-Verar- beitungsvorschrift, die beispielsweise durch die kombinierten Parameter 272 parametrisiert wird, ein benutzer-individuell angepasstes Audiosignal 217 bereitgestellt wird (oder meh rere Benutzer-individuell angepasste Audiosignale bereitgestellt werden). Die Audio-Verar beitung 220 ermöglicht es, das Audio-Eingangssignal 216, das auf dem Audio-Eingang 210 basiert, unter Verwendung der kombinierten Parameter 272 zu verarbeiten, beispielsweise unter Verwendung der parametrisierten Audio-Verarbeitungsvorschrift, um das benutzer individuell angepasste Audiosignal 217 zu erhalten. Optionale Details und Ausführungsbei spiele zu den kombinierten Parametern 272 werden im weiteren Verlauf der vorliegenden Patentanmeldung näher erläutert. Zuvor folgen weitere Details und Ausführungsbeispiele zu den Komponenten der Vorrichtung 200.

Der Audio-Ausgang 240 kann beispielsweise das von der Audio-Verarbeitung 220 verän derte, neu zugeordnete, benutzer-individuell angepasste Audiosignal 217 empfangen und als ein verändertes beziehungsweise verarbeitetes Audiosignal 218 für eine Bestimmung von Parametern bzw. Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift (beispielsweise des neuronalen Netzes 260) einem Koeffizienten-Bestimmer 250 (der bei- spielsweise unter Verwendung eines bestärkenden Lernens realisiert ist) bereitstellen. Al ternativ oder zusätzlich kann der Audio-Ausgang beispielsweise das von der Audio-Verar- beitung 220 veränderte, neu zugeordnete, benutzer-individuell angepasste Audiosignal 217 als ein verändertes beziehungsweise verarbeitetes Audiosignal 219 für eine Schnittstelle, beispielsweise für Kopfhörer oder Lautsprecher bereitstellen, wobei das nicht zwingend er forderlich ist.

Ferner ermöglichen es Ausführungsbeispiele, dass zusätzliche Informationen des Audio- signals 218 über den Audio-Ausgang 240 an das bestärkende Lernen 250 (oder eine an dere Einrichtung zur Bestimmung von Koeffizienten oder Parametern der Verarbeitungspa rameter-Bestimmungsvorschrift ) bereitgestellt werden, um beispielsweise einen Daten speicher 252 (dessen Inhalt Teil einer Datenbasis sein kann) mit Informationen über Audi- osignale zu versorgen.

Das Audio-Ausgangssignal 218 kann, beispielsweise wie das Audio-Eingangssignal 214, dem bestärkenden Lernen 250 zur Bestimmung von Koeffizienten oder Parametern der Verarbeitungsparameter-Bestimmungsvorschrift 260 bereitgestellt werden, so dass bei spielsweise die Informationen des Audio-Eingangssignals 214 und des Audio-Ausgangs- signals 218 in einem Datenspeicher 252 als eine entsprechende Datenbasis der Vorrich tung 200 gespeichert werden.

In anderen Worten kann beispielsweise mittels der Audiosignale 218 und 214 das bestär kende Lernen 250 Koeffizienten oder Parameter der Verarbeitungsparameter-Bestim mungsvorschrift 260 bestimmen. Ferner kann das bestärkende Lernen 250beispielsweise basierend auf den Audiosignalen 214,218 die Datenbasis vergrößern beziehungsweise und/oder die Audiosignale 214,218 in den Datenspeicher 252 aufnehmen. Alternativ oder zusätzlich kann das bestärkende Lernen zumindest einen nutzerangepassten Koeffizien ten 254 bestimmen oder in die Datenbasis einspeichern.

Es sei allerdings darauf hingewiesen, dass die Nutzung des Ausgangs-Audiosignals 218 durch das bestärkende Lernen 250 (oder durch eine andere Vorrichtung zur Bestimmung der Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift, die an die Stelle des bestärkenden Lernens 250 treten kann) als optional anzusehen ist.

Die Datenbasis beziehungsweise der Datenspeicher 252 kann eine Vielzahl von Informati onen umfassen, zum Beispiel Informationen über den Audio-Eingang 210 (bzw. über ein Audio-Eingangssignal) und/oder über eines oder mehrere der Audiosignale 212 und 214 von dem Audio-Eingang 210 kommend, und/oder Informationen über den Audio-Aus- gang 240 und/oder über das Audiosignal 218 von dem Audio-Ausgang 240 kommend, und/oder Informationen über und für die Audio-Verarbeitung 220 und zum Beispiel auch zumindest einen nutzerangepassten Koeffizienten 254. Als nutzerangepasste Koeffizien ten 254 können Koeffizienten verstanden werden, die beispielsweise für eine Verwendung durch die Verarbeitungsparameter-Bestimmungsvorschrift 250 basierend auf der Datenba sis 252 und/oder basierend auf einem eingestellten Nutzerparameter 232 bestimmt werden. Als nutzerangepasste Koeffizienten können aber auch durch den Benutzer eingestellte Pa rameter der Audio-Verarbeitung verstanden werden.

Die Koeffizienten der Verarbeitungsparameter-Bestimmungsvorschrift, also beispielsweise Kantengewichte des Neuronalen Netzes, können unter anderem auf einer Methode des bestärkenden Lernens basieren, die in der Fig. 2 mit dem Bezugszeichen 250 als „Bestär kendes Lernen“ gekennzeichnet ist.

Beispielsweise kann das bestärkende Lernen 250 (zum Beispiel als eine Teilfunktion) die Datenbasis beziehungsweise den Inhalt des Datenspeichers 252 so bestimmen, dass der Datenspeicher 252 eine Zuordnung zwischen verschiedenen Audio-Eingangssignalen 212, 214 und jeweiligen durch den Benutzer eingestellten Nutzerparametern 232, beispielsweise einen nutzerangepassten Koeffizienten 254, beschreibt.

Indem beispielsweise das bestärkende Lernen 250 die Datenbasis beziehungsweise den Inhalt des Datenspeichers 252 so bestimmt, dass der Datenspeicher 252 (beispielsweise zusätzlich) eine Zuordnung zwischen dem Audio-Ausgangssignal 218 und jeweiligen durch den Benutzer eingestellten Nutzerparametern, beispielsweise einen nutzerangepassten Koeffizienten 254, beschreibt, können Koeffizienten 256 des neuronalen Netzes durch das bestärkende Lernens 250 in Vorteilhafter Weise bereitgestellt werden.

Darüber hinaus kann die Verarbeitungsparameter-Bestimmungsvorschrift als ein neurona les Netz 260 ausgelegt sein, oder kann integriert in ein neuronales Netzt vorgesehen sein, um Audio-Verarbeitungsparameter 262 unter Verwendung des beispielsweise durch das bestärkende Lernen 250 bestimmten Koeffizienten 256 zu erhalten. Anders gesagt, es kann beispielsweise das neuronale Netz 260 basierend auf dem Audiosignal 212 und dem durch das bestärkende Lernen 250 erhaltenen Koeffizienten 256 die Audio-Verarbeitungspara- meter 262 bestimmen, so dass im Ergebnis beispielsweise ein lernender Algorithmus be nutzer-individuelle Audio-Verarbeitungsparameter 262 einstellt.

Der zumindest eine Audio-Verarbeitungsparameter 262, der von dem neuronalen Netz 260 geliefert wird, kann eine ein einziger Parameter sein, oder kann mehrere Parameter umfas sen. Das Neuronale Netz 260 kann als Audio Verarbeitungsparameter 262 beispielsweise einen oder mehrere der folgenden Parameter liefern: einen Parameter des Nutzerprofils N, und/oder einen Multiband-Kompressionsparameter R, und/oder einen Hörschwellen-An- passungsparameter T, und/oder Glättungen (bzw. einen oder mehrere Glättungsparame ter) und/oder Kompressionseinstellungen (bzw. einen oder mehrere Kompressionsparame ter). Ferner können zur Klanganpassung (alternativ oder zusätzlich) ein oder mehrere Pa rameter verwendet (bzw. durch das neuronale Netz als Audioverarbeitungsparameter 262 geliefert) werden, wie beispielsweise eine bandabhängige Verstärkung G, eine Störge räuschreduktion (bzw. ein oder mehrere Störgeräuschreduktionsparameter) und/oder eine blinde Quellentrennung (bzw. ein oder mehrere Parameter einer blinden Quellentrennung).

Beispielsweise kann die Anzahl der Eingangsparameter (zum Beispiel des bestärkenden Lernens 250 und/oder des neuronalen Netzes 260) sich in Abhängigkeit von einer Anzahl C an Kanälen eines Mehrkanal-Audiosignals ergeben, und auch in Abhängigkeit von einer Anzahl B der Verarbeitungsbänder, bzw. in Abhängigkeit von einer Anzahl P der Nutzerpa rameter. Beispielsweise kann die Anzahl der Nutzerparameter P sich als das Produkt aus der Anzahl der Frequenzbänder B und der Anzahl der Audiosignale bzw. Audiokanäle C ergeben.

Alternativ oder zusätzlich können die Eingangsparameter (zum Beispiel des bestärkenden Lernens oder des neuronalen Netzes) Audiomerkmale („Audio Features“) N umfassen, bei spielsweise F=2048 Fourierkoeffizienten pro Kanal für jeweils Eingang (z. B. das Audio- Eingangssignal) und Ausgang (z. B. das Audio-Ausgangssignal), beispielsweise alle 10ms.

Beispielsweise kann die Anzahl der Ausgangsparameter (beispielsweise der Ausgangspa rameter des neuronalen Netzes 260 bzw. der Eingangsparameter der Audio-Verarbeitung) in einem erlernten Nutzerprofil M sich aus der Anzahl der Audiokanäle (zum Beispiel C), der Hörschwellenanpassung T, der Multibandkompression mit Rate R, der bandabhängigen Verstärkung G und zwei weiteren Zeitkonstanten zusammensetzen, wobei die Anzahl der Werte von G, R, T beispielsweise der Anzahl der Bänder B entspricht. Ferner kann der Wert des erlernten Nutzerprofils M (bzw. die Werte des erlernten Nutzerprofils M) den nutzeran gepassten Koeffizienten (oder Parameter) 254 (bzw. einen Satz von Nutzerangepassten Koeffizienten bzw. Parametern) bilden.

Die Nutzersteuerung 230 stellt zumindest einen Nutzerparameter 232 bereit, der beispiels weise Parameter der Lautstärke, und/oder Parameter der Klangregelung umfassen kann. Die Nutzersteuerung kann beispielsweise eine Schnittstelle zur Visualisierung der ein oder mehreren Nutzerparameter umfassen kann.

Eine Lautstärkesteuerung bzw. eine Lautstärkeregelung, die durch die Nutzersteue rung 230 erfolgen kann, kann beispielsweise Parameter liefern, die eine Verstärkung oder Dämpfung des Audiosignals bewirken. Mittels einem Tiefenregler, einem Höhenregler und/oder einem Equalizer kann der Benutzer über die Nutzersteuerung 230 beispielsweise Parameter der Klangregelung einstellen, die beispielsweise als Teil der Nutzerparame ter 232 mit den (durch das neuronale Netz 260 gelieferten) Audio-Verarbeitungsparame- tern 262 unter Verwendung einer Kombination 270 zusammengeführt werden können.

Anders gesagt, können die von der Nutzersteuerung 230 gelieferten Nutzerparameter 232 mit dem Audio-Verarbeitungsparameter 262 kombiniert werden, beispielsweise durch Ad dition, Multiplikation, Division oder Subtraktion. Durch die Kombination 270 der Nutzerpa rameter 232 mit den Audio-Verarbeitungsparametern 262 können zum Beispiel dadurch kombinierte Parameter 272, der Audio-Verarbeitung 220 bereitgestellt werden. Alternativ können die Benutzerparameter 232 die Parameter 262 auch ersetzen, beispielsweise wenn der Benutzer eine deutlich andere Einstellung wünscht als diese durch die Parameter 262 vorgegeben wird.

Zusammenfassend ist festzuhalten, dass die Vorrichtung 200 ein Audio-Eingangssignal, das über den Audio-Eingang 210 erhalten wird, in der Audio-Verarbeitung 220 verarbeitet, um Klangeigenschaften an die Wünsche bzw. Bedürfnisse eines Benutzers anzupassen. Eine Verarbeitungscharakteristik der Audio-Verarbeitung 220 wird durch die Parameter 272 eingestellt, wobei die Parameter 272 einerseits durch das neuronale Netz 260 beeinflusst werden und andererseits durch den Nutzer über die Nutzersteuerung 230 modifiziert wer den können. Das bestärkende Lernen 250 erfüllt allgemein gesprochen die Funktion, einen oder mehrere Koeffizienten (z. B. Kantengewichte) des neuronalen Netzes so anzupassen, dass die durch das neuronale Netz gelieferten Parameter im Wesentlichen den Benutzer- erwartungen entsprechen, also im Rahmen von akzeptablen Toleranzen die Parameter werte aufweisen, die die der Benutzer über die Nutzersteuerung 230 in jeweiligen verschie denen akustischen Umgebungen einstellt.

Somit kann erreicht werden, dass die Vorrichtung nach einem ausreichenden Training in vielen verschiedenen akustischen Umgebungen eine für den Benutzer angenehme auto matische Einstellung der Audio-Verarbeitung erreicht.

Fig. 3 zeigt eine schematische Darstellung beziehungsweise ein schematisches Block schaltbild einer Vorrichtung 300 zum Bestimmen von Audio-Verarbeitungsparametern in Abhängigkeit von zumindest einem Audio-Eingangssignal, das auf der Vorrichtung 200 aus der Fig. 2 basiert.

Es sei darauf hingewiesen, dass bei der Vorrichtung 300 gemäß Fig. 3 Funktionsblöcke, die auch in der Fig. 2 gezeigt sind, beispielsweise eine ähnliche oder gleiche Funktionalität aufweisen können wie entsprechende Funktionsblöcke in der Vorrichtung 200 (aber nicht notwendigerweise aufweisen müssen). Es sei ferner darauf hingewiesen, dass die Vorrich tung 300 optional um alle Merkmale, Funktionalitäten und Details ergänzt werden kann, die hierin beschrieben sind, und zwar sowohl einzeln als auch in Kombination.

Die Vorrichtung 300 verfügt, ebenso wie die Vorrichtung 200, über einen Audio-Ein- gang 310 (der dem Audio-Eingang 200 entsprechen kann), eine Audio-Verarbeitung 320 (die der Audio-Verarbeitung 220 entsprechen kann), eine Nutzersteuerung 330 (die der Nutzersteuerung 230 entsprechen kann), einen Audio-Ausgang 340 (der dem Audio-Aus- gang 240 entsprechen kann), ein bestärkendes Lernen 350 (das beispielsweise von seiner Grundfunktion dem bestärkenden Lernen 250 entsprechen kann), ein neuronales Netz 360 (das beispielsweise von seiner Grundfunktion her dem neuronalen Netz 260 entsprechen kann) und die Kombination 370 der benutzer-individuell eingestellten Nutzerparameter 332 und der Audio-Verarbeitungsparameter 362 (die beispielsweise der Kombination 270 ent sprechen kann).

Ausgehend von der Vorrichtung 200 aus der Fig. 2 beinhaltet beziehungsweise umfasst die Vorrichtung 300 der Fig. 3 zusätzlich eine Audio-Analyse 380-1 zwischen dem Audio-Ein gang 310 und dem neuronalen Netz 360 sowie eine Audio-Analyse 380-2 zwischen dem Audio-Ausgang 340 und dem bestärkenden Lernen 350. Insbesondere diese Anordnung ermöglicht es der Audio-Analyse 380-1 beispielsweise das von dem Audio-Eingang 310 ausgehende Audio-Eingangssignal 311 zu empfangen und zu analysieren, um ein Audio-Eingangssignalanalyseergebnis, beispielsweise eine Information über spektrale Eigenschaften und/oder Dynamik und/oder Frequenz des Audio-Eingangs- signals 311 , in Form des Audio-Analysesignals 312 und/oder 314 bereitzustellen. Die Infor mation des Audio-Analyse-Ergebnisses der Audio-Analyse 380-1 kann beispielsweise dem neuronalen Netz 360 und dem bestärkenden Lernen 350 (beispielsweise zeitgleich) über die analysierten Audiosignale 312, 314 bereitgestellt werden.

Die Verarbeitungsparameter-Bestimmungsvorschrift, die beispielsweise ein Teil des neuro nalen Netzes 360 (oder ein Teil des bestärkenden Lernens 350) umfassen kann, bzw. die durch das neuronale Netz 360 implementiert wird, kann beispielsweise eine Ableitungsvor schrift zur Ableitung der Audio-Verarbeitungsparameter 362 von dem Audio-Eingangsana- lyseergebnis definieren. Mittels der Audio-Analyse 380-1 können zusätzliche (bzw. kom pakte) Informationen über spektrale Eigenschaften, zum Beispiel ein Intensitätswert pro Frequenzband und Kanal, erhalten werden, um beispielsweise bei Audiosignalen (zum Bei spiel bei Mehrkanal-Audiosignalen) eine Frequenzselektivität bereitzustellen. Die Fre quenzselektivität ist erforderlich, um die wahrnehmbaren klanglichen Aspekte des Signals analysieren und darstellen zu können. Allgemein gesprochen kann durch die Audio-Analyse 380-1 eine Eingangs-Datenmenge des neuronalen Netzes deutlich verringert werden, bei spielsweise im Vergleich zu einem Konzept, bei dem Zeitbereichs-Abtastwerte in das neu ronale Netz eingegeben werden. Indem beispielsweise die analysierten Audiosignale 312, 314 Parameter enthalten, die Eigenschaften des Audio-Eingangssignals in kompakter Form beschreiben (wobei eine Anzahl von Parametern pro Zeitabschnitt beispielsweise um zu mindest einen Faktor 10 oder um zumindest einen Faktor 20 oder um zumindest einen Faktor 50 geringer ist als eine Anzahl an Abtastwerten pro Zeiteinheit) kann die Komplexität des neuronalen Netzes 360 vergleichsweise gering gehalten werden. Dementsprechend kann die Anzahl an Koeffizienten des neuronalen Netzes vergleichsweise gering gehalten werden, was einen Lernvorgang (beispielsweise durch das bestärkende Lernen 350) er leichtert. Dies gilt umso mehr, je besser die Parameter der analysierten Audiosignale ge eignet sind, um unterschiedliche akustische Umgebungen zu unterscheiden.

Zusätzlich und optional kann eine Audio-Analyse 380-2 des Audio-Ausgangssignals 342 durchgeführt werden, um ein Audio-Ausgangssignalanalyseergebnis für eine Bestimmung des zumindest einen Koeffizienten der Verarbeitungs-Parametervorschrift, beispielsweise zumindest einen Koeffizienten des bestärkenden Lernens 350 bereitzustellen. Möglich ist auch eine „gemeinsame“ Audio-Analyse des Audio-Eingangssignals 311 und des Audio-Ausgangssignals 342 (also beispielswiese eine Audio-Analyse sowohl des Au dio-Eingangssignals als auch des Audio-Ausgangssignals), wobei separate Audio-Sig- nalanalyseergebnisse bereitgestellt werden können. Separat heißt in diesem Zusammen hang, dass das Audio-Eingangssignalanalyseergebnis beispielsweise anderen Komponen ten bereitgestellt werden kann, verglichen mit dem Audio-Ausgangssignalanalyseergebnis. Beispielsweise können die Informationen der Audio-Analyse 380-1 , 380-2 des Eingangs beziehungsweise Ausgangssignals unterschiedlich zueinander oder entsprechend gleich sein.

Ausführungsbeispiele sehen dabei ferner vor, dass der Audio-Ausgang 340 ein verändertes beziehungsweise verarbeitetes Audiosignal 319 für eine Schnittstelle, beispielsweise für Kopfhörer oder Lautsprecher, bereitstellen, wobei das nicht zwingend erforderlich ist. Fer ner ermöglichen es Ausführungsbeispiele, dass die Audio-Analyse 380-2 das Audio-Sig- nal 313 für die Schnittstelle oder für eine weitere Schnittstelle bereitstellt. Hierdurch kann die Vorrichtung 300 das Audiosignal 319 und 313 beispielsweise über zumindest eine Schnittstelle externen Komponenten bereitstellen, wobei das nicht zwingend erforderlich ist.

Zusammenfassend ist somit festzuhalten, dass bei der Vorrichtung 300 nicht das Eingangs- Audiosignal oder das Ausgangs-Audiosignal selbst dem neuronalen Netz 360 oder dem bestärkenden Lernen 350 zugeführt werden, sondern ein oder mehrere entsprechende Au- dio-Analyseergebnisse. Somit kann durch geeignete Vorab-Analyse des Eingangs-Audio- signals und/oder des Ausgangs-Audiosignals eine Komplexität des neuronalen Netzes und damit auch eine Komplexität des bestärkenden Lernens niedrig gehalten werden, was den Implementierungsaufwand deutlich senkt.

Fig. 4 zeigt ein schematisches Blockschaltbild einer Vorrichtung 400 zum Bestimmen von Audio-Verarbeitungsparametern in Abhängigkeit von zumindest einem Eingangs-Signal, die teilweise auf der Vorrichtung 200 aus der Fig. 2 basiert.

Es sei darauf hingewiesen, dass bei der Vorrichtung 400 gemäß Fig. 4 Funktionsblöcke, die auch in der Fig. 2 gezeigt sind, beispielsweise eine ähnliche oder gleiche Funktionalität aufweisen können wie entsprechende Funktionsblöcke in der Vorrichtung 200 (aber nicht notwendigerweise aufweisen müssen). Es sei ferner darauf hingewiesen, dass die Vorrich tung 400 optional um alle Merkmale, Funktionalitäten und Details ergänzt werden kann, die hierin beschrieben sind, und zwar sowohl einzeln als auch in Kombination.

Die Vorrichtung 400 umfasst einen Audio-Eingang 410 (der beispielsweise dem Audio-Ein- gang 210 entsprechen kann), eine Audio-Verarbeitung 420 (die beispielsweise der Audio- Verarbeitung 220 entsprechen kann), eine Nutzer-Steuerung 430 (die beispielsweise der Nutzer-Steuerung 230 entsprechen kann), einen Audio-Ausgang 440 (der beispielswiese dem Audio-Ausgang 240 entsprechen kann), ein bestärkendes Lernen 450 (das beispiels weise von seiner grundsätzlichen Funktion her dem bestärkenden lernen 250 entsprechen kann), ein neuronales Netz 460 (das beispielsweise von seiner grundsätzlichen Funktion her dem neuronalen netz 260 entsprechen kann), eine Kombination 470 )die beispielsweise der Kombination 270 entsprechen kann) und eine Audio-Analyse 480 (die beispielsweise der Audio-Analyse 380-1 entsprechen kann) zwischen dem Audio-Eingang 410 und dem neuronalen Netz 460 und dem bestärkenden Lernen 450.

Verglichen mit der Vorrichtung 300 umfasst die Vorrichtung 400 keine Audio-Analyse des Audio-Ausgangs 440 und verglichen mit der Vorrichtung 200 wird kein Audio-Ausgangssig- nal von dem Audio-Ausgang 440 kommend dem bestärkenden Lernen 450 bereitgestellt. Anders gesagt, erhält das bestärkende Lernen 450 keine Informationen über das Audio- Ausgangssignal.

Stattdessen basiert das bestärkende Lernen 450 auf den kombinierten Parametern 472, 473 beziehungsweise auf einer Information 433, die Änderungen bzw. Anpassungen der durch das neuronale Netz 460 gelieferten Audioverarbeitungsparameter 462 durch den Be nutzer beschreibt. Ferner verwendet das bestärkende Lernen das Audio-Eingangssig- nalanalyseergebnis 414.

In anderen Worten kann das bestärkende Lernen 450 eine Datenbasis 452 in Abhängigkeit von durch den Benutzer eingestellten Nutzerparametern beziehungsweise den kombinier ten Parameter 472, 473 bestimmen, so dass Einträge der Datenbasis 452 die durch den Benutzer eingestellten Nutzerparameter 472, 473 darstellen. Die Datenbasis 452 kann zur Bestimmung der Koeffizienten 456 der Verarbeitungsparameter-Bestimmungsvorschrift, beziehungsweise des neuronalen Netzes 460, bereitgestellt bzw. verwendet werden. Dadurch kann ein Vorhersagemodell bestimmt werden, das direkt auf Nutzerparametern (bzw. den durch den Nutzer angepassten Audiosignal-Verarbeitungsparametern 472) ba siert, die direkt in das bestärkende Lernen 450 zugeordnet werden.

Optional können die ein oder mehreren kombinierten Parameter 472, 473 beziehungsweise Nutzerparameter auch im Betrieb direkt, mittels dem kombinierten Parameter 474 in das neuronale Netz 460 eingehen, so dass als Ausgabe beispielsweise die Kompressoreinstel lungen und/oder andere Parameter für die Audio-Verarbeitungsparameter 462 bereitgestellt werden können.

Alternativ oder optional können die jeweiligen durch den Benutzer eingestellten Nutzerpa rameter 432 direkt dem bestärkenden Lernen 450 bereitgestellt werden (wie bei Bezugs zeichen 433 gezeigt), wobei das nicht zwingend erforderlich ist. Es kann also beispielsweise eine Information darüber, wie sehr der Benutzer die durch das neuronale Netz 460 gelie ferten Parameter 462 verändert, für das bestärkende Lernen verwendet werden. Ändert der Benutzer die durch das neuronale Netz 460 gelieferten Parameter 462 gar nicht oder nur wenig, so kann davon ausgegangen werden, dass der Benutzer mit der aktuellen Funktio nalität des neuronalen Netzes völlig oder zumindest in sehr hohem Maße zufrieden ist, so dass Koeffizienten des neuronalen Netzes gar nicht oder nur geringfügig geändert werden müssen. Nimmt der Benutzer hingegen deutliche Veränderungen der Parameter 462 vor, so kann durch das bestärkende lernen davon ausgegangen werden, dass eine deutliche Veränderung der Koeffizienten des neuronalen Netzes erforderlich ist, um zu erreichen, dass die durch das neuronale Netz gelieferten Parameter 462 den Benutzererwartungen entsprechen. Insofern kann beispielswiese die Information 433, die einen Benutzereingriff beschreibt, durch das bestärkende Lernen verwendet werden, um ein Lernen auszulösen und/oder einen Umfang der Veränderungen der Koeffizienten des neuronalen Netzes zu bestimmen.

Insgesamt ermöglicht es das Ausführungsbeispiel gemäß der Fig. 4, die Koeffizienten 456 des neuronalen Netzes 460 in effizienter Weise zu lernen und/oder (z. B. kontinuierlich) zu verbessern.

Fig. 5 zeigt eine Vorrichtung 500, die ähnliche Eigenschaften aufweist, wie die Vorrichtun gen 200, 300 und 400. Es sei darauf hingewiesen, dass bei der Vorrichtung 500 gemäß Fig. 5 Funktionsblöcke, die auch in den Fig. 2, Fig. 3 und Fig. 4 gezeigt sind, beispielsweise eine ähnliche oder gleiche Funktionalität aufweisen können wie entsprechende Funktions blöcke in der Vorrichtung 200, der Vorrichtung 300 und der Vorrichtung 400 (aber nicht notwendigerweise aufweisen müssen). Es sei ferner darauf hingewiesen, dass die Vorrich tung 500 optional um alle Merkmale, Funktionalitäten und Details ergänzt werden kann, die hierin beschrieben sind, und zwar sowohl einzeln als auch in Kombination.

Das schematische Blockschaltbild der Fig. 5 zeigt die Vorrichtung 500, umfassend einen Audio-Eingang 510 (der beispielsweise dem Audio-Eingang 210 entsprechen kann), eine Audio-Verarbeitung 520 (die beispielsweise der Audio-verarbeitung 220 entsprechen kann), eine Nutzersteuerung 530 (die beispielsweise der Nutzersteuerung 230 entsprechen kann), einen Audio-Ausgang 540 (der beispielsweise dem Audio-Ausgang 240 entsprechen kann), ein bestärkendes Lernen 550 (das beispielsweise von seiner grundsätzlichen Funktion her dem bestärkenden lernen 250 entsprechen kann), ein neuronales Netz 560 (das beispiels weise von seiner grundsätzlichen Funktion her dem neuronalen Netz 260 entsprechen kann) und eine Kombination 570 (die beispielsweise der Kombination 270 entsprechen kann).

Die Vorrichtung 500 umfasst beispielsweise keine Audio-Analyse des Audioeingangssig- nals und keine Audio-Analyse des Audio-Ausgangssignals, so dass die Audiosignale 512 und 514 direkt von dem Audio-Eingang 510 in das bestärkende Lernen 550 bzw. in das neuronale Netz 560 geleitet werden können. Optional kann bei der Vorrichtung 500 aber auch eine Audio-Analyse des Audio-Eingangssignals erfolgen.

Wie bereits in der Fig. 2 der Vorrichtung 200 erwähnt, kann ein Audio-Eingangssignal 512 für das neuronale Netz 560 und ein Audio-Eingangssignal 514 für das bestärkende Ler nen 550 breitgestellt werden. Im Gegensatz zur Vorrichtung 400 kann das bestärkende Ler nen 550 der Vorrichtung 500 auf dem Audio-Eingangssignal 514 und den der Audio-Verar- beitung 520 bereitgestellten (bzw. durch die Audioverarbeitung 520 tatsächlich verwende ten) einen oder mehreren Audioverarbeitungsparametern 572 basieren.

Optional kann der Nutzerparameter, beziehungsweise der kombinierte Parameter 572, dem neuronalen Netz 560 bereitgestellt werden, so dass als Eingangsgrößen des neuronalen Netzes 560 der Nutzerparameter 572 und der beziehungsweise die von dem bestärkenden Lernen 550 gelieferten Koeffizienten eingehen beziehungsweise bereitgestellt werden.

Die Vorrichtung 500 erlaub eine besonders effiziente Einstellung der Koeffizienten des neu ronalen Netzes, da das bestärkende Lernen 550 die durch die Audiosignalverarbeitung 520 tatsächlich verwendeten Parameter berücksichtigt und somit die Koeffizienten des neuro nalen Netzes sehr präzise ermitteln bzw. optimieren kann.

Fig. 6 zeigt ein schematisches Ablaufdiagramm eines Verfahrens 600 zum Betrieb einer Vorrichtung, etwa der Vorrichtung 100, 200, 300, 400 oder 500, bzw. ganz allgemein zum Erhalten von Audio-Verarbeitungsparametern. Ein erster Schritt 610 umfasst ein benutzer individuelles Bestimmen von zumindest einem Koeffizienten einer Verarbeitungsparameter- Bestimmungsvorschrift basierend auf beim Benutzerbetrieb erhaltenen Audiosignalen. Ein zweiter Schritt 620 umfasst ein Erhalten von Audio-Verarbeitungsparametern unter Ver wendung der Verarbeitungsparameter-Bestimmungsvorschrift basierend auf dem Audio- Eingangssignal.

Das Verfahren 600 wird dabei beispielsweise so ausgeführt, dass Audio-Verarbeitungspa- rameter in Abhängigkeit von zumindest einem Audio-Eingangssignal bestimmt werden. Das Verfahren 600 kann dabei so ausgeführt werden, dass eine Klangverarbeitung bzw. Audi- overarbeitung auf Basis von unmittelbar aufgezeichneten Umgebungsgeräuschen (wobei beispielsweise ein Audio-Eingangssignal zu einer Anpassung von Audio-Verarbeitungspa rametern führt) zu einer Verbesserung der individuellen Wahrnehmung von Klang führt. Beispielsweise kann erreich werden, dass die Koeffizienten der Verarbeitungsparameter- Bestimmungsvorschrift auf beim Benutzerbetrieb erhaltenen Audio-Eingangssignale basie ren und benutzer-individuell (beispielweise in Echtzeit) bestimmt werden, so dass Audio- Verarbeitungsparameter unter Verwendung eines neuronalen Netzes, dessen Koeffizienten durch ein bestärkendes Lernen bestimmt oder sogar kontinuierlich angepasst werden, ba sierend auf dem Audio-Eingangssignal erhalten werden.

Das Verfahren 600 kann optional um alle hierin beschriebenen Merkmale, Funktionalitäten und Details ergänzt werden, auch wenn diese im Hinblick auf Vorrichtungen beschrieben wurden. Das Verfahren kann um diese Merkmale, Funktionalitäten und Details sowohl ein zeln als auch in Kombination ergänzt werden.

Weitere Ausführunqsbeispiele

Im Folgenden werden einige Aspekte der vorliegenden Erfindung beschrieben, die einzeln oder in Kombination in Ausführungsbeispielen angewendet werden können. Durch den Nutzer einstellbare situationsabhängige Steuerungsparameter, beziehungs weise durch den Benutzer eingestellte Nutzerparameter, kann beispielsweise durch Ana lyse des eingehenden und ausgehenden Audiosignals, so wie beispielsweise in der Fig. 3 dargestellt, der Klangverarbeitung im Training eines selbstbestärkenden Lernalgorithmus integriert werden.

Das eingehende Audiosignal kann die Klangumgebung enthalten. Dadurch können Ände rungen der Klangumgebung und der Nutzereinstellungen inhärent beispielsweise in Lauf zeit gelernt werden.

Der selbstbestärkende Lernalgorithmus kann aus diesen Daten beispielsweise einen nut zerspezifischen Parametersatz zur Klangverarbeitung entwickeln, der einerseits automati siert unter gleichen äußeren Rahmenbedingungen dieselben Steuerungsparameter anwen det, aber auch in der Situation selbst weitere Nutzer-Anpassungen zulässt, die in das ler nende System integriert werden (beispielsweise basierend auf einem Prinzip des bestär kenden Lernens). So kann sich beispielsweise das maschinelle Lernsystem und die An wendung in einem fortwährenden Lernprozess den klanglichen Nutzerpräferenzen anpas sen. Zur Klanganpassung können Algorithmen integriert und gesteuert werden, wie sie bei spielsweise in Hörgeräten verwendet werden. Dazu können beispielsweise Multibandkom pression mit Rate R und Hörschwellen-Anpassung T und bandabhängiger Verstärkung G, Störgeräuschreduktion oder Blinde Quellentrennung dazugehören.

Das eingehende Audiosignal, die Klangverarbeitungsparameter und/oder das mit dem Klangverarbeitungsparametern verarbeitete Audiosignal können beispielsweise zum Trai ning des Nutzerprofils in einer Cloud (z. B. einem zentralen Datenspeicher) gespeichert werden. Gleichzeitig können die vom Nutzer gewählten Klangverarbeitungsparameter, be ziehungsweise Nutzerparameter auf das eingehende Audiosignal angewandt werden. Die Anzahl der Eingangsparameter für das bestärkende Lernen z. B. eines CNNs (Convolutio- nal Neural Network bzw. faltendes neuronales Netz) kann sich beispielsweise zusammen setzen aus Mehrkanal-Audioeingang (z. B. mit C=4 Kanäle) und Audioausgang (z. B. mit C=2 Kanäle). Die Anzahl der Ausgangsparameter im erlernten Parametersatz M kann sich z. B. aus M = C ^* (T + R + G) + 2 Zeitkonstanten zusammensetzen, wobei die Anzahl der Werte von G, R, T beispielsweise der Anzahl der Verarbeitungsbänder B (z. B. B = 8) ent sprechen kann. Im Folgenden werden einige Aspekte der vorliegenden Erfindung beschrieben, die einzeln oder in Kombination in Ausführungsbeispielen angewendet werden können.

Eine mögliche Umsetzung des Verfahrens, beziehungsweise der Vorrichtung, in dem Be reich Klangsteuerung ist beispielsweise, dass ein Anwender ein Klangwiedergabegerät (z. B. ein Hearable bzw. einen Ohrhörer mit Zusatzfunktion) trägt, das mit einem System mit integrierter Klangverstärkung und einer Audioanalyse, beispielsweise wie in der Fig. 3 oder der Fig. 4 aufgezeigt, ausgestattet ist. Die Parameter der Klangverstärkung kann der Anwender beispielsweise mit einer App (bzw. mit einer Applikationssoftware) steuern, bei spielsweise unter Verwendung der oben beschriebenen Nutzersteuerung. Im Hintergrund kann die Audioanalyse beispielsweise die auditorische Szene mittels Mikrophonie ständig aufnehmen und analysieren und sie beispielsweise in Dynamik und/oder Frequenz und/o der spektralen Eigenschaften evaluieren (beispielsweise in der Audioanalyse). In einer be stimmten auditorischen Szene, z. B. beim Fahren im Auto auf der Autobahn, kann der An wender mittels einer App eine Klanganpassung durchführen und ändert somit die Parame ter der Klangverstärkung (Beispielsweise die Parameter 272). Das System (beispielsweise das bestärkende Lernen 250) kann einen algorithmischen Zusammenhang zwischen den Parameteränderungen durch den Anwender und der Analyse der auditorischen Szene er stellen und daraus ein Vorhersagemodell, das durch künstliche Intelligenz (Kl) weitere Klan ganpassungen des Users ad hoc integriert, entwickeln (und beispielsweise durch Koeffi zienten 256 beschreiben). Hierunter wird verstanden, dass eine individualisierte Kl- Steuerung (Kl bedeutet hier zum Beispiel künstliche Intelligenz), beziehungsweise eine in dividualisierte Al-Steuerung (engl. Artificial Intelligence, AI, künstliche Intelligenz) ermög licht bzw. durch die Vorrichtung bereitgestellt wird.

Befindet sich der Anwender beispielsweise zu einem anderen Zeitpunkt wieder in derselben auditorischen Szene, in diesem Fall im fahrenden Auto auf der Autobahn, wird das Vorher sagemodell angewandt und die Parameter der Klangverstärkung (Beispielsweise die Para meter 262) automatisiert vom System (z. B. von dem durch Koeffizienten 256 definierten neuronalen Netz 260) vorgenommen bzw. geliefert. Nimmt der Benutzer (User) gegebe nenfalls wieder Klanganpassungen vor (Beispielsweise über die Schnittstelle 230), können diese beispielsweise ad hoc in das selbstlernende System integriert werden.

Im Folgenden werden einige Aspekte der vorliegenden Erfindung beschrieben, die einzeln oder in Kombination in Ausführungsbeispielen angewendet werden können, und die bei spielswiese Unterschiede zur Github-Veröffentlichung „liketohear-ai-pt“ darstellen. • Gemäß einem (optionalen) Aspekt der Erfindung basiert das Vorhersagemodell auf einer multidimensionalen Optimierung in Echtzeit, die alle vorhandenen Frequenz bänder analysiert.

• Gemäß einem (optionalen) Aspekt der Erfindung werden beispielsweise Methoden des Bestärkenden Lernens und Methoden des Unbeaufsichtigten Lernens genutzt (beziehungsweise verwendet).

• Gemäß einem (optionalen) Aspekt der Erfindung kann die Anpassung (beziehungs weise können die Anpassungen), beispielsweise der Verarbeitungsparameter-Be stimmungsvorschrift und/oder der Audio-Verarbeitungsparameter, kontinuierlich in Laufzeit stattfinden.

Im Folgenden werden einige Aspekte der vorliegenden Erfindung beschrieben, die einzeln oder in Kombination in Ausführungsbeispielen angewendet werden können, die beispiels wiese Unterschiede zur Offenlegungsschrift US 2015 195641 A1 darstellen.

Ausführungsbeispiele gemäß der Erfindung beziehen sich beispielsweise primär auf eine intuitive und ergonomische Benutzersteuerung von Klängen in alltagsakustischen Umge bungen und präferieren daher generalisierende Einstellungsmöglichkeiten, aus folgenden Gründen:

• Eine Aufteilung der Signale in einzelne „types of sounds“ in Echtzeit ist in alltags akustischen Situationen kaum zu realisieren. Daher wendet die vorliegende Erfin dung dieses Verfahren nicht an, sondern deckt vielmehr mit einem 2-dimensionalen Parameterraum eine Vielzahl von klanglichen Möglichkeiten.

• Benutzereinstellungen müssten bei einer Signaltrennung jeweils getrennt für jedes Objekt und jeder Kontextsituation getroffen werden. In alltagsakustischen Umge bungen mit schnell wechselnden Hörsituation wird die Benutzersteuerung bzw. Usersteuerung zu komplex und daher nicht ergonomisch anwendbar. Mit der vorlie genden Erfindung kann der Benutzer mit einer einfachen und intuitiv bedienbaren Schnittstelle wie beispielsweise eine 2d-Touchoberfläche eines Smartphones kom plexe Klanganpassungen durchführen (beispielsweise in der Einrichtung 230).

• Klangliche Eigenschaften von einzelnen Klängen, könnten sich im Zusammenklang unterschiedlich als in der Präferenz anhören z. B. Klänge wie Musik als vordergrün diges oder als hintergründiges Geräusch. Daher wird bei der vorliegenden Erfindung beispielsweise die Komplexität der auditorischen Szene an eine für den Benutzer optimierte Wahrnehmung aller vorhanden Klänge angepasst. • Einstellungen für einzelne Signale adaptieren sich nicht dynamisch an wechselnde Umgebungsbedingungen. So kann beispielsweise bei leise gesprochener Sprache oder nur leise abgespielter Musik schon eine leichte Lautstärkeerhöhung der Hin tergrundgeräusche Sprache unverständlich bzw. Musik nicht mehr hörbar werden.

Im Folgenden werden einige Aspekte der vorliegenden Erfindung beschrieben, die einzeln oder in Kombination in Ausführungsbeispielen angewendet werden können, die beispiels wiese Unterschiede zur Offenlegungsschrift US 2020 0066264 A1 darstellen.

Bei der Offenlegungsschrift US 2020 0066264 A1 steuert ein Prozessor die Klangverarbei tung des Hörgeräts aufgrund von "user preferences and interests" (Benutzerpräferenzen und Interessen) und "historical activity patterns" (früheren Aktivitätsmustern).

Bei Ausführungsbeispielen der vorliegenden Erfindung wird die Klangverarbeitung des Hör geräts hingegen beispielswese auf Basis von in Echtzeit-gemessenen äußeren Rahmen bedingungen, beispielsweise so wie in der Fig. 2 dargestellt, gesteuert.

Zusammenfassend ist festzuhalten, dass gemäß einem Aspekt der Erfindung die oben ge nannten Kriterien bzw. Anforderungen in ein lernendes Verfahren beziehungsweise einer Vorrichtung integriert werden, das in Echtzeit aus Benutzereinstellungen lernt und diese automatisiert anwendet, um die individuelle Wahrnehmung von Klang bzw. Tönen in Form von Audiosignalen für den Benutzer zu verbessern. Mittels der vorliegenden Erfindung kann eine auf die Benutzerpräferenzen optimierte Signalwiedergabe bzw. Audiowiedergabe rea lisiert werden.

Somit kann gemäß einem Aspekt der vorliegenden Erfindung berücksichtigt werden, dass sich die individuelle Wahrnehmung von Klang und damit die individuellen Anforderungen für den Klang bzw. Wohlklang an deren Anpassung von Klangwiedergabegeräten unter an derem nach folgenden Kriterien unterscheiden:

• Individualität

• Situationsbedingte Bedürfnisse

• Äußere Rahmenbedingungen

Gemäß einem Aspekt der Erfindung können Ausführungsbeispiele gemäß der Erfindung berücksichtigen, dass die Klangwahrnehmung sich von Person zu Person unterscheidet. Beispielsweise ist ein Gespräch mit einer Person in einem Raum mit vielen Menschen mit unter einer lauten Klangkulisse für den Einen schwerer zu führen als für den Anderen. Ebenso wird je nach Bedürfnis dieselbe Einstellung einer Klangwiedergabe unterschiedlich wahrgenommen.

Gemäß einem Aspekt der Erfindung können Ausführungsbeispiele gemäß der Erfindung berücksichtigen, dass auch Umgebungsparameter, wie die auditorische Umgebung, die Steuerungswerte für eine Klanganpassung eines Klangwiedergabegeräts erheblich beein flussen.

Zusammenfassend ist weiterhin zu sagen, dass Ausführungsbeispiele gemäß der vorlie genden Erfindung eine Vorrichtung und ein Verfahren schaffen, die eine Klangverarbeitung auf Basis von Umgebungsgeräuschen, die unmittelbar aufgezeichnet beziehungsweise ge messen werden, durchführen. Basierend auf diesen Aufzeichnungen und den durch den Benutzer eingestellten Nutzerparametern generiert beispielsweise ein lernender Algorith mus ein Vorhersagemodell, der in der Situation selbst weitere Anpassungen zulässt, die in das lernende System integriert werden, um die individuelle Wahrnehmung von Klang bzw. Tönen in Form von Audiosignalen für den Benutzer zu verbessern.

Obwohl manche Aspekte im Zusammenhang mit einer Vorrichtung beschrieben wurden, versteht es sich, dass diese Aspekte auch eine Beschreibung des entsprechenden Verfah rens darstellen, sodass ein Block oder ein Bauelement einer Vorrichtung auch als ein ent sprechender Verfahrensschritt oder als ein Merkmal eines Verfahrensschrittes zu verstehen ist. Analog dazu stellen Aspekte, die im Zusammenhang mit einem oder als ein Verfahrens schritt beschrieben wurden, auch eine Beschreibung eines entsprechenden Blocks oder Details oder Merkmals einer entsprechenden Vorrichtung dar.

Je nach bestimmten Implementierungsanforderungen können Ausführungsbeispiele der Er findung in Hardware oder in Software implementiert sein. Die Implementierung kann unter Verwendung eines digitalen Speichermediums, beispielsweise einer Floppy-Disk, einer DVD, einer Blu-ray Disc, einer CD, eines ROM, eines PROM, eines EPROM, eines EEPROM oder eines FLASH-Speichers, einer Festplatte oder eines anderen magnetischen oder optischen Speichers durchgeführt werden, auf dem elektronisch lesbare Steuersignale gespeichert sind, die mit einem programmierbaren Computersystem derart zusammenwir- ken können oder Zusammenwirken, dass das jeweilige Verfahren durchgeführt wird. Des halb kann das digitale Speichermedium computerlesbar sein. Manche Ausführungsbei- spiele gemäß der Erfindung umfassen also einen Datenträger, der elektronisch lesbare Steuersignale aufweist, die in der Lage sind, mit einem programmierbaren Computersystem derart zusammenzuwirken, dass eines der hierin beschriebenen Verfahren durchgeführt wird.

Allgemein können Ausführungsbeispiele der vorliegenden Erfindung als Computerpro grammprodukt mit einem Programmcode implementiert sein, wobei der Programmcode da hin gehend wirksam ist, eines der Verfahren durchzuführen, wenn das Computerprogramm produkt auf einem Computer abläuft. Der Programmcode kann beispielsweise auch auf ei nem maschinenlesbaren Träger gespeichert sein.

Andere Ausführungsbeispiele umfassen das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren, wobei das Computerprogramm auf einem maschinen lesbaren Träger gespeichert ist.

In anderen Worten ist ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens somit ein Computerprogramm, das einen Programmcode zum Durchführen eines der hierin be schriebenen Verfahren aufweist, wenn das Computerprogramm auf einem Computer ab läuft. Ein weiteres Ausführungsbeispiel der erfindungsgemäßen Verfahren ist somit ein Da tenträger (oder ein digitales Speichermedium oder ein computerlesbares Medium), auf dem das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren auf gezeichnet ist.

Ein weiteres Ausführungsbeispiel des erfindungsgemäßen Verfahrens ist somit ein Daten strom oder eine Sequenz von Signalen, der bzw. die das Computerprogramm zum Durch führen eines der hierin beschriebenen Verfahren darstellt bzw. darstellen. Der Datenstrom oder die Sequenz von Signalen kann bzw. können beispielsweise dahin gehend konfiguriert sein, über eine Datenkommunikationsverbindung, beispielsweise über das Internet, trans feriert zu werden.

Ein weiteres Ausführungsbeispiel umfasst eine Verarbeitungseinrichtung, beispielsweise einen Computer oder ein programmierbares Logikbauelement, die dahin gehend konfigu riert oder angepasst ist, eines der hierin beschriebenen Verfahren durchzuführen. Ein weiteres Ausführungsbeispiel umfasst einen Computer, auf dem das Computerpro gramm zum Durchführen eines der hierin beschriebenen Verfahren installiert ist.

Bei manchen Ausführungsbeispielen kann ein programmierbares Logikbauelement (bei- spielsweise ein feldprogrammierbares Gatterarray, ein FPGA) dazu verwendet werden, manche oder alle Funktionalitäten der hierin beschriebenen Verfahren durchzuführen. Bei manchen Ausführungsbeispielen kann ein feldprogrammierbares Gatterarray mit einem Mikroprozessor Zusammenwirken, um eines der hierin beschriebenen Verfahren durchzu führen. Allgemein werden die Verfahren bei einigen Ausführungsbeispielen seitens einer beliebigen Flardwarevorrichtung durchgeführt. Diese kann eine universell einsetzbare Hard- ware wie ein Computerprozessor (CPU) sein oder für das Verfahren spezifische Hardware, wie beispielsweise ein ASIC.

Die oben beschriebenen Ausführungsbeispiele stellen lediglich eine Veranschaulichung der Prinzipien der vorliegenden Erfindung dar. Es versteht sich, dass Modifikationen und Vari ationen der hierin beschriebenen Anordnungen und Einzelheiten anderen Fachleuten ein leuchten werden. Deshalb ist beabsichtigt, dass die Erfindung lediglich durch den Schutz umfang der nachstehenden Patentansprüche und nicht durch die spezifischen Einzelheiten, die anhand der Beschreibung und der Erläuterung der Ausführungsbeispiele hierin präsen- tiert wurden, beschränkt sei.

Claims

Patentansprüche

1. Eine Vorrichtung (100;200;300;400;500) zum Bestimmen von Audio-Verarbeitungs- parametern (120;262;362;462;562) in Abhängigkeit von zumindest einem Audio- Eingangssignal (110,112;212,214,216; 311 ,316;411 ,416;512,514,516); wobei die Vorrichtung (100;200;300;400;500) ausgebildet ist, um zumindest einen Koeffizienten (142;256;356;456;556) einer Verarbeitungsparameter-Bestimmungs vorschrift (140;250;350;450;550) benutzer-individuell basierend auf beim Benutzer betrieb erhaltenen Audiosignalen (217,218,219;313,317,318,319,342;417;517) zu bestimmen; wobei die Vorrichtung (100;200;300;400;500) ausgelegt ist, um die Audio-Verarbei- tungsparameter (120;262;362;462;562) unter Verwendung der Verarbeitungspara meter-Bestimmungsvorschrift (140;250;350;450; 550) basierend auf dem Audio- Eingangssignal (110,112;212,214,216;311 ,316; 411 ,416;512,514,516) zu erhalten.

2. Vorrichtung (100;200;300;400;500) gemäß Anspruch 1 , wobei die Vorrichtung aus gebildet ist, um eine Datenbasis (252;352;452;552) in Abhängigkeit von durch den Benutzer eingestellten Nutzerparametern (232;332;432,433;532) zu bestimmen, so dass Einträge der Datenbasis (252;352;452;552) die durch den Benutzer eingestell ten Nutzerparameter (232;332;432,433;532) beschreiben.

3. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um eine Datenbasis (252;352;452;552) in Ab hängigkeit von dem zumindest einen Audio-Eingangssignal (110,112;212,214,216; 311 ,316;411 ,416;512,514,516) zu bestimmen, so dass Einträge der Datenbasis (252;352;452;552) das Audio-Eingangssignal (110,112;212,214,216;311 ,316; 411 ,416;512,514,516) beschreiben.

4. Vorrichtung (100;200;300;400;500) gemäß Anspruch 3, wobei die Vorrichtung aus gebildet ist, die Datenbasis (252;352;452;552) so zu bestimmen, dass die Datenba sis (252;352;452;552) eine Zuordnung zwischen verschiedenen Audio-Eingangssig- nalen (110,112;212,214,216;311 ,316; 411 ,416;512,514,516) und jeweiligen durch den Benutzer eingestellten Nutzerparametern (232;332;432,433;532) beschreibt.

5. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um eine Datenbasis (252;352;452;552) in Ab hängigkeit von einem Audio-Ausgangssignal (218,219,313,318,319,342) zu bestim men, so dass Einträge der Datenbasis (252;352;452;552) das Audio-Ausgangssig nal (218,219,313,318,319,342) beschreiben.

6. Vorrichtung (100;200;300;400;500) gemäß Anspruch 5, wobei die Vorrichtung aus gebildet ist, die Datenbasis (252;352;452;552) so zu bestimmen, dass die Datenba sis (252;352;452;552) eine Zuordnung zwischen verschiedenen Audio-Ausgangs- signalen (218,219,313,318,319,342) und jeweiligen durch den Benutzer eingestell ten Nutzerparametern (232;332;432,433;532) beschreibt.

7. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um den zumindest einen Koeffizienten (142;256;356;456;556) der Verarbeitungsparameter-Bestimmungsvorschrift (140; 250;350;450;550) basierend auf der von der Vorrichtung akquirierten Datenbasis (252;352;452;552) anzupassen, um die Verarbeitungsparameter-Bestimmungsvor schrift (140;250;350; 450;550) benutzer-individuell anzupassen, um benutzer-indi viduell angepasste Audio-Verarbeitungsparameter (120;262;362;462;562) zu erhal ten.

8. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um die Verarbeitungsparameter-Bestim mungsvorschrift (140;250;350;450;550) basierend auf der Datenbasis (252;352;452;552) bereitzustellen oder anzupassen.

9. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, den zumindest einen Koeffizienten (142;256;356;456;556) der Verarbeitungsparameter-Bestimmungsvorschrift (140; 250;350;450;550) basierend auf zumindest einem von einem Benutzer korrigierten und/oder veränderten Audio-Verarbeitungsparameter (120;262;362;462;562) zu be stimmen und/oder anzupassen.

10. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um eine Audio-Verarbeitung (220;320;420; 520) basierend auf dem Audio-Eingangssignal (110,112;212,214,216; 311 ,316;411 ,416;512,514,516) und basierend auf dem Audio-Verarbeitungspara- meter (120;262;362;462;562) auszuführen, um die benutzer-individuell angepass ten Audiosignale (217,218,219;313,317,318,319,342) zu erhalten.

11 . Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um die Koeffizienten (142;256;356;456;556) der Verarbeitungsparameter-Bestimmungsvorschrift (140;250;350;450;550) unter Verwendung eines Vergleichs des Audio-Eingangssignals (110,112;212,214,216; 311 ,316;411 , 416;512,514, 516) und eines durch die Audio-Verarbeitung (220;320; 420;520) unter Verwendung der Audio-Verarbeitungsparameter (120;262;362;462; 562) gelieferten Audio-Ausgangssignals (218,219,313,318,319,342) zu bestimmen.

12. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um die von dem Benutzer eingestellten Nut zerparameter (232;332;432,433;532) als Ausgangsgröße an Stelle der Audio-Ver arbeitungsparameter (120;262;362;462;562) bereitzustellen, und wobei die von dem Benutzer eingestellten Nutzerparameter (232;332;432,433;532) Lautstärkeparame ter und/oder Klangparameter und/oder Equalizer-Parameter umfassen.

13. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgelegt ist, um die Nutzerparameter (232;332;432,433;532) mit den Audio-Verarbeitungsparametern (120;262;362;462;562) zu kombinieren, um kombinierte Parameter (272;372;472,473,474;572,573) der Audio-Verarbeitung (220;320;420;520) zu erhalten und als Ausgangsgröße bereitzustellen.

14. Vorrichtung (100;300;400) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, eine Audio-Analyse des Audio-Eingangssignals (110, 112;212, 214, 216;311 , 316;411 , 416;512, 514, 516) durchzuführen, um ein Au- dio-Eingangssignalanalyseergebnis für eine Bestimmung des zumindest einen Ko effizienten (142;256;356;456;556) einer Verarbeitungsparameter-Bestimmungsvor schrift (140;250;350;450;550) bereitzustellen.

15. Vorrichtung (100;300) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, eine Audio-Analyse des Audio-Ausgangssignals (342) durchzuführen, um ein Audio-Ausgangssignalanalyseergebnis für eine Bestimmung des zumindest einen Koeffizienten (142;256;356;456;556) der Verarbeitungspara meter-Bestimmungsvorschrift (140;250;350;450;550) bereitzustellen.

16. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Audio-Verarbeitungsparameter (120;262;362;462;562) zumindest einen Multibandkompressionsparameter R, und/oder zumindest einen Hörschwellenan passungsparameter T, und/oder zumindest einen bandabhängigen Verstärkungs parameter G, und/oder zumindest einen Störgeräuschreduktionsparameter, und/o der zumindest einen blinden Quellentrennungsparameter, und/oder zumindest ei nen Schallrichtungsparameter, und/oder zumindest einen binauralen Parameter und/oder zumindest einen Parameter von adaptiven Filtern umfassen.

17. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ein neuronales Netz (260;360;460;560) umfasst, das ausge legt ist, um die Audio-Verarbeitungsparameter (120;262;362;462;562) unter Ver wendung der Verarbeitungsparameter-Bestimmungsvorschrift

(140;250;350;450;550) zu erhalten.

18. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um die Verarbeitungsparameter-Bestim mungsvorschrift (140;250;350;450;550) basierend auf einer Methode des bestär kenden Lernens und/oder basierend auf einer Methode des verstärkenden Lernens und/oder basierend auf einer Methode des unbeaufsichtigten Lernens und/oder ba sierend auf einer Methode der multivariaten Vorhersage und/oder basierend auf ei nem mit multivariabler Regression festgelegten multidimensionalen Parameterraum bereitzustellen und/oder anzupassen, um den Audio-Verarbeitungsparameter (120;262;362;462;562) zu bestimmen.

19. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgebildet ist, um die durch den Benutzer eingestellten Nut zerparametern (232;332;432,433;532) von einer Schnittstelle zu erhalten.

20. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei das Audio-Eingangssignal (110,112;212,214,216;311 ,316;411 ,416; 512,514,516) ein Mehrkanal-Audiosignal oder zumindest zwei Audio-Kanäle um fasst.

21 . Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgelegt ist, um eine Audio-Verarbeitung (220;320;420;520) separat für zumindest vier Frequenzbänder des Audio-Eingangssignals (110,112;212,214, 216; 311 ,316;411 , 416;512,514,516) durchzuführen.

22. Vorrichtung (100;200;300;400;500) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung ausgelegt ist, um den zumindest einen Koeffizienten (142;256;356;456;556) der Verarbeitungsparameter-Bestimmungsvorschrift (140; 250;350;450;550) benutzer-individuell während des Benutzerbetriebs zu bestim men, um die Audio-Verarbeitungsparameter (120;262;362;462;562) in Echtzeit zu erhalten und/oder die veränderten Audio-Verarbeitungsparameter (120;262;362;462;562) in Echtzeit zu bestimmen und/oder anzupassen.

23. Hörgerät, wobei das Hörgerät eine Audioverarbeitung aufweist; und wobei das Hörgerät eine Vorrichtung zum Bestimmen von Audio-Verarbeitungspa- rametern gemäß einem der Ansprüche 1 bis 22 aufweist, wobei die Audioverarbeitung ausgelegt ist, um ein Audio-Eingangssignal abhängig von den Audio- Verarbeitungsparametern zu verarbeiten.

24. Verfahren (600) zum Bestimmen von Audio-Verarbeitungsparametern in Abhängig keit von zumindest einem Audio-Eingangssignal, wobei das Verfahren aufweist: benutzer-individuelles Bestimmen von zumindest einem Koeffizienten einer Verar beitungsparameter-Bestimmungsvorschrift basierend auf beim Benutzerbetrieb er haltenen Audiosignalen; und

Erhalten von Audio-Verarbeitungsparametern unter Verwendung der Verarbeitungs parameter-Bestimmungsvorschrift basierend auf dem Audio-Eingangssignal.

25. Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch 24, wenn das Programm auf einem Computer läuft.

26. Eine Vorrichtung (100;200;300;400;500) zum Bestimmen von Audio-Verarbeitungs- parametern (120;262;362;462;562) in Abhängigkeit von zumindest einem Audio- Eingangssignal (110;212,214,216; 311 ,316;411 ,416;512,514,516); wobei die Vorrichtung (100;200;300;400;500) ausgebildet ist, um zumindest einen Koeffizienten (142;256;356;456;556) einer Verarbeitungsparameter-Bestimmungs vorschrift (140;250;350;450;550) benutzer-individuell basierend auf beim Benutzer betrieb erhaltenen Audiosignalen (217,218,219;313,317,318,319,342;417;517) zu bestimmen; wobei die Vorrichtung (100;200;300;400;500) ausgelegt ist, um die Audio-Verarbei- tungsparameter (120;262;362;462;562) unter Verwendung der Verarbeitungspara meter-Bestimmungsvorschrift (140;250;350;450; 550) basierend auf dem Audio- Eingangssignal (110;212,214,216;311 ,316; 411 ,416;512,514,516) zu erhalten; wobei die Vorrichtung ein neuronales Netz (260;360;460;560) umfasst, das ausge legt ist, um die Audio-Verarbeitungsparameter (120;262;362;462;562) unter Ver wendung der durch Koeffizienten angepassten Verarbeitungsparameter-Bestim mungsvorschrift (140;250;350;450;550) unmittelbar ohne Kategorisierung der akus tischen Umgebung zu erhalten.

27. Verfahren (600) zum Bestimmen von Audio-Verarbeitungsparametern in Abhängig keit von zumindest einem Audio-Eingangssignal, wobei das Verfahren aufweist: benutzer-individuelles Bestimmen von zumindest einem Koeffizienten einer Verar beitungsparameter-Bestimmungsvorschrift basierend auf beim Benutzerbetrieb er haltenen Audiosignalen; und

Erhalten von Audio-Verarbeitungsparametern unter Verwendung der Verarbeitungs parameter-Bestimmungsvorschrift basierend auf dem Audio-Eingangssignal, wobei die Audio-Verarbeitungsparameter (120;262;362;462;562) unter Verwendung der durch Koeffizienten angepassten Verarbeitungsparameter-Bestimmungsvor schrift (140;250;350;450;550) unmittelbar ohne Kategorisierung der akustischen Umgebung bestimmt werden.

28. Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch 27, wenn das Programm auf einem Computer läuft.