EP3937515A1 - Invarianzgesteuerter elektroakustischer übertrager - Google Patents

Invarianzgesteuerter elektroakustischer übertrager Download PDF

Info

Publication number
EP3937515A1
EP3937515A1 EP20075008.1A EP20075008A EP3937515A1 EP 3937515 A1 EP3937515 A1 EP 3937515A1 EP 20075008 A EP20075008 A EP 20075008A EP 3937515 A1 EP3937515 A1 EP 3937515A1
Authority
EP
European Patent Office
Prior art keywords
hrtfs
signals
stereo
invariants
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP20075008.1A
Other languages
English (en)
French (fr)
Inventor
Par Clemens
Clemens Par
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to EP20075008.1A priority Critical patent/EP3937515A1/de
Priority to PCT/EP2021/000069 priority patent/WO2022008092A1/de
Priority to EP21733058.8A priority patent/EP4176591A1/de
Priority to US18/011,434 priority patent/US20230247381A1/en
Publication of EP3937515A1 publication Critical patent/EP3937515A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Definitions

  • the optimized acquisition, the optimized transmission or the optimized recalculation (including coding) of spatial audio signals are either head-related, by means of acoustic measurement of the human head shape (Head Related Transfer Functions, HRTFs), or loudspeaker-related, by the distribution of the audio signal to a referential display of speakers (e.g. ITU-R 5.1 Surround or NHK 22.2) .
  • HRTFs Head Related Transfer Functions
  • loudspeaker-related by the distribution of the audio signal to a referential display of speakers (e.g. ITU-R 5.1 Surround or NHK 22.2) .
  • WO2016030545 (“Comparison or Optimization of Signals Using the Covariance of Algebraic Invariants”) describes together with WO2012016992 (“Device and Method for Evaluating and Optimizing Signals on the Basis of Algebraic Invariants”) the so-called Par-Hilbert invariants in Ecma TC32-TG22, whereby these remain the subject of orthogonal projections onto algebraic cones, which are consistently used as principal components of the form of the human ear can be observed, which reflects the sound.
  • head-related HRTFs can be generated from original loudspeaker signals with an accuracy of more than 99 percent by means of so-called convolution in the frequency domain (frequency domain ), mostly by means of FFT or QMF, in successively calculated time windows, whereby the transmitter curve of the headphones used, also according to the state of the art, must also be taken into account.
  • ECMA-416 also operates in the frequency domain and therefore cannot solve the problem of increased latency.
  • the broadcaster agnostically, wanted a stereo signal that could be directly reproduced for all applications: for headphones and at the same time for loudspeakers, namely for stereo, for surround and for three-dimensional loudspeaker setups, in real time.
  • the original signal is now replaced by its polynomial approximation (e.g. according to Chebyshev) and if the all-pass filter is approximately simulated with a loudspeaker rotated by 90°, the so-called substitution determinant is immediately recognizable, around which the subsequent z-transformation is also based
  • the subject stereo signal differs from its original Par-Hilbert invariants of order 1 in terms of its three-dimensionality.
  • both human auricles (after a long natural selection) correspond to a forward-pointing double cone including its polarity reversal, thus exactly the algebraic cones FIG. 1 to 3 .
  • ITDs interaural time differences
  • IIDs interaural intensity differences
  • CC-HRTFs ritical Cue Head Related Transfer Functions
  • the structure of the cochlea is decisive for the perceived critical cues.
  • the bandwidths of the bark scale suggest, according to the invention, that instead of measuring the HRTFs, the diameter of the head should be reduced (for example by around 10%) without the localization critically changing, but the measuring point of the CC-HRTF (ear opening). not to vary (this criterion is already met by a silicone tube protruding by approx. 1cm per ear opening). Please refer FIG. 7 .
  • Such an arrangement now makes it possible to approximately reconstruct the space based on an arrangement, for example the shape FIG. 8th for stereo and ITU-R 5.1 surround (the center channel is not shown because according to ITU-R it only transmits mono signals in this position):
  • the speakers BtFL and BtFR on the floor are now added to the stereo speakers FL and FR, offset by 90° above.
  • the speakers BL and BR are, for example, as in ITU-R 5.1 Surround added and, shifted 90° up, also added to the floor with BtBL and BtBR complementary.
  • NB A variant is, for example, the omission of BL and BR and the attachment of BtBL and BtBR at the same level as FL and FR without substantially changing the principle of operation. All possible installation variants are therefore part of the subject matter of the invention.
  • All loudspeakers but in particular BtFL and BtFR as well as BtBL and BtBR, can be subjected to equalization so that the spatial sound components are emphasized.
  • an artificial head of the form FIG. 7 newly measured the so-called CC-HRTFs.
  • the output signal is now formed as follows: It can be shown experimentally that an audio signal below 120 Hz that is only slightly bent by the anatomy of the head remains uncritical with regard to localization. This frequency range can thus easily be retained in the output signal via a low-pass filter.
  • the sound engineer then usually increases the high frequency range using microphones or an equalizer, while the bark scale also suggests increasing the CC-HRTF.
  • Bark Scale suggests adding the CC-HRTFs to the output signal in terms of their physical overtones in order to increase their robustness.
  • a so-called octave filter already achieves this, for example.
  • the resulting output signal has the following properties in the experiment:
  • the added CC-HRTFs allow the head to be moved by more than 90° without head-tracking. They form both with loudspeaker operation via stereo and independently of this with headphones.
  • the use of dipole loudspeakers is not mandatory for an adequate one listening experience.
  • the localization and sound characteristics of the original recording room are preserved.
  • An embodiment of the invention is an apparatus for analog acquisition of the CC-HRTF in real time.
  • an artificial head whose diameter has been reduced by about 10% compared to the human head while maintaining the bark scale, see FIG. 7 , equipped with two silicone hoses, which protrude approx. 1cm beyond the ear cups to pick up the CC-HRTFs.
  • the diaphragm of the human ear is replaced by a microphone of appropriate impedance in the usual way, as in the case of an artificial head.
  • the dummy head is in the sweet spot of a non-anechoic room with a loudspeaker arrangement of the form, for example FIG. 8th placed.
  • a stereo signal is encoded by ECMA-407 as a mono signal plus 2kbps payload, and this is output directly via a left front speaker FL and a left front speaker FR after decoding.
  • the frequency loss of the 1st main reflection compared to the original signal is simulated via equalization, and the resulting left ECMA-407 output signal after such equalization directly via a lower left loudspeaker BtFL placed on the floor and offset 90° above FL radiated above.
  • the resulting right ECMA-407 output signal after such equalization is radiated upwards directly via a lower right loudspeaker BtFR placed on the floor and offset 90° upwards compared to FR.
  • the frequency loss of the 1st or 2nd main reflection compared to the original signal is simulated via equalization, and the resulting left ECMA-407 output signal, after equalization and adjustment of the volume, is fed with reverse polarity to the rear left loudspeaker BL at ear level, which is reversed compared to FL rotated 180°.
  • the resulting right ECMA-407 output signal after such equalization and adjustment of the volume, is fed with reversed polarity to the rear right loudspeaker BR at ear level, which has been rotated by 180° with respect to FR.
  • the frequency loss of the 1st or 2nd main reflection compared to the original signal is simulated via equalization, and the resulting reversed polarity, rear left ECMA-407 output signal after such equalization and adjustment of the volume directly via a lower left, compared to BL 90° upwards, placed on the floor, BtBL loudspeaker radiated upwards.
  • the resulting reversed polarity, rear right ECMA-407 output signal after such equalization and adjustment of the volume is radiated upwards directly via a lower right loudspeaker BtBR placed on the floor and offset 90° upwards compared to BR.
  • these are expanded using the bark scale, for example using an octave filter, by specifically amplifying the overtones of the CC-HRTFs.
  • the resulting stereo signal is made up as follows: A low-pass filter seamlessly inserts FL and FR below 120Hz into the resulting stereo output signal from our arrangement. A high-pass filter adds FL and FR in an attenuated form and with equalization below the critical limit at which, together with the measured CC-HRTFs, localization in the head would occur with headphone operation.
  • the measured CC-HRTFs are added in such a way that they completely satisfy the sound engineer's efforts to prefer the high frequencies.
  • an all-pass filter can also be inserted per speaker rotated by 90°. The same considerations as above apply with regard to the invariances.
  • HRTFs can be calculated by convolution, see above.
  • CC-HRTFs so that an arrangement according to FIG. 8th with appropriate calculation and automation, see above, a forteriori can be omitted.
  • Such calculations and automations are therefore part of the subject matter of the invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

Die Bestimmung von Par-Hilbert-Invarianten ist ein zuverlässiges Hilfsmittel im Bereich der Echtzeit-Übertragung von räumlichen Audiosignalen. Sogenannte CC-HRTFs ermöglichen ein inverses stabiles Modell der räumlichen Wahrnehmung sowohl auf Kopfhörern als auch auf Lautsprechern bei scharfer Lokalisation im dreidimensionalen Raum.

Description

  • Die optimierte Gewinnung, die optimierte Übertragung oder die optimierte Neuberechnung (einschliesslich Kodierung) von räumlichen Audiosignalen sind gemäss Stand der Technik entweder kopfbezogene, mittels akustischer Vermessung der menschlichen Kopfform (Head Related Transfer Functions, HRTFs), oder Lautsprecher-bezogene, durch die Verteilung des Audiosignals auf eine referentielle Ausstellung von Lautsprechern (beispielsweise ITU-R 5.1 Surround oder NHK 22.2) .
  • Aufgrund eines erfolgreichen sogenannten MPEG-H 3D Audio Core Experiment per Oktober 2015 bei ISO/IEC JTC1/SC29/WG11 (Moving Pictures Experts Group, MPEG) mit den beiden internationalen Standards ECMA-407 und ECMA-416 sowie weiteren Komponenten, welche in der November-Ausgabe 2016 der "Fernseh- und kinotechnischen Rundschau" ("FKT") samt zugehöriger Bibliographie ausführlich dargestellt sind, bilden den Stand der Technik die folgenden Patentanmeldungen.
  • Diese Patentanmeldungen werden hiermit als Referenz eingeführt:
    WO2016030545 ("Comparison or Optimization of Signals Using the Covariance of Algebraic Invariants"), WO2015173422 ("Method and Apparatus for Generating an Upmix from a Downmix Without Residuals"), WO2015128379 ("Coding and Decoding of a Low Frequency Channel in an Audio Multi Channel Signal"), WO2015128376 ("Autonomous Residual Determination and Yield of Low-Residual Additional Signals"), WO2015049332 ("Derivation of Multichannel Signals from Two or More Basic Signals"), WO2015049334 ("Method and Apparatus for Downmixing a Multichannel Signal and for Upmixing a Downmix Signal"), WO2014072513 ("Non-linear Inverse Coding of Multichannel Signals"), WO2012032179 ("Apparatus and Method for the Time-oriented Evaluation and Optimization of Stereophonic or Pseudo-stereophonic Signals"), WO2012032178 ("Apparatus and Method for the Time-oriented Evaluation and Optimization of Stereophonic or Pseudo-stereophonic Signals"), WO2012016992 ("Device and Method for Evaluating and Optimizing Signals on the Basis of Algebraic Invariants"), WO2011009650 ("Device and Method for Optimizing Stereophonic or Pseudo-stereophonic Audio Signals"), WO2011009649 ("Device and Method for Improving Stereophonic or Pseudo-stereophonic Audio Signals"), WO2009138205 ("Angle-dependent Operating Device or Method for Obtaining a Pseudo-stereophonic Audio Signal"), und im weiteren EP1850639 ("Systems for Generating Multiple Audio Signals from at Least One Audio Channel").
  • Insbesondere WO2016030545 ("Comparison or Optimization of Signals Using the Covariance of Algebraic Invariants") beschreibt gemeinsam mit WO2012016992 ("Device and Method for Evaluating and Optimizing Signals on the Basis of Algebraic Invariants") die, bei Ecma TC32-TG22 sogenannten, Par-Hilbert-Invarianten, wobei diese Gegenstand orthogonaler Projektionen auf algebraische Kegel bleiben, die durchwegs als Principal Components der Form der menschlichen Ohrmuschel betrachtet werden können, welche den Schall reflektiert.
  • Diese Invarianzen sind in jedem Falle Gegenstand des menschlichen angelernten Raumverständnisses und bleiben, da kopfbezogen, an die menschliche Anatomie jedes Individuums geknüpft.
  • Mit sogenanntem Head-tracking, das in Bezug auf willkürliche oder unwillkürliche Kopfbewegungen diese nachvollzieht und akustisch auskorrigiert, um eine stabile Ortung zu ermöglichen, lassen sich mit einer Genauigkeit von mehr als 99 Prozent kopfbezogene HRTFs aus ursprünglichen Lautsprechersignalen mittels sogenannter Faltung im Frequenzraum (Frequency domain), zumeist mittels FFT oder QMF, in sukzessiv errechneten Zeitfenstern bestimmen, wobei die Übertragerkurve des benutzten Kopfhörers, ebenfalls nach Stand der Technik, mitberücksichtigt werden muss.
  • Dies bedeutet Latenzen von rund 10ms und die Notwendigkeit, etwa bei Rundfunksignalen eine zusätzliche Frequenzkorrektur (sogenanntes Equalizing) für den jeweilig benutzten Kopfhörer durchführen zu müssen, was eine breite Nutzung derartiger Signale im Alltag schlichtweg vereitelt.
  • Auch ECMA-416 operiert im Frequenzraum und kann damit die Problematik einer erhöhten Latenz nicht auflösen.
  • Der Broadcaster wünschte agnostisch sich ideal ein direkt wiedergabefähiges Stereosignal für alle Anwendungsfälle: für Kopfhörer und zugleich für Lautsprecher, und zwar für Stereo, für Surround und für dreidimensionale Lautsprecheraufstellungen, in Echtzeit.
  • Für das Verständnis der Erfindung ist die Tatsache entscheidend, dass näherungsweise die Schallreflexion an der Ohrmuschel jene algebraischen Kegel beinhaltet, die auch WO2016030545 ("Comparison or Optimization of Signals Using the Covariance of Algebraic Invariants") und WO2012016992 ("Device and Method for Evaluating and Optimizing Signals on the Basis of Algebraic Invariants") nennen.
  • Im weiteren stellt die z-Transformation H s = s 1 RC s + 1 RC = 1 sRC 1 + sRCʹ
    Figure imgb0001
    umgedeutet ein "Inductor-resistor-capacator problem" dar, somit das sogenannte 6. Hilbertsche Problem, das Rudolf E. Kálmán umfangreich bearbeitete. Eine solche z-Transformation beschreibt zugleich jedoch einen All-pass-Filter, d.h. es liegt bei der Frequenz ω = 1 / RC
    Figure imgb0002
    eine Phasenverschiebung um 90° vor, was bedeutet, dass näherungsweise sich die Invarianzen der Ordnung 2 (Dreidimensionalität) durch jene der Ordnung 1 (Zweidimensionalität, i.e. Stereo) beschreiben lassen.
  • Ersetzt man das Originalsignal nunmehr durch seine polynomiale Näherung (beispielsweise nach Tschebyschew), und simuliert man den All-pass-Filter näherungsweise mit einem um 90° gedrehten Lautsprecher, ist die sogenannte Substitutionsdeterminante unmittelbar erkennbar, um die sich auch das nachträglich einer z-Transformation unterworfene Stereosignal hinsichtlich seiner Dreidimensionalität von seinen ursprünglichen Par-Hilbert-Invarianten der Ordnung 1 unterscheidet.
  • Definitionsgemäss unterscheiden sich nach David Hilbert ("Über die vollen Invariantensysteme") bei derartigen Transformationen die entstandenen algebraische Invarianten nur um deren Substitutionsdeterminante.
  • Dies ermöglicht nicht nur den direkten Vergleich WO2016030545 ("Comparison or Optimization of Signals Using the Covariance of Algebraic Invariants"), sondern auch die näherungsweise simultane Berechnung und Übertragung für Kopfhörer und zugleich für Lautsprecher, und zwar für Stereo, für Surround und für dreidimensionale Lautsprecheraufstellungen, in Echtzeit, siehe oben.
  • Es ist leicht, eine Lautsprecheraufstellung zu finden, die diese Kriterien optimal erfüllt, selbst ohne All-pass-Filter, wobei die notwendige Phasenumkehr bereits aus H s = s 1 RC s + 1 RC = 1 sRC 1 + sRCʹ
    Figure imgb0003
    ableitbar ist. Für das Überleben im natürlichen Lebensraum ist das räumliche Hörvermögen der erste Reiz sich annähernder Gefahr. (Im Volksmund: "Wer nicht hört, muss fühlen.")
  • Wie FIG. 5 bis 6 zeigen, entsprechen beide menschlichen Ohrmuscheln (nach langer natürlicher Auslese) einem vorwärts gerichteten Doppelkonus samt dessen Verpolung, somit exakt den algebraischen Kegeln FIG. 1 bis 3.
  • Lord Raleighs Experimente zum räumlichen Hörvermögen zeigen jene Unterschiede, die unser Gehirn in Räumlichkeit umsetzt, nämlich die sogenannten Interaural time differences (ITDs) und Interaural intensity differences (IIDs), die anhand der bereits memorierten Invarianzen im Gehirn zum Raumverständnis in Echtzeit führen.
  • Im Unterschied zu HRTFs sei hier der Begriff der CC-HRTFs (Critical Cue Head Related Transfer Functions) eingeführt, also jene Anteile der ITDs und IIDs, die unmittelbar diese memorierten Invarianzen ansprechen.
  • Für die wahrgenommenen Critical Cues ist zugleich die Struktur der Cochlea entscheidend. Diese ist durch die experimentell festgelegte Bark Scale, siehe FIG. 10 vollständig dargestellt:
    Die Bandbreiten der Bark Scale legen, dies erfindungsgemäss, nahe, anstelle der Vermessung der HRTFs den Diameter des Kopfes zu verringern (beispielsweise um rund 10%), ohne dass sich die Lokalisation dabei kritisch ändert, den Messpunkt der CC-HRTF (Ohröffnung) jedoch nicht zu variieren (dieses Kriterium erfüllt bereits ein ca. 1cm je Ohröffnung überstehender Silikonschlauch). Siehe FIG. 7.
  • Eine solche Anordnung ermöglicht nunmehr näherungsweise die Rekonstruktion des Raumes anhand einer Anordnung beispielsweise der Form FIG. 8 für Stereo und ITU-R 5.1 Surround (der Center Kanal ist nicht dargestellt, da er nach ITU-R nur Monosignale in dieser Position überträgt):
    Den Stereolautsprechern FL und FR werden nunmehr, um 90° nach oben versetzt, die Lautsprecher BtFL und BtFR am Boden hinzugefügt. Rückwärtig werden (unter Verpolung bei Stereo) die Lautsprecher BL und BR beispielsweise wie bei ITU-R 5.1 Surround hinzugefügt und, um 90° nach oben versetzt, am Boden mit BtBL und BtBR komplementär ebenso hinzugefügt.
  • N.B. Eine Variante ist beispielsweise der Verzicht auf BL und BR und das Anbringen von BtBL und BtBR auf derselben Höhe wie FL und FR, ohne das Wirkungsprinzip im Wesentlichen zu verändern. Sämtliche möglichen Aufstellungsvarianten sind somit Teil des Erfindungsgegenstands.
  • Alle Lautsprecher, insbesondere jedoch BtFL und BtFR sowie BtBL und BtBR, können dabei einem Equalizing unterworfen werden, sodass die räumlichen Schallanteile hervorgehoben werden.
  • Im Sweetspot werden nunmehr beispielsweise mit einem Kunstkopf der Form FIG. 7 neu die sogenannten CC-HRTFs gemessen.
  • Das Ausgangssignal wird nunmehr wie folgt gebildet:
    Es lässt sich experimentell zeigen, dass ein Audiosignal, dies unterhalb von 120 Hz, nur unwesentlich gebeugt durch die Anatomie des Kopfes, hinsichtlich Lokalisation unkritisch bleibt. Dieser Frequenzbereich kann somit ohne weiteres im Ausgangssignal erhalten bleiben über einen Low-pass-Filter.
  • Der Toningenieur hebt im weiteren zumeist den hohen Frequenzbereich über Mikrofonierung oder Equalizer an, während die Bark Scale eine Anhebung der CC-HRTF ebenso nahelegt.
  • In der Praxis bedeutet dies, dass das ursprüngliche Signal im Frequenzbereich überhalb von 120Hz soweit abgeschwächt wird, dass gegenüber den zum Beispiel über High-pass-Filtern hinzugefügten CC-HRTFs keine Lokalisation innerhalb des Kopfes mehr auftritt (ein Phänomen fast jeden Stereosignals, dass nicht ausschliesslich für Kopfhörer bestimmt ist).
  • Die Bark Scale legt abschliessend nahe, die CC-HRTFs hinsichtlich ihrer physikalischen Obertöne noch verstärkt dem Ausgangssignal hinzuzufügen, um deren Robustheit zu erhöhen. Dies leistet beispielsweise bereits ein sogenannter Oktavfilter.
  • Das resultierende Ausgangssignal hat dabei im Experiment folgende Eigenschaften: Die hinzugefügten CC-HRTFs erlauben das Bewegen des Kopfes bis über 90° ohne Head-tracking. Sie bilden sich sowohl bei Lautsprecherbetrieb über Stereo ab als auch unabhängig davon über Kopfhörer. Der Einsatz von Dipol-Lautsprechern ist nicht zwingend für ein adäquates Hörerlebnis. Die Lokalisationen und Klangcharakteristik des ursprünglichen Aufnahmeraumes bleiben erhalten.
  • Das Raumerlebnis ist jedoch ein dreidimensionales, vergleichbar mit NHK 22.2. Der stille Grund für diese räumliche Rekonstruktion, letztlich im Sinne eines inversen Problems, siehe ECMA-407 sind obige Bemerkungen zu Substitutionsdeterminanten etc.
  • Beschreibung der Zeichnungen
    • FIG. 1 bis 4 zitieren WO2016030545 ("Comparison or Optimization of Signals Using the Covariance of Algebraic Invariants") hinsichtlich algebraischen Kegeln, welche eine Konstruktion der Par-Hilbert-Invarianten für die Ordnung 1 (Zweidimensionalität) ermöglichen.
    • FIG. 5 stellt einen Kunstkopf ("Manikin") dar und zeigt zugleich anhand von FIG. 2, dass die menschliche Ohrform FIG. 1 bis 3 zur Detektierung von Invarianten nachgebildet bleibt, dies zweidimensional je Ohrmuschel. Die Legende zeigt die Elemente der Lokalisation eines Schallereignisses im Raum.
    • FIG. 6 zeigt in einer eigenen Skizze das Aussenohr dar und veranschaulicht nochmals das Auftreten der algebraischen Kegel FIG. 1 bis 3 als Principal Components des Aufbaus der Ohrmuschel. Es bleibt dabei zu beachten, dass FIG. 4 sich auf die kritische Ebene der abgebildeten Invarianten bezieht und nicht mit der Ohrmuschel, sondern unseren cerebralen Funktionen sowie der Cochlea in Verbindung zu bringen ist.
    • FIG. 7 zeigt das Abnehmen von CC-HRTFs über einen ca. 1cm herausragenden Silikonschlauch in einem Kunstkopf. Δ erweist sich bei einem Wert von 1cm, sofern der Kunstkopf im Sweetspot platziert ist gemäss der folgenden FIG. 8, als entsprechend robust, wie in der Beschreibung oben dargestellt.
    • FIG. 8 zeigt eine mögliche Anordnung zur Gewinnung der CC-HRTFs, wie in der Beschreibung oben dargestellt.
    • FIG. 9 zeigt einen All-pass-Filter gemäss Stand der Technik, siehe auch oben in der Beschreibung.
    • FIG. 10 zeigt die sogenannte Bark Scale, welche experimentell die kritischen Frequenzen anhand der Struktur der Cochlea erfasst.
    Ausführungsbeispiel der Erfindung
  • Eine Ausführungsform der Erfindung besteht in einer Vorrichtung zur analogen Gewinnung der CC-HRTF in Echtzeit.
  • Hierbei wird ein Kunstkopf, dessen Diameter unter Wahrung der Bark Scale ca. 10% verringert wurde, als ihn der menschliche Kopf aufweist, siehe FIG. 7, mit zwei Silikonschläuchen bestückt, die zum Abgreifen der CC-HRTFs ca. 1cm über die Ohrmuscheln hinausragen. Das Diaphragma des menschlichen Ohres bleibt dabei in gewohnter Weise wie beim Kunstkopf durch ein Mikrofon entsprechender Impedanz ersetzt.
  • Der Kunstkopf wird im Sweetspot eines nicht-schalltoten Raumes mit einer Lautsprecheranordnung beispielsweise der Form FIG. 8 platziert. In einer Ausführungsform wird beispielsweise ein Stereosignal durch ECMA-407 als Monosignal zuzüglich 2kbps Payload kodiert, und dieses nach der Dekodierung direkt über einen linken vorderen Lautsprecher FL und einen linken vorderen Lautsprecher FR ausgegeben.
  • Der Frequenzverlust der 1. Hauptreflexion gegenüber dem Originalsignal wird über ein Equalizing nachgebildet, und das resultierende linke ECMA-407-Ausgangssignal nach solchem Equalizing direkt über einen linken unteren, gegenüber FL um 90° nach oben versetzten, auf den Boden gelegten, Lautsprecher BtFL nach oben abgestrahlt. Gleichermassen wird das resultierende rechte ECMA-407-Ausgangssignal nach solchem Equalizing direkt über einen rechten unteren, gegenüber FR um 90° nach oben versetzten, auf den Boden gelegten, Lautsprecher BtFR nach oben abgestrahlt.
  • Der Frequenzverlust der 1. oder 2. Hauptreflexion gegenüber dem Originalsignal wird über ein Equalizing nachgebildet, und das resultierende linke ECMA-407-Ausgangssignal wird, nach Equalizing und Anpassen der Lautstärke, verpolt dem rückwärtigen linken Lautsprecher BL in Ohrhöhe zugeführt, welcher gegenüber FL um 180° gedreht wurde. Gleichermassen wird das resultierende rechte ECMA-407-Ausgangssignal, nach solchem Equalizing und Anpassen der Lautstärke, verpolt dem rückwärtigen rechten Lautsprecher BR in Ohrhöhe zugeführt, welcher gegenüber FR um 180° gedreht wurde.
  • Der Frequenzverlust der 1. oder 2. Hauptreflexion gegenüber dem Originalsignal wird über ein Equalizing nachgebildet, und das resultierende verpolte, hintere linke ECMA-407-Ausgangssignal nach solchem Equalizing und Anpassen der Lautstärke direkt über einen linken unteren, gegenüber BL um 90° nach oben versetzten, auf den Boden gelegten, Lautsprecher BtBL nach oben abgestrahlt. Gleichermassen wird das resultierende verpolte, hintere rechte ECMA-407-Ausgangssignal nach solchem Equalizing und Anpassen der Lautstärke direkt über einen rechten unteren, gegenüber BR um 90° nach oben versetzten, auf den Boden gelegten, Lautsprecher BtBR nach oben abgestrahlt.
  • Mit unserem Anwendungsbeispiel mit ECMA-407, dessen agnostisch standardisierte "Signal analysis" eine Invariantenbestimmung gemäss WO2016030545 ("Comparison or Optimization of Signals Using the Covariance of Algebraic Invariants") konform zulässt, lässt sich zugleich über obige Interpretation der z-Transformation bzw. des All-pass-Filters leicht einsehen, weshalb diese Invarianten, enthalten in den CC-HRTFs, die über unseren Kunstkopf extrahiert wurden, für den gesamten Hörprozess bestimmend bleiben.
  • Diese werden in einem nächsten Schritt anhand der Bark Scale, beispielsweise anhand eines Oktavfilters, erweitert, indem gezielt die Obertöne der CC-HRTFs verstärkt werden.
  • Das resultierende Stereosignal setzt sich wie folgt zusammen: Ein Low-pass-Filter fügt FL und FR unterhalb von 120Hz nahtlos in das resultierende Stereo-Ausgangssignal unserer Anordnung ein. Ein High-pass-Filter fügt FL und FR in abgeschwächter Form und unter Equalizing unterhalb jener kritischen Grenze hinzu, bei der, gemeinsam mit den gemessenen CC-HRTFs, Lokalisation im Kopf bei Kopfhörerbetrieb aufträte.
  • Abschliessend werden die gemessenen CC-HRTFs so hinzugefügt, dass sie dem Bestreben des Toningenieurs, die Höhen bevorzugt abzubilden, restlos Genüge tun.
  • N.B. Alle diese Schritte lassen sich, wie unschwer anhand von Grenzwerten zu erkennen ist, in Echtzeit automatisieren. Eine solche Verfahren oder eine solche Vorrichtung sind somit als Teil des Erfindungsgegenstandes zu betrachten.
  • N.B. Anstelle der Lautsprecherdrehungen lässt sich pro um 90° gedrehte Lautsprecher auch ein All-pass-Filter einfügen. Hier gelten hinsichtlich der Invarianzen gleiche Überlegungen wie oben.
  • N.B. Nach Stand der Technik lassen sich HRTFs durch Faltung, siehe oben, berechnen. Gleiches gilt somit auch für CC-HRTFs, sodass eine Anordnung nach FIG. 8 bei entsprechender Berechnung und Automatisierung, siehe oben, a forteriori entfallen kann. Derartige Berechnungen und Automatisierungen sind somit Teil des Erfindungsgegenstandes.

Claims (14)

  1. Vorrichtung zur Ableitung eines räumlichen Audiosignals aus einem Mono-, Stereo- oder Multikanalsignal, gekennzeichnet durch die Verwendung oder Messung oder Berechnung von CC-HRTFs.
    (FIG. 8).
  2. Vorrichtung gemäss Anspruch 1, gekennzeichnet durch die Verwendung oder Messung oder Berechnung von wenigstens einem, um 90°versetzten, Referenz-Lautsprecher oder Verwendung von wenigstens einem All-pass-Filter.
    (FIG. 9).
  3. Vorrichtung gemäss Anspruch 1 oder 2, gekennzeichnet durch das Mischen von Mono-, Stereo- oder Multikanalsignalen mit CC-HRTF-Signalen.
  4. Vorrichtung gemäss einem der Ansprüche 1 bis 3, gekennzeichnet durch die Anhebung von Oktaven oder Obertönen der CC-HRTFs.
    (FIG. 10).
  5. Vorrichtung gemäss einem der Ansprüche 1 bis 4, gekennzeichnet durch die Signalumsetzung in Echtzeit.
  6. Vorrichtung gemäss einer der Ansprüche 1 bis 5, gekennzeichnet durch die Berechnung der CC-HRTFs in Echtzeit.
  7. Vorrichtung gemäss einer der Ansprüche 1 bis 6, gekennzeichnet durch die zusätzliche Bestimmung der Par-Hilbert-Invarianten.
    (FIG. 1 bis 3).
  8. Verfahren zur Ableitung eines räumlichen Audiosignals aus einem Mono-, Stereo- oder Multikanalsignal, gekennzeichnet durch die Verwendung oder Messung oder Berechnung von CC-HRTFs.
    (FIG. 8).
  9. Verfahren gemäss Anspruch 1, gekennzeichnet durch die Verwendung oder Messung oder Berechnung von wenigstens einem, um 90°versetzten, Referenz-Lautsprecher oder Verwendung von wenigstens einem All-pass-Filter.
    (FIG. 9).
  10. Verfahren gemäss Anspruch 1 oder 2, gekennzeichnet durch das Mischen von Mono-, Stereo- oder Multikanalsignalen mit CC-HRTF-Signalen.
  11. Verfahren gemäss einem der Ansprüche 1 bis 3, gekennzeichnet durch die Anhebung von Oktaven oder Obertönen der CC-HRTFs.
    (FIG. 10).
  12. Verfahren gemäss einem der Ansprüche 1 bis 4, gekennzeichnet durch die Signalumsetzung in Echtzeit.
  13. Verfahren gemäss einer der Ansprüche 1 bis 5, gekennzeichnet durch die Berechnung der CC-HRTFs in Echtzeit.
  14. Verfahren gemäss einer der Ansprüche 1 bis 6, gekennzeichnet durch die zusätzliche Bestimmung der Par-Hilbert-Invarianten.
    (FIG. 1 bis 3).
EP20075008.1A 2020-07-06 2020-07-06 Invarianzgesteuerter elektroakustischer übertrager Withdrawn EP3937515A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP20075008.1A EP3937515A1 (de) 2020-07-06 2020-07-06 Invarianzgesteuerter elektroakustischer übertrager
PCT/EP2021/000069 WO2022008092A1 (de) 2020-07-06 2021-06-03 Invarianzgesteuerter elektroakustischer übertrager
EP21733058.8A EP4176591A1 (de) 2020-07-06 2021-06-03 Invarianzgesteuerter elektroakustischer übertrager
US18/011,434 US20230247381A1 (en) 2020-07-06 2021-06-03 Invariance-controlled electroacoustic transmitter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP20075008.1A EP3937515A1 (de) 2020-07-06 2020-07-06 Invarianzgesteuerter elektroakustischer übertrager

Publications (1)

Publication Number Publication Date
EP3937515A1 true EP3937515A1 (de) 2022-01-12

Family

ID=71522934

Family Applications (2)

Application Number Title Priority Date Filing Date
EP20075008.1A Withdrawn EP3937515A1 (de) 2020-07-06 2020-07-06 Invarianzgesteuerter elektroakustischer übertrager
EP21733058.8A Pending EP4176591A1 (de) 2020-07-06 2021-06-03 Invarianzgesteuerter elektroakustischer übertrager

Family Applications After (1)

Application Number Title Priority Date Filing Date
EP21733058.8A Pending EP4176591A1 (de) 2020-07-06 2021-06-03 Invarianzgesteuerter elektroakustischer übertrager

Country Status (3)

Country Link
US (1) US20230247381A1 (de)
EP (2) EP3937515A1 (de)
WO (1) WO2022008092A1 (de)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1850639A1 (de) 2006-04-25 2007-10-31 Clemens Par signalsysteme zur gewinnung multipler audiosignale aus wenigstens einem audiosignal
WO2009138205A1 (de) 2008-05-13 2009-11-19 Clemens Par Winkelabhängig operierende vorrichtung oder methodik zur gewinnung eines pseudostereophonen audiosignals
WO2011009649A1 (de) 2009-07-22 2011-01-27 Stormingswiss Gmbh Vorrichtung und verfahren zur verbesserung stereophoner oder pseudostereophoner audiosignale
WO2012016992A2 (de) 2010-08-03 2012-02-09 Stormingswiss Gmbh Vorrichtung und verfahren zur auswertung und optimierung von signalen auf der basis algebraischer invarianten
WO2012032179A2 (en) 2010-09-10 2012-03-15 Miniflex Limited Optical fibre connector
WO2012032178A1 (de) 2010-09-10 2012-03-15 Stormingswiss Gmbh Vorrichtung und verfahren zur zeitlichen auswertung und optimierung von stereophonen oder pseudostereophonen signalen
WO2014072513A1 (de) 2012-11-09 2014-05-15 Stormingswiss Sàrl Nichtlineare inverse kodierung von multikanal-signalen
WO2015049334A1 (de) 2013-10-02 2015-04-09 Stormingswiss Gmbh Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals
WO2015049332A1 (de) 2013-10-02 2015-04-09 Stormingswiss Gmbh Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
WO2015128376A1 (de) 2014-02-28 2015-09-03 Stormingswiss Sàrl Autonome residualbestimmung und gewinnung von residualarmen zusatzsignalen
WO2015128379A1 (de) 2014-02-28 2015-09-03 Stormingswiss Sàrl Kodierung und dekodierung eines niederfrequenten kanals in einem audiomultikanalsignal
WO2015173422A1 (de) 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
WO2016030545A2 (de) 2014-08-29 2016-03-03 Clemens Par Vergleich oder optimierung von signalen anhand der kovarianz algebraischer invarianten

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1850639A1 (de) 2006-04-25 2007-10-31 Clemens Par signalsysteme zur gewinnung multipler audiosignale aus wenigstens einem audiosignal
WO2009138205A1 (de) 2008-05-13 2009-11-19 Clemens Par Winkelabhängig operierende vorrichtung oder methodik zur gewinnung eines pseudostereophonen audiosignals
WO2011009649A1 (de) 2009-07-22 2011-01-27 Stormingswiss Gmbh Vorrichtung und verfahren zur verbesserung stereophoner oder pseudostereophoner audiosignale
WO2011009650A1 (de) 2009-07-22 2011-01-27 Stormingswiss Gmbh Vorrichtung und verfahren zur optimierung stereophoner oder pseudostereophoner audiosignale
WO2012016992A2 (de) 2010-08-03 2012-02-09 Stormingswiss Gmbh Vorrichtung und verfahren zur auswertung und optimierung von signalen auf der basis algebraischer invarianten
WO2012032179A2 (en) 2010-09-10 2012-03-15 Miniflex Limited Optical fibre connector
WO2012032178A1 (de) 2010-09-10 2012-03-15 Stormingswiss Gmbh Vorrichtung und verfahren zur zeitlichen auswertung und optimierung von stereophonen oder pseudostereophonen signalen
WO2014072513A1 (de) 2012-11-09 2014-05-15 Stormingswiss Sàrl Nichtlineare inverse kodierung von multikanal-signalen
WO2015049334A1 (de) 2013-10-02 2015-04-09 Stormingswiss Gmbh Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals
WO2015049332A1 (de) 2013-10-02 2015-04-09 Stormingswiss Gmbh Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
WO2015128376A1 (de) 2014-02-28 2015-09-03 Stormingswiss Sàrl Autonome residualbestimmung und gewinnung von residualarmen zusatzsignalen
WO2015128379A1 (de) 2014-02-28 2015-09-03 Stormingswiss Sàrl Kodierung und dekodierung eines niederfrequenten kanals in einem audiomultikanalsignal
WO2015173422A1 (de) 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
WO2016030545A2 (de) 2014-08-29 2016-03-03 Clemens Par Vergleich oder optimierung von signalen anhand der kovarianz algebraischer invarianten

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AHMAD JUNAID JAMEEL ET AL: "ECMA-407: New Approaches to 3D Audio Content Data Rate Reduction with RVC-CAL", AES CONVENTION 137; OCTOBER 2014, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, 8 October 2014 (2014-10-08), XP040639127 *
CLEMENS PAR: "ECMA-407 - Teil 1: Internationaler Standard für modularen 3D-Audio-Transport", FERNSEH- UND KINOTECHNIK (FKT), BERLIN, DE, no. 4, 1 April 2015 (2015-04-01), pages 174 - 176, XP009184451, ISSN: 0015-0142 *
CLEMENS PAR: "ECMA-407 - Teil 2: Internationaler Standard für modularen 3D-Audio-Transport", FERNSEH- UND KINOTECHNIK (FKT), BERLIN, DE, no. 5, 1 May 2015 (2015-05-01), pages 246 - 249, XP009184452, ISSN: 0015-0142 *
CLEMENS PAR: "Poesie des Raums", FKT FERNSEH UND KINOTECHNIK, FACHVERLAG SCHIELE & SCHON GMBH., BERLIN, DE, vol. 67, no. 5, 1 May 2013 (2013-05-01), pages 260 - 264, XP001584335, ISSN: 1430-9947 *

Also Published As

Publication number Publication date
US20230247381A1 (en) 2023-08-03
EP4176591A1 (de) 2023-05-10
WO2022008092A1 (de) 2022-01-13

Similar Documents

Publication Publication Date Title
DE69511246T2 (de) Binaurale synthese, kopfbezogene ubertragungsfunktionen und ihre verwendungen
DE60119911T2 (de) System und verfahren zur optimierung von dreidimensionalem audiosignal
DE69417571T2 (de) Vorrichtung zur verarbeitung von binauralen signalen
DE69433258T2 (de) Raumklangsignalverarbeitungsvorrichtung
DE60304358T2 (de) Verfahren zur verarbeitung von audiodateien und erfassungsvorrichtung zur anwendung davon
EP3044972B1 (de) Vorrichtung, verfahren und computerprogramm zur dekorrelation von lautsprechersignalen
DE2244162A1 (de) Verfahren zur simulation der bei einer lautsprecherbeschallung auftretenden hoerereignisse mittels kopfhoerern
AT394650B (de) Elektroakustische anordnung zur wiedergabe stereophoner binauraler audiosignale ueber kopfhoerer
EP2891334B1 (de) Erzeugung von mehrkanalton aus stereo-audiosignalen
DE102014006997A1 (de) Verfahren, Vorrichtung und Erzeugnis für drahtlose immersive Audioübertragung
EP2917908A1 (de) Nichtlineare inverse kodierung von multikanal-signalen
DE19911507A1 (de) Verfahren zur Verbesserung dreidimensionaler Klangwiedergabe
EP2357854B1 (de) Verfahren und Vorrichtung zur Erzeugung individuell anpassbarer binauraler Audiosignale
EP1471770A2 (de) Verfahren zur Erzeugung einer angenäherten Teilübertragungsfunktion
DE112019001916T5 (de) Audioverarbeitungsvorrichtung, audioverarbeitungsverfahren und programm
DE112021003592T5 (de) Informationsverarbeitungsvorrichtung, Ausgabesteuerverfahren und Programm
EP0484354B1 (de) STEREOKOPFHöRER ZUR VORNEORTUNG VON MITTELS STEREOKOPFHöRERN ERZEUGTEN HöREREIGNISSEN
DE112006002548T5 (de) Vorrichtung und Verfahren zur Wiedergabe von virtuellem Zweikanal-Ton
WO2021122540A1 (de) Verfahren und system zur übermittlung und wiedergabe akustischer informationen
EP3595334A2 (de) Verfahren zur audio-wiedergabe in einem hörgerät
EP3937515A1 (de) Invarianzgesteuerter elektroakustischer übertrager
DE112019005814T5 (de) Optimale filtersätze zur unterdrückung von störungen durch übersprechen, die unter verwendung eines störfeldmodells erzeugt werden, und verfahren zur verwendung
DE112019004139T5 (de) Signalverarbeitungsvorrichtung, signalverarbeitungsverfahren und programm
DE19847689B4 (de) Vorrichtung und Verfahren zur dreidimensionalen Tonwiedergabe
EP0025509B1 (de) Stereophones Übertragungsverfahren und Mittel zur Durchführung des Verfahrens

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN PUBLISHED

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

B565 Issuance of search results under rule 164(2) epc

Effective date: 20210301

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20220713